Macのファイル管理に使われているUTF-8-Macですが。
UTF-8-Macは濁点自体が一つの文字として扱われています。
文字数の例
- バイオリン UTF-8-Macでは6文字。通常のユニコードでは5文字
- パパイヤ UTF-8-Macでは6文字。通常のユニコードでは4文字
注意点
UTF-8-Macは通常のUTF-8と濁点以外互換性があります。
UTF-8でMacのファイル名を検索すると濁点半濁点のファイルが除外されてしまいます。
検索自体は働くのでエラーが発見しにくいです。
所感
中途半端な互換性があるためバグを見落としやすいです。
Appleの独自規格は開発者の天敵です。
0 件のコメント:
コメントを投稿