2023年9月26日火曜日

UTF-8-Macの濁点半濁点ユニコードの注意

 Macのファイル管理に使われているUTF-8-Macですが。

 UTF-8-Macは濁点自体が一つの文字として扱われています。

文字数の例

  • バイオリン  UTF-8-Macでは6文字。通常のユニコードでは5文字
  • パパイヤ  UTF-8-Macでは6文字。通常のユニコードでは4文字

注意点

 UTF-8-Macは通常のUTF-8と濁点以外互換性があります。

 UTF-8でMacのファイル名を検索すると濁点半濁点のファイルが除外されてしまいます。

検索自体は働くのでエラーが発見しにくいです。

所感

中途半端な互換性があるためバグを見落としやすいです。

Appleの独自規格は開発者の天敵です。

0 件のコメント:

コメントを投稿