結合文字についてMacのおしい点

| コメント(0) | トラックバック(0)

Mac OS Xには標準でアイヌ語用の入力方式が搭載されています。アイヌ語のモードにした上で、例えば "sirpopke" とローマ字を打鍵すると「シㇼポㇷ゚ケ」となり、「ㇼ」や「ㇷ゚」といったアイヌ語表記用の片仮名を自然に入力することができます。これは市場性を考慮するとなかなかすごいことだと思います。

それはいいのですが、こうして入力できるにもかかわらず、一部の文字、Unicodeで結合文字を使わないと表現できない文字について、OS Xに標準添付のソフトウェアで適切に表示できないことがあります。

端的には、アイヌ語の片仮名表記に頻出する「ㇷ゚」が挙げられます。この文字はJIS X 0213では単独の符号位置(1面6区88点)が与えられていますが、Unicodeでは合成用の半濁点(U+309A)を「ㇷ」のあとに続けて、ふたつの符号位置を並べて表現する必要があります。

例えば、このページをOS Xに添付のSafariで見ると、「ㇷ゚」の濁点のところに妙に間が空いてしまうと思います。しかし、この文字列をマウスでコピーして、やはりOS添付のテキストエディタであるテキストエディットに貼り付けると、きちんと一文字として表示されるはずです。Firefoxでは一文字の幅に表示されますが、編集用のテキストエリアでは表示が若干崩れるようです(今まさにMac上のFirefoxで編集しています)。

フォントのせいなのか文字表示のライブラリのせいなのかよくわかりませんが、ユーザの視点からすると、まだちょっと惜しいという感じです。

同種の文字としては「ト゚」などがありますが、今日での使用頻度はあまり高くないと思います。

ちなみに「ㇷ゚」については朝鮮語(韓国語)音を片仮名で記すのに利用する人もいるようです。

【2013年10月26日追記】この記事を公開した直後なのですが、新たに配布されたOS X MavericksについてくるSafariでは、上記の問題は起こらないようです。ただし、MacでなくiPadのSafariでは、iOSの最新版7.0.3でも上記と同じ問題があります。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/501

コメントする

最近のブログ記事

テレワークの環境改善〜CO2濃度をチェックする
テレワークの問題点 新型コロナウイルスの…
エンジニアHubにて「文字コード再入門─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!」公開
「エンジニアHub」にて記事を執筆しまし…
National Geographic Your Shot で Daily Dozen に選ばれた話
ブログをさぼっている間に時間がずいぶん経…
情報処理学会から山下記念研究賞を頂いた話
ブログをさぼっている間に時間がずいぶん経…
Go と Rustの文字列
Go言語における文字列はUTF-8のバイ…

広告