ことえりでアイヌ語を試す

| コメント(0) | トラックバック(1)

Mac OS Xのことえりを触ってみて面白かった、かつ感心したのは、アイヌ語の入力方式が実装されていたことです。

単に文字が入力できるというだけでなく、アイヌ語の一般的なローマ字つづりにしたがって打鍵すると片仮名に変換されるというものです。

たとえば、ローマ字で「akor␣itak⏎」と打鍵すると片仮名の「アコㇿ イタㇰ」になるのです。最後にリターンが必要なのは、後に母音がつくのでなくそこで終わりであることを示すためです。リターンを押すまでは未確定の状態になっています。スペースの前のrも同様で、直後にスペースを打つことによってㇿに確定されます。

また、「sirpopke」と打鍵すると「シㇼポㇷ゚ケ」と入力されます。標準添付のエディタ「テキストエディット」であれば、この文字列をShift_JIS-2004 (テキストエディットの画面では「Shift JIS X0213」)やUTF-8で保存することができます。

UTF-8で保存すると、Emacs 22 + Mule-UCSの環境では正しく表示できない文字があります。Unicodeで結合文字を使う必要のある文字がそれです。アイヌ語関係では、セ゚、ツ゚、ト゚、ㇷ゚の4文字です。よく使う「ㇷ゚」についてこの問題があるのはかなり痛いです。

Shift_JIS-2004であればこの問題はないので、Emacsとの間で自由に交換することができます。

トラックバック(1)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/21

先の記事に「ㇷ゚」などアイヌ語特有の片仮名を書きましたが、私のこの... 続きを読む

コメントする

最近のブログ記事

National Geographic Your Shot で Daily Dozen に選ばれた話
ブログをさぼっている間に時間がずいぶん経…
情報処理学会から山下記念研究賞を頂いた話
ブログをさぼっている間に時間がずいぶん経…
Go と Rustの文字列
Go言語における文字列はUTF-8のバイ…
『[改訂新版] プログラマのための文字コード技術入門』のページ作成
発売されてから半年以上経ってようやくのこ…
『[改訂新版]プログラマのための文字コード技術入門』発売!
ばたばたしていて当サイトの更新も怠ってい…

広告