第3第4水準辞書を使おう!

| コメント(0) | トラックバック(0)

いまだに、広く使われている日本語入力環境は、JIS X 0208の第1・第2水準漢字に制限されていることが多いと思います。第3・第4水準を追加するJIS X 0213の制定から10年も経つにもかかわらずです。

現代日本で使われていながらJIS X 0208に入っていなかった文字を収録したJIS X 0213という優れた規格の利点を活かすには、その文字を普通に入力できる漢字変換辞書を持つことが重要です。

そこで、第3第4水準辞書を使いましょう。

ここで「第3第4水準辞書」と呼ぶものは、単に単漢字変換などで入力できるということにとどまらないものです。具体的には、下記の条件を満たすことが必要です。

  • 第3・第4水準漢字が語彙として入力できること。例えば、「噶」という字が単に単漢字変換で入力できるだけでなく、「吐噶喇列島」といった語として収録されている。
  • 漢字だけでなく、JIS X 0213で追加された非漢字についても入力を可能とする。例えば、ローマ字の ā や ô や ç や é といった文字や、◉や♨や〽のような記号類なども。
  • JIS X 0213の11,233文字について、広範に、できれば網羅的に対応すること。

こうした入力を可能にする第3第4水準辞書の例として、仮名漢字変換プログラムの種類に応じて3つここでは示します。

上には入力プログラムの有名と思われる順に挙げましたが、実際には、SKK用の辞書が元となって、Anthy用とATOK用とが生成されています。

これらの辞書については、当ブログでも時々紹介してきました。ご参考まで。

第3第4水準辞書によって文字入力環境の改善を実現する人が増えることを願ってやみません。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/330

コメントする

最近のブログ記事

libiconv に JIS X 0213がない場合
GNU libiconvはJIS X 0…
「キュレーション」なる語について
DeNAのキュレーションサイトWelqの…
雪の青の夜景、札幌と函館
何日か前の朝のNHKニュースで札幌の夜景…
「2バイト文字」という言い方
「2バイト文字」という言い方につっこみを…
EUCが国際標準化されていれば良かった
すごい後知恵なんですが、1980年代に「…

広告