第3第4水準文字コードを使おう!

| コメント(0) | トラックバック(0)

過去に、下記の2つの記事を書きました。

このシリーズの仕上げは、「第3第4水準文字コードを使おう!」です。

第3第4水準文字コードとは聞いたことがないかもしれません。私も言うのは初めてです。

ここでいう第3第4水準文字コードとは、JIS X 0213の文字をサポートする文字コードです。JIS X 0213はそれ自体が文字コードの規格ですから、JIS X 0213の符号化方式は当然第3第4水準文字コードですが、それ以外にも、Unicodeの符号化方式も第3第4水準に対応しています。

ですから、第3第4水準文字コードとは具体的には下記のような文字コードです。

  • EUC-JIS-2004
  • Shift_JIS-2004
  • ISO-2022-JP-2004
  • UTF-8
  • UTF-16
  • UTF-32

第3第4水準辞書を使って文字を入力するには、こうした文字コードの使用が前提となるわけです。これまでに第3第4水準の辞書とフォントを取り上げましたが、それに先だって、実は第3第4水準文字コードが必要だったわけです。

残念ながら、現状ではいつでもどこでも第3第4水準文字コードが使われているわけではありません。下記のような文字コードは、第3第4水準に対応していませんがいまだに使われています。

  • Shift_JIS (および、それにベンダ定義外字を付加した所謂Windows-31Jなどの亜種を含む)
  • EUC-JP
  • ISO-2022-JP

今後は、こうした不十分な文字コードの使用をやめて、第3第4水準文字コードに移行すべきです。

なんとなれば、JIS X 0208が許されるのは小学2年生までなのだし、電子書籍時代にはJIS X 0213の文字が必要だということを前に述べました。また、このたび改正されたJIS X 0208とJIS X 0213の附属書をよく読むと、改訂された常用漢字表により良く対応するにはJIS X 0213の文字が必要であることも分かります。

あるコラムサイトで、「補塡」という言葉の第3水準の「塡」を記すのにHTMLの文字参照を使用しているのを見かけましたが、第3第4水準文字コードを使えばそのようなことは不要で、「補塡」という文字そのものを記すことができます。

様々な点から、第3第4水準文字コードの使用が望まれているわけです。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/349

コメントする

最近のブログ記事

libiconv に JIS X 0213がない場合
GNU libiconvはJIS X 0…
「キュレーション」なる語について
DeNAのキュレーションサイトWelqの…
雪の青の夜景、札幌と函館
何日か前の朝のNHKニュースで札幌の夜景…
「2バイト文字」という言い方
「2バイト文字」という言い方につっこみを…
EUCが国際標準化されていれば良かった
すごい後知恵なんですが、1980年代に「…

広告