改定常用漢字表と文字コード

| コメント(0) | トラックバック(0)

改定常用漢字表がこの11月30日に内閣告示されました。それと同時に、経済産業省からは、「改定常用漢字表に対するJIS漢字コード規格の対応状況について」という発表が出ています。常用漢字表の改定に文字コードがどう対応しているかをまとめた資料です。

詳しくはリンク先の資料、特に「改定常用漢字表に関する規格検討報告書」というPDFを読むと良いです。

私なりに超簡略化していうと、文字コード的には、

  • JIS X 0213を使っていればオッケー。
  • JIS X 0208は大体いいけど一部の文字に字体の問題がある、

というところです。

JIS X 0213の符号化方式に対応したソフトウェアでは改定常用漢字表の文字は何の問題もなく扱えます。また、JIS X 0213の例示字形に則って設計されたフォントは字体上の問題もありません。

JIS X 0208にしか対応していない場合に文字コード的に問題になるのは何かというと、「塡」「剝」「頰」「𠮟」の4文字です。これらが、JIS X 0208ではそれぞれ「填」「剥」「頬」「叱」という字体になってしまう(「互換包摂」まで適用すればX0208の包摂規準で救済できるけど、JIS X 0213ができてから10年も経っているのに互換包摂というのも残念な感じが強い)。改定常用漢字表ではこれらX0208の方の字体でもいいことになってはいるのですが、表に掲出されている字体としては第3水準の方の「塡」「剝」「頰」「𠮟」であるわけです。

「𠮟」については、『プログラマのための文字コード技術入門』にも書いたとおり、Unicodeで表したときにBMPでなく面02の文字であるという点が、多分いろいろな問題を依然として引き起こすと思います。UTF-8として3バイトまでしか対応していないMySQL 5.1とかを使っているとその時点で駄目です。そういう問題があることが意識されてかどうかは知らないけれど、改定常用漢字表では「𠮟」と「叱」は「特定の字種に適用されるデザイン差」ということになっています。他の字種に一般化することのできない個別のデザイン差ということです。この種のデザイン差は5字種について挙げられているのですが、中でも「𠮟・叱」については、「本来別字とされるが、その使用実態から見て、異体の関係にある同字と認めることができる」というただし書きまである念の入れようです。

経済産業省によると、「常用漢字表の改定を契機に今後一層JIS X0213が普及することが期待されます」だそうです。そうなると本当にいいですね。それはひとり常用漢字表のためだけではありません。先日述べた仏教の用語の件もあるし、アイヌ語の件もあるし、地名の件もあるし、その他このブログで度々取り上げている様々な文字への対応も含めてのことです。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/190

コメントする

最近のブログ記事

仮名合字・合略仮名の文字コード
合字とは 合字というものがあります。複数…
なぜ『プログラマのための文字コード技術入門』の改訂新版にはSKKと Emacsの話が入っていないのか
拙著『[改訂新版] プログラマのための文…
朝鮮半島の訃報の第3水準漢字
朝鮮戦争で韓国軍として活躍した白善燁氏が…
テレワークの環境改善〜CO2濃度をチェックする
テレワークの問題点 新型コロナウイルスの…
エンジニアHubにて「文字コード再入門─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!」公開
「エンジニアHub」にて記事を執筆しまし…

広告