Unicode 6.0.0

| コメント(0) | トラックバック(0)

Unicode 6.0.0が発表されました。

日本の利用者にとって最も影響が大きいのは携帯電話の絵文字の収録でしょうか。『プログラマのための文字コード技術入門』に書いたとおり、多くの絵文字はBMPでなく面01に入っているので、UTF-16ではサロゲート・ペアの、UTF-8では4バイトのUTF-8への対応が必須です。Unicode対応を謳いながらこれらの機構に対応していない時代遅れのプログラムは改善が必要です。

ただ、Unicodeに絵文字が入ったからといって、それを張り切って使うのが本当に良いことなのかどうかは、文字コード以前の問題として、考えられるべきではないかと思います。「絵文字」というものの、それは言語表記に用いる文字ではなく、ただの絵にすぎません。文章の中に絵を散りばめるのは、文章力のなさを非言語的なシンボルによる印象で糊塗しようとしているだけではないのかという疑いを消すことが私にはできません。

さて、新規追加の漢字としては面02にCJK統合漢字拡張Dというのが追加されています。ブロックはU+2B740〜U+2B81Fです。これらを使う機会はほとんどの場合ないでしょう。コード表を見ていると、書体の違いや書き方の癖のようなものを無理矢理明朝体化したようなものが見受けられ、Unicodeとしてどういう基準で収録しているのか疑問を抱きます。例えば、U+2B746は「今」という字の手書きの書体でよく見られる形でしょう。岡山県の倉敷美観地区にある今橋という橋(大原美術館のすぐ前)に彫られている「今」という字はこの形です。康煕字典の(康煕字典体ではなく楷書で書かれている)序文の「今」もこの形だといいます。ほかにも沢山あるでしょう。「解説 字体辞典」を見ると、「今」の伝統的な楷書の形であることが分かります。こうしたものに別のコードを振るというのが本当に適切なのか疑問に思います。

前に少し記した、インドの通貨ルピーの記号も早速入りました。U+20B9です。

バージョン6.0.0での変更点はUnicodeコンソーシアムのWebサイトから見ることができます。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/167

コメントする

最近のブログ記事

National Geographic Your Shot で Daily Dozen に選ばれた話
ブログをさぼっている間に時間がずいぶん経…
情報処理学会から山下記念研究賞を頂いた話
ブログをさぼっている間に時間がずいぶん経…
Go と Rustの文字列
Go言語における文字列はUTF-8のバイ…
『[改訂新版] プログラマのための文字コード技術入門』のページ作成
発売されてから半年以上経ってようやくのこ…
『[改訂新版]プログラマのための文字コード技術入門』発売!
ばたばたしていて当サイトの更新も怠ってい…

広告