Unicode 9.0が出ています

| コメント(0) | トラックバック(0)

UnicodeコンソーシアムからUnicode 9.0が6月21日に出ました。

このバージョンではちょうど7,500文字が追加されたということです。数がずいぶん多いようにも思えますが、多くは西夏文字で、6,881文字あります。この数字はブロックTangut, Tangut Components, Ideographic Symbols and Punctuationの字数の合計です。

西夏文字についてはひとつ前の記事に書きました。

ISO/IEC 10646とUnicodeが同期するように更新というのはこういうことで、10646に追加された西夏文字がUnicodeでも追いかけるように追加されているわけです。逆、つまり先にUnicodeに入って後から10646に追加されるものもあります。先の記事のCJK統合漢字の追加9文字というのはUnicodeでは昨年のバージョン8.0で入ったものです。またU+301C波ダッシュ (WAVE DASH) の例示字形の修正もUnicodeではバージョン8.0で行われていました。

文字の追加に応じてUnicodeの文字情報を収めたテキストファイルUnicodeData.txtも当然更新されていますが、西夏文字については各文字について1行ではなく、漢字と同じようにコード範囲を示す形になっています。具体的には、「<Tangut Ideograph, First>」で範囲の最初が示され、次に「<Tangut Ideograph, Last>」で終わりが示されています。漢字のほかにも私用領域(PUA)やサロゲート領域を示すのにも同じ形式が使われています。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/605

コメントする

最近のブログ記事

JISの幽霊漢字が大正時代の新聞にあったように見えたという記事
JIS X 0208の幽霊漢字についてT…
Jアラート訓練メールで文字化けとのニュース
一昨日のことですが、中国・四国地方から文…
任俠の第3水準漢字
ユーモラス、と言っていいのか分かりません…
ふるさと納税で奥尻島のワインを頂きました
奥尻島は北海道の南西の方に浮かぶ島です。…
電子マネーの優先順位を考える
このブログを電子マネーとクレジットカード…

広告