Unicode 9.0が出ています

| コメント(0) | トラックバック(0)

UnicodeコンソーシアムからUnicode 9.0が6月21日に出ました。

このバージョンではちょうど7,500文字が追加されたということです。数がずいぶん多いようにも思えますが、多くは西夏文字で、6,881文字あります。この数字はブロックTangut, Tangut Components, Ideographic Symbols and Punctuationの字数の合計です。

西夏文字についてはひとつ前の記事に書きました。

ISO/IEC 10646とUnicodeが同期するように更新というのはこういうことで、10646に追加された西夏文字がUnicodeでも追いかけるように追加されているわけです。逆、つまり先にUnicodeに入って後から10646に追加されるものもあります。先の記事のCJK統合漢字の追加9文字というのはUnicodeでは昨年のバージョン8.0で入ったものです。またU+301C波ダッシュ (WAVE DASH) の例示字形の修正もUnicodeではバージョン8.0で行われていました。

文字の追加に応じてUnicodeの文字情報を収めたテキストファイルUnicodeData.txtも当然更新されていますが、西夏文字については各文字について1行ではなく、漢字と同じようにコード範囲を示す形になっています。具体的には、「<Tangut Ideograph, First>」で範囲の最初が示され、次に「<Tangut Ideograph, Last>」で終わりが示されています。漢字のほかにも私用領域(PUA)やサロゲート領域を示すのにも同じ形式が使われています。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/605

コメントする

最近のブログ記事

電子マネーiDの良さが今更ながら分かった
iDとはどんなものか 電子マネーというと…
書家の第3水準漢字が文字化けするわけ
北海道南部の松前町は、20世紀日本の書家…
どうせクレジットカードを持つなら出身大学の支援になるものはどうか
大学カードというものがある 今や生活に欠…
「など」の使い方
曖昧な言い方が好まれる風潮があると感じて…
日本の文字は「表イメージ文字」でいいのか
笹原 宏之『漢字に託した「日本の心」』 …

広告