Unicode 9.0が出ています

| コメント(0) | トラックバック(0)

UnicodeコンソーシアムからUnicode 9.0が6月21日に出ました。

このバージョンではちょうど7,500文字が追加されたということです。数がずいぶん多いようにも思えますが、多くは西夏文字で、6,881文字あります。この数字はブロックTangut, Tangut Components, Ideographic Symbols and Punctuationの字数の合計です。

西夏文字についてはひとつ前の記事に書きました。

ISO/IEC 10646とUnicodeが同期するように更新というのはこういうことで、10646に追加された西夏文字がUnicodeでも追いかけるように追加されているわけです。逆、つまり先にUnicodeに入って後から10646に追加されるものもあります。先の記事のCJK統合漢字の追加9文字というのはUnicodeでは昨年のバージョン8.0で入ったものです。またU+301C波ダッシュ (WAVE DASH) の例示字形の修正もUnicodeではバージョン8.0で行われていました。

文字の追加に応じてUnicodeの文字情報を収めたテキストファイルUnicodeData.txtも当然更新されていますが、西夏文字については各文字について1行ではなく、漢字と同じようにコード範囲を示す形になっています。具体的には、「<Tangut Ideograph, First>」で範囲の最初が示され、次に「<Tangut Ideograph, Last>」で終わりが示されています。漢字のほかにも私用領域(PUA)やサロゲート領域を示すのにも同じ形式が使われています。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/605

コメントする

最近のブログ記事

日本の文字は「表イメージ文字」でいいのか
笹原 宏之『漢字に託した「日本の心」』 …
Creative Commonsライセンスの作品は無条件で使って良いわけではない
他人の写真や文章を盗用・コピペする「キュ…
「小樽雪あかりの路」の魅力
北海道の冬のイベントというと札幌の雪まつ…
libiconv に JIS X 0213がない場合
GNU libiconvはJIS X 0…
「キュレーション」なる語について
DeNAのキュレーションサイトWelqの…

広告