ISO/IEC 10646:2014/追補2:2016がダウンロード可能に

| コメント(0) | トラックバック(0)

国際規格のISO/IEC 10646:2014への追補2:2016がダウンロード可能になっています。追補の発行は5月1日と記されています。普通は規格票というのはお金を払って購入するものですが、この規格はPublicly Available StandardsというISOの提供するサイトからダウンロードできます。

ISO/IEC 10646とは

ISO/IEC 10646はUnicodeと同等の文字コードのISOとIECによる国際規格です。標題を「Information technology -- Universal Coded Character Set (UCS)」といいます。UnicodeはUnicodeコンソーシアムという業界団体、つまりは別団体の発行している規格ですが、UnicodeとISO/IEC 10646は互いに同期するように更新されており、文字コードとしては同等になるように調整されています。10646に対応する日本の規格はJIS X 0221です。

追補とは

ISOやJISでは既に発行済みの規格の更新を「追補」という形で行うことがあります。この場合、追補には既存の規格への変更点のみが記されています。プログラムで言えばパッチを提供するようなものですね。

文字の追加: 西夏文字

今回もいくつかの文字が追加されていますが、多少なりとも聞き覚えのありそうなものとしては西夏文字(Tangut)でしょうか。高校で世界史を勉強した人は覚えているかもしれませんが、今でいう中国の宋王朝の時代、その西北の方に西夏という、チベット系とされるタングート人の国がありました。そこで作られた文字です。漢字と似た雰囲気の文字ですが、全般に漢字よりも複雑に見えます。今日の社会で用いられている文字ではなく、20世紀に解読が進んだのだそうです。UCSへの追加は歴史的な文書の研究のために意義のあるものだろうと思います。

西夏文字はSupplementary Multilingual Plane (SMP), 面01のU+17000以降に配置されています。また、その少し手前のU+16FE0に TANGUT ITERATION MARKという、「々」に似た記号が追加されています。西夏文字の文字名は「TANGUT IDEOGRAPH-17000」のように符号位置を含めた格好になっています。漢字と同じ形式ですね。漢字と似た性質の文字なので、ほかにやりようがないのでしょう。

波ダッシュの例示字形の修正

そのほか細かなところでは、U+301C波ダッシュの例示字形がJIS X 0208/0213と同様のものに修正されています。これまでは位相が反転したような、間違いとまではいえないとしてもちょっとおかしな字形になっていました。例示字形だけでなく、符号位置の説明にも、JIS C 6226 (現X0208)の波ダッシュに対応するものである旨が明記されています。こうした修正により、JISとUnicodeの間の変換でJISの波ダッシュを誤ってU+FF5Eに移してしまう等の問題のある実装も修正されていくと良いですね。

統合漢字のソース

ISO/IEC 10646ではCJK統合漢字のそれぞれについて各国規格の符号位置を示すテキストファイルを提供していますが、これまでJIS X 0212やベンダ定義外字のソースであったものが可能な限りJIS X 0213のソースに置き換えられたようです。例えば、U+4E28「丨」(←これ一応漢字です)の日本ソースがJIS X 0212のコード値(J1-3029。「J1」はJIS X 0212を表す印)だったのがJIS X 0213の第3水準漢字の「J13-2E24」と表されています。J13は、J1だったのをJIS X 0213の第3水準で置き換えた、の意味です。こうしたデータは統合漢字を調べる際に役に立つでしょう。

CJK統合漢字への追加

地味にBMPのCJK統合漢字のエリアに漢字が9文字追加されています。U+9FCDからU+9FD5に入っています。中国関連の文字のようですが、どういう背景で追加されているのかは知りません。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/604

コメントする

最近のブログ記事

日本の文字は「表イメージ文字」でいいのか
笹原 宏之『漢字に託した「日本の心」』 …
Creative Commonsライセンスの作品は無条件で使って良いわけではない
他人の写真や文章を盗用・コピペする「キュ…
「小樽雪あかりの路」の魅力
北海道の冬のイベントというと札幌の雪まつ…
libiconv に JIS X 0213がない場合
GNU libiconvはJIS X 0…
「キュレーション」なる語について
DeNAのキュレーションサイトWelqの…

広告