波ダッシュ問題はなぜ『文字コード技術入門』の第8章にあるのか

| コメント(0) | トラックバック(0)

Unicode 8.0では、U+301C WAVE DASH (波ダッシュ)の例示字形が変更されて、JIS X 0208/0213の1面1区33点の例示字形と同様の形になるそうです。UnicodeコンソーシアムのウェブサイトのBETA Unicode 8.0.0から確認することができます。

波ダッシュがシフトJIS等のJIS系の符号化とUnicodeとの間の変換で文字化けを生じるケースがあることは、拙著『プログラマのための文字コード技術入門』第8章で説明しました。Unicode仕様書の例示字形は問題の一部でしかありませんが、これが是正されることは良いことだと思います。

さて、上記『文字コード技術入門』は全8章とAppendixとからなりますが、波ダッシュ問題について記しているのは本編の最後である第8章です。この位置に置かれていることには理由があります。

それは、この問題をきちんと理解するためには、第1章から第7章までのほとんどの章の内容が関連してくるからです。コード表の例示字形やフォントにだけやたら詳しくても、あるいはコード変換プログラムの実装についてだけやたら詳しくても駄目で、全体像を理解する必要があります。

本書への書評に、第8章の記述についてそうした構成の意図を汲んで言及してくれたものがあって、ああきちんと読み取ってくれているのだなとありがたく思った記憶があります。(URLをなくしてしまったのでリンクできないのが残念ですが)

パラメータをちょっといじったら文字化けが直りましたといった刹那的な話ではなしに、文字コードとはそもそもどういうものであって、どんな背景にもとづいて何が起こっているのかを理解し、長期的に見てどうするのがいいのかを判断するために本書の説明が役に立てば幸いです。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/563

コメントする

最近のブログ記事

日本の文字は「表イメージ文字」でいいのか
笹原 宏之『漢字に託した「日本の心」』 …
Creative Commonsライセンスの作品は無条件で使って良いわけではない
他人の写真や文章を盗用・コピペする「キュ…
「小樽雪あかりの路」の魅力
北海道の冬のイベントというと札幌の雪まつ…
libiconv に JIS X 0213がない場合
GNU libiconvはJIS X 0…
「キュレーション」なる語について
DeNAのキュレーションサイトWelqの…

広告