波ダッシュ問題はなぜ『文字コード技術入門』の第8章にあるのか

| コメント(0) | トラックバック(0)

Unicode 8.0では、U+301C WAVE DASH (波ダッシュ)の例示字形が変更されて、JIS X 0208/0213の1面1区33点の例示字形と同様の形になるそうです。UnicodeコンソーシアムのウェブサイトのBETA Unicode 8.0.0から確認することができます。

波ダッシュがシフトJIS等のJIS系の符号化とUnicodeとの間の変換で文字化けを生じるケースがあることは、拙著『プログラマのための文字コード技術入門』第8章で説明しました。Unicode仕様書の例示字形は問題の一部でしかありませんが、これが是正されることは良いことだと思います。

さて、上記『文字コード技術入門』は全8章とAppendixとからなりますが、波ダッシュ問題について記しているのは本編の最後である第8章です。この位置に置かれていることには理由があります。

それは、この問題をきちんと理解するためには、第1章から第7章までのほとんどの章の内容が関連してくるからです。コード表の例示字形やフォントにだけやたら詳しくても、あるいはコード変換プログラムの実装についてだけやたら詳しくても駄目で、全体像を理解する必要があります。

本書への書評に、第8章の記述についてそうした構成の意図を汲んで言及してくれたものがあって、ああきちんと読み取ってくれているのだなとありがたく思った記憶があります。(URLをなくしてしまったのでリンクできないのが残念ですが)

パラメータをちょっといじったら文字化けが直りましたといった刹那的な話ではなしに、文字コードとはそもそもどういうものであって、どんな背景にもとづいて何が起こっているのかを理解し、長期的に見てどうするのがいいのかを判断するために本書の説明が役に立てば幸いです。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/563

コメントする

最近のブログ記事

JISの幽霊漢字が大正時代の新聞にあったように見えたという記事
JIS X 0208の幽霊漢字についてT…
Jアラート訓練メールで文字化けとのニュース
一昨日のことですが、中国・四国地方から文…
任俠の第3水準漢字
ユーモラス、と言っていいのか分かりません…
ふるさと納税で奥尻島のワインを頂きました
奥尻島は北海道の南西の方に浮かぶ島です。…
電子マネーの優先順位を考える
このブログを電子マネーとクレジットカード…

広告