波ダッシュ問題はなぜ『文字コード技術入門』の第8章にあるのか

| コメント(0) | トラックバック(0)

Unicode 8.0では、U+301C WAVE DASH (波ダッシュ)の例示字形が変更されて、JIS X 0208/0213の1面1区33点の例示字形と同様の形になるそうです。UnicodeコンソーシアムのウェブサイトのBETA Unicode 8.0.0から確認することができます。

波ダッシュがシフトJIS等のJIS系の符号化とUnicodeとの間の変換で文字化けを生じるケースがあることは、拙著『プログラマのための文字コード技術入門』第8章で説明しました。Unicode仕様書の例示字形は問題の一部でしかありませんが、これが是正されることは良いことだと思います。

さて、上記『文字コード技術入門』は全8章とAppendixとからなりますが、波ダッシュ問題について記しているのは本編の最後である第8章です。この位置に置かれていることには理由があります。

それは、この問題をきちんと理解するためには、第1章から第7章までのほとんどの章の内容が関連してくるからです。コード表の例示字形やフォントにだけやたら詳しくても、あるいはコード変換プログラムの実装についてだけやたら詳しくても駄目で、全体像を理解する必要があります。

本書への書評に、第8章の記述についてそうした構成の意図を汲んで言及してくれたものがあって、ああきちんと読み取ってくれているのだなとありがたく思った記憶があります。(URLをなくしてしまったのでリンクできないのが残念ですが)

パラメータをちょっといじったら文字化けが直りましたといった刹那的な話ではなしに、文字コードとはそもそもどういうものであって、どんな背景にもとづいて何が起こっているのかを理解し、長期的に見てどうするのがいいのかを判断するために本書の説明が役に立てば幸いです。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/563

コメントする

最近のブログ記事

電子マネーiDの隠れたお得
iDというのはSuicaやEdyのような…
Java 9 でようやくResourceBundle のデフォルト文字コードが UTF-8に
Java 9では国際化機構で用いられるリ…
Unicode 10.0リリース、変体仮名を収録
Unicode 10.0が2017年6月…
Chrome 拡張機能 Personal Blocklist でパクリサイトをブロックしよう
Google検索結果からサイトを除外でき…
Unicode の嫌なところを触ってしまった Python
Pythonとlibiconv, nkf…

広告