メールで文字化けしていた第3水準漢字

| コメント(0) | トラックバック(0)

ある組織から送られてきた長めのメールの中で、人の名字にあたる部分で文字化けしているものがありました。名字の漢字2文字のうち1文字目が化けて「?」になっています。

はてなんだろうな。そのメールに記載のURLにアクセスしてみたらわかりました。「柗」、JIS X 0213の面区点位置1-85-59にあるJIS第3水準漢字です。「松」の異体字です。異体字ですから、読みも意味も同じです。

そんな字は見たことがないという人も多いかもしれませんが、同じタイプのものとして「船・舩」を想像すれば、ああそうかと納得されるかもしれません。

さてなぜこれがメールで文字化けしていたか。というと話は簡単で、メールの符号化にISO-2022-JPが使われていたためです。元の文章がUTF-8なりShift_JIS-2004なりの第3第4水準文字コードで作られていたとしても、ISO-2022-JPに変換しようとしたら第3水準漢字が表現できませんから「?」に置き換えられるなどします。

対処法としては、メールに第1・第2水準までしか対応していないISO-2022-JPではなく、第3・第4水準まで対応したUTF-8やISO-2022-JP-2004を使うことです。もっともISO-2022-JP-2004で送られても新しいエスケープシーケンスに対応したメーラは極めて少ないでしょうから、UTF-8でいいでしょう。ともあれ、いつでもどこでも第3・第4水準に対応したJIS X 0213やUnicodeの符号化方式を使うことが肝心です。JIS X 0213の11,233文字は日本語環境のベースラインとなります。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/558

コメントする

最近のブログ記事

Jアラート訓練メールで文字化けとのニュース
一昨日のことですが、中国・四国地方から文…
任俠の第3水準漢字
ユーモラス、と言っていいのか分かりません…
ふるさと納税で奥尻島のワインを頂きました
奥尻島は北海道の南西の方に浮かぶ島です。…
電子マネーの優先順位を考える
このブログを電子マネーとクレジットカード…
電子マネーiDの隠れたお得
iDというのはSuicaやEdyのような…

広告