メールの符号化

| コメント(0) | トラックバック(0)

私はメーラにMewを使っているのですが、これを使うといろいろ発見があります。

この前は、日本語のメールで、ISO-2022-JPをQuoted-Printableしたものに出食わしました。なぜそんなことが分かるかというと、Mewのメール一覧の表示エリアで、日本語がデコードされていなかったので気付いたのです。

7ビットのコードで特別な符号化を施す必要のないISO-2022-JPをQuoted-Printableにするのは、無駄なことです。なぜこんなことになったのでしょう。

UTF-8をQuoted-Printableにしたものを見ることもあります。Twitterから送られてくるメールはこれだと思います。日本語のメールならbase64の方が効率的なのですが、Q-Pにするのは欧米のASCII+αな文字体系のシステムをそのまま使っているからだと想像できます。これは仕方ない感じがしますが、Q-Pかbase64か、適切な符号化を自動で判断できればベストなのだと思います。

メールの符号化について、『プログラマのための文字コード技術入門』でも説明しています。メールを送信するようなアプリケーションを初めて作るというような方は、お読みいただくと良いと思います。いま買うと震災の被災地の支援にもなるので、是非どうぞ。

符号化とは少々別の話ですが、先日使ったあるウェブシステムは、送出されてきたメールを見たら全然読めない状態でした。何が起こったのかをひとしきり調べてみたら、UTF-8の本文をbase64して送っているのですが、ヘッダの途中に空行が誤って入ってしまって、それ以降が本文扱いされてしまい、base64した結果がまるごと本文になってしまっていたのでした。base64の箇所だけ抜き出してデコードしたら、何が書いてあったかは分かりました。普通は本番稼働する前にテストして気付かないものかと思います。メーラにもいろいろありますが、これが読めるメーラは多分ないと思うのですが...。開発時によく注意してほしいと思います。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/241

コメントする

最近のブログ記事

名字の第3水準漢字:「㞍」
先日テレビを見ていたら、人名の名字にJI…
JISの幽霊漢字が大正時代の新聞にあったように見えたという記事
JIS X 0208の幽霊漢字についてT…
Jアラート訓練メールで文字化けとのニュース
一昨日のことですが、中国・四国地方から文…
任俠の第3水準漢字
ユーモラス、と言っていいのか分かりません…
ふるさと納税で奥尻島のワインを頂きました
奥尻島は北海道の南西の方に浮かぶ島です。…

広告