PHP で Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004

| コメント(0) | トラックバック(0)

最近知ったのですが、ウェブ開発によく使われるスクリプト言語のPHPでは、JIS X 0213の符号化方式、Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004が使えるようになっているそうです。バージョン5.4からmbstringというモジュールで対応がなされている由。

私自身はPHPを使わないのでよく分からないのですが、PHPをお使いの方は下記のページを見ていただくといいのではないかと思います。

ただ、よく注意してみると、EUC-JIS-2004を指定する文字列が "EUC-JP-2004" となっているようです。これはRubyの以前のバージョンと同じですね。紛らわしいところではあります。(参考: Ruby 2.1 で EUC-JIS-2004 の名前が修正)

さて、いくつかのプログラミング言語のJIS X 0213対応を表にすると下記のようになります。

言語EUC-JIS-2004Shift_JIS-2004ISO-2022-JP-2004
PHP
Python
Ruby××
Java (およびScala)××

このほか、libiconvを使えば上記3つのいずれの文字コードもUTF-16等の他の文字コードに変換できます。また、テキストエディタのGNU Emacsは上記3つ全てに対応しています。

私自身はISO-2022-JP-2004は正直使わないのですが、SJISというときはShift_JIS-2004、EUCはEUC-JIS-2004をもっぱら使用しています。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/596

コメントする

最近のブログ記事

National Geographic Your Shot で Daily Dozen に選ばれた話
ブログをさぼっている間に時間がずいぶん経…
情報処理学会から山下記念研究賞を頂いた話
ブログをさぼっている間に時間がずいぶん経…
Go と Rustの文字列
Go言語における文字列はUTF-8のバイ…
『[改訂新版] プログラマのための文字コード技術入門』のページ作成
発売されてから半年以上経ってようやくのこ…
『[改訂新版]プログラマのための文字コード技術入門』発売!
ばたばたしていて当サイトの更新も怠ってい…

広告