PHP で Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004

| コメント(0) | トラックバック(0)

最近知ったのですが、ウェブ開発によく使われるスクリプト言語のPHPでは、JIS X 0213の符号化方式、Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004が使えるようになっているそうです。バージョン5.4からmbstringというモジュールで対応がなされている由。

私自身はPHPを使わないのでよく分からないのですが、PHPをお使いの方は下記のページを見ていただくといいのではないかと思います。

ただ、よく注意してみると、EUC-JIS-2004を指定する文字列が "EUC-JP-2004" となっているようです。これはRubyの以前のバージョンと同じですね。紛らわしいところではあります。(参考: Ruby 2.1 で EUC-JIS-2004 の名前が修正)

さて、いくつかのプログラミング言語のJIS X 0213対応を表にすると下記のようになります。

言語EUC-JIS-2004Shift_JIS-2004ISO-2022-JP-2004
PHP
Python
Ruby××
Java (およびScala)××

このほか、libiconvを使えば上記3つのいずれの文字コードもUTF-16等の他の文字コードに変換できます。また、テキストエディタのGNU Emacsは上記3つ全てに対応しています。

私自身はISO-2022-JP-2004は正直使わないのですが、SJISというときはShift_JIS-2004、EUCはEUC-JIS-2004をもっぱら使用しています。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/596

コメントする

最近のブログ記事

朝鮮半島の訃報の第3水準漢字
朝鮮戦争で韓国軍として活躍した白善燁氏が…
テレワークの環境改善〜CO2濃度をチェックする
テレワークの問題点 新型コロナウイルスの…
エンジニアHubにて「文字コード再入門─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!」公開
「エンジニアHub」にて記事を執筆しまし…
National Geographic Your Shot で Daily Dozen に選ばれた話
ブログをさぼっている間に時間がずいぶん経…
情報処理学会から山下記念研究賞を頂いた話
ブログをさぼっている間に時間がずいぶん経…

広告