EUCが国際標準化されていれば良かった

| コメント(3) | トラックバック(0)

すごい後知恵なんですが、1980年代に「EUC」方式の文字コードをISOで国際標準化しておけば良かったのではと考えます。

EUC方式、というのがどういうことかというと、

  • 8ビット符号表のGL領域(0x20-0x7F)にASCIIを配置、
  • GR領域には2バイトの漢字コードを配置

という形が基本で、必要に応じてシングルシフトコードでG2, G3に指示されている2バイト(ないし1バイト)符号化文字集合をGRに呼び出せるステートレスな符号、というものです。

具体的には、EUC-JIS-2004, EUC-JP, EUC-KR, EUC-CNなどです。

これはISO/IEC 2022の枠内の運用なので、別段この方式を改めて標準化する必要はないのではないか、という意見もあるでしょう。しかし、型決めしておくことによるメリットもあります。理解が容易になり、設計や実装も使い回せる。特に2022は複雑ですからね。

ISO/IEC 8859という規格は、GLにASCII、GRに欧州等の各地域ごとの文字集合を配置した1バイトコード、という形になっています。この2バイト版があっても良かったのではないか。

それは世の中で「EUC」と呼ばれてそれなりに共有されているのだけども、ISOで標準化されていなかったのはもしかすると惜しかったのではないか。特に、2バイトコードが出てきた早いうちからそれがあれば......、と考えた次第です。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/620

コメント(3)

「EUCが国際標準化されていれば良かった」のは、シフトJISの誕生を防げた (かもしれない) からでしょうか。

実現可能性はともかく今から振り返っての願望としてはそれもありますね。ただ、ここでの主眼は型を決めて標準化することにあります。2022はあまりに柔軟すぎるところがあるので。

例えば、日本における ISO-2022-JPや、(2022非準拠ですが) Shift_JIS などの複数の符号化方式が使われたことによる混乱 (?) が EUC-JP に統一されることによって緩和された (かもしれない) という意味だと理解しました。確かにそうなっていれば良かったですね。

コメントする

最近のブログ記事

日本の文字は「表イメージ文字」でいいのか
笹原 宏之『漢字に託した「日本の心」』 …
Creative Commonsライセンスの作品は無条件で使って良いわけではない
他人の写真や文章を盗用・コピペする「キュ…
「小樽雪あかりの路」の魅力
北海道の冬のイベントというと札幌の雪まつ…
libiconv に JIS X 0213がない場合
GNU libiconvはJIS X 0…
「キュレーション」なる語について
DeNAのキュレーションサイトWelqの…

広告