EUCが国際標準化されていれば良かった

| コメント(3) | トラックバック(0)

すごい後知恵なんですが、1980年代に「EUC」方式の文字コードをISOで国際標準化しておけば良かったのではと考えます。

EUC方式、というのがどういうことかというと、

  • 8ビット符号表のGL領域(0x20-0x7F)にASCIIを配置、
  • GR領域には2バイトの漢字コードを配置

という形が基本で、必要に応じてシングルシフトコードでG2, G3に指示されている2バイト(ないし1バイト)符号化文字集合をGRに呼び出せるステートレスな符号、というものです。

具体的には、EUC-JIS-2004, EUC-JP, EUC-KR, EUC-CNなどです。

これはISO/IEC 2022の枠内の運用なので、別段この方式を改めて標準化する必要はないのではないか、という意見もあるでしょう。しかし、型決めしておくことによるメリットもあります。理解が容易になり、設計や実装も使い回せる。特に2022は複雑ですからね。

ISO/IEC 8859という規格は、GLにASCII、GRに欧州等の各地域ごとの文字集合を配置した1バイトコード、という形になっています。この2バイト版があっても良かったのではないか。

それは世の中で「EUC」と呼ばれてそれなりに共有されているのだけども、ISOで標準化されていなかったのはもしかすると惜しかったのではないか。特に、2バイトコードが出てきた早いうちからそれがあれば......、と考えた次第です。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/620

コメント(3)

「EUCが国際標準化されていれば良かった」のは、シフトJISの誕生を防げた (かもしれない) からでしょうか。

実現可能性はともかく今から振り返っての願望としてはそれもありますね。ただ、ここでの主眼は型を決めて標準化することにあります。2022はあまりに柔軟すぎるところがあるので。

例えば、日本における ISO-2022-JPや、(2022非準拠ですが) Shift_JIS などの複数の符号化方式が使われたことによる混乱 (?) が EUC-JP に統一されることによって緩和された (かもしれない) という意味だと理解しました。確かにそうなっていれば良かったですね。

コメントする

最近のブログ記事

JISの幽霊漢字が大正時代の新聞にあったように見えたという記事
JIS X 0208の幽霊漢字についてT…
Jアラート訓練メールで文字化けとのニュース
一昨日のことですが、中国・四国地方から文…
任俠の第3水準漢字
ユーモラス、と言っていいのか分かりません…
ふるさと納税で奥尻島のワインを頂きました
奥尻島は北海道の南西の方に浮かぶ島です。…
電子マネーの優先順位を考える
このブログを電子マネーとクレジットカード…

広告