Unicode Standardの元号の説明の問題は変わっていなかった

| コメント(0) | トラックバック(0)

生前譲位の報道でUnicode仕様書の元号の問題を思い出す

天皇陛下が生前譲位される御意向という報道が出回り、様々な意見や憶測が飛び交っています。その中には譲位がなされれば行われるであろう改元についてのものもあります。これで私が思い出したのはUnicode仕様書の中の元号の説明が微妙に間違っている件です。

平成は1989年1月8日から始まりましたが、Unicode Standardの説明では1月7日としており1日ずれています。昭和や大正もなぜか同じく1日ずれています。アメリカ時間でもないのでしょうが、不思議な現象です。

Unicodeの最新版ではどうか?

上の記事を書いた時はUnicode 6.1だったのですが、現行の最新版ではどうかとチェックしてみました。

先日Unicode 9.0が発表されましたが(参考: Unicode 9.0が出ています (2016年6月))、上記記述に対応する部分のPDFはまだウェブサイトで公開されていません。"Available August 2016" と記されています。

現在該当部分を確認できる最新版は8.0.0でした。Chapter 22 Symbolsの中、Table 22-8 "Japanese Era Names" が該当部分です。これを見ると、先の記事を書いたときと同じ記述になっていました。仕様書の以前の版の記述をそのまま持ってきただけなのでしょう。誰も気づいていないのかもしれません。

元号の合字のようなものについて

なお、UnicodeにはU+337BからU+337Eの範囲に、明治から平成までの元号を1文字分にした合字のようなものが割り当てられています。これの存在が上記Table 22-8の設けられた理由です。

改元によってこれらに加えて新たな元号のものが追加されると思う向きもあるかもしれませんが、これら4つの元号の符号位置は元来ベンダ定義外字との互換用に設けられたものなので、新たな元号を追加するというのは適当でないでしょう。最近では知らない人もいるのかも知れませんが、昔のPCではベンダがシフトJISなどの文字コードの空き領域に勝手に文字を割り当ててしまうという問題があっていまだに尾を引いていますが(現在ではJIS X 0213やUnicodeの文字コード標準に従うべき)、その中にこれらの元号もあったのです。当時想定されたのがスペースの節約のためか縦書き用か詳細は知りませんが、いずれにせよ1文字分に詰め込みたいなら組版の機能で行うべきです。

もし個々の元号について必要だというなら、西暦645年の大化から明治の直前の慶応まで、全部の元号を追加すべきということも言えてしまうでしょう。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/607

コメントする

最近のブログ記事

電子マネーiDの隠れたお得
iDというのはSuicaやEdyのような…
Java 9 でようやくResourceBundle のデフォルト文字コードが UTF-8に
Java 9では国際化機構で用いられるリ…
Unicode 10.0リリース、変体仮名を収録
Unicode 10.0が2017年6月…
Chrome 拡張機能 Personal Blocklist でパクリサイトをブロックしよう
Google検索結果からサイトを除外でき…
Unicode の嫌なところを触ってしまった Python
Pythonとlibiconv, nkf…

広告