2010年7月アーカイブ

ISOの国際規格の一部を無料公開しているサイト(Publicly Available Standards)で、ISO/IEC 10646:2003の追補7が公開されました。10646というのはUnicodeと同等の国際標準です。この追補の発行は2010年7月15日付となっています。

この追補ではいくつも文字の追加がありますが、日本語に関係あるものとしては、新たに「Kana Supplement」というブロックが面01に追加され、2文字だけ、KATAKANA LETTER ARCHAIC E (符号位置U+1B000) と HIRAGANA LETTER ARCHAIC YE (符号位置U+1B001) というのが追加されています。

この2文字は、どうやらア行とヤ行の「え」の区別に関するもののようですが、私にはよく分かりません。元の提案者だという人のWebサイトもあったことを付記しておきます。

用意されたKana Supplementブロックは256文字分確保されています。今後、変体仮名でも入るのでしょうか。

ハイチの大地震が発生したのが今年1月。半年経ちますが、元々豊かでない国のため、復興は大変そうです。

災害時の緊急医療援助などの活動を国際的に行っているNPOのAMDAの報告によると、ハイチでは被災して手足を切断せざるを得なかった人が多くいるため、そういう人たちに義肢を提供するプロジェクトを行っているそうです。

ハイチには大家族が多いので、一家の大黒柱が脚を失って歩けなくなると、家族みなが困窮することになる。そういう人に義肢を提供することで、一家10人とかを支援することになる、ということのようです。手足を失った人の数は4000人とも5000人ともいわれているそうです。

テレビではハイチ地震の報道を見かけなくなりましたが、情報に注意を払って、こうした支援プロジェクトを応援することが必要なのだと思いました。

参考:

電子メールはISO-2022-JPで符号化するというのが、インターネットで日本語をやり取りするようになってから長く続いてきた習慣でした。しかしISO-2022-JPでは使える文字が限られていて、問題があります。現代日本の文字にちゃんと対応するには、JIS X 0213の文字に対応する必要があるのです。

で、細かい背景や議論は拙著『プログラマのための文字コード技術入門』の第6章を参照していただきたいのですが、結論からいうと、ASCII + JIS X 0208の組み合わせで済む場合はISO-2022-JPで、それを超える範囲の文字(JIS第3・第4水準とか)を含む場合にはUTF-8を使う、というのが、最も受け入れられやすそうに考えられます。異論もあるかもしれませんが、ここではそういうことにしておきます。

この方針は、Emacs上のメーラのMewで実現できます。Emacsでは既にJIS X 0213の文字コードを扱う方法が確立されていますし、文字入力にSKKやAnthyを使うことで、JIS X 0213の全文字を自由自在に入力できます。そしてMewはそうした文字の送受信にも対応しています。

Mewで上記の方針の通りの動作をするには、以下のように、Emacs Lispファイルを書き換える必要があります。デフォルトでは後述するとおりちょっと違った動作になってしまうので、動作の定義を変更してやるのです。

Mewを構成するEmacs Lispファイル mew-mule3.el の中に、下記のような記述があります。

    ((ascii japanese-jisx0208 japanese-jisx0213-1 japanese-jisx0213-2)
                            iso-2022-jp-3 "7bit"             "B")

この2行目を、下記の内容に置き換えます。

	utf-8 ,mew-charset-utf-8-encoding ,mew-charset-utf-8-header-encoding)	

以上です。

この変更によって、JIS X 0213の文字が含まれる場合はUTF-8で符号化されます。①のような丸付き数字や♡のような記号、あるいは「氐」「𩸽」のような第3・第4水準漢字が含まれていたら、UTF-8で符号化のうえ送信されるということです。一方、ASCIIとJIS X 0208の文字しか使っていない場合には、従来どおりにISO-2022-JPが使われます。

mew-mule3.elに上記の変更を施さない場合には、JIS X 0213の文字があるとMewはISO-2022-JP-3で符号化して送信します。これはこれで正統なやり方ではあるのですが、残念ながらこの符号化方式を解釈できるメーラはごく限られます。現時点では、UTF-8にした方が読んでもらえる可能性は高まります。

UTF-8は8ビットのコードなのでContent-Transfer-Encodingが問題になりますが、私が試したところではbase64になりました。これは上記のmew-charset-utf-8-encodingという変数で決まるようです。

ちなみに、私はMew 5.2で試していますが、上記変更箇所は最新版6.3でも変わっていないようなので、同じ手順でうまくいくと思います。

平野克己『南アフリカの衝撃』(日経プレミアシリーズ)を読みました。

南アフリカの過去と現在が分かる良い本だと思います。元々アフリカに住んでいた人々に加え、オランダからの入植者、連れてこられたマレー系の人々、さらにはイギリス人と、世界史の進展にあわせて複雑な変遷をたどってきたことが分かります。

さらには、企業活動のグローバル化、グローバル化の負の側面としての犯罪組織の国際的な活動など、良きにつけ悪しきにつけ、重要な国になってきているという印象を受けました。

また、アパルトヘイトが終わった後になると、アパルトヘイト撤廃のために活動していた人たちが行き場を失って失業者や犯罪者になってしまうなど、なかなかうまくいかないこともあるのだなと分かりました。

先月公開したAnthy用JIS第3・第4水準漢字辞書を更新して第0.2版としました。Anthyをお使いの方は試してみていただけると嬉しいです。

この版では、(c)から©が変換できたり、あるいは ! から ¡ が、(1) から ❶ が、といったように、仮名文字以外の記号・英数字から変換できる語彙が多数含まれています。非漢字の入力のバリエーションが増えているということです。

また、SKK-JISYO.JIS2004の内容をマージしているので、JIS2004で追加された所謂「表外漢字UCS互換」の10文字も新たに変換できるようになりました。ただし相変わらず用言には対応していません。

最近、インドの通貨ルピーの記号のデザインがインド政府から発表されたというニュースがありました。例えば時事ドットコムの以下の記事。

この記事には記号の画像も載っています。

それを受けて、ISO/IEC 10646 UCS (Unicode)にこの記号を入れようという提案が早くも出ているようです。10646を作っている作業部会、ISO/IEC JTC 1/SC 2/WG 2のサイトの文書番号N3862にあります。

新興国の勢いのようなものを感じます。

時として、ほかの人だったり別のマシンだったりに、メールで送るにははばかられるような大きさのファイルを渡したくなることがあります。そういうとき、簡単にWebサーバを立てることができれば便利なのにと思うことでしょう。私も先日そう思うことがありました。

世の中よくしたもので、PythonやRubyを使うと簡易なWebサーバを簡単に実現することができます。以下のページに解説されています。

結論からいってしまうと、Pythonで行う方が若干楽です。コマンドラインから次のように入力すれば、カレントディレクトリに http://localhost:8080/ でアクセスできるようになります。

$ python -m SimpleHTTPServer 8080

終了は Ctrl-C です。

一方、Rubyで同じことをするには、以下のようにやや長い入力が必要です。

$ ruby -rwebrick -e 'WEBrick::HTTPServer.new({:DocumentRoot => "./", :Port => 8080}).start'

テレビで放送していた映画「踊る大捜査線 THE MOVIE」を見ていたら、エンディングのスタッフロールにJIS第3水準漢字があるのが目に入りました。

「棈木」という人名の1文字目、棈です。面区点番号1-85-73です。EUCではF5E9、SJISではEB89になります。読み方は分かりません。あおきとでもいうのでしょうか。画面では旁の「青」が常用漢字体の青と同じになっていました。

JIS漢字字典には「棈木」であぶきという読みの人名が載っています。ただこの場合にどうかは分かりません。

私がメインで使っているPCが故障してしまったので、復旧するまでの間、ブログ更新があまりないかもしれません。機械は壊れるものだとはいえ、困ったものです。

さて、先週はダライ・ラマ法王が来日し、長野や横浜で講演されました。なんでも今回は動員数がかなり多かったように聞きます。

何度も日本に来ていて、特にここ数年は毎年来日されている法王は、日本では仏教への関心が高まっているようだと話されていました。聴衆の手ごたえなどからそう感じられたのでしょうか。

長らく「葬式仏教」などといわれてきて、最近ではその葬式にすらお坊さんを呼ばない人が出てきているらしいという状況からすると、仏教へ関心が高まっているというのは、ちょっと矛盾しているように思えます。

ですが、儀式的な習慣が惰性に成り果てたがために、そもそも仏教とはなんだったのかという根源的な問いに回帰してきたのだとすれば、矛盾ではないのかもしれません。

仏教というのは心の科学と形容されることもあり、人間の心の動きをよく観察して良い方向に持っていくことが重要視されているように思います。そうしたことに対する需要は時代を超えて存在します。むしろ、知的・精神的に高度な作業を必要とする職業につく人が増えた現代ではより多くの需要が存在するという見方さえ可能かもしれません。

今後、何かのきっかけで仏教が再発見される可能性があるのではないでしょうか。2002年頃からの自転車ブームは、自動車が溢れ返る世の中において、知的感度の高い人たちが「そうだ、自転車があった」と気付いて、ありふれた存在だった自転車を再発見して新たな役割を与えるものでした。同様に、「そうだ、仏教があった」という動きがあり得るかどうか。適当な契機があればそれは可能だと私は思います。

仏像ブームなんていうのもありますが、あれは美術品として鑑賞するにとどまっていて、仏教そのものとはあまり関係がないように思えます。しかし、そういう「器」が存在していれば、そこに実質を与えることは十分に可能です。アルボムッレ・スマナサーラの本もよく売れているようだし、新たな仏教受容の土壌は整いつつあるのかもしれません。

広告