2010年10月アーカイブ

ウェブページ「創造性の育成塾 北の国からのエッセイ秋の道東一巡り(5)〜オホーツクの秋の花〜」に、漢字を画像で作って貼っている箇所があるのが目を引きました。

それは、高浜虚子のこういう句です。

玫瑰(はまなす)の丘を後にし 旅つづく

この句の一文字目、「玫」を画像にしていたのでした。

この漢字は、JIS第3水準、面区点番号1-87-88にあります。このウェブページはUTF-8で符号化されているので「玫」を符号化することはできるのですが、入力環境に問題があって文字を入れられなかったのか、わざわざ画像にして貼り込んでいます。

単にエンコーディングだけをUTF-8にしてもしようがないという例です。JIS X 0213の文字がきちんと入力できなければ意味がありません。

SKKのJIS第3・第4水準漢字辞書やそれをAnthy用に変換した辞書では、「はまなす」や「まいかい」という読みから「玫瑰」を単語として入力することができます。国語辞典をひくと、はまなすの漢名として「玫瑰(まいかい)」が掲載されています。俳句では、季語になっていることからしばしばこの語が現れるようです。

ちなみに、JIS X 0213の規格票を見ると、この字を使った人名の用例もあるようです。JIS X 0213は面白い。

キーボードから日本語を入力する方法として、ローマ字入力は最も多く使われている方式でしょう。ほとんどの人が使っていると言っても過言ではないと思います。

このローマ字入力、良いところは何かといえば、まず第一に覚えることが少なくて済むということでしょう。覚えることが少ないというのには2つの意味があります。ひとつは、アルファベットの配列さえ覚えてしまえば、英語などを入力するのにも日本語を入力するのにも使えるということ。アルファベットと別に仮名のキー配列を覚える必要がないということですね。もうひとつは、覚えるべきキーが少ないということ。キーボードの最上段を使う必要がないのは勿論、qとかvとかの位置は知らなくてもいい。

しかし、覚えることが少ないということ以外のメリットは思い付きません(ほとんどのソフトウェアでサポートされているというのもありますが、それはどちらかといえば結果論)。覚えることが少ないというのは、逆にいえば入力時の冗長性が高いということでもあり、非効率性につながることでもあります。

ローマ字入力は最初に覚える配列としては確かに適当なものでしょう。しかし、いつまでもローマ字入力でいいのでしょうか? ITリテラシーが上がったなら、やさしくて非効率的なローマ字入力を卒業して、より効率的な入力方式にステップアップしても良いのではないでしょうか。

ローマ字入力以外の選択肢をここではいくつか挙げてみましょう。

JIS仮名配列

いわゆる「仮名入力」としてポピュラーな方式。日本で販売されているPCに付属のキーボードに刻印されている仮名配列がこれです。多くの日本語入力ソフトウェアでサポートされており、とりあえず取りかかりやすいといえるでしょう。

ローマ字入力に対するメリットは、1打鍵で入力できる文字が多いということが挙げられます。打鍵数が少なくなるので、速く、少ない負担で入力できます。一方で、キーボードの最上段を使うことから、あまり打ちやすい配列とはいえません。

親指シフト

かつて富士通のワープロで採用されて人気の出た入力方式。その名のとおり、親指で押すシフトキーを持つ独特のキーボードで打つことを前提とした方式です。根強い人気を保っており、プロの作家にも愛用者がいます。

メリットは、1つの入力アクションに1つの仮名が対応することから、速く快適な入力が可能であることです(だそうです)。一方、特別なキーボードを必要とすることが採用のための難点となります。もっとも、親指シフトキーボードは現在でも発売されてはいますし、また、通常の日本語キーボードの変換キーなどを親指シフトに見立てるエミュレーションソフトが開発されてもいます。つまり、エミュレータさえ導入すれば親指シフトを実現することは可能ということです。とはいえ、変換キーのないANSI配列キーボードではやはり無理があり、キーボードを選ぶという点は大なり小なりついて回ります。

月配列

JIS仮名配列は文字通りJISの規格、親指シフトはベンダが開発した方式ですが、この月配列は、なんと2ちゃんねるで匿名の有志たちが開発した草の根発祥の仮名配列です。

月配列には、新JIS配列と花配列という2つのルーツがあります。新JIS配列を元に、花配列で発明された中指シフトを組み合わせたものが月配列です。

メリットは、親指シフトと異なり特別なキーボードを全く必要としないこと、JIS仮名配列と異なり最上段を使わず打ちやすいこと、それでいて入力打鍵数はローマ字入力より25%ほど少なくて済む、ということです。

こういう優れた性質を持つ配列ですが、何ぶん、草の根の活動にすぎないことから(それも匿名!)、有力ソフトウェアによるサポートが全くといっていいほど無いのが難点です。月配列を紹介したホームページを見ると、Windowsで月配列を実現するソフトウェアを見付けることができます。また、私はEmacs上のSKKで月配列を実現する設定ファイルを公開しています。

私はこの月配列を使っています。

花配列

これも、2ちゃんねるではありませんが、規格やPCベンダとは無関係に提唱された仮名配列です。月配列で採用された中指シフトという卓抜なアイディアの元祖です。

メリット・デメリットは月配列とほぼ同様と考えて良いでしょう。ただ、花配列はキーボード最下段の使用が多いそうです。この点を嫌うなら月配列、むしろ好きなら花配列を選ぶということになるのかもしれません。

ウェブページ「花のくに」に花配列の説明があります。

さあどうでしょう、ローマ字入力を卒業したくなってきましたか? 新たなキー配列を覚えるには手間と根気が必要です。しかしその先には、もっと良い世界があなたを待っている筈です。

asahi.comの記事「河北に環首都経済圏 北京・天津・河北の一体化加速」に、JIS第3・第4水準漢字がまとめて出てきました。

いずれも地名として、「タク州市、ライ水県、タク鹿県」「ラン平県」の4つです。記事の後ろの方には、「*ライ:「さんずい」に「來」」「*ラン:「さんずい」に「欒」 」と注釈が付いています。タクは忘れてしまったものか、注釈なしです。

それぞれ、涿州、淶水、涿鹿、灤平、でしょう。「涿」は第3水準、面区点1-86-80、「淶」は第4水準、面区点2-78-76、「灤」は第3水準、面区点1-87-35です。

JIS X 0213に対応していればこれらの字はなんなく表すことができます。JIS X 0213が制定されたのはもう10年も前なのですが、世間は一体いつまでJIS X 0208にこだわっているのでしょう。

なお、JIS X 0213に対応しているSKKの辞書、およびそれをAnthy用に変換した辞書では、涿州と涿鹿は既に単語として変換可能となっています。

自転車が注目されています。世界的に。理由はもちろん、地球温暖化をはじめとする環境問題が大きいわけですが、それだけでなく、渋滞対策、健康増進(医療費削減) といった面も無視できません。自転車には色々な効果が見込めるということです。オランダやドイツ、デンマークといった一部欧州諸国は20世紀のうちから自転車活用に取り組んできましたし、近年ではアメリカやイギリス、フランスといった国々も自転車政策を始めているそうです。

日本でも2000年代の半ばくらいから自転車ブームだといわれています。本当は一過性のブームなどでなく、地殻変動のような大きなうねり、本質的な変化であろうし、またそうであるべきだと思います。

そういう日本における自転車ムーブメントの立役者といっていいであろう疋田智氏の新刊『自転車ツーキニストの作法』(ソフトバンク新書)が発売になりました。

疋田氏は自転車に関する多くの著作を持っています。その中には、『自転車生活の愉しみ』という、高千穂遙氏や勝間和代氏といった著名人に影響を与えた名作もあれば、『自転車の安全鉄則』という一冊まるごと自転車交通の安全について書かれた空前の本などもあり、氏は自転車界のオピニオンリーダーというべき存在になっています。

で、その新刊なわけですが、名前からわかるように自転車通勤についての「作法」を語るというものになっています。もっとも、別に通勤でなくても、日常の移動に自転車を使う、あるいは週末に自転車に乗って楽しむ、という場合でも十分通用する話です。

また、交通機関としての自転車について多く書かれているのが特徴といえるでしょうか。短くいえば、今の日本の自転車交通はデタラメであって、直さなきゃいけないことが多いということです。直さなきゃいけないことには、交通行政の問題もあれば、自転車乗り自身の問題もある、はたまた自動車ドライバーの問題もある、と、あちこち問題だらけなので、勢いこのトピックの分量が増えるというものです。

著者は既に何冊もの著書をものしているので、今までの本と同じなんじゃないの、という疑いを、読む前にはちょっと持ってしまったことも事実です。基調となるトーンは既刊の本と共通ですが (そりゃそうだ、同じ著書のいうことがコロコロ変わるわけはない)、さすがに最新の情報に基いた記述になっています。著者の本に親しんでいる人にも新しい発見があるものと思います。

メルマガにおける著者本人の弁では本書は「辛口」だそうです。まあ、いわれてみれば辛口かもしれませんが、面白い方が先に立っています。面白いですよ、この本は。自転車に乗る人、また、交通としての自転車に興味のある人は是非読んでみるといいでしょう。本書がたくさんたくさん売れてその内容が社会に浸透したら、日本の道路はもっと走りやすく安全になるのではないかなあと、私は期待しています。

以前にも書きましたが、私は日本語入力に月配列という仮名配列を使用しています。

月配列にはいくつか良い点があります。一つには、ローマ字入力に対して打鍵数が少ないことがあります。ローマ字入力に比べてざっと4分の3程度の打鍵数で済みます。これは1打鍵で入力できる文字が多いからです。「ここにきたってことはないしょなのに、そんなこというのかい」という文の文字は全部1打鍵で打てます。

ならば、入力速度もローマ字入力の4分の3になるのかというと、さすがにそんな単純な話にはならないようです。

ローマ字入力で打つ場合、例えば「か」を入力する「ka」、「に」を入力する「ni」などは、ばらばらでなく、間を詰めてまとめて打たれる傾向があるように感じます。1文字に2打鍵かかるときでも、1打鍵の文字の2倍かかるのではなく、もっと短い時間で打っているように思われます。

試しに、いくつか文をローマ字入力と月配列とで両方打ってみて時間を比べてみました。やはり月配列の方が速いようです。ただし、4分の3というような大きな差はつきません。

時間にあまり大きな差がつかないなら新たな配列を無理して覚える必要はないというのもひとつの考え方でしょう。一方、少しでも速い方がいいという考え方もあり得ます。あるいは、時間だけの問題でなく、手にかかる負担を考慮したら打鍵数が少ない方がいいという見方もできます。

何にせよ、ローマ字入力にこだわらずに、より良い方式を検討するのは良いことでないかと思います。

国際貢献の真実

| コメント(0) | トラックバック(0)

伊勢﨑賢治『国際貢献のウソ』(ちくまプリマー新書)を読みました。

アフガニスタンで武装解除を行ってきた筋金入りのプロが、国際貢献の通俗的な甘い幻想を容赦なく鮮やかに切っていく本です。

例えば、国際貢献というとボランティアが現地に赴いて汗水たらして工事をしたり穴を掘ったりというイメージ。日本人は実際にこういう貢献の仕方をしたりするそうですが、実際に国際協力のNGOが必要としているのは、現場で働く人でなくマネジメントの人材だと著者はいいます。現場で働くスキルのある人は現地にもたくさんいるのだとか。予算をきっちり管理して、時には容赦なく人をクビにできるような人材が求められているのだそうです。

また、国際貢献は利益を求めてはいけないというイメージ。日本人はそういう観念を抱きがちですが、国際NGOは豊富な資金力を持ち、給料も国連職員と同じくらい出るそうです。日本のNGOは資金力がなく、給料が低いといいます。その裏には日本に寄付文化が根付いていないことがあります。資金力がなければできることも自ずと限られます。著者は日本のNGOがNPO (つまり非営利団体)であることをやめたらという提言をしています。ビジネスとして行うべしということです。

また、国連に対するイメージ。国連は要するに官僚組織であって、いろいろ無駄が多く、現場の活動はNGOがないと成り立たないのだそうです。また国連は国の集まりであることから、各国(特に安保理の常任理事国)の思惑で動いたり動かなかったりすることがあって、平和のために公平に活動しているとはいいがたい面もある。そういうことが具体的な事例にもとづいて書かれています。

そのほか様々なことが、みもふたもない感じで書かれています。実態というものは多くの場合みもふたもないのかもしれません。国際貢献について考えたい人におすすめの本。

ニュースから新JIS漢字ネタ2題。

MSN産経ニュース、「「オレたちはゆるくない!」ゆるキャラ20体集結 大会前に鳥取砂丘で決起集会」に、こんな表記がありました。

鳥取砂丘で行われる「ゆるキャラ●(=○の中にR)カップ」

「○の中にR」とは、登録商標を表す®のことでしょう。以前にも、「ゆるキャラ®」という表記を取り上げたことがありました。「ゆるキャラ」が商標登録されていることをアピールしたいという関係者の思惑があるようです。

それにしても、こういうときは (R) のような代用表記を使うことが多いのですが、「○の中にR」と記すパターンは珍しい。記事制作の都合か何かなのでしょうか。

次は漢字。

同じくMSN産経ニュース、「【世界体操】五輪金の中国が存在感」に、「主軸の江●(=金へんに玉)源らが」という記載がありました。

「金へんに玉」とは、JIS第3水準の「鈺」、面区点番号1-93-08でしょう。EUCではFDA8、SJISではEF47というコード値になります。

ここでは中国人の名前として出てきていますが、同じ字がオクという読みで韓国人の名前としても使われることもあります。

それにしても世間はいつになったら文字の足りないJIS X 0208を卒業して新JIS漢字(JIS X 0213)の世界に入るのでしょうか。

先日、東京・池上本門寺で、日蓮の命日にあわせて毎年行われる「お会式」がありました。私は初めて見に行ってきました。

今まで知らなかったのですが、これはたいそう大きなイベントで、大変な人出があります。電車は臨時ダイヤになっているし、付近一帯は交通規制が敷かれていて、万灯が練り歩きまくる体制になっています。駅から寺へと向かう道の両脇にはびっしりと露店が連なっていて賑わいを見せています。

お会式の万灯

万灯を中心とした行列は住宅街を小気味よいテンポの音を発しながら練り歩きます。

お会式の万灯

万灯は、日蓮が亡くなったときに桜の花が開いたという故事から、紙で作った花で宝塔を飾っています。光が綺麗です。

お会式の万灯

寺の長い階段を皆で上っていきます。

お会式の万灯

沿道だけでなくもちろん境内も人でいっぱい。

IMG_1127

江戸時代の火消しが持っているようなもの(何て言うんでしたっけこれ)を盛んに回しています。

この様子は、YouTubeやUstreamで配信もされていたそうです(とウェブサイトに書かれていました)。お寺は案外こうした新しいメディアに積極的だったりするようです。

Unicode 6.0.0

| コメント(0) | トラックバック(0)

Unicode 6.0.0が発表されました。

日本の利用者にとって最も影響が大きいのは携帯電話の絵文字の収録でしょうか。『プログラマのための文字コード技術入門』に書いたとおり、多くの絵文字はBMPでなく面01に入っているので、UTF-16ではサロゲート・ペアの、UTF-8では4バイトのUTF-8への対応が必須です。Unicode対応を謳いながらこれらの機構に対応していない時代遅れのプログラムは改善が必要です。

ただ、Unicodeに絵文字が入ったからといって、それを張り切って使うのが本当に良いことなのかどうかは、文字コード以前の問題として、考えられるべきではないかと思います。「絵文字」というものの、それは言語表記に用いる文字ではなく、ただの絵にすぎません。文章の中に絵を散りばめるのは、文章力のなさを非言語的なシンボルによる印象で糊塗しようとしているだけではないのかという疑いを消すことが私にはできません。

さて、新規追加の漢字としては面02にCJK統合漢字拡張Dというのが追加されています。ブロックはU+2B740〜U+2B81Fです。これらを使う機会はほとんどの場合ないでしょう。コード表を見ていると、書体の違いや書き方の癖のようなものを無理矢理明朝体化したようなものが見受けられ、Unicodeとしてどういう基準で収録しているのか疑問を抱きます。例えば、U+2B746は「今」という字の手書きの書体でよく見られる形でしょう。岡山県の倉敷美観地区にある今橋という橋(大原美術館のすぐ前)に彫られている「今」という字はこの形です。康煕字典の(康煕字典体ではなく楷書で書かれている)序文の「今」もこの形だといいます。ほかにも沢山あるでしょう。「解説 字体辞典」を見ると、「今」の伝統的な楷書の形であることが分かります。こうしたものに別のコードを振るというのが本当に適切なのか疑問に思います。

前に少し記した、インドの通貨ルピーの記号も早速入りました。U+20B9です。

バージョン6.0.0での変更点はUnicodeコンソーシアムのWebサイトから見ることができます。

拙著『プログラマのための文字コード技術入門』がおかげさまでまた増刷されることになりました。皆様本当にありがとうございます。読もうかどうしようか迷っていた方は、この機会に是非どうぞ。

最近聞いた感想には、「面白くて1日で読んだ」というものもありました。ありがたいことです。技術書ですから内容がきちんとしていることは必須条件ですが、「面白い」といっていただけるのは大変励みになり、書いた甲斐があったと実感します。嬉しいことに、当初の予想以上に、面白いと言っていただいています。

面白いといっても、別にギャグが散りばめられているわけでもなければ、寸劇仕立てになっているわけでもありません。であれば、この場合の「面白い」というのは一体どういう面白さなのか? ということを考えてみるのも一興かもしれません。

先週、埼玉県の東武動物公園に行ってきました。

ここはホワイトタイガーがウリです。文字通り白い虎です。白虎です(?)。

Pillow

ホワイトタイガーの餌やりタイムも見てきました。人が多過ぎてよく見え なかったのですが、肉に向かってとびつくところが見られました。

Hand and tongue

この動物園には犬とふれあえるコーナーもあります。ただし別料金500円が 必要なのですが、わざわざ500円払うような人ならば犬にいたずらしたりしな いということなのかもしれません。このコーナーはベンチで囲った枠の中に犬 が沢山いて、撫でることができたり、座っている人の膝に犬が乗ってきたりす るというものです。犬は大変おとなしい。

Noticed

このダルメシアンは置物のようにおとなしかったです。

Tail and face

この写真は色合いが面白くなりました。表情もいい。

Encounter

毛並みが綺麗です。

勿論、象とかライオンとか、定番の動物たちもちゃんといます。

Yawn

ライオンのおおあくび。

Napping lion

お昼寝中。

Meerkats in the dark

ミーアキャット。

Snowy owl in a cage

シロフクロウ。格好いい表情が撮れました。

末延岑生『ニホン英語は世界で通じる』(平凡社新書)を読みました。刺激的でユニークな面白い本でした。

日本人は英語が下手だとよく言われます。英語の上手下手ということでよく槍玉にあげられるのが発音です。ネイティブの英語を至上のものとするならば下手といえるのかもしれません。

しかし、英語が英国や米国の言語というよりも国際交流のための手段として使われる局面では、そういう見方は必ずしも当たっていないようです。なんと、アジアでは、ネイティブの英語よりも日本人の英語の方が通じるという研究もあるとのことです。

ネイティブの発音は、効率性が追求された結果として、単語の間がつながっていて発音の切れ目と単語の切れ目が一致しないなど、非ネイティブにはわかりにくい特徴があります。

また、日本の学校のテストでは几帳面にバッテンをつけられるような細かな文法事項も、実際の会話の場面では理解を妨げるほどのことでないものも少なくないようです。間違いを恐れず臆せずに話した方が得なのかもしれません。

インドやシンガポールなどと違って、日本は国内で自国民同士の会話として英語を話す必要はないので、日本英語というものが確立する条件はあまり高くないのではないかと、私には思えます。しかしそれでも、日本人が話し・聞きやすい英語、日本的な発想にもとづいた英語が普及することは、肯定されて良いように思いました。

広告