2010年12月アーカイブ

まず何はなくとも、『プログラマのための文字コード技術入門』(技術評論社)。まだの方はこの機会に是非。

......と、これだけで終わるのはいくら何でもあんまりなので、関連する本をいくつか挙げてみましょう。

まずは芝野耕司編著『JIS漢字字典』(日本規格協会)。

のっけから困ったことに、この貴重な書籍は今現在、品切れらしいのです。Amazonでは中古品が買えます。中古はややお高いですが、JIS漢字を知りたい方は是非。新品が欲しい方は、日本規格協会に要望を出すとかになるのでしょうか。

次は、安岡孝一、安岡素子『文字コードの世界』(東京電機大学出版局)。

いかんせん10年前の本なので情報が古いことは否めないのですが、日本以外の各国の文字コードを紹介した本というのはほかにあまり (ほとんど? 全く?)ないので、そういう箇所を見るのにはいいと思います。これも品切れで、中古品になります。安く出ているようです。

次は、小林龍生ら編『インターネット時代の文字コード』(共立出版)。

これも、古いことは古いのですが、Unicode以外の文字コードについてはそんなに問題ない時期ではないかと思います。論集の形をとっています。面白い記事は面白いし、また自分にはあまり興味が持てないというのもあったりするでしょう。私は、書誌データベースの話が気に入りました。この本はAmazonに新品の在庫があるようです。

次。三上喜貴『文字符号の歴史 アジア編』(共立出版)。

上にリンクをつけたものの、激しいことに、Amazonでは新品も中古品も販売されていません。どうにかして入手してください、としかいいようがない。アジア編ということで、インド系の文字やアラビア文字などの処理が紹介されています。各地の情報処理事情なども書かれていて、これは年による変化もあるのでしょうが、これだけ調べられているのはすごいことだと思います。

姉妹編として、安岡孝一、安岡素子『文字符号の歴史--欧米と日本編』(共立出版)。

欧米・日本の文字コード、つまりASCIIやJIS X 0208といったおなじみの文字コード規格の成立過程を非常に丹念に追いかけている本。巻末の文献リストは圧巻。記述が20世紀の最後の年で終わっているので、JIS X 0213の2004年改正までは入っていません。

次は、漢字の字体の理解のための本として、江守賢治『解説 字体辞典』(三省堂)。

困ったことにこれも品切れ、中古品もなし、という状況。復活するまでは、次の本をお読みいただきたい。この『解説 字体辞典』に影響を受けた本です。

気をとりなおして、大熊肇『文字の骨組み』(彩雲出版)。

文字の骨組みは、楷書や明朝体活字といった書体によって変わるものだ、というのがこの本の骨子。良い本です。この本によって文字の常識というものを取り戻してほしいと思います。

最後に、Andrew Deitsch, David Czarnecki、風間一洋(翻訳)『Java国際化プログラミング 』。

これも古い本で中古品しかありません。対象としているJDKのバージョンも古いです。が、国際化の考え方や基本的な技法はそう変わるものでないので、役に立つと思います。

佐々木信夫『道州制』(ちくま新書)を読みました。

道州制の議論というと、どういう区割りにするかということがしばしば報じられますが、道州制というのは単に区域を分けるだけのものではありません。著者は区割りの話題に終始する議論に不満があるようです。

著者は道州制が必要な根拠として以下の3つを挙げています。ひとつには、日本を分権国家へと導くため。ふたつめは、広域化時代に対応するため、三つめは、行財政を効率化するため。

本書では道州制のメリットや反論を紹介しています。また、一口に道州制といってもどういう形を目指すべきなのかは議論の分かれる点があるので、どんな道州制が考えられるのかを、外国のケースも紹介しながら取り上げています。それから、日本の中で突出した経済力を持つ東京をどう扱うべきか、そして大都市制をどうしたらいいかという論点も紹介しています。

道州制がなぜ必要とされているのか、何が問題なのか、どういう議論があるのか、を知りたい向きには格好の本ではないかと思います。

山崎元、水瀬ケンイチ『ほったらかし投資術』(朝日新書)を読みました。

投資というと何を思い浮かべるでしょうか。株式、投資信託、不動産、金。自分でやっているという人もいれば、そんなおっかないことは自分にはできない、やらない、という人もいるでしょう。

本書は、投資信託を利用した投資法を紹介しています。それも、インデックスファンドという種類の投資信託を利用するものです。これは、日本の株式ならば日経平均やTOPIXといった市場の指標に連動した運用を目指した投資信託です。インデックスファンドの対義語はアクティブファンドです。アクティブファンドは日経平均などのベンチマークに勝つことを狙って運用されるファンドですが、実際にはベンチマークに勝っているアクティブファンドは多くなくなおかつコストが高いのでおすすめでないというのが本書のスタンスです。

インデックス投資自体は以前から知られている投資法です。本書が特徴的なのは、実際にインデックス投資を実践している一般の人が共著者であることです。この水瀬氏のブログは同種のものとしては大変人気のあるブログです。このブログがきっかけで同書の執筆を手がけるようになったそうです。(余談ながら、水瀬氏と私は同年生まれで勤務先の業種が同じなど共通点が多く、親近感を抱きます)

水瀬氏の「実践編」と山崎氏の「理論編」とから本書はなっています。理論編は、全く初めての人が読むには少々 (かなり?) 難しいと思います。理屈や専門用語の込み入った箇所が分からなければとりあえず飛ばして読んで、結論だけ覚えておき、後日知識が増えてから読み直すという読み方でも構わないでしょう。一方、実践編は初心者向けです。具体的な投資信託を取り上げて良い点などを論評しているくだりもあり、実際に投資する参考になるでしょう。

本書でも触れられていますが、インデックス投資の環境は最近何年かで着実に進歩を遂げています。低コストで国内外の株式・債券に投資できる投資信託やETFが登場し、ネット証券を使うと月々の積立て投資が小額から可能になったのです。

投資というと「以前株式をいくつか売り買いしてみたことがある、でもリーマンショックでひどいことになって慌てて撤退した」というような人は、本書を読んでみると新しい発見があるのではないかと思います。

Flickrで遊ぶ

| コメント(0) | トラックバック(0)

何ヶ月か前からFlickrを使っています。無料で少し使った後、有料会員になりました。これは大した額でないので (月額に換算すればiモードの番組ひとつと同じくらい)、有料で使うのがいいと思います。

Flickrを使うと良い点がいくつかあります。それは例えば、自分の写真が外出先などどこからでもネット経由で見られることだったり、写真を人に見せるのが楽になったり (URLを教えるだけ)、写真のバックアップとしての機能を期待できたり(オリジナルサイズでアップロードできるので)、といったことがあります。当ブログで時々やっているように、ブログにFlickrの写真を載せることもできます。Twitterへのツイートもできます。

自分が撮影した写真を他人に見てもらえる、ときにはフィードバックがある、というのも勿論、良い点のひとつです。

Flickrではブログのようにコメントを付けられたり、気に入った他人の写真を「Favorite」指定できたりします。こういうのが付くのは、写真の上手い人だけだろうと最初は思っていました。しかし、私のような初心者でも、下手な鉄砲も数撃ちゃ当たるで、たくさんアップロードしているとたまにはFavorite指定してくれる人も出てきます。こういうのは嬉しいですね。

自分の撮った写真をいくらかでも楽しんでくれる人がいるとなれば、やりがいもあるというものです。それも、全然知らない人だったり遠い外国の人だったりが見てくれるというのは、ネットならではです。

また、写真ページはURLがついた普通のウェブページなので、検索エンジンや他のサイトから参照されることもあります。Flickrではreferrerを見るとこができるので、どういう検索語から飛んできてるのかを知ることもできます。

他人に見られたくない写真 (人の顔が写っているものとか) は非公開にすることができます。が、見られて問題のない写真はどんどん公開するのがいいと思います。

Flickrみたいなもの (Flickrでなくてもいいけど) を多くの人が活用して、日本のいい写真が世界各地に届けられるといいと思います。

ちなみに私の写真は http://www.flickr.com/photos/yanoks48/ から見ることができます。ヘボ写真ですが...。

日経ビジネスオンラインのコラム「中小支える"次のアリババ"」に、第3水準漢字が2つ出てきました。どれだかわかるでしょうか。

ひとつは、「深圳市」の「圳」(面区点番号1-15-37)。これはよく出てくるので気付く人が多いと思います。

もうひとつは、「王樹彤(ワンシュウトン)」という人名に出てくる「彤」(1-84-29)。日本語の音読みでは「トウ」と読むようです。あまり目立たない、ひょっとしたら第2水準にあるかな? という雰囲気の字なので、第3水準だとすぐには気付かないかもしれません。

日経ビジネスオンラインのウェブページでは、文字コードはEUC-JPにしていて、これら第3水準漢字はHTMLの文字参照で表しています。EUC-JPでなくUTF-8にすれば文字参照にする必要はなく直接文字として表せますが、記事製作時の文字入力環境で第3・第4水準漢字が入力できないのかもしれません。文字として入力する手段がなく文字参照で表すのならUTF-8にしても宝の持ち腐れで、EUCでいいことになります。

やはり、第3・第4水準漢字の入力手段が整備されていることが文字環境の改善のために必要だと思えます。

半月状の記号

| コメント(0) | トラックバック(0)

JIS X 0213の「◑」(1-8-72)や「◐」(1-8-71)が日本語のアクセントの表記のために使われる記号であることは規格票の説明から知っていたのですが、具体的にどう使われるものなのかまでは全く分かりませんでした。その使い方を知ったのは、小学館の「句読点、記号・符号活用辞典。」によってでした。またこの辞典にはアクセント以外の用法が用例付きで掲載されているのも興味深いです。全般にこの辞典は用例が豊富なのが面白い。

この記号は、アクセントが拍の途中で上がるまたは下がることを示すのに使うのだそうです。京都の方のアクセントを表すのに必要らしいです。

手がかりとなるキーワードが分かったので、ウェブに用例がないかと検索してみたら、見付かりました。あるページには、こういう記載があります。

アクセントの専門書では、左半分が黒く右半分が白い丸印(◐)を使って表記するのが一般的なのですが、あいにくJISコードにこの記号がないため、やむを得ず「下降」を連想させるような記号で代用しています。

ただし記号そのものは画像を使って表しています。JIS X 0208に記号が足りないばかりに、余計な手間がかかってしまっていたようです。JIS X 0213を使えばこうした手間は不要になります。

このページによると、京阪式アクセントでは「(はる)」という言葉のアクセントは「○◐」と表せるということになります。「は」は低く、「る」の前半は高く、途中から音程が低くなる、ということです。(私は日本語のアクセントについては全く詳しくありません。あくまでウェブページの解説に基いて書いています)

さて、私が「◐」「◑」という記号を見て最初に思ったのは、「これは半月だな」ということです。よくカレンダーや手帳に、新月、上弦、満月、下弦といった月の満ち欠けが記載されていることがあります。そのうち、上弦や下弦を「◑」「◐」の形で記していることがあるからです。実際、この用法も先の辞典には記されています。

TBSのニュースを見ていたら、ノーベル平和賞の報道の中で、第4水準漢字を見かけました。

ノルウェーの現地リポーターの名字が「秌場」となっていたのです。「秌」はJIS第4水準、面区点番号2-82-81です。

この字は「秋」の異体字です。よく見ると、「秋」の左右を逆にしたものだと分かるでしょう。テレビ画面に振り仮名はついていませんでしたが、おそらく「あきば」と読むのでしょう。

新潮文庫から出ている太宰治『津軽』には、太宰自身が描いたと思われる津軽の略図が掲載されています。

この図は全て手書きなのですが、その中に「海」という字が「海」の形に書かれている箇所もあります。

図の中に「海」という字が出てくるのは「北海道」「津軽海峡」「日本海」の3箇所です。ここで、「北海道」については「海」の、「津軽海峡」については「海」の形につくられています。「日本海」については、筆の運びは「海」のようで、しかし中の点ふたつはつながった形になっています。「海」とも「海」ともとれるような形です。

ここには「海」と「海」を区別して扱っているような意図は見受けられません。「北海道の『正式な表記』は『北海道』だ」と太宰が考えていたとは思われないのです。

太宰にとってこのふたつの字体は区別して扱うようなものではなかったのでしょう。

先日、北朝鮮軍が韓国国民の住む延坪島を砲撃するという物騒な事件がありました。この背景を解説する日経ビジネスオンラインのコラムに、第3水準漢字を見付けました。

「10月には今回の延坪島より北にある白翎島の沖合に...」というくだりに現れる、「翎」です。この字はJIS第3水準、1面90区30点にあります。リョウ、レイ等と読むようです。

日経ビジネスオンラインのサイトでは、この字をHTMLの文字参照で表しています。

また、この記事の2ページ目には「鄧小平」と、やはり第3水準漢字の「鄧」(1-92-80)が使われています。「翎」と同様にHTMLの文字参照で表しています。

こういうのを見ると、IVSも結構だけど、まずはJIS X 0213の全文字をいつでもどこでも使えるようにするのが先決ではないかと思います。

Unicodeの「IVS」というものの普及を目指す協議会が設立されたというニュースが出ていました。例えば、ITmedia Newsの「「書き手と読み手の字体の一致」を保証する「IVS」普及へ、MSやアドビなど協力」などの記事があります。

内容以前に気になったのが、IVS という用語の使い方。Ideographic Variation Sequenceという名のとおり、これはsequenceを表す言葉です。どういうsequenceなのかというと、UnicodeのCJK統合漢字の後ろにU+E0100のような符号位置 (variation selector) を付けたものです。これによって漢字の異体字 (とひとまず呼んでおくが、異体字というより活字のデザイン差程度のものが多い) を示すものです。

つまり例えば 「U+4E08 U+E0100」 のような列のことを本来はIVSと呼ぶわけです。

ただし、「variation selectorによってCJK統合漢字の形のバリエーションを示す技術」のことも(便宜的に?) IVSと呼ぶことがあって、上記記事の見出しではこの意味で使われています。

細かいことをと言われるかもしれませんが、これはちょっと気持ち悪いなあと思います。

私の本では、これをどう書くか迷った結果、「異体字セレクタ」という言葉で表しておきました。同書ではIVSという言葉は、上記のごとく、「U+4E08 U+E0100」のような(sequence)を表すものとして使っています。でも私の主観としては、それを書いた後くらいから、IVSという言葉で「variation selectorを使う方式」のことをも示す言い方が広まってきたような感じがします。ううむ。

まあ、あまり気に病むようなことではないのでしょうか。そんなことよりも、IVSが本当に使いものになるのかどうか、運用上の問題はどうか、などを気にした方がいいのかもしれません。

以前紹介した『自転車ツーキニストの作法』のp.90に、社団法人 日本自動車工業会 (自工会) が作成したレポートが取り上げられています。そのレポートというのは誰でも読めるようウェブで公開されています。「自転車との安全な共存のために」と題されたものがそれです。

このレポートでは、ざっといえば、車道の左端に自転車レーンが設置されるべきこと、自転車は車道を走るべきこと、自転車のルールが周知徹底されるべきことが提言されています。

自動車の運転手の中には、最近増えてきた車道を走る自転車(しかし1970年代まではこれが普通だった)を邪魔だと思っている人もいるのでしょうが、ほかでもない自動車の業界団体が、自転車は車道を走るべしと正論を吐いているのです。これは興味深いことだと思います。

それも、単にお題目として唱えているのではなく、なぜ自転車の歩道走行が危険か (お間違えなきよう。車道ではなく、歩道走行が危険なのです) を統計を援用しながら分析しつつ説いているのです。これは大変説得力があります。

ぜひ、この資料を、各市町村の道路整備の関係者には読んでほしいと思います。自転車レーンを間違った形で作ってしまう前に!

もちろん、自転車に乗る人も読むと良いと思います。どういうところで事故が起こるのか、何が本当に危険なのか、この資料を読んで研究すれば、自分の身を守ることにつながります。

12月2日の朝の北海道の地震は、緊急地震速報が出た割には、最大震度3に終わりました。揺れが小さかったこと自体は良いのですが、これでは緊急地震速報は狼少年になってしまいかねないと心配します。

そんなことを思いながらこの件のニュースをウェブで見ていて驚いたのは、MSN産経ニュースの記事

各地の震度を報じた中に、「石狩」「江別」など普通の市町村名とともに列挙されてこんな記載があったのです。

震度1=小樽、余市、●(=2004年新規追加人名漢字)知安

小樽と余市は北海道の街ですが、問題はその次。普通なら「倶知安(くっちゃん)」と書くべきところが、「●(=2004年新規追加人名漢字)知安」になってしまっています。

「●(=2004年新規追加人名漢字)」は、JIS第3水準の「俱」(1-14-01)のつもりなのでしょう。MSN産経ニュースとしては倶知安町の1文字目は「倶」でなく「俱」でなければならず、「倶」を使うなどとんでもないという方針なのでしょうか。しかし、倶知安町役場のホームページを見ても普通に「倶」が使われているし、大体この2つの字体に本質的な違いなどないだろうし、何より一般の読者が「●(=2004年新規追加人名漢字)知安」という記載を見ても何のことやら分からないと思うのですが...。

人名や地名の固有名詞に対して、文字の常識を超えて無闇矢鱈と字形の枝葉末節に拘泥した「正式な表記」を求めたがる思考が一部にあります。Wikipediaなどでも、首をかしげるような「正式な表記」の主張を見かけることがあります。こういうのは、文字の実態を正しく理解しているとはいえず、実運用上も弊害の方が大きいだろうと、今回の事例を見て改めて思うのでした。

広告