2012年9月アーカイブ

Unicode Standardを見ていたら、"Tabe 15-6. Japanese Era Names" (p. 533)という表で、目が違和感を検知しました。

U+337B    SQUARE ERA NAME HEISEI    1989-01-07 to present day

いやいやいや、平成になったのは1月8日でしょう。

そう思って下の行を見るとこうなっています。

U+337C    SQUARE ERA NAME SYOUWA  1926-12-24 to 1989-01-06

終端は1月7日でしょう、というのは上の平成のと連動した話ですが、念のため辞書(広辞苑)で昭和の始まりの日を確かめてみたら、1926年12月25日となっています。1日違う。

では大正・明治はどうか。

U+337D    SQUARE ERA NAME TAISYOU    1912-07-29 to 1926-12-23
U+337E    SQUARE ERA NAME MEIZI       1867 to 1912-07-28

明治のはじめだけ扱いが雑なのはおいとくとしても (陰暦のせい?)、辞書では明治の終わりは1912年7月30日、大正は1912年7月30日から1926年12月25日となっています。

微妙にずれているのは何なのでしょう? 私が何か勘違いしている? うーん...。

Version 6.1のPDFと、5.0の紙版で確認しました。

丸ゼロ

| コメント(0) | トラックバック(0)

完全に後知恵なのですが、JIS X 0213が制定された後で、公開レビューのときに提案しておけば良かったなと思った記号があります。

それは、丸ゼロです。JIS X 0213には丸付き数字として、①から㊿まで、白抜きは❶から⓴まで、二重の丸は⓵から⓾まで用意されています。が、丸ゼロというのはありません。

丸ゼロなんて何に使うのか、と思ったとしても無理はないでしょう。普通、丸付き数字は項番に用いるので、その場合は1から始まります。

ところが、国語辞典には丸ゼロという記号を使っているものがあります。大辞林や新明解国語辞典といった辞書 (どちらも三省堂ですね) では、言葉のアクセントを記すのに丸付き数字を使っています。例えば「雨(あめ)」であれば、1拍目を強く言うのでアクセントは①と記されます。3拍目にアクセントの来る「大雨(おおあめ)」ならば③です。一方、「飴(あめ)」のように平板に発音するものは、丸ゼロで表すのです。丸ゼロがJIS X 0213にあれば、この辞書のようなアクセント表記ができたわけです。

大辞林のCD-ROM版やウェブ版では、丸付き数字でなしに [0] のように表しているようです。

...とここまで書いて、念のため確認したら気付いたのですが、紙の辞書では丸の中に数字でなく、四角の中に数字となっていますね (あれ、覚え違いしていたかな...)。まあ、「四角つき数字」というのは尚更JISコードにないわけですが。

ちなみにUnicodeには丸ゼロがありますが、①とは連続していない位置U+24EAにあります。Unicodeの丸付き数字は、後からいろいろ追加した結果なのでしょうが、目的のものがどこにあるのか分かりづらかったり、Dingbatsブロックのは文字名に "SANS-SERIF" なんて入っているのがあってびっくりしたりと (元ネタがあるので仕方ないのでしょうが)、なかなか難しいです。

某通販世界大手の日本語サイトを見ていたら、英文の中に「痴」という文字が混じっていることに気づきました。海外からのメールがこう表示されるのは時々見かけますが、世界大手の企業のサイトでもあるとは意外でした。

例えば、「world痴」「president痴」のように、単語の後ろに「痴」が続くのが典型例です。

これは何かというと、Windowsのベンダ定義外字を使って「's」と記したものをシフトJISとして解釈するとこうなります。

英語版のWindowsのベンダ定義外字、Windows-1252と呼ばれることがありますが、これはISO/IEC 8859-1 (Latin-1)の制御文字の領域に独自に字を割り当てたものです。

この中に、左右を区別したシングルクォーテーションマークがあります(JIS X 0208にもありますね)。これが時々、アポストロフィとして使われることがあります。ASCIIにはアポストロフィ「'」がありますが、表示上、短い縦線のように表示されることがしばしばあります。一方シングルクォーテーションの方は、左右を区別しているので、カーブのついた形にデザインされています。この形を好んでか、アポストロフィの意味で引用符が使われることがあります。(自動的にこのコードを使ってしまうお節介なソフトウェアを使っているのかもしれません)

この引用符のベンダ定義外字のコード値は0x92です。「world's」のような形で、後ろに小文字の「s」が続くことがよくあるわけですが、この字のコード値は0x73です。「's」という並びは、92 73というバイト列になる。ところで、シフトJISで92 73というと、「痴」という漢字(区点番号は35-52)にあたるのです。それで、このベンダ定義外字の文字列をシフトJISだと思って解釈すると、「world's」が「world痴」になってしまうわけです。

おそらく、この通販サイトは、1バイトコードを使った英文だからASCIIだろうと思ってそのままシフトJISのテキストに埋め込んだところ、実はベンダ定義外字が使われていたということではないかと思います。

英文の中に「痴」という字がまじっている文章を見ると、ベンダ定義外字を使うのは痴であるといっているように、私には見えます。

テキストの入力の段階からずっとUTF-8を使っていれば、こういう問題は起こりません。

「文化庁が発表した「国語に関する世論調査」では、事実上の誤用の割合が本来の使い方を上回り、"市民権"を得ている実態も浮かび上がった」(Yahoo!ニュース)という報道がネットで話題になっています。

「にやける」「失笑する」「割愛する」などの言葉について、本来の意味から外れて理解している人が多かったということです。

大体、この手の話題が降ってくると、「言葉は生き物だ」といった言い回しで、誤用ではなく言葉の変化だ、と擁護する意見が必ず出てきます (生き物って、ころころ変わるんですかね?)。

ネットを見ていると、半数以上の人が誤用しているならそれはもう誤用じゃない、みたいな意見もあります。言葉が長い年月のうちに変わっていくのは仕方ありませんが、しかし学級会じゃあるまいし、多数決で決めていいものなのかという懸念は拭えません。(まあ、私だって誤解している言葉は勿論ありますが、だからといって「多数派だからいい」とはなるべく言いたくない)

私の考えでは、言葉はいずれ変化するものではあるけど、変化はゆっくりな方がいい。あまり頻繁に変わるようだと、意思疎通のさまたげとなるからです。ここで意思疎通というのは、昔に書かれたものを読むことも含みます。言葉については保守的な判断の方が好ましいと思います。

とはいえ、多くの人が誤用している中で正しい用法を通すのが難しいこともあるでしょう。誤用とどう付き合えばいいか。

ひとつの目安として、「つじつまが合うか、合わないか」で考えてはどうかと思います。

例えば、今回の報道にはありませんが、よくある誤用として「役不足」を考えてみましょう。「俳優などが、自分に割り当てられた役に対して不満を抱くこと」(広辞苑)という意味です。「役」が「足りない」わけですからこの意味になるわけです。広辞苑には親切にも「誤って、力不足の意に用いることがある」という注釈がそえられています。正反対の意味に誤用されるということです。この誤用は、「役が不足」という言葉の意味に合いません。つじつまが合わない。こういうのは、論理的に考えれば間違いが露呈するわけですから、たとえ誤用する人が多かったとしても、それに同調するのはやめた方がいい。

一方、以前取り上げた「敷居が高い」というのはどうか。これも誤用が多いとされる慣用句です。文化庁のサイトに説明があります。この説明を読めば、本来の意味は分かりますが、さて、この場合の誤用は、本来の意味と混同して困るということはないのではないかと思います。文脈によって分かるので、別に困らないのではないか。いわば、本来の意味とcompatibleである、共存できるような「誤用」ならば、許容できるのではないかということです。文化庁の説明を借りれば、「前提となる理由の部分が欠け、その家に入りにくい、という結果だけを残して用いられる」わけで、意味の中核の部分は残っていて矛盾しないといえるのではないでしょうか。

論理的に破綻しないものについては妥協してもいいけど、つじつまの合わないような「変化」はなるべくしない方がいいのではないかと思います。

ところで、冒頭のリンク先に掲げられている説明で、いまひとつ腑に落ちないのが、「うがった見方をする」の説明。国語辞典にあたると、「せんさくする。普通には知られていないところをあばく」(広辞苑)や、「事の裏面の事情を詮索する」(大辞林)といった説明がされているので、そこに書かれている説明は果たして適当なのだろうかと思います。

この前の記事に書いた北海道Likersで紹介されていた北海道のお菓子に、たいそう懐かしいものがありました。

それは小型の羊羹なのですが、筒に入っています。筒の底を押して反対側からうにょーんと出し、もれなくついている糸を巻きつけてスパッと切って一口サイズにして食べるというものです。

当時は子供だったのでどこの製品かということは気にしていなかったのですが、いま改めて知ったところでは、道南は江差町にある五勝手屋本舗という会社の商品でした。ウェブサイトによると、明治3年創業とのことです。また明治以前より菓子商として営業していたそうです。江差は江戸時代からニシン漁で栄えた町で、「江差の五月は江戸にもない」といわれた由。

この懐かしい羊羹、函館の丸井今井で見つけたので買ってきました。

五勝手屋羊羹の箱

紙箱。伝統を感じさせるデザインが素敵です。「賜宮内省御買上之栄」と書かれています。この箱に3本の羊羹が入っています。

五勝手屋羊羹の筒

これが羊羹1本。この写真では大きさが分かりませんが、あまり大きくない、ちょっと食べるのにいいサイズです。

五勝手屋羊羹、上からの図

ふたをあけたところ。てっぺんはザラメのようになっています。ここが好きだという人も。

五勝手屋羊羹、糸

底から少し押し出したところです。筒の右側に糸が見えます。押し出された羊羹を、この糸で切って食べます。

子供の頃、この仕掛けがなんだか好きでした。いま見て大変懐かしく感じるとともに、21世紀の今も健在なことに嬉しく思いました。

「食指が動く」という成句がありますが、これはしばしば「触手が動く」や「食指がのびる」といった具合に誤用されるようです。

「食指が動く」というのは漢籍に出てくる話が元になっています。ある人が、御馳走にありつけるときは食指(人差し指)が動くのだと言った話です。そこから、「食欲が起こる。興味・関心をもつ。してみたい気持ちが起こる」(大辞林第二版)という意味で使われます。

ショクシという言葉が「触手」と混同されるのでしょう。また、イソギンチャクみたいな生き物が触手をのばして捕食するさまが想像されて、「食指がのびる」のような誤用につながるのだと思います。

川島真『近代国家への模索 シリーズ中国近現代史②』(岩波新書)の中に、清末の梁啓超が20世紀初頭に「自国史をいかに呼ぶかという点を議論して次のように述べた」と書いてありました。

孫引きになってしまいますが、ちょっと抜き出してみると、

吾人がもっとも慙愧にたえないのは、わが国には国名がないことである。漢、唐などは王朝名であるし、外国人の使う支那はわれわれがつけた名ではない。

といっています。漢民族の居住地域を通時的に指す呼び名が確立されていなかったことが分かります。ではどう呼べばいいかということで、次のように提言しています。

中国・中華などの名には自尊自大の気味があり、他国から批判されるかもしれないが、〔中略〕 われわれの口頭の習慣に従って「中国史」と呼ぶこととしたい。

「口頭の習慣」というのがいつ頃できたのかは分かりませんが、ともかく20世紀初頭においては、チャイナの意味で「中国」と呼ぶことがまだ一般的でなく、梁のような活動家によってこの名称が広まっていったよっです。

ちなみに、上の引用で「外国人の使う支那は」とありますが、日本で支那という言葉が広まったのは、他の本で読んだところによると、江戸時代、ヨーロッパの宣教師が漢や唐といった国の興亡した地域のことを一括りにシーナとかヒーナとか言っていることを新井白石が知って、漢訳仏典から支那という言葉を探して用いたことによるそうです。

本書の著者は、19世紀後半の清の外交文書で自国を指して「中国」という言葉が用いられたとしています。私が他の本で読んだところでは、満洲語で「真ん中の国」を意味する「ドゥリンバイ・グルン」という言葉が、清の藩部を除いた直轄地(つまり満洲人と漢人の居住地)を指す意味で使われたそうなので、それとの関係が気になります。

さて、こうしてできた「中国」という概念が、漢民族の伝統的な居住地(おおむね、明や宋の範囲)を指すものであれば問題はまだ小さかったのでしょうが、いつの時点からか「清の最大勢力範囲 = 中国 = 中国人(≒漢人)の国」という図式への読み替えが行われたようです。これが、ウイグルやチベット、南モンゴル(内モンゴル)といった現在の「民族問題」(という言い方が適切かはまた疑問ですが)の原因となったように、私には思えます。

Facebookページの北海道情報発信ページ「北海道Likers」は大変注目を集めています。

サッポロビールが運営しているそうなのですが、企業色はほとんど出てこないで、純粋に北海道のいい場所や物などの紹介に徹しています。

このページの最近の記事に、JIS X 0213の文字を使ったものがありました。

「アイヌ四季の暮らし・その5「舟を使いわける」」という記事です。この中に、「サㇰ・ル=夏の道」だとか「トントチㇷ゚=革舟」といったように、「ㇰ」(1-06-78)や「ㇷ゚」(1-06-88)といったJIS X 0213の文字、アイヌ語表記用に追加された片仮名が使われています。

HTMLを手打ちして作っているようなウェブページだと、fontタグで文字を小さくしてこういう字を表現することがよくありました。しかしFacebookのようなサイトではそういうことはできません (よくは知りませんがきっとそうでしょう)。

FacebookのサイトはUTF-8で符号化されているので、「ㇷ゚」については結合文字を使って表す必要があります。これをきちんと表示できない環境もあります。例えば、iPadのFacebookアプリで見ると、「ㇷ」と半濁点とが分かれて表示されていました。

まだ、閲覧ソフトなどの実装に問題はありますが、fontタグなどでなしにきちんと文字として入力されるようになってきたのは、進歩だといえます。

なお、第3第4水準辞書を使うと、こうした「ㇰ」や「ㇷ゚」といった文字を入力できます。入力したテキストは、UTF-8やEUC-JIS-2004、Shift_JIS-2004といった文字コードで扱えます。日本国内の言語の表記に使われる文字に、日本のソフトウェア、日本の文字コードが対応するのは、ごく自然なことです。

少し前の記事「電子書籍における外字の弊害」は(当ブログとしては)多くの人にお読みいただいたのですが、少々補足する必要があると感じたので、ここに付け足したいと思います。

まず訂正なのですが、『銀輪の巨人』について、外字になっている箇所は全てJIS X 0213で表現できると書きましたが、後で確かめたら、1文字だけJIS X 0213にない字が使われていました。門がまえの中に品と書く字(U+95C6, 闆)で、「老闆(社長さん)」という文脈で現れていました。中国語でしょうか。読み仮名は振られていませんでした。

Twitterで見た本記事についての反響では、細かなところで誤解が見られました。

まずひとつは、「シフトJISは第1・第2水準漢字のみ」という誤解です。JIS X 0213ではShift_JIS-2004という符号化方式が定義されており、これを使えば第3・第4水準が扱えます。「漳州」の「漳」は、1面87区8点ですから、シフトJISではEC47という2バイトになります。

JIS X 0213は、既存のJIS X 0208の符号化方式で符号化できることを前提として設計されています。ですから、シフトJIS (Shift_JIS-2004) でもEUC (EUC-JIS-2004) でも、あるいは1バイトコードとの混在のない2バイト固定長の方式 (漢字用8ビット符号) でも符号化できます。国際対応のしやすさを考えると新たに設計するものはUnicodeをベースにした方が有利でしょうが、既存資産との互換性が重要な場面ではこうした符号化方式を使うのが良いでしょう。

それから、「EPUBなら問題ない」という見解が見られました。確かにEPUBではUTF-8を使うでしょうから第3・第4水準漢字も符号化できます。ただ、それは別にEPUBというフォーマットに固有の話ではありません。別のフォーマットでも、文字コードとしてUTF-8を扱えれば (扱えるようにすれば) かわりないことです。

また、配信用のフォーマットが第3・第4水準に対応していたとしても、文字を入力したり編集したりするプログラムが第3・第4水準に対応していなければ意味がありません。執筆者はどうしたら「漳州」という文字を入力できるのか、ということです。世間のウェブサイトを見ていると、HTMLの文字コードとしてUTF-8を使っていても、第3・第4水準漢字を外字扱いしているものはしばしばあります。

ですから是非とも補足しておきたいのは、フォーマットだけを考えているのでは不十分だということです。

以前、当ブログで次の3つの記事を書きました。

単に文字コードだけでなく、フォントや文字入力環境も対応する必要があるということです。とりわけ、仮名漢字変換、もっと広くいえば文字入力環境の役割は重要です。プログラムで処理できて、フォントで表示できても、入力できなければ絵に描いた餅であるからです。

札幌でどこに行きたいかと家人に聞いたところ、ちざきバラ園と答えました。ちざきバラ園は札幌の中心地を見下ろす斜面にあって、たいへん眺めの良い場所だったのですが、惜しいことに何年か前に閉園してしまいました。

それで、かわりといってはなんですが、大通公園西12丁目のローズガーデンに行ってみることにしました。

ちょっと西の方に行くならということで、ついでといってはなんですが、知事公館にも行ってみることにしました。今まで行ったことがなかったんですね。知事公館は地下鉄東西線の西18丁目の近く、道立近代美術館のそばにあります。ドラマの撮影に使われることもあるそうです。

Hokkaido Governor's Official Residence / 北海道知事公館

これが庭の方から見た知事公館の建物。彫刻作品が設置されています。

建物に入って見学することもできます。昭和11年に建てられたものだそうです。窓の外に芝生の緑が見えるのが印象的でした。

Hokkaido Governor's Official Residence / 北海道知事公館

正面から見た図。白と赤の対比がおしゃれです。

知事公館を見学した後、東に向かって歩いて、大通公園の端まできました。大通公園は西1丁目から西12丁目までなので、西の端は12丁目です。ただ、道をはさんだ向かいの13丁目に建っている札幌市資料館(旧控訴院)も、あたかも大通公園の一部のように見えます。

Former Sapporo Court of Appeals / 札幌市資料館

彫刻とバラの花は大通公園、その後ろにあるのが、西13丁目の資料館。実はこの間に車道がはさまっています。

Nishi 12-chome, Ōdōri Park / 大通公園西12丁目

大通公園の西12丁目はこのように、バラの庭園と水路からなっています。札幌ではバラは夏に咲いているので、夏の散策に良いでしょう。

Roses / バラ

多くのバラが咲いていました。ちなみに、犬の散歩も多く見かけました。

バラを見た後は、大通公園を東へと歩きました。初音ミクで知られるクリプトン・フューチャー・メディアは大通西10丁目にあって大通公園に面しているそうなので、多分その前を通ったと思います。

Black Slide Mantra / ブラック・スライド・マントラ

イサム・ノグチの彫刻作品にして滑り台の、ブラック・スライド・マントラ。西8丁目と9丁目の間。これについては以前記事を書きました。

Playing on the water / 水遊び

大通公園には噴水がいくつもありますが、西の方は子供の水遊びに適した作りになっています。

Place of relaxation / 憩いの場

駅前通り、西3丁目まできました。この辺は多くの人が訪れると思います。地下鉄大通駅はこの付近の地下です。ここから北に向かえば札幌駅。南に向かえば、デパートの多い商業地区を通ってすすきのへ行くことができます。

大通公園の良いところは、街の一部となっていることだと思います。ことさらに公園に行こうと意気込まなくても、都市生活の中にごく自然に組み込まれている。こういう環境はとても恵まれていると思います。

先月北海道に行ったときは、支笏湖にも行ってきました。

支笏湖は、札幌から程近い、車で1時間くらいのところにあるカルデラ湖です。空港のある千歳市の一部です。といっても街からは離れています。

近くにある洞爺湖と周囲の山々や登別温泉をもあわせて、支笏洞爺国立公園に指定されています。福田首相のときにG8サミットが行われ、映画「しあわせのパン」の舞台ともなった洞爺湖の方が有名かもしれませんが、支笏湖もいいところです。

Lake Shikotsu in summer / 夏の支笏湖

今回なんといっても良かったのは、水の色です。晴れていたのと、湖底に何か理由があるのでしょうが、エメラルドグリーンのような不思議な緑色でした。

支笏湖は水質が全国一なのだそうで、そのことも水の見栄えに一役買っているのかもしれません。

River of green / 緑の川

湖とつながっている川の色もこんな具合。

Red on green / 緑に赤

青緑の川の上に赤いカヌーがよく映えます。

Yamasen-Tekkyō Bridge / 山線鉄橋

山線鉄橋。昔は工事の物資運搬のために列車が走っていたのだそうです。今は人が歩いて渡っています。

支笏湖の周りには、温泉宿もあれば、キャンプ場もあります。季節によっても表情が違いますから、様々に楽しめる湖だと思います。

「邪馬台国」がどこにあったのかというのは、いまだ決着を見ていない謎めいた問題で、多くの人の興味をかきたてています。いわゆる「魏志倭人伝」の記述に従うと邪馬台国は海の上にあることになってしまって、どこだかわからない。さあどういうことか。

これについて書かれた最近の本、渡邉義浩『魏志倭人伝の謎を解く』(中公新書)が面白かったです。

俗に魏志倭人伝と呼ばれるものは、西晋の陳寿によって書かれた歴史書の「三国志」の一部です。本書は「三国志」の書かれた背景を考慮したり他の史料と比較したりしながら、いわゆる魏志倭人伝の記述を批評的に検証していきます。

そこから分かることは、魏志倭人伝の邪馬台国についての記述は、「三国志」の政治的な立場や儒教的な価値観が反映されているということです。何も、客観的な事実を忠実に記録しようとしたわけではないわけです。

魏志倭人伝における邪馬台国の位置は、中国の南東の海上にあることになっていて、現実の日本列島よりもかなり南になっています。これは、三国志を著した陳寿が仕えた晋の帝室の司馬氏の権力基盤を固めたのが、小説の三国志にも登場する、魏に仕えた司馬懿であり、魏と邪馬台国が外交関係を結んだことが司馬懿の功績とされていることと関係します。当時、魏は呉と敵対していたので、魏と外交関係を結んだ邪馬台国が呉の背後、挟み撃ちにできる位置にあるとした方が、司馬懿の功績がより際立つということです。司馬懿の功績を強調するために、陳寿は邪馬台国を実際よりも南方にあることにしたというわけです。

また、司馬懿のライバルである曹真が、蜀との対抗上有利な西方の大月氏と外交関係を結んだという手柄を立てているので、それとの釣り合いをとることも考慮されているということです。

さらに、倭人伝に記されている倭人の習俗は、漢民族の自民族中心主義の色合いの濃い儒教思想に影響されているということです。例えば、邪馬台国に女性が多いように書かれているのは、男尊女卑の儒教思想では中華から遠く離れた野蛮な地には女性が多いと観念されているからなのだといいます。

三国志は正史と呼ばれますが、政治的な都合や儒教的な観念によって事実から歪められていることがあるわけです。正史というのは、「正しい史実」を意味しているのではなく、「正統を示す史書」のことなのだと著者はいいます。三国志の場合であれば、陳寿の仕えた晋の正統性を示すために記された書であるということです。

中国の歴史文化にはそういう特徴があることをわきまえる必要があるわけです。

この前、関東地方のテレビニュースで、埼玉県にある「(がけ)」という地名が変更されそうなので反対の声があるという話を報じていました。全国でここだけにしかない地名だから保存すべき、という話です。

ウェブのニュースサイトにあるかなと思って探してみたら、例えば次のような記事がありました。

この「垳」という字は、JIS X 0208の第2水準、区点位置52-24にあります。ただ、この字は5万字を誇る「大漢和辞典」にも載っていない字です。かつて、どうしてこんな、辞書に載っていないような字がJISに入っているんだ、という疑問(というか批判)がありました。

しかし、JIS X 0208の1997年改正によって、この埼玉県の地名からきていることが明らかになりました。漢和辞典は主として漢文を読むための辞典であって、日本で作られた漢字(国字)で専ら地名にのみ使われているような字は必ずしも入っていなかったわけです。なので、「辞書に載ってないような字がJISに入っているなどけしからん」という批判はむしろ、「辞書にも載っていないのに、地名として実際に使われている字を見付け出して収録したのは偉い」というべきだったのでした。大漢和辞典は、のちに補巻でこの垳という字を収録しました(字の説明としては埼玉県の地名にあることを掲載しています)。

もし区画整理などで実際にこの地名が消えてしまい、年月を経てこの垳という字を使う人が誰もいなくなったら、そのときは、かつて言われたのとは別の意味で、幽霊漢字と呼ばれるようになるのかもしれません。

広告