2012年5月アーカイブ

前回の記事(「パスポート式ローマ字の憂鬱」)は少々愚痴っぽい終わり方になってしまいました。あまり後ろ向きな事をいっていても仕方ないので、どうすれば状況を良くできるかを考えてみましょう。

地道なようですが、きちんとした日本語のローマ字綴りを実践する人が増えるということが必要だと思います。そのためには、綴り方についての知識が普及することも必要だし、情報機器でローマ字を入力・表示するための環境が整備されることも必要です。

ローマ字の綴り方の知識というのは、小学校で誰もが教わっていることです。ですから、本来は、あまり心配する必要のない筈のことです。

ローマ字の正しい知識があったとしても、パソコンや携帯電話で「ō」や「ū」のような文字が入力できない人が少なくないのではないでしょうか。小学校で教わるローマ字を簡単に入力する手段が備わっていないのは、情報機器を提供する側の怠慢といわれても仕方ないのではないかと私は思います。

そこで、当サイトで以前からご紹介している第3第4水準辞書を使うと、母音aiueoの上に ^ や ¯ の付いた字を入力できるということを、ここではご紹介しましょう。

ATOK用Anthy用の第3第4水準辞書を使うと、例えば「A-」から「Ā」や「ā」に変換できます。同様に、「A^」から「Â」や「â」に変換できます。単に「A」だけからでも、これらのアクセント付きの文字に変換することができます。ローマ字仮名変換で入力している場合はAキーを押すとただちに「あ」に変わってしまいますが、シフトキーを押して大文字のAならば、普通は仮名にならないので、大文字のAから小文字のāなどに変換できるようにしています。Aだけでなく、OやUなど他の母音字でも同じです。

Emacs上のSKKでは、ATOK・Anthy用第3第4水準辞書の元になったSKK-JISYO.JIS3_4を使うよう設定しておくと、& キーを押してから、a- とタイプしてスペースキーを押すことで ā に変換できます。SKKのこの入力方法では大文字小文字を変換前の段階で区別できるので、A- からは大文字の Ā、a- からは小文字の ā に変換します。

こうして入力した長音符号付きのローマ字テキストは、第3第4水準文字コードであるUTF-8やEUC-JIS-2004、Shift_JIS-2004といった文字コードで保存できます。â や ū などの文字は、JIS X 0208にはありませんがJIS X 0213には入っています。ローマ字の正しい綴り方を可能にする意味からも、今後は常にこうした第3第4水準文字コードを使うのが良いでしょう。

ちなみに、iPod TouchやiPhoneのiOSでは、英語キーボードの「A」のような文字を長押しすると、符号付きの ā や â などが入力できます。

さて、上では仮名漢字変換辞書を使って入力する方法を示しました。â などの文字が入力できない状態から見れば大きな進歩ではありますが、頻繁に日本語のローマ字綴りを入力しようとしたら、かなり煩わしいことは否めません。本格的にローマ字日本語を入力するには、より簡単な入力方法の使えることが望ましいことを、申し添えておきましょう。

なお、こうした長音符号の要らないローマ字の綴り方として、99式ローマ字というのがあります。あまり有名とは思われませんが、利便性という点で一考の価値はあるでしょう。

あるウェブサイトを見ていて気付いたのですが、日本語のローマ字綴りに関して、「ヘボン式ローマ字では長音を明示しない」と誤解している人が、どうやら稀でないようです。

なぜそんな風に思うのだろうと訝しんだのですが、「ヘボン式」を検索語にウェブ検索してみて、ああそうかと分かりました。パスポートの名前表記に用いる綴り方を、役所では「ヘボン式」と称しており、役所が指定するその方式では長音を示す符号を使わないのです。「ゆうき」という名前でも「ゆき」という名前でも「Yuki」になります。それで、「ヘボン式ローマ字では長音を示さないのだ」と誤解した人が続出したのでしょう。

一般のヘボン式ローマ字では、長音を示すのにマクロン (¯) 記号を用います。例えば「空港」は「kūkō」のように記します。こうした表記は電車の駅の名前によく見られます。

さかのぼれば、ヘボン式の元祖であるJ. C. Hepburnの「和英語林集成」でも、「おー」の音を「ō」で表すような表記法になっています。

ヘボン式ローマ字を批判し日本式ローマ字を推薦した田丸卓郎『ローマ字國字論』には、ヘボン式の例として「Itchōme」という綴りが見え、やはりヘボン式でも長音を示しています。田丸はこの本でいろいろな論点を挙げてヘボン式より日本式が優れているのだと主張するのですが、ヘボン式は長音を示さないから駄目だという風には言っていないんですね。ですから、当時(大正から昭和初期)も、ヘボン式においては長音を ō のように示すものだったということになります。ちなみに、本書で田丸は、長音を示さずに「東京」を「Tokyo」のように書くのは、日本語の綴りとしては誤りだと一蹴しています(くどいようですが、ヘボン式は長音を示さないということは田丸は言っていません)。

大体、常識で考えれば分かることで、「おばさん」と「おばあさん」が両方「obasan」になってしまって区別のつかない綴り方が日本語の表記法としてまともであるわけがない。

通常、訓令式かヘボン式かという違いは、「ち」を ti とするか chi とするか、「し」を si とするか shi とするか、といったことを問題にします。パスポート式の綴りを「ヘボン式」と称するのは、この観点に着目した場合のことなのでしょう(ちなみにWikipediaでは「外務省ヘボン式」という呼称を使っています)。しかし、訓令式であれヘボン式であれ、日本語をローマ字で表すのに長音をはっきり表さないというのは、「ち」が ti なのか chi なのかといったことよりも遥かに致命的な欠陥です。それは訓令式かヘボン式か以前の問題だといえましょう。

英語話者は「ゆうき」も「ゆき」も区別しないからこれでいいのだという見方もあるのでしょう。「Yūki」と書こうが「Yuki」と書こうが、英語話者は「ユゥキィ」のような感じに発音するかもしれません。このパスポート式の綴り方というのは、日本語をきちんと綴るのには明らかに不十分です。しいていうならば、「名前をアメリカ人に英語風に発音してもらうための間に合わせの綴り方」といったところなのでしょう。

私個人の意見では、このようなローマ字の綴り方がいいとは全く思いません。長音を「ō」や「ô」のような形で明示すべきです (どちらの記号を使うかは決めの問題で、割にどちらでもいいことでしょう)。とはいえ、ローマ字の使い道というのが、「名前をアメリカ人に英語風に発音してもらう」という程度のものでしかないのならば、パスポート式・外務省式の綴り方がはびこるのも仕方ないのかもしれません。

言葉を調べるのに国語辞典を見ていたら、偶然にもJIS第4水準漢字にでくわしました。

「わらしべ」という言葉を漢字で書くと「藁稭」となり、この「稭」という字が第4水準なのです。面区点番号は2-82-94です。

昔話の「わらしべ長者」も、漢字で書くと「藁稭長者」です。この言葉は、広辞苑・大辞林ともに見出し語として掲げており、漢字表記も載っています。

なお、CD-ROM版の広辞苑・大辞林では、「稭」は外字になっています。JIS X 0213に対応すれば、外字でなく普通の文字として扱えるので、是非そうしてほしいところです。(もっとも、最近は辞典のCD-ROM版はあまり出ない傾向にあるようですね...。EPWING形式だとLinuxでも使えて助かるのですが)

第3第4水準辞書を使うと、「しべ」から「稭」に、「わらしべ」から「藁稭」に、「わらしべちょうじゃ」から「藁稭長者」に変換できます。どうぞご活用ください。

辞書によると、藁稭長者の話は、今昔物語集や宇治拾遺物語集に収められているそうです。こうした文献の「わらしべ」の文字表記はどうなっているのでしょうね。

1年くらい前、東日本大震災で被災した地方自治体に寄付金を送ったときのこと。寄付の申し込みのフォームに記入して役所に送付する必要がありました。問題はそのフォームがMS Wordの文書(*.doc)だったことです。

私のメインPCはLinux機なのでMS Officeはありません。ノートPCのWindows機にもMS Officeは入れていませんでした。自治体に寄付をするにはMS Officeを持っていなければならないのでしょうか?

もっとも、Linux機にインストールしているOpenOfficeでWordのdocファイルを開くことも一応できます。このときはこの機能を使って対応しました。

ただし互換性が完全ではないので、正しく表示されないこともあります。正しく表示されているかどうかは、私の環境では分かりません。目の前に見えているものを信じるほかありません。また、フォームに記入したものが、Wordで意図通りに見えるのかどうかも分かりません。そこで、記入したフォームをPDF形式に出力して(これはOpenOfficeでは標準装備の機能)、Wordの形式のフォームに添えて送ることにしました。念のための処置です。

こういう面倒なことを考えなくていいように、地方自治体でODF (OpenDocument Format)形式のファイルを受け付けてくれればいいのにと思いました。ODFはOpenOfficeやLibreOfficeで採用されている文書フォーマットで、OASISとISOで標準化されている国際標準です。

ODFに対応しているOpenOfficeやLibreOfficeはWindowsだけでなくMacやLinux用のものもあり、誰でも無償で利用できるオープンソースソフトウェアですから、MS Officeよりも間口が広いという点で、公共の団体に適していると考えられます。特定ベンダの製品を買わなくてもいいわけです。

公平を期して記しておくと、理論的には、MS Officeの最近の版の文書形式であるOffice Open XML (OOXML)も、ISOで(ODFの後に)標準化された国際標準であり、仕様書を読めば誰でも実装できるはずのものであって(少なくともそのつもりで標準化されているはずです)、ODFのかわりにOOXMLという選択肢もあり得ます。実際OpenOfficeもOOXMLへの対応をうたっているのですが、しかし、私が試したところではレイアウトが乱れて、実用には障害があるように思われました。対応をうたっているといっても、本当にMS Office以外のソフトウェアで支障なく使えるかどうかは慎重に検証する必要があります。

役所の内部の処理にどんなソフトを使うかは様々な事情に合わせて決めれば良いことで、その点に干渉するつもりはありません。しかし、外部とのやりとりの窓口、インタフェースとしては、ODFに対応しておいてくれると、一市民としてありがたいと思うのでした。

テレビを見ていたら、JIS第4水準漢字が目に飛び込んできました。

画面に「魷魚」と映っていたのです。「魷」は第4水準、面区点番号2-93-39です。

どうやら、「魷魚」は中国語でイカを意味するようです。ウェブでこの言葉を検索すると、中国語版Wikipediaでイカのページらしきものがヒットします。検索結果を眺めると、中華料理のメニュー風の言葉や、料理店の名前にもこの文字が含まれているように見えます。

JIS X 0213は別に中国語に対応することを意図したものではありませんが、このようにある程度は中国語で使われる漢字もカバーしています。

『JIS漢字字典』でこの字を引くと面白い。用例として、家庭科の教科書を挙げています。夕食の中国風献立というので、拌黄瓜魷魚(バンホワンゴワヨーユイ)というのが記されているそうです。学校の家庭科の教科書にそんなのが載ってるとは驚きです。

第3第4水準辞書では、「ゆう」から「魷」に変換できます。学研「漢字源」にも「ゆう」という字音が記されています。

以前の記事で、Sony ReaderでPDFを読む話を書いた際、達人出版会が提供している青空文庫から生成したPDFのページめくりが普通の感覚と逆だということを書きました。

ちょっと前のことですが、今年(2012年) 3月30日のSony Readerのソフトウェアアップデートで、この問題が解消されました。アップデートの説明にある、「PDF形式の書籍に設定されている"綴じ方"を反映するようになりました」というのが該当するのでしょうか。

これで直感に逆らわずに操作できるようになりました。

今回のアップデートの目玉はEPUB3形式の漫画の配信に対応ということだそうですが、そういう大きな内容だけでなく、上記のような細かい修正も継続的にしていってほしいですね。JIS X 0213対応もしてほしいところです。

やや旧聞に属しますが、情報処理学会の会誌「情報処理」に初音ミクの特集 (「CGMの現在と未来: 初音ミク,ニコニコ動画,ピアプロの切り拓いた世界」) を掲載したところ、一般向けの販売が、同学会の史上初めて、完売してしまったということです。先日ちょっとした話題になりました。この会誌「情報処理」は学会員には無料で配布されているのですが、一般向けにも販売されていて、Amazonでも買うことができるようになっています。

こうした現象を、単にキャラクターの人気だとか流行だとかということでとらえると、事の本質を見誤ってしまうように思います。

初音ミクは単に絵がかわいいから人気になったのでもなければ、音声合成の技術だけで流行になったのでもない。ニコニコ動画という舞台装置やピアプロ、キャラクターライセンスといった、創作支援のための仕掛けが複合的に機能して初めて発生した創造の連鎖がムーブメントの本質です。

この特集は、そうした創造の連鎖を発生させるアーキテクチャに主に注目して構成されています。

個人個人の創造性が大事であることは勿論ですが、そうした創造性を発揮させるための仕掛け作りが、大局的にはものをいいます。

創造の連鎖を引き起こすアーキテクチャの秘密を解き明かしたい人には、この「情報処理」の特集はうってつけでしょう。初音ミク現象の何がそんなに重要なのかを知りたい人にも、やはりうってつけでしょう。

この特集の掲載された会誌は売り切れてしまいましたが、特別措置として、特集だけを切り出した別刷がAmazonで買えるようになっています。興味のある方はそちらをどうぞ。

読売オンラインを見ていたら、文字コード的に気になる記事がありました。

この記事の中に、韓国人名を「朴泰●」と記して「●は金偏に高」と注記を付けている箇所があります。

「金偏に高」はJISにない字だと思ったのかもしれませんが、実はJIS X 0208の第2水準にあります。79区14点です。

この字は「しのぎを削る」という言い回しの「しのぎ」です。国語辞典にも載っています。(しのぎ)というのは刀剣の部分をさす言葉です。鎬を削るという言い回しは「切り合う時、鎬が互いに強く擦れて削り落ちるように感ずるからいう」(広辞苑第五版)のだそうです。

Twitterで知り合いから寄せられた情報によると、この字は漢検1級に出るそうなので、漢字に詳しい人は知ってるのでしょう。

拙著『プログラマのための文字コード技術入門』のAppendixで『JIS漢字字典』(日本規格協会)を紹介する際、こうした、JISにある字を探し出せずに誤って外字扱いしてしまうことに言及し、その実例としてまさにこの「鎬」の字を例にあげました。実はその記述の元になったのは、まさに読売オンラインがこの字を外字扱いしていた事例でした(書籍では出典は伏せましたが)。あれから2年以上経ちますが、改善が見られないのは残念です。

ぜひ、新聞社の人には、『JIS漢字辞典』を(それにできれば『プログラマのための文字コード技術入門』も!)座右に置いて活用していただきたいと思います。

広告