長音符号つきのローマ字地名辞書

概要

全国の都道府県・市町村名等のうち、ローマ字表記に長音符号を必要とする地名を仮名からローマ字に変換できるようにする辞書です。ATOK、Anthy、SKK用の辞書を提供します。

例えば、下記のような変換が可能になります。

  • とうきょう → Tōkyō ならびに Tôkyô
  • きょうと → Kyōto ならびに Kyôto
  • こうしゅう → Kōshū ならびに Kôsyû (注: 山梨県甲州市)
  • しこくちゅうおう → Shikokuchūō ならびに Sikokutyûô (注: 愛媛県四国中央市)

ダウンロード

  • ATOK用
  • Anthy用 (使用するには、このファイルを ~/.anthy/imported_words_default.d/ にコピーしてください)
  • SKK用 (EUC-JIS-2004)

利用条件

自由に使用、再配布、加工、加工したものの再配布等していただいてかまいません。(創作性の低いデータと考えられ、著作権が適用されるのかどうかよく分かりません)

本辞書データの正確性や有用性等について保証しません。

どういうときに便利か

当サイトで配布している第3第4水準辞書(ATOK用Anthy用)を使うと、日本語のローマ字に使われる ā や ô といった文字を、漢字変換の仕組みによって入力することが可能になります。しかしこの方法では、長音符号のつく文字ごとに変換操作をしなければならず、頻繁な入力には手間です。

例えば、従来の第3第4水準辞書だけで「Tōkyō」と入力しようとしたら、Tを打鍵したあと、仮名漢字変換モードで「O-」と打鍵のうえ変換キーを押して「ō」を選んで確定し、つづいて仮名漢字変換から抜けて「ky」を入力して、その後また仮名漢字変換モードに入って「O-」を打鍵して変換キーを押し......と、仮名漢字変換モードに入ったり出たりしないといけないわけです。

そこで、よく使われる言葉は、単語として登録しておけば、簡単に入力できて便利でしょう。「とうきょう」と入力するのはいつもの日本語入力と同じ操作で楽ですから、そこから変換キーを押すだけで「Tōkyō」になってくれればいいわけです。ローマ字でよく書き表される言葉の代表例として、地名を登録したものがこの辞書です。

したがって、英語など外国語の中に日本の地名を記載する機会のある方には、便利にお使いいただけると思います。

収録している地名

元にしているデータは、統計局提供の、統計に用いる標準地域コードのCSVファイルです。このファイルに市町村名等とその読み仮名が入っているので、それを(ほぼ)機械的に処理してヘボン式・訓令式両方のローマ字表記を生成しています。

辞書に入っているのは、地名のうち、長音符号のつく文字、例えば ō や û 等を含むもののみです。長音のないもの、例えば Nagoya などは収録していません。

含まれる地名は下記に相当するものです。

  • 都道府県名
  • 市町村名
  • 区名 (政令指定都市、および東京特別区)
  • 郡、支庁(小笠原等)、振興局 (北海道、以前の支庁)の名前

これらの地名の、「市」「県」などを除いた部分が辞書に入っています。例えば、南大東村 (みなみだいとうそん、沖縄県)については、末尾の「村」を除いた「みなみだいとう」の読みに対して「Minamidaitō」(ヘボン式)ならびに「Minamidaitô」(訓令式)のローマ字表記が収録されています。ただし、唯一の例外として、「北海道」は末尾の「道」を除かない「ほっかいどう」の形で収録しています。

なお、北海道の郡名は入っていません。かわりに振興局名が入っています。これは元データがそうなっていたためです。

ローマ字の綴り方について

本辞書では、ヘボン式と訓令式の両方の綴りを収録しています。

訓令式については、内閣告示の方法に準拠しています。

ヘボン式については、一般的なヘボン式の綴り方(内閣告示の第2表?)に加えて、下記の要領です:

  • 長音はマクロン (上つきの横線、¯)で表す (内閣告示では一律に「^」ですが、ヘボン式ではマクロンの使用が一般的なために採用しました)
  • はねる音は一律に「n」で表す (例: きょうたんば → Kyōtanba)

複数の語が組み合わされたと考えられる名前でも、ハイフンでつなぐことはせず、一律に完全な一語として扱っています(例: 山陽小野田→San'yōonoda)。これが適当かどうかはよく分かりません。

本辞書で採用している綴りは、各地方自治体がウェブサイト等で使用している綴りとは必ずしも一致しません。また、一致させることを意図してもいません。(地方自治体のウェブサイトに見られるローマ字綴りは長音を明示せず、日本語のローマ字綴りとして問題のあるものが多く見受けられます)


2012年11月 初版公開

最近のブログ記事

libiconv に JIS X 0213がない場合
GNU libiconvはJIS X 0…
「キュレーション」なる語について
DeNAのキュレーションサイトWelqの…
雪の青の夜景、札幌と函館
何日か前の朝のNHKニュースで札幌の夜景…
「2バイト文字」という言い方
「2バイト文字」という言い方につっこみを…
EUCが国際標準化されていれば良かった
すごい後知恵なんですが、1980年代に「…

広告