2016年2月アーカイブ

最近知ったのですが、ウェブ開発によく使われるスクリプト言語のPHPでは、JIS X 0213の符号化方式、Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004が使えるようになっているそうです。バージョン5.4からmbstringというモジュールで対応がなされている由。

私自身はPHPを使わないのでよく分からないのですが、PHPをお使いの方は下記のページを見ていただくといいのではないかと思います。

ただ、よく注意してみると、EUC-JIS-2004を指定する文字列が "EUC-JP-2004" となっているようです。これはRubyの以前のバージョンと同じですね。紛らわしいところではあります。(参考: Ruby 2.1 で EUC-JIS-2004 の名前が修正)

さて、いくつかのプログラミング言語のJIS X 0213対応を表にすると下記のようになります。

言語EUC-JIS-2004Shift_JIS-2004ISO-2022-JP-2004
PHP
Python
Ruby××
Java (およびScala)××

このほか、libiconvを使えば上記3つのいずれの文字コードもUTF-16等の他の文字コードに変換できます。また、テキストエディタのGNU Emacsは上記3つ全てに対応しています。

私自身はISO-2022-JP-2004は正直使わないのですが、SJISというときはShift_JIS-2004、EUCはEUC-JIS-2004をもっぱら使用しています。

最初にお断りしておきたいのは、漢字と平仮名の使い分けには「これこそが正しい」という絶対的な決まりがあるわけでなく、要するに読んで意味が通じればいいものであるということです。

では「読んで意味が通じる」かはどう判断するかというと、常用漢字表に載っている、あるいは市販の国語辞典を引けば分かる、というあたりが指針になるでしょう。

その上で、どのように漢字と平仮名を使い分ければいいか、私の考え・方針をこの記事に記してみます。具体的な方針に入る前に、日本語表記に漢字を使うことの利点と欠点を考えます。

漢字仮名交じり文の利点

日本語は平仮名だけあれば書けるのですが、ではなぜ面倒くさい漢字を使うのか。いくつか利点があります。

  • 分かち書きをしなくて良い
  • 同音異義語の書き分け (「公園・講演・後援」、「雨・飴」など)
  • 高級語彙の理解の手助け (「かしじょうみゃくりゅう」が何だか分からなくても「下肢静脈瘤」という字を見れば見当がつく)
  • 文字数が少なくて済む

漢字があることによって読みやすい・分かりやすいということが重要です。そうでなかったら平仮名だけでいいんですからね。

漢字の日本語表記における難点

一方、漢字による難点・欠点もあります。ここでは日本語表記の場合のことを言っているので、漢字であっても中国語など外国語の場合には当てはまらないものもあります。

  • 文字数が多くて学習が大変
  • 形が複雑で学習が大変
  • 1文字の読みが複数あって学習が大変
  • 読みの定まらないことがある (「止める」(とめる・やめる)、「歪み」(ひずみ・ゆがみ)、「酷い」(むごい・ひどい)など)
  • 同じ語の書き方にバリエーションが多い (例えば「バラ・ばら・薔薇」。ちなみに「薔薇」は本来は漢語で「しょうび(そうび)」)

したがって、利点を活かしつつ、欠点を抑えるような運用方法が望ましいといえます。

私の方針

漢語はなるべく漢字にする

ここで漢語とは「漢字からできた言葉」ぐらいの意味でいっています。漢字を音読みにする単語と言ってもいいでしょう。「読書」「登山」などです。こういうのはなるべく漢字で書きます。ただし、元の漢字の意味があまり意識されないものは平仮名で書くこともあります。(副詞の「だいたい」「ふだん」「いったん」など)

漢語には同音異義語が多く、漢字で書かないとどれのことか分からないことがしばしばあります、例えば、上記の「こうえん」や、ほかにも「せいき」→「世紀・正規・生気・精気」など、いくらでもあります。また、語の成り立ちとしてこれらは、元々音声言語として存在していた大和言葉とは異なり、漢字によって作られたものであるわけですから、漢字で表記することが言葉の理解のために適当であると考えられるでしょう。

形態的なまとまりを意識する

漢字が連続しているとひとまとまりの語として認識しやすいことを利用します。漢字だけで書ける単語の中に平仮名を交ぜる「交ぜ書き」はなるべく用いません。

したがって、「子ども」「友だち」ではなく「子供」「友達」とします。なお、これらの語の「ども」「だち(たち)」は元々は複数を意味しますが、現在では「こども」「ともだち」でそれぞれ単一の語として扱われ、複数としての意味が薄れています。「男ども」「女ども」のような例を考えると、「子ども」のように平仮名で書くと、却って複数としての意味が強調されてしまうように私には見えます。こうしたことからも漢字だけで書く方が適当と考えます。

また、漢字の語が連続すると区切りが分かりにくくなるので、紛らわしい場合には連続した語のどちらかを仮名に開くことを検討します。これが起こりやすいのは文頭の副詞の場合です。「今行ってきた」とあると「今行」という語のように見えてしまい、いやそんな語はないぞと、余計な判断が増えてしまいます。「いま行ってきた」ならすんなり読めます。この場合は「今」の後に読点を打つという解決方法もありますが、意味の修飾関係や読んだときのリズムを損ねないよう注意が必要です。

同様に平仮名ばかりが連続すると語の切れ目が分かりにくくなるので、やはり避けるようにします。

大和言葉に対応する漢字が複数あって使い分けが面倒な場合は平仮名に開く

面倒なら開く、というのはいい加減に聞こえるかもしれませんが、大和言葉の場合には多分かなり本質的に適切な方針だと考えています。

例えば大和言葉「はかる」に対しての漢字表記は「計る」「測る」「量る」と複数あるわけですが、どれが最も適当かはなかなか難しいことがあります。辞書を調べて「この場合はこれだ」と追求してもいいのですが、判断が難しければ「はかる」と平仮名でも構わない、ということです。そのとき言いたかったのは大和言葉の「はかる」であって、(古代中国の言語体系に基づいた)漢字ではなかったのでしょう。

いちいち断っているように、これは大和言葉の場合、いいかえれば訓読みの場合ですので誤解なきよう。

読みの曖昧な漢字はなるべく使わない

上にあげた「止める」「歪み」の例のように、どちらに読めばいいか分からない場合は漢字を使わず平仮名にします。文脈を考えれば判断できることもありますが、なるべく立ち止まらずにすんなり読めるようにします。

ただし別の要因とのトレードオフも考慮します。平仮名が連続して読みにくくなる場合に、どちらを優先するかといった問題です。状況によっては振り仮名を使うのも手です。

例えば私は「平仮名」「片仮名」のように、これらの語を漢字で表記します。これは上述の形態的なまとまりを考慮してのことです。しかし単に「仮名」とすると、「かな」なのかそれとも別の単語の「かめい」なのか、分かりづらいことがあります。なので、単独で「仮名」とはなるべく使わず、「平仮名」「片仮名」にするとか「仮名文字」のようにするといった工夫をします。技術的に可能なら振り仮名を使って「仮名(かな)」とするのもいいでしょう。表記上の不統一をいとわなければ「カナ」のようにする手もあります。

あまり難しい漢字や特殊な読みは使わない

老若男女、また外国語として日本語を学んでいる外国人も読むことを考え、あまり難しい漢字や特殊な読みは用いません。常用漢字表は良い目安となるでしょう。

もっとも、特定分野の専門用語に難しい字が出てくるのは仕方ないところがあります。そういうのは無理に平仮名にすると却って分かりづらかったり読みづらかったりすることがあるので、読み仮名を振ったり初出の際に説明したりします。特に複数の熟語で使われる漢字は、仮名に開かずにむしろ積極的に漢字を使った方が良いでしょう。

一方、特殊な読みを指定したり、固有名詞だからといって無闇に旧字体や異体字を振りかざしたりするのは控えた方がいいでしょう。字を変にいじって悦に入るのは十代で卒業しておくべきです。

他人の用字を間違いと決めつけない

これは自分が書くこととは違うのですが、他人が自分にとってあまり見慣れない用字をしているときに無闇に間違いと決めつけるのは良くないですね。

例えばあるウェブサイトで「〜して下さい」のような「下さい」を漢字で書いたら間違いだみたいなことを書いていたのを見た覚えがありますが、全然間違いじゃない、きちんとした日本語表記です。大辞林にだって例文として載っています。こういう補助動詞を平仮名で書くのを選好する考え方があるのは分かりますが、あくまでも趣味の問題でしかない。

他人の用字が間違いではないかと疑問に思ったら辞書を引いてみるのが良いでしょう。知らなかったことがきっと載っているはずです。

広告