書家の第3水準漢字:「金子鷗亭」

| コメント(0) | トラックバック(0)

書家・金子鷗亭の作品の特別展が北海道立函館美術館で開催されるとのニュースがありました。

金子鷗亭とは

金子鷗亭は1906年生まれ、2001年没で、函館から比較的近い松前町の出身です。1990年に文化勲章を受章しています。漢文に偏ったそれまでの書のあり方を批判し、生活に近い口語文や短歌などを題材とすることを提唱、漢字・平仮名・片仮名の調和を重視したということです。日本酒「一ノ蔵」のラベルでも知られます。

鷗という字と文字コード

この「鷗」はJIS第3水準、面区点位置1-94-69にあります。鳥のカモメの意味です。音読みではオウと読みます。

PCでかもめと打って変換すると「鴎」の方が先に出てくることが多いでしょう。こちらはJIS第1水準、1-18-10です。

JIS X 0208はもともと、18-10の位置に「鷗」がありました。しかし1983年改正で「鴎」という略字体に変更されてしまいました。これは表外字なので常用漢字体ではありません。新聞の紙面では、独自に略したこの字体が採用されていたそうです。JIS X 0208の拡張版であるJIS X 0213で、元の字体が第3水準漢字として1-94-69に復活しました。

このニュース記事では注釈として「文字化けを回避するため「かもめ」の人名用漢字を鴎に置き換えました」と記しています。「「かもめ」の人名用漢字」というのは間違いとも言いにくいですがちょっと微妙な説明です。確かに「鷗」は人名用漢字に入っていますが、この説明だと「普通のカモメの漢字のほかに「人名用漢字のカモメ」という特殊な漢字がある」かのような理解をしてしまう人がいそうです。そうでなく、元来「かもめ」の漢字は「鷗」なのであり、この字は常用漢字表には入っていないが子の名付けに使って良い字に含まれている、というのが実際のところです。一方、「鴎」は新聞などで使われた「鷗」の略字体で、83JIS変更によってPCではこっちの字体しか出ない状態が長く続いたので広まっているものです。

このような面倒な説明を避けるためには記事で「鷗」を使えばいいわけですが、このニュースサイトはJIS X 0208ベースの Shift_JIS を使っているので「鷗」は表現できません。JIS X 0213ベースに拡張した Shift_JIS-2004 や、Unicodeの UTF-8を使えば問題なく表現できます。その際、単にHTMLだけでなく、記事の執筆・編集・管理といった作業工程全体で第3第4水準文字コードを用いることが必要です。

例えば、作業工程のあるフェーズで、UTF-8にて作成したファイルをSJISに変換する必要があるなら、Shift_JIS-2004を指定すれば良いです。これなら、「鷗」のような第3第4水準漢字や、非漢字たとえば著作権表示記号やユーロ記号なども文字化けしません。iconvコマンドではこうします:

  iconv -f UTF-8 -t SHIFT_JISX0213 < utf8.txt > sjis.txt

逆向きの変換、つまりSJISからUTF-8に変換するには、-f と -t を入れ替えてやります。これはCP932の波ダッシュ問題も引き起こさず、最も正当な変換結果が得られます。

  iconv -f SHIFT_JISX0213 -t UTF-8 < sjis.txt > utf-8.txt

余談ながら

冒頭の展覧会は道立函館美術館で12月11日まで開催とのことです。この美術館、函館の観光名所・五稜郭のすぐそばにあります。新幹線も開業したことですし、旅行の一環として行くのにも向いているでしょう。

下の画像は年末、雪の時期の五稜郭の写真です。12月11日だとまだ雪は積もっていないかもしれませんね。函館美術館はこの五稜郭を上から眺める五稜郭タワーの近くにあります。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/615

コメントする

最近のブログ記事

libiconv に JIS X 0213がない場合
GNU libiconvはJIS X 0…
「キュレーション」なる語について
DeNAのキュレーションサイトWelqの…
雪の青の夜景、札幌と函館
何日か前の朝のNHKニュースで札幌の夜景…
「2バイト文字」という言い方
「2バイト文字」という言い方につっこみを…
EUCが国際標準化されていれば良かった
すごい後知恵なんですが、1980年代に「…

広告