『アイヌと縄文』の第4水準漢字:「埦」

| コメント(0) | トラックバック(0)

瀬川拓郎『アイヌと縄文: もうひとつの日本の歴史』(ちくま新書)を読んでいたら、JIS第4水準漢字を見つけました。

(わん)」がそれです。JIS X 0213の漢字集合2面の4区87点にあります。文章の中で「青苗土器の埦は還元焼成気味で硬く」のように使われています。

どういう字か

この字は「碗」と同じように器を意味するようです。広辞苑では「飯・汁などを盛る陶磁器の食器」と説明されています。

埦飯(おうばん)」という熟語もあり、広辞苑にも載っています。ウェブ検索では百科事典の記述の一部としてもこの語が出てきます。また、埦を「「素焼き」で蓋つきの器」と説明しているページもあります(【茶道】盌と碗と椀と埦 )。

文字入力

Emacs上で動くSKKのJIS第3第4水準漢字辞書には、この「(わん)」や「埦飯(おうばん)」が登録されており、普通の単語と同じように読みから入力できます。

Macの仮名漢字変換では、「わん」から「埦」に変換できます。ただし「埦飯」は入ってないようです。

文字コードの扱い

JIS X 0213の第4水準漢字なので、Shift_JIS-2004やEUC-JIS-2004、UTF-8などで符号化できます。SJISのコード値はF1F5です。EUCでは8Fというシングルシフトコードに続けてA4F7とします(都合3バイトに見えます)。Unicodeの符号位置はU+57E6です。

UTF-8からSJISに文字コード変換するときは、iconvコマンドで下記のようにすれば「埦」という漢字も文字化けしません。

  iconv -f UTF-8 -t SHIFT_JISX0213 < utf8.txt > sjis.txt

この例の SHIFT_JISX0213 がShift_JIS-2004を意味します。EUCの場合はこれにかえて EUC-JISX0213 とします。反対にSJIS/EUCからUTF-8に変換するときは、オプション -f と-t を入れ替えます。

iconvの実装によっては SHIFT_JIS-2004 及び EUC-JIS-2004 という名前が使えるものもありますが、この名前に対応していないものもあります。SHIFT_JISX0213, EUC-JISX0213 であれば、一般的に問題なく使えるはずです。なおこれは名前だけの問題で、中身は SHIFT_JISX0213 も SHIFT_JIS-2004 も同じです。

第3第4水準漢字はいつでも出てくる

度々書いているように、文化的な文章にはしばしばJIS第3第4水準漢字が出てきます。

いつでも、第3第4水準漢字を扱える文字コードを使うことが重要です。具体的には、Shift_JIS-2004, EUC-JIS-2004, UTF-8などです。

アイヌ文化つながりで、先月書いた記事「札幌で見たJIS X 0213の文字」もご覧ください。こちらに出てくるアイヌ語表記用の片仮名の取り扱いにも、上記で説明した文字コード変換のコマンドが必要です。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/611

コメントする

最近のブログ記事

Unicode 10.0リリース、変体仮名を収録
Unicode 10.0が2017年6月…
Chrome 拡張機能 Personal Blocklist でパクリサイトをブロックしよう
Google検索結果からサイトを除外でき…
Unicode の嫌なところを触ってしまった Python
Pythonとlibiconv, nkf…
電子マネーiDの良さが今更ながら分かった
iDとはどんなものか 電子マネーというと…
書家の第3水準漢字が文字化けするわけ
北海道南部の松前町は、20世紀日本の書家…

広告