『アイヌと縄文』の第4水準漢字:「埦」

| コメント(0) | トラックバック(0)

瀬川拓郎『アイヌと縄文: もうひとつの日本の歴史』(ちくま新書)を読んでいたら、JIS第4水準漢字を見つけました。

(わん)」がそれです。JIS X 0213の漢字集合2面の4区87点にあります。文章の中で「青苗土器の埦は還元焼成気味で硬く」のように使われています。

どういう字か

この字は「碗」と同じように器を意味するようです。広辞苑では「飯・汁などを盛る陶磁器の食器」と説明されています。

埦飯(おうばん)」という熟語もあり、広辞苑にも載っています。ウェブ検索では百科事典の記述の一部としてもこの語が出てきます。また、埦を「「素焼き」で蓋つきの器」と説明しているページもあります(【茶道】盌と碗と椀と埦 )。

文字入力

Emacs上で動くSKKのJIS第3第4水準漢字辞書には、この「(わん)」や「埦飯(おうばん)」が登録されており、普通の単語と同じように読みから入力できます。

Macの仮名漢字変換では、「わん」から「埦」に変換できます。ただし「埦飯」は入ってないようです。

文字コードの扱い

JIS X 0213の第4水準漢字なので、Shift_JIS-2004やEUC-JIS-2004、UTF-8などで符号化できます。SJISのコード値はF1F5です。EUCでは8Fというシングルシフトコードに続けてA4F7とします(都合3バイトに見えます)。Unicodeの符号位置はU+57E6です。

UTF-8からSJISに文字コード変換するときは、iconvコマンドで下記のようにすれば「埦」という漢字も文字化けしません。

  iconv -f UTF-8 -t SHIFT_JISX0213 < utf8.txt > sjis.txt

この例の SHIFT_JISX0213 がShift_JIS-2004を意味します。EUCの場合はこれにかえて EUC-JISX0213 とします。反対にSJIS/EUCからUTF-8に変換するときは、オプション -f と-t を入れ替えます。

iconvの実装によっては SHIFT_JIS-2004 及び EUC-JIS-2004 という名前が使えるものもありますが、この名前に対応していないものもあります。SHIFT_JISX0213, EUC-JISX0213 であれば、一般的に問題なく使えるはずです。なおこれは名前だけの問題で、中身は SHIFT_JISX0213 も SHIFT_JIS-2004 も同じです。

第3第4水準漢字はいつでも出てくる

度々書いているように、文化的な文章にはしばしばJIS第3第4水準漢字が出てきます。

いつでも、第3第4水準漢字を扱える文字コードを使うことが重要です。具体的には、Shift_JIS-2004, EUC-JIS-2004, UTF-8などです。

アイヌ文化つながりで、先月書いた記事「札幌で見たJIS X 0213の文字」もご覧ください。こちらに出てくるアイヌ語表記用の片仮名の取り扱いにも、上記で説明した文字コード変換のコマンドが必要です。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/611

コメントする

最近のブログ記事

どうせクレジットカードを持つなら出身大学の支援になるものはどうか
大学カードというものがある 今や生活に欠…
「など」の使い方
曖昧な言い方が好まれる風潮があると感じて…
日本の文字は「表イメージ文字」でいいのか
笹原 宏之『漢字に託した「日本の心」』 …
Creative Commonsライセンスの作品は無条件で使って良いわけではない
他人の写真や文章を盗用・コピペする「キュ…
「小樽雪あかりの路」の魅力
北海道の冬のイベントというと札幌の雪まつ…

広告