ウソに戸惑う

| コメント(0) | トラックバック(0)

JIS X 0213の追補1:2004で、所謂「表外漢字UCS互換」10文字が追加されました。この中に、「噓」(cf. 「嘘」)という字も含まれています。第3水準に含まれ、面区点番号は1-84-7です。

自分で文字を入力しようとすると、ウソという言葉を漢字で入力するのに、第1水準の「嘘」にすべきなのか、それとも第3水準の「噓」にすべきなのか、戸惑います。第3第4水準辞書を使うと、どちらのウソも入力可能です。

表外漢字UCS互換とは何であるかについては、拙著『プログラマのための文字コード技術入門』の第3章をご覧ください。

表外漢字字体表の趣旨としては、「噓」を使うべきということになるのでしょう。しかし、読み手の機器やフォントなどにおいて、第3水準の「噓」が正しく扱えないケースがたくさんあることが予想されます。ならば、表外漢字字体表を作った人には悪いけど、無難に第1水準の「嘘」にしておこうか、という考えがわいてきます。

そもそも何で「噓」の方がいいというのか、私にはよく分かりません。「所謂康煕字典体」だということなのでしょうが、実は、康煕字典そのものに載っているのは「所謂康煕字典体」の「噓」ではなく「嘘」の方なんだそうです。ここで「所謂」は無意味な飾りではありません。

こういう、活字のデザインに属するところは、文字コードとしては区別せずに、フォントの問題とするのが使いやすい文字コードであると私は思います(実際、Unicodeが両者を区別していなければそうなる筈でした)。これを文字入力(符号化)の段階で区別する意味があるとは思えません。「文字コード」は「活字デザインコード」ではない。

第3水準がいつでもどこでも使えるようになるまでは「噓」を使うのに上記のような懸念があるわけだし、どこでも使えるようになったらなったで、固有名詞などについて「正式な表記は『噓』だ、『嘘』ではない」みたいな鬱陶しい言説がまかりとおるようになるのもあまり良い未来とは思えません。すっきりしない状況はまだまだ続きそうです。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/331

コメントする

最近のブログ記事

仮名合字・合略仮名の文字コード
合字とは 合字というものがあります。複数…
なぜ『プログラマのための文字コード技術入門』の改訂新版にはSKKと Emacsの話が入っていないのか
拙著『[改訂新版] プログラマのための文…
朝鮮半島の訃報の第3水準漢字
朝鮮戦争で韓国軍として活躍した白善燁氏が…
テレワークの環境改善〜CO2濃度をチェックする
テレワークの問題点 新型コロナウイルスの…
エンジニアHubにて「文字コード再入門─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!」公開
「エンジニアHub」にて記事を執筆しまし…

広告