2015年7月アーカイブ

拙著「プログラマのための文字コード技術入門」の電子書籍版、既に提供済のPDF版に加えて、EPUB版の公開が開始されたようです。

PDFが先行して販売されていましたが、EPUBはUnicode特有の問題のために時間がかかっていたようです。

本書の原稿はJIS X 0213にある文字だけを使っているのですが(EUC-JIS-2004で書いたので当然)、Unicodeで符号化したときにアプリケーションの処理で問題になりそうな点として、サロゲートペアの必要な文字、結合文字の必要な文字、互換漢字、という3つが挙げられます。今回のEPUB (のアプリケーション)では主に結合文字の箇所で問題があったのではないかと思います。そういうところはまさに本書が扱っている文字コードの問題です。

ともあれ、EPUBで読みたい方はぜひ試してみて下さい。上記リンクではPDFとEPUBのセット販売となっています。

少し前に書いた記事「硯の色の第3水準漢字:「玫瑰紫」」で紹介したテレビ東京の「なんでも鑑定団」の同じ回の再放送を見るともなく見ていたら、最初に気付かなかったJIS第4水準漢字が字幕に写っていることに気付きました。

それは、「鱔魚黄(ぜんぎょおう)」という言葉です。この1文字目の「鱔」は、JIS X 0213の第4水準、面区点番号2-93-81です。

澄泥硯という種類の硯の色のひとつであるようです。ネット検索すると硯の紹介などのページにこの字が使われているものがあります。文字を入力できなかったのか、「ゼン」と片仮名書きしているものもありました。文字コード・フォント・文字入力プログラム(IME)の3点そろってJIS X 0213に対応することが、日本の文字運用上では重要です。

テレビを見ていてなぜこれが第4水準だと気付いたかというと、字のデザインのバランスがあまりとれていないように見えて、作字したのかなと思ったためです。

「JIS漢字字典」でこの字を見てみると、古い医学書(金匱要略)が用例として確認されているようです。硯については出ていません。

「漢字源」によると、「鱓」の異体字だということです。意味として、淡水魚やうつぼ、わにの一種と、異なったものが掲載されています。この「鱓」はJIS第3水準、面区点1-94-52です。

Emacs上の仮名漢字変換プログラムSKKのJIS第3第4水準辞書SKK-JISYO.JIS3_4では、「ぜん」という読みから「鱔」に変換できます。

プレーンテキストではUTF-8やShift_JIS-2004EUC-JIS-2004といった符号化方式でこの字を扱うことができます。

広告