なぜ『プログラマのための文字コード技術入門』の改訂新版にはSKKと Emacsの話が入っていないのか

| コメント(0) | トラックバック(0)

拙著『[改訂新版] プログラマのための文字コード技術入門』(技術評論社,2018)についての感想で,初版にAppendixとして入っていたSKKとEmacsによるJIS X 0213対応の話が無くなっていることを惜しんでくれているものがありました。

これは初版執筆時に著者(私だ)がEmacsとSKKを使ってEUC-JIS-2004のプレーンテキストとして原稿を書いていたことを紹介し,当時の一般的な日本語入力環境が抱えていた問題点をこれによって解消できることを説明したものです。

当時の日本語入力環境というのは,おおまかにいえばJIS X 0208の第1・第2水準漢字に制約されており,それ以外の文字は入力できないか,できたとしても単漢字変換や文字パレットのような使いにくい方式によるしかないというものでした。そういう状況を改善し,現代日本で使われている文字は第1・第2水準漢字に限らず,分け隔てなくストレスなしに使えるようにするということが,EmacsとSKKでは2000年のJIS X 0213制定後まもなくして実現されていたのです。それがJIS X 0213という規格の狙いでもありました。

本書はその性質上,JIS X 0208にない文字をふんだんに含んでいるわけですが,その執筆のためにEmacsとSKKの組み合わせが絶大な威力を発揮したのです。

ただ,初版刊行後,何年も経つうちに一般的な日本語入力環境も大きく進歩して,EmacsとSKKを使わずとも同じようなことはだいぶ可能になりました。いま私がこのブログを書くのに使っている環境でも,「とかられっとう」と打てば「吐噶喇列島」に変換され(噶はJIS第3水準),著作権記号「©」も「ちょさくけん」等の言葉から変換でき(JIS X 0213で追加された非漢字),「きもと」と打てば「生酛」に変換できる(酛は第3水準)。Macに至ってはJIS X 0213に収録されたアイヌ語表記用片仮名を用いた本格的なアイヌ語入力方式が実装されており,ローマ字「cep」から「チェㇷ゚」を入力できるようになっています。それは,JIS X 0213が目指したあるべき進歩の道でした。

そこで,このAppendixはもはや現在の状況にそぐわないと判断し,改訂新版からは取り除くことにしたのです。

ただ、著者としてはこのAppendixを気に入ってもらえたことは大変嬉しいのです。多分、私が重要だと考えていたところが詰まっていて、今読み返しても力を感じる文章でもあるからでしょう。その辺を汲み取ってもらえたのか,編集者は本編の文章の脚注としてこのAppendixのごく短いダイジェストを挿入してくれました。

もっとも,今の日本語環境が全然問題ないかというとそうでもなく,Unicodeに色々な文字や記号が収録された結果,文字入力時に「意図にふさわしいコードが入力されているのか」を容易に判断できないことも増えています。先の著作権記号にしても,絵文字スタイルが変換候補に出てきたり,著作権とは異なるただの丸付きC (U+24B8)があったりして、判断に困ります。こういう点は,文字コードの「一意な符号化」という観点から問題があります。SKKには「$」を打鍵するとカーソル位置の文字の符号位置を表示する機能があり,そういう入力支援の面でアドバンテージがあります。

公共図書館等で本書初版を所蔵しているところも多いようなので,どんな内容だったか気になる方は初版のAppendix A.5をチェックしていただくのも良いと思います。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/651

コメントする

最近のブログ記事

なぜ『プログラマのための文字コード技術入門』の改訂新版にはSKKと Emacsの話が入っていないのか
拙著『[改訂新版] プログラマのための文…
朝鮮半島の訃報の第3水準漢字
朝鮮戦争で韓国軍として活躍した白善燁氏が…
テレワークの環境改善〜CO2濃度をチェックする
テレワークの問題点 新型コロナウイルスの…
エンジニアHubにて「文字コード再入門─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!」公開
「エンジニアHub」にて記事を執筆しまし…
National Geographic Your Shot で Daily Dozen に選ばれた話
ブログをさぼっている間に時間がずいぶん経…

広告