どうやって「吐噶喇列島」を入力しているのか

| コメント(0) | トラックバック(0)

先の記事のHTMLソースをご覧になった方は、吐噶喇の「噶」が文字参照でなく普通の文字として書かれていることに気付いたことでしょう。こうしたJIS第3水準などの文字を私がどう入力しているのかについて少し記しておきます。

私が日常的に使っているエディタのEmacsではJIS X 0213の文字コードに対応しています。Emacs 21や22では、Mule-UCSというEmacs LispパッケージをインストールすることでJIS X 0213のテキストを編集可能です。最新版のEmacs 23では追加パッケージは不要です。

もっとも、編集できるだけでは不十分で、文字が入力できなくてはなりません。入力には、Emacs上で動作する仮名漢字変換プログラムのSKKを利用しています。SKKでは、JIS第3・第4水準漢字辞書を使うことで、「噶」のような第3水準漢字も普通に単語の読みから変換できるのです。

当サイトも含めてブログというものは大体Webブラウザから入力するものですから、そのままではEmacsのJIS X 0213対応がブログ編集に活用できません。そこで、Firefoxの拡張機能のMozExを使って、テキストエリアの編集にEmacsを呼び出して使うようにしています。これにより、ブログの入力にEmacsとSKKのJIS X 0213対応環境を利用できるのです。ファイル保存にUTF-8を指定することで、ブラウザに正しく文字データが渡されます。

ブラウザの入力欄というのは文章を編集するにはあまり使い勝手の良いものでないので、JIS X 0213の利用というだけでなく、書きやすさの点からも、Emacsを使って編集できるのは助かります。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/12

コメントする

最近のブログ記事

仮名合字・合略仮名の文字コード
合字とは 合字というものがあります。複数…
なぜ『プログラマのための文字コード技術入門』の改訂新版にはSKKと Emacsの話が入っていないのか
拙著『[改訂新版] プログラマのための文…
朝鮮半島の訃報の第3水準漢字
朝鮮戦争で韓国軍として活躍した白善燁氏が…
テレワークの環境改善〜CO2濃度をチェックする
テレワークの問題点 新型コロナウイルスの…
エンジニアHubにて「文字コード再入門─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!」公開
「エンジニアHub」にて記事を執筆しまし…

広告