仮名合字・合略仮名の文字コード

| コメント(0) | トラックバック(0)

合字とは

合字というものがあります。複数の文字を組み合わせて一文字となったものです。欧文の「Æ」のような文字はどこかで見たことがある人が多いでしょう。いうまでもなくAとEの組み合わせです。ドイツ語の「ß」も「ss」を表す合字です。合字を英語ではligatureといいます。

漢字にも,「麻呂」を組み合わせて一字になった「麿」や,「久米」の「粂」等の合字があります。

仮名文字にも合字があります。今日,通常の文章には用いられませんが,昔のものには見ることができます。こうしたものは仮名合字や合略仮名と呼ばれます。

ここではそれらのうち,現在符号化されているものについて文字コードをまとめてみます。

仮名合字の文字コード

文字読みJIS X 0213UnicodeUnicode文字名Unicodeブロック
より1-2-25U+309FHIRAGANA DIGRAPH YORIHiragana
コト1-2-24U+30FFKATAKANA DIGRAPH KOTOKatakana
𪜈トモU+2A708(CJK)CJK統合漢字拡張C
𬼀シテU+2CF00(CJK)CJK統合漢字拡張F
𬼂なりU+2CF02(CJK)CJK統合漢字拡張F

最後のものは合字ではなく「也」の草体からきたもので,仮名のように扱われるそうです。

これらのうち最も早く取り入れられたのは,JIS X 0213:2000にて符号化された平仮名合字より,片仮名合字コトです。それに基づいてUnicodeにも入りました。

Unicodeで漢字扱いされているものがあります。ものによっては,仮名合字でなく漢字の草体としてみなされるものもあるようです。

これで全てではなく,今後符号化されるものもあるかもしれません。

用例

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/655

コメントする

最近のブログ記事

仮名合字・合略仮名の文字コード
合字とは 合字というものがあります。複数…
なぜ『プログラマのための文字コード技術入門』の改訂新版にはSKKと Emacsの話が入っていないのか
拙著『[改訂新版] プログラマのための文…
朝鮮半島の訃報の第3水準漢字
朝鮮戦争で韓国軍として活躍した白善燁氏が…
テレワークの環境改善〜CO2濃度をチェックする
テレワークの問題点 新型コロナウイルスの…
エンジニアHubにて「文字コード再入門─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!」公開
「エンジニアHub」にて記事を執筆しまし…

広告