国旗の絵文字はどうなったのか

| コメント(0) | トラックバック(0)

プログラマのための文字コード技術入門』を書いたときにはUnicodeの携帯絵文字はまだ標準化作業の途中だったので、その時点での情報を記しておきました。最終的にできた仕様は本に書いた時点の案とは違うものになっています。ここで簡単にふれておきましょう。

国旗の絵文字を表すために、"Regional Indicator" という特殊な記号を使います。U+1F1E6からU+1F1FFまでの範囲に、例示字形としては点線で囲まれたAからZまでのアルファベットが用意されています。このアルファベットを使って、例えば日本なら「JP」というISO 3166の国コードを表す。つまり符号位置としてはU+1F1EF U+1F1F5という列になります。絵文字に対応した環境でこの列を表示すると、JPすなわち日本の国旗の絵文字を出力する、という具合です。

HTMLの文字参照で書けば、日本の国旗は「🇯🇵」ということになります。実際にこのブログ記事のHTMLの中に書けば「🇯🇵」になるのですが、見えるでしょうか。iPadやMacでは見えるようです。iPod Touch第2世代では点線に囲まれたJとPが見えていて、国旗としては出力しないけれどもregional indicator自体は認識されているような見た目です。全く見えない環境も多いでしょう。まあ、あまり気に病むことはありません。

Unicodeの仕様書を見ると、別にどの国旗に対応してないといけないと規定されているわけではないし(それを言い出したらいろいろ大変でしょう)、枠組みは用意しておいたのであとはよろしく、といった感じです。Unicodeコンソーシアムのサイトでダウンロードできるcode chartにはこのregional indicator symbolについての説明があるのですが、とても弱気な感じが味わい深い。

In some emoji implementations, certain pairs may be recognized and displayed by alternate means; for instance, an implementation might recognize F + R and display this combination with a symbol representing the flag of France.

someとかmayとかmightとかいってて、これ書いた人は本当は実装してほしくないんじゃないかとさえ思えてきます。

今日は2月11日、建国記念日にちなんだお話でした。(?)

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/449

コメントする

最近のブログ記事

National Geographic Your Shot で Daily Dozen に選ばれた話
ブログをさぼっている間に時間がずいぶん経…
情報処理学会から山下記念研究賞を頂いた話
ブログをさぼっている間に時間がずいぶん経…
Go と Rustの文字列
Go言語における文字列はUTF-8のバイ…
『[改訂新版] プログラマのための文字コード技術入門』のページ作成
発売されてから半年以上経ってようやくのこ…
『[改訂新版]プログラマのための文字コード技術入門』発売!
ばたばたしていて当サイトの更新も怠ってい…

広告