辞書サイトの発音記号

| コメント(0) | トラックバック(0)

英和辞典などを提供しているウェブサイトで、発音記号の表記をどのように行っているか、気になりました。ある程度Unicodeの文字を活用しているかと思えば、文字によってはなぜか画像を使っていたりと、どういう方針なのかが見えづらいのです。

例えば、Yahoo!辞書の英和辞典では、ASCIIで表せる以外の発音記号はほとんど画像に頼っているように見受けられます。試しにalthoughなんていう言葉をひいてみると、[ɔːlðóu] と発音が記されているうち、l と u 以外は全部画像です。ただ、thoughtをひくとthの音にあたる記号がθで記されています。これはギリシャ文字シータで、JIS X 0208で表せるので使っているものと想像できます。してみると、ASCII + JIS X 0208で表せるかが、文字か画像かの基準となっているのかもしれません。ちなみにYahoo!辞書のウェブサイトの文字コードはUTF-8です。

これがgoo辞書になると、画像に頼らず文字として表している程度がもう少し高くなります。例えば、compassionという語をひくと、ASCIIにもJIS X0208にもないǽが文字で表されています。ただし、əやʃは画像を使っています。また、先に例示したalthoughについてYahoo!辞書と比較すると、ðとóを画像でなく文字にしているところが違います。ただし、ɔːはやはり画像です。この辺の、画像か文字かの分かれ目がどこにあるのか、goo辞書については私には見出せませんでした。

goo辞書もYahoo!辞書も、文字コードはUTF-8です (ちなみにInfoseek辞書はEUC-JP)。せっかくUTF-8を使うのなら、Unicodeにある発音記号を使えばもっとすっきり綺麗に表示できるのにと思います。Unicodeのどこまで対応すればいいか分からないというなら、JIS X 0213にある文字という基準で対応すれば、大体の用は済むはずです。

トラックバック(0)

トラックバックURL: http://yanok.net/yanok/mt-tb.cgi/163

コメントする

最近のブログ記事

仮名合字・合略仮名の文字コード
合字とは 合字というものがあります。複数…
なぜ『プログラマのための文字コード技術入門』の改訂新版にはSKKと Emacsの話が入っていないのか
拙著『[改訂新版] プログラマのための文…
朝鮮半島の訃報の第3水準漢字
朝鮮戦争で韓国軍として活躍した白善燁氏が…
テレワークの環境改善〜CO2濃度をチェックする
テレワークの問題点 新型コロナウイルスの…
エンジニアHubにて「文字コード再入門─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう!」公開
「エンジニアHub」にて記事を執筆しまし…

広告