2011-06-08

IVSというかUnicodeに見る日本政府のダメな感じ

UnicodeでのIVS (Ideographic Variation Sequence) の倒れそうなお話

IVS (要は異体字のサポートね) ってのはUnicode 5.1で導入されたもので、簡単に言ってしまえば、"渡辺"の"辺"っていろんなバリエーションがあるじゃない?で、それをどうにかできるものなんだよね。それだけ聞くと、おぉ!いいじゃない?って思うんだけど、まぁ、聞け

"辺"の例は、この日経の記事にあるけど、これはわかりづらいから、もっと簡単な例をだす。

U+53DFの異体字一覧があるわけだけど、なんか気付かない?。同じ文字としか見えないものがダブってるだけだよね。

Adobe-Japan-1ってのは、その名の通りAdobeのフォントで定義されてたものヤツ。ある意味出版系で使われているから標準の一つであるよね。もうひとつ、Hanyo-Denshi ってのは、汎用電子情報交換環境整備プログラムで定義されているヤツで要は住基ネットとかe-Japanとかで絡んでたヤツってこと。明らかに正規化を怠ってる感じになってる。

でさ、同じ時期に両方がサブミットしてるんだったら、正規化に失敗するってのだったら、まあ、しょうがないよね、どうしようかって事になるんだけど、どうもAdobeが字形の一覧をサブミットして公開されたのが2007年で、日本政府系のフォントのは2010年。ということで明らかに日本政府関係がやっちまった感じっぽいんだよね。

また、いろいろな話を探っていくと、日本政府関係者が同じっぽい字形が入ってるのを知りながら同じ字形をサブミットした理由ってのが、同じ字形かどうかが分からないから別の字形として申請したというアホな理由ぽいらしいんだけど、関係者に会う機会があったら、是非ホントのところを聞いてみたい感じ。ていうか、Adobe呼んで相談すればいいだけの話じゃない?

こんなアホな理由で同じ字形が複数登録されるくらいだったら、日本の政府関係者は、国際規格に関わらない方がいい規格になると思うのは、オレだけ?

2 件のコメント:

Koichi Yasuoka さんのコメント...

呼びました? でも、本気でまとめるとなると、たとえば「U+5BEC U+E0100」と「U+5BEC U+E0101」の間には「U+5BDB U+E0101」が立ちはだかってて、原理的に無理なんじゃないかって気がします。「U+90F7 U+E0101」と「U+9115 U+E0102」なんて、明らかにAdobeのミスだし。

VYV03354 さんのコメント...

> ていうか、Adobe呼んで相談すればいいだけの話じゃない?
汎用電子の成果報告書
http://www.meti.go.jp/information/downloadfiles/c100806a04j.pdf
を見るとAdobeの山本太郎が委員として参加しているわけですが(6p)、話を聞く気がないんだったら何のために呼んだんでしょうね。政府のパブリックコメントなんかでもありがちな単なるアリバイ作りですかね。