Windows Vista狂想曲2006年11月29日 23:31

Windows Vistaの文字コードについてにわかに騒がれているようです。例えばITproの特番。前から分かっていた話なんですけどね。

どういう点が問題かというと、例えば、今まで1文字2バイトと仮定していたのが、これからはUnicodeのPlane 2の漢字も含まれるのでサロゲートペアを使って4バイトの文字が入ってき得る、とか。アイヌ語表記用の片仮名 (相変わらず「アイヌ文字」などと誤って呼んでいる記事もあるようですね) や鼻濁音表記用の仮名では合成文字を使うのでやはり1文字4バイトになったり、というのもありますね。

そんなことで騒ぐんだったら、Shift_JIS-2004を使えばどうですか? いわゆる「全角文字」は全部2バイトで済みますよ。でもMSの資料やそのへんの解説記事では「JIS2004というのは (符号化文字集合ではなく) 字体の規格である」ということになってしまっているので、そういう便利な符号化方式のことには頭が回らない、というか知りさえしないんでしょうなぁ。

もう何年も前からEUC-JISX0213やShift_JISX0213を使って改善された日本語環境を使っている身としては、いまごろご苦労さまという感じです。

あるいは、6年前に「括弧つきUCS」にごちゃごちゃと文句つけていた人はどう思っているのでしょう? Unicodeが「括弧つきUCS」のとおりに改正されていれば、JIS X 0213の文字は全部BMPに入って、いま騒いでいる問題の半分は何もしなくても片付いていたことになりますね。まぁ「括弧つきUCS」が無用の反感を買ってしまった面はあるとしても、とにかく全部BMPに入れようよという意図は圧倒的に正しかった筈なのですが。そういう実用的な物の見方をする人はなぜか少ないようです。

コメント

トラックバック

_ [CentOS] - WEBデザインのための自宅サーバ構築記 - 2007年01月17日 00:24

1月30日にどうやら発売されるらしい、WindowsVista。
Windows3.1 Windows95 Windows98 WindowsME
WindowsXP の次となるコレだが・・・

第一印象あれ?こんな高かったっけなとおもった。
それはともかく、4種に分かれるらしく、その機能を把握
するのも正直...

_ 英語自己紹介 説明 - 2007年06月01日 13:07

英語自己紹介 案内と情報です。できるとかっこいい!