JIS X 0213で多言語文書2005年07月14日 22:06

JIS X 0213を利用した多言語文書の処理の例を公開しました。この例では、日本語・アイヌ語・エスペラントがひとつの文書の中で混在しています。アイヌ語・エスペラントに固有な文字がJIS X 0213では追加されています。

JIS X 0213というと漢字が追加されたという印象が強いかも知れませんが、非漢字にも注目すべきものがあります。上記の例でいえば、アイヌ語は日本国内の先住民族の言語として重要ですし、エスペラントは国際的に公平な共通語として根強く推進している人たちがいます。

こうした非漢字をうまく処理することも、JIS X 0213を使いこなす上で大事なことではないかと思います。

遠望不明瞭2005年07月29日 23:42

Windows VistaにJIS X 0213:2004対応の新日本語フォント「メイリオ」 (Internet Watch)という記事が出ています。

〔Microsoft製品に〕これまで搭載されてきた日本語フォントの字体は、基本的に1990年改正のJIS規格による例示字体と同じもので、一般の書籍類で用いられている字体との間に不整合が生じていた。こうした問題を解消するために、JIS2004では「鴎」や「葛」などの字体を変更している。

ひとつめの文は正しい。しかし、ふたつめの文は誤りです。まず「鴎」の字体はJIS2004でも相変わらず「鴎」で、変わりありません。「區鳥」の字体は別の符号位置に追加されたものです。字体の変更ではありません。また、「葛」の例示字形は変更されましたが、変更前の字体でも規格に適合します。つまり、どちらの字体で表示しても良いのです。これもやはり、規格による「字体の変更」ではありません。

フォントを「表外漢字字体表」に則って実装することは、従来の規格でもできました(ただしJIS X 0208では表外漢字字体表の全ての字を表すことはできません)。また、表外漢字字体表に則ったからといって、JIS2004に対応というわけではありません。表外漢字字体表に則らなくてもJIS2004に適合することはできるからです。つまり、表外漢字字体表に則ることとJIS2004の規定に適合することとは独立した事柄なのです。

文字コード規格の例示字形はあくまで「例示」でしかありません。しかし上のInternet Watchの記事に見られるように、そのことはよく理解されていないようです。

ではなぜ理解されていないのでしょうか? ひとつにはフォントの実装者や(上記記事のような)ジャーナリズムの怠慢もあるでしょう。しかし、ことJIS2004に限っては、規格改正のあり方が誤解を助長したことも否めないのではないかと思えます。

JIS2004では、表外漢字字体表にあわせて例示字形の変更が行われました。この変更は、規格の技術的内容を変えるものではありません。つまり、実装はこの変更に追従しなくとも新しい版の規格に適合するのです。

ではなぜわざわざそのような変更をしたかというと、「誤解に基づく実装の変更」を誘ったものと思われます。規格本文を良く読めば、規格票通りの字形でなくても規格に適合することはわかります。しかし、多くの実装者は例示字形をnormativeなものとみなして(即ち、誤解して)例示字形に近い形に実装するだろう──。そういう意図が働いていたのだと思います。JIS2004改正時に字体の変更を(規格への適合性に影響しないにも関わらず)宣伝していたのもそのような影響を期待してのことなのでしょう。

このような規格改正は、規格の利用者に規格の読解力がないものと想定している点で悪質なものといえるでしょう。そもそも、JIS2004改正の始まりからして、表外漢字字体表どおりのフォント実装を文字コード規格の改正で実現しようという、誤った方針で主導されたものでした。

本来、フォントをどう実装するかということは、文字コード規格だけで決められるものではありません。表外漢字字体表に則った字体を採用させたいなら、そのためのフォント設計の指針をJISなり何なりにすべきでした。そういう見識がJIS関係者に無かったとしたら、誤った認識の持ち主が規格を改正し、規格を読まない実装者とジャーナリストが誤解を拡大再生産し、その一方でJIS97以来の遺産である精緻な規格本文が空文化していくという反知性の共犯を止める術はないのでしょうか。

奇しくも、新しいフォント「Meiryo」が搭載されるのは「Windows Vista」です。このフォント発表の報道を読むと、文字コードの世界の遠望(vista)は不明瞭(不-meiryo)との思いを抱かざるを得ません。