「アイヌ文字」?2006年05月16日 21:00

Windows VistaのフォントについてのIT Proの記事を読んで、引っ掛かった表現がありました。

MS Fontバージョン3では,約900文字の漢字や約200文字の非漢字(英語の発音表記などに用いられる音声記号やアイヌ文字など)が表示可能になる。

(強調引用者)

この「アイヌ文字」という表現です。

この記事で言いたいのは、JIS X 0213に収録された、アイヌ語表記に使われる片仮名のことなのでしょうが、それを「アイヌ文字」と呼ぶとちょっと違和感を覚えます。

アイヌ文化は元々文字を持ちません。だから「アイヌ文字」と呼べるような固有の文字体系はありません。記録するための便宜として、アイヌ語を書き留めるのに片仮名が使われるわけですが (ラテン文字で書くこともあります)、日本語と異なるアイヌ語を書き表すのに普通の片仮名ではうまく書けない音があります。そこで、片仮名を小書きにしたり、半濁点をつけたりといった工夫がされてきたわけです。

そういうのはあくまでも「アイヌ語を書くために工夫した片仮名」であって、「アイヌ文字」とは呼びにくいのではないかと思います。私はアイヌ語の専門家ではありませんが、アイヌ語のテキストや一般向けの書籍でも、片仮名を指して「アイヌ文字」とはいわないようです。

ちなみにGoogleで「アイヌ文字」を検索すると、神代文字の類いとしてこの言葉が使われているのがでてきます。これが何なのかは私は知りません。

Windows VistaはJIS X 0213:2004に対応しないらしい2006年05月23日 23:30

文字の海、ビットの舟」などの報道によると、Windows VistaはJIS X 0213に対応したフォントを搭載するものの、JIS X 0213の符号化方式にはまだ対応していないようです。これでは、JIS X 0213:2004に対応とは言えませんね。

そもそもJIS X 0213のような符号化文字集合規格というものは、文字の集合を定めてその各文字に対応するコード値を定義する規格であるわけです。例えば、JIS X 0213では「亜」という漢字に対して「x0110000 x0100001」というビット組合せ (MSBは呼出し先がGLなら0、GRなら1) を定義しています。こうした符号化表現を用いないのであれば、符号化文字集合を採用したとは言い難い。

同様の理由で、「WindowsはJIS X 0212補助漢字に対応している」という命題も偽となります。実態は、JIS X 0221の実装において、JIS X 0212相当の文字のレパートリーに対応している、といったところでしょう。

符号化文字集合規格は、(符号化と無縁な) ただの文字集合の規格ではないし、ましてや漢字の字体の規格ではない。そこのところの区別をはっきりさせることが大事ではないかと思います。

ちなみに私が普段使っているEmacs (+Mule-UCS) は、JIS X 0213の本体で定義されている「国際基準版・漢字用8ビット符号」の符号化表現に対応する、正しいJIS X 0213の実装です (2004年改正の追加10文字には対応していませんが…)。

マイクロソフトが標準を尊重していたら2006年05月31日 23:31

文字の海・ビットの舟によると、マイクロソフトは文字コードの標準に基づいてソフトウェアを実装してきたのだそうです。この連載が面白いのは、こういった関係者の声が聞けることで、これなども大変ユニークな意見と聞こえます。

  • マイクロソフトが文字コード標準を尊重していたら、機種依存文字の文字化けに悩まされることもなく、「機種依存文字は文字化けするので使わないで下さい」とお願いする手間が省けていたことでしょう。
  • マイクロソフトが文字コード標準を尊重していたら、WindowsにおいてJIS X 0208からJIS X 0213への移行がスムーズに行え、今ごろは、とっくに、より多くの人がJIS X 0213の恩恵を受けていたことでしょう。
  • マイクロソフトが文字コード標準を尊重していたら、Unicodeとの変換で波ダッシュ(〜)が文字化けするなどという馬鹿らしい問題 (MS-Unicode問題) は起こらず、より容易にUnicodeが使えたことでしょう。
  • マイクロソフトが文字コード標準を尊重していたら、シフトJIS (というかCP932) の中に同じ記号が重複符号化されているなどということはなく、意味不明の文字化けに遭遇することはなかったでしょう。

もしこれからマイクロソフトが文字コード標準を尊重するようになるのなら、大いに歓迎します。