文字コードについても標準マインドを2006年08月01日 22:21

私はかつて、HTMLの標準化を追いかけていました。Netscape Navigatorがまだ健在で、「ブラウザ戦争」なる言葉が使われていた頃です。

当時はブラウザが勝手にHTMLに独自タグを追加することが行われていて、いかに独自タグでユーザを囲い込むかを競っていたような状況でした。そのような動きは結局、Webの相互運用性を損なうものであったので、標準化団体の定める仕様に準拠することが大事だという風潮が次第に広まってきました。

今では、標準にしたがったタグ付けをすることがWeb開発者のたしなみだという考えは、(控えめに言っても) 少なからぬ支持を得ていると言えるでしょう。

さて、HTMLと同様に、文字コードを標準に則って使うことも、データの相互運用性のために大事なことです。ここに疑いの余地は無いでしょう。

しかしながら、文字コードに関してはHTMLと異なり、事態はむしろ悪化しているのではないでしょうか? 私の印象では、機種依存文字で文字化けしたメールを見る機会は、以前よりも増えているように思えます。

それどころか、特定ベンダの機種依存文字や、標準と異なるコード変換(Unicodeとの間の)を擁護するような意見までも目にすることさえあります。

もし、「IEでしか見られないWebサイトを作るな」という人が同じ口で機種依存文字を擁護したとしたら、一貫性に欠けた、おかしなことだと言わざるを得ないでしょう。

HTMLだけでなく文字コードに関しても、JIS X 0208やJIS X 0213といったベンダ中立な標準を尊重することが、異なる製品間の接続が当り前であるインターネット時代、オープンソース時代の常識であるべきではないでしょうか。

Web日記でJIS X 0213を実践する2006年08月07日 21:12

本来このブログに書くべきなのだろう内容を、個人的なWeb日記の方に書くことがときどきあります。

なぜなら、Emacsで書いてHTMLに変換というプロセスを踏むと、JIS X 0213の文字が至って自然に入力できるからです。Webブラウザのインタフェースから入力するブログシステムではなかなかこうはいきません。

私は日記本文を書くのにEmacsとSKKを使って、思うがままにJIS X 0213の文字を入力し (扱いはJIS X 0208と全く同じです)、nDiaryでHTMLに変換する際にescapeX0213フィルタを使ってX0208外の文字をHTMLの文字参照に置き換えています。

こうして書いたWeb日記の記事には、例えば以下のようなものがあります。

この環境で快適に使えているので、古風なWeb日記スタイルでの新JIS漢字の実践をやめることは当分ないでしょう。

JISとUnicodeの妥当な変換とは2006年08月16日 10:42

実に6年ぶりに、「JIS漢字とUCS (Unicode)の文字の対応・変換について」を小改訂しました。今回は、具体的なコード変換表を提供しているサイト (JIS-UCS 変換表JIS X 0213とUnicodeの対応表) ヘのリンクを付け加えました。

6年経っても、この文書の内容は古びていないことが確認できました。もっともそれは、世間の状況があまり進歩していないということでもあるので、一概に歓迎できるものではありませんが……。

この文書の根底にある考え方は、コード変換においては、単にコード値だけを見るのでなく、コード値に対応づけられた現実の文字の対応を調べることが重要だということです。

これはどんなコード間の変換であれ変わらない普遍的な原則ですから、時を経て実装が変わり規格が変わっても、応用のきく考え方です。

特定製品の実装にとらわれることなく、コード変換の普遍原理に基づいて発想し行動することが大切です。