「シフトJIS 2.0」でJIS2004を乗り切る2006年12月07日 22:28

Windows Vistaを契機に、Shift_JIS-2004の再評価が行われるのではないでしょうか。しない方がおかしい。

考えてもみてください。Unicodeでは、今まで漢字が2バイトで済んでいたのが、4バイトの漢字も出てくる。また、1文字を表すのに、結合文字を使って2つのコードポイントを使わなければならないケースも新たに出てくる。今までそんな想定はしていないから、困るわけです。

これがShift_JIS-2004だとどうか。全部「1文字 = 2バイト」で済むわけです。今までと変わりありません。どうみても、Shift_JIS-2004の方が扱いやすいわけです。

もちろん、今までの機種依存文字は文字化けします。ですが、忘れてはいけないのは、機種依存文字はこれまでも化けてきたし、いま現在も化けているし、たぶんこれからも化け続けるのです。いま現在も、というのは、Googleの検索結果やBloglinesに表示されるRSSフィードなんかをよく見ていると分かります。機種依存文字の箇所は文字化けするんです。もう、機種依存文字 (CP932, MS932, Windows-31Jなど) は止めませんか。ベンダ非依存の、よく練られた標準 (Shift_JIS-2004)を使うのが良いわけです。

そう考えていくと、Shift_JIS-2004というのは、現在の問題を解決する次世代シフトJIS、「シフトJIS 2.0」なんだというのが分かってくる。PythonRubyGaucheといった先進的な言語では既にShift_JIS-2004を扱えるようになっています (GaucheはJIS2000かもしれない)。

一番の課題は、MS製品がこの「シフトJIS 2.0」に対応していないことでしょう。MS製品が新規格に対応すれば問題ないのですが、そうでなければ、MS製品をわきにおいといて世の中がうまく回るような仕組みを作っていく必要があるのかも知れません。