文字コード「EUC-JISX0208」の提案2006年09月06日 22:37

EUC-JPからJIS X 0212を除いたコード系、いいかえればJIS X 0208の「国際基準版・漢字用8ビット符号」にJIS X 0201片仮名を付け加えたコード系を、「EUC-JISX0208」として定義してはどうでしょうか。

そんなことをして何が嬉しいかというと、EUC-JISX0208がEUC-JISX0213 (EUC-JIS-2004) のサブセットとして扱えるということです。

Shift_JISX0213 (Shift_JIS-2004) はShift_JISの上位互換なのに、EUC-JISX0213がEUC-JPの上位互換でないのはどうもイマイチな感じがします。ならば、実態としてほとんど使われていないJIS X 0212をEUC-JPから除いてしまえば、EUC-JISX0213のサブセットとなってすっきりするというわけです。

また、JIS X 0213で「国際基準版・漢字用8ビット符号」にJIS片仮名を追加して「EUC」にしていますが、これと同様のやり方で「JIS X 0208版のEUC」を定義することになり、規格をまたがっての一貫性も確保できることになります。

ひとつ迷っているのは「EUC-JISX0208」という命名が妥当かどうかということです。JIS X 0213のEUCが2004年改正で「EUC-JIS-2004」になってしまったので、名前が整合しないのがいまいち美しくないなあ、ということです。「EUC-JIS-1997」というのも考えましたが、別に1997年に制定したものでもないしなあ……と思案に暮れています。

「レガシーエンコーディング」という用語の政治性2006年09月09日 16:19

Unicode以外の文字コードを指して「レガシーエンコーディング legacy encoding」と呼ぶことがあります。この言葉には、世の中全部をUnicodeにしたいという意図がうかがえます。政治性を帯びた用語であり、あまり好ましくない印象があります。

コンピュータの世界で「レガシー」といえば、メインフレームで構築したシステムを指して「レガシーシステム」と呼ぶことがあります。これはUNIX等のオープン系のシステムと対比させた言葉で、オープン系へ移行されるべきものというニュアンスをただよわせています。

本来レガシーという言葉には否定的な意味合いはない筈なのですが、コンピュータの世界では「過去の遺物」的な使われ方をされることがあるようです。

いわゆる「レガシーシステム」の利用者自身がそれを過去の遺物だと思っているならまだしも、メインフレームの信頼性を気に入っている利用者に「おたくのレガシーシステムをマイグレーション(移行)しましょう」などと売り込みに行けば顰蹙を買うのは当然の話です。無神経なレガシーよばわりには手痛いしっぺ返しが待っていることもあるわけです。

Unicode信奉者の使う「レガシーエンコーディング」なる用語も、Unicodeに移行させたいという非技術的・政治的な思惑から出たものであって、思慮深い大人の使うべき言葉としてはちょっとどうなのかと思うのですがいかがでしょうか。