第4水準漢字をニュースで見る2009年04月20日 00:27

第三種郵便を悪用した事件のNHKテレビ報道で、JIS第4水準漢字を見かけました。宇という漢字の異体字で、𡧃という文字です。2-5-94。UCSではBMP外にあります。SKKのJIS第3・第4水準漢字辞書を使えば「う」という読みから変換できます。

ニュースサイトでは宇という字を使っているようです。新聞はまだ見ていません。

月配列で拡張仮名2009年02月08日 12:44

ここしばらく、月配列という仮名入力キー配列にこっています。この記事も月配列で入力しています。

Emacsを使うときはもっぱらSKKで漢字変換しているのですが、このSKKを使って月配列で入力できるようにしてみました。その方法を「SKKで月配列を使う」というページにまとめています。

上記のページの「おまけ」というセクションに記しているのですが、月配列で入力の際にJIS X 0213の拡張平仮名・片仮名を打鍵できるようにしてみました。月配列は濁点・半濁点が後付けなので(JIS仮名配列同様です)、たとえば「う」の後に濁点を打てば「濁点つきの『う』」が、「か」の後に半濁点を打てば「半濁点つきの『か』」が入力されます。

これまでもSKKの設定ファイルでローマ字入力の定義をいじればこれらの文字を入力できたのですが (もちろん、JIS X 0213の符号化方式に対応したMule-UCS等の準備が前提です)、鼻濁音の仮名などはうまいローマ字定義ができませんでした。半濁点を後置する月配列では自然な入力が可能です。そのかわり、アイヌ語用の小書きの仮名はちょっと苦しい入力方法になりますが…。

ともあれ、これでまたひとつ新JIS漢字実践ライフに広がりが出るというものです。

Ruby 1.9の多言語化2009年02月08日 12:31

Rubyist Magazine 25号にRuby M17N の設計と実装という記事が出ています。1.8まではSJISやEUCやUTF-8が一応使えますよという程度だったRubyが1.9ではじめて導入した多言語対応の機構の解説です。

Unicodeを使ったUCS normalization方式が全盛を極める中、CSI方式を採用しているのが興味深いところです。

Ruby 1.9.1が対応しているかどうかは知りませんが、原理的にはEUC-JIS-2004やShift_JIS-2004をネイティブに (Unicodeとの変換でなく) 処理することも可能なはずです。

前のバージョン(1.8系列)からメソッドの挙動が非互換に変わっているものがあるのが気になりますが、この記事を読んだらRuby 1.9.1を使ってみたくなりました。