UCSの包摂規準を明確化する試み2007年03月24日 18:57

漢字データベース計画の「UCSにおける包摂規準(α版)」が素晴しいです。JIS X 0213の包摂規準をベースにISO/IEC 10646 UCS (といわれてピンとこない人は、Unicodeのことだと思っていいです) の漢字集合の包摂規準に相当するものを作成しようという試みです。

これは、ISO/IEC 10646の規格の中に盛りこまれて然るべき内容であると思います。規格で規定されて、電子データの形でも入手できるようになれば、文字の入力や検索の際の役に立つことでしょう。こうしたデータが完備して初めてUnicodeは使いものになるのではないでしょうか。

それにしてもこれ、規格票を目で追って手作業で作っていたら死にそうになると思うのですが、どのように作業しているのかが興味深いところです。そこは "Kanji Database Project" だけに、きちんと作業インフラが整っているのでしょうか。

コメント

_ 安岡孝一 ― 2007年03月31日 17:44

『字形IDSデータ』でまずあたりをつけているものの、それから後は「目で追って手作業」のようです。川幡さん、からだ大丈夫なんだろうか…。

_ やの ― 2007年04月02日 10:51

うう、それはすごいですね。考えただけで気の遠くなるような話です。

トラックバック