文字コードに対する3つのスタンス2007年05月06日 12:19

文字コードについての意見や議論は、その人の立場によって立脚点や基本的なものの見方がかなり異なっており、そのことが相互の理解を難しくしていると感じることがあります。

私が考える3つのスタンスを図に表してみました。それぞれのスタンスをステレオタイプ的に描画すると以下のようになります。

プログラミング系

文字コードをバイト値として扱うことに詳しい。文字コードがどのような特徴を持っていればプログラミングが楽になるかという観点が強い。一方、コード値に対応する文字そのものがどう定義されているかにはあまり興味がない。文字の定義は規格を決めた人がうまくやっているはずだと考えている。「Unicodeさえあれば良い」と考えがちなのもこのタイプ。

フォント・活字書体系

フォント設計の微細なところまで知りつくしている。文字コード規格の例示字形に詳しく、常人には区別のつかないわずかな違いも見逃さない。フォント技術に詳しいが、文字コードはフォントによる字形表現のためにあるものととらえがち。包摂規準の意義を理解していることもあるが、「所詮は規格票の字形が全て」と達観する人も。

テキスト符号化系

紙の上などに表現された現実の文字を、文字コード規格に沿った形でデジタル化することに喜びを覚える。文書の符号化、書誌データベースの整備、仮名漢字変換辞書の開発などに携わる。文字を符号化するという意味において文字コード規格の根元的な利用者であるが、人数が絶対的に少ないのと言うことが難しいために彼らの声は世間に届きにくい。包摂規準を重視する。

どのスタンスが正しいということではなく、肝心なのは相互理解であろうと思います。

ちなみに私自身は、「プログラミング系」と「テキスト符号化系」の中間あたりに位置します。

これをお読みの方は、ご自身の立ち位置を振り返って、自分に足りない要素は何だろうかと自問してみるのも一興かと思います。