「コンピューター上で外国語や旧漢字をどう扱うか」---こんな問題が、数年前から話題になっている。インターネットの普及に伴って諸外国とメールなどのやり取りが急増したが、その際問題となるのは、“文字化け”だ。コンピューター世界での文字表示問題について、9日にセミナーが開かれた。講師は『文字コードの世界』(東京電機大学出版局)執筆者の安岡孝一氏(京都大学大型計算機センター研究開発部助教授)である。
安岡孝一氏 |
セミナーでは、ヨーロッパ、日本、中国、台湾、韓国で使用されている文字コードについて説明した後、世界の国々で使用されている文字コードを統一しようという試み“Unicode”の現状や今後の見通しについて紹介した。
現在世界で用いられている文字コードの基礎は、'63年に誕生した“ASCII”*である(これは7ビット**で1文字を表すものであり、基本的に電子メールなどはこれを使用している)。
*American Standard Code for Information Interchange
**ビットは2進法における桁。7ビットは2進法で7桁になる。
安岡氏はこのASCIIをもとに、各国が苦心惨憺(さんたん)して自国語の文字コードを作成してきた過程を説明した。特に日本の文字コードには、何度も変更が加えられたため、非常に複雑になったという。また、各国の文字コードの間にはまったく互換性がないので、使用言語が多岐に渡るヨーロッパでは文字化けが絶えなかった。
編集部注:各国の文字コードを統一して扱うために、ISOによる文字コードの標準化が進められた。そこでは、文字セットを指定し、その文字セット内での定義に従って文字コードで文章をつづる。同じ文字コードでも、ロシア語文字セットの中で使う場合と、スペイン語文字セットの中で使う場合とでは、別の文字を示すことになる。しかしこれでは、文字セットの指定をしないで(国内では通常同じ文字セットを使うので、文字セットをわざわざ宣言する必要はない)別の国に文書を送ると、相手国の文字セットで表示されるため、文字化けがおきる。また、1つの文章の中に2カ国語を混在させることが難しくなる。
こうした問題を解決しようと、'85~86年ごろからヨーロッパで開発されはじめたのがUnicodeである。セミナーではこのUnicodeのメリットとデメリット、そして10月に発表される予定のUnicode3.0が紹介された。WindowsもMacintoshも、今後はUnicodeを実装していくという。また、10日に規格が決定されるJISの新しい規格についても紹介した。
安岡氏自身は、「増加・変更が必至である文字コードを、統一しようという試み自体に無理があるかもしれない」としつつも、今後はUnicodeが文字コードの主流となるだろうと予測した。また、安岡氏も開発に大きく関わったというShift_JISについても、広く普及することを期待したい、とセミナーを結んだ。
JPC(Japan Publishing Consortium)は、デジタルによる出版の世界においての情報交換の場を作る会で、月に1度のペースでセミナーを開催している。