このページの本文へ

TRONプロジェクト、13万字の文字コードを集めた文字情報サイト“TRON文字収録センター”を年内開設

1999年12月01日 00時00分更新

文● 編集部 伊藤咲子

  • この記事をはてなブックマークに追加
  • 本文印刷

東京大学教授の坂村健氏が主催する“TRONプロジェクト”*は30日、(社)TRON協会*の主催する研究会の中で、13万字の文字コードを集めた情報サイト“TRON文字収録センター”を年内に開設する見込みだと発表した。これは、出版や文字コード業界関係者を対象にこの日開催された同団体のセミナー“多文字・多漢字・多国籍OS応用研究会”において、坂村教授が講演で言及したもの。JIS第1水準/第2水準やUnicodeをはじめ、あらゆる文字を収録するデータベースを構築し、公開するという。

*
TRON(トロン:The Real-time Operating system Nucleus)Projectは、'83年に提出された(社)日本電子工業振興協会(JEIDA)の国内のコンピューター開発ビジョンに関する報告書を受け、'84年に東京大学教授の坂村健氏らが中心となり発足した産学共同のプロジェクトである。社団法人TRON協会は、'88年に設立された。

坂村健教授 坂村健教授



このサイトの構想は、パーソナルメディア(株)がBTRON仕様のパソコン用OS『超漢字』を9月にリリースしたことが1つの契機となっている。『超漢字』は、TRONプロジェクトで推進する148万字を扱えるという多国語文字コード体系“TRONコード(TAD)”を採用。トロンコードに対し、漢字、ラテン文字、梵字など世界各国の文字約13万字*のコード割り当てがなされているのが特徴。

超漢字に含まれる文字セットは、JIS第1/第2水準、JIS補助漢字、韓国語(漢字/ハングル)、中国語(簡体字/伝統字/繁体字)、6点点字、8点点字、大修館書店刊『大漢和辞典』収録の約5万字、今昔文字鏡に収録されている約2万8700文字(字喃、甲骨文字、梵字など)、Unicode 2.0収録の約6600文字(技術記号や通貨記号、ラテン、ギリシャ、キリル、ヘブライ、デヴァナガリ、タイ、チベット語など)

“TRON文字収録センター”のサイト開設時にはTADの割当が済んでいるこの13万文字を掲載する。さらに、ここに含まれていない文字について、同サイトを通じて一般から申請を受けつけ、文字の形や典拠、よみ、意味、著作権などを確認した上で、随時コードの割り当てやフォントの作成を行なうという。

TRONプロジェクトは、これまで多言語開発環境の構築を1つの研究テーマにしてきたが、今回の構想に至る経緯について、坂村教授は以下のように述べている。

「一般的によく知られている文字コードであるJIS X0208で登録されている漢字は、6355字。これに対し、日本で使われている漢字は異字体も含めると10万ぐらい存在すると思われます。漢字を使用する国は日本以外にも、中国、韓国、ベトナムなどいくつか存在します。これは私見ですが、これらの国も同様に、それぞれ10万程度の漢字が存在するでしょう。現在、コンピューターで使われている文字コードでは不十分ではないかと考えました」

「例えば、中国語と日本語をチャンポンで使用したいと思ったとしましょう。Windows 日本語版で、中国語で使用されている多くの漢字はデータ変換できないし、逆に中国語版では、日本語で使用されている多くの漢字のデータ変換ができない。フォントパッチンを使用するなど、苦し紛れのテクニックはあります。しかし、ネットワークを使って人にメールをおくったり、データ交換したりすると、結局ボコボコと不具合が出てきます。このように、“外字”という扱いでは、電子的に文書を渡す際に支障を来たしてしまいます」

「根本的にこの問題を解決するために、TRONプロジェクトでは、あらゆる文字に対しコードを振ろうと考えています。TADは、さまざまな文字セットで扱っている文字を収録するにあたり、そこに含まれている文字を全て対象にしているので、場合によっては1つの文字にいくつかのコードが割り当てられているかもしれません。しかし、それは何と何が重複しているといった情報を加えることで、問題がクリアされるでしょう。コードが重複していることよりも、コードが割り当てられていない方が問題と考えます」

「“TRON文字収録センター”ではスタート時に収録する13万字に加え、コードが割り当てられていない文字の申請を一般から受け付ける予定ですが、それがどのくらい来るかはまだ予想がつきません。新たに追加された文字は、『超漢字』の次期バージョンにフィードバックされることもあるでしょう」

会場ではパーソナルメディアによる『超漢字』のデモも行なわれた
会場ではパーソナルメディアによる『超漢字』のデモも行なわれた

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン