このページの本文へ

公開レビューに参加を!小池和夫氏、JIS拡張漢字を語る

1998年11月09日 00時00分更新

文● 報道局 白神貴司

  • この記事をはてなブックマークに追加
  • 本文印刷

 JIS拡張漢字(7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合)の公開レビューが11月6日から始まった。この公開レビューはインターネットを通じて実施される。(株)聚珍社ディレクターズ・フラクションの校正者で、JCSオブザーバーである小池和夫氏に、JIS拡張漢字について語ってもらった。

----現在の文字コードが抱える問題点についてどうお考えでしょうか

 「“JIS漢字では文字が足りない”と誰かがいう。そのこと自体は間違いではありません。しかし、“実際にどの字がないのか”という議論の伴わないことが多く“批判のための批判”“議論のための議論”に陥ってしまっています」

 「一字一字の文字の具体的検討をすることなく、いきなり数万字の文字セットを持ち出す議論や、その内容を見ないまま“外国企業の陰謀説”をわめきたてるような悪質なデマがマスコミを通じて喧伝されて、文字コード問題を分かりにくくさせていることは事実です」

----文字コードには具体的にどのような問題があるのでしょうか

 「現在、文字コードの問題点として挙がっているものを整理すれば、

・実装上の混乱
・文字種の不足
・包摂規準の妥当性
ということになります。

まず、JISが規定していなかった記号類(丸付き数字や単位記号)を各メーカーが独自に実装してしまっているために起きている混乱。さらに、'83年の規格改訂で規格票の字形を変更したり、コード位置を入れ替えたりしたことを原因とする実装上の混乱。現在でも‘鴎’の偏が‘区’を旧字体にした字と、偏が‘区’になっている字などを例に挙げて語られますね」

 「次に、確かに不足している文字種はかなりあります。実装上の混乱にしても、文字種の追加によって解決できるものもあり、十分な追加を行えば文字コードへの不満はほとんど解消することになると思います。しかし、ここで注意しなければならないのが3番目の問題です」

 「“包摂”という用語については多くの誤解があります。ひとことで言えば“同じ字を同じ字だとする取り決め”。小学校の国語教育で“手偏の縦画ははねるが、木偏の縦画ははねない”などといった些末な(しかも誤った)字体認識を教え込まれれば、漢字に対する感覚は歪められてしまうのは当然かも知れませんが」

 「例えば手書きの原稿で、しんにょうの点の数に気をつけて書いたりはしないでしょう。ところが、印刷物ではそれを気にしている人が多い。“同じ字を同じ字だとすること”は文字コード以前の問題だと思います」

----JIS漢字拡張に際して重要視されていることは

 「今回のJIS漢字拡張で最重要視しているのは“使える規格”という点。そのため、必要な文字種はすべて採録し、典拠や用例の不明なものは採録しないということと、現在多方面で用いられているエンコーディングに配慮しました」

 「具体的には、(1)用例がある文字であり、(2)複数の独立ソースで用例が確認でき、文字として流通していることが確かな文字で、(3)文字として理解できる、という3つの条件で文字を収録しました」

 「符号化方法についても、パソコン環境でのシフトJISの実装に配慮するとともに、UNIX環境でのEUCの実装およびインターネット環境でのISO-2022-JPの実装にも配慮し、符号化方法についての公開レビュー案を作成しました」

 「JCSが追加漢字選定のために収集したソースは、日本電信電話株式会社電話帳(3245)、国土地理院1万分の1地図(13)、国土地理院2万5000の1地図(138)、国土地理協会・町字ファイル書き換え字(184)、神社本廳・神社名・祭神名(54)、新潮文庫CD-ROM外字(589)、青空文庫外字(53)、雑誌『群像』使用字(4)、歌舞伎番附(東京大学国文学研究室)(39)、酒造講本(日本醸造協会、第5版)(5)、 文部省学術用語集(6)、現行法律・勅令・政令(7)、弓道、国宝名、切韻(鉅宋広韻)韻目、韻鏡三十六字母等(42)、日本内経医学会(1066)、全日本鍼灸学会(130)、日本東洋医学会(156)、国立国会図書館(1428)、日本書籍出版協会書籍総合目録(288)、共同通信社の記事用例(55)、朝日新聞社の記事用例(451)、毎日新聞社の記事用例(91)、共同通信社(K-JIS)(365)、日本国語大辞典(小学館)(6682)、『大辞林』外字表(三省堂)(1342)、メインフレーム(IBM/富士通/NEC/日立)外字(10291)などである(数字は収集字種数)。ほかにも、大正新修大蔵経所収漢字(大蔵出版社)、『広辞苑』外字表(岩波書店御提供)、精興社外字表、産経新聞外字表、読売新聞外字表など」

 「さらに、委員会では現行の小・中・高校の教科書(全教科・約1500冊)を独自て画像データで扱い、手で書き写すことによる情報の劣化を最小限に抑えました。ここから単純な重複を除くと、1万2260字種となり、この中から前述の条件を満たすものを抽出し、さらに一字一字について確認作業を行ないました」

 「その結果約4000字種を選定しました。また非漢字についても別途検討し、約620字種を選定。合計は約4700字種で、これはシフトJISの実装に配慮した場合のぎりぎりの字種数となります(半角カナを廃止しない場合、4777字)。最初からシフトJISの実装という枠を決めて選定作業を行なったのではないので、これは偶然の一致ですが」

----公開レビューで寄せられた意見に対してはどのように対応されるのでしょうか

 「公開レビューの結果、委員会の見落としや収集の不備により、さらに追加すべき字種が確認されることも考慮に入れています。今回の拡張漢字が“すべての文字だ”と言うつもりはないのですから。漏れているものがあって当然で、そのために公開レビューを実施するのです。しかし“どこかに私の知らない何万字もの漢字があって、それが入っていないから駄目だ”などといわれても困ります」

 「公開レビューの期間は'99年2月末まで。この間に寄せられた意見を反映して、最終的な文字集合が確定されます。したがって、“足りない文字”等を要求することによって、誰もが規格の策定に参加することができるわけです。たとえ1字でも“この字が足りない”というものがあれば、どんどんお教えください」

 「今回のレビューでは、印刷物による公開資料は用意できませんでした。PDFはプリント可能ですから、インターネットに接続できない人のためには、自主的に資料のコピーを配布してくれるボランティアの方がいらっしゃれば幸いです。ただし、公開内容は必要に応じて更新されることがありうるので、注意してほしい」

 なお、小池氏は、11月3日付の『日刊デジタルクリエーターズ』に同様のコメントを寄稿している。

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン