このページの本文へ

悟空、秘技「分かち書き」を習う (2/3)

2009年04月22日 08時00分更新

文●清田陽司/東京大学 情報基盤センター 図書館電子化研究部門 助教

  • この記事をはてなブックマークに追加
本文印刷

 「根拠なんてないんじゃない? 世界中でそういう約束になっているんだからしょうがないよ」――そう、明確な根拠はありません。社会の中で、みんなが「『G』は『47』で表すことにしましょう」と合意しているだけなのです。ことばもまったく同じです。先ほどの地図のように、「京都」という文字列から「近畿地方の一部」を思い出せるのは、現代の日本人のみんなが「あの場所は『京都』と呼ぶことにする」と合意しているからです。こうした、結びつきに完全な根拠がなく、「みんなの合意」というあやふやなものによって結びつけられていることを、ソシュールは「恣意的」という用語で表現しました。

 「京都」という文字列を構成する「京」や「都」という漢字にはもともと「政治の中心都市」の意味があって、あの場所が歴史上の中心都市であることも表しています。その意味を表すだけならば、「京」や「都」の漢字1字だけで十分ですよね。しかし現代の日本人にとって、現代的な大都市としてのあの場所はあくまで「京都」です。「明日新幹線で京に出張します」と言ったらちょっと変な感じに聞こえてしまいます。

 その理由は、「みんながそんな言い方を普通はしないから」としか説明できません。ソシュールの定義した通り、「京都」であって「京」「都」でないことには明確な根拠はないにもかかわらず、「みんなの合意」によって「京都」でなければならないのです。「京都」という文字列には、単に「京」「都」という文字が並んでいるだけではない、何となく、「意味のまとまり」みたいなものを誰もが感じます。ことばの真髄にちょっと近づいてきた感じがしませんか?

 ことばの真髄にさらに迫るため、もうひとつの例を示しましょう。下の図を見てください。「東京」という文字列が日本列島の東側、太平洋側にある湾の奥あたりの場所(X)を指しています。また、「都」という文字列が「1都1道2府43県」というグループのうちの1つ(Y)を指しています。さらに、「東京」と「都」、「X」と「Y」がそれぞれ結びついて、「東京」+「都」=「東京都」が「関東平野の一部分+太平洋の島々の区域」(Z)を指していることに注目してください。


 「東京」という場所が、「47都道府県」のひとつとして位置づけられることで、「東京」「都」にはない、新しい意味が出てきました。ことばの面白いところは、「記号表現同士が結びつくことで新しい意味が生まれる」ことです。

 ところで、「東京都」という文字列は「東」+「京都」とも分けられます。


 「東」は「東西南北」のうちのひとつを指しています。「京都」はすでに説明しました。しかし、「東」+「京都」=「東|京都」が指すものは何だかよく分かりません。もし「京都の東側、つまり琵琶湖のあたりだな」と言ったら、滋賀県や大津市の人に怒られてしまうでしょう。東京には「東久留米」という市がありますが、九州にある「久留米」(筆者の出身地です)からは1000km以上離れています。「東久留米」を「東」と「久留米」に区切ってしまったら、何を指しているのかよく分からなくなってしまいます。

 ここまで説明してきたように、ことばには「分割すると意味が失われるひとまとまり」、言い換えれば「意味をもつ最小単位」が存在します。本連載ではこの最小単位のことを「単語」と呼ぶことにしましょう。「京都」「東京」「東久留米」は、いずれも単語なのです。検索エンジンが「ことばの問題」という“人間の都合”を扱うには、まず単語について考える必要があるのです。

 単語の概念は、日本語だけでなく世界中のあらゆる言語に存在します。アメリカの大都市「New York」の名前を「New」と「York」に分けてしまったら、それはもはや大都市ではありません(「York」という地名はイギリスやアメリカ東部のペンシルバニア州などに存在します)。「York」についてのWebページを探している場合に、「New York」について書かれたページを検索結果として表示してしまうのは困ります。つまり「New York」は、単語すなわち「意味をもつ最小単位」といえます。


 (次ページ、『パソコンの都合』で単語を扱う」に続く)

この連載の記事

一覧へ

この記事の編集者は以下の記事をオススメしています