このページの本文へ

悟空、村の中で文書を探す

2008年11月15日 08時00分更新

清田陽司/東京大学 情報基盤センター 図書館電子化研究部門 助教

  • この記事をはてなブックマークに追加
本文印刷

「1兆ページ以上」といわれる世界中の膨大なWebページの中から、目的の情報を的確に見つけ出すGoogleの検索サービス。日々、当たり前のように利用しているGoogleの検索エンジンがどのような仕組みで動いているか、ご存知ですか? 本連載では東京大学 情報基盤センター 図書館電子化研究部門 助教の清田陽司氏が解説します。

 私はここ数年間、欠かさずにパソコンで日記をつけています。といってもおおげさなものではなく、今日何をしたのか、どこに行ったのか、誰と会ったのか、思いついたアイディアを箇条書きにするだけです。当初は仕事上の必要に迫られてつけはじめたのですが、パソコンで日記をつける大きなメリットに気づいてからはやめられなくなってしまいました。

 たとえば、土曜日の夕方に久しぶりに再会する友人と食事をする約束をしたとします。「せっかくの機会だから美味しい店で一緒に食事を楽しみたいなあ。できればスパゲティにしようか」と思うのですが、なかなかいいお店が思い浮かびません。こんなとき、書き留めておいた日記のファイルを開いて、「スパゲティ」というキーワードを検索ボックスに入力して探していくと、「2002年9月○日 銀座のイタリアンABCで△△君とスパゲティを食べた」という記録がみつかりました。「そういえばここのカルボナーラは絶品だったなぁ」ということを思い出してWebで検索してみると、そのお店はまだ健在です。かくして2人とも銀座の夜を満喫できたのでした。日記を探さなければ、たぶんそのお店を思い出せなかったでしょう。

 このように、ノートに書かれた日記を1枚1枚めくって探すのとはまったく違う探し方ができることで、いろんな可能性が生まれてくるのです。

 「大量の文書を蓄えておく」というパソコンの使い道は、人類と情報のかかわりの歴史における革命だ、と私は思っています。グーテンベルグによる近代印刷術の発明以来の大革命といっても過言ではないでしょう。もちろんパソコンの使い道は文書を蓄えておくだけではありません。会社で売上高のグラフを作ったり、大学の研究室でシミュレーション実験をしたり、自宅でオンラインゲームを楽しんだり、レンタルした映画のDVDを見たり、海外の親友とSkypeで話したり……。まさに万能のコンピューターです。電卓、デジタル時計、電子マネー、携帯電話、DVDデッキ、炊飯器、エアコン、自動車、飛行機……。現代社会にあふれる他の電子機器のように、使い道があらかじめ決められているのとは大違いです。

 では、紙の上に書かれていた文書がパソコンの中に蓄えられることで何が変わったのでしょうか。ひとつずつ見ていきましょう。

1.膨大な文書を収納できるようになった

 パソコンには「大量のデータを記憶する」機能があります。パソコンが記憶できるデータの量は爆発的に増えてきていて、現在市販されているパソコンは、100 ギガバイトを超えるデータをハードディスクに貯めておけます。100ギガバイトは、約300億文字もの日本語の文書に相当するデータ量です。新聞の朝刊1部に含まれる文字数を約20万文字とすると、400年分以上の新聞記事すべてを収納することができるわけです!想像できますか?

2.編集が簡単になった

 パソコンやワープロが出現する以前、文章の校正は大変な作業でした。パソコンで文章を書けば、簡単に挿入・削除ができますから、校正の効率が飛躍的に向上しました。

3.他の人とのやりとりが簡単になった

 パソコンを使って書いた文章は、さまざまな形で相手に伝達できます。たとえば、転勤のあいさつ文をパソコンで書けば、ハガキに印刷して郵送したり、FAX で送信したり、電子メールで職場の全社員にも送れます。自分のホームページ上に載せてもいいでしょう。

4.検索が簡単になった

 机の上に積み重ねられた書類の山から必要な書類を探し出すのに苦労した経験は誰にでもあるでしょう。一方、パソコンの中に蓄えられた文書であれば、キーワードを手がかりに一瞬で探し出せます。文書をパソコンに蓄えるようになったことで起きた変化のなかでも、「必要な情報を一瞬で探せる」のは革命といってもいいでしょう。


 それでは、「膨大な量を収納できる」「編集が簡単にできる」「他の人とやりとりできる」「検索が簡単にできる」というパソコンの能力は、いったいどうやって実現されているのでしょうか?

「ちょっと待った、オレはGoogleの仕組みが知りたいんであって、パソコンのことはどうでもいいよ」――はい、そうおっしゃる気持ちはよくわかります。できれば私も検索エンジンの仕組みの説明に早く移りたいわけです。でもそう焦らないで。Googleのような巨大な検索エンジンも、実は何十万台というパソコンが組み合わさって出来ているんです。「ええっ?!」

 Googleは的確に探せるのが凄いと思われていますが、私は、膨大な数のパソコンを組み合わせることで、1台のパソコンの能力を究極まで引き出していることが本当の凄さだと思っています。まずは1台のパソコンがどんな能力を持っているのかを理解すると、検索エンジンの仕組みもより深く理解できるはずです。

 この連載では、「大量の文書を扱う」能力がどこからきているのかを、パソコンの仕組みから説き起こしていきます。パソコンの仕組みについてすでに理解されている方にとっては退屈な説明になってしまいますので、適当に読み飛ばしてかまいません。「そういえばパソコンの仕組みってあまり知らなかったな~」という方は、ぜひお付き合いください。いままで「けったいなヤツだな~」と思っていたパソコンのことが、ちょっと身近で面白い存在に思えてくるかもしれません。


次ページ:そもそもパソコンっていったいなに?

担当編集者より

Googleの連載タイトルがなぜ「悟空」? この連載では、西遊記の三蔵法師一行がさまざまな苦難を乗り越えていくように、Googleのような検索エンジンがどのように作られているのかを清田陽司先生に解説していただきます。「Google」と「悟空」。何となく読み方も似ています。悟空ことGoogleの冒険を最後までお楽しみください。

Web Professionalトップページバナー

この記事の編集者は以下の記事をオススメしています

ASCII.jp会員サービス 週刊Web Professional登録

Webディレクター江口明日香が行く