Googleはなぜ的確に探せるのか?
「1兆ページ以上」といわれる世界中の膨大なWebページの中から、目的の情報を的確に見つけ出すGoogleの検索サービス。日々、当たり前のように利用しているGoogleの検索エンジンがどのような仕組みで動いているか、ご存知ですか? 本連載では東京大学 情報基盤センター図書館電子化研究部門 助教の清田陽司氏が解説します。
2009年07月03日 12時46分更新
-
第6回 2009年07月03日 12時46分
WebPro
悟空、単語辞書を手に入れる
検索エンジンを作るには、コンピュータに単語の区切りを正しく「解釈」させる必要がある。どのような方法があるのだろうか。
-
第5回 2009年04月22日 08時00分
WebPro
悟空、秘技「分かち書き」を習う
検索エンジンは人間が使うもの。パソコンだけではなく、人間の都合も考えて検索エンジンを作るにはどうしたらよいのだろうか。
-
第4回 2008年12月26日 08時00分
WebPro
悟空、キーワードを瞬時に見つける
大量のキーワードの列から目当てのキーワードを探し出す「二分探索法」の欠点を補うにはどうしたらよいのでしょうか? 今回は、偏ったデータを均等に分割し、すばやく検索できるようにする「ハッシュ表」を紹介します。
-
第3回 2008年12月15日 17時25分
WebPro
悟空、キーワードを電光石火で切り出す
転置インデックスの仕組みを使って検索システムを作るには、文書の文字列から「キーワード」を切り出さなくてはなりません。そもそも、コンピュータにとっての「キーワード」とは何でしょうか? 今回はそんな疑問から考えてみましょう。
-
第2回 2008年12月08日 08時00分
WebPro
悟空、秘剣「転置インデックス」を手に入れる
Googleはなぜ、あれほどすばやく目的の情報を探せるのでしょうか? ヒントは、私たちが本で調べ物をするときに使っている「索引」にありました。今回は、パソコンが索引を使って文書を検索する仕組みに迫ります。
-
第1回 2008年11月15日 08時00分
WebPro
悟空、村の中で文書を探す
「1兆ページ以上」といわれる世界中の膨大なWebページの中から、目的の情報を的確に見つけ出すGoogleの検索サービス。日々、当たり前のように利用しているGoogleの検索エンジンがどのような仕組みで動いているか、ご存知ですか? 本連載では東京大学 情報基盤センター 図書館電子化研究部門 助教の清田陽司氏が解説します。