インターネットで調べものをするとき、GoogleやYahoo!を使っているだろう。これらの検索サイトは、知りたいことをただ調べるのには役立つが、その上で検索ワードに関する現在の注目傾向が分かると便利だ。ソフトウェア開発者として世界的に評価が高い奥一穂さんが、ページの視聴率が分かるランキングポータルサイト「Pathtraq」を開発した。Pathtraqによって、どのような情報を手に入れられるようになるのかを聞いた。
Google検索の価値は資料性、Pathtraqは時事性
従来の検索サイトで、最近市場から撤退することが決まった「HD DVD」を検索すると、Wikipediaや用語辞典サイトのHD DVDの項目、HD DVDの推進活動をしている団体のサイト、東芝のサイトなどが上位に表示される。これらの検索結果の並び順はいつでもほぼ固定で、新しい情報を得たい場合には、URLを指定してニュースサイトだけを検索対象にするとった工夫が必要になる。それに対してPathtraqは、入力された単語を含むページの中で、多くの人に参照されているものを上位に表示されるようになっており、単語に関しての現在注目されている内容から知ることができる。
「PathtraqでHD DVDを検索すると、現在ならHD DVDの撤退などのニュースが上に表示されます。Google検索の価値が『資料性』だとすると、Pathtraqの価値は『時事性』ということになります。時事性を重視した検索には、Googleニュース検索やブログの検索エンジンなどもありますが、これまで記事の注目度でランク付けをしたものはありませんでした。Googleなど現在広く使われている検索エンジンのアルゴリズムは、リンク数などでランキングを出すので、ページの内容のアクセス数は分かりません。なので、アップされて数時間のページに対して、注目度を考慮した検索結果を出すことができませんでした。そこで、アクセス数の推移やページに書かれている単語を組み合わせることで、即時性のある検索エンジンを作ろうと考えたのです」
Pathtraqでは、ユーザーのWebブラウザの専用のプラグインをインストールしてもらい、アクセスログを送信してもらうことで情報を集めている。1時間ごとに集めたログから、あるURLを何人が見たのかという情報を、通算のヒット数や6時間以内のヒット数、24時間以内のヒット数という形で、ランキング表示している。
この連載の記事
-
第4回
ビジネス
ライブドアの社内事情~コンペ発の初サービス「fixdap」で得たものとは~ -
第3回
ビジネス
グーグルにはグーグルのやり方がある! 「モバイルGoogleマップ」 -
第2回
ビジネス
開発者とは“やったもの勝ち” NTTデータのOSS「Hinemos」 -
第1回
ビジネス
SaaS型Webメール開発者に聞く~フィードパス「feedpath Zebra」~ -
ビジネス
エンジニア・インタビュー - この連載の一覧へ