このページの本文へ

解説:Googleパーソナライズ検索、全てのユーザに適用へ

2009年12月08日 03時46分更新

記事提供:SEMリサーチ

  • この記事をはてなブックマークに追加
本文印刷

パーソナライズ検索(Personalized Search)とは、検索結果の適合性(Relevancy)を高めるために、ユーザの興味や関心にあわせて検索結果をカスタマイズする検索技術です。

たとえば「SOX」と検索したユーザのインテント(検索意図)は、(1) Sarbanes-Oxley Act(サーベンス・オクスリー法)と(2) MLBの球団・ボストンレッドソックスの可能性があります。この時、Googleは当該ユーザの過去に入力したクエリやクリックしたページなどの検索行動データを参照して、インテントに適した情報を他のページよりも上位に表示することで最適な検索結果を表示します。


Googleパーソナライズ検索の変遷

Googleパーソナライズ検索は当初(2005年11月)、Googleアカウントを取得し、かつ、アカウント管理画面でパーソナライズ検索を有効にしたユーザだけを対象に提供してきました。その後、2007年2月にGoogleアカウントを取得した場合は標準でパーソナライズ検索を有効にするように変更が行われました(※ 検索行動に基づいたパーソナライズを利用する場合はウェブ履歴を有効にする必要あり)。

この時点までのGoogleは、徐々にハードルを下げているとはいえ、基本的にオプトイン方式、つまりユーザが明示的にパーソナライゼーションを利用するという意思表示をしなければ検索結果の個別化は行われませんでした。しかし、今回のCookieを使ったパーソナライズ検索は、オプトアウト方式、すなわち、無効にするという設定をしない限りは検索結果が個別化されるようになる、という点がポイントであるといえます。

Googleパーソナライズ検索の種類

とはいえ、実はGoogleはそれが明示的なもの、暗黙的なものを含めて様々な形で私たちに提示する検索結果を最適化するための機能を追加してきています。その機能は次のようなものです:

Google SearchWiki

Google SearchWikiは日本でも2009年5月に開始されました。Googleアカウントにサインインすることが必須で、かつユーザが明示的にコントロールするものです。任意のクエリでよく閲覧するページや気に入らないページの順位を操作したり、検索結果に表示されるべきページを追加することができるサービスです。リリースされた当初は検索業界で話題になりましたが最近はさっぱり名前すら聞かなくなりました。一般のユーザにとって検索エンジンとは「探す場所」であり「作成する場所」ではないことが原因の1つではないかと考えます。つまり、検索結果の最適化は自動的に実現されるものであって、ユーザ自身が作り込むものではないのではないかということです。マイクロソフトがLive Search向けにリリースした検索マクロがほとんど使われていないことも同様の理由と考えられます。


Google Preferred sites

Google Preferred sitesは、2009年1月に試験的に提供された機能です(2009年3月末に、Google Labsで公開、2009年12月現在、機能を確認できず)。先ほど紹介したSearchWikiの拡張機能的な位置づけです。ユーザが日常よく利用するサイト、信頼しているサイトのドメインを登録しておくことで、当該サイトが検索結果に表示されやすくする機能です。

従来、そして今日も、検索エンジンはウェブの信頼度や重要度を判定する尺度としてリンクによる人気投票的要素に依存しています。しかし、ウェブページが発するリンクとは、いわばサイト運営者による人気投票であり、つまりランキングはサイト運営者による投票の結果であり、そこに検索ユーザの意見は反映されていない、という見方もできます。

対してGoogle Preferred sitesは、検索結果にユーザが明示した意見を反映させることで、検索結果の最適化を図ろうという試みなのです。


Google Social Search

Google Social Searchはソーシャルグラフ(人間関係)に基づいて個々のユーザに適合性の高い検索結果を提供するアプローチです。2009年10月末に発表されました。

Google Social Searchは、友人や知人のウェブサイトやブログ、つぶやき、レビューなど、Googleプロフィールと関連づけられた情報を、検索結果に反映させます。時として、素性をよく理解しているユーザのコンテンツは、名前も顔も知らない第三者のコンテンツよりも有益になることがあります。同じ飲食店に関する口コミであれば、同じ地元で頼りになる友人の口コミを信頼するケースもあるでしょう。これは検索行動ではなく、ソーシャル(交流)属性から検索結果をカスタマイズする試みです。

検索履歴に基づいたパーソナライズ検索の種類

このようにパーソナライズ検索には様々なパーソナライズの方法がありますが、ここで検索履歴を利用するパーソナライズ検索の話に戻します。

Googleは2009年12月時点で、(1) Googleアカウントにログインしたユーザ、(2) 同ログインしていないユーザ、という2つのユーザ向けに、異なる手法を用いた検索履歴ベースのパーソナライズ検索を提供していることになります。

ログイン時のGoogleパーソナライズ検索

Googleアカウントにログインした場合の、検索結果のカスタマイズの要素は次の通りです。

(1) ブラウザの言語設定
(2) 検索場所(IPアドレス)
(3) ブラウザ
(4) iGoogleのガジェット
(5) ウェブ履歴 (検索クエリ、クリックしたページ)
(6) ページ閲覧履歴(Googleツールバーをインストールした場合のみ)

(1) ~ (3) はログインとは関係なく参照・カスタマイズに利用される情報ですが、おさらいとしてリストに挙げます。(4) のiGoogleのガジェットについては2008年に開催されたSMXにて米Googleのエンジニアがそのように説明をしていたので列挙しましたが、真偽は定かではありません。(6) のウェブページの閲覧履歴は、Googleアカウントでログインし、かつブラウザにGoogleツールバーをインストールして、さらに拡張機能を有効にしている場合に限定されます。

さて、「検索履歴」データを参照するとのことですが、過去何日にさかのぼって参照するのか。Googleはこの点について明らかにしていませんが。過去の検索履歴はユーザが自発的に削除しない限り無期限に残されること、また、パーソナライズ検索は検索履歴データが蓄積されるほど有効に機能するようになること、さらに後述するCookieベースのパーソナライズ検索が180日を遡ること、あまりに古い検索履歴は今日のインテントを反映しないケースが増えることも考えると、無限に過去データを参照することはないのでしょう。

ログインしない時のGoogleパーソナライズ検索

Googleアカウントにログインしていない、取得していない場合の検索結果のカスタマイズの要素は次の通りです。

(1) ブラウザの言語設定
(2) 検索場所(IPアドレス)
(3) ブラウザ
(4) 検索クエリ
(5) 閲覧したページ

Cookieに(4)~(5)のデータとリンクさせることでパーソナライゼーションを行います。検索履歴情報はGoogleサーバに蓄積されており、複数ユーザでPCを共同使用している場合でも検索クエリや閲覧ページを第三者に参照されることはありません。

使用する過去の検索履歴は、180日前までとなっています。


以上のように、Googleが提供する同じパーソナライズ検索ながら、Googleアカウントのログインの有無によってアプローチは異なっています。アプローチが異なるため、それぞれにおいてパーソナライズ検索を無効にする方法も異なります。


Googleパーソナライズ検索を無効にする方法

Googleパーソナライズ検索を何らかの理由で中止したい場合、次の手順を踏みます。

(1) ログイン時のパーソナライズ検索

Googleアカウントからウェブ履歴を削除します

(2) ログアウト時のパーソナライズ検索

複数の方法があります。

a) 検索結果のURLにパラメータ &pws=0 をつける
b) 検索結果ページの右上にある「ウェブ履歴」をクリックして、[検索内容に基づくカスタマイズを無効にする] をクリックする
c) ブラウザのCookieを削除する


Googleパーソナライズ検索で順位はどの程度、変化するか

「パーソナライズ検索による順位の違いは軽微」というのが複数のGoogleエンジニアの回答です。実際、私自身も様々な実験を行いましたが、順位の違いは「軽微」の範囲です。検索結果の全てがそっくり他のページと入れ替わるのではなく、いくつかのページの順序が異なる、全体の20%が変化するかどうかのレベルです。つまり、パーソナライズ検索によって、同じ検索クエリながら隣のユーザの検索結果画面と全く異なる、ということはありません。

ユーザは24時間いつも同じインテントを持った検索をしたり、同じ話題について検索しているわけではありません。仕事でパソコンを利用している人であれば、昼間(=仕事)と夜(=趣味)で検索の指向は大きく異なるでしょう。ゴールデンウィーク直前になったら急に旅行についての検索が増加する人もいるでしょうが、旅行にいってしまえばその検索クエリは急減するに違いありません。

ユーザの趣味嗜好に合わせすぎると検索結果の多様性(diversity)が失われるというデメリットもあります。当該ユーザがまだみたことのない、しかし有益なコンテンツが提示される機会が失われることは、検索結果の適合性を高めることにはならないのです。

2009/12/08 03:45 時点


パーソナライズ検索結果: 基本情報 [Google]
http://www.google.com/support/accounts/bin/answer.py?hl=jp&answer=54041

パーソナライズ検索結果: カスタマイズを無効にする [Google]
http://www.google.com/support/accounts/bin/answer.py?hl=ja&answer=54048#signedout

パーソナライズ検索結果: プライバシー
http://www.google.com/support/accounts/bin/answer.py?hl=jp&answer=55988

Web Professionalトップへ

WebProfessional 新着記事