このページの本文へ

米Google、ページレイアウト分析アルゴリズムを改善 [詳細版]

2012年01月20日 13時04分更新

記事提供:SEMリサーチ

  • この記事をはてなブックマークに追加
本文印刷

米Googleは2012年1月19日、ウェブページのレイアウトやコンテンツボリュームを分析するアルゴリズムに変更を加えたことを明らかにした。同社Matt Cutts氏(Distinguished Engineer)は、検索利用者がより高品質なウェブサイトを発見できるようにするための改善策の1つだと述べている。

ページレイアウト分析の概要

これは2011年1月に発表した、コンテンツ品質評価の改善のための取り組みの一環だ。検索結果のリンクをたどると、実際のコンテンツ量が極端に少なかったり、アフィリエイトやテキスト広告で埋め尽くされたページが開いてしまうことに不満を述べるユーザーは少なくない。ユーザーはコンテンツを見たいのであって広告を見たいのではない。above-the-fold (ファーストビューのこと、スクロールなしで画面に表示されている領域)が広告で埋まったような、ユーザーエクスペリエンス(UX)に問題があるウェブページを検索上位に表示してしまうことは、すなわちGoogleの検索体験そのものも損なうことになる。こうした問題を解決するための方法の1つが、本日発表されたページレイアウト分析だ。


ページレイアウトの分析とは、ページを意味のある情報構造に分類、主要素となる情報がどこにあるかを認識することにより情報検索技術を向上させようという試みだ。一般的にウェブページに盛り込まれたコンテンツは、その内容や役割によって複数のブロック(単位)に分けることができる。たとえばグローバルナビゲーションや主コンテンツ、広告枠、フッターリンク、著作権表示、見出し、本文といった単位だ。人間はこうした視覚的な情報を利用して、自分が探しているコンテンツを認識したり、別のページに移動するためのリンクといったブロック単位の役割を理解する。一方、ファーストビューに大量の広告があることを認識すると、人間は快く思わないだろう。こうした人間が通常行っている情報処理をアルゴリズムで計算するのがページレイアウト分析だ。ウェブページのソースコードを読取り、ファーストビューに該当するエリアに含まれている情報を評価すれば、そのページのユーザーにとっての有用性の手掛かりを得ることができる。

Matt Cutts氏によると、ファーストビューに明らかに過剰な広告が掲載されていたり、主たるコンテンツが探しにくいようなレイアウト構造、あるいはコンテンツボリュームが極端に少ないウェブページは、今回のアルゴリズムの影響を受けることになると述べている。ただし、ウェブサイトが収益性を高めるためにファーストビューに広告を掲載することはビジネス一般で行われていることであり、Googleはそうしたビジネスモデルを崩壊させようとする意図はない。あくまで、「UXを損なうレベルの」ウェブページが対象だ。

もし自身のウェブサイトがページレイアウト問題を原因とした影響を受けている可能性があると判断できる場合は、そのレイアウトを見直して再設計した上で、クローラ(googlebot)の再クローリングを待つ必要がある。Googleはクローリングした際にそのレイアウトの変更を認識できたら自動的にランキングに反映していくという。変更後が検索結果に反映されるまでは、サイトの規模、ページ数などに依存するため、大規模サイトの場合は数週間程度の時間を要する場合もある。

ウェブページのレイアウト構造分析は、以前から検索関連特許文書(例えばVIPS)にたびたび登場してきた話題であるが、商用検索エンジンが実際にそれを導入しているという確たる証拠があるわけではなかった。また、Googleによるコンテンツ品質評価のための一連のアルゴリズム変更、通称「パンダ・アップデート」の判断基準の1つとして多くの専門家がページレイアウトを取り上げていたが、それも様々な状況証拠から積み上げられた可能性として取り上げられていたわけで、Googleがそれを明言していたわけではなかった。その意味で今回Googleが公式ブログでページレイアウトと品質判断について言及してきたことは新しく、また(当たり前であるが)ユーザーに目を向けたサイトをきちんと評価するという方針を改めて示したともいえる。


どのくらいの広告を掲載するとNGなのか?

「どの程度の量の広告掲載なら問題ないのか?」といった疑問を持たれるサイト運営者の方がきっといるに違いないが、Googleの立場として答えると、バカげた質問といえる。というのは、「ユーザーエクスペリエンスを考えたページレイアウトの設計を」とアドバイスする通り、UXを考えつつマネタイズのバランスを常識的に考えれば着地点はおのずと見えてくるはずで、たぶん「その量」で良い、といえるからだ。「広告○枠までならOK、○枠以上はNG」という回答を期待するのが間違いといえよう。ここで実名サイトをあげてしまうと色々問題があるので書かないが、広告を大量に掲載していそうなサイトを見まわってみると、これはNG、というイメージはつけられるはずだ。

Web Professionalトップへ

WebProfessional 新着記事