このページの本文へ

Googleが指摘する"コンテンツファーム"とは? Demand Mediaのコンテンツミル問題 (中編)

2011年01月31日 13時40分更新

記事提供:SEMリサーチ

  • この記事をはてなブックマークに追加
本文印刷

Googleが低品質コンテンツの排除を強化する方針を発表した背景として、先日NYSEに上場した米Demand Media対策という指摘もあります。Google公式発表には一切、Demand Mediaに言及はありませんが、背景事情的に、そう考えることに一定の合理性はあります。

今回はそのDemand Mediaのコンテンツと検索エンジンにとっての課題について簡単に説明します。

Demand Media は独自の予測アルゴリズム技術を用いてオンラインユーザが求めている情報を解析して、それに合致する記事やビデオなどのコンテンツをeHowやLivestrong、Trails.com、answerbag などのDemand Mediaネットワークを通じて配信しています。現在、13,000人以上のフリーランスを雇い、1日当たり5000以上のコンテンツを作成しているといわれています。2010年12月の同社ネットワークの訪問者数は6億7,300万(comScore)と創業からわずか4年程度で巨大なネットワークとなっています。

ところで、同社はその多くのトラフィックと収益をGoogleに依存しています。つまりSEOを駆使して、キーワード検索した際に同社のメディアが検索上位に表示されるようにしているのですが、この点について、批判をしている人も少なくありません。というのは、このDemand Mediaのコンテンツの多くは、特に面白くもない平凡なものであること、そして中には、価値が薄っぺらな情報も多い点です。単に低価値のコンテンツを生成している工場(Content Mill、コンテンツ工場)に過ぎない、と。

たとえば、eHow.comのサイトに、ある建築業界向けのソフトウェアのトラブルシューティングについての記事が掲載されています。しかし内容を見ると、単に「ソフトウェアをアンインストールして、Windows を再起動して、必要なら再インストールして」と、中身は至って普通のことしか書いてありませんでした。つまり、その記事のソフトウェアの部分を別のキーワード(たとえばAdobe AcrobatやMS Office 2010など)に置き換えるだけで別の記事が出来上がってしまいます。あるいは、靴ひもの結び方について、最初のステップが「靴を履いていることを確認しましょう」で始まっているといった始末です。

つまり、確かにコンテンツ(=文字情報)はあるし、キーワードとの関連性は(文字列上は)高いのですが、人間の目から見ると低品質(low-quality content)なわけです。しかしGoogleは、コンテンツが文字列的にキーワードとの関連性の程度を判断することができても、それの質(ユーザにとって有益となりうる情報なのか)は判断することができません。特にDemand Mediaネットワークの場合、日々大量のコンテンツがオンラインに公開され、増殖している以上、従来のランキングアルゴリズムでは「非常に優れたサイト」(authority site)と判断するしかないのです。

しかし、有益でない、対して役に立たないコンテンツを検索上位に表示することは、ユーザの期待に添いません。だから、Googleはこうした人間なら評価をしない、質が低いサイトを排除する方法を検討する必要が出てきたわけです。

(後編に続く)

Web Professionalトップへ

WebProfessional 新着記事