このページの本文へ

Google Matt Cutts「ウェブ上のコンテンツの25-30%は重複コンテンツ」

文●渡辺隆広/SEMリサーチ

2013年12月17日 07時45分更新

記事提供:SEMリサーチ

  • この記事をはてなブックマークに追加
本文印刷

Google Matt Cutts「ウェブ上のコンテンツの25-30%は重複コンテンツ」

米GoogleウェブスパムチームトップのMatt Cutts(マット・カッツ)氏は2013年12月16日、ウェブマスターから頻繁に質問が寄せられる重複コンテンツ(Duplicate Content)についての質問にビデオで回答した。

同氏はまず第1に、Googleは重複コンテンツを一律にウェブスパムと判断しているわけではないと説明。通常のサイト運営を行っていてもどこかのページで重複は必然的に発生するからだ。しかし、ある検索クエリに対して、(異なるURLながら)同一のコンテンツを持つページを検索結果に複数返すことは、検索結果の関連性や品質の観点から望ましいことではない。どのリンクをクリックしても同じコンテンツが表示されてしまう検索結果は、便利とはいえないからだ。したがってGoogleは、最も関連性が高い、最善のウェブページを1つ選択し、その他の(同一)コンテンツを非表示にする対応をとっている。

ウェブに公開されているコンテンツの25-30%が事実、重複しているという。Googleはインターネットで同一のコンテンツを見つけた時はそれらをクラスタリング(グルーピング)して、1つのコンテンツという扱いをする。そして関連性や重要性から最もベストなページを1つ選択するというわけだ。

How does Google handle duplicate content?

How does Google handle duplicate content and what negative effects can it have on rankings from an SEO perspective ? - Gray Taylor, Stratford Upon Avon, UK

ただし、悪意を持って生成された何の価値ももたらさない重複コンテンツはウェブスパムとみなす。例えば、他のサイトのRSSから丸ごと引用して自分のウェブサイトに展開しているようなケースだ。これは何の付加価値ももたらさない単なるコピーのため、ウェブスパムと判断しうる。


同じコンテンツの公開に注意:SEO「重複コンテンツ」問題

[重複コンテンツその1] IPv4 と IPv6 でホストするウェブサイトのコンテンツは重複扱いになりますか?

[重複コンテンツその2] レスポンシブWebデザインは重複コンテンツ扱いになりますか?

[重複コンテンツその3] コンテンツを複数言語に翻訳したものを異なるドメインで公開しています。重複コンテンツ扱いになりますか?

[重複コンテンツその4] 製品スペック表や栄養成分表など他サイトにもあるコンテンツを掲載することは重複コンテンツ扱いにありますか?

#1
この話題は、基本的に大規模サイト運営している方が気にすべきお話です。なぜなら、大規模サイトにおいては意図せず重複コンテンツが発生するケースが多々ありますし、その結果、意図しないページが検索流入ページになってしまうことがあるから。小規模サイトの場合はまず問題にならないはずです、問題になるなら、それ、怪しいことを意図的にやってないかを疑って下さい。今日のGoogleは、ちょっとした重複コンテンツは大概、上手に扱ってくれます。

#2
これはほんとよくある質問ですよね。実際、「プレスリリースをHTML版とPDF版の2つを用意した」「ウェブ閲覧用と印刷用の2つのバージョン」「新旧2つの取引契約書を用意している」といった具合に、日常のサイト運営においても必然的に2つ以上の(ほぼ)同一コンテンツを公開してしまうことはありうるので、Googleはこうした『ウェブの活動において必然的に発生しうる事柄』は原則としてウェブスパムとは判断しないのです。ただ、検索結果の品質や適合性の観点から、同一内容のページを1つの検索結果内に多数含めることは望ましくないので、非表示にするだけです。

この問題は、日本では常に OKWave - MSN相談箱 - 教えて!goo その他のOKWave系ネットワークが邪魔だという問題に関連づけられるんですが、ま、これは技術的に処理するの難しいので。。

カテゴリートップへ

WebProfessional 新着記事

ASCII.jp会員サービス 週刊Web Professional登録

Webディレクター江口明日香が行く