グーグルは2015年11月17日(米国時間)、同社検索サービスのインデックスシステムを調整し、HTTP と HTTPS の2つのバージョンが存在する場合は HTTPSページを優先的に登録していくことを発表した。
同社はユーザーのセキュリティ観点から常時HTTPS(HTTPS everywhere)を推進してきた。昨年も、暗号化されたページを検索順位を決定する手がかり(シグナル)として用いることを発表していた(関連:Google HTTPS暗号化サイトの検索順位優遇を発表)。
今回の発表の内容は次の通りだ。ある1つのサイトに同じコンテンツを提供する HTTPS と HTTP の両方のバージョンが存在する場合、同社公式ブログに記載されている以下の条件を満たしていれば HTTPSページをインデックス登録する。
- セキュアでない依存関係が含まれていない
- robots.txt によってクロールがブロックされていない
- セキュアでない HTTP ページに(または HTTP ページを経由して)ユーザーをリダイレクトしていない
- HTTP ページへの rel="canonical" リンクが含まれていない
- noindex robots メタタグが含まれていない
- 同一ホスト上の HTTP ページヘのリンクが含まれていない
- サイトマップに HTTPS URL が掲載されている(または URL の HTTP バージョンが掲載されていない)
- サーバーに有効な TLS 証明書がある
今回の発表はあくまで「同じコンテンツを掲載しているけれどプロトコルが違うだけの、HTTP と HTTPS 両方のバージョンが存在したら、HTTPSページを優先する」という話でしかなく、暗号化されていないHTTPページは一切、影響を受けない。同様に、今回はインデックス(データベースへの登録)の話であってランキング(検索順位決定)の話ではないので、自然検索順位への影響もこれ自体は一切ない。
Bing や Yandex など他の検索エンジンでも HTTPS を優先的に登録したい場合は、HTTP を HTTPS にリダイレクトしたり、HSTS ヘッダー を用いるといった従来(Googleでも)推奨されてきた方法を用いることで、検索エンジンに対して明示的に HTTPS を優先登録するように伝えることができる。
Indexing HTTPS pages by default
http://googlewebmastercentral.blogspot.com.au/2015/12/indexing-https-pages-by-default.html
HTTPS ページが優先的にインデックスに登録されるようになります
http://googlewebmastercentral-ja.blogspot.jp/2015/12/indexing-https-pages-by-default.html
#
国内海外問わず、勘違いしてニュース記事を書いている方もいらっしゃったので、誤解していそうな箇所について触れておきました。繰り返しますが、ウェブ全体において HTTPS を優先登録していく(≒HTTPが後回し)という意味ではなく、1つのサイト(ドメイン)に HTTP と HTTPS の両方に同一のコンテンツが掲載されている時は Google のシステムは後者を選択するという話です。
もう1点、本件に限らず「インデックス」と「ランキング」の話がよく混同されますよね。データベースを作ることと、掲載する順序を決めることは異なります。実際、みなさんも自分の Webサイトは Google に登録(インデックス)されていても、自然検索順位が低いから(ランキング) SEO に悩んでいるわけですよね。この2つの区別がつくと、「モバイル専用のインデックス」の話の論点も見えてくるようになると思います。
本題ですが、Google が列挙している(HTTPSページを優先登録する)条件は、現状守られていないものばかりです。よく見られるのは、HTTPS にしているのに canonical は http のままであること、http を https にリダイレクトしていないことでしょうか。システム的に出来ないこともあるようですが、今日のウェブ技術のトレンドを考えると、数年先には HTTPS everywhere な環境になっているかもしれないので、(SEOの議論としてでなく)未来の Web を考えて取り組んでいかなければいけないでしょう。