このページの本文へ

米Google、表形式データから事実を抽出・表示する「構造化スニペット」を発表

2014年09月24日 02時24分更新

記事提供:SEMリサーチ

  • この記事をはてなブックマークに追加
本文印刷

米Google は2014年9月23日、ウェブ検索結果のスニペット(説明文欄)に、検索クエリに関連する既成の事実や正確な情報を表示する Structured Snippets (構造化スニペット)をリリースした。日本語検索結果でも一部の情報は対応している。

Googleは近年、整理され関連性が高いデータを検索利用者に提供するために開発されたナレッジグラフや他のデータソースによって支えられた数々の機能によって進化してきた。本日発表された構造化スニペットはさらに発展させたもので、ウェブページに掲載された表形式データから、動かぬ事実や正確なデータと推定される情報を抽出して、スニペット欄を通じて利用者に提供する機能だ。

例えば "nikon d7100" (※ ニコンのデジタル一眼レフのカバン)で検索すると、検索結果に表示される dpreview.com の通常のスニペットの下欄に、同ページの一覧表に掲載されていたこセンサーの有効画素数や撮像素子、カメラの重さについての情報を抽出して表示されることが確認できる。

他にも "mysql" と検索した時に安定版のバージョンとリリース日、ライセンスの種類、開発者の名前が表示される例、"cent OS"と検索した時にOSの種類やライセンスの種類が表示される例、"Facebook"と検索した時に本社所在地や設立日が表示される例、"Boston Marathon"と検索した時の最高記録と開催日が表示される例、"us open"(テニスの全米オープン)と検索した時の賞金金額や開催場所、直近の優勝者の名前が表示される例などを確認できる。

Google Research 所属の WebTables研究チームは、インターネット上に散在する数々の表形式データを抽出・理解して、そこに埋もれた特に関連性の高い情報を検索利用者の目に触れやすくするための取り組みを行ってきた。こうした取り組みで得られたデータは Google Docs や Google Slides 内のリサーチツールで利用されている。

構造化スニペットは Google Research と Google ウェブ検索チームが共同で取り組んだ最新のプロダクトで、こうした表形式データを活用して常に最も関連性の高い情報を検索利用者に提供することを可能にするものだ。関連性のあるデータを取り出すために機械学習の手法を利用して、映画出演俳優や試合日程、製品仕様といった意味のある情報・事実を整理している表形式データと、レイアウト構成のために用いられたそれ自体は事実や事実を整理していない表形式データを機械的に区別する試みをしているという。また、構造化スニペットの開発にあたり、追加のアルゴリズムを導入して、スニペット欄に表示する情報の品質や関連性の計算も行っている。この構造化スニペットは最大4つの事実・情報を表示する仕組みのため、関連性が高いものをアルゴリズムで判定している。





Introducing Structured Snippets, now a part of Google Web Search [Google Research Blog - The latest news from Research at Google]
http://googleresearch.blogspot.jp/2014/09/introducing-structured-snippets-now.html


リッチ スニペットと構造化データについて

https://support.google.com/webmasters/answer/99170?hl=ja


#
リッチスニペットと似ていますが、テーブルのデータを解析するというところが違うのかと。

Web Professionalトップへ

WebProfessional 新着記事