米Google、表形式データから事実を抽出・表示する「構造化スニペット」を発表

2014年09月24日　02時24分更新

ツイートする

米Google は2014年9月23日、ウェブ検索結果のスニペット（説明文欄）に、検索クエリに関連する既成の事実や正確な情報を表示する Structured Snippets （構造化スニペット）をリリースした。日本語検索結果でも一部の情報は対応している。

Googleは近年、整理され関連性が高いデータを検索利用者に提供するために開発されたナレッジグラフや他のデータソースによって支えられた数々の機能によって進化してきた。本日発表された構造化スニペットはさらに発展させたもので、ウェブページに掲載された表形式データから、動かぬ事実や正確なデータと推定される情報を抽出して、スニペット欄を通じて利用者に提供する機能だ。

例えば "nikon d7100" （※ ニコンのデジタル一眼レフのカバン）で検索すると、検索結果に表示される dpreview.com の通常のスニペットの下欄に、同ページの一覧表に掲載されていたこセンサーの有効画素数や撮像素子、カメラの重さについての情報を抽出して表示されることが確認できる。

他にも "mysql" と検索した時に安定版のバージョンとリリース日、ライセンスの種類、開発者の名前が表示される例、"cent OS"と検索した時にOSの種類やライセンスの種類が表示される例、"Facebook"と検索した時に本社所在地や設立日が表示される例、"Boston Marathon"と検索した時の最高記録と開催日が表示される例、"us open"（テニスの全米オープン）と検索した時の賞金金額や開催場所、直近の優勝者の名前が表示される例などを確認できる。

Google Research 所属の WebTables研究チームは、インターネット上に散在する数々の表形式データを抽出・理解して、そこに埋もれた特に関連性の高い情報を検索利用者の目に触れやすくするための取り組みを行ってきた。こうした取り組みで得られたデータは Google Docs や Google Slides 内のリサーチツールで利用されている。

構造化スニペットは Google Research と Google ウェブ検索チームが共同で取り組んだ最新のプロダクトで、こうした表形式データを活用して常に最も関連性の高い情報を検索利用者に提供することを可能にするものだ。関連性のあるデータを取り出すために機械学習の手法を利用して、映画出演俳優や試合日程、製品仕様といった意味のある情報・事実を整理している表形式データと、レイアウト構成のために用いられたそれ自体は事実や事実を整理していない表形式データを機械的に区別する試みをしているという。また、構造化スニペットの開発にあたり、追加のアルゴリズムを導入して、スニペット欄に表示する情報の品質や関連性の計算も行っている。この構造化スニペットは最大4つの事実・情報を表示する仕組みのため、関連性が高いものをアルゴリズムで判定している。

Introducing Structured Snippets, now a part of Google Web Search [Google Research Blog - The latest news from Research at Google]
http://googleresearch.blogspot.jp/2014/09/introducing-structured-snippets-now.html

リッチスニペットと構造化データについて

https://support.google.com/webmasters/answer/99170?hl=ja

#
リッチスニペットと似ていますが、テーブルのデータを解析するというところが違うのかと。

Web Professionalトップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

WebProfessional 新着記事

WebPro

KUSANAGI Security Editionが進化！新機能「SafeUpgrade」でダウンタイムゼロのnginxアップデートを実現

KUSANAGI Security Editionが新機能「KUSANAGI SafeUpgrade」を導入し、nginxのメジャーバージョンアップを無停⽌で実施可能にする。

WebPro

高速CMS基盤「KUSANAGI Security Edition」がMicrosoft Azureに登場｜自動アップデートで安全性を確保

プライム・ストラテジーが、新しいセキュリティ基盤「KUSANAGI Security Edition」をMicrosoft Azureで提供開始。セキュリティ向上と運用効率を両立し、ビジネス効果を最大化する製品の特徴を紹介。

WebPro

KUSANAGI 9、新たにOracle CloudにAlmaLinux OS 9を採用し、2032年までの長期サポート提供開始

KUSANAGI 9 for Oracle CloudがAlmaLinux OS 9を新たに採用し、2032年までの長期サポートを提供。同時に官公庁や大手企業向けにより安全な使用が可能に。

Team Leaders

例えるなら“表参道の一等地”　14年ぶりに申請開始する「ブランドTLD」の価値とは？

企業がドメイン名に自社のブランド名を使用できる「ブランドTLD」のセカンドラウンドが、2026年4月から申請開始となる。本記事では、GMOブランドセキュリティが開催した説明会の内容から、ブランドTLDの概要と取得方法について紹介しよう。

ビジネス

Backlogは未来を楽にする　最初は手間だけど、1年後は使った自分を褒めたくなる

　2024年12月14日、BacklogのユーザーグループであるJBUG（Japan Backlog User Group）は「Backlog World 2024 in YOKOHAMA」を開催した。Webプロジェクト、イベント運営、新規事業、オンボーディング、ミーティング、ワークスペース統合など多種多様なBacklog活用事例が披露された。