このページの本文へ

NTTレゾナント、評判やQ&Aをネット上から検索するサービス“評判検索”と“Q&A検索”の実証実験をgooラボ上で開始

2006年03月28日 17時17分更新

文● 編集部 小西利明

  • この記事をはてなブックマークに追加
  • 本文印刷
“Q&A検索”で、「地上デジタル放送を見るUHFアンテナ」の質問文で、“教えて!goo”を対象に検索した画面。単語だけでなく自然文での検索も可能
“Q&A検索”で、「地上デジタル放送を見るUHFアンテナ」の質問文で、“教えて!goo”を対象に検索した画面。単語だけでなく自然文での検索も可能

エヌ・ティ・ティ レゾナント(株)(以下NTTレゾナント)は28日、インターネット上の日本語ページから検索キーワードの“評判”を抽出して検索できる“評判検索”と、単語や自然文による検索キーワードを元に、“質問と回答”が書かれた日本語ページを検索する“Q&A検索”の2種類の検索サービスを検証・評価する実証実験を、同社が運営するポータルサイト“goo”上で開始したと発表した。期間は本日から6月16日まで。

両検索サービスは、NTTサイバーソリューション研究所で開発された、ウェブページを分析して検索に活用する日本語処理時技術を活用して開発された。同社ではこれらの技術を元に新しい日本語検索サービスの開発を目指し、両検索サービスを実証実験として提供することでユーザーニーズを探るとしている。

両検索サービスに使われている技術の概念図。日本語ウェブページを“高速ウェブクローラ”で分類、評判やQ&Aを含むページを選びだして、そこから評判情報や質問文に似た概念などを抽出、インデックス化していく
両検索サービスに使われている技術の概念図。日本語ウェブページを“高速ウェブクローラ”で分類、評判やQ&Aを含むページを選びだして、そこから評判情報や質問文に似た概念などを抽出、インデックス化していく
NTTレゾナント ポータル事業本部 技術マーケティング部 担当部長の竹野浩氏
NTTレゾナント ポータル事業本部 技術マーケティング部 担当部長の竹野浩氏

両検索サービスの内容については、同社ポータル事業本部 技術マーケティング部 担当部長の竹野浩氏が説明を行なった。評判検索は自動収集された約1億ページの日本語ウェブページを対象に、検索キーワードになりうる単語と、それに関する“評判”を含む文章を抽出、インデックス化を行なう。ユーザーが評判検索に検索キーワードを入力すると、インデックスを元に検索キーワードに関する評判を、肯定的(Good)と否定的(Bad)に分けて表示する。さらにGoodとBadの大まかな割合も、円グラフ形式で表示する。検索されたページの検索結果も一覧表示される。



評判検索のトップ画面。使い方と評価画面の見方が説明されている 検索結果画面の解説。評判情報はヒット数の多い順に左から並び、大きなサイズの文字ほどヒット数が多い
評判検索のトップ画面。使い方と評価画面の見方が説明されている検索結果画面の解説。評判情報はヒット数の多い順に左から並び、大きなサイズの文字ほどヒット数が多い

評判として判断される文はさまざまで、食べ物なら“うまい”“まずい”、ハードウェアやサービスなら“よかった”“いまいち”といった具合に、検索キーワードに合わせて変化する(内部的には評判に対してキーワードを関連関連付ける形で処理しているとのこと)。評判は“良い”“悪い”といった単純な語だけでなく、“受賞しました”“納得できません”といった単文も対象とされる。さらに単純に評判と認識された語や文の有無を見るだけでなく、評判の前後の文章も解析することで、評判を含む文が肯定的か否定的なを判断するといった処理を行なっているとのことだ。そのため同じ語がGoodとBadの両方に表示されることもあるが、リンク先はそれぞれ異なる評価が書かれていたりする。

記者所有の携帯電話機について検索した結果。評判情報に列挙された文字(や文)をクリックすると、その文字を含むページの検索結果が表示され、そこから検索されたページへ移動できる
記者所有の携帯電話機について検索した結果。評判情報に列挙された文字(や文)をクリックすると、その文字を含むページの検索結果が表示され、そこから検索されたページへ移動できる

ただし現状では、検索キーワードひとつひとつに合わせた肯定/否定の分析はまだまだ完全と言えるものではない。竹野氏はデモで食べ物の“カレー”を評判検索すると、“辛い”がBadの側に表示されてしまう例を示して、分析の難しさの例を示した。また現状では対象となるウェブページが約1億程度であるため、検索キーワードによってはヒット数が少ないものもある。

一方のQ&A検索は、goo上で展開されている質問投稿と回答投稿のサービス“教えて!goo”にある100万件のQ&Aと、一般の日本語ウェブページから収集した20万件のQ&Aを対象として、検索キーワードに関連した質問文と回答文を含むページを検索するサービスを提供する。あらかじめ日本語ウェブページを分析して、質問文と回答文と思われる概念を抽出し、検索エンジンに登録する。そしてユーザーが入力した検索キーワードから、同様に概念を抽出、似た概念を持つ質問文と回答文を含むページを検索、結果を表示する。そのため検索キーワードは単語だけでなく、自然文での検索も可能となっている。単純なキーワードの有無を見るだけでなく、キーワードに似た概念も検索対象とするため、入力した検索キーワードそのものでは検索にかからないような場合も検索可能な、“あいまい検索”を特徴としている。

Q&A検索の説明図。検索キーワードに基づいた検索結果が一覧表示されるほか、どの程度似通った意味を持つ文章かを、レーダーチャートで表示する 検索キーワードそのものを含まなくても、類似する意味を持つ質問文と回答文も検索される。あいまいな質問でも関連するページを検索できるのは興味深い
Q&A検索の説明図。検索キーワードに基づいた検索結果が一覧表示されるほか、どの程度似通った意味を持つ文章かを、レーダーチャートで表示する検索キーワードそのものを含まなくても、類似する意味を持つ質問文と回答文も検索される。あいまいな質問でも関連するページを検索できるのは興味深い

結果表示には、検索にかかったページのURLや文章に加えて、レーダーチャート型の“意味グラフ”が表示される。これは検索キーワードと検索結果の関連を視覚的に表わしたもので、検索キーワードのレーダーチャート図形と検索結果の図形が似た形をしているほど、検索結果が似た意味の文章であることを示すという。チャートの詳細については公表されていない。また検索キーワードが複数ある場合、それぞれのキーワードごとに“キーワードの有無”やその頻度を調節することもできる。これにより検索結果から重要と思われる結果を絞り込みやすくなっている。

“地上デジタル”と“UHFアンテナ”を検索キーワードに、“教えて!goo”内を検索した結果。さらに絞り込みたければ、左側で対象キーワードをチェックして、スライダーで重み付けを変えることで絞り込んだ再検索を行なえる
“地上デジタル”と“UHFアンテナ”を検索キーワードに、“教えて!goo”内を検索した結果。さらに絞り込みたければ、左側で対象キーワードをチェックして、スライダーで重み付けを変えることで絞り込んだ再検索を行なえる

今回実証実験に供される検索サービスはあくまで実験であり、直接商用利用が行なわれるものではない。同社では実験の成果やユーザーからのフィードバックを元に、今後のサービス展開の可能性を検討するとしている。

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン