このページの本文へ

関連語と文章単位のスコア計算を加えたBIGLOBE「感°Report」

ブログ分析のノイズを半減してネット口コミに敏感!

2009年06月30日 06時00分更新

文● 企画報道編集部

  • この記事をはてなブックマークに追加
  • 本文印刷

 今やマーケティングや市場調査、ユーザー評価などを知るためにブログの評判も欠かせない情報となっている。そんなブログの評判を知るために、BIGLOBEでは2008年10月から企業向けブログ分析サービス「感°Report」(かんどレポート)を月額3万9900円で提供している(関連記事)。

感°Report

企業向けブログ分析サービス「感°Report」

 同社は29日、新機能「話題文脈判定」を導入して調べたい内容とは異なるブログ記事(ノイズ)を除去できるようになった。この機能には、以下の2つの手法が使われている。

  1. 調査対象の関連ワード抽出
  2. 文章ごとの関連スコア計算
新機能「話題文脈判定」の説明図

新機能「話題文脈判定」の説明図(プレスリリースより)

 関連ワード抽出は、過去のブログ記事群から調査対象となる話題に関連するキーワードを自動学習する「拡張型確率的コンプレキシティ」(NECが独自開発したアルゴリズム)を利用している。これにより、日々増え続けるブログ記事でも、関連語の追加・拡張に柔軟に対応できるという。

 文章ごとの関連スコア計算は、1つの記事の中で複数の話題が扱われるブログの特性に対応するための機能。関連ワード抽出で見つけた関連語を、文章単位で有無を調べて関連度のスコアを計算し、それぞれの個所が調査対象の話題かどうかを判定する。つまり、目的以外の話題を含む文章(段落)は読み飛ばせるというわけだ。

 これにより、同社の従来方式よりノイズが1/2以下、一般的なブログ検索などの方式と比べるとノイズ混入率は1/4以下に低減できたとしている。これにより、利用者はブログ分析の際にも余分なブログ記事をチェックする必要がなく、手間や時間が半減するという。


■関連サイト

カテゴリートップへ

アスキー・ビジネスセレクション

ASCII.jp ビジネスヘッドライン

ピックアップ