このページの本文へ

カラオケのエクシングは言語解析APIでビッグデータに向かう

2013年12月17日 16時00分更新

文● 松下 康之/アスキークラウド

  • この記事をはてなブックマークに追加
  • 本文印刷

 顧客からのクレームや対話から得られたフィードバックなど非定形で大量の日本語データをビジネスに利用するには様々な方法がある。Hadoopでデータをバッチ処理して傾向や推移を知るのもひとつの方法だ。ただし、実際にそのデータが何を意味しているのか?を知らないとデータを最適に活用することは不可能では無いが難しいだろう。例えば、金曜日の深夜に「ラーメン」「大盛り」がツイッターで頻出すれば、誰かがラーメンを食べているもしくは食べたいと思っていることは類推出来る。また、ネット上のニュースの文章を大量に処理すれば、何が話題になっているのか?を定量的に分析することは可能だろう。

 だが、その文章が意味しているところを理解するためには人間が読み込んでその意味を解釈する必要があった。それを自然言語解析が補完するのが今のWebサービスの流行りなのだろう。

 先日、さくらインターネットと通信カラオケの大手エクシングが共催したハッカソンを取材した。約30名の参加者がさくらインターネットのクラウドサービスとエクシングが提供する言語解析APIを使って新しいサービスを半日で創りあげようというものだ。

Samurai Startup Islandで開かれたハッカソン

Samurai Startup Islandで開かれたハッカソン

 言語解析APIの公開はエクシング(というよりも2012年に事業譲渡を受けた言語工学研究所の成果物と思われる)にとっては未知の領域ということでこのハッカソンに限定利用ということだったが、参加者が開発したアプリはツイッターのタイムラインを集めてネガティブ/ポジティブの解析を行ったり、ツイッターのアカウントのプロフィール情報からアイドルの名前を収集して分析したり、ロケーション情報と「美味しい」「不味い」などと言った感想を分布させて地域の特性を解析したり、スパムメールの中身を解析したりとハッカソンらしく面白いアイデアばかりだった。このハッカソンではアプリを実装するエンジニアにとって「日本語を機械が理解する」と言う醍醐味を味わったのではないだろうか。

 実際にはエクシング以外にも日本語の形態素解析をベースにした日本語処理のサービスは存在する。
ヤフージャパン:日本語係り受け解析API:http://developer.yahoo.co.jp/webapi/jlp/da/v1/parse.html
NTTデータ:高精度日本語解析エンジンなずき:http://www.nttdata-nazuki.jp/EA.html
オープンソースの日本語解析API MeCab:http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html

 このハッカソンで開発されたアプリをみる限りでは「文章のネガポジを判定する」と言う部分にエンジニアの興味が集まっていたようだ。ただ、「冷たいビール」「温かいビール」「冷たい笑顔」「温かい笑顔」のように同じ形容詞でも係る対象によってはネガティブかポジティブかの意味合いが変わるような場合をどうするのか?ここにはアプリの作り方、辞書(コーパス)の使い方など工夫が必要であるようだ。

 またサイボウズのアプリケーションプラットフォームであるKintoneでも日本語の解析処理を実現するサービスが12月16日付けで発表された。

http://group.cybozu.jp/news/13121601.html
https://kintone.cybozu.com/jp/app/075-datasection-001.html

 今後のビッグデータの活用では日本語データの持つ意味を理解することが必要な要件になるだろう。通信カラオケがメインのビジネスであるエクシングにとってこの言語解析APIがどういう意味を持つことになるのか、エクシングの今後の動きに注目したい。

スポンサーであるエクシングのロゴが描かれたティラミス

スポンサーであるエクシングのロゴが描かれたティラミス

週刊アスキー最新号

編集部のお勧め

ASCII倶楽部

ASCII.jp Focus

MITテクノロジーレビュー

  • 角川アスキー総合研究所
  • アスキーカード
ピックアップ

デジタル用語辞典

ASCII.jp RSS2.0 配信中