NHKといえば、広報局のTwitterアカウントが人気だ。ユル~いトークやユニークなツッコミで56万以上のフォロワーを獲得しており、着実にNHKファンを増やしている。だが実は、NHKはTwitterを番組の評判を見るためにも利用している。最先端の技術を取材した。
2013年1月に放送されたNHKスペシャル「世界初撮影! 深海の超巨大イカ」を覚えている人は多いだろう。
世界で初めてダイオウイカの撮影に成功したこの番組は、放送前から予告編がTwitterで話題になり、ちょっとしたブームを巻き起こした。
このようなTwitter上の評判を分析する技術を、NHKが持っていることはあまり知られていない。しかも、Twitter解析を主導する放送技術研究所の小早川 健氏によると「他社にはないNHKのみの独自技術」が盛り込まれているという。
NHKの独自技術の正体は、Twitterのツイートから番組名を当てる技術だ。
Twitterは気軽に使うツールなので、ある番組についてツイートする場合でも、いちいち番組名を正確につぶやくとは限らない。
小早川氏によると、NHKに関するツイートは1日で6万件もあるが、そのうち本文中に番組名が記されているのは2、3割程度という。
これでは、つぶやきが特定の番組に関するものなのかどうかを機械的に判断することはできない。そこで小早川氏は、EPG(電子番組ガイド)の内容とツイートとの類似度を測る技術を考え出した。
番組の検出には番組の略称/出演者名/つぶやき時刻という3種類の判定アルゴリズムから得られる情報を用い、EPGとの類似度を総合的に判定する。単なる番組名だけでなく、番組の放送回まで推定できるという。
また、つぶやきの内容がポジティブなのか、それともネガティブな発言なのかといった分類も可能。番組の話題性に加え、評価のされ方まで分かるわけだ。
この技術を用いれば、Twitter上の盛り上がりと視聴率とのギャップも分かる。小早川氏によれば「ツイートと視聴率の相関率は、良くて7割程度」という。
具体例は、6月9日に放送されたNHKスペシャル「未解決事件 File.03 尼崎殺人死体遺棄事件」だ。
この番組は視聴率はさほど高くはなかったが、Twitter上では賛否両論が飛び交い、話題性が高かったという。「ランダムサンプリングの視聴率に対し、ツイートは主体的な書き込みなので、数値が違ってくるのは当然。違う指標だと考えています」(小早川氏)。
本格運用は今後の課題
気になるのは、NHKがどこまで個人情報を見ているか。小早川氏によると、「ユーザーのアカウントや属性と、その発言とを紐づけて分析していません」という。今後の方針も「番組推定技術とは要素技術が異なるため、考えていない」とのことだ。
Twitter解析は2010年にスタートしたばかり。まだ検討課題も多い。
ポジティブ/ネガティブ判定は、文脈によって意味が変わるような発言は拾いきれていない。例えば、ケンカをしているときの「バカ」と、恋人に甘えるときに使う「バカ」とを見分けるところまでは到達していないという。
また番組名の推測についても、「現状で100点満点の80点程度」(小早川氏)。まだ学術評価に耐えられるほどの性能に達していない。
Twitterの解析結果は現場の番組制作チームに伝えてはいるが、分析結果が番組編成に影響した例はない。「どこまで視聴者の声を聞くべきなのか、という議論は永遠の課題です。非常にバランスが難しいところです」(小早川氏)。
今後の目標は言語処理精度の向上。社内向けのサービスなので、Twitterの分析結果やツイート内容をホームページで公開することは考えていない。
その代わり、特定の番組について多くつぶやかれた言葉を「トレンドワード」として提出するといった構想はあるという。
「番組の推薦に使うなど応用範囲は広いはずです。まだなにか決まっているわけではないですが、いろいろな可能性があると思います」(小早川氏)。