[短期集中連載]AIとディープラーニングが起こす"知能革命" 第2回
「もしドラ」仕掛け人・加藤貞顕×人工知能プログラマー清水亮 徹底対談
「創作する人工知能」を誕生させるために必要な条件
2017年02月07日 09時00分更新
「僕たち、記事の内容や品質、面白さを機械にもわかるようにしたいと思ってるんです」(加藤)
加藤 話は変わりますけど、清水さんは今どの領域を顧客にしてやってるんですか。
清水 結構幅広いですよ。
清水 金融系とか、あと機械系、制御系とかロボットとか。官公庁もありますね。国のAI関連の知財政策を議論する委員もやってますし、その他政府機関さんとのお仕事が多いですね。
加藤 そんなに色々やってるんですね。それはやっぱり、今のいろんな理論であったりとか、あるいはフレームワークだったりを理解していて、それを即コードで書けるみたいなことができる人がほかにはあまりいないってことですかね。
清水 いませんね。手前味噌ですけど、多分、僕は人工知能の実装に関しては日本で一番詳しい経営者かもしれないですよ。だって、人工知能を売りにしているテクノロジー企業の社長は、普通は実装までしてないですから。でもこの世界は実装までやらないとわからないことが多すぎるんですよ。日々勉強と発見の連続です。こんなにおもしろい仕事はちょっとない。
加藤 冒頭でもお話ししましたけど、僕ら、記事をちゃんと評価できるようにしたいなと思ってるんですよ。内容や品質、おもしろさなんかを機械がわかるようにしたい。そうすると、ものづくりも変わるし、広告やアフィリエイトなどのビジネスもがらっと変わります。
あとこれはメディアの運営側向けの話なんですが、コンテンツがちゃんと読まれるかどうか、できれば世に出す前に事前に評価したいんですよね。今僕らが取り組んでるのは、出して15分後ぐらいには、1週間後にどのぐらいのページビュー(PV)に着地するか、っていうような予測システムです。
まだ実験レベルですが、これは単にPVとかコンバージョンの話だけじゃなくて、結局、コンテンツの中身を評価する、要するにGoogleの"ページランク"に代わる新しい仕組みが必要だと思ってるわけなんですよ。キュレーションメディアの問題って、つまりはページランクがいまいちだから、あんなことになってるとも言えるじゃないですか。
清水 それ、面白いじゃないですか。ぜひやりましょう。
加藤 あ、一緒にやっていただけます? こういうシステムって人工知能が得意ですよね。今って結局、記事が何分間読まれるかとか、PV/UUがどうだとか、SNSのいいね!数とかRT数とか、大体そんなレベルで評価してるわけじゃないですか。要するに統計的な評価。中身を見て評価できるのって、画期的だなって思うんですよ。
――文章の中身を解析して、結果として良いものが「良い」と評価されるっていう風に動けばいいんですが、一方でポピュリズムの悪い側面に目を移すと、「広く一般に受けるモノ=質が良いもの」とも限らないかもしれなくて、その辺はどうなんでしょう。
加藤 たしかにGoogleのページランクにはその種の問題があって、いっぱい読まれると上に表示されるから、さらに読者が読むっていう側面があります。
だからこそ、機械である程度、良いコンテンツがわかるようにするのは大事なんです。そしてメディアのマネタイズのためにも良い面があって、中身がちゃんと解析できれば、たとえば広告なんかの精度も上がるわけですよ。今、メディアの収益性が低いのってアドテクに限界があるからなんです。だって、要らない広告が出てくるじゃないですか。広告って本当は、完璧なものが表示されるなら、むしろうれしいことさえあるはずなのに。
――ターゲティング広告で、さっき買った商品なのに延々としつこく追いかけて宣伝してきたりしますね。
加藤 そういう話です。あれはユーザー情報をただ照合しているから駄目なんであって――まあ、これは人工知能の話だけじゃないんですけど――データ構造や、サイト側でどうやってユーザーの属性情報を持つかとか、色々やりようがあるはず。大きな話にはなりますが、改善できる余地は相当あるなと思ってます。
清水 確かにそうですね。
加藤 僕はこれを「コンテンツテクノロジー」と名付けたんですけれども。
清水 「コンテク」ね(笑)。
加藤 コンテク。アドテクノロジーの上位互換になるような、そういうものがネットを包み込むようになると思っています。
――加藤さんが考えるコンテクって、どういうものですか。もうちょっと教えてもらっていいですか。
清水 AIで評価して、この人にマッチするコンテンツを出すってことでしょ?
加藤 そうですね。広義のコンテンツですよね。だから記事もあるし、広告もだし、ECもありうる。ユーザーが喜ぶものなら、なんでもいいと思います。
どうやって実現するかというと、記事の内容の解析と、ユーザー情報の解析のクロスだと思うんだけど、これが完璧にできていればもっとよくなるはず。
たとえば、清水さんが自分のブログでラズパイ(プロトタイピングボード「Raspberry Pi」のこと)の記事を書いたら、自動的にちゃんとラズパイの一番安くて買いやすいリンクが自動掲出されれば、読者はすぐ買うじゃないですか。さらにそのリンクからアフィリエイトを自動的に貼ってくれれば、収益も上がりますよね。僕はウェブ全部がそうなっていってもいいと思うんですよね。
清水 いや、本当にそうだ。
加藤 分析のベースになる情報はすべて揃ってるわけだから、技術的にも多分、もうできるんじゃないかなと思うんですよね。メディアやサービスを横断して掲出できるような仕組みをつくれれば、ウェブ全体の収益性が上がるんじゃないかなとすら思うわけです。
清水 いや、本当そうですね。アドテクには正義の人工知能が必要とされている。
加藤 もちろん、正義じゃない人工知能もこれからね、いっぱい出てくるとは思いますけれど。
清水 うん、まあ出てくるでしょうね。
加藤 そういえば、誰かがネットに書いてましたけど、キュレーションサイトのコンテンツつくるのに、人工知能って活用されてるんですか。
清水 ワードサラダ(適当な単語を組み合わせてデタラメな文章を生成するプログラム)を人工知能と呼ぶなら、人工知能です。
加藤 そういう、いろんなところから文章をコピペしてきてつくるツールがあるんですよね。
清水 そうそう。
加藤 それって、人工知能って言うほどのものでもない?
清水 まあ、それ言ったら、今や人工知能と言うほどのものとは何かってまた定義の問題になりますね。
広い意味では電卓だって人工知能と言えなくもないですから。だから「それは人工知能かどうか」というのは、この際あまり問題ではないと思いますが。強いて言えば、第三世代人工知能かどうか。
加藤 清水さんの人工知能の定義は、ディープラーニングを使ってるかどうか?
清水 最近出した本に関しては、そうですね。だから「よくわかる人工知能」に続いて先日出した本は「はじめての人工知能」じゃなくて「はじめての深層学習」(技術評論社刊)なんですよ。
加藤 ああ、なるほどね。それって、すごく誠実だけど、「人工知能」と書いた方が売れるんじゃないですか?と編集者としては思ってしまう(笑)。
清水 いや、やっぱり、エンジニアには嘘がすぐわかりますから。「人工知能」って書いて全然人工知能の話を書いてない本はいっぱいあるので、あえて「人工知能」って書かなかったんです。
加藤 たしかに、「人工知能」って書いていながら、中身でエキスパートシステムの話とかしてる本ってありますよね。
清水 いやほんとにね。結局、「人工知能って言ったら記号処理のことだ」っていう人が、旧来の専門家の99%なんですよ。
加藤 今まではそうですもんね。
清水 うん。昔から書いてきた先生とかに原稿を頼むとそうなっちゃう。さらに、その人たちは、本当に機械学習が大嫌いだから。
この連載の記事
-
第3回
ビジネス
人工知能が「売れる本」を見分けるようになる……かもしれない話 -
第1回
ビジネス
「もしドラ」のミリオンセラー編集者はなぜ人工知能にハマったか? - この連載の一覧へ