[短期集中連載]AIとディープラーニングが起こす"知能革命" 第3回
「もしドラ」仕掛け人・加藤貞顕×人工知能プログラマー清水亮 徹底対談
人工知能が「売れる本」を見分けるようになる……かもしれない話
2017年02月20日 09時00分更新
短期集中連載「AIとディープラーニングが起こす"知能革命" 」。前回は、創作する人工知能には、実は人生という体験をAIにも体験させる必要があるのではないか?という仮説が語られました。
それでは自分の経験を人工知能に伝える、つまり人工知能を「弟子」にすることってできるの?というのが今回のテーマ。実は、「蒸留」というテクニックがそのヒントになるのではないか、と清水さんは語ります。お二人のトーク興味深い展開を続ける最終回、どうぞ!
海外で学習させた画像認識APIは日本では使い物にならない?
加藤 話を戻しますけど、「よくわかる人工知能」のインタビューの中で、東大の松尾先生が認識・運動・言語の順序で発展すると語っていたじゃないですか。そこで、本の中にはあまり出てこなかった「言語」の部分の見通しはどうなんでしょう?
清水 その話の根本は、なんで日本には記号処理系の人しかいないのかって話なんですよ。理由は簡単で、日本語が世界で一番特殊な言語の1つだからですよ。句読点があったりなかったりするし、日本語の文法がめちゃくちゃ難しい。
たとえば「風の谷のナウシカ」って、普通だったらこれ、「なんとか・オブ・なんとか・オブ・なんとか」なので、英語だったら特別な表記じゃないと絶対伝わらないですよ。でも、日本語で「風の谷のナウシカ」って突然書いてあってもみんな認識できてしまう。だから、固有名詞の翻訳すら難しいっていうのが日本語なんです。
加藤 うんうん、難しいですよね。
清水 だから、日本には記号処理の研究者が歴史的経緯で非常にたくさんいる。それに日本語に特化すると、逆に海外勢は進出してこれないという可能性がある。
加藤 ああ、日本語特化のエリアでは、言語の壁がありますからね。
清水 逆に外には行けない。
加藤 なるほど。それはやっぱり別の枠で処理が必要ですか、結局そこは?
清水 うん、それは必要ですね。だって英語と日本語の処理は全然違いますから。逆に言うと、英語で鍛えちゃってるAIは日本語でしゃべれません。ただそれも、そのうち上手いこといく可能性も出てきました。
加藤 中間言語みたいなやつですか?
清水 いや、そうではなくて機械翻訳、ニューラル翻訳がもっと精度が上がれば、別に最終的に英語でも日本語でも大丈夫で、むしろ日本語で書いたコンテンツを英語に翻訳して、英語圏でも通用するようになると思う。
加藤 なるほど。もうひとつ悩むのが、Googleが公開している画像に説明文を自動的につけてくれるCloud Vision APIとか見ると、もう自社で人工知能の技術開発をどこまでやるのか?意味あるのか?って考えてしまうんですよね。
清水 でもVision APIだって基本、外国人向けですから。実装してみると、実は日本ではほとんど使えないですよ。だって、つけ麺の絵を見せると「カルボナーラだ」って判定するんですから。
加藤 つけ麺を認識できないんだ(笑)。
清水 面白いでしょ、これ(笑)。
加藤 たしかに、(Vision APIからすると)見たことないもんなあ。つけ麺が認識できないんじゃ、たしかに使えないですね。じゃあやっぱり自社でちゃんと作り込むのは意味があるんですね。しかもまだ、今ならやったもん勝ちだと。
なるほどなあ。いや、これまでも自社でやってたんですけど、もっともっと本気出そうかな(笑)。アクセルをどのぐらい踏み込んでいくのかなっていうのがあったんですけど、まだまだ全然、やりようがありますね。
「売れる本」を見分ける人工知能のヒントは人のアタマの中にある
——ところでせっかくなので加藤さんにお聞きしますけど、cakesの人工知能まわりの開発は、どこと組んでやられてるんですか?
加藤 基本、自社開発ですよ。専門家のかたにコンサルしてもらったりもしてますけど。
僕たちは、特定のメディアを流行らせようっていうよりは、メディアの流通の仕組みをつくろうっていうモチベーションの方が実は強いんです。結局、「本」というメディアが盛り上がった理由というのは、出版というプラットフォームがあったからですよね。取り次ぎの存在と、本屋さんの存在がやっぱりすごく良くできていた。
出版社というのは極端に言うと、本を出すだけで儲けることができた。つまり、よくできたファイナンスと流通のしくみがあったのから日本の出版はもりあがったわけですね。でも、webはそれがあまりにも弱い。
——おっしゃるとおりですね。もう一点お聞きしたいのは、編集者としての加藤さんの目線で、コンテンツ産業へのAIの活用については、どんな風に期待をお持ちですか?
加藤 まず1つは、さっきの話とやや関係してるんですけど、コンテンツの質。これは編集者というよりは編集をする会社の代表として、記事や編集の質っていうものを評価する仕組みが欲しいんです。
清水 それを聞くと思い出すことがあります。加藤さんに初めて会ったときに、僕のブログと著者の岩崎夏海氏のブログを見て、「清水さんに本書いてもらおうかなと思ったけど先に岩崎さんに頼んだ」(それが後の大ベストセラー「もし高校野球の女子マネージャーがドラッカーの『マネジメント』を読んだら(もしドラ)」になった)っていう逸話があって。当時、なぜ僕じゃなくて、岩崎さんだったんだろうって思ったんですよね。
加藤 ああ、そんな話をしたことありましたね。
清水 でも、悔しいことに岩崎夏海の方が本は売れてる。加藤さんの中で、なぜ岩崎夏海の方がいけるって思ったんですかね。僕に言わせれば、もしドラって文章はかなり癖があって、あれが普通に受け入れられてるってことも結構すごいなと思ってるんですよ。
しかも、自分でそう思ってるのに、読み終わったら自分が泣いちゃってたっていう驚きね。AIと関係するかはよくわからないけど、加藤さんに会ったら改めて聞こうと思ってたんですよ。
きっとそこは、さっき加藤さんが言った「編集の質」の本質に絡むところだと僕は思ってるんですけど。
Image from Amazon.co.jp |
もし高校野球の女子マネージャーがドラッカーの『マネジメント』を読んだら |
加藤 なんで清水さんじゃなくて岩崎さんに先に声をかけたのかといえば、わりと話は単純で、やっぱりテーマがより大きかったからですよね。
清水 加藤さんが手がけたベストセラー「英語耳」の背景にある、英語を勉強している人は日本人の半分ぐらいいる、みたいな話?
加藤 そうです。テーマの大きさは、部数が出るものをつくろうっていう意味では、あたりまえですけど、重要ですよね。これは人工知能とぜんぜん関係なくって、マーケットの話ですけどね。
当時は100万部売れるような勢いのある本ってなんだ? って調べていたことがあって、ことあるごとに色々な場で話してるんですけど、テーマが相当大きな本しか100万部にはいかないんですよ。「家族」とか「健康」とか「青春」とか「恋愛」とか「お金」とか。
清水 人工知能やプログラミングの本ではテーマが狭いと。
加藤 そういうことになりますね。
清水 でも、僕が書きたいのは、こういうテーマだからなぁ……。
加藤 そうだと思ったんですよ。だから、清水さんにも、もちろん執筆をお願いはしたい気持ちはあったんだけど、やっぱり単純に当時の僕は、自分のリソースの制限として、年間5〜6冊ぐらいしか本を作れないから。そうすると、テーマが大きいところから順番にいくと清水さんに回らなかったっていうだけなんです。
清水 今更だけど、でも「もしドラ」の作りは変ですよね。女子高生と野球とドラッカーっていう。ドラッカーは普通、なんか100万部いかなそうじゃないですか。
加藤 ドラッカーだけだったら、まずいかないでしょうね。
清水 やっぱり野球が大事?
加藤 野球も女子高生も大事ですよね。結局、人間ってギャップが好き、意外性が好きじゃないですか。だからドラッカーと女子高生を組み合わせるとやっぱり「おっ」って思うんですよね。理由はわからないですけど。
あと、言うまでもないんだけど、「女の子」っていうのは非常に強いコンテンツで、かわいい女の子って男性は全員好きだし、女性も好きじゃないですか。そしてもちろん、あたりまえですが、それを岩崎さんがうまく書かれたということですよね。
Image from Amazon.co.jp |
よくわかる人工知能 最先端の人だけが知っているディープラーニングのひみつ |
この連載の記事
-
第2回
ビジネス
「創作する人工知能」を誕生させるために必要な条件 -
第1回
ビジネス
「もしドラ」のミリオンセラー編集者はなぜ人工知能にハマったか? - この連載の一覧へ