[短期集中連載]AIとディープラーニングが起こす"知能革命" 第1回
「もしドラ」仕掛け人・加藤貞顕×人工知能プログラマー清水亮 徹底対談
「もしドラ」のミリオンセラー編集者はなぜ人工知能にハマったか?
2017年02月01日 07時00分更新
ディープラーニング技術によって実現される人工知能の今とこれからを天才プログラマーの視線を通して語る解説書「よくわかる人工知能」。人工知能はさまざまなサービスや産業への導入を目指した開発が本格化していますが、「知能」というからには、コンテンツ産業への応用だって、他人事ではないはず。
その答えを聞くには、コンテンツを知り尽くした編集者に聞くしかありません。
そこでお声掛けしたのは、ミリオンセラーのビジネス書として知られる「もしドラ」(ダイヤモンド社刊)の仕掛け人・加藤貞顕さん。加藤さんは自身がやり手編集者でもありながら、コンテンツプラットフォーム「cakes」を運営する会社のCEOでもあります。
加藤さんはいま、cakesに人工知能を組み込んで、新しい試みを始めていると言います。加藤さんが構想している"人工知能でコンテンツ産業を発展させるアイデア"、そして編集者として人工知能とどう付き合ったいくのか? 人工知能はコンテンツ産業の未来にどういう影響を与えるのか?などを存分に語っていただきました。
それでは、注目の対談のスタートです!
人工知能がメディアサイトの収益化モデルを変える
加藤 ご無沙汰してます。
清水 こちらこそ、お久しぶりです。
——お二人は以前からつながりあるんですよね?
加藤 結構前から、清水さんとは編集者として知り合いなんですよ。UEIさんは前はゲームの会社という印象でしたが、最近は、人工知能の会社になってるみたいですけど。
清水 いまは人工知能ですね。加藤さんは「もしドラ」(もし高校野球の女子マネージャーがドラッカーの『マネジメント』を読んだら )や「スタバではグランデを買え!」なんかのベストセラーを手がけたあと、独立されてコンテンツプラットフォームを運営されてますよね。
加藤 はい。弊社が運営してるのはまず、「cakes(ケイクス)」というコンテンツプラットフォームです。B to CあるいはB to B to Cのプラットフォームで、つまり、我々自身がコンテンツをつくって発表することに加えて、出版社などのコンテンツホルダーがコンテンツを掲載できる場としても使えるようにもなっています。「ゼロ」、「嫌われる勇気」(ダイヤモンド社刊)、「マチネの終わりに」(毎日新聞出版刊)とか、cakesで連載してから発売した本がたくさんベストセラーになってます。
それから、「note(ノート)」というサービスもやってます。これはC to C、クリエイターが自由にコンテンツを発表するサービスです。
弊社では今、その2つのサービスを運営しているんですけれど、実は僕らのモチベーションの根本にあるのは、"インターネットの世界において、メディアビジネスの収益化があまりにも遅れている"ということです。たとえば2016年末の大ニュースになったキュレーションサイトの問題もまさにそのせいで起きたことだと思っていて。要するに、あんまり儲からないからコピペで「仕入れ値」を下げたわけでしょ。
清水 おっしゃる通りですね。
加藤 いまメディアを収益化するモデルっていうのは、従来どおりの広告収入と、それからターゲティング広告に代表されるようなアドテクノロジー(以下、アドテク)になります。極論を言うと、それ以外はないという状況で、改善の余地が相当あるだろうと思ってるんです。
そして今、僕らはcakesの裏側で人工知能を使い出しています。今アプリケーションとして公開しているのはレコメンドエンジンぐらいなんですけど、自然言語処理を上手く使うことによって、たとえば読者に的確な広告を見てもらえたり、ユーザーの行動解析をすることによって集客のエンジンになり得たり、いろんなことが可能になる。その辺の実装と分析を、サービス開発の一環でやっています。しかもそれを、B to Bで外部に提供もしていこうと思っています。
清水 なるほど、それはいいですね。
加藤 これまでのインターネットって、インフラ整備の段階だったと思うんですよね。だいたいそれが終わって、今後はメディアビジネスがもっと流行していくだろうと思っています。それで、アドテクノロジーというのが、いままでのネットのファイナンスのエンジンだったわけですが、どうやらそれだけでは足りない。だから、より収益性を高める「コンテンツテクノロジー」が必要だと思っています。その根幹技術としてAIが必要になるだろうなと考えて、今投資をしています。だから清水さんにその辺の可能性や、こんな使い方がある、という現実的な話を今日はいろいろ伺いたいなと思ってきました。
清水 だいぶハードルの高い話ですね。間違ったことを言わないように発言に気をつけないと(笑)。
加藤 それともうひとつ、これも事業に関わる話でもあるんですけど、別の方面では、コンテンツと人のあり方というところに、おそらくAIそのものが入ってくる。つまり、AIがクリエイターやクリエイターの補助として入ってくる可能性が大いにあるので、その辺りがどうなっていくのかという見通しもお聞きしたいと思ってます。
——それでは、今日は「よくわかる人工知能」とは趣向を変えて、加藤さんがインタビュアー、清水さんがインタビュイーってことで進めましょうか。
加藤 いいですね。それでお願いします。
「よくわかる人工知能」(KADOKAWA アスキー・メディアワークス刊)も、「はじめての深層学習(ディープラーニング)プログラミング」(技術評論社刊)も、自然言語処理の話はそんなにやってないですよね。
1,836円
2,462円
清水 はい、それには理由があって。まず第1に、自然言語処理ってディープラーニングの分野じゃないんですよ。
加藤 ああ、なるほど。
清水 基本的には、ですけどね。だけど、最近は自然言語処理を機械学習でやるということが増えてきた。だから全く無関係じゃなくなってきた、という経緯があります。
人工知能の産業利用において気を付けたいのは、企業が人工知能をやろうっていう話になると、すぐみんな「自然言語処理が得意な人を雇います」って言うんですよ。あるアプリのベンチャー企業と話したときも、「自然言語処理の技術者を雇う」って言っていて、僕には疑問でした。「あなたは本当に、“自然言語処理の技術者”が何をしてる人なのか理解してるの?」って深掘りして聞いたら、やっぱり、あまりわかってはいなかった。「自然言語処理」と言った瞬間に思考停止してブラックボックスになってしまってる。基本的には今の自然言語処理と言われてるものは、大体は記号処理なんですよ。要するに構文解析とか品詞分解とか。
加藤 昔からある手法ですよね。
清水 そうです。そして、その分野は、別に最近何か目覚ましい成果があるわけでもない。だからその分野がいくらできるっていう人を集めても、正直、アリ10万匹で原子力空母と戦うみたいな話なんですよ。
ディープラーニングの成果が自然言語処理の分野でも出始めた
清水 ただしその一方で、NLP=自然言語処理=Natural Language Processingの分野では、ディープラーニングが非常に大きな効果を上げつつあります。たとえば、「よくわかる人工知能」に出ているものでは、Seq2Seq(ある記号列から別の記号列への変換を深層学習する手法)がそれですね。シーケンスとシーケンスを照合して学習させることで、コンピューターと会話できるようになるとか。
加藤 「よくわかる人工知能」に書いてあった、Googleが映画の字幕から会話AIを作り出したエピソードですね。あの話は相当面白かったですね。
清水 ニューラルネットワークに字幕を見せ続けただけで、知的な会話ができるAIが作れてしまうって話ですからね。あとは最近ではGoogleの「ニューラル翻訳」。
加藤 Google翻訳が急に自然になってきてますよね。あれはすごい成果です。
清水 この翻訳も基本、全部Seq2Seqなんですよ、言ってみれば。あとは、ありそうなのはWord2Vec。「よくわかる人工知能」のヤフー研究所にお邪魔した際のエピソードで少し言及してます。
加藤 弊社も文章の特徴を抽出する技術のDoc2Vecを採用して、コンテンツの中身を見て、似たコンテツをおすすめするレコメンドエンジンをつくっています。
これを各記事の下に出すわけですが、以前は普通に記事のランキングを出していたんですよね。ランキングと人工知能レコメンドをABテストして、ある時期から人工知能が勝つようになったので、基本、人工知能レコメンドに切り替えました。
清水 厳密に言うと、人工知能というよりは機械学習といったほうがいいかもしれないけど。
加藤 あ、そういう言葉は、難しいところですね(笑)。ぼくらが使っているDoc2Vecは3層のニューラルネットワークですが、この場合は人工知能というよりも機械学習って言うのが正確ですかね?
清水 それだと広い意味での機械学習だと思いますね。
加藤 なるほど。うちはさっきのレコメンドエンジンとは別に、他の課題でディープラーニングの活用もやっています。だから総称で「コンテンツビジネスへの人工知能の活用」と言ってます。ただ、レコメンドに関しては今のやりかたがリーズナブルにできるので、まずはそうしているわけです。
清水 コンテンツへの人工知能の応用は2段階あって、今回の文章を解析する自然言語処理の話で言うと、まず1つは文章の塊を何かしらAIに学習させて、ここから特徴ベクトルを取り出します。
特徴ベクトルを特徴空間にマッピングしていって、「ある特徴ベクトルを持った文章」と近い文章を探します。これを「近傍探索」って言うんですけど、そうするとこの本と似た本が出てきますよっていうのが1つ。
加藤 はい。それはまさにcakesのリコメンドでやってることです。
清水 そうです。要はベクトルなので何らかの空間に存在してる。ベクトルである以上、距離も測れるし足し算や引き算もできる。この話は厳密にはAIじゃないんですけど、AI的な考え方の根本はまずここにあるんですね。
ただ、特徴ベクトルをどのように把握するか、導くかっていう手法がAIであるかどうかは重要です。もっといえば、機械が特徴を自動的に抽出していれば深層学習と言えるけど、人間が特徴量の検出方法を設計している場合は単なる機械学習です。たとえばよく使われるWord2Vecのようなライブラリは深層学習ではない。あれは単語と単語の出現距離で特徴ベクトルを割り出すわけです。つまり人間が「特徴量は出現距離をもとにする」と決めてるわけですね。でも実際にはそれだけでも意外と使えるぞ、ってことで使ってるだけであって。
加藤 意外といい結果が出るんですよね。
清水 ただそれはあくまで「意外と」なんですよ。
この連載の記事
-
第3回
ビジネス
人工知能が「売れる本」を見分けるようになる……かもしれない話 -
第2回
ビジネス
「創作する人工知能」を誕生させるために必要な条件 - この連載の一覧へ