AIがマンガを、ストーリーを生み出す!
【2月16日、17日開催】NEDO「AI NEXT FORUM 2023」で展示される最新AI技術(4)
本特集では、2月16日・17日に開催されるNEDO「AI NEXT FORUM 2023」でも展示される、社会実装に向けた最前線のAI技術を、全10回にわたって紹介する。第4回は、キャラクターやストーリーなど、コンテンツを生成するAIだ。
NEDO「人と共に進化する次世代人工知能に関する技術開発事業」プロジェクト
「インタラクティブなストーリー型コンテンツ創作支援基盤の開発」
AIによるキャラやプロット自動生成でマンガ創作を支援
慶應義塾大学理工学部 教授の栗原聡氏は、マンガのようなコンテンツ創作をAIで支援する研究を進めている。AIを使って、キャラクターの顔を生成したり、ストーリーのプロットを作ったりして、クリエイターの創作を支援する。
もとは漫画の神様として知られる手塚治虫氏没後30年と、記憶メモリーを事業とするキオクシアのブランディングイベントとして始まった「TEZUKA2020」がきっかけだ。「TEZUKA2020」は記憶することが新しいものを生み出す、AIを使って漫画を作りましょうというプロジェクトだった。当時、栗原氏らが実際に作業にかけられた時間は1、2ヶ月程度だったが、実際にマンガ家とコラボして製作したマンガ「ぱいどん」は講談社の週刊漫画雑誌「モーニング」に掲載されて、話題になった。栗原氏は「売れる雑誌に耐えうるものが出せた。現場で勝負できたのは大きかった」と振り返る。
いまのAIは基本的には効率化、すなわち無駄をなくすことに使われている。だが「合理化はいずれ終わる」と栗原氏は語る。「いま、いろいろなコンテンツがあふれている。チャネルも増えている。でもコンテンツを作るところは未だに人間。企業のPRのためのシナリオも人間が作っている。そうするとライターやコンサルにしわ寄せがいく。人が創作力を発揮できるコンテンツにおいて、如何に良質なものを多く作れるか。そういうところでのAI活用はまだされていない」。単に新しい使い方を模索するだけではなく、トップクリエイターに使われるものを目指している。海外への展開も視野に入れているという。
気づきとセレンディピティをシステマティックに増やす
では、どんなサポートをすれば人の創造力は引き出せるのだろうか。プロジェクトでは「創造」とは「気づくこと」だと考えて、その「気づき」をシステムがお膳立てしようと考えている。「気づき」は多ければ多いほど良い。同時にセレンティビティ、すなわち偶然の出会い、それまでは自分でも関係ないと思っていたこと、興味がなかったことにも面白さを発見できる新たな発見の機会を増やしたいと考えたという。ではどうすれば「気づき」や「セレンティビティ」をシステマティックに増やせるのか。
優秀なクリエイターは「引き出しが多い」と言われる。その引き出しと引き出しをネットワーク化してくっつける、あるいは何かしらの中継点を見出して繋げることができれば、新たな気づきになるかもしれない。セレンティビティは外側からポンと与える。こうすることで、「人間の創造力がAIとコラボすることで創作物が量産できるのではないか。人とAIの共進化ができるのではないか」と栗原氏は語る。
キャラデザインの自動生成
学習データにないほどの極端な誇張
実際に行なっている取り組みは3つだ。一つ目はキャラクターデザインの生成だ。前述の「ぱいどん」のときにも行われた試みだが、当時はAIにさまざまなキャラ原画を生成させたものの、実際には絵を描くマンガ画家がその中から選んだものを加筆して仕上げるという作業に留まっていた。本来は人と人工知能が常にインタラクション、やりとりしながら作っていくようにしたいと栗原氏は考えた。
たとえば、手塚マンガで有名なキャラクターの「御茶ノ水博士」は鼻がとても大きい。このような絵は、現在流行している画像生成AIを使っても出てはこない。もともとの学習データにそんな顔はないからだ。では手塚治虫はどういうふうに作ったか。最初のキャラ原案では鼻の大きさも普通で、そこに部分的な誇張を施し、試行錯誤しながら作ったのだという。
そこで栗原氏らも、まず平均顔を作成し、個性を際立たせるために如何に誇張を施すかということを自動化することに取り組んだ。マンガの顔を生成するための学習データは実は数が少ない。通常、AIでリアリスティックな顔を生成する場合、だいたい正面から見た画像を作る。しかしマンガは写真と違って点と線で構成されており、もともと情報が少ない。また正面から見た顔が少ないのだ。
そこで既存技術を使いながら、いかに少ないデータでクオリティーの高いデータを作れるかに取り組んだ。学習データにないほどの強い誇張を行うには生成系のAIの一つ「NaviGAN」が有望であることを見出し、残り2年のプロジェクト期間を使ってさらに良いキャラクターを生成することに取り組む。AIが作り出す絵を見て、絵描きがインスピレーションを受ける場合もあるし、絵描きが『目や鼻をこうしたい』というと、AIがさらに一歩先を行く絵を出す、といった使いかたを想定している。なお今のところ、生成するのは顔だけだ。
プロットの自動生成
二つ目の取り組みがプロットの自動生成だ。OpenAIによる「GPT-3」のような大規模言語モデルは滑らかな自然言語での応答を生成できることから、大いに話題になっている。だが「1時間もののドラマのシナリオを出せるかというと出せない。まだプロのシナリオライターレベルの物語性や構造を持つものは生成できない」(栗原氏)。そこでプロジェクトでは実際にドラマや映画に耐えるシナリオプロットを自動生成することに取り組んでいる。
「物語には必ず型がある」と栗原氏は語る。型とは、一定の流れだ。基本的な流れに乗った物語が人を感動させる。その型構造の骨組みを自動生成し、肉付けには既存の人工知能技術を使うという取り組みを進めている。「欲しいジャンルの骨組みに則った物語を無尽蔵に出せる」ようになるという。
「クリエイターは奇抜性を好む傾向がある」と仮定し、奇抜性が高くなるよう始まりと終わりの距離が大きければ大きいほど良いとし、その間をAIが埋めることで、物語展開の構造を保ちつつ評価が高いプロットの自動生成を目指している。「欲しい物語構造のパーツに合った文章を吐き出させることができる」ものになるという。また、手作業でジャンル横断的な物語構造解析データを生成しており、そこから人間がどのような物語を好んできたかを整理・ルールを解明するための取り組みも進めている。
自律型AIを使ったセリフや物語の自動生成も
3つ目は自律エージェントを使ったアプローチである。汎用型人工知能を目指す取り組みで、たとえば喫茶店やストリートなど、一定の環境下で自律型人工知能エージェントを自由に動かし、そこで偶然起きるイベントを使ってシナリオを生成する。人が作り込むのではない。それぞれのエージェントは自分の役割に従って人工的に作られた箱庭の日常世界で暮らしている。そのなかで、人が作った物語に従って動く黒子的キャラクターを投入し、イベントを起こす。
つまり、大雑把なあらすじは決まっているが、細部はエージェントたちの振る舞いによって決まり、さまざまな物語展開が起こりえる。セリフについても、具体的にどういうセリフをいうかは言語モデルを使って自動生成する。「細かい部分はアドリブでやってほしい」というわけだ。
キャラクターが自律的に破綻なく動作するためには常識、すなわち膨大な暗黙知が必要だ。要するに「こういうときはこうする」といった知識、常識だ。それは大規模言語モデルから取り出して、アフォーダンスとしてプランナーに組み込む。これは自律型のAIを作るためのコアの仕掛けとして使えると考えている。
プロが使えるツール開発を目指す
プロジェクトメンバーには手塚プロダクション、ヒストリア、エッジワークス、ネオンテトラ、Alesといったコンテンツ関連企業が並んでおり、最初から事業化を念頭に置いている。 「どういうニーズがあるのかは彼らのほうがプロ。あとは2年で実際に使いながらコンテンツを作ってもらう」(栗原氏)。「いまのAIは一気に全部作ってしまうのでインタラクティブ性がない。人とやりとりして変えていけるのが僕らの技術の特徴」だという。
プロジェクトでは一般ユーザー向けとプロが使うツールの2種類を開発する予定だ。どちらもまだ使えるレベルには至ってない。「プロが本当に使ってみて まずはどれだけ使えるのか、使いものになるのか。僕ら自身が作ってみないといけないと思っている。おそらく2023年には発表できると思う」(栗原氏)。
画像生成、文章生成、自律型人工知能の3種類を開発することで壁を越えることを目指す。何かしら大きなブレイクスルーは出していけるのではないかと考えているという。「創造は難しい。僕らのシステムは素材を繋ぐことで新しいものを生み出す。人の持つ『繋ぐ』能力をいかに押し上げられるかに取り組んでいる」(栗原氏)。
開催概要
名称:AI NEXT FORUM 2023-ビジネスとAI最新技術が出会う、新たなイノベーションが芽生える-
日時:2023年2月16日(木)、17日(金)10時00分~17時00分
場所:ベルサール御成門タワー「4Fホール」(〒105-0011 東京都港区芝公園1-1-1 住友不動産御成門タワー4F)
アクセス:都営三田線 御成門駅 A3b出口直結、都営大江戸線・浅草線 大門駅 A6出口徒歩6分、JR浜松町駅 北口徒歩10分、東京モノレール 浜松町駅 北口徒歩11分
参加:無料(事前登録制)
内容:AI技術に関する研究成果を実機やポスター展示などにより対面形式で解説(出展数:最大44件)、各種講演やトークセッションを実施(会場参加とオンライン配信のハイブリッド形式)
主催:国立研究開発法人新エネルギー・産業技術総合開発機構
運営委託先:株式会社角川アスキー総合研究所