新清士の「メタバース・プレゼンス」 第38回
伝説のアニメ「serial expeliments lain」をAI化したワケ
アニメ業界で“生成AI”に挑んだ実験の裏側
2023年10月02日 07時00分更新
レスポンスが遅いのはなぜなのか
西山 テキストを送信してから応答までに数秒かかっているのは、LLMだけでもAPIを合計3回叩いているからです。そこに生まれるタイムラグには、デザイナーさんに作ってもらったキーボードのタッチ音が入ることで体験上の緩和があります。これ以上早くしようとすると、他の人のキャッシュを出すなどの調整が必要になるんですが、それは個人データになってしまう。使う人もプライベートな会話をしたくなくなってしまうので、それは使わないようにしています。
上田 不思議なのは、スマホの音声入力でやったほうが近未来感が出るかなと思って試してみたんですが、返答にディレイがあると会話している感じがしないんですよね。テキストのほうが逆にいい。キーボードでやりとりする方が会話している感じがしてるかなぁ。
会話内容について教えてほしい
西山 会話内容は変なことを言わない、ユーザーを傷つけないというのはOpenAIが一番気にしているところだと思っています。もし完全にオープンソースのLLMで(AI lainを)作ることになったら、そのあたりをすべて自分たちでやる必要がある。人間とキャラクターの関係なので、本当に信じこんでしまうとよくない方向にいく未来があるので難しい。
上田 当初「天気も時間も知りたいから日常の情報を返せないか」とリクエストしたんですが、それはユーザーのGPS情報など個人情報が関わってくるので諦めざるをえなかったですね。昔はインターネットに転がっていればなんでも共有しようという認識だったけど、今はそういう時代じゃなくなった。
西山 マイクロソフトが出しているBingトレンドのAPIは今のトレンドを取れるんですけど、APIが1コールいくらと決まっていて、キャッシュをしてはいけないという規約があるので非常に高額なんですよね。情報を外部から取りたいけど、お金の制約と、情報の中身が過激な情報だったらどうするかという内容側の制約があって。
上田 XのTLみたいに「渋谷めっちゃ混んでる」というリアルタイムの情報を扱えると面白いけど、実際には「ポケモンGO」じゃないけど田舎に行くとモンスターがいないみたいな地域格差の問題があるよなぁと。「田舎いつも空いてるぜ」って情報にあまり価値がない。話は飛びますが「ポケモンGO」って素晴らしいですよね。家にこもっていた人たちを外に連れ出しただけでも本当に素晴らしい。ソフトウェアとかの役割としてそんな風に社会との関わり方が持てたらいいですよね。AI lainもそういうとこまでになれたらなぁと、絶対無理だろうけど(笑)。
音声はどうやって作っていったのか
西山 (音声を学習させてモデルを作る)CoeFontは読みとアクセントとスピードの調整ができるので、そこでキャラクターらしさを表している形です。このPoCはもともと音声学習ソフトの「RVC」でやっていて、僕もRVCのコミッターになって関わっていたこともあります。ただ、RVCだと、音声の生成の遅延がどうしても大きくなってしまう。グーグルのtext 2 speechをしたあと、speech 2 speechでRVCにかけるとなると、合計30秒くらいかかってしまいました。その点CoeFontさんのほうが(生成時間としては)圧倒的に優秀だったんですよね。
中村 (感情表現の少ない音声は)ちょうどいいですよね。感情表現が豊かなキャラクターだとまだAIの音声はちょっと違和感があるので。
上田 今回、英語音声に挑戦できたのがすごくうれしかったんだけど、あんまり海外はピンと来てないみたいだな……。我々(日本人)は機械とか道具に対し、捨てる時に「お世話になりました」と感謝するくらいの人種だけど、海外では「AIは機械」と割り切っているって聞くし、そもそも今回のサービスがわかりづらい。もうちょい「ワーッ」となるのかと思ったら、大してならなかったね。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ





