新清士の「メタバース・プレゼンス」 第39回
画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている
2023年10月16日 07時00分更新
ついにChatGPTでもDALL·E 3が使えるように
これと同時期に、月20ドルの有料課金で利用できるChatGPT Plusのユーザーを対象に画像解析機能が順次与えられるようになりました。「GPT-4V(ision)」ですね。
たとえば筆者が開発しているゲームのキービジュアルを入力すると、何の画像か説明してくれて、どんな意味を持っているか文章化できるようになりました。「このデータをプロンプトにまとめてくれ」と言い、Bingチャットに持っていくと、それっぽいものを出してくれます。この時点で、ChatGPTとDALL·E 3が合体すると強力になるんだなということが見えてきたわけです。
そして、その後いよいよChatGPT Plusで、順次DALL·E 3が利用できるようになり、組み合わせるととてつもなく強力だということがわかってきました。対話の柔軟度はChaGPTのほうがさすがにBingチャットより上で、いろいろ細かいところまで指示に付き合ってくれます。
たとえば「制服を来た少女が全速力で坂道を駆け抜ける姿」という指示で描いてもらいました。特にStable Diffusion v1.5は表情が苦手なのですが、DALL·E 3は表情も豊かに描いてくれました。追加で指定するたびに、新しいプロンプトのバリエーションを4種類生成して、それぞれで画像を作り出すという仕組みになっています。ただ、「もうちょっとスピードを上げて」とか、追加指示をしているうちに坂道がなくなってしまったりというところはありましたが。
ほかに驚いたのは、より複雑なバイクです。自転車が出せるのだから、バイクも出せるわけですが、この自然にバイクに人が乗っているクオリティは現状ほかの画像生成AIではなかなか簡単には出ません。
フェイク、著作物は対策済み
また、OpenAIは3日に「DALL·E 3 システムカード」というレポートを発表し、画像生成AIで生成される画像の安全性を確保するために、様々な仕組みを入れていることを報告しています。性的であったり、暴力的だったり、憎悪のシンボルであったりするようなものや、フェイクニュースとなりうるリアル性の高い画像が生成できないように、様々な対策が取られているようです。実際にそういう画像を作ろうとすると、拒絶されます。
ChatGPTでは、IP関連についてのレギュレーションも厳しく設定されているようです。
検証してみて面白かったのは「ガンダムが空を飛んでいる」という指示を出すと、プロンプトのなかには「ガンダム」が含まれないんですよ。IPが直接指示に入っているものについてはそれを回避するルールがあるようです。ただ、実際に出てくるものはガンダムっぽい何かなんですけど……(笑)。まだBing側はこのレギュレーションが入っていないようで、プロンプトにガンダムがそのまま入っているのですが、クラウド系サービスをやっている企業は、今後トラブルを避けるためにもIP関係が厳しくなっていくのだろうという予想はつきますね。
「ガンダムが空を飛んでいる姿を描いて」と指示して、ChatGPTが画像を生成しているところ。4種類のプロンプトが生成されてDALL·E 3が画像を生成しているが、ガンダムという単語がない。「giant robot, reminiscent of populer mecha designs(人気メカのデザインを彷彿とさせる巨大ロボット)」などと直接言及しないように言い換えている。
ちなみに別の例で、「ドラえもん」はどうかと言うと、そのままでは生成できませんでした。「ドラえもんの雰囲気を持つオリジナルキャラクターを」とすると、似たようななにかが生成されるようになりました。しかし、これがオリジナルと言えるかどうかはなかなか微妙な印象は受けます。
しかし、その後調整が入ったようで、ドラえもんだけでなく、「ドラえもんスタイル」といったものでは生成してくれなくなりました。ドラえもん風など、ドラえもんがプロンプトで直接触れていないワードにしないと生成してくれないようです。その結果、ドラえもんとはだいぶ違うものが生成されるようになっています。英語で生成されたプロンプトにはいずれも「ドラえもん」というワードは入っていません。
ただ、プロンプトの工夫で、回避方法はいくつもあるようです。しかし、IPに似たものを出そうとすると、生成者が意識して似せようとしないと似ないという傾向はあるようです。つまり、著作権侵害などが問題になったときに、プロンプトを確認すれば、生成者がどの程度、似せようとして作っていたかが明らかになるわけです。似せようとすればするほど、生成者の責任が重くなると考えることができそうです。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ














