画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている

2023年10月16日 07時00分更新

文● 新清士　編集●ASCII

ついにChatGPTでもDALL·E 3が使えるように

　これと同時期に、月20ドルの有料課金で利用できるChatGPT Plusのユーザーを対象に画像解析機能が順次与えられるようになりました。「GPT-4V（ision）」ですね。

　たとえば筆者が開発しているゲームのキービジュアルを入力すると、何の画像か説明してくれて、どんな意味を持っているか文章化できるようになりました。「このデータをプロンプトにまとめてくれ」と言い、Bingチャットに持っていくと、それっぽいものを出してくれます。この時点で、ChatGPTとDALL·E 3が合体すると強力になるんだなということが見えてきたわけです。

筆者が開発中のゲーム「EXELIO-エグゼリオ」のキービジュアルを試しに分析させてみた。かなり複雑な要素を的確に解釈しているのがわかる

GPT-4Vで作成したプロンプトを、Bing Image Creatorに持ち込んで生成した画像。オリジナルのイメージの雰囲気をそれなりに再現できている

　そして、その後いよいよChatGPT Plusで、順次DALL·E 3が利用できるようになり、組み合わせるととてつもなく強力だということがわかってきました。対話の柔軟度はChaGPTのほうがさすがにBingチャットより上で、いろいろ細かいところまで指示に付き合ってくれます。

　たとえば「制服を来た少女が全速力で坂道を駆け抜ける姿」という指示で描いてもらいました。特にStable Diffusion v1.5は表情が苦手なのですが、DALL·E 3は表情も豊かに描いてくれました。追加で指定するたびに、新しいプロンプトのバリエーションを4種類生成して、それぞれで画像を作り出すという仕組みになっています。ただ、「もうちょっとスピードを上げて」とか、追加指示をしているうちに坂道がなくなってしまったりというところはありましたが。

自転車と人間との描写の自然さ、表情に疾走感と、これまでの画像生成AIでは描写できなかった生き生きとした表情を作り出すことに成功している

　ほかに驚いたのは、より複雑なバイクです。自転車が出せるのだから、バイクも出せるわけですが、この自然にバイクに人が乗っているクオリティは現状ほかの画像生成AIではなかなか簡単には出ません。

フェイク、著作物は対策済み

　また、OpenAIは3日に「DALL·E 3 システムカード」というレポートを発表し、画像生成AIで生成される画像の安全性を確保するために、様々な仕組みを入れていることを報告しています。性的であったり、暴力的だったり、憎悪のシンボルであったりするようなものや、フェイクニュースとなりうるリアル性の高い画像が生成できないように、様々な対策が取られているようです。実際にそういう画像を作ろうとすると、拒絶されます。

フェイク画像の様なものを作ろうと試みると、Bingチャット（上）も、ChatGPT（下）にも拒否される

　ChatGPTでは、IP関連についてのレギュレーションも厳しく設定されているようです。

　検証してみて面白かったのは「ガンダムが空を飛んでいる」という指示を出すと、プロンプトのなかには「ガンダム」が含まれないんですよ。IPが直接指示に入っているものについてはそれを回避するルールがあるようです。ただ、実際に出てくるものはガンダムっぽい何かなんですけど……（笑）。まだBing側はこのレギュレーションが入っていないようで、プロンプトにガンダムがそのまま入っているのですが、クラウド系サービスをやっている企業は、今後トラブルを避けるためにもIP関係が厳しくなっていくのだろうという予想はつきますね。

「ガンダムが空を飛んでいる姿を描いて」と指示して、ChatGPTが画像を生成しているところ。４種類のプロンプトが生成されてDALL·E 3が画像を生成しているが、ガンダムという単語がない。「giant robot, reminiscent of populer mecha designs（人気メカのデザインを彷彿とさせる巨大ロボット）」などと直接言及しないように言い換えている。

生成された結果。ガンダム風の画像は出ているが、スタイルと言える余地は生み出されている

　ちなみに別の例で、「ドラえもん」はどうかと言うと、そのままでは生成できませんでした。「ドラえもんの雰囲気を持つオリジナルキャラクターを」とすると、似たようななにかが生成されるようになりました。しかし、これがオリジナルと言えるかどうかはなかなか微妙な印象は受けます。

　しかし、その後調整が入ったようで、ドラえもんだけでなく、「ドラえもんスタイル」といったものでは生成してくれなくなりました。ドラえもん風など、ドラえもんがプロンプトで直接触れていないワードにしないと生成してくれないようです。その結果、ドラえもんとはだいぶ違うものが生成されるようになっています。英語で生成されたプロンプトにはいずれも「ドラえもん」というワードは入っていません。

　ただ、プロンプトの工夫で、回避方法はいくつもあるようです。しかし、IPに似たものを出そうとすると、生成者が意識して似せようとしないと似ないという傾向はあるようです。つまり、著作権侵害などが問題になったときに、プロンプトを確認すれば、生成者がどの程度、似せようとして作っていたかが明らかになるわけです。似せようとすればするほど、生成者の責任が重くなると考えることができそうです。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている

ついにChatGPTでもDALL·E 3が使えるように

フェイク、著作物は対策済み

この連載の記事

この記事の編集者は以下の記事をオススメしています

AI 画像生成AIに“表現の自由”を スーパーハッカーが挑んだ「Fooocus」

AI アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化

AI 商用利用OKのAIイラスト生成サービス「Emi」使ってみた

トピックス グーグル、検索サービスで“画像生成AI”をテスト中。マイクロソフトを追いかける格好に

AI マイクロソフト、Bing AIの脆弱性見つけたら最大1万5000ドルの報奨金プログラム

AI スマホで画像生成AIが使える時代、“来歴情報”は必要不可欠になる

AI ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に

AI Adobeやグーグル、AIの売り込み進める｜AIニュースまとめて解説

AI 鴻海、NVIDIAと提携しAI工場建設へ

AI ChatGPTで「単純な会話から画像生成」が可能に！ DALL・E 3がChatGPT PlusとEnterpriseに対応

PC Edge搭載の画像生成AI「DALL・E」がグレードアップしてさらにすごくなった

トピックス 「Adobe MAX 2023」注目の生成AI新機能・新サービス、アップデートまとめ

AI 画像生成AI「Midjourney」で4K画像が出せる！ アップスケーリングで最大4倍に

トピックス 朝日新聞社、記事校正履歴を学習させたAI搭載の校正支援ツール「Typoless」

AI Stability AI Japan、最高水準の日本語言語モデル2種を公開

AI Yahoo!ニュース、GPT-4を用いたコメント要約機能の試験提供を開始

ビジネス 生成AIにアーティストが反撃する技術／「CAPTCHA」の終わりの始まり

トピックス デジタルハリウッド大学大学院、AIについて有識者と語る連続セミナー開催のお知らせ

AI 3Dスキャンの進化がすごい。今なら無料で高精度、しかも簡単！

AI X、ChatGPT対抗のAIチャット「Grok」 有料会員向けに先行開始

AI グーグル、24時間先まで2分ごとの気象予測を可能に 高性能なニューラル気象モデル「MetNet-3」

PC Windows 11のタスクバーを使いやすいようにカスタマイズする方法

AI OpenAI発表まとめ カスタ厶版「ChatGPT」作成機能、128Kの長文入力に対応した「GPT-4 Turbo」など盛りだくさん

AI Adobe StockでAI生成の「破壊されたガザ地区」画像が販売される

AI 伊藤園がAIタレントを使ったワケ

AI アップル新型「MacBook Pro」生成AIを意識したスペックに｜AIニュースまとめて解説

AI GitHub、GPT-4でコードを提案・説明してくれるチャットAI 一般提供開始へ

AI マイクロソフト、ChatGPTの社内利用を一時制限か セキュリティ上の懸念で

AI 世界が変わる。ChatGPT新機能、有料ユーザー全員が使えるように

PC Windows 11「エクスプローラー」が進化！ 新UIで効率アップする方法

AI アマゾン、ChatGPT（GPT-4）超えのAIモデル開発か その名も「Olympus」

AI 爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに

AI ChatGPTで収益化も可能「GPT ストア」を11月末に立ち上げ

AI Stability AI、商用利用可能な日本語画像言語モデル「Japanese Stable VLM」

AI NTTと元グーグル研究者による「Sakana AI」アーキテクチャーの研究開発で連携

AI Youtube、生成AI利用コンテンツの開示を義務付け。従わない場合罰則も

AI AWSの生成AIプラットフォーム「Amazom Bedrock」でメタの最新LLM「Llama 2」利用可能に

AI マイクロソフト、GPTsに続いてカスタム「Copilot」作成ツールを発表 Bing Chatは「Copilot」に改称

AI 世界トップ級の画像生成AI「Midjourney」更に強力に。ライバル「Stable Diffusion」との違いもはっきり

AI OpenAIサム・アルトマンCEO電撃解任。復帰の道は？

AI OpenAI電撃解任のサム・アルトマン氏、今度はマイクロソフトに電撃入社

AI OpenAI従業員の9割、アルトマン復帰なければ退職と署名

AI これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした

AIオススメ記事

ピックアップ

AI
画像生成AIに“表現の自由”を　スーパーハッカーが挑んだ「Fooocus」

AI
アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化

AI
商用利用OKのAIイラスト生成サービス「Emi」使ってみた

トピックス
グーグル、検索サービスで“画像生成AI”をテスト中。マイクロソフトを追いかける格好に

AI
マイクロソフト、Bing AIの脆弱性見つけたら最大1万5000ドルの報奨金プログラム

AI
スマホで画像生成AIが使える時代、“来歴情報”は必要不可欠になる

AI
ChatGPT対抗の本命「Claude 2」ついに日本でも利用可能に

AI
Adobeやグーグル、AIの売り込み進める｜AIニュースまとめて解説

AI
鴻海、NVIDIAと提携しAI工場建設へ

AI
ChatGPTで「単純な会話から画像生成」が可能に！ DALL・E 3がChatGPT PlusとEnterpriseに対応

PC
Edge搭載の画像生成AI「DALL・E」がグレードアップしてさらにすごくなった

トピックス
「Adobe MAX 2023」注目の生成AI新機能・新サービス、アップデートまとめ

AI
画像生成AI「Midjourney」で4K画像が出せる！アップスケーリングで最大4倍に

トピックス
朝日新聞社、記事校正履歴を学習させたAI搭載の校正支援ツール「Typoless」

AI
Stability AI Japan、最高水準の日本語言語モデル2種を公開

AI
Yahoo!ニュース、GPT-4を用いたコメント要約機能の試験提供を開始

ビジネス
生成AIにアーティストが反撃する技術／「CAPTCHA」の終わりの始まり

トピックス
デジタルハリウッド大学大学院、AIについて有識者と語る連続セミナー開催のお知らせ

AI
3Dスキャンの進化がすごい。今なら無料で高精度、しかも簡単！

AI
X、ChatGPT対抗のAIチャット「Grok」　有料会員向けに先行開始

AI
グーグル、24時間先まで2分ごとの気象予測を可能に　高性能なニューラル気象モデル「MetNet-3」

PC
Windows 11のタスクバーを使いやすいようにカスタマイズする方法

AI
OpenAI発表まとめ　カスタ厶版「ChatGPT」作成機能、128Kの長文入力に対応した「GPT-4 Turbo」など盛りだくさん

AI
Adobe StockでAI生成の「破壊されたガザ地区」画像が販売される

AI
伊藤園がAIタレントを使ったワケ

AI
アップル新型「MacBook Pro」生成AIを意識したスペックに｜AIニュースまとめて解説

AI
GitHub、GPT-4でコードを提案・説明してくれるチャットAI 一般提供開始へ

AI
マイクロソフト、ChatGPTの社内利用を一時制限か　セキュリティ上の懸念で

AI
世界が変わる。ChatGPT新機能、有料ユーザー全員が使えるように

PC
Windows 11「エクスプローラー」が進化！新UIで効率アップする方法

AI
アマゾン、ChatGPT（GPT-4）超えのAIモデル開発か　その名も「Olympus」

AI
爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに

AI
ChatGPTで収益化も可能「GPT ストア」を11月末に立ち上げ

AI
Stability AI、商用利用可能な日本語画像言語モデル「Japanese Stable VLM」

AI
NTTと元グーグル研究者による「Sakana AI」アーキテクチャーの研究開発で連携

AI
Youtube、生成AI利用コンテンツの開示を義務付け。従わない場合罰則も

AI
AWSの生成AIプラットフォーム「Amazom Bedrock」でメタの最新LLM「Llama 2」利用可能に

AI
マイクロソフト、GPTsに続いてカスタム「Copilot」作成ツールを発表　Bing Chatは「Copilot」に改称

AI
世界トップ級の画像生成AI「Midjourney」更に強力に。ライバル「Stable Diffusion」との違いもはっきり

AI
OpenAIサム・アルトマンCEO電撃解任。復帰の道は？

AI
OpenAI電撃解任のサム・アルトマン氏、今度はマイクロソフトに電撃入社

AI
OpenAI従業員の9割、アルトマン復帰なければ退職と署名

AI
これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした