このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」 第101回

ChatGPT、“ジブリ風”で世界騒然 画像生成AIが「自己回帰」で新時代に

2025年04月07日 08時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

OpenAI「4o Image Generator」で生成した画像。画像生成AIサービス「Midjourney」で作成した2枚の画像を参考にアップにして二人を一緒に描くようにと指示したもの(筆者作成)

 OpenAIが3月25日、ChatGPT(GPT-4o)用の新しい画像生成機能「4o Image Generator」をリリースしました。“ジブリ風”の画像が作れるとアピールされたのがわかりやすかったこともあり、世界的に大騒ぎになりました。日本でも大手メディアの読売新聞、日経新聞、NHKなどが著作権上の懸念があるのではないかと大々的に報じていました。実際に試してみたところ、今までの画像生成AIの常識をひっくり返すような使い方を実現していました。OpenAIは詳細を明らかにしていませんが、これまでの画像生成AIでは一般的だった「拡散モデル」ではなく、近年、研究が進んでいた「自己回帰モデル」を応用し、ChatGPTのチャットに組み込むことによって、反応のよさを生み出しているようです。

※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください

できることの幅が恐ろしいほど広い

 月額20ドルの「ChatGPT Plus」以上の契約で自由に使い放題なため、4o Image Generatorを実際に試したところ、できることの幅が恐ろしいほど広いことに驚かされました。この連載でおなじみのキャラクター「明日来子さん」の画像を読み込ませて、指示を出していきました。「アニメのイラスト風に」と指示すると、なんとなく目が大きな日本のアニメ風の絵柄で、キャラクターを作り直してくれます。「春の服装にして」というと春らしい服装に。「手を振って、桜を追加して」と言えば、すぐに変わり、「アメコミ風に」とするとリアルになり、それを「もう少しかわいく」としたらアイドル風になり……生成にはそれぞれ1~2分程度かかるのですが、作業そのものはこれまでの画像生成AIに比べて極端に簡単です。

1枚目の画像を読み見込ませて、番号のとおりに画像を指示して変化させていった

やり取りしているときのChatGPTの実際の画面。単にテキストで指示するだけで、複雑なプロンプト指定などはしていない

前へ 1 2 3 4 5 次へ

カテゴリートップへ

この連載の記事
ピックアップ