OpenAIは3月25日、GPT-4oの画像生成機能について、さまざまなスタイルの画像を作成、変換できるよう強化したことを発表した。
今回の機能強化は、オンライン画像とテキストの共分布に基づいたトレーニングにより、AIモデルに画像と言葉や、画像と画像同士の関連性を学習させることで実現。これまでより一貫性があり、コンテキストを認識した画像の生成が可能となったほか、画像生成AIが苦手とするテキストを含む画像の生成能力も向上しているという。
同社が公式Xアカウントで公開した動画では、実際にテキストプロンプトからセリフ入りの4コママンガを生成する様子も紹介。動画を見る限り、少なくとも英語とアルファベットに関しては、ある程度正確に画像内に挿入できることがわかる。
Create or transform images into a variety of styles with 4o image generation. pic.twitter.com/trEqLLZ9KL
— OpenAI (@OpenAI) March 25, 2025
本機能はChatGPTおよびSoraの無料ユーザーと、Plus、Pro、Teamの各有料プランを契約するユーザー向けに、3月25日より順次提供を開始。Enterpriseプラン、Eduプランと開発者向けの APIについては、近日中の対応を予定している。







