グーグルは3月12日、最新AIモデル「Gemini 2.0 Flash」の新機能を開発者向けに公開した。やりとりを通じてAI画像の生成と編集ができるようになる。Google AI Studioでサポートされている全地域で利用可能だ。
Gemini 2.0 Flashにテキストを通じて指示を伝えると、キャラクターと設定の一貫性を維持した形で画像つきの物語を生成する。生成結果に対して変更指示を出して、話を作りなおすか、画像のスタイルを変更させることもできる。
世界にまつわる知識と、強化された推論能力により、他の画像生成AIモデルと比べて“適切”な画像を作り出せるのも特徴。長いテキストの反映も正確性に長けており、サンプル画像では液晶モニターに数行にわたる長文が表示されている。
グーグルは開発者のフィードバックを通じ、新機能を本番対応のバージョンにすることを目指している。







