グーグルは3月12日、最新の大規模言語モデル(LLM)「Gemini 2.0 Flash Experimental」の画像生成・編集機能を「Google AI Studio」で開発者向けに試験的に無料公開した。
Stability AIの「Stable Diffusion」やグーグルの「Imagen 3」といった従来の画像生成特化モデルとは異なり、Gemini 2.0 Flash Experimentalはテキスト生成と画像生成を単一のモデルで実行する「マルチモーダルネイティブ」であることが大きな特徴だ。これにより、視点変更、キャラクターの一貫性維持、精度の高いテキスト描画など、従来の画像生成AIが苦手としていた作業も可能となった。特に、これまで画像生成AIを利用してきたユーザーほど、その進化を実感できるだろう。
具体的な作例を交えながら、Gemini 2.0 Flash Experimentalの「どこがすごいのか」を解説していきたい。

この連載の記事
-
第35回
AI
ここがヤバい!「Nano Banana Pro」画像編集AIのステージを引き上げた6つの進化点 -
第34回
AI
無料で始める画像生成AI 人気モデルとツールまとめ【2025年11月最新版】 -
第33回
AI
初心者でも簡単!「Sora 2」で“プロ級動画”を作るコツ -
第32回
AI
【無料】動画生成AI「Wan2.2」の使い方 ComfyUI設定、簡単インストール方法まとめ -
第31回
AI
“残念じゃない美少女イラスト”ができた! お絵描きAIツール4選【アニメ絵にも対応】 -
第30回
AI
画像生成AI「Midjourney」動画生成のやり方は超簡単! -
第29回
AI
創作のプロセスを激変させる画像生成AI「Midjourney V7」の使い方 ドラフトモード、パーソナライズ機能に大注目 -
第28回
AI
ローカル動画生成AIの革命児「FramePack」の使い方 -
第26回
AI
人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク 初心者にオススメ -
第25回
AI
業界トップ級の画像生成AIツール「Recraft」 Adobeユーザーは体験する価値あり - この連載の一覧へ






