このページの本文へ

動画版「Nano Banana」がついに来た! Google「Gemini Omni」シリーズ発表

2026年05月20日 10時05分更新

文● G.Raymond 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 「Nano Banana」動画版、ついに登場だ。

 Googleは米国時間5月19日、Google I/O 2026にあわせて新AIモデル「Gemini Omni」シリーズを発表した。最初のモデルは「Gemini Omni Flash」で、Geminiアプリ、Google Flow、YouTube Shorts向けに提供を開始した。Google AI Plus、Pro、Ultra加入者はグローバルで利用可能。YouTube ShortsとYouTube Create Appでは今週から無料ユーザーにも展開される。開発者と企業向けのAPI提供は今後数週間で始まる。

 Gemini Omniは、入力の自由度が高いことが特徴。画像、音声、動画を組み合わせて送信することで、新しい動画を作ることができる。Googleはこれを「anything from any input」と説明している。まずは動画出力から始め、将来的には画像や音声の出力にも広げる計画だ。

 撮った動画を素材にして、「彫刻を泡にして」「鏡に触れたら液体のように波打たせて」といった編集指示を繰り返せるのが強み。キャラクターの一貫性や前後の文脈、物理的な動きのつながりを保ちながら編集できるという。

 Geminiの推論能力を使った動画も生成できる。たとえばアルファベット26文字に対応する物体を次々に見せたり、タンパク質の折りたたみを粘土アニメ風に説明したりと、意味のある説明や構成を作れるようになっている。

 AI動画はここ数年で、一気に実験レベルから実用レベルへとクオリティが跳ね上がった。そのなかで特に必要とされているのが、動画の一貫性を保ちながらユーザーの意図を汲める編集性能だ。Gemini Omniは、まさにその機能をみがいた推論時代の動画生成モデルとなっている。「Seedance」のバイトダンスなど、競合大手との競争がますます激しくなりそうだ。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

ピックアップ