このページの本文へ

グーグル、モデル・シーン・スタイルの画像を組み合わせ1枚の画像を生成できるAI「Whisk」提供開始 日本でも使えるぞ

2025年02月12日 13時40分更新

文● @sumire_kon

  • お気に入り
  • 本文印刷
トップ画像

 グーグルは2月12日、画像をもとに別の画像を生成できるAIサービス「Whisk」を、日本を含む100以上の国と地域で順次提供すると発表した。対象は18歳以上のユーザー。

 Whiskは詳細なテキストプロンプトを必要とせず、画像をプロンプトとして使用できるシステム。ユーザーはテンプレートに沿って画像を選択し、Whiskに入力するだけで、新しい画像を簡単に生成できる。

テンプレートの使用例1
テンプレートの使用例2

 画像の入力から新しい画像の生成までのプロセスは、同社のAIモデル「Gemini」と「Imagen 3」を活用。具体的には、ユーザーが入力した画像をGeminiが解析して詳細なキャプションを作成し、それをもとにImagen 3が画像を生成する仕組みだ。

 テンプレートに関しては、日本文化にインスパイアされた「カプセルトイ」や「お弁当」、季節のイベントにあわせた「バレンタインデー」用のテンプレートなど、さまざまなパターンが用意されている。

カプセルトイのテンプレートの使用イメージ
お弁当テンプレートの使用イメージ

 2月12日現在、グーグルはWhiskの試験運用版をGoogle Labsで公開中。システム自体は日本語にも対応しているが不完全なため、一部の機能については英語での利用を推奨している。

カテゴリートップへ

ピックアップ