グーグルは2月12日、画像をもとに別の画像を生成できるAIサービス「Whisk」を、日本を含む100以上の国と地域で順次提供すると発表した。対象は18歳以上のユーザー。
Whiskは詳細なテキストプロンプトを必要とせず、画像をプロンプトとして使用できるシステム。ユーザーはテンプレートに沿って画像を選択し、Whiskに入力するだけで、新しい画像を簡単に生成できる。
画像の入力から新しい画像の生成までのプロセスは、同社のAIモデル「Gemini」と「Imagen 3」を活用。具体的には、ユーザーが入力した画像をGeminiが解析して詳細なキャプションを作成し、それをもとにImagen 3が画像を生成する仕組みだ。
テンプレートに関しては、日本文化にインスパイアされた「カプセルトイ」や「お弁当」、季節のイベントにあわせた「バレンタインデー」用のテンプレートなど、さまざまなパターンが用意されている。
2月12日現在、グーグルはWhiskの試験運用版をGoogle Labsで公開中。システム自体は日本語にも対応しているが不完全なため、一部の機能については英語での利用を推奨している。
