グーグルは8月28日、AIチャットボット「Gemini」の画像生成機能を大幅に強化した。最新の画像生成モデル「Imagen 3」を導入し、すべてのGeminiユーザーが利用できるようになる。
Imagen 3は、わずか数語の説明から高品質な画像を生成できる優れたモデル。写実的な風景や油絵風、クレイアニメ風など、様々なスタイルの画像を作成可能。従来のモデルと比べて画像の詳細さが増し、乱れも少なくなっている。
Imagen 3はテキストのレンダリング機能が大幅に強化された。これにより、画像内に文字を自然に組み込むことができるようになり、バースデーカードやプレゼン資料の作成など、新たな用途への活用が期待されている。
グーグルは安全性にも配慮しており、Imagen 3には安全対策が組み込まれている。また、AI生成画像に透かしを入れるツール「SynthID」を使用し、AI生成コンテンツの透明性を確保している。
今後数日以内に、有料版Geminiユーザーを対象に、人物画像の生成機能も再開される予定だ。Geminiの画像生成機能は2024年2月から提供されていたが、人物描画に関する批判を受け、グーグルは一時的に人物画像の生成機能を停止していた。ただし、写実的で識別可能な人物や未成年者の描写、過度に暴力的または性的なシーンの生成はサポートされない。