このページの本文へ

グーグル「Gemini」画像生成の品質爆上げ 新モデル「Imagen 3」採用で

2024年08月29日 16時20分更新

文● G.Raymond 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 グーグルは8月28日、AIチャットボット「Gemini」の画像生成機能を大幅に強化した。最新の画像生成モデル「Imagen 3」を導入し、すべてのGeminiユーザーが利用できるようになる。

 Imagen 3は、わずか数語の説明から高品質な画像を生成できる優れたモデル。写実的な風景や油絵風、クレイアニメ風など、様々なスタイルの画像を作成可能。従来のモデルと比べて画像の詳細さが増し、乱れも少なくなっている。

 Imagen 3はテキストのレンダリング機能が大幅に強化された。これにより、画像内に文字を自然に組み込むことができるようになり、バースデーカードやプレゼン資料の作成など、新たな用途への活用が期待されている。

 グーグルは安全性にも配慮しており、Imagen 3には安全対策が組み込まれている。また、AI生成画像に透かしを入れるツール「SynthID」を使用し、AI生成コンテンツの透明性を確保している。

 今後数日以内に、有料版Geminiユーザーを対象に、人物画像の生成機能も再開される予定だ。Geminiの画像生成機能は2024年2月から提供されていたが、人物描画に関する批判を受け、グーグルは一時的に人物画像の生成機能を停止していた。ただし、写実的で識別可能な人物や未成年者の描写、過度に暴力的または性的なシーンの生成はサポートされない。

 

■関連サイト

カテゴリートップへ

ピックアップ