グーグルは8月13日、画像生成AI「Imagen 3」を実現する技術を解説する論文が公開した。
Imagen 3の特徴は精密な画像を出力することに加え、プロンプトの理解力も大幅に向上。複雑なプロンプトから細部まで作り込まれ、しかも安全な画像を出力するのが特徴としている。
Imagen 3では生成AIとしてGeminiを活用し、多段階のフィルタリングプロセスを用いることでプロンプトの理解度を高めるとともに、生成する画像の品質を評価して審美的な品質も高めているという。
さらに大きな特徴として、詐欺やネット上での憎悪拡大に利用されないように配慮されており、暴力シーンや露出の多い女性などの画像を生成しにくくなっている。