グーグルは2月2日、昨年12月に英語版チャットAIサービス「Bard」に搭載した同社の大規模言語モデル「Gemini Pro」が日本語版でも利用可能になったことを発表した。また、英語版Bardでは画像生成機能も公開された。
高度な理解、推論、要約、コーディング能力
2023年12月に発表されたGeminiは、最高性能を誇るGemini Ultra、幅広いタスクに対応するGemini Pro、モバイルデバイス向けのGemini Nanoの3つのサイズに最適化されており、今回導入されるのはまんなかのモデル。
従来よりも高度な理解、推論、要約、コーディング能力を備えるGemini Proは、今回のアップデートで日本語をはじめとする40以上の言語、230以上の国と地域で提供されるようになった。
「回答を再確認」機能でファクトチェック
今回、Gemini Proと共に英語版で既に導入されていた「回答を再確認(ダブルチェック)」機能も日本を含む40以上の言語に拡張された。
回答の下に表示された「G」アイコンをクリックすると、その回答を裏付けるコンテンツ(出典)がウェブ上に存在するかどうかを評価する。
出典が見つかった場合、緑で強調表示された語句をクリックするとその情報が表示される。
見つからなかった場合は赤で強調表示される。
英語版Bardは画像生成を無料提供
発表時よりテキストに留まらないマルチモーダル性が強調されていたGeminiだが、ようやく英語版においては、品質や速度のバランスを保つように設計および強化された「Imagen 2」モデルを利用した画像生成機能が実装された。
上記画像は「日没時にレンズの外側を見つめている人物の写真のような画像を生成して。ポートレートモードで背景をぼかして」というプロンプトで生成されたもの。
なお、生成された画像はAIが生成したものだとわかるよう、SynthIDを活用して画像のピクセルにデジタルで識別可能な透かしを埋め込んでいる。