グーグルDeepMindは9月24日、大規模言語モデルGemini 1.5 ProとGemini 1.5 Flashの最新版を発表した。長文理解能力や視覚能力、数学能力が向上した。特筆すべきは、10月1日から、Gemini 1.5 Proの利用料金が大幅に引き下げられることだ。
具体的には、12万8000トークン以下のプロンプトに対して、入力トークンが100万トークンあたり1.25ドル、出力トークンが100万トークンあたり2.5ドルになる。12万8000トークンを超えるプロンプトの場合は、入力トークンが100万トークンあたり5ドル、出力トークンが100万トークンあたり10ドルになる。
AI大手OpenAIの最新モデルであるGPT-4o(2024年8月6日版)と比較すると、Gemini 1.5 Proの入力トークンは50%安く、出力トークンは75%安価という破格の安さになる。
性能面でも向上が見られ、AIベンチマークのMMlu-Proで約7%、数学関連のベンチマークで約20%の改善が確認された。視覚理解やPythonコード生成のベンチマークでも2〜7%の向上が見られた。なかでも数学関連のベンチマークスコアは86.5%で、OpenAI最新モデル「o1」が達成した94.8%に迫っている。
さらに応答速度も2倍に向上し、レイテンシーも3分の1に短縮されている。グーグルは、これらの更新によってGeminiモデルがより使いやすく、コスト効率の良いものになったとしている。
今回の値下げと性能向上により、AIモデル市場での競争が一層激化することが予想され、ユーザーにとってはより高性能で低コストなAIサービスを利用できる可能性が高まった。