グーグル・ディープマインドは4月2日、オープンAIモデルの新シリーズ「Gemma 4」を発表した。少ない計算資源で高い性能を引き出す効率性を重視した設計が特徴。
用途やハードウェアに応じて、20億パラメータのE2B、40億パラメータのE4B、26BのMoE、31BのDenseという4つのサイズで展開される。スマートフォンなどのエッジデバイスから高性能GPUまで、幅広い環境での運用を前提としているのが大きな特徴だ。
E2BとE4Bは低遅延かつ省メモリ設計で、モバイルやIoT機器上でのオフラインAI利用を想定している。一方、26B MoEは一部のパラメータのみを動的に活用することで高速性を高め、31B Denseは品質重視で高度な推論や研究用途に適する設計となっている。
最大モデルはAI性能ランキング「Arena AI」で世界3位に位置づけられ、サイズで大きく上回るモデルに匹敵する能力を示すとされる。複雑な推論、エージェント的なタスク実行、コード生成に加え、画像・音声・動画を扱うマルチモーダル機能や最大25万6000トークンの長文処理にも対応する。
同シリーズは商用利用可能なApache 2.0ライセンスで公開され、企業や開発者が自由に改変・運用可能だ。モデルはHugging FaceやKaggle、Ollamaからダウンロードできる。
本記事はアフィリエイトプログラムによる収益を得ている場合があります








