このページの本文へ

前へ 1 2 次へ

グーグル、1.0から2ヵ月弱で「Gemini 1.5」を発表。驚きの100万トークン

2024年02月17日 17時00分更新

文● 田口和裕

　グーグルおよび傘下のGoogle DeepMindは2月15日（現地時間）、同社が2023年12月に発表した大規模言語モデル（LLM）「Gemini 1.0」の次世代モデルとなる「Gemini 1.5」を発表。グーグルの統合AIプラットフォーム「Vertex AI」および「Google AI Studio」において、試験運用機能の限定プレビューをデベロッパーと企業を対象に開始した。

最初のリリースは「Gemini 1.5 Pro」

　Gemini 1.5は「基盤モデルの開発とインフラにおけるグーグルの研究とエンジニアリングの革新に基づき、飛躍的に向上したパフォーマンスを提供」する最新LLMという位置付け。

　最初にリリースされるのは中規模のマルチモーダルモデル「Gemini 1.5 Pro」。幅広いタスクに対応できるように最適化されており、これまでの最大モデル「Gemini 1.0 Ultra」と同レベルの性能だという。

　Gemini 1.5は標準で12万8000トークンのコンテキストウィンドウを備えるが、2月16日から始まるプレビューでは一時的に最大100万トークンのコンテキストウィンドウで試すことができる。ただし、そのぶんスピードは遅くなるようだ。

　その後のロードマップとしては、標準の12万8000トークンのモデルを一般リリースし、モデルの改善に伴って最大100万トークンまでスケールアップする価格帯を導入する予定だという。

高効率なアーキテクチャ

　Gemini 1.5は「Mixture-of-Experts（MoE）」と呼ばれる新しい技術を用いて効率的にトレーニングされている。

　従来の「Transformer」技術がひとつの大きなニューラルネットワークとして機能するのに対し、MoEモデルはより小さな「専門家」ニューラルネットワークに分割される。

　入力されるデータのタイプに応じて、MoEモデルはその中で最も関連性の高い「専門家」のみを選択的に活性化することを学ぶため大幅に効率化されるという。

1時間のビデオ、11時間のオーディオ、70万語以上のテキストを理解

　Gemini 1.5は標準で12万8000トークン（Gemini 1.0は3万2000トークン）のコンテキストウィンドウを持つ。

　「トークン」とは、簡単に言えば、LLMがテキストや画像、動画、音声などを理解し処理するための基本的な単位だ。

　コンテキストウィンドウが大きければ大きいほど「与えられたプロンプトでより多くの情報を取り込み処理することができ、その出力をより一貫性があり、関連性が高く、役に立つものに」できるという。

　さらにすごいことに、現在Gemini 1.5の本番環境では最大100万トークンまで実行できるようになっているという。

　これは、1時間のビデオ、11時間のオーディオ、3万行以上のプログラムコード、70万語以上のテキストに相当する。なお、テストでは最大1000万トークンまで成功しているという。

　なお、OpenAIの最新モデルとなる「GPT-4 Turbo」のトークン数はGemini 1.5と同様の12万8000となっている。ひとつ前の「GPT-4」になると3万2000トークンまでしか扱えない。

前へ 1 2 次へ

ツイートする

カテゴリートップへ

AIオススメ記事

2024年05月16日

AI

ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法（ちょっとわかりづらいので解説）
2024年05月13日

AI

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性
2024年04月29日

AI

漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ
2024年05月15日

AI

新しい「ChatGPT」はココがすごい　解説「GPT-4o」
2024年05月09日

AI

画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」
2024年05月10日

AI

15歳の高校生、「日本語能力最強」のAIモデル開発　AITuber向けに設計
2024年05月10日

AI

画像生成AI「Stable Diffusion」が「Midjourney」のように使える（しかも安い）「Stable Artisan」
2024年04月24日

AI

マイクロソフト最新SLM「Phi-3」　メタ「Llama 3」あっさり抜く
2024年03月13日

AI

これは便利！「Stable Diffusion」が超簡単に始められる「Stability Matrix」
2024年04月22日

AI

日本語対応の画像生成AI、東京発のSakana AIが発表　既存モデルより10倍高速

ピックアップ

sponsored
Radiant GZ3500Z790/D5をカスタム

BTOってマジ大事。16万円台のふつ～なPCが20万円のi5＆RTX 4060のゲーミングPCに
sponsored
音を知る企業による自社ブランドの第一弾製品

一生使いたいヘッドホンを見つけた。その名は「The Industrial-ist Wired」だ！
sponsored
見た目スッキリでキレイなPCが誰でも簡単に組める

自作PCの配線ゴチャゴチャは過去の話、「PROJECT ZERO」製品一覧と作例を紹介
sponsored
ファッショナブルなデザインに、カロリー管理や睡眠モニタリングなどの便利機能をプラス！

スマートバンドの着け心地とスマートウォッチの高機能が両方ある！ファーウェイ「HUAWEI WATCH FIT 3」レビュー
sponsored
ゲームも作業もすべてがなめらか表示

ヌルヌル動くというのはこのこと、240Hzゲーミングディスプレー「G274QPX」レビュー
sponsored
「STYLE-14FH128-U7-UH2X」をチェック、16:10ディスプレーを採用

1kg以下の14型ノートPCで「Stable Diffusion」も、Core Ultra 7でやりたいことを加速しよう
sponsored
第14世代インテルCore、RTX 40 SUPERシリーズ、DDR5メモリーを選択可能

純白のコスパ最強ゲーミングPCを目指せ！ソフマップの「STORM」BTOパソコンを実機レビューだ
sponsored
ビジネスバッグに入るサイズ感、持ち運べる重量感

実用性能が1グレード高いのに価格はスタンダードなノートPCをレビュー「Modern 15 H C13M」シリーズ
sponsored

200mmファンにダスト検知機能！エアフロー最強ケース「ProArt PA602」をレビュー
sponsored
JN-GMM1IPS28BKをレビュー

PS5の実力も引き出せる28型4K/144Hz、KVMまで使える万能モデルが7万円はコスパ◎！
sponsored
なぜクラウドストレージに切り替える企業が増えているのか

ファイルサーバー／NASとクラウドストレージの違いとは？《基本編》
sponsored
JN-MD-OLED156UHDR-Tをレビュー

15.6型4K有機ELのタッチ対応モバイルディスプレーと16型IPSのWQXGAモデル、どちらを買うべきか