OpenAIは7月18日(現地時間)、高性能と低コストを両立させた最新の大規模言語モデル(LLM)「GPT-4o mini」を発表。同社のチャットAI「ChatGPT」では、旧来の「GPT-3.5」に置き換える形で実装した。
API利用料金は驚きの安さ
GPT-4o miniは、上位モデルの「GPT-4 turbo」や「GPT-4o」と同様に128Kトークンのコンテキストウィンドウを持ち、1回のリクエストで最大16K出力トークンを生成できるモデル。
テキストに加えて画像の認識も可能だが、画像の生成機能は含まれていない。将来的にはビデオと音声の入力にも対応する予定だ。
最大の特徴は、APIを通じて利用したときの費用対効果の高さにある。入力トークン100万個あたり15セント、出力トークン100万個あたり60セントという価格設定は、従来のモデルと比べて極めて安価であり、多くのユーザーにとってより利用しやすいものとなっている。
ChatGPTではすでにGPT-3.5との置き換え完了
現在、ChatGPTでは、無料/Plus/Teamすべてのユーザーに対し、GPT-4o miniがGPT-3.5の代替としてアクセスできるようになっている。Enterprise版のユーザーも、近日中にアクセスが可能になる予定だ。
また、開発者向けには、Assistants API、Chat Completions API、Batch APIを通じて提供されている。さらに、数日以内にはファインチューニング機能をリリースする予定であり、より多様なニーズに対応できるようになる。
競合の小型モデルを上回る性能
性能面でも複数のベンチマークテストで優れた結果を示している。推論能力のベンチマークであるMMLUでは82.0%のスコアを獲得し、グーグルの「Gemini Flash」やAnthropicの「Claude Haiku」などの競合小型モデルを上回った。
数学的推論を測定するMGSMでは87.0%、コーディング性能を評価するHumanEvalでは87.2%のスコアを達成し、こちらも他の小型モデルを上回る結果となった。
さらに、マルチモーダル推論評価のMMMUでも59.4%のスコアを記録し、競合モデルを上回る性能を示した。
「指示階層方式」で攻撃耐性を向上
OpenAIは、GPT-4o miniの開発において安全性を重視している。モデルには、ヘイトスピーチやアダルトコンテンツなどの不適切な情報をフィルタリングする機能が組み込まれており、人間からのフィードバックによる強化学習(RLHF)を用いて、応答の正確性と信頼性を向上させている。
さらに、API版のGPT-4o miniは「指示階層方式」(Instruction Hierarchy)を適用した最初のモデルとなっている。この方式は、システムプロンプトをユーザー入力よりも優先的に扱うよう学習させることで、プロンプトインジェクションやジェイルブレイクなどの攻撃に対する耐性を向上させている。これにより、モデルの応答がより信頼性の高いものとなり、大規模なアプリケーションでの使用がより安全になると期待されている。
LLMの民主化に向けて
低コストと高性能を兼ね備えたこのモデルにより、多くの開発者がより効率的にAIアプリケーションを構築できるようになるだろう。OpenAIは将来的にAIモデルがあらゆるアプリやウェブサイトに統合される世界を想定しており、GPT-4o miniはその実現に向けた重要な一歩となる。