OpenAIは1月25日(現地時間)、新しい埋め込み(Embedding)モデルおよびAPIの値下げを含む複数のアップデートを発表した。
新しい埋め込みモデル
埋め込みモデルとは、テキストや言語データを数値のベクトルに変換するためのモデル。テキストの意味内容や構造を数学的に表現し、機械学習モデルが処理しやすくするために使用される。このような埋め込みは、テキスト分類、情報検索、自然言語理解など多くの用途に使われている。
本日OpenAIが発表した新しい埋め込みモデル、「text-embedding-3-small」と「text-embedding-3-large」の2つは、テキストデータの高度な理解と分析を可能にするため、従来のモデルよりもテキストの意味内容をより精確に捉えることができ、様々な言語や文脈に対応する柔軟性があるという。
特に「text-embedding-3-large」モデルは、より大きな容量と複雑性を持ち、深い理解と細かいニュアンスの捉え方に優れているとしている。
また、これらのモデルは開発者がパフォーマンスとコストのバランスを取ることを可能にする技術を使用してトレーニングされている。
具体的には、埋め込みの次元数を減らす(数値列の末尾からいくつかの数値を削除する)ことが可能で、これにより埋め込みの容量を小さくしつつ、その概念表現の特性を保持することができるという。
たとえば、text-embedding-3-largeモデルの埋め込みは、サイズが1536のtext-embedding-ada-002モデルよりも高いパフォーマンスを発揮しながら、256のサイズに短縮することが可能でだ。
GPT-4 Turboプレビューモデルのアップデート
GPT-4 Turboの最新プレビューモデル「gpt-4-0125-preview」もリリースされた。
このモデルは、コード生成などのタスクを前のモデルよりも徹底的に実行し、タスクの未完了を減らすことを目指している。非英語のUTF-8生成に影響するバグの修正も含まれているという。
今後数ヵ月以内に、ビジョン機能を含むGPT-4 Turboの一般提供を予定している。
GPT-3.5 Turboモデルは3度目の値下げ
来週には新しいGPT-3.5 Turboモデル「gpt-3.5-turbo-0125」を導入し、この1年間で3回目となる値下げを実施する。
新モデルの入力価格は1000トークンあたり$0.0005、出力価格は1000トークンあたり$0.0015にそれぞれ50%、25%減少する。
このモデルは、要求された形式での応答精度の向上や、非英語言語の関数呼び出しでテキストエンコーディングの問題を引き起こすバグの修正を含む様々な改善が実施されているという。
テキストモデレーションモデルもアップデート
有害なテキストを特定する堅牢な無料のモデレーションモデル「text-moderation-007」もリリース。既存の「text-moderation-latest」と「text-moderation-stable」エイリアスで利用できる。
APIの使用状況とキー管理の新しい方法
APIの管理ページにも改良が施された。APIキーページからAPIキーに権限を割り当てることができるようになり、使用ダッシュボードと使用量エクスポート機能はAPIキーレベルでのメトリクスを提供するようになった。これにより、機能、チーム、製品、プロジェクトごとの使用状況を簡単に確認できるようになるという。