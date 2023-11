イーロン・マスク氏が率いるXの関連会社xAIは11月5日(現地時間)、GPT-3.5やClaude-2に匹敵する性能を持った独自の大規模言語モデル(LLM)「Grok-1」および、同モデルを使用したAIチャットシステム「Grok」を発表。米国内の有料ユーザーに向けてベータテストを開始した。

Grokは、2023年7月「宇宙の本質を理解する」ためにイーロン・マスク氏が設立した新会社xAIによって、「全人類に最大限の利益をもたらすAIツールを構築すること」を目的に開発されたAIツール。

ベースとなるのは4ヵ月に渡りトレーニングされた大規模言語モデル「Grok-1」。

LLMを評価するのに使用されるベンチマーク、HumanEvalコーディングタスクで63.2%、MMLUで73%を達成し、GPT-3.5やInflection-1を含む、同クラスのモデルを上回る結果を示している。

また、ベンチマークに使用される問題を事前に学習していたという可能性を鑑み、データセット収集後の5月末に発表された2023年ハンガリー全国高等学校数学決勝試験の問題を解かせてみたところ、Grokは59%の正解率でGPT-3.5やClaude-2を凌駕したという。(GPT-4は68%)

Grokは、Xから取得したリアルタイム知識を持っており、他のほとんどのAIチャットでは拒否されるようなデリケート(スパイシー)な質問にも答えてくれるという。

