1月20日に、中国のAI企業DeepSeekがリリースした大規模言語モデル(LLM)の「DeepSeek R1」が世界中に衝撃を与えています。OpenAIの「o1」に匹敵する性能とアピールされているにも関わらず、誰にも扱えて、緩いライセンスでオープンウェイトモデルとして公開されるとはまったく予想外でした。今までのLLM開発をけん引してきたアメリカを中心とするAI大手各社に大幅な戦略の見直しを迫るほどのものでした。一方で、政治バイアスが明確に組み込まれていることもあり、日本でも警戒が広がっています。ローカルPCで動作するDeepSeek R1はどれほどの性能のものなのか、早速試してみました。
アメリカ有利だったLLM開発に中国が追いついた
発表によると、DeepSeek R1は各種比較テストでo1に匹敵する性能であると主張しています。また、教師モデルを持たず、強化学習だけでo1レベルに達したとアピールしています。数学などの難易度の高い問題を解くことが得意なようです。パラメーター数はトータルでは6710億、実際の推論時に使うアクティブパラメーターは370億、さらに記憶容量を決めるコンテキスト長は12万8000トークンにまで対応しているという巨大LLMモデルです。ファイルサイズは650GBに及び、これはo1に匹敵すると考えられています。
当初の報道では、開発費が600万ドル(約8億円)とされ、大きな衝撃を与えました。ChatGPTの開発費に比べて10分の1以下であるというわけです。社員も150人しかおらず、1500人以上と言われるOpenAIに比べると非常に小さな規模です。しかし、その後の米Semianalysis誌によると、中国のヘッジファンドHigh-Flyer Capital(高飛資本)から資金提供を受けており、株式などの取引用のAIのために多額のコンピューティング環境への投資をしており、人件費なども含めると実際の投資額は5億ドル(約750億円)になると推測されており、そこまで小規模というわけではないようです。それでも、北米企業が圧倒的な優位性を維持できていると考えられていたLLM開発で、中国企業に一気に追いつかれた可能性が出てきました。

この連載の記事
-
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 -
第123回
AI
グーグルの画像生成AI「Nano Banana」は異次元レベル AIコンテンツの作り方を根本から変えた -
第122回
AI
動画生成AI「Wan2.2」の進化が凄い アリババが無料AIモデルの牽引者に -
第121回
AI
愛していたAIが消えた日 ChatGPTだけと“付き合う”危うさ -
第120回
AI
ラフさえ描けばイラスト作品ほぼ完成 画像生成AI「FLUX.1 Kontext」LoRAが示す制作の未来 - この連載の一覧へ





お気に入り

