このページの本文へ

OpenAI、数学的思考力がすごいAIモデル「o1-preview」 深く考えることで難問を解く

2024年09月13日 05時45分更新

文● G.Raymond 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 OpenAIが9月12日、「Strawberry」と呼ばれていた次世代AIモデル「o1-preview」をついに発表した。複雑な問題に対してより長い時間をかけて思考し、科学、コーディング、数学などの分野で従来のモデルを凌駕する能力を持つとされている。また、より効率的なコーディング用モデルとして「o1-mini」も同時に発表された。o1-previewの80%のコスト削減を実現しつつ、高度な推論能力を維持しているという。いずれもChatGPT PlusおよびTeamユーザーに対して即日利用可能となり、API開発者向けにも提供が開始された。

 o1-previewの特筆すべき点は、人間のように問題を深く考察してから回答する能力だ。このアプローチにより、物理学、化学、生物学などの難解な課題において、博士課程の学生と同等の成績を収めたという。特に数学の分野では際立った成果を上げており、国際数学オリンピックの予選問題の83%を正解したと報告されている(従来モデル「GPT-4o」の正答率はわずか13%だった)。国際的なプログラミングコンテストでは上位11%に入る成績を達成した。

 ただし、Webで情報を閲覧したり、ファイルや画像の分析をするといったChatGPTの機能にはまだ対応しない。ユーザとの対話など、一般的なケースでもGPT-4oの方がまだ優秀なことが多いという。OpenAIのノーム・ブラウン研究員は、「o1は従来のモデルと比べてすべての面で優れているわけではありませんが、推論を必要とする多くの課題で大幅な改善を示しています」と説明している。

 サム・アルトマンCEOは「o1にはまだ欠陥があり、制限があり、時間をかけて使用した後よりも、初めて使用したときの方が印象に残ります」「しかし、これはまた、汎用的で複雑な推論ができるAIという新しいパラダイムの始まりでもあります」と述べ、o1シリーズがこれまでのGPTシリーズと位置づけが異なる“ゼロリセット”されたモデルであることを強調した。

 o1-previewは推論にあたり、「思考の連鎖(Chain of Thought)」と呼ばれる手法を使用している。思考の連鎖は「ステップバイステップで考えよう」というテキストプロンプト(指示文)で知られ、ChatGPTのようなAIサービス利用者にはなじみ深い。これにより、従来のモデルでは難しかった暗号解読のような問題にもより正確に回答できる仕組みになっている。

 ただし、OpenAIはこのときにo1-previewがどのように推論を進めているか、いわば「心の中」をユーザーには見えないようにしている。生の思考プロセスを見せると、ユーザーが混乱する可能性があるためだ。また、他社にAIの内部動作を完全に公開したくないという意図もある。さらに将来的には、AIの思考プロセスを監視することで不適切な行動を防ぐことができる可能性もあるとしている。

 安全性に関しても進歩が見られる。o1-previewは、安全性ガイドラインをより効果的に適用する能力を持ち、従来のモデルと比較して大幅に改善されたセキュリティスコアを達成している。「プロンプトインジェクション」と呼ばれる攻撃への耐性も高まった。

 OpenAIでは、この新モデルが特に科学研究者やプログラマーにとって有用なツールになると期待している。例えば、医療研究者による細胞配列データの注釈付けや、物理学者による量子光学の複雑な数式生成などに活用できるとしている。

 OpenAIは今後、継続的にモデルの更新や機能の追加をしていく予定だ。

 

■関連サイト

カテゴリートップへ

ピックアップ