グーグルは1月17日(現地時間)、数学オリンピックの金メダリストに匹敵する解答能力をもつAI「AlphaGeometry」を発表した。
Introducing AlphaGeometry: an AI system that solves Olympiad geometry problems at a level approaching a human gold-medalist. 📐
— Google DeepMind (@GoogleDeepMind) January 17, 2024
It was trained solely on synthetic data and marks a breakthrough for AI in mathematical reasoning. 🧵 https://t.co/g3RFSoWNPPpic.twitter.com/NER2TJsA7r
これまでのAIでは推論のスキルやトレーニングデータの不足により、幾何学や数学の複雑な問題に対しては苦戦することが珍しくなかった。
AlphaGeometryはこういった課題を解決するため、「ニューラル言語モデル」と「記号演繹エンジン」を組み合わせて答えを導く仕組みを採用。以下に示したように両者の性質は正反対だが、セットで運用することで、互いの長所と短所を補い合い、迅速で「直感的な」アイデアの提供と、慎重で合理的な意思決定が可能となる。
●ニューラル言語エンジン
・長所:データ内の一般的なパターンと関係性の特定が得意
・短所:厳密な推論や決定したことに対する説明が苦手
●記号演繹エンジン
・長所:形式論理に基づき明確なルールを使用して結論を導ける
・短所:処理が遅く柔軟性に欠ける
同社によると、AlphaGeometryは世界中の高校生が数学力を競う「国際数学オリンピック」の幾何学問題30問を使ったベンチマークテストで、標準制限時間内に25問の解答に成功したという。人間の金メダリストの平均スコアが25.9問なので、あくまで幾何学限定ではあるが、人間の中でも特に数学に秀でた人物に近い能力をもったAIと考えてよいだろう。参考までに、AlphaGeometryより以前のAIの回答数は、AlphaGeometryのおよそ2/3(10問)だ。
トレーニングデータ不足の問題については、合成トレーニングデータの膨大なプール(1億個の固有の例)を生成する方法を開発して対応。AIのトレーニングに人間のデモンストレーションを必要としない「自己教師あり学習」の仕組みを使うことで、データのボトルネックを回避しているという。
AlphaGeometryのコードとモデルはオープンソース化されており、誰でも利用が可能。同社は本件について、「合成データの生成とトレーニングにおける他のツールやアプローチと組み合わせて、数学、科学、AIにわたる新たな可能性を切り開くのに役立つことを期待しています」と述べている。