産業技術総合研究所(産総研)は2023年、若手AI研究者の育成を支援する「覚醒プロジェクト」を立ち上げた。35歳未満の若手研究者を対象に独創的な研究テーマを募集し、採択された研究者には研究資金や計算資源、プロジェクトマネージャー(PM)による助言などの支援を提供する。応募は10月13日まで、同プロジェクトのサイトで受付中だ。
ホットなAI分野で先端を走るプロジェクトマネージャーたちは、「覚醒」にどのような研究者を求めているのか? PMの一人で、自然言語処理を専門とする東京大学大学院 情報理工学系研究科の谷中 瞳准教授に話を聞いた。
東京大学大学院 情報理工学系研究科 准教授(卓越研究員)
谷中 瞳氏
2013年、東京大学大学院工学系研究科化学システム工学専攻修士課程修了。同年、株式会社野村総合研究所に入社し、特許検索システムの開発に従事。2018年、東京大学大学院工学系研究科システム創成学専攻博士課程修了、博士(工学)。2018年理化学研究所革新知能統合研究センター特別研究員を経て、2021年、東京大学卓越研究員に採択され現職。人工知能学会理事、理化学研究所客員研究員を兼務。人工知能学会優秀賞、船井研究奨励賞を受賞。人のようにことばの意味を理解する自然言語処理技術を目指して、理論言語学に基づく言語モデルの分析や、機械学習と記号論理の融合による推論技術の研究に取り組む。
大規模言語モデルの課題を調べる
——昨年末のChatGPTの登場以来、AIが再び大きなブームになっています。谷中先生のご専門は自然言語処理とのことですが、こうした状況についてどのように見ていますか。
谷中 まず、ブーム自体は純粋にポジティブに受け止めています。AIブームはこれまでにも何度かありましたが、今回のAIブームは特にディープラーニングの誕生から続く一連の流れの延長線上にあります。最近ではChatGPTをはじめ、本当に人間のように言語を理解できているかのようなAIまで生まれているとも言われていますが、一方で大量のデータを使い、大量のパラメータ数を持つモデルを大量の計算資源を使って訓練するというディープラーニングの本質を考えると、入力から出力までがブラックボックスであるという問題が残っています。
チャットで想定通りの答えを出してくれる点では確かに精度が上がってきていると言えるかもしれませんが、なぜその答えが出力されるのか、その判断根拠が分からない、説明性や解釈性といった課題はまだ根本的には解決されていません。つまり、AIの中で何が起こっているのかがまだ見えない状況です。今後はそういった課題を調べていく必要があると考えています。例えばChatGPTについても、本当に言葉の意味を理解しているのか、さまざまな観点から調べていく必要があるでしょう。
——「AIが言葉の意味を理解する」というのは、どのような状態を指すのでしょうか。
谷中 その点もずっと議論されている問題です。どこまで実現できていれば理解したと言えるのかは、実は人間でも難しい問題ですよね。例えば、テストで良い点が取れたからといって、その内容を完全に理解できているのか、十分に測ることができているのかは分かりません。ただ、勉強したことを他人に説明できれば、テスト以外である種の理解能力を測ることができるかもしれません。
何より、1つの尺度から見て精度がいいとか理解できているとかいうことではなく、さまざまな側面から理解を捉えて評価していく必要があると考えています。AIが理解しているのかを調べることで、逆に人間の理解がどのような仕組みになっているのか、見えてくることもあるかもしれません。
——現在の先生の研究テーマについて改めて教えていただけますか。
谷中 1つのアプローチとして、ディープラーニングと記号論理の融合があります。認知科学の世界では「二重過程理論」と呼ばれる考え方があります。人間の認知能力や脳の仕組みは、システム1とシステム2という2つのシステムからできているという考えです。システム1は、いわゆるディープラーニングのように即時的にデータから回答するようなシステム。システム2は熟考的でゆっくり考えるようなシステムです。例えば数学の場合、即時的に回答できる場合と、熟考して数式を証明するような場合があり、相互作用で計算しているという考え方があります。そういった考えを、AIの技術に持ち込んだものが、ディープラーニングと記号論理の融合、あるいはニューロシンボリックAIといった言葉で説明されるものです。
——ディープラーニングと記号論理の融合によって、どのようなことが分かるのでしょうか。
谷中 人間はGPTのように大量のデータを使って言語を獲得しているわけではない、ということは1つ言えるかもしれません。人間の子どもは機械よりずっと少ないデータで言語を学習しており、両者の言語獲得の方法は異なるかもしれないと言われています。
では、なぜ人は少ないデータからでも効率的に言語を学習できるのか。人間は聞いたことがない言葉であっても、構成されている要素に分解し、組み合わせて文を理解できる「構成性」という能力があることが、1つの可能性として考えられています。大雑把に言えば、言語の文法に則って考えるということですが、これは記号論理では得意とされている一方で、ディープラーニングではうまく捉えられているのか、まだはっきりとは分かっていません。もしかすると、たまたまできているように見えるだけで、データに依存しているのかもしれない。そうなると、データや計算機をどんなに増やしても、構成性を得るのは難しいかもしれません。
そこで、私の研究では、大規模言語モデルが汎化能力、構成性といったものをどこまで実現できるのかを把握した上で、人間のような構成性や汎化能力を持つAIを構築することを目標としています。
採択者には「研究のおもしろさ」を伝えたい
——今回、先生がPMを務める「覚醒プロジェクト」は研究者にとってどのような点が魅力的だと思いますか。
谷中 まず、1プロジェクトあたり300万円が支援され、比較的柔軟に使える点はすばらしいと思います。研究者が資金を調達するにはさまざまな方法がありますが、使途が厳しく制限されているものもあります。
また、研究をサポートするPMが揃っていて、異なるAI分野の中でネットワークを作れることも魅力です。研究に取り組むことのおもしろさの1つは、分野が異なる人たちとネットワークを築いて、自分の興味があることを伝え合い、お互いの興味を広げ合うことだと思います。
さらに、産総研の「ABCI(AI橋渡しクラウド)」が利用できる点もメリットとしては大きいと思います。大規模言語モデルはGPUを使うことが必須になっていますが、最近では学会の締切前など、大学や民間のGPUが混雑して計算資源を確保するのに苦労することもあります。ABCIを使えるという選択肢が増えることは、研究者にとって非常にありがたいのではないでしょうか。
——プロジェクトの最終的な成果に関しては、どのようなイメージをお持ちですか。
谷中 1つには、国際会議での発表をぜひ目指してもらいたいと思っています。国際会議は論文を発表する場というだけでなく、ネットワークを作る場にもなっているので、参加することはとても貴重な経験になります。私自身、博士課程の時に半年ほどで国際会議に出た経験がありますが、覚醒プロジェクトの約9カ月という期間はまったく無理な目標ではないはずです。
ただ、学会発表だけを目標にするのではなく、研究に関わる一連のプロセスを楽しんでもらいたいですね。私は大学に所属する以前、企業で勤務した経験がありますが、大学での研究活動でも活きていることがたくさんありますし、研究での辛抱強さや耐久力は人生全体に活かせるはずです。そういった人生の糧になるようなものが、少しでも得られればと考えています。
——PMとしては、どのような伴走・アドバイスをしたいと考えていますか。
谷中 覚醒プロジェクトの対象は幅広く、中には高専生のように研究をすること自体が初めて、という方もいるかもしれません。ですので、何より「研究のおもしろさ」を伝えたいと考えています。もちろん成果を出すことも重要ですが、関連研究を調べて仮説を立て、その仮説を検証・分析して、最終的には論文などの形にするという一連のプロセスを踏むことで、達成感や自己肯定感、経験値が増えるはずです。また、研究ではうまくいかないこともたくさんでてきますが、うまくいった時の考え方や、自分にしか見つけられなかった問題を発見できた時の感慨は大きなものがあります。そういったおもしろさをなるべく伝えられるような、伴走・アドバイスをしたいと考えています。
——どのような方に応募してほしいか、応募を考えている方にメッセージをお願いします。
谷中 好奇心や熱意のある方に応募してもらいたいです。特に、既存のものにプラスアルファするより、新しくまったく違うことを考えられる方だといいですね。大規模言語モデルが今はホットですが、次に来るような言語理解やマルチモーダル推論といったモデルを作りたいと考えている方にもぜひ応募してもらいたいです。
非常にいい機会だと思うので、一緒に自然言語処理やマルチモーダル推論の根本を変えて、人々を覚醒させるようなプロジェクトに全力で取り組みましょう。
覚醒プロジェクト概要
応募締切:2023 年 10 ⽉ 13⽇(金)23:59
募集内容:
以下の5つの分野に関する研究開発を提案してください。
・募集分野① 「空間の移動」
・募集分野② 「生産性」
・募集分野③ 「健康・医療・介護」
・募集分野④ 「安心・安全」
・募集分野⑤ 「その他の社会課題解決に資するテーマ」
募集対象:
高等専門学校専攻生、大学院生(学部生は対象外)、ポスドクなど、高専、大学、研究機関、企業等に所属する35歳未満の個人もしくはグループ(2023年4月1日時点)
応募⽅法:
公式サイトで応募を受け付けます。Webフォームに必要事項を記入のうえ、提案書や知的財産の確認書、所属組織の承諾書など、指定する必要書類をアップロードください。
研究開発支援:
採択された研究実施者には、以下の支援を行います。
・プロジェクトマネージャー(PM)の伴走・アドバイス
・1プロジェクトあたり300万円 を支援
・ABCI(AI橋渡しクラウド)等の産業技術総合研究所の共用施設の無償利用
覚醒プロジェクト公式サイト