画像クレジット:Stephanie Arnett/MIT Technology Review
AI関連でノーベル賞が2つが授与されたことは、AIの大きな節目になるだろう。だが、AIが成果をあげるには高品質のデータが大量に必要であり、そうしたデータセットは稀であるとノーベル化学賞を受賞したデビッド・ベイカー教授は指摘する。
この記事は米国版ニュースレターを一部再編集したものです。
ワシントン大学の生化学教授であるデビッド・ベイカーは寝不足だが幸せな気持ちだ。何しろ、ノーベル化学賞を受賞したばかりなのだから。
スウェーデン王立科学アカデミーからの電話で、夜中に目が覚めた。というか、ベイカー教授の妻が目を覚ました。ワシントンD.C.の自宅で電話に出た妻は、彼がノーベル化学賞を受賞したと叫んだ。この賞は、ワシントン大学の生化学者としてのベイカー教授の研究に対する究極の評価だ。
「午前2時に起きて、パーティーなどで1日中眠れませんでした」。受賞発表の翌日、ベイカー教授は私にこう語った。「今日は少しでも普段の生活に戻れれば良いのですが」。
先週は人工知能(AI)関連の発見で2つのノーベル賞が授与され、AIにとって大きな節目となった。
ノーベル化学賞を受賞したのはベイカー教授だけではなかった。 スウェーデン王立科学アカデミーは、グーグル・ディープマインド(Google DeepMind)の共同創業者で最高経営責任者(CEO)を務めるデミス・ハサビスと、同社のジョン・M・ジャンパー上級研究科学者にもノーベル化学賞を授与した。グーグル・ディープマインドは、タンパク質構造の予測が可能なツールである「アルファフォールド(AlphaFold)」の研究での受賞となり、ベイカー教授は、AIを駆使して新たなタンパク質を設計する研究が認められた。 詳細はこちらでお読みいただきたい。
一方、ノーベル物理学賞は、1980年代と90年代の深層学習に関する先駆的な研究で、現在世界で最も強力なAIモデルのあらゆる礎を築いたコンピューター科学者のジェフリー・ヒントン(トロント大学教授)、さらには同じくコンピューター科学者で、データの保存と再構築が可能なパターンマッチング・ニューラル・ネットワークの一種を発明したジョン・ホップフィールド(プリンストン大学教授)に授与された。 詳細はこちらでお読みいただきたい。
受賞の発表後、ハサビスCEOは記者団に対して、今回の受賞は重要な科学的発見にAIツールがさらに多く使われるようになる時代の到来を告げるものだと語った。
しかし、問題が1つある。AIが科学に役立つためには大量の高品質なデータが必要であり、そのようなデータを含むデータベースは稀だとベイカー教授は話す。
今回の受賞は、タンパク質設計者として働く者たちのコミュニティ全体に対する評価である。そして、タンパク質設計を「何の役にも立たないと誰もが思っていた狂気の沙汰のようなものから、中央の舞台へと押し上げる助けとなるだろう」とベイカー教授は言う。
AIは、ベイカー教授のような生化学者にとってゲームチェンジャーとなっている。ディープマインドがアルファフォールドで実現したことを見ると、深層学習が生化学の研究にとって強力なツールになるであろうことは明らかだった。
「以前は本当に難しかった問題が、生成AIの手法のおかげで、今でははるかにうまく解決できるようになっています。はるかに複雑なことができるようになっているのです」とベイカー教授は語る。
ベイカー教授はすでに研究で忙しい。彼のチームは、生物が生存するために必要なすべての化学反応を実行する酵素の設計に注力しているという。また、適切なタイミングに体内の適切な部位でのみ作用する薬の開発にもチームで取り組んでいる。
しかし、今回の受賞を科学におけるAIの転換点と呼ぶことにベイカー教授は躊躇している。
AIの世界では、「ゴミを入れればゴミが出る」という格言が存在する。AIモデルに投入されるデータが良くなければ、その結果も素晴らしいものにはならない。
ノーベル化学賞の受賞に結びついたAIツールの威力は、厳選され標準化された高品質なデータの貴重な宝庫である「蛋白質構造データバンク(PDB:Protein Data Bank)」によるものである。これこそが、AIを何かに役立てようとする際に必要となる類のデータだ。しかし、AI開発の現在のトレンドは、AIが生成した雑多なものでますます溢れかえっているインターネットのコンテンツ全体を使って、さらに大規模なモデルを訓練するといった具合だ。この雑多なものが、今度は訓練用のデータセットに吸い込まれ、結果を汚染し、バイアスやエラーを引き起こす。これでは、正確な科学的発見はできない。
「PDBと同じくらい優れたデータベースがたくさんあるとしたら、今回の受賞はおそらくその第1号に過ぎないと言えるでしょう。しかし、PDBは生物学における、いわば唯一のデータベースです」とベイカー教授は言う。「生成AIは手法だけではありません。データが重要なのです。PDBのようなデータベースはそれほど多く存在しません」。
アドビ、クリエイターがAI訓練「NO」を示せる新ツール
アドビは、クリエイターが自分の作品に「透かし」を入れ、生成AIモデルの訓練に使用されないように表明できる新しいツールを発表した。「アドビ・コンテンツ・オーセンティシティ(Adobe Content Authenticity)」というこのWebアプリを使えば、アーティストは自分の作品に、認証されたID、ソーシャルメディアのハンドルネーム、その他のオンライン・ドメインなどの「コンテンツ・クレデンシャル」を付加できるようになる。
コンテンツ・クレデンシャルは、出所を明確にする情報を暗号化して、画像、映像、音声に安全にラベル付けする技術仕様「C2PA」に基づいている。つまり、21世紀におけるアーティストの署名に相当するものだ。クリエイターは、作品制作にアドビのツールで使ったかどうかにかかわらず、それらを適用できる。アドビは、2025年初頭にパブリック・ベータ版を提供開始する予定だ。 詳しくはこちらの記事で。
AI関連のその他のニュース
2025年のAIの状況。AI投資家のネイサン・ベナイチとエア・ストリート・キャピタル(Air Street Capital)が、AIの状況に関する年次分析を発表した。彼らの来年の予測によると、大規模な独自モデルは優位性を失い始め、ラボは計画立案と推論に重点を置くようになるだろう。驚くことではないかもしれないが、彼らは、一握りのAI企業が本格的な収益を上げ始めると予想している。
シリコンバレーが新たなロビー活動のモンスターに。巨大テック企業の触手はワシントンD.C.のあらゆる場所に伸びている。テック企業による政治家へのロビー活動が、米国におけるAI規制のあり方に影響を与える様子が垣間見える興味深い記事である。 (ザ・ニューヨーカー)