若手ディープテック研究者の育成を支援する産業技術総合研究所(産総研)の「覚醒プロジェクト」。この連載では、2023年度の覚醒プロジェクトに採択された研究者の研究内容を紹介する。
今回は、医療分野における大規模な日本語マルチモーダルモデルの開発に挑む、東京大学大学院の助田一晟さん、澤野晋之介さんのチームを取り上げる。代表者である助田さんに話を聞いた。
- 研究実施者:助田一晟、澤野晋之介(東京大学大学院)
- 研究テーマ:JMed-LMM:医療分野における大規模マルチモーダルモデルの開発
- 担当PM:瀬々 潤(ヒューマノーム研究所代表取締役社長)
医療テキストに心電図、レントゲン画像を組み合わせたマルチモーダルモデル
東京大学大学院の助田一晟さんと澤野晋之介さんが覚醒プロジェクトで取り組む研究テーマが、「JMed-LMM:医療分野における大規模マルチモーダルモデルの開発」である。JMed-LMM は「Japanese Medical Large Multimodal Model」の略で、今話題の生成AI系技術を活用した医療AIの土台となる基盤モデルの開発を目標とするものだ。
テキストや画像、音声などの入力情報(モーダル)を単一で処理するのではなく、同時に扱うAIを「マルチモーダルAI」と呼ぶ。助田さんたちの研究では、このマルチモーダルAIのうち、医療かつ日本語に特化した大規模モデルの構築を目指している。
具体的には、循環器内科に焦点を当て、医療レポートなどの日本語テキストデータ、オープンデータとして入手可能な心電図データ、レントゲン画像データを用いて統合的に学習し、医療診断や治療支援、病態解析、患者ケアなどで、問診や症例判断など多岐にわたる医療タスクに適用できる基盤モデルを開発する。
医療分野では、レントゲンや胃カメラなどの画像データから異常所見を見つけるタスクなどでAIを活用する動きが数年前からあるものの、広く普及しているとは言いがたい。また、多岐にわたる医療行為において既存のAIが活用できる範囲は狭く、限られた業務効率化での利用にとどまっている状況だ。画像データとテキストデータを組み合わせたマルチモーダル化が実現すれば、医師の負担軽減や、病気の早期発見、治療の精度向上が期待される。そもそも医療の現場では複数の情報を統合して病状を判断するため、マルチモーダル化は医療AIにおいて必然的な流れだと言えるだろう。
ただ、世界的にも医療AIにおけるマルチモーダル化の取り組みは始まったばかりで、必要な学習データの条件や効果はまだ十分明らかになっていない。助田さんらの研究ではそうした未解明の部分に着目し、異なる医療データを効率的に学習するための新たな手法についても検討。将来はさまざまなAIサービスの開発に使える基盤モデルの先駆けとなる存在を目指す、意欲的な研究となっている。
医師と数理工学の学生がタッグを組んで医療AIに取り組む
今回の研究で一つのポイントになっているのが、タッグを組んでいる二人の立ち位置の違いだ。助田さんによると、多くの医師も医療AIに関心を持っており、本業と並行して一からプログラミングを勉強し、休む暇を削ってAIの開発に取り組んでいる状況があるという。研究メンバーの澤野さんもまた、そうした医師の一人であり、医療AIの研究で医学博士の学位を取得し、東大病院/東京大学医学部附属病院を経て、現在は医療現場の負担軽減を目指してJDSCで勤務している循環器内科専門医である。
一方の助田さんは数理工学を専門としており、東京大学松尾研究室認定の学生AIベンチャー「EQUES」の創業者兼CTOでもある。あの松尾研関係者ということは、以前からAI研究に強い関心があったのだろうか。
「もともと数学が少し好きで、高校生の時に数理工学を学ぼうと思った時はまだAIに興味はありませんでした。AIに興味を持ち始めたのは実は大学に入ってからです。もっというと、それまではプログラミングに触れたことすらありませんでした。大学でも理論研究に惹かれたのですが、学ぶにつれて数理工学はAI技術等を通して社会に役立てられるのが醍醐味だと感じるようになりました」
助田さんは学部生時代の2年ほど前から、東京大学医学部循環器内科のAIグループの研究開発に参加している。澤野さんとの出会いもこのグループだった。グループには医療のバックグラウンドがない助田さんら情報系の学生も複数人参加しており、互いにアイデアを出し合いながら研究を進めてきた。
「工学的なアプローチで医療に貢献できるAI開発に魅力を感じました。いろいろなアイデアがありましたが、ちょうど2022年末にChatGPTがリリースされたタイミングで、LLM(Large Language Model:大規模言語モデル)がブームになったことから、それまでの画像系を中心とした方向から転換しました。日本でもいち早く医療LLMを開発する必要があると考え、事前学習済みのLLMをファインチューニングして、医療分野に適応させる研究に取り組んだのです」
この研究では、日本語LLMとして当時最大規模だったサイバーエージェントの「OpenCALM」と、英語LLMとして当時最高性能だったメタの「Llama2」をベースに、日本語の医療用LLMを開発。研究成果は論文にまとめ、学会でも発表した。ただ、開発したモデルの性能を医師国家試験の5択問題などで評価したところ、残念ながらChatGPTに性能が及ばなかったという。
そこで助田さんらは、LLM本体の性能向上ではなく、病院や医学系学会で収集される多様な医療データを包括的に統合する、マルチモーダルモデルの開発に舵を切る。
覚醒プロジェクトに採択された今回の研究では、OpenAIが開発しているChatGPTのモデルの基にもなっているTransformerベースの単一モデルに、プライバシー情報を含まない医療データを可能な限り学習させる。心電図、レントゲン画像、テキストデータともにオープンデータセットを利用する予定だ。
難しい挑戦、まずは最後まで走りきる
今回の研究で開発されるマルチモーダルは将来的に、患者と対話する問診AIや医師のカルテ記入を自動化し、医療現場全体の業務効率化と支援に役立つ可能性がある。だが、助田さんらは目指すのは、こうしたAIアプリケーションそのものではなく、あくまでも基盤モデルだ。医療機関や研究機関が保有する医療データでモデルをチューニングし、独自のアプリケーションを実装することを想定している。健康診断や人間ドッグなど、幅広いデータをモデルが扱えるようになれば、この分野を大きく成長させる可能性も高まるはずだ。
「今回作ろうとしているモデルは、全体から見ればあくまでも構成要素の一つでしかありません。それでも学生が取り組むには壮大で、覚醒プロジェクトで提供されるABCI(AI橋渡しクラウド)のような計算資源がなければ、とても不可能なことに挑もうとしています。かなり実験的な研究であり、成功例がまだない中で、難しい挑戦だと感じています。プロジェクトマネージャー(PM)の瀬々先生からも『まずは走り切ることが大事』だと言われていますが、とにかく今は手を動かして、失敗してもその成果を発表することが社会の役に立つような、取り組むこと自体に価値がある研究だと捉えています」
欧米に目を向ければ、医療分野のAI研究は医師だけではなく情報系の研究者も専門に取り組んでおり、2022年末にはGoogleが医療に特化した大規模言語モデル「Med-PaLM」の論文を発表するなど、取り組みが活発化している。
「日本では医療AIの研究はまだまだ足りてないと思います。取り組みが足りないので、新しいインパクトは生まれてきませんし、そもそも現段階でどこまでできていて、どれくらいできないのか、といった情報も不足しています。今回の私たちの取り組みが、国内での着火剤の1つになればうれしいです」
最後に、今後の課題や研究のあり方について、助田さんは次のように語ってくれた。
「本当はもっと僕たちのような情報系の研究者が、医療分野にもしっかり入っていって、一緒に戦わなければいけない。ただ、残念ながら医療AI研究に取り組むインセンティブが、特に学生視点だと見えにくいこともあり、なかなか参加者が増えない現状があります。医学の知識が乏しくてもデータの扱いに長けることで、お医者さん方と手を組めば、医療AIに貢献できる成果が出せることもあるはずです。
覚醒プロジェクトに採択されたみなさんは志が高く、コミュニティとして交流も盛んに行なわれると聞いています。今後は、そうした人たちともつながりながら新しいチャレンジをするなど、将来につなげていきたいと考えています」
■覚醒プロジェクト 公式Webサイト
http://kakusei.aist.go.jp/
この連載の記事
-
ビジネス
「生命工学の研究に没頭できる絶好のチャンス」覚醒PM・東北大の阿部敬悦教授 -
AI
元サッカー青年コンビが挑む「FootballGPT」、試合動画から次の展開を予測 -
AI
未来のAIアシスタントは行動認識で「次はジャガイモ切って」と教えてくれる -
AI
ペロブスカイト太陽電池の材料探索を深層学習で効率化、「次の世代」への責任果たす -
AI
「あはは」も再現? 味気ないAIとのおしゃべりを豊かにする音声対話技術 -
ビジネス
産総研「覚醒プロジェクト」、2024年度の採択者が決定 -
AI
「日本の声優のすばらしさ広めたい」アニメの世界観ごと輸出するAI吹き替え技術 -
AI
AIに難しい「時間的な動き」の理解、動画-自然言語モデルで目指す突破口 -
ビジネス
「まだまだ未熟な量子技術、だからこそおもしろい」覚醒PM・名古屋大学の藤巻 朗教授 -
AI
シャノン限界超え!物理層秘密鍵でセキュアなセマンティック通信を目指す - この連載の一覧へ