このページの本文へ

Transformerの化学言語モデルはキラリティ認識が苦手

2024年02月21日 06時05分更新

文● MIT Technology Review Japan

東京大学の研究チームは、深層学習モデルのTransformer（トランスフォーマー）が多様な化合物構造を学習していく過程で、特定の部分を苦手としていることを発見した。深層学習モデルは薬学研究でも活用されており、化合物構造を自然言語処理を使って数値へ変換する化学言語モデルが使われている。ただ、深層学習モデルが多様な化合物構造をどのように認識し、学習しているのかは明らかになっていなかった。

東京大学の研究チームは、深層学習モデルのTransformer（トランスフォーマー）が多様な化合物構造を学習していく過程で、特定の部分を苦手としていることを発見した。深層学習モデルは薬学研究でも活用されており、化合物構造を自然言語処理を使って数値へ変換する化学言語モデルが使われている。ただ、深層学習モデルが多様な化合物構造をどのように認識し、学習しているのかは明らかになっていなかった。研究チームは、深層学習モデルは学習を重ねるごとに精度が向上していく点に着目して、学習の進捗に応じてTransformerの性質がどのように変遷するのかを調べた。その結果、学習開始早々に、化合物構造を表現する文字列の部分的な学習が完了するが、文字列全体の学習には時間がかかることを確認。さらに、学習経過が異なる複数のモデルを用意し、それぞれで化合物の毒性や物性を推定させたところ、学習経過に関係なく、学習初期段階からほぼ同等の精度となることを発見した。この検証の最中に、深層学習モデルの学習が確率的に滞る現象を確認し、原因を探索した。その結果、化合物の立体的特性であるキラリティを表現する文字（@、@@）を見出したことから、キラリティの認識がTransformerモデルの学習に大きく影響することが分かった。加えて、原子ごとの精度を評価する際にもキラリティの学習が遅いことも分かった。さらに、この分野で頻用するSMILES（Simplified Molecular Input Line Entry System）表現やInChI（International Chemical Identifier）表現でも同様の現象を確認できた。研究成果は2月16日、ネイチャー・コミュニケーションズ（Nature Communications）にオンライン掲載された。（笹田）

【この記事をMITテクノロジーレビューで読む】

ツイートする

カテゴリートップへ

お知らせ

ピックアップ

sponsored
Radiant GZ3500Z790/D5をカスタム

BTOってマジ大事。16万円台のふつ～なPCが20万円のi5＆RTX 4060のゲーミングPCに
sponsored
音を知る企業による自社ブランドの第一弾製品

一生使いたいヘッドホンを見つけた。その名は「The Industrial-ist Wired」だ！
sponsored
見た目スッキリでキレイなPCが誰でも簡単に組める

自作PCの配線ゴチャゴチャは過去の話、「PROJECT ZERO」製品一覧と作例を紹介
sponsored
ファッショナブルなデザインに、カロリー管理や睡眠モニタリングなどの便利機能をプラス！

スマートバンドの着け心地とスマートウォッチの高機能が両方ある！ファーウェイ「HUAWEI WATCH FIT 3」レビュー
sponsored
ゲームも作業もすべてがなめらか表示

ヌルヌル動くというのはこのこと、240Hzゲーミングディスプレー「G274QPX」レビュー
sponsored
「STYLE-14FH128-U7-UH2X」をチェック、16:10ディスプレーを採用

1kg以下の14型ノートPCで「Stable Diffusion」も、Core Ultra 7でやりたいことを加速しよう
sponsored
第14世代インテルCore、RTX 40 SUPERシリーズ、DDR5メモリーを選択可能

純白のコスパ最強ゲーミングPCを目指せ！ソフマップの「STORM」BTOパソコンを実機レビューだ
sponsored
ビジネスバッグに入るサイズ感、持ち運べる重量感

実用性能が1グレード高いのに価格はスタンダードなノートPCをレビュー「Modern 15 H C13M」シリーズ
sponsored

200mmファンにダスト検知機能！エアフロー最強ケース「ProArt PA602」をレビュー
sponsored
JN-GMM1IPS28BKをレビュー

PS5の実力も引き出せる28型4K/144Hz、KVMまで使える万能モデルが7万円はコスパ◎！
sponsored
なぜクラウドストレージに切り替える企業が増えているのか

ファイルサーバー／NASとクラウドストレージの違いとは？《基本編》
sponsored
JN-MD-OLED156UHDR-Tをレビュー

15.6型4K有機ELのタッチ対応モバイルディスプレーと16型IPSのWQXGAモデル、どちらを買うべきか