画像クレジット:FeatureChina via AP Images
人工知能(AI)を用いたスクリーニング検査によってがんの発見件数が増えれば、死なずにすむ人が増えると一般には考えられている。しかし、過剰診断が増えれば、むしろ不利益をもたらす可能性もある。
この記事は米国版ニュースレターを一部再編集したものです。
私は先日、誕生日を迎えた。なぜこんなことを書くかというと、大腸内視鏡検査を受ける資格を新たに得られたからだ。私は最近、がんのスクリーニングについてよく考えている。というのも、ここ数カ月、「人工知能(AI)ががん検出に革命を起こす」という見出しをいくつも目にしたからだ。
マイクロソフトは9月7日、デジタル病理診断を開発するペイジ(Paige)と提携し、がんを識別するための世界最大の画像ベースのAIモデルを構築することを発表した。このアルゴリズムの訓練用データセットには400万枚の画像が含まれる。ペイジのアンディ・モイエ最高経営責任者(CEO)はニュース専門放送局CNBCの取材に対し、「これはがん治療にとって、月面着陸の瞬間のような画期的な出来事です」と語った。
そうかもしれない。8月には、AIを併用した乳がん検診の初の臨床試験の結果が発表された。研究チームは、2つのマンモグラムの判定方法を比較した。1つは2人の放射線科医のそれぞれによる標準的な診断、もう1つは放射線科医一人とAIがチームを組んで患者に1から10 までの数値のがんリスクスコアを割り当てるシステムによる診断だ。 後者のグループでは、リスクが最も高いスコア10を割り当てられた患者は、2人の放射線科医にマンモグラムを診断してもらった。AI支援モデルでは、作業負荷が44%削減され、がんの検出数が20%増加した。
この結果はすばらしいことのように思える。理論的には、がんを早期に発見すれば治療が容易になり、命が救われるはずだ。しかし、データによると、必ずしもそうとは限らない。8月下旬に発表された研究では、がんスクリーニング検査(がん検診)を受けた人と受けなかった人の2つのグループで(がんに限らずあらゆる原因による)死亡率を比較するランダム化臨床試験の文献が徹底的に調査された。大部分の一般的な種類のがんスクリーニング検査では、有意な差は認められなかった。ただし、結腸の下部のみを視覚的に確認する結腸がんスクリーニング検査の一種である、S状結腸内視鏡検査は例外だった。
なぜこのような結果になるのかは、明確にわかっていない。研究計画に欠陥があったのかもしれないし、論文の著者らが分析に含めた臨床試験は、有意差を確認するのに十分な期間、参加者を追跡していなかったのかもしれない。 ひょっとすると、スクリーニング検査の不利益が、恩恵を上回るのかもしれないとも考えられる。たとえば、スクリーニングによって致命的ながんを早期に発見できれば、患者はそれをうまく治療するための貴重な時間を獲得できるかもしれない。 しかし、スクリーニングで死亡に至らないがんが多く発見されれば、不利益の方が増える。この問題は過剰診断と呼ばれる。私はオーストラリアの研究者による以下の説明がわかりやすいと思う。「過剰診断とは、偽陽性診断(診断基準を満たさない人に病気を診断すること)でも誤診(基礎疾患を持つ人に間違った病態を診断すること)でもありません」。正しいが、患者にとって健康上の利益はほとんどないか皆無で、場合によっては不利益をもたらす可能性さえある診断のことなのだ。
スクリーニングによって、発見されていなければ死に至ったであろうがんが発見されていることに疑問の余地はない。では、なぜ過剰診断を心配するのか? スクリーニング検査は害をもたらすこともある。大腸内視鏡検査を受ける患者はまれに腸に穿孔(穴が開くこと)を起こすことがある。生体検査は感染症につながることがある。放射線療法や化学療法などの治療には、患者の健康に深刻なリスクが伴う。それは腫瘍除去手術でも同様だ。
では、AI支援によるスクリーニング検査は、過剰診断の増加につながるのだろうか? テキサス大学オースティン校デル医科大学の皮膚科医で研究者のアデウォレ・アダムソンに話を聞いた。「私なら率直に『はい、増加につながります』と答えます」とアダムソン医師は語る。「人々は、より多くのがんを発見することが目標だと考えていますが、それは私たちの目標ではありません。私たちの目標は、最終的に人を死に至らしめるがんを発見することです」 。そして、それはとても厄介だ。ほとんどのがんでは、致死的ながんとそうでないがんを区別する優れた方法は存在しないからだ。そのため、医師はすべてのがんを致死的であるかのように扱うことが多い。
アダムソン医師は2019年の論文で、がん検出アルゴリズムの学習プロセスについて説明している。コンピューターには「がん」または「がんではない」とラベル付けされた複数の画像が提示される。アルゴリズムは、その中から判別に役立つパターンを探す。「問題は、がんの性質を説明する唯一の正解が存在しないことです」とアダムソン医師は論文の中で指摘する。「機械学習アルゴリズムを使った早期がんの診断は、人間の解釈に基づいた診断よりも間違いなく一貫性があり、再現性も高くなります。しかし、必ずしも真実に近づくとは限りません。つまり、どの腫瘍が症状や死をもたらすことになるのかを判断する点では、アルゴリズムは人間よりも優れているわけではないかもしれません」。
しかし、AIが過剰診断の問題の解決に役立つ可能性もある。前述したオーストラリアの研究者はこんな例を挙げている。AIは、医療記録の中にある情報を使って、さまざまな患者のがんの経時的変化の傾向を調べることができるかもしれない。この想定では、診断から利益を受けられない患者を区別できる可能性がある。
アダムソン医師はアンチAIではない。アルゴリズムが学習するデータに「がんかもしれない」という第3のカテゴリーを単に加えてはどうかと考えている。このカテゴリーに、専門家の間で意見が分かれるスライドや画像を含める。このカテゴリーの患者に対しては、「保存的療法の検討がやや増えるかもしれません」。
というわけで、がん診断におけるAIの役割について判断を下すのはおそらく時期尚早だろう。だが、おそらく今後、AIによるがんスクリーニング検査に関する主張には、より懐疑的な目を向ける必要があるだろう。アダムソン医師は、AIがより多くのがんを発見できると吹聴する見出しにはうんざりしている。「人々はそのような見出しに騙されて、より多くのがんを発見する方が良いと思い込んでしまうのです。イライラして髪の毛を引き抜きたいほどです。私の頭にそんなに毛はありませんが」。
MITテクノロジーレビューの関連記事
放射線科医とAIが協力すれば、どちらかが単独で診断するよりも多くの乳がん症例を発見できる。 ハナ・キロ記者による記事。
以前の記事で、AIに医療判断を任せることのマイナス面についてジェシカ・ヘンゼロー記者が論じた。
◆
新型コロナ・ワクチンの秋接種始まる
この秋の新型コロナウイルス感染症(COVID-19)ワクチンについて知っておくべきことをまとめた記事を発表した。今週は新たに、9月12日に米国疾病予防管理センター(CDC)によって承認された改良ワクチンから誰が最も恩恵を受けると予想されるかについてまとめた記事を発表した。
医学・生物工学関連の注目ニュース
米食品医薬品局(FDA)諮問委員会によると、市販の風邪薬や鼻炎薬の多くに含まれている充血除去薬のフェニレフリンは安全だが、効果はないという(注:フェニレフリンはプソイドエフェドリンとは異なる)。(ニューヨーク・タイムズ紙 )
科学者は、ブタの体内で人間の腎臓を培養する目標に一歩近づいた。こうして作られた腎臓は、いつか移植を必要とする患者に使用されるかもしれない。(CNN)
新型コロナウイルス感染症は留まり続ける。私たちは対処法を学ばなければならない。(スタット誌、ワシントンポスト紙)
注意欠如・多動症(ADHD)の治療薬不足はまだまだ続く。(NBC)