このページの本文へ

医学に関するチャットGPTの回答、正答率は文献数と関連

2023年11月24日 06時10分更新

文● MIT Technology Review Japan

横浜市立大学の研究チームは、米オープンAI（OpenAI）のチャットボット「チャットGPT（ChatGPT）」が医学に関する質問に対して回答する際の正誤を左右する要因を明らかにした。

横浜市立大学の研究チームは、米オープンAI（OpenAI）のチャットボット「チャットGPT（ChatGPT）」が医学に関する質問に対して回答する際の正誤を左右する要因を明らかにした。研究チームは、日本の医師国家試験3年分をチャットGPTに出題し、その正答率と回答の一貫性を集計した。その結果、大規模言語モデル「GPT-3.5」を使った場合（正答率56.4％、回答の一貫性56.5％）よりも、「GPT-4」を使った場合（正答率81.0％、回答の一貫性88.8％）の方が、正答率、回答の一貫性ともに優れていた。続いて試験問題を出題形式（単肢選択問題／多肢選択問題／計算問題）と出題内容（循環器学、小児科学などの分野）に応じて分類し、正答率に関係する因子を探索した。チャットGPTが、インターネット上の膨大なテキストデータで学習していることから、インターネット上の情報量の指針の一つとして、世界的な学術文献・引用情報データベースであるウェブ・オブ・サイエンス・コア・コレクション（Web of Science Core Collection）に収蔵されたすべての文献数を集計した。その結果、出題内容と正答率は、出題分野における総文献数と有意に関連することが明らかになった。また、出題形式や回答の一貫性も正答率に関連することが分かった。研究成果は11月3日、インターナショナル・ジャーナル・オブ・メディカル・インフォマティクス（International Journal of Medical Informatics）誌にオンライン掲載された。

（笹田）

【この記事をMITテクノロジーレビューで読む】

ツイートする

カテゴリートップへ

お知らせ

ピックアップ

sponsored
有線/2.4GHz/Bluetoothを選べるトリプルモード接続＆クリック音アリナシも選択可能

我が家の「深夜うるさい問題」を解決する静音ワイヤレスゲーミングマウス「ED-G3MPRO」
sponsored

200mmファンにダスト検知機能！エアフロー最強ケース「ProArt PA602」をレビュー
sponsored
JN-GMM1IPS28BKをレビュー

PS5の実力も引き出せる28型4K/144Hz、KVMまで使える万能モデルが7万円はコスパ◎！
sponsored
なぜクラウドストレージに切り替える企業が増えているのか

ファイルサーバー／NASとクラウドストレージの違いとは？《基本編》
sponsored
購入しやすい価格ながら機能充実、バッテリー長持ちの人気製品

1万円以下ウェアラブルの大定番がさらに進化！睡眠モニタリング精度アップの「HUAWEI Band 9」レビュー
sponsored
eスポーツ大会で採用される24インチクラスの新モデル

180Hzで3万円切りの即買いモデル、スピーカー内蔵のゲーミングディスプレー「G255PF E2」レビュー
sponsored
新たな敵は地中から現れる！

さらなる刺客（シカク）が四角い地球を襲う！5月23日発売『デジボク地球防衛軍２（略）』の魅力をチェック
sponsored
JN-MD-OLED156UHDR-Tをレビュー

15.6型4K有機ELのタッチ対応モバイルディスプレーと16型IPSのWQXGAモデル、どちらを買うべきか
sponsored
大阪・泉州産のスウェット生地を採用した「AKRacing by BEAMS DESIGN モデル」

スウェット生地のチェアってどう？編集部員何人かに座った感想を聞いてみた
sponsored
セブンアールジャパンの西川氏とASRockの原口氏にコダワリを聞いてきた

パソコンショップSEVENとASRockのコダワリが炸裂！ Threadripper PRO 7995WX搭載BTOPC
sponsored
従来よりもさらにコスパよくゲーミングPCを組みたい方へ

ゲーミングマザーボード「GAMING PLUS」シリーズ完全解説＆自作のオススメ構成例も紹介
sponsored
強化ガラス製マウスパッド「ROG Moonstone」など気になるデバイスもまとめて試す！

静音性重視の独自スイッチ“ROG NX Snow”がイイ！「ROG Strix Scope II 96 Wireless」をレビュー