SciHub
文献互助
期刊查询
一搜即达
科研导航
即时热点
交流社区
登录
注册
发布
文献
求助
首页
我的求助
捐赠本站
Performance of GPT-4 with Vision on Text- and Image-based ACR Diagnostic Radiology In-Training Examination Questions
医学
医学物理学
放射科
人工智能
培训(气象学)
计算机视觉
计算机科学
物理
气象学
作者
Nolan Hayden,
Spencer Gilbert,
Laila Poisson,
Brent Griffith,
Chad Klochko,
Shannyn Wolfe
出处
期刊:
Radiology
[Radiological Society of North America]
日期:2024-09-01
卷期号:312 (3)
被引量:6
链接
nih.gov
doi.org
标识
DOI:10.1148/radiol.240153
摘要
Background Recent advancements, including image processing capabilities, present new potential applications of large language models such as ChatGPT (OpenAI), a generative pretrained transformer, in radiology. However, baseline performance of ChatGPT in radiology-related tasks is understudied. Purpose To evaluate the performance of GPT-4 with vision (GPT-4V) on radiology in-training examination questions, including those with images, to gauge the model's baseline knowledge in radiology. Materials and Methods In this prospective study, conducted between September 2023 and March 2024, the September 2023 release of GPT-4V was assessed using 386 retired questions (189 image-based and 197 text-only questions) from the American College of Radiology Diagnostic Radiology In-Training Examinations. Nine question pairs were identified as duplicates; only the first instance of each duplicate was considered in ChatGPT's assessment. A subanalysis assessed the impact of different zero-shot prompts on performance. Statistical analysis included χ2 tests of independence to ascertain whether the performance of GPT-4V varied between question types or subspecialty. The McNemar test was used to evaluate performance differences between the prompts, with Benjamin-Hochberg adjustment of the P values conducted to control the false discovery rate (FDR). A P value threshold of less than.05 denoted statistical significance. Results GPT-4V correctly answered 246 (65.3%) of the 377 unique questions, with significantly higher accuracy on text-only questions (81.5%, 159 of 195) than on image-based questions (47.8%, 87 of 182) (χ2 test, P < .001). Subanalysis revealed differences between prompts on text-based questions, where chain-of-thought prompting outperformed long instruction by 6.1% (McNemar, P = .02; FDR = 0.063), basic prompting by 6.8% (P = .009, FDR = 0.044), and the original prompting style by 8.9% (P = .001, FDR = 0.014). No differences were observed between prompts on image-based questions with P values of .27 to >.99. Conclusion While GPT-4V demonstrated a level of competence in text-based questions, it showed deficits interpreting radiologic images. © RSNA, 2024 See also the editorial by Deng in this issue.
求助该文献
最长约 10秒,即可获得该文献文件
相关文献
科研通智能强力驱动
Strongly Powered by AbleSci AI
我的文献求助列表
浏览历史
一分钟了解求助规则
|
捐赠本站
|
历史今天
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
存在
发布了新的
文献求助
30
刚刚
共享精神
的
应助
被
王晰贺
采纳,获得
10
1秒前
小蘑菇
的
应助
被
liu
采纳,获得
10
2秒前
LMFY222
完成签到,获得积分
20
2秒前
顺利墨镜
发布了新的
文献求助
10
2秒前
奋斗的舒芙蕾
上传了
应助文件
3秒前
000
发布了新的
文献求助
10
3秒前
田様
上传了
应助文件
3秒前
难过的丹烟
完成签到,获得积分
10
5秒前
SciGPT
的
应助
被
LuoYR@SZU
采纳,获得
10
6秒前
淡然的宛菡
发布了新的
文献求助
10
6秒前
一米多
完成签到,获得积分
10
7秒前
共享精神
上传了
应助文件
7秒前
存在
完成签到,获得积分
10
7秒前
弥豆子
完成签到
,获得积分
10
9秒前
OIC
发布了新的
文献求助
10
9秒前
垃圾桶
完成签到
,获得积分
10
10秒前
mhlu7
发布了新的
文献求助
10
12秒前
简单点
发布了新的
文献求助
10
12秒前
共享精神
上传了
应助文件
13秒前
善学以致用
上传了
应助文件
14秒前
小蘑菇
的
应助
被
小杨
采纳,获得
10
14秒前
healthy
完成签到
,获得积分
10
15秒前
小星星
完成签到
,获得积分
10
15秒前
凹凸先森
发布了新的
文献求助
10
15秒前
Olivia
关闭了
Olivia
的
文献求助
17秒前
mimi
发布了新的
文献求助
10
18秒前
qin
完成签到,获得积分
10
19秒前
利好
完成签到
,获得积分
10
19秒前
牟弼
完成签到,获得积分
10
20秒前
曾经的含之
发布了新的
文献求助
10
20秒前
贾方硕
发布了新的
文献求助
10
20秒前
完美世界
上传了
应助文件
21秒前
cctv18
上传了
应助文件
22秒前
小天
完成签到,获得积分
10
22秒前
小蘑菇
上传了
应助文件
23秒前
领导范儿
上传了
应助文件
23秒前
哇哇哇哇
发布了新的
文献求助
30
24秒前
dorothy_meng
完成签到,获得积分
10
24秒前
毛豆
的
应助
被
kkuula
采纳,获得
10
24秒前
高分求助中
Востребованный временем
2500
Injection and Compression Molding Fundamentals
1000
Classics in Total Synthesis IV: New Targets, Strategies, Methods
1000
Mantids of the euro-mediterranean area
600
The Oxford Handbook of Educational Psychology
600
Mantodea of the World: Species Catalog Andrew M
500
Insecta 2. Blattodea, Mantodea, Isoptera, Grylloblattodea, Phasmatodea, Dermaptera and Embioptera
500
热门求助领域
(近24小时)
化学
医学
生物
材料科学
工程类
有机化学
生物化学
内科学
物理
纳米技术
计算机科学
基因
遗传学
化学工程
复合材料
免疫学
物理化学
细胞生物学
催化作用
病理
热门帖子
关注
科研通微信公众号,转发送积分
3422301
求助须知:如何正确求助?哪些是违规求助?
3022634
关于积分的说明
8901789
捐赠科研通
2710031
什么是DOI,文献DOI怎么找?
1486283
科研通“疑难数据库(出版商)”最低求助积分说明
686983
邀请新用户注册赠送积分活动
682206
今日热心研友
毛豆
575
4895
cocolu
189
4270
ceeray23
235
1630
丰知然
162
1380
VDC
64
2350
Jason
183
1030
模糊中正
46
2300
彭于彦祖
62
2130
tuanheqi
2350
十七
111
1180
卡卡
2140
pluto
57
1520
无名老大
2050
36456657
90
1090
我是站长才怪
50
1320
iNk
64
1040
sutharsons
56
970
方羽
1330
5度转角
114
不配.
1120
注:热心度 = 本日应助数 + 本日被采纳获取积分÷10