亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Generative Large Language Models for Detection of Speech Recognition Errors in Radiology Reports

医学 召回 听写 自然语言处理 生成模型 精确性和召回率 生成语法 人工智能 机器学习 语音识别 心理学 认知心理学 计算机科学
作者
Reuben Schmidt,Jarrel Seah,Ke Cao,L Lim,Wei Xiang Lim,Justin Yeung
出处
期刊:Radiology [Radiological Society of North America]
卷期号:6 (2) 被引量:14
标识
DOI:10.1148/ryai.230205
摘要

This study evaluated the ability of generative large language models (LLMs) to detect speech recognition errors in radiology reports. A dataset of 3233 CT and MRI reports was assessed by radiologists for speech recognition errors. Errors were categorized as clinically significant or not clinically significant. Performances of five generative LLMs—GPT-3.5-turbo, GPT-4, text-davinci-003, Llama-v2–70B-chat, and Bard—were compared in detecting these errors, using manual error detection as the reference standard. Prompt engineering was used to optimize model performance. GPT-4 demonstrated high accuracy in detecting clinically significant errors (precision, 76.9%; recall, 100%; F1 score, 86.9%) and not clinically significant errors (precision, 93.9%; recall, 94.7%; F1 score, 94.3%). Text-davinci-003 achieved F1 scores of 72% and 46.6% for clinically significant and not clinically significant errors, respectively. GPT-3.5-turbo obtained 59.1% and 32.2% F1 scores, while Llama-v2–70B-chat scored 72.8% and 47.7%. Bard showed the lowest accuracy, with F1 scores of 47.5% and 20.9%. GPT-4 effectively identified challenging errors of nonsense phrases and internally inconsistent statements. Longer reports, resident dictation, and overnight shifts were associated with higher error rates. In conclusion, advanced generative LLMs show potential for automatic detection of speech recognition errors in radiology reports. Keywords: CT, Large Language Model, Machine Learning, MRI, Natural Language Processing, Radiology Reports, Speech, Unsupervised Learning Supplemental material is available for this article. © RSNA, 2024
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
研友_VZG7GZ应助科研通管家采纳,获得10
5秒前
Lucas应助科研通管家采纳,获得10
5秒前
5秒前
丘比特应助奋斗若冰采纳,获得30
9秒前
12秒前
隐形曼青应助Xx采纳,获得10
14秒前
15秒前
Suzy应助ni采纳,获得10
16秒前
奋斗若冰发布了新的文献求助30
20秒前
可爱的函函应助GONGLI采纳,获得10
27秒前
33秒前
34秒前
bluecat发布了新的文献求助10
37秒前
星辰大海应助wzwer123采纳,获得10
41秒前
乐乐应助bluecat采纳,获得10
41秒前
喵喵完成签到 ,获得积分10
42秒前
脑洞疼应助背后的思真采纳,获得10
55秒前
眼睛大慕卉完成签到 ,获得积分10
56秒前
整齐泥猴桃完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
1分钟前
林林完成签到 ,获得积分10
1分钟前
1分钟前
何琳发布了新的文献求助10
1分钟前
1分钟前
Menand完成签到,获得积分10
1分钟前
Xx发布了新的文献求助10
1分钟前
jokerhoney完成签到,获得积分10
1分钟前
背后的思真完成签到,获得积分10
1分钟前
bkagyin应助Xx采纳,获得10
1分钟前
dddd完成签到,获得积分10
1分钟前
Lin完成签到,获得积分10
1分钟前
2分钟前
科研通AI2S应助科研通管家采纳,获得10
2分钟前
丘比特应助科研通管家采纳,获得10
2分钟前
科研通AI2S应助科研通管家采纳,获得10
2分钟前
李爱国应助科研通管家采纳,获得10
2分钟前
SciGPT应助万万陈陈采纳,获得10
2分钟前
2分钟前
高分求助中
Востребованный временем 2500
The Three Stars Each: The Astrolabes and Related Texts 1500
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Les Mantodea de Guyane 800
Mantids of the euro-mediterranean area 700
The Oxford Handbook of Educational Psychology 600
有EBL数据库的大佬进 Matrix Mathematics 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 物理 纳米技术 计算机科学 遗传学 化学工程 基因 复合材料 免疫学 物理化学 细胞生物学 催化作用 病理
热门帖子
关注 科研通微信公众号,转发送积分 3413289
求助须知:如何正确求助?哪些是违规求助? 3015642
关于积分的说明 8871542
捐赠科研通 2703375
什么是DOI,文献DOI怎么找? 1482215
科研通“疑难数据库(出版商)”最低求助积分说明 685159
邀请新用户注册赠送积分活动 679927