Automated HEART score determination via ChatGPT: Honing a framework for iterative prompt development

管道(软件) 置信区间 计算机科学 集合(抽象数据类型) 迭代法 弗雷明翰风险评分 风险评估 算法 医学 内科学 计算机安全 程序设计语言 疾病
作者
Conrad W. Safranek,Thomas Huang,D. Wright,Catherine X. Wright,Vimig Socrates,Rohit B. Sangal,Mark Iscoe,David Chartash,Richard A. Taylor
出处
期刊:Journal of the American College of Emergency Physicians Open [Wiley]
卷期号:5 (2) 被引量:8
标识
DOI:10.1002/emp2.13133
摘要

Abstract Objectives This study presents a design framework to enhance the accuracy by which large language models (LLMs), like ChatGPT can extract insights from clinical notes. We highlight this framework via prompt refinement for the automated determination of HEART (History, ECG, Age, Risk factors, Troponin risk algorithm) scores in chest pain evaluation. Methods We developed a pipeline for LLM prompt testing, employing stochastic repeat testing and quantifying response errors relative to physician assessment. We evaluated the pipeline for automated HEART score determination across a limited set of 24 synthetic clinical notes representing four simulated patients. To assess whether iterative prompt design could improve the LLMs’ ability to extract complex clinical concepts and apply rule‐based logic to translate them to HEART subscores, we monitored diagnostic performance during prompt iteration. Results Validation included three iterative rounds of prompt improvement for three HEART subscores with 25 repeat trials totaling 1200 queries each for GPT‐3.5 and GPT‐4. For both LLM models, from initial to final prompt design, there was a decrease in the rate of responses with erroneous, non‐numerical subscore answers. Accuracy of numerical responses for HEART subscores (discrete 0–2 point scale) improved for GPT‐4 from the initial to final prompt iteration, decreasing from a mean error of 0.16–0.10 (95% confidence interval: 0.07–0.14) points. Conclusion We established a framework for iterative prompt design in the clinical space. Although the results indicate potential for integrating LLMs in structured clinical note analysis, translation to real, large‐scale clinical data with appropriate data privacy safeguards is needed.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
许许完成签到,获得积分10
1秒前
闲听花落完成签到 ,获得积分10
1秒前
橘白应助爱笑的幻姬采纳,获得10
1秒前
西南楚留香完成签到,获得积分10
4秒前
大旭发布了新的文献求助10
5秒前
哔哔鱼发布了新的文献求助10
6秒前
梅子完成签到 ,获得积分10
8秒前
科研通AI5应助RockLee采纳,获得10
8秒前
万能图书馆应助丑丑阿采纳,获得10
9秒前
11秒前
15秒前
15秒前
橘白应助爱笑的幻姬采纳,获得10
15秒前
18秒前
FAN凡完成签到,获得积分20
18秒前
董董发布了新的文献求助10
19秒前
20秒前
20秒前
素简发布了新的文献求助10
21秒前
21秒前
科研通AI5应助支雨泽采纳,获得10
22秒前
jingmishensi发布了新的文献求助10
23秒前
哈哈发布了新的文献求助10
24秒前
24秒前
FAN凡发布了新的文献求助10
26秒前
查理fofo完成签到,获得积分20
26秒前
tivyg'lk发布了新的文献求助10
27秒前
b15966013195发布了新的文献求助10
28秒前
王提完成签到,获得积分10
29秒前
HMONEY给wjar的求助进行了留言
29秒前
Kvolu29发布了新的文献求助10
31秒前
31秒前
可爱的函函应助tivyg'lk采纳,获得10
32秒前
34秒前
完美世界应助有魅力乌采纳,获得10
34秒前
惠慧完成签到,获得积分10
35秒前
36秒前
科研通AI5应助称心寒松采纳,获得10
37秒前
yy应助Qq采纳,获得10
37秒前
37秒前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Animal Physiology 2000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Am Rande der Geschichte : mein Leben in China / Ruth Weiss 1500
CENTRAL BOOKS: A BRIEF HISTORY 1939 TO 1999 by Dave Cope 1000
Machine Learning Methods in Geoscience 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3741422
求助须知:如何正确求助?哪些是违规求助? 3284072
关于积分的说明 10038118
捐赠科研通 3000880
什么是DOI,文献DOI怎么找? 1646811
邀请新用户注册赠送积分活动 783919
科研通“疑难数据库(出版商)”最低求助积分说明 750478