Performance of two large language models for data extraction in evidence synthesis

计算机科学 解析 数据提取 上传 范围(计算机科学) 插件 数据挖掘 自然语言处理 数据科学 梅德林 万维网 程序设计语言 政治学 法学
作者
Amanda Konet,Ian B. Thomas,Gerald Gartlehner,Leila C. Kahwati,Rainer Hilscher,Shannon Kugley,Karen Crotty,Meera Viswanathan,Rob Chew
出处
期刊:Research Synthesis Methods [Wiley]
卷期号:15 (5): 818-824 被引量:2
标识
DOI:10.1002/jrsm.1732
摘要

Abstract Accurate data extraction is a key component of evidence synthesis and critical to valid results. The advent of publicly available large language models (LLMs) has generated interest in these tools for evidence synthesis and created uncertainty about the choice of LLM. We compare the performance of two widely available LLMs (Claude 2 and GPT‐4) for extracting pre‐specified data elements from 10 published articles included in a previously completed systematic review. We use prompts and full study PDFs to compare the outputs from the browser versions of Claude 2 and GPT‐4. GPT‐4 required use of a third‐party plugin to upload and parse PDFs. Accuracy was high for Claude 2 (96.3%). The accuracy of GPT‐4 with the plug‐in was lower (68.8%); however, most of the errors were due to the plug‐in. Both LLMs correctly recognized when prespecified data elements were missing from the source PDF and generated correct information for data elements that were not reported explicitly in the articles. A secondary analysis demonstrated that, when provided selected text from the PDFs, Claude 2 and GPT‐4 accurately extracted 98.7% and 100% of the data elements, respectively. Limitations include the narrow scope of the study PDFs used, that prompt development was completed using only Claude 2, and that we cannot guarantee the open‐source articles were not used to train the LLMs. This study highlights the potential for LLMs to revolutionize data extraction but underscores the importance of accurate PDF parsing. For now, it remains essential for a human investigator to validate LLM extractions.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
dent强完成签到 ,获得积分10
1秒前
任性星星完成签到 ,获得积分10
7秒前
开放访天完成签到 ,获得积分10
7秒前
20秒前
Xie完成签到 ,获得积分10
21秒前
优雅的凝阳完成签到 ,获得积分10
24秒前
LT完成签到 ,获得积分10
24秒前
36秒前
神勇的天问完成签到 ,获得积分10
39秒前
阳炎完成签到,获得积分10
47秒前
老王家的二姑娘完成签到 ,获得积分10
49秒前
hua完成签到 ,获得积分10
51秒前
黄花菜完成签到 ,获得积分10
52秒前
Hey完成签到 ,获得积分10
57秒前
1分钟前
Hiaoliem完成签到 ,获得积分10
1分钟前
小墨墨完成签到 ,获得积分10
1分钟前
仿真小学生完成签到,获得积分10
1分钟前
失眠的香蕉完成签到 ,获得积分10
1分钟前
Herbs完成签到 ,获得积分10
1分钟前
Gary完成签到 ,获得积分10
1分钟前
双眼皮跳蚤完成签到,获得积分10
1分钟前
blueblue完成签到,获得积分10
1分钟前
liangxu0313完成签到,获得积分10
1分钟前
peterlzb1234567完成签到,获得积分10
1分钟前
李金奥完成签到 ,获得积分10
1分钟前
dreamwalk完成签到 ,获得积分10
2分钟前
maclogos完成签到,获得积分10
2分钟前
落落完成签到 ,获得积分0
2分钟前
zyjsunye完成签到 ,获得积分0
2分钟前
曾建完成签到 ,获得积分10
2分钟前
腰果虾仁完成签到 ,获得积分10
2分钟前
穆一手完成签到 ,获得积分10
2分钟前
陈米花完成签到,获得积分10
2分钟前
yyjl31完成签到,获得积分0
2分钟前
Simon_chat完成签到,获得积分10
2分钟前
吐司炸弹完成签到,获得积分10
2分钟前
mayfly完成签到,获得积分10
2分钟前
邵翎365完成签到,获得积分10
2分钟前
雨城完成签到 ,获得积分10
2分钟前
高分求助中
Evolution 10000
Distribution Dependent Stochastic Differential Equations 500
A new species of Coccus (Homoptera: Coccoidea) from Malawi 500
A new species of Velataspis (Hemiptera Coccoidea Diaspididae) from tea in Assam 500
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 500
Die Gottesanbeterin: Mantis religiosa: 656 400
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3158663
求助须知:如何正确求助?哪些是违规求助? 2809828
关于积分的说明 7883769
捐赠科研通 2468539
什么是DOI,文献DOI怎么找? 1314323
科研通“疑难数据库(出版商)”最低求助积分说明 630582
版权声明 601983