Integrating large language models in systematic reviews: a framework and case study using ROBINS-I for risk of bias assessment

系统回顾 协议(科学) 任务(项目管理) 判断 数据提取 风险评估 心理干预 选择偏差 原始分数 计算机科学 选择(遗传算法) 心理学 应用心理学 原始数据 人工智能 统计 梅德林 医学 工程类 数学 生物 病理 计算机安全 政治学 法学 替代医学 系统工程 精神科 生物化学 程序设计语言
作者
Bashar Hasan,Samer Saadi,Noora S. Rajjoub,Moustafa Hegazi,Mohammad Al-Kordi,Farah Fleti,Magdoleen H. Farah,Irbaz Bin Riaz,Imon Banerjee,Zhen Wang,M. Hassan Murad
出处
期刊:BMJ evidence-based medicine [BMJ]
卷期号:: bmjebm-112597 被引量:5
标识
DOI:10.1136/bmjebm-2023-112597
摘要

Large language models (LLMs) may facilitate and expedite systematic reviews, although the approach to integrate LLMs in the review process is unclear. This study evaluates GPT-4 agreement with human reviewers in assessing the risk of bias using the Risk Of Bias In Non-randomised Studies of Interventions (ROBINS-I) tool and proposes a framework for integrating LLMs into systematic reviews. The case study demonstrated that raw per cent agreement was the highest for the ROBINS-I domain of ‘Classification of Intervention’. Kendall agreement coefficient was highest for the domains of ‘Participant Selection’, ‘Missing Data’ and ‘Measurement of Outcomes’, suggesting moderate agreement in these domains. Raw agreement about the overall risk of bias across domains was 61% (Kendall coefficient=0.35). The proposed framework for integrating LLMs into systematic reviews consists of four domains: rationale for LLM use, protocol (task definition, model selection, prompt engineering, data entry methods, human role and success metrics), execution (iterative revisions to the protocol) and reporting. We identify five basic task types relevant to systematic reviews: selection, extraction, judgement, analysis and narration. Considering the agreement level with a human reviewer in the case study, pairing artificial intelligence with an independent human reviewer remains required.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
李德胜发布了新的文献求助10
刚刚
盼着毕业的研究牲完成签到,获得积分20
刚刚
刘兴龙发布了新的文献求助20
刚刚
quhayley应助日笙采纳,获得10
1秒前
lcm发布了新的文献求助10
1秒前
1秒前
斯文败类应助高妖丽采纳,获得10
1秒前
1秒前
简单的笑蓝完成签到 ,获得积分10
2秒前
乐乐应助风来枫去采纳,获得10
3秒前
光风霁月发布了新的文献求助10
3秒前
斯文媚颜发布了新的文献求助10
3秒前
万万发布了新的文献求助10
3秒前
zjy完成签到,获得积分10
3秒前
3秒前
4秒前
yidashi发布了新的文献求助10
5秒前
FashionBoy应助骆驼牛子采纳,获得10
5秒前
yummy应助北河三采纳,获得10
5秒前
大方雁风完成签到,获得积分10
5秒前
生动的夜云完成签到,获得积分20
6秒前
6秒前
6秒前
7秒前
圆圈发布了新的文献求助10
7秒前
华仔应助carol采纳,获得10
8秒前
9秒前
顺利的伊完成签到,获得积分10
9秒前
cyrong应助大方雁风采纳,获得10
11秒前
11秒前
12秒前
kdl发布了新的文献求助10
12秒前
waa发布了新的文献求助10
13秒前
骆驼牛子完成签到,获得积分20
13秒前
爆米花应助xixi采纳,获得10
13秒前
ljj完成签到,获得积分10
13秒前
14秒前
贝贝完成签到,获得积分10
14秒前
嘀嘀嘀发布了新的文献求助10
15秒前
高妖丽发布了新的文献求助10
16秒前
高分求助中
Evolution 10000
Sustainability in Tides Chemistry 2800
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
An Introduction to Geographical and Urban Economics: A Spiky World Book by Charles van Marrewijk, Harry Garretsen, and Steven Brakman 600
Diagnostic immunohistochemistry : theranostic and genomic applications 6th Edition 500
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3152657
求助须知:如何正确求助?哪些是违规求助? 2803891
关于积分的说明 7856198
捐赠科研通 2461571
什么是DOI,文献DOI怎么找? 1310444
科研通“疑难数据库(出版商)”最低求助积分说明 629205
版权声明 601782