已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Med-2E3: A 2D-Enhanced 3D Medical Multimodal Large Language Model

计算机科学 心理学 自然语言处理 语言学 哲学
作者
Yiming Shi,Xun Zhu,Ying Hu,Cheng Guo,Miao Li,Ji Wu
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2411.12783
摘要

The analysis of 3D medical images is crucial for modern healthcare, yet traditional task-specific models are becoming increasingly inadequate due to limited generalizability across diverse clinical scenarios. Multimodal large language models (MLLMs) offer a promising solution to these challenges. However, existing MLLMs have limitations in fully leveraging the rich, hierarchical information embedded in 3D medical images. Inspired by clinical practice, where radiologists focus on both 3D spatial structure and 2D planar content, we propose Med-2E3, a novel MLLM for 3D medical image analysis that integrates 3D and 2D encoders. To aggregate 2D features more effectively, we design a Text-Guided Inter-Slice (TG-IS) scoring module, which scores the attention of each 2D slice based on slice contents and task instructions. To the best of our knowledge, Med-2E3 is the first MLLM to integrate both 3D and 2D features for 3D medical image analysis. Experiments on a large-scale, open-source 3D medical multimodal benchmark demonstrate that Med-2E3 exhibits task-specific attention distribution and significantly outperforms current state-of-the-art models, with a 14% improvement in report generation and a 5% gain in medical visual question answering (VQA), highlighting the model's potential in addressing complex multimodal clinical tasks. The code will be released upon acceptance.

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
共享精神应助元yuan采纳,获得10
刚刚
lixiaofan发布了新的文献求助10
2秒前
冷酷的听兰完成签到,获得积分10
3秒前
hyt发布了新的文献求助10
3秒前
上官若男应助完美不惜采纳,获得10
9秒前
9秒前
SciGPT应助alexzlmmd采纳,获得10
12秒前
daisy发布了新的文献求助10
13秒前
SUNINE发布了新的文献求助10
16秒前
17秒前
没有昵称完成签到 ,获得积分10
17秒前
李不错完成签到 ,获得积分10
20秒前
20秒前
星辰大海应助自驾小胖采纳,获得10
21秒前
黄油屑屑发布了新的文献求助10
22秒前
不配.应助我不是鸡哥采纳,获得10
24秒前
大侠发布了新的文献求助10
24秒前
xiaixax发布了新的文献求助10
29秒前
传奇3应助chentutu采纳,获得10
29秒前
聪明的怜烟完成签到,获得积分20
29秒前
小蘑菇应助黄油屑屑采纳,获得10
30秒前
gemn完成签到,获得积分10
30秒前
33秒前
FashionBoy应助自信的秀发采纳,获得10
33秒前
化工兔应助科研通管家采纳,获得10
34秒前
脑洞疼应助科研通管家采纳,获得30
34秒前
英姑应助科研通管家采纳,获得10
34秒前
buno应助科研通管家采纳,获得10
34秒前
英姑应助科研通管家采纳,获得10
34秒前
ding应助科研通管家采纳,获得10
34秒前
动听帆布鞋完成签到 ,获得积分10
37秒前
1111完成签到,获得积分10
37秒前
38秒前
38秒前
Dontcare发布了新的文献求助10
40秒前
41秒前
1111发布了新的文献求助10
43秒前
45秒前
chentutu发布了新的文献求助10
46秒前
cabbage008完成签到,获得积分10
46秒前
高分求助中
Востребованный временем 2500
Les Mantodea de Guyane 1000
Very-high-order BVD Schemes Using β-variable THINC Method 930
Field Guide to Insects of South Africa 660
The Three Stars Each: The Astrolabes and Related Texts 500
effects of intravenous lidocaine on postoperative pain and gastrointestinal function recovery following gastrointestinal surgery: a meta-analysis 400
The Collected Works of Jeremy Bentham: Rights, Representation, and Reform: Nonsense upon Stilts and Other Writings on the French Revolution 320
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3384284
求助须知:如何正确求助?哪些是违规求助? 2998308
关于积分的说明 8778225
捐赠科研通 2683887
什么是DOI,文献DOI怎么找? 1469969
科研通“疑难数据库(出版商)”最低求助积分说明 679585
邀请新用户注册赠送积分活动 671926