UniDCP: Unifying Multiple Medical Vision-Language Tasks Via Dynamic Cross-Modal Learnable Prompts

计算机科学 情态动词 自然语言处理 人工智能 人机交互 语音识别 化学 高分子化学
作者
Chenlu Zhan,Yufei Zhang,Yu Lin,Gaoang Wang,Hongwei Wang
出处
期刊:IEEE Transactions on Multimedia [Institute of Electrical and Electronics Engineers]
卷期号:26: 9736-9748 被引量:2
标识
DOI:10.1109/tmm.2024.3397191
摘要

Medical vision-language pre-training (Med-VLP) models have recently accelerated the fast-growing medical diagnostics application. However, most Med-VLP models learn task-specific representations independently from scratch, thereby leading to great inflexibility when they work across multiple fine-tuning tasks. In this work, we propose UniDCP , a Uni fied medical vision-language model with D ynamic C ross-modal learnable P rompts, which can be plastically applied to multiple medical vision-language tasks within a unified model. Specifically, we explicitly construct a unified framework to harmonize diverse inputs from multiple pre-training tasks by leveraging cross-modal prompts for unification, which accordingly can accommodate heterogeneous medical fine-tuning tasks within a same model. Furthermore, we conceive a dynamic cross-modal prompt optimizing strategy that optimizes the prompts within the shareable space for implicitly processing the shareable clinic knowledge. UniDCP is the first Med-VLP model capable of performing all 8 medical uni-modal and cross-modal tasks over 14 corresponding datasets, consistently yielding superior results over diverse state-of-the-art methods.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
温眸完成签到,获得积分10
3秒前
科研通AI2S应助安静的尔岚采纳,获得10
3秒前
852应助Luka采纳,获得10
5秒前
5秒前
6秒前
zqingxia发布了新的文献求助10
8秒前
帅气的逍遥完成签到 ,获得积分10
9秒前
人间烟火发布了新的文献求助10
10秒前
真金小子完成签到 ,获得积分10
10秒前
充电宝应助沉稳效师旅采纳,获得10
11秒前
11秒前
WuYiHHH完成签到,获得积分10
13秒前
yc发布了新的文献求助10
14秒前
17秒前
Whisper完成签到,获得积分10
18秒前
19秒前
人间烟火完成签到,获得积分10
22秒前
热心的善愁完成签到,获得积分10
23秒前
ycyang发布了新的文献求助30
24秒前
单纯手机完成签到,获得积分10
24秒前
ZBY发布了新的文献求助10
24秒前
YAQII完成签到,获得积分10
24秒前
wei完成签到,获得积分10
28秒前
嚯嚯很有才完成签到,获得积分10
29秒前
研友_VZG7GZ应助甜蜜雅彤采纳,获得10
33秒前
35秒前
yc完成签到,获得积分10
35秒前
CipherSage应助zqingxia采纳,获得10
38秒前
小王爱学习完成签到 ,获得积分10
39秒前
miaowuuuuuuu完成签到 ,获得积分10
42秒前
响铃发布了新的文献求助30
43秒前
杜十二完成签到,获得积分10
44秒前
我是老大应助孙同学采纳,获得10
44秒前
45秒前
46秒前
老崔完成签到,获得积分20
48秒前
小白发布了新的文献求助10
49秒前
如果发布了新的文献求助10
49秒前
Luka完成签到,获得积分10
53秒前
高分求助中
Solution Manual for Strategic Compensation A Human Resource Management Approach 1200
Natural History of Mantodea 螳螂的自然史 1000
Glucuronolactone Market Outlook Report: Industry Size, Competition, Trends and Growth Opportunities by Region, YoY Forecasts from 2024 to 2031 800
A Photographic Guide to Mantis of China 常见螳螂野外识别手册 800
Autoregulatory progressive resistance exercise: linear versus a velocity-based flexible model 500
The analysis and solution of partial differential equations 400
Spatial Political Economy: Uneven Development and the Production of Nature in Chile 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3334217
求助须知:如何正确求助?哪些是违规求助? 2963538
关于积分的说明 8609923
捐赠科研通 2642446
什么是DOI,文献DOI怎么找? 1446654
科研通“疑难数据库(出版商)”最低求助积分说明 670394
邀请新用户注册赠送积分活动 658533