亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

How Well Apply Multimodal Mixup and Simple MLPs Backbone to Medical Visual Question Answering?

计算机科学 增采样 一般化 人工智能 特征(语言学) 联营 机器学习 简单(哲学) 感知器 骨干网 答疑 编码(集合论) 特征提取 数据挖掘 模式识别(心理学) 人工神经网络 图像(数学) 程序设计语言 哲学 数学分析 计算机网络 集合(抽象数据类型) 认识论 语言学 数学
作者
Lei Liu,Xiangdong Su
标识
DOI:10.1109/bibm55620.2022.9995347
摘要

Although current methods have significantly improved the performance of medical visual question answering (Med-VQA), there are still two aspects worth exploring, namely the simplification of model structure and the effective model training on small-scale data. Different from the previous Med-VQA model, this paper only employs multi-layer perceptrons (MLPs) as the backbone network for feature extraction and modal fusion and designs a Med-VQA model on such basis, which achieves superior performance with a simple backbone network. To enhance model generalization, we design multimodal mixup (M-Mixup) to augment images and questions separately, which effectively alleviates the problem of insufficient training samples in the Med-VQA task. To prevent the destruction of the feature relationship when tokenizing the medical image, we design pooling tokens (PTs), a simple downsampling structure to capture fine-grained visual features without affecting the parameters and FLOPs of the entire model. Experimental results demonstrate that our model achieves state-of-the-art on the SLAKE, and obtains a remarkably competitive performance on the VQA-RAD. The source code and models are available at https://github.com/Alivelei/M-Mixup.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
爆米花应助明白放弃采纳,获得10
1秒前
年少丶完成签到,获得积分10
3秒前
我爱陶子完成签到 ,获得积分10
6秒前
爱撒娇的妙竹完成签到,获得积分10
12秒前
13秒前
Freeasy完成签到 ,获得积分10
16秒前
成就人杰发布了新的文献求助10
17秒前
lililili完成签到,获得积分10
18秒前
L_BD应助科研通管家采纳,获得10
18秒前
18秒前
L_BD应助科研通管家采纳,获得10
18秒前
18秒前
研友_VZG7GZ应助科研通管家采纳,获得10
18秒前
19秒前
852应助科研通管家采纳,获得10
19秒前
Akim应助Yifan17D采纳,获得10
20秒前
zhiwei完成签到 ,获得积分10
20秒前
27秒前
阔达雨灵完成签到 ,获得积分10
27秒前
Yifan17D发布了新的文献求助10
32秒前
HZW完成签到 ,获得积分10
33秒前
斯文败类应助成就人杰采纳,获得10
34秒前
277完成签到 ,获得积分10
38秒前
Yifan17D完成签到,获得积分10
40秒前
hujiwen020完成签到,获得积分10
45秒前
自由灰狼完成签到,获得积分10
1分钟前
孤芳自赏IrisKing完成签到 ,获得积分10
1分钟前
1分钟前
Jasper应助白茶清酒采纳,获得10
1分钟前
1分钟前
公子李发布了新的文献求助10
1分钟前
英姑应助自然醒采纳,获得10
1分钟前
科研通AI2S应助虚心的思真采纳,获得10
1分钟前
1分钟前
1分钟前
NYM发布了新的文献求助10
1分钟前
公子李完成签到,获得积分20
1分钟前
1分钟前
白茶清酒发布了新的文献求助10
1分钟前
虚心的思真完成签到,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Modern Epidemiology, Fourth Edition 5000
Handbook of pharmaceutical excipients, Ninth edition 5000
Digital Twins of Advanced Materials Processing 2000
Weaponeering, Fourth Edition – Two Volume SET 2000
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 化学工程 生物化学 物理 计算机科学 内科学 复合材料 催化作用 物理化学 光电子学 电极 冶金 细胞生物学 基因
热门帖子
关注 科研通微信公众号,转发送积分 6020845
求助须知:如何正确求助?哪些是违规求助? 7623082
关于积分的说明 16165681
捐赠科研通 5168555
什么是DOI,文献DOI怎么找? 2766100
邀请新用户注册赠送积分活动 1748479
关于科研通互助平台的介绍 1636086