Visual question answering in the medical domain based on deep learning approaches: A comprehensive study

计算机科学 答疑 联营 人工智能 深度学习 机器学习 领域(数学分析) 卷积神经网络 任务(项目管理) 多样性(控制论) 卷积(计算机科学) 序列(生物学) 自然语言处理 人工神经网络 情报检索 生物 管理 经济 数学分析 遗传学 数学
作者
Aisha Al-Sadi,Mahmoud Al‐Ayyoub,Yaser Jararweh,Fumie Costen
出处
期刊:Pattern Recognition Letters [Elsevier]
卷期号:150: 57-75 被引量:10
标识
DOI:10.1016/j.patrec.2021.07.002
摘要

Visual Question Answering (VQA) in the medical domain has attracted more attention from research communities in the last few years due to its various applications. This paper investigates several deep learning approaches in building a medical VQA system based on ImageCLEF's VQA-Med dataset, which consists of about 4K images with about 15K question-answer pairs. Due to the wide variety of the images and questions included in this dataset, the proposed model is a hierarchical one consisting of many sub-models, each tailored to handle certain questions. For that, a special model is built to classify the questions into four categories, where each category is handled by a separate sub-model. At their core, all of these models consist of pre-trained Convolution Neural Networks (CNN). In order to get the best results, extensive experiments are performed and various techniques are employed including Data Augmentation (DA), Multi-Task Learning (MTL), Global Average Pooling (GAP), Ensembling, and Sequence to Sequence (Seq2Seq) models. Overall, the final model achieves 60.8 accuracy and 63.4 BLEU score, which are competitive with the state-of-the-art results despite using less demanding and simpler sub-models.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
2秒前
完美世界应助SC30采纳,获得10
2秒前
2秒前
郭郭完成签到 ,获得积分10
3秒前
3秒前
五五发布了新的文献求助10
4秒前
4秒前
科研通AI2S应助daker采纳,获得10
4秒前
5秒前
FashionBoy应助星期一采纳,获得10
6秒前
6秒前
lzw完成签到,获得积分10
7秒前
WangYanjie发布了新的文献求助10
7秒前
JamesPei应助徐佳乐采纳,获得10
8秒前
舒心的紫雪完成签到,获得积分10
8秒前
TwT完成签到,获得积分10
8秒前
彭于晏应助Eason采纳,获得10
9秒前
Albert发布了新的文献求助10
9秒前
ss1234ning完成签到,获得积分10
10秒前
10秒前
研友_24789发布了新的文献求助300
11秒前
精灵大夫完成签到,获得积分10
11秒前
Spectator发布了新的文献求助10
12秒前
桐桐应助天真的迎天采纳,获得30
12秒前
SC30完成签到,获得积分10
13秒前
Ava应助风吹月光采纳,获得20
13秒前
14秒前
常常完成签到 ,获得积分10
14秒前
小应应发布了新的文献求助10
14秒前
小仙鱼发布了新的文献求助10
16秒前
华仔应助1+1采纳,获得10
16秒前
17秒前
17秒前
现代书雪发布了新的文献求助10
17秒前
挽眠发布了新的文献求助30
18秒前
ttracc完成签到 ,获得积分10
19秒前
传奇3应助Sun1c7采纳,获得10
19秒前
19秒前
小卷粉发布了新的文献求助20
19秒前
高分求助中
Evolution 10000
The Young builders of New china : the visit of the delegation of the WFDY to the Chinese People's Republic 1000
юрские динозавры восточного забайкалья 800
English Wealden Fossils 700
Foreign Policy of the French Second Empire: A Bibliography 500
Chen Hansheng: China’s Last Romantic Revolutionary 500
China's Relations With Japan 1945-83: The Role of Liao Chengzhi 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3147888
求助须知:如何正确求助?哪些是违规求助? 2798879
关于积分的说明 7832212
捐赠科研通 2455931
什么是DOI,文献DOI怎么找? 1307018
科研通“疑难数据库(出版商)”最低求助积分说明 627959
版权声明 601587