avtmNet:Adaptive Visual-Text Merging Network for Image Captioning

隐藏字幕 计算机科学 图像(数学) 人工智能 计算机视觉 语音识别 自然语言处理
作者
Heng Song,Junwu Zhu,Yi Jiang
出处
期刊:Computers & Electrical Engineering [Elsevier]
被引量:5
标识
DOI:10.1016/j.compeleceng.2020.106630
摘要

Abstract Recently, researchers have made extensive research on the technology of automatically generating descriptions for an image. Various technologies for image captioning have been proposed, among which attention-based encoder-decoder framework achieved great success. Two different types of attention models are proposed to generate image captions respectively, i.e., model based visual attention that is good at describing details, and model based text attention that is good at comprehensive understanding. In order to integrate and make full use of visual information and text information to generate more accurate captions for images, in this paper, we firstly introduce a visual attention model to generate the visual information and a text attention model to form the text information respectively, and then propose an adaptive visual-text merging network(avtmNet). This merging network can effectively merge the visual information and text information, and automatically determine the proportion of both visual information and text information to generate the next caption word. Extensive experiments are performed on the datasets named COCO2014 and Flickr30K respectively, and show the effectiveness and superiority of our proposed approach.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
善学以致用应助牧百川采纳,获得30
1秒前
太叔道罡发布了新的文献求助10
4秒前
detail完成签到 ,获得积分10
5秒前
Orange应助liuminghui采纳,获得10
5秒前
5秒前
5秒前
knowledge完成签到,获得积分10
6秒前
8秒前
曹大壮发布了新的文献求助10
9秒前
小二郎应助锦哥采纳,获得10
10秒前
高贵冷荷发布了新的文献求助10
10秒前
Michael_li发布了新的文献求助30
12秒前
俭朴大碗完成签到 ,获得积分10
13秒前
monere完成签到,获得积分10
14秒前
烟花应助ahaemmm采纳,获得20
15秒前
17秒前
一一应助科研通管家采纳,获得20
19秒前
OPV应助科研通管家采纳,获得10
19秒前
酷波er应助科研通管家采纳,获得10
19秒前
爆米花应助高贵冷荷采纳,获得10
20秒前
liuminghui发布了新的文献求助10
21秒前
21秒前
21秒前
爱爱发布了新的文献求助10
24秒前
曹大壮发布了新的文献求助10
26秒前
formscratch发布了新的文献求助10
26秒前
27秒前
28秒前
北越惊鸿发布了新的文献求助10
30秒前
懵懂的仙人掌完成签到,获得积分10
31秒前
xisiwangdian发布了新的文献求助10
32秒前
善学以致用应助cyy112358采纳,获得10
32秒前
花开富贵完成签到 ,获得积分10
35秒前
会发芽完成签到 ,获得积分10
35秒前
linbei完成签到,获得积分10
38秒前
ChatGPT发布了新的文献求助10
44秒前
511完成签到,获得积分10
45秒前
无奈擎苍完成签到 ,获得积分10
46秒前
Duncan关注了科研通微信公众号
49秒前
mei发布了新的文献求助10
50秒前
高分求助中
LNG地下式貯槽指針(JGA指-107) 1000
LNG地上式貯槽指針 (JGA指 ; 108) 1000
Preparation and Characterization of Five Amino-Modified Hyper-Crosslinked Polymers and Performance Evaluation for Aged Transformer Oil Reclamation 700
Operative Techniques in Pediatric Orthopaedic Surgery 510
How Stories Change Us A Developmental Science of Stories from Fiction and Real Life 500
九经直音韵母研究 500
Full waveform acoustic data processing 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 免疫学 细胞生物学 电极
热门帖子
关注 科研通微信公众号,转发送积分 2930311
求助须知:如何正确求助?哪些是违规求助? 2582119
关于积分的说明 6963672
捐赠科研通 2230643
什么是DOI,文献DOI怎么找? 1185042
版权声明 589575
科研通“疑难数据库(出版商)”最低求助积分说明 580111