Context-Aware Attention Network for Image-Text Retrieval

计算机科学 人工智能 背景(考古学) 相似性(几何) 情态动词 自然语言处理 图像检索 嵌入 文字嵌入 语义相似性 词(群论) 视觉文字 模态(人机交互) 情报检索 注意力网络 过程(计算) 图像(数学) 模式识别(心理学) 数学 古生物学 化学 几何学 高分子化学 生物 操作系统
作者
Qi Zhang,Zhen Lei,Zhaoxiang Zhang,Stan Z. Li
标识
DOI:10.1109/cvpr42600.2020.00359
摘要

As a typical cross-modal problem, image-text bi-directional retrieval relies heavily on the joint embedding learning and similarity measure for each image-text pair. It remains challenging because prior works seldom explore semantic correspondences between modalities and semantic correlations in a single modality at the same time. In this work, we propose a unified Context-Aware Attention Network (CAAN), which selectively focuses on critical local fragments (regions and words) by aggregating the global context. Specifically, it simultaneously utilizes global inter-modal alignments and intra-modal correlations to discover latent semantic relations. Considering the interactions between images and sentences in the retrieval process, intra-modal correlations are derived from the second-order attention of region-word alignments instead of intuitively comparing the distance between original features. Our method achieves fairly competitive results on two generic image-text retrieval datasets Flickr30K and MS-COCO.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
忆仙姿发布了新的文献求助10
1秒前
2秒前
蓝天发布了新的文献求助30
2秒前
小卜同学发布了新的文献求助10
2秒前
2秒前
2秒前
Lisss完成签到 ,获得积分10
3秒前
斯文败类应助马可采纳,获得10
5秒前
马尔斯完成签到,获得积分10
7秒前
8秒前
aaa发布了新的文献求助20
9秒前
Tracer发布了新的文献求助10
9秒前
9秒前
棉花完成签到 ,获得积分10
11秒前
cy发布了新的文献求助10
13秒前
14秒前
15秒前
甜甜灵槐完成签到,获得积分10
15秒前
15秒前
17秒前
冻干粉发布了新的文献求助10
19秒前
土豪的代芙完成签到,获得积分10
20秒前
酷波er应助小卜同学采纳,获得10
20秒前
crazy完成签到 ,获得积分10
21秒前
研友_ndvmV8发布了新的文献求助10
21秒前
trojan621发布了新的文献求助10
22秒前
22秒前
失眠赛凤完成签到,获得积分10
23秒前
23秒前
长情从安完成签到,获得积分10
24秒前
24秒前
24秒前
小点点完成签到,获得积分10
25秒前
jxl完成签到 ,获得积分10
26秒前
做梦完成签到,获得积分10
26秒前
既晓发布了新的文献求助10
26秒前
breeder完成签到,获得积分10
27秒前
宝玉完成签到 ,获得积分20
28秒前
28秒前
辛勤新梅完成签到 ,获得积分10
33秒前
高分求助中
GL 2 A method for assessing the in-place cleanability of food processing equipment, Fourth Edition, December 2023 3000
Annie Ernaux: De la perte au corps glorieux 600
Developing Solid Oral Dosage Forms Pharmaceutical Theory and Practice (3rd Edition) 500
Writing Systems 500
类器官构建与应用:从基础到前沿 500
Thermodynamics of Natural Systems 400
Electric Vehicle Powertrains Design Fundamentals, Components, and Applications 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6811585
求助须知:如何正确求助?哪些是违规求助? 8527372
关于积分的说明 18152729
捐赠科研通 6138011
什么是DOI,文献DOI怎么找? 3029966
邀请新用户注册赠送积分活动 2006633
关于科研通互助平台的介绍 2005352