已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

HGAN: Hierarchical Graph Alignment Network for Image-Text Retrieval

计算机科学 图像检索 情报检索 人工智能 图形 视觉文字 图论 模式识别(心理学) 图像(数学) 理论计算机科学 组合数学 数学
作者
Jie Guo,Meiting Wang,Yan Zhou,Bin Song,Yuhao Chi,Wei Fan,Jianglong Chang
出处
期刊:IEEE Transactions on Multimedia [Institute of Electrical and Electronics Engineers]
卷期号:25: 9189-9202 被引量:16
标识
DOI:10.1109/tmm.2023.3248160
摘要

Image-text retrieval (ITR) is a challenging task in the field of multimodal information processing due to the semantic gap between different modalities. In recent years, researchers have made great progress in exploring the accurate alignment between image and text. However, existing works mainly focus on the fine-grained alignment between image regions and sentence fragments, which ignores the guiding significance of context background information. Actually, integrating the local fine-grained information and global context background information can provide more semantic clues for retrieval. In this paper, we propose a novel Hierarchical Graph Alignment Network (HGAN) for image-text retrieval. First, to capture the comprehensive multimodal features, we construct the feature graphs for the image and text modality respectively. Then, a multi-granularity shared space is established with a designed Multi-granularity Feature Aggregation and Rearrangement (MFAR) module, which enhances the semantic corresponding relations between the local and global information, and obtains more accurate feature representations for the image and text modalities. Finally, the ultimate image and text features are further refined through three-level similarity functions to achieve the hierarchical alignment. To justify the proposed model, we perform extensive experiments on MS-COCO and Flickr30 K datasets. Experimental results show that the proposed HGAN outperforms the state-of-the-art methods on both datasets, which demonstrates the effectiveness and superiority of our model.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
cocolu应助Tana采纳,获得10
1秒前
ljy阿完成签到 ,获得积分10
3秒前
3秒前
tongluobing完成签到,获得积分10
5秒前
cocolu应助司空三毒采纳,获得10
6秒前
6秒前
Charles发布了新的文献求助30
8秒前
8秒前
8秒前
9秒前
爆米花应助李政浩采纳,获得10
9秒前
欣慰雪巧完成签到 ,获得积分10
10秒前
10秒前
所所应助pengjiejie采纳,获得10
11秒前
清风发布了新的文献求助10
11秒前
自由的果汁完成签到,获得积分10
14秒前
从容甜瓜完成签到 ,获得积分10
19秒前
19秒前
美好海白完成签到,获得积分10
19秒前
Charles完成签到,获得积分10
19秒前
JKWu完成签到,获得积分10
20秒前
阵痛完成签到 ,获得积分10
21秒前
清风完成签到,获得积分10
22秒前
22秒前
23秒前
锦鲤完成签到 ,获得积分10
24秒前
347完成签到,获得积分10
24秒前
haui完成签到,获得积分10
26秒前
26秒前
落寞诗珊发布了新的文献求助10
27秒前
xxy应助peng采纳,获得10
28秒前
cc应助iwjlkdjalkjc采纳,获得10
30秒前
水晶鞋完成签到 ,获得积分10
34秒前
李政浩关注了科研通微信公众号
34秒前
37秒前
38秒前
洁净思枫关注了科研通微信公众号
39秒前
41秒前
42秒前
llnysl完成签到 ,获得积分10
43秒前
高分求助中
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
Les Mantodea de Guyane 800
Mantids of the euro-mediterranean area 700
The Oxford Handbook of Educational Psychology 600
有EBL数据库的大佬进 Matrix Mathematics 500
Plate Tectonics 500
Igneous rocks and processes: a practical guide(第二版) 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 物理 纳米技术 计算机科学 基因 遗传学 化学工程 复合材料 免疫学 物理化学 细胞生物学 催化作用 病理
热门帖子
关注 科研通微信公众号,转发送积分 3417333
求助须知:如何正确求助?哪些是违规求助? 3018956
关于积分的说明 8886126
捐赠科研通 2706477
什么是DOI,文献DOI怎么找? 1484297
科研通“疑难数据库(出版商)”最低求助积分说明 685955
邀请新用户注册赠送积分活动 681110