Giving Text More Imagination Space for Image-text Matching

计算机科学 人工智能 概括性 匹配(统计) 光学(聚焦) 情态动词 图像(数学) 自然语言处理 空格(标点符号) 特征(语言学) 模式识别(心理学) 语言学 数学 心理学 哲学 物理 化学 高分子化学 光学 操作系统 心理治疗师 统计
作者
Xinfeng Dong,Longfei Han,Dingwen Zhang,Li Liu,Junwei Han,Huaxiang Zhang
标识
DOI:10.1145/3581783.3612103
摘要

Image-text matching is a hot topic in multi-modal analysis. The existing image-text matching algorithms focus on bridging the heterogeneity gap and mapping the feature into a common space under strong alignment assumption. However, these methods have unsatisfactory performance under the weak alignment scenario, which assumes that the text contains more abstract information, and the number of entities in the text is always fewer than objects in image. This is the first time, from our knowledge, to solve the image-text matching problem from the perspective of information difference with weak alignment. In order to both narrow the cross-modal heterogeneity gap and balance the information discrepancy, we proposed an imagination network to enrich the text modality based on pre-trained framework, which is helpful for image-text matching. The imagination network utilizes reinforcement learning to enhance the semantic information for text modality, and an action refinement strategy is designed to constrain the freedom and divergence of imagination. The experiment results show the superiority and generality of the proposed framework based on two pre-trained models, CLIP and BLIP on two most frequently-used datasets MSCOCO and Flickr30K.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
fsm发布了新的文献求助20
刚刚
未月初二完成签到,获得积分10
刚刚
1秒前
sue发布了新的文献求助100
2秒前
量子星尘发布了新的文献求助10
2秒前
酷炫的白翠完成签到,获得积分10
3秒前
3秒前
英姑应助GGB采纳,获得10
3秒前
3秒前
geoffreyfan发布了新的文献求助10
4秒前
斯文败类应助未月初二采纳,获得10
5秒前
5秒前
fino发布了新的文献求助10
5秒前
Mullt完成签到 ,获得积分10
7秒前
小金鱼完成签到,获得积分20
7秒前
7秒前
7秒前
专一的猎豹完成签到,获得积分10
8秒前
Jingg完成签到,获得积分10
8秒前
OnMyWorldside发布了新的文献求助10
9秒前
朴实浩宇完成签到,获得积分10
10秒前
明天想自律完成签到 ,获得积分10
10秒前
10秒前
11秒前
量子星尘发布了新的文献求助10
11秒前
12秒前
13秒前
皮卡皮卡丘完成签到,获得积分10
13秒前
13秒前
顾矜应助fino采纳,获得10
13秒前
ymbb发布了新的文献求助10
14秒前
14秒前
淡然的咖啡豆完成签到 ,获得积分10
14秒前
旺仔不甜完成签到,获得积分10
14秒前
15秒前
科研小趴菜完成签到,获得积分10
15秒前
孔踏歌完成签到,获得积分10
15秒前
一个好听的名字完成签到,获得积分10
16秒前
远山黛完成签到 ,获得积分10
16秒前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
Statistical Methods for the Social Sciences, Global Edition, 6th edition 600
こんなに痛いのにどうして「なんでもない」と医者にいわれてしまうのでしょうか 510
The Insulin Resistance Epidemic: Uncovering the Root Cause of Chronic Disease  500
Walter Gilbert: Selected Works 500
An Annotated Checklist of Dinosaur Species by Continent 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3662750
求助须知:如何正确求助?哪些是违规求助? 3223555
关于积分的说明 9752139
捐赠科研通 2933523
什么是DOI,文献DOI怎么找? 1606108
邀请新用户注册赠送积分活动 758266
科研通“疑难数据库(出版商)”最低求助积分说明 734771