清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Cross-Modal Retrieval With Partially Mismatched Pairs

过度拟合 计算机科学 杠杆(统计) 情态动词 人工智能 稳健性(进化) 水准点(测量) 估计员 机器学习 数学 统计 人工神经网络 生物化学 化学 高分子化学 基因 大地测量学 地理
作者
Peng Hu,Zhenyu Huang,Dezhong Peng,Xu Wang,Xi Peng
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [IEEE Computer Society]
卷期号:45 (8): 9595-9610 被引量:38
标识
DOI:10.1109/tpami.2023.3247939
摘要

In this paper, we study a challenging but less-touched problem in cross-modal retrieval, i.e., partially mismatched pairs (PMPs). Specifically, in real-world scenarios, a huge number of multimedia data (e.g., the Conceptual Captions dataset) are collected from the Internet, and thus it is inevitable to wrongly treat some irrelevant cross-modal pairs as matched. Undoubtedly, such a PMP problem will remarkably degrade the cross-modal retrieval performance. To tackle this problem, we derive a unified theoretical Robust Cross-modal Learning framework (RCL) with an unbiased estimator of the cross-modal retrieval risk, which aims to endow the cross-modal retrieval methods with robustness against PMPs. In detail, our RCL adopts a novel complementary contrastive learning paradigm to address the following two challenges, i.e., the overfitting and underfitting issues. On the one hand, our method only utilizes the negative information which is much less likely false compared with the positive information, thus avoiding the overfitting issue to PMPs. However, these robust strategies could induce underfitting issues, thus making training models more difficult. On the other hand, to address the underfitting issue brought by weak supervision, we present to leverage of all available negative pairs to enhance the supervision contained in the negative information. Moreover, to further improve the performance, we propose to minimize the upper bounds of the risk to pay more attention to hard samples. To verify the effectiveness and robustness of the proposed method, we carry out comprehensive experiments on five widely-used benchmark datasets compared with nine state-of-the-art approaches w.r.t. the image-text and video-text retrieval tasks. The code is available at https://github.com/penghu-cs/RCL.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Noah完成签到 ,获得积分10
9秒前
sci_zt完成签到 ,获得积分0
10秒前
LJ_2完成签到 ,获得积分10
11秒前
Glory完成签到 ,获得积分10
29秒前
啦啦啦完成签到 ,获得积分10
30秒前
tcy完成签到,获得积分10
46秒前
xyliu发布了新的文献求助20
47秒前
无限凡白完成签到 ,获得积分20
54秒前
科研狗的春天完成签到 ,获得积分10
54秒前
孟寐以求完成签到 ,获得积分10
55秒前
露露完成签到 ,获得积分10
57秒前
雪花完成签到 ,获得积分10
1分钟前
南风完成签到 ,获得积分10
1分钟前
李剑鸿发布了新的文献求助30
1分钟前
淡然藏花完成签到 ,获得积分10
1分钟前
xxiao完成签到 ,获得积分10
1分钟前
科研狗完成签到 ,获得积分10
1分钟前
dm完成签到 ,获得积分10
1分钟前
健壮的芷容完成签到,获得积分10
1分钟前
坦率的从波完成签到 ,获得积分10
1分钟前
1分钟前
天天开心完成签到 ,获得积分10
2分钟前
研友_nqylan发布了新的文献求助10
2分钟前
Lyn完成签到 ,获得积分10
2分钟前
xinchengzhu完成签到 ,获得积分10
2分钟前
古炮完成签到 ,获得积分10
2分钟前
不秃燃的小老弟完成签到 ,获得积分10
2分钟前
lingling完成签到 ,获得积分10
2分钟前
jiujieweizi完成签到 ,获得积分10
2分钟前
火火火木完成签到 ,获得积分10
2分钟前
ukz37752应助科研通管家采纳,获得20
2分钟前
华仔应助科研通管家采纳,获得10
2分钟前
绿色心情完成签到 ,获得积分10
2分钟前
小太阳完成签到 ,获得积分10
2分钟前
啥时候吃火锅完成签到 ,获得积分0
2分钟前
vitamin完成签到 ,获得积分10
3分钟前
Linson完成签到,获得积分10
3分钟前
别找了睡觉吧完成签到 ,获得积分10
3分钟前
Alger完成签到,获得积分10
3分钟前
华仔应助陶醉的烤鸡采纳,获得10
4分钟前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2700
Neuromuscular and Electrodiagnostic Medicine Board Review 1000
Walter Gilbert: Selected Works 500
An Annotated Checklist of Dinosaur Species by Continent 500
岡本唐貴自伝的回想画集 500
Distinct Aggregation Behaviors and Rheological Responses of Two Terminally Functionalized Polyisoprenes with Different Quadruple Hydrogen Bonding Motifs 450
彭城银.延安时期中国共产党对外传播研究--以新华社为例[D].2024 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3655740
求助须知:如何正确求助?哪些是违规求助? 3218581
关于积分的说明 9724510
捐赠科研通 2927090
什么是DOI,文献DOI怎么找? 1603051
邀请新用户注册赠送积分活动 755904
科研通“疑难数据库(出版商)”最低求助积分说明 733617