Object Adaptive Self-Supervised Dense Visual Pre-Training

计算机科学 人工智能 计算机视觉 培训(气象学) 对象(语法) 图像处理 模式识别(心理学) 视觉对象识别的认知神经科学 目标检测 图像(数学) 物理 气象学
作者
Yu Zhang,Tao Zhang,Hongyuan Zhu,Zihan Chen,Siya Mi,Xi Peng,Xin Geng
出处
期刊:IEEE transactions on image processing [Institute of Electrical and Electronics Engineers]
卷期号:: 1-1
标识
DOI:10.1109/tip.2025.3555073
摘要

Self-supervised visual pre-training models have achieved significant success without employing expensive annotations. Nevertheless, most of these models focus on iconic single-instance datasets (e.g. ImageNet), ignoring the insufficient discriminative representation for non-iconic multi-instance datasets (e.g. COCO). In this paper, we propose a novel Object Adaptive Dense Pre-training (OADP) method to learn the visual representation directly on the multi-instance datasets (e.g., PASCAL VOC and COCO) for dense prediction tasks (e.g., object detection and instance segmentation). We present a novel object-aware and learning-adaptive random view augmentation to focus the contrastive learning to enhance the discrimination of object presentations from large to small scale during different learning stages. Furthermore, the representations across different scale and resolutions are integrated so that the method can learn diverse representations. In the experiment, we evaluated OADP pre-trained on PASCAL VOC and COCO. Results show that our method has better performances than most existing state-of-the-art methods when transferring to various downstream tasks, including image classification, object detection, instance segmentation and semantic segmentation.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
大个应助玩命做科研采纳,获得10
刚刚
打打应助pka采纳,获得10
刚刚
1秒前
1秒前
Annieqqiu发布了新的文献求助10
2秒前
英俊的铭应助xhs采纳,获得30
2秒前
3秒前
善学以致用应助燕燕于飞采纳,获得150
4秒前
英姑应助日出采纳,获得10
4秒前
Niar完成签到 ,获得积分10
4秒前
5秒前
seven发布了新的文献求助10
5秒前
田様应助罗大壮采纳,获得10
5秒前
6秒前
6秒前
6秒前
LPH应助boom采纳,获得10
6秒前
莹亮的星空完成签到,获得积分0
8秒前
8秒前
JAJ发布了新的文献求助10
8秒前
乐乐应助陆上飞采纳,获得10
9秒前
whysoserious完成签到,获得积分10
9秒前
toda_erica完成签到,获得积分10
9秒前
cdercder应助孤月独明采纳,获得20
10秒前
10秒前
10秒前
朴实流沙发布了新的文献求助10
11秒前
Momomo应助辛辛那提采纳,获得10
12秒前
pka发布了新的文献求助10
12秒前
12秒前
ANNY完成签到,获得积分10
13秒前
13秒前
我的光发布了新的文献求助10
13秒前
14秒前
烟花应助Una采纳,获得10
14秒前
小胳膊细腿完成签到,获得积分10
14秒前
CipherSage应助宝康biocom采纳,获得10
14秒前
15秒前
15秒前
yoyo完成签到,获得积分10
15秒前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Machine Learning Methods in Geoscience 1000
Essentials of Performance Analysis in Sport 500
Measure Mean Linear Intercept 500
Jianghu noir : the temporal and spatial becoming of the multitude in the cinema of Hong Kong 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3730303
求助须知:如何正确求助?哪些是违规求助? 3275045
关于积分的说明 9990562
捐赠科研通 2990604
什么是DOI,文献DOI怎么找? 1641231
邀请新用户注册赠送积分活动 779605
科研通“疑难数据库(出版商)”最低求助积分说明 748331