Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data

计算机科学 一般化 公制(单位) 集合(抽象数据类型) 单眼 人工智能 比例(比率) 数据集 简单(哲学) 编码器 杠杆(统计) 缩放比例 机器学习 数据挖掘 程序设计语言 经济 物理 哲学 数学分析 几何学 操作系统 认识论 量子力学 数学 运营管理
作者
Lihe Yang,Bingyi Kang,Zilong Huang,Xiaogang Xu,Jiashi Feng,Hengshuang Zhao
出处
期刊:Cornell University - arXiv 被引量:9
标识
DOI:10.48550/arxiv.2401.10891
摘要

This work presents Depth Anything, a highly practical solution for robust monocular depth estimation. Without pursuing novel technical modules, we aim to build a simple yet powerful foundation model dealing with any images under any circumstances. To this end, we scale up the dataset by designing a data engine to collect and automatically annotate large-scale unlabeled data (~62M), which significantly enlarges the data coverage and thus is able to reduce the generalization error. We investigate two simple yet effective strategies that make data scaling-up promising. First, a more challenging optimization target is created by leveraging data augmentation tools. It compels the model to actively seek extra visual knowledge and acquire robust representations. Second, an auxiliary supervision is developed to enforce the model to inherit rich semantic priors from pre-trained encoders. We evaluate its zero-shot capabilities extensively, including six public datasets and randomly captured photos. It demonstrates impressive generalization ability. Further, through fine-tuning it with metric depth information from NYUv2 and KITTI, new SOTAs are set. Our better depth model also results in a better depth-conditioned ControlNet. Our models are released at https://github.com/LiheYoung/Depth-Anything.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
ivying0209发布了新的文献求助10
刚刚
刚刚
顺心毛巾完成签到,获得积分10
1秒前
小李发布了新的文献求助50
1秒前
爆米花应助封印采纳,获得10
2秒前
2秒前
3秒前
群青发布了新的文献求助10
5秒前
科研通AI6.4应助E9采纳,获得10
6秒前
无误发布了新的文献求助10
6秒前
mkmkm完成签到,获得积分20
6秒前
七月流火应助naru采纳,获得50
6秒前
Robin发布了新的文献求助10
7秒前
7秒前
7秒前
Aurora完成签到 ,获得积分10
8秒前
9秒前
9秒前
聪慧千万发布了新的文献求助10
9秒前
海棠完成签到,获得积分10
10秒前
李爱国应助菜鸟学习采纳,获得10
10秒前
Tommmy完成签到,获得积分20
10秒前
11秒前
Alexa发布了新的文献求助50
11秒前
魔幻菇菇完成签到,获得积分20
11秒前
12秒前
mkmkm发布了新的文献求助10
12秒前
dongshao6666发布了新的文献求助10
13秒前
14秒前
RMgX发布了新的文献求助10
15秒前
Akim应助kk采纳,获得10
15秒前
16秒前
小可完成签到,获得积分20
16秒前
双儿完成签到,获得积分10
17秒前
17秒前
封印发布了新的文献求助10
18秒前
魔幻菇菇发布了新的文献求助20
18秒前
20秒前
北月景彡完成签到,获得积分10
20秒前
领导范儿应助聪慧千万采纳,获得10
20秒前
高分求助中
Cronologia da história de Macau 5000
Matrix Methods in Data Mining and Pattern Recognition 510
Interactions of Vowel Quality and Prosody in East Slavic 500
Vander's Renal Physiology第10版 500
Forensic Science An Introduction to Scientific and Investigative Techniques 6th Edition 400
Virus-like particles empower RNAi for effective control of a Coleopteran pest 400
Materials Informatics Molecules, Crystals and Beyond A volume in Acta Materialia Book Series 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7099539
求助须知:如何正确求助?哪些是违规求助? 8755309
关于积分的说明 18518645
捐赠科研通 6656832
什么是DOI,文献DOI怎么找? 3139512
关于科研通互助平台的介绍 2249195
邀请新用户注册赠送积分活动 2114161