Rich feature hierarchies for accurate object detection and semantic segmentation

计算机科学 人工智能 分割 滑动窗口协议 模式识别(心理学) 可扩展性 边距(机器学习) 特征(语言学) 目标检测 帕斯卡(单位) 卷积神经网络 机器学习 窗口(计算) 哲学 程序设计语言 操作系统 数据库 语言学
作者
Ross Girshick,Jeff Donahue,Trevor Darrell,Jitendra Malik
出处
期刊:Cornell University - arXiv 被引量:375
摘要

Object detection performance, as measured on the canonical PASCAL VOC dataset, has plateaued in the last few years. The best-performing methods are complex ensemble systems that typically combine multiple low-level image features with high-level context. In this paper, we propose a simple and scalable detection algorithm that improves mean average precision (mAP) by more than 30% relative to the previous best result on VOC 2012---achieving a mAP of 53.3%. Our approach combines two key insights: (1) one can apply high-capacity convolutional neural networks (CNNs) to bottom-up region proposals in order to localize and segment objects and (2) when labeled training data is scarce, supervised pre-training for an auxiliary task, followed by domain-specific fine-tuning, yields a significant performance boost. Since we combine region proposals with CNNs, we call our method R-CNN: Regions with CNN features. We also compare R-CNN to OverFeat, a recently proposed sliding-window detector based on a similar CNN architecture. We find that R-CNN outperforms OverFeat by a large margin on the 200-class ILSVRC2013 detection dataset. Source code for the complete system is available at this http URL.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
1秒前
jyd完成签到,获得积分10
2秒前
weiyashu完成签到 ,获得积分10
2秒前
lena发布了新的文献求助10
3秒前
大个应助WHH采纳,获得10
3秒前
4秒前
张铁柱完成签到,获得积分10
4秒前
Takagi52发布了新的文献求助10
5秒前
无花果应助欣喜的青梦采纳,获得10
5秒前
ng完成签到 ,获得积分10
6秒前
光亮的莺发布了新的文献求助10
6秒前
Freya发布了新的文献求助30
7秒前
7秒前
czh发布了新的文献求助10
7秒前
子非鱼发布了新的文献求助10
8秒前
Sun1c7完成签到,获得积分10
8秒前
9秒前
十一发布了新的文献求助10
10秒前
12秒前
烧酒发布了新的文献求助10
12秒前
李健的小迷弟应助芭娜55采纳,获得50
12秒前
13秒前
13秒前
Freya完成签到,获得积分10
13秒前
甲羟基戊二酸单酰辅酶A完成签到 ,获得积分10
15秒前
大气从安发布了新的文献求助10
16秒前
开朗的慕儿完成签到,获得积分10
16秒前
小杜完成签到,获得积分10
17秒前
JiangYifan完成签到 ,获得积分10
17秒前
19秒前
此间少年郎完成签到 ,获得积分10
19秒前
葵葵完成签到,获得积分10
20秒前
20秒前
21秒前
21秒前
22秒前
赘婿应助王九八采纳,获得20
25秒前
25秒前
香蕉觅云应助冷静灵竹采纳,获得10
25秒前
高分求助中
A new approach to the extrapolation of accelerated life test data 1000
Cognitive Neuroscience: The Biology of the Mind 1000
Technical Brochure TB 814: LPIT applications in HV gas insulated switchgear 1000
Immigrant Incorporation in East Asian Democracies 500
Nucleophilic substitution in azasydnone-modified dinitroanisoles 500
不知道标题是什么 500
A Preliminary Study on Correlation Between Independent Components of Facial Thermal Images and Subjective Assessment of Chronic Stress 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3966029
求助须知:如何正确求助?哪些是违规求助? 3511354
关于积分的说明 11157644
捐赠科研通 3245890
什么是DOI,文献DOI怎么找? 1793218
邀请新用户注册赠送积分活动 874262
科研通“疑难数据库(出版商)”最低求助积分说明 804296