Recovering Homography from Camera Captured Documents using Convolutional Neural Networks

透视失真 单应性 计算机科学 人工智能 卷积神经网络 透视图(图形) 失真(音乐) 管道(软件) 模式识别(心理学) 计算机视觉 比例(比率) 图像(数学) 数学 放大器 计算机网络 统计 投射试验 带宽(计算) 射影空间 程序设计语言 物理 量子力学
作者
Syed Ammar Abbas,Sibt ul Hussain
出处
期刊:Cornell University - arXiv 被引量:6
标识
DOI:10.48550/arxiv.1709.03524
摘要

Removing perspective distortion from hand held camera captured document images is one of the primitive tasks in document analysis, but unfortunately, no such method exists that can reliably remove the perspective distortion from document images automatically. In this paper, we propose a convolutional neural network based method for recovering homography from hand-held camera captured documents. Our proposed method works independent of document's underlying content and is trained end-to-end in a fully automatic way. Specifically, this paper makes following three contributions: Firstly, we introduce a large scale synthetic dataset for recovering homography from documents images captured under different geometric and photometric transformations; secondly, we show that a generic convolutional neural network based architecture can be successfully used for regressing the corners positions of documents captured under wild settings; thirdly, we show that L1 loss can be reliably used for corners regression. Our proposed method gives state-of-the-art performance on the tested datasets, and has potential to become an integral part of document analysis pipeline.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
李健的小迷弟应助tang采纳,获得10
刚刚
燕儿应助ohhhRachel采纳,获得10
刚刚
2秒前
joy发布了新的文献求助10
4秒前
孙畅发布了新的文献求助10
4秒前
4秒前
articlechaser发布了新的文献求助10
5秒前
Orange应助nimo采纳,获得10
5秒前
5秒前
猫咪老师完成签到,获得积分10
6秒前
6秒前
Akin关注了科研通微信公众号
7秒前
追寻的白安完成签到,获得积分10
7秒前
8秒前
10秒前
Hello应助articlechaser采纳,获得10
11秒前
潘健康发布了新的文献求助10
11秒前
莎akkk完成签到,获得积分10
12秒前
恺撒完成签到 ,获得积分10
13秒前
16秒前
至秦发布了新的文献求助10
17秒前
pass完成签到,获得积分10
18秒前
ding应助茜茜采纳,获得10
18秒前
Oying完成签到,获得积分10
19秒前
19秒前
孙畅完成签到,获得积分20
19秒前
搞怪烨伟发布了新的文献求助10
21秒前
Hubery完成签到 ,获得积分10
22秒前
虚拟小号发布了新的文献求助10
22秒前
lily发布了新的文献求助10
22秒前
23秒前
23秒前
lindsay完成签到,获得积分10
24秒前
完美世界应助优雅含灵采纳,获得10
24秒前
25秒前
米恩完成签到,获得积分10
28秒前
tanhaowen发布了新的文献求助10
28秒前
29秒前
郑郑郑幸运完成签到 ,获得积分10
30秒前
dakdake大可完成签到,获得积分10
30秒前
高分求助中
The Data Economy: Tools and Applications 1000
Bayesian Models of Cognition:Reverse Engineering the Mind 800
Essentials of thematic analysis 700
Mantiden - Faszinierende Lauerjäger – Buch gebraucht kaufen 600
PraxisRatgeber Mantiden., faszinierende Lauerjäger. – Buch gebraucht kaufe 600
A Dissection Guide & Atlas to the Rabbit 600
Внешняя политика КНР: о сущности внешнеполитического курса современного китайского руководства 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3119973
求助须知:如何正确求助?哪些是违规求助? 2770627
关于积分的说明 7704974
捐赠科研通 2425862
什么是DOI,文献DOI怎么找? 1288275
科研通“疑难数据库(出版商)”最低求助积分说明 620932
版权声明 599998