Improving optical character recognition performance for low quality images

光学字符识别 预处理器 计算机科学 人工智能 计算机视觉 模式识别(心理学) 低分辨率 性格(数学) 字符识别 图像(数学) 数学 高分辨率 遥感 几何学 地质学
作者
Matteo Brisinello,Ratko Grbić,Matija Pul,Tihomir Andelic
标识
DOI:10.23919/elmar.2017.8124460
摘要

Efficient Optical Character Recognition (OCR) in images grabbed from Set-Top Boxes (STBs) plays an important role in STB testing. However, running OCR software on such images usually ends with low OCR performance since images can have low resolution, low image quality or colorful background. In order to improve OCR performance, four different image preprocessing methods are proposed. In this paper OCR is performed with Tesseract 3.5 and the relatively new Tesseract 4.0 on the images grabbed from different STBs. On the original images Tesseract 3.5 provides a 35.7% accuracy while Tesseract 4.0 attains a 70.2% accuracy. The proposed preprocessing methods improve OCR performance by 33.3% for Tesseract 3.5 and 22.6% for Tesseract 4.0 on the available images.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Jzhaoc580完成签到 ,获得积分10
刚刚
胡思乱响完成签到,获得积分10
1秒前
hahaha6789y完成签到,获得积分10
1秒前
想毕业的猫猫完成签到,获得积分10
2秒前
oy完成签到,获得积分10
2秒前
愤怒的水绿完成签到,获得积分10
3秒前
xiaowang发布了新的文献求助10
4秒前
浮尘完成签到 ,获得积分0
4秒前
舒心的夜完成签到,获得积分10
4秒前
hahaha2完成签到,获得积分10
4秒前
syltharion完成签到,获得积分10
4秒前
maybe完成签到,获得积分10
5秒前
sheep完成签到,获得积分10
5秒前
James完成签到,获得积分10
5秒前
simon666完成签到,获得积分10
6秒前
Miya完成签到 ,获得积分10
6秒前
徐彬荣完成签到,获得积分10
6秒前
LGA1700完成签到,获得积分10
7秒前
Paff完成签到,获得积分10
7秒前
Tom2077完成签到,获得积分10
7秒前
Walton完成签到,获得积分10
7秒前
MaxwellZH完成签到,获得积分10
7秒前
fate完成签到,获得积分10
8秒前
量子咸鱼K完成签到,获得积分10
8秒前
清风徐来完成签到,获得积分10
8秒前
PaperCrane完成签到,获得积分10
8秒前
执着柏柳完成签到,获得积分10
8秒前
霡霂完成签到,获得积分10
8秒前
qqqdewq完成签到,获得积分10
9秒前
surlamper完成签到,获得积分10
9秒前
molihuakai应助科研通管家采纳,获得10
9秒前
lilycat完成签到,获得积分10
10秒前
活泼学生完成签到 ,获得积分10
12秒前
xiaowang完成签到,获得积分10
13秒前
cgl155410完成签到 ,获得积分10
17秒前
隐形跳跳糖完成签到 ,获得积分10
17秒前
公冶愚志完成签到 ,获得积分10
17秒前
lily完成签到,获得积分10
19秒前
风中的向卉完成签到 ,获得积分10
23秒前
辻诺完成签到 ,获得积分10
25秒前
高分求助中
Adhesion Science: Principles & Practice 1234
Signals, Systems, and Signal Processing 610
Burger's Medicinal Chemistry and Drug Discovery 400
A Step-by-Step Guide to Qualitative Data Coding 2nd Edition 400
Impact of Storage Orientation and Duration on Prefilled Syringe Performance: Break-Loose and Glide Forces, and Injection Time Across Multiple Time Points 360
Programming for Chemical Engineers Using C, C++, and MATLAB 300
Upland Kenya wild flowers and ferns: a flora of the flowers, ferns, grasses, and sedges of highland Kenya 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6663148
求助须知:如何正确求助?哪些是违规求助? 8413192
关于积分的说明 17984478
捐赠科研通 5867254
什么是DOI,文献DOI怎么找? 2975010
邀请新用户注册赠送积分活动 1950898
关于科研通互助平台的介绍 1876727