A Direct Regression Scene Text Detector With Position-Sensitive Segmentation

计算机科学 人工智能 分割 棱锥(几何) 联营 回归 职位(财务) 模式识别(心理学) 推论 图像分割 基本事实 计算机视觉 数学 统计 经济 几何学 财务
作者
Peirui Cheng,Yuanqiang Cai,Weiqiang Wang
出处
期刊:IEEE Transactions on Circuits and Systems for Video Technology [Institute of Electrical and Electronics Engineers]
卷期号:30 (11): 4171-4181 被引量:21
标识
DOI:10.1109/tcsvt.2019.2947475
摘要

Direct regression methods have demonstrated their success on various multi-oriented benchmarks for scene text detection due to the high recall rate for small targets and the direct regression for text boxes. However, too many false positive candidates and inaccurate position regression still limit the performance of these methods. In this paper, we propose an end-to-end method by introducing position-sensitive segmentation into the direct regression method to overcome these shortcomings. We generate the ground truth of position-sensitive segmentation maps based on the information of text boxes so that the position-sensitive segmentation module can be trained synchronously with the direct regression module. Besides, more information about the relative position of text is provided for the network through the training of position-sensitive segmentation maps, which improves the expressiveness of the network. We also introduce spatial pyramid of position-sensitive segmentation into the proposed method considering the huge differences in sizes and aspect ratios of scene texts and we propose position-sensitive COI(Corner area of Interest) pooling into the proposed method to speed up the inference. Experiments on datasets ICDAR2015, MLT-17 and COCO-Text demonstrate that the proposed method has a comparable performance with state-of-the-art methods while it is more efficient. We also provide abundant ablation experiments to demonstrate the effectiveness of these improvements in our proposed method.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
lqz07完成签到,获得积分10
刚刚
小巧涔雨完成签到,获得积分10
1秒前
fff发布了新的文献求助10
1秒前
mc完成签到,获得积分10
1秒前
七月发布了新的文献求助10
1秒前
懿懿发布了新的文献求助10
2秒前
Atalent发布了新的文献求助10
2秒前
2秒前
白芷完成签到,获得积分10
2秒前
高大山彤完成签到,获得积分10
3秒前
合适醉蝶完成签到 ,获得积分10
3秒前
3秒前
王云霞完成签到,获得积分10
4秒前
xycc完成签到,获得积分10
4秒前
4秒前
Duang发布了新的文献求助10
4秒前
开心的西瓜完成签到,获得积分10
6秒前
7秒前
北冥鱼发布了新的文献求助10
7秒前
白板完成签到,获得积分20
8秒前
10秒前
10秒前
Lucas应助Champion采纳,获得10
10秒前
有个女孩叫阿娇完成签到,获得积分10
10秒前
丰富以亦发布了新的文献求助10
11秒前
李爱国应助zzzz采纳,获得10
11秒前
xinxin0902应助研狗采纳,获得20
11秒前
11秒前
古人说发布了新的文献求助20
11秒前
yaya发布了新的文献求助10
12秒前
12秒前
Akim应助Atalent采纳,获得10
12秒前
英姑应助千衷采纳,获得10
12秒前
ppat5012完成签到,获得积分10
12秒前
美味肉蟹煲完成签到,获得积分10
13秒前
歪比巴卜发布了新的文献求助10
13秒前
13秒前
13秒前
DEF完成签到 ,获得积分10
13秒前
zero完成签到,获得积分10
13秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
List of 1,091 Public Pension Profiles by Region 1561
Binary Alloy Phase Diagrams, 2nd Edition 1200
Holistic Discourse Analysis 600
Atlas of Liver Pathology: A Pattern-Based Approach 500
Latent Class and Latent Transition Analysis: With Applications in the Social, Behavioral, and Health Sciences 500
Using Genomics to Understand How Invaders May Adapt: A Marine Perspective 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5506056
求助须知:如何正确求助?哪些是违规求助? 4601542
关于积分的说明 14477374
捐赠科研通 4535544
什么是DOI,文献DOI怎么找? 2485440
邀请新用户注册赠送积分活动 1468399
关于科研通互助平台的介绍 1440887