An end-to-end model for multi-view scene text recognition

计算机科学 人工智能 脚本语言 端到端原则 深度学习 水准点(测量) 相似性(几何) 语言模型 鉴定(生物学) 一致性(知识库) 机器学习 成对比较 模式识别(心理学) 自然语言处理 图像(数学) 植物 大地测量学 生物 地理 操作系统
作者
Ayan Banerjee,Palaiahnakote Shivakumara,Sumanta Bhattacharya,Umapada Pal,Cheng-Lin Liu
出处
期刊:Pattern Recognition [Elsevier]
卷期号:149: 110206-110206 被引量:1
标识
DOI:10.1016/j.patcog.2023.110206
摘要

Due to the increasing applications of surveillance and monitoring such as person re-identification, vehicle re-identification and sports events tracking, the necessity of text detection and end-to-end recognition is also growing. Although the past deep learning-based models have addressed several challenges such as arbitrary-shaped text, multiple scripts, and variations in the geometric structure of characters, the scope of the models is limited to a single view. This paper presents an end-to-end model for text recognition through refining the multi-views of the same scene, which is called E2EMVSTR (End-to-End Model for Multi-View Scene Text Recognition). Considering the common characteristics shared in multi-view texts, we propose a cycle consistency pairwise similarity-based deep learning model to find texts more efficiently in three input views. Further, the extracted texts are supplied to a Siamese network and semi-supervised attention embedding combinational network for obtaining recognition results. The proposed model combines natural language processing and genetic algorithm models to restore missing character information and correct wrong recognition results. In experiments on our multi-view dataset and several benchmark datasets, the proposed method is proven effective compared to the state-of-the-art methods. The dataset and codes will be made available to the public upon acceptance.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
所所应助小美采纳,获得10
刚刚
12345完成签到,获得积分10
刚刚
Dloftdv完成签到 ,获得积分10
1秒前
小杭76应助wocao采纳,获得10
1秒前
黄丹丽发布了新的文献求助10
1秒前
tkxfy完成签到,获得积分10
2秒前
顺利毕业耶耶耶完成签到,获得积分10
2秒前
QAQ发布了新的文献求助30
3秒前
Rn发布了新的文献求助10
3秒前
4秒前
5秒前
Leon完成签到,获得积分10
5秒前
221完成签到,获得积分10
5秒前
华仔完成签到,获得积分10
5秒前
iNk应助酷酷的山雁采纳,获得10
8秒前
陈慧钦发布了新的文献求助10
8秒前
8秒前
tiatia应助5999采纳,获得10
8秒前
10秒前
香蕉觅云应助Lee采纳,获得10
11秒前
充电宝应助研友_8Kedgn采纳,获得10
12秒前
研研发布了新的文献求助10
12秒前
汉堡包应助blueskyzhi采纳,获得10
12秒前
皮蛋完成签到,获得积分10
14秒前
14秒前
鱼贝贝完成签到 ,获得积分10
16秒前
懒洋洋完成签到 ,获得积分10
18秒前
yaxuandeng完成签到,获得积分10
19秒前
19秒前
浮游应助wocao采纳,获得10
20秒前
Lee发布了新的文献求助10
22秒前
23秒前
deeperection发布了新的文献求助10
25秒前
27秒前
丘比特应助ahfjk采纳,获得10
28秒前
youxiu完成签到 ,获得积分10
28秒前
29秒前
dolabmu完成签到 ,获得积分10
30秒前
30秒前
31秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Fermented Coffee Market 2000
Methoden des Rechts 600
Constitutional and Administrative Law 500
PARLOC2001: The update of loss containment data for offshore pipelines 500
Critical Thinking: Tools for Taking Charge of Your Learning and Your Life 4th Edition 500
Vertebrate Palaeontology, 5th Edition 380
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5284152
求助须知:如何正确求助?哪些是违规求助? 4437733
关于积分的说明 13814786
捐赠科研通 4318688
什么是DOI,文献DOI怎么找? 2370566
邀请新用户注册赠送积分活动 1365978
关于科研通互助平台的介绍 1329429