清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

AMRE: An Attention-Based CRNN for Manchu Word Recognition on a Woodblock-Printed Dataset

计算机科学 光学(聚焦) 文档 人工智能 卷积神经网络 分割 自然语言处理 过程(计算) 鉴定(生物学) 性格(数学) 词(群论) 卷积(计算机科学) 写作风格 模式识别(心理学) 人工神经网络 语言学 生物 几何学 植物 操作系统 光学 物理 哲学 程序设计语言 数学
作者
Zhiwei Wang,Siyang Lu,Mingquan Wang,Xiang Wei,Yingjun Qi
出处
期刊:Lecture Notes in Computer Science 卷期号:: 267-278 被引量:3
标识
DOI:10.1007/978-3-031-30108-7_23
摘要

Ancient minority language character recognition could be challenging due to limited documentation, but it is always critical to better understand history and conduct social science researches. As an important minority language, Manchu language is confronted with the similar challenges due to the lack of systematic document studies. Recently, more researches focus on solving this problem through different approaches, such as document digitalization or character image segmentation. However, there are still some limitations. On one hand, existing digitalized Manchu documents are carried out based upon machine-printed style, which is not common in real historical documents and can cause severe recognition bias. On the other hand, most of Manchu identification methods are based on coarse image segmentation and may result in recognition error since it is difficult to consistently cut the words accurately. To tackle these two challenges, we propose a segmentation-free method for Manchu recognition with a medium scale dataset of Woodblock-printed Manchu Words (WMW). We first develop WMW based-upon woodblock-printed Manchu words, which are more common in ancient documents. With the developed dataset, we conduct document mining and carry out a framework, namely AMRE, with Attention-based Convolutional Recurrent Neural Network. AMRE leverages attention mechanism by weighted aggregation of the convolution results from differently sized kernels and more effectively mine the valid information of morphed words in recognition process. By implementing our proposed AMRE, the digitalized characters can be more accurately recognized. The experiment results show that the word recognition accuracy of AMRE exceeds the baseline by more than 5 $$\%$$ .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
wanci应助白华苍松采纳,获得10
4秒前
年轻的凝云完成签到 ,获得积分10
12秒前
24秒前
ceeray23发布了新的文献求助20
29秒前
李健的粉丝团团长应助一木采纳,获得200
51秒前
poki完成签到 ,获得积分10
56秒前
57秒前
一木发布了新的文献求助200
1分钟前
1分钟前
MchemG完成签到,获得积分0
1分钟前
amelia完成签到 ,获得积分10
1分钟前
sunny完成签到,获得积分10
3分钟前
3分钟前
fddd发布了新的文献求助10
3分钟前
3分钟前
星星发布了新的文献求助10
3分钟前
4分钟前
SciGPT应助星星采纳,获得10
4分钟前
星辰大海应助科研通管家采纳,获得10
4分钟前
牛八先生完成签到,获得积分10
4分钟前
方白秋完成签到,获得积分10
5分钟前
5分钟前
我是老大应助白华苍松采纳,获得10
6分钟前
汤圆儿完成签到 ,获得积分10
6分钟前
烟花应助科研通管家采纳,获得10
6分钟前
科研通AI2S应助科研通管家采纳,获得10
6分钟前
wodetaiyangLLL完成签到 ,获得积分10
7分钟前
科目三应助fddd采纳,获得10
7分钟前
7分钟前
7分钟前
fddd发布了新的文献求助10
7分钟前
lanxinge完成签到 ,获得积分10
7分钟前
陶醉笑柳完成签到,获得积分20
7分钟前
陶醉笑柳发布了新的文献求助10
7分钟前
Orange应助陶醉笑柳采纳,获得10
7分钟前
紫熊发布了新的文献求助10
8分钟前
科研通AI5应助一木采纳,获得20
8分钟前
8分钟前
8分钟前
一木发布了新的文献求助20
8分钟前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Kelsen’s Legacy: Legal Normativity, International Law and Democracy 1000
Interest Rate Modeling. Volume 3: Products and Risk Management 600
Interest Rate Modeling. Volume 2: Term Structure Models 600
Dynamika przenośników łańcuchowych 600
The King's Magnates: A Study of the Highest Officials of the Neo-Assyrian Empire 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3539060
求助须知:如何正确求助?哪些是违规求助? 3116670
关于积分的说明 9326455
捐赠科研通 2814641
什么是DOI,文献DOI怎么找? 1546998
邀请新用户注册赠送积分活动 720679
科研通“疑难数据库(出版商)”最低求助积分说明 712178