🔥 科研通第二届『应助活动周』正在进行中,3月24-30日求助秒级响应🚀,千元现金等你拿。当前排名🏆 📚 中科院2025期刊分区📊 已更新

IMTLM-Net: improved multi-task transformer based on localization mechanism network for handwritten English text recognition

变压器 计算机科学 计算智能 任务(项目管理) 人工智能 机制(生物学) 语音识别 模式识别(心理学) 自然语言处理 工程类 电压 电气工程 物理 量子力学 系统工程
作者
Qian‐Feng Zhang,Feng Liu,Wanru Song
出处
期刊:Complex & Intelligent Systems 卷期号:11 (1)
标识
DOI:10.1007/s40747-024-01713-8
摘要

Intelligence technology has widely empowered education. As an example, Optical Character Recognition (OCR) can be used in smart education scenarios such as online homework correction and teaching data analysis. One of the fundamental yet challenging tasks is to recognize images of handwritten English text as editable text accurately. This is because handwritten text tends to have different writing habits as well as smearing and overlapping, resulting in hard alignment between the image and the real text. Additionally, the lack of data on handwritten text further leads to a lower recognition rate. To address the above issue, on the one hand, this paper extends the existing dataset and introduces hyphenated data annotation to provide data support for improving the robustness and discrimination of the model; on the other hand, a novel framework named Improved Multi-task Transformer based on Localization Mechanism Network (IMTLM-Net) is proposed for handwritten English text recognition. IMTLM-Net contains two parts, namely the encoding and decoding modules. The encoding module introduces a dual-stream processing mechanism. That is, in the simultaneous processing of text and images, a Vision Transformer (VIT) is utilized to encode images, and a Permutation Language Model (PLM) is designed for word arrangement. Two Multiple Head Attention (MHA) units are employed in the decoding module, focusing on text sequences and image sequences. Moreover, the localization mechanism (LM) is applied to enhance font structure feature extraction from image data, which in turn improves the model's ability to capture complex details. Numerous experiments demonstrate that the proposed method achieves state-of-the-art results in handwritten text recognition.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
应助活动周(3月24-30日)排名
今日排名(3月26日)
1#707 科研小民工
227
4800
2#634 SYLH
317
3170
3#441 天才小能喵
210
2310
4#410 nozero
133
2770
5#308 xjcy
153
1550
6#303 小透明
105
1980
7#144 shinysparrow
61
830
8#127 CAOHOU
63
640
9#112 S77
56
560
10#109 浦肯野
52
570
11#102 迟大猫
51
510
12#102 研友_Z30GJ8
51
510
13#97 curtisness
47
500
14#92 夕诙
46
460
15#76 我是站长才怪
36
400
16#75 昏睡的蟠桃
25
500
17#75 36456657
37
380
18#74 从容芮
31
430
19#69 史小菜
31
380
20#66 天黑不打烊
33
330
21#58 QOP
29
290
22#58 zho
29
290
23#56 cdercder
23
330
24#54 孤檠
27
270
25#52 实验好难
24
280
26#52 斯文的寒风
26
260
27#52 zxzxzx
26
260
28#52 高高
26
260
29#50 1+1
24
260
30#48 古的古的
23
250
31#46 lijianguo
23
230
32#44 请叫我风吹麦浪
22
220
第1名:50元;第2名:30元;第3名:10元

总排名
1#2778 nozero
1057
17210
2#2252 科研小民工
806
14460
3#1794 SYLH
897
8970
4#1582 xjcy
786
7960
5#1526 shinysparrow
695
8310
6#1109 小透明
465
6440
7#441 天才小能喵
210
2310
8#438 毛豆
218
2200
9#435 36456657
211
2240
10#430 浦肯野
196
2340
11#416 S77
208
2080
12#394 昏睡的蟠桃
139
2550
13#379 CAOHOU
188
1910
14#321 从容芮
133
1880
15#274 迟大猫
137
1370
16#235 劲秉
82
1530
17#234 我是站长才怪
115
1190
18#229 curtisness
112
1170
19#220 子车茗
107
1130
20#208 cdercder
76
1320
21#196 点着太阳的人
70
1260
22#190 研友_Z30GJ8
94
960
23#184 QOP
92
920
24#177 史小菜
83
940
25#174 Catalina_S
85
890
26#160 zho
80
800
27#158 Leon
78
800
28#136 Auston_zhong
68
680
29#134 whisper
67
670
30#132 实验好难
64
680
31#131 suibianba
63
680
32#118 muxiangrong
42
760
33#118 斯文的寒风
59
590
34#118 tuanheqi
15
1030
35#116 HEIKU
58
580
36#114 VDC
37
770
37#108 无敌最俊朗
40
680
38#106 不懈奋进
50
560
39#106 火星上的菲鹰
53
530
40#103 sakurai
46
570
41#97 灵巧高山
37
600
42#96 遇上就这样吧
43
530
43#94 一一
20
740
44#92 夕诙
46
460
45#86 8R60d8
43
430
46#84 聪明钢铁侠
42
420
47#84 Leif
42
420
48#83 彭于彦祖
33
500
49#81 怼怼
36
450
50#80 天黑不打烊
40
400
第1名:500元;第2名:300元;第3名:100元
第4名:50元;第5名:30元;第6-10名:10元

10分钟更新一次,完整排名情况
实时播报
菠萝派完成签到,获得积分10
刚刚
幼稚完成签到,获得积分10
1秒前
善学以致用应助南风采纳,获得10
1秒前
搜集达人应助zhouzhou采纳,获得10
2秒前
3秒前
3秒前
nozero应助小小富采纳,获得10
3秒前
赵振辉发布了新的文献求助10
3秒前
4秒前
4秒前
wangyu发布了新的文献求助10
4秒前
着急的糖豆完成签到,获得积分20
4秒前
4秒前
5秒前
5秒前
5秒前
斯文败类应助张三毛采纳,获得10
8秒前
8秒前
小悔发布了新的文献求助10
8秒前
9秒前
wangyu完成签到,获得积分10
9秒前
简默发布了新的文献求助10
9秒前
皮灵犀发布了新的文献求助10
9秒前
tjfwg发布了新的文献求助10
9秒前
9秒前
9秒前
酷波er应助一一一采纳,获得10
9秒前
震动的幼蓉完成签到,获得积分10
9秒前
小小小白完成签到,获得积分10
9秒前
称心曼安发布了新的文献求助10
10秒前
10秒前
10秒前
11秒前
毛男完成签到,获得积分10
11秒前
12秒前
12秒前
赵振辉完成签到,获得积分10
13秒前
练习者发布了新的文献求助10
13秒前
sunlibiye发布了新的文献求助10
15秒前
陈佳旺发布了新的文献求助10
16秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 3000
Production Logging: Theoretical and Interpretive Elements 2700
Dialogue on Bridging Some Gaps in Stability and Transition Research 2000
On Troodon validus, an orthopodous dinosaur from the Belly River Cretaceous of Alberta, Canada 2000
Continuum Thermodynamics and Material Modelling 2000
Conference Record, IAS Annual Meeting 1977 1250
British Girl Chinese Wife (New World Press, 1985) 800
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 3627027
求助须知:如何正确求助?哪些是违规求助? 3196206
关于积分的说明 9640296
捐赠科研通 2901475
什么是DOI,文献DOI怎么找? 1590619
邀请新用户注册赠送积分活动 748339
科研通“疑难数据库(出版商)”最低求助积分说明 729809