Multi-level semantic enhancement based on self-distillation BERT for Chinese named entity recognition

计算机科学 命名实体识别 人工智能 平滑的 自然语言处理 水准点(测量) 任务(项目管理) 背景(考古学) 编码(集合论) 构造(python库) 模式识别(心理学) 过程(计算) 实体链接 蒸馏 机器学习 情报检索 化学 程序设计语言 计算机视觉 地理 生物 经济 集合(抽象数据类型) 大地测量学 有机化学 管理 古生物学 知识库
作者
Zepeng Li,Shuo Cao,Minyu Zhai,Nengneng Ding,Zhenwen Zhang,Bin Hu
出处
期刊:Neurocomputing [Elsevier BV]
卷期号:586: 127637-127637 被引量:7
标识
DOI:10.1016/j.neucom.2024.127637
摘要

As an important foundational task in the field of natural language processing, the Chinese named entity recognition (NER) task has received widespread attention in recent years. Self-distillation plays a role in exploring the potential of the knowledge carried by internal parameters in the BERT NER model, but few studies have noticed the impact of different granularity semantic information during the distillation process. In this paper, we propose a multi-level semantic enhancement approach based on self-distillation BERT for Chinese named entity recognition. We first design a feasible data augmentation method to improve the training quality for handling complex entity compositions, then construct a boundary smoothing module to achieve the model's moderate learning on entity boundaries. Besides, we utilize the distillation reweighting method to let the model acquire balanced entity and context knowledge. Experimental results on two Chinese named entity recognition benchmark datasets Weibo and Resume have 72.09% and 96.93% F1 scores, respectively. Compared to three different basic distillation BERT models, our model can also produce better results. The source code is available at https://github.com/lookmedandan/MSE.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
连垣完成签到,获得积分10
刚刚
跳跃的惮发布了新的文献求助10
1秒前
1秒前
齐桓公完成签到,获得积分10
1秒前
aigj完成签到 ,获得积分10
1秒前
MADKAI发布了新的文献求助20
1秒前
科研狗完成签到,获得积分10
1秒前
芷莯发布了新的文献求助10
2秒前
2秒前
3秒前
3秒前
善学以致用应助无情的海采纳,获得10
3秒前
羊毛毛衣完成签到,获得积分10
4秒前
搞怪的人龙完成签到,获得积分10
4秒前
忧郁的驳完成签到,获得积分10
5秒前
5秒前
6秒前
青炀应助里维斯采纳,获得10
6秒前
joysa完成签到,获得积分10
6秒前
6秒前
guoyanna发布了新的文献求助50
6秒前
hgf发布了新的文献求助30
7秒前
xwy完成签到,获得积分10
7秒前
情怀应助快乐凌寒采纳,获得10
7秒前
7秒前
8秒前
wei完成签到,获得积分10
8秒前
8秒前
幸福糖豆完成签到,获得积分10
9秒前
teadan完成签到,获得积分10
9秒前
10秒前
10秒前
11秒前
看不懂发布了新的文献求助10
11秒前
彪壮的青雪完成签到 ,获得积分10
11秒前
小九九发布了新的文献求助10
11秒前
阔达的傲MUMU完成签到 ,获得积分10
12秒前
12秒前
sssssssssss完成签到,获得积分10
12秒前
wwww完成签到,获得积分10
13秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Musculoskeletal Pain - Market Insight, Epidemiology And Market Forecast - 2034 2000
Animal Physiology 2000
Am Rande der Geschichte : mein Leben in China / Ruth Weiss 1500
CENTRAL BOOKS: A BRIEF HISTORY 1939 TO 1999 by Dave Cope 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3746471
求助须知:如何正确求助?哪些是违规求助? 3289359
关于积分的说明 10064159
捐赠科研通 3005740
什么是DOI,文献DOI怎么找? 1650360
邀请新用户注册赠送积分活动 785858
科研通“疑难数据库(出版商)”最低求助积分说明 751296