Joint Pre-Trained Chinese Named Entity Recognition Based on Bi-Directional Language Model

计算机科学 条件随机场 命名实体识别 人工智能 特征工程 接头(建筑物) 自然语言处理 变压器 编码器 人工神经网络 特征(语言学) 对话 深度学习 语音识别 语言学 建筑工程 哲学 物理 管理 量子力学 电压 工程类 经济 任务(项目管理) 操作系统
作者
Changxia Ma,Chen Zhang
出处
期刊:International Journal of Pattern Recognition and Artificial Intelligence [World Scientific]
卷期号:35 (09): 2153003-2153003 被引量:3
标识
DOI:10.1142/s0218001421530037
摘要

The current named entity recognition (NER) is mainly based on joint convolution or recurrent neural network. In order to achieve high performance, these networks need to provide a large amount of training data in the form of feature engineering corpus and lexicons. Chinese NER is very challenging because of the high contextual relevance of Chinese characters, that is, Chinese characters and phrases may have many possible meanings in different contexts. To this end, we propose a model that leverages a pre-trained and bi-directional encoder representations-from-transformers language model and a joint bi-directional long short-term memory (Bi-LSTM) and conditional random fields (CRF) model for Chinese NER. The underlying network layer embeds Chinese characters and outputs character-level representations. The output is then fed into a bidirectional long short-term memory to capture contextual sequence information. The top layer of the proposed model is CRF, which is used to take into account the dependencies of adjacent tags and jointly decode the optimal chain of tags. A series of extensive experiments were conducted to research the useful improvements of the proposed neural network architecture on different datasets without relying heavily on handcrafted features and domain-specific knowledge. Experimental results show that the proposed model is effective, and character-level representation is of great significance for Chinese NER tasks. In addition, through this work, we have composed a new informal conversation message corpus called the autonomous bus information inquiry dataset, and compared to the advanced baseline, our method has been significantly improved.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
fogsea完成签到,获得积分0
9秒前
15秒前
骄傲yy发布了新的文献求助10
18秒前
田様应助积极方盒采纳,获得10
19秒前
21秒前
22秒前
dajiejie完成签到 ,获得积分10
24秒前
黑水仙完成签到 ,获得积分10
31秒前
chd完成签到 ,获得积分10
32秒前
伊yan完成签到 ,获得积分10
38秒前
sun完成签到 ,获得积分10
39秒前
tulips完成签到 ,获得积分10
44秒前
猪仔5号完成签到 ,获得积分10
45秒前
太清完成签到 ,获得积分10
51秒前
nano完成签到 ,获得积分10
1分钟前
张占完成签到,获得积分10
1分钟前
Shuhe_Gong完成签到 ,获得积分10
1分钟前
甜甜的问芙完成签到 ,获得积分10
1分钟前
良人完成签到 ,获得积分10
1分钟前
东十八完成签到 ,获得积分10
1分钟前
jameslee04完成签到 ,获得积分10
1分钟前
完美世界应助科研通管家采纳,获得10
1分钟前
1分钟前
1分钟前
111完成签到 ,获得积分10
1分钟前
JAJ完成签到 ,获得积分10
1分钟前
xiaopihaier完成签到,获得积分10
1分钟前
meng若完成签到 ,获得积分10
1分钟前
1分钟前
depurge完成签到,获得积分10
1分钟前
小吴没烦恼完成签到 ,获得积分10
2分钟前
mendicant完成签到,获得积分10
2分钟前
www完成签到 ,获得积分10
2分钟前
欣欣发布了新的文献求助10
2分钟前
TAO LEE完成签到 ,获得积分10
2分钟前
wp4455777完成签到,获得积分10
2分钟前
Singularity完成签到,获得积分0
2分钟前
Young完成签到 ,获得积分10
2分钟前
Invincible完成签到 ,获得积分10
2分钟前
2分钟前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2000
Very-high-order BVD Schemes Using β-variable THINC Method 1200
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 1000
中国荞麦品种志 1000
BIOLOGY OF NON-CHORDATES 1000
Autoregulatory progressive resistance exercise: linear versus a velocity-based flexible model 550
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3360134
求助须知:如何正确求助?哪些是违规求助? 2982678
关于积分的说明 8704677
捐赠科研通 2664481
什么是DOI,文献DOI怎么找? 1459080
科研通“疑难数据库(出版商)”最低求助积分说明 675400
邀请新用户注册赠送积分活动 666447