Named entity recognition for Chinese telecommunications field based on Char2Vec and Bi-LSTMs

计算机科学 命名实体识别 自然语言处理 人工智能 条件随机场 CRF公司 文字嵌入 背景(考古学) 任务(项目管理) 构造(python库) 实体链接 汉字 嵌入 依赖关系(UML) 领域(数学) 知识库 纯数学 程序设计语言 管理 经济 古生物学 生物 数学
作者
Yu Wang,Bin Xia,Zheng Liu,Yun Li,Tao Li
标识
DOI:10.1109/iske.2017.8258773
摘要

Named Entity Recognition (NER) is a basic task in Natural Language Processing (NLP), which extracts the meaningful named entities from the text. Compared with the English NER, the Chinese NER is more challenge, since there is no tense in the Chinese language. Moreover, the omissions and the Internet catchwords in the Chinese corpus make the NER task more difficult. Traditional machine learning methods (e.g., CRFs) cannot address the Chinese NER effectively because they are hard to learn the complicated context in the Chinese language. To overcome the aforementioned problem, we propose a deep learning model Char2Vec+Bi-LSTMs for Chinese NER. We use the Chinese character instead of the Chinese word as the embedding unit, and the Bi-LSTMs is used to learn the complicated semantic dependency. To evaluate our proposed model, we construct the corpus from the China TELECOM FAQs. Experimental results show that our model achieves better performance than other baseline methods and the character embedding is more appropriate than the word embedding in the Chinese language.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
oracl完成签到 ,获得积分0
刚刚
ALIVE_STAR完成签到,获得积分10
4秒前
柔弱云朵完成签到 ,获得积分10
5秒前
LIUJIE完成签到,获得积分10
9秒前
sdfdzhang完成签到 ,获得积分10
11秒前
14秒前
janer完成签到 ,获得积分0
17秒前
法克西瓜汁完成签到,获得积分10
17秒前
小孟吖完成签到 ,获得积分10
21秒前
冷傲的帽子完成签到 ,获得积分10
25秒前
内向东蒽完成签到 ,获得积分10
27秒前
桐桐应助T_MC郭采纳,获得10
27秒前
超级大猩猩完成签到,获得积分10
31秒前
平淡茈完成签到 ,获得积分10
32秒前
聪明的芳芳完成签到 ,获得积分10
32秒前
微笑完成签到,获得积分10
36秒前
搭碰完成签到,获得积分0
37秒前
冷傲机器猫完成签到,获得积分10
38秒前
秋迎夏完成签到,获得积分0
40秒前
风-FBDD完成签到,获得积分10
42秒前
科研通AI2S应助小阿博采纳,获得10
47秒前
不穷知识完成签到,获得积分10
54秒前
小糖完成签到 ,获得积分10
56秒前
重要的惜萍完成签到,获得积分10
57秒前
青青完成签到 ,获得积分10
58秒前
行者+完成签到,获得积分10
1分钟前
砳熠完成签到 ,获得积分10
1分钟前
求知的周完成签到,获得积分10
1分钟前
温暖的蚂蚁完成签到 ,获得积分10
1分钟前
简单幸福完成签到 ,获得积分0
1分钟前
不良帅完成签到,获得积分10
1分钟前
一路有你完成签到 ,获得积分10
1分钟前
仁爱的戒指完成签到 ,获得积分10
1分钟前
罗氏集团完成签到,获得积分10
1分钟前
小杨完成签到,获得积分10
1分钟前
1分钟前
simon完成签到,获得积分10
1分钟前
土豪的灵竹完成签到 ,获得积分10
1分钟前
1分钟前
温暖糖豆完成签到 ,获得积分10
1分钟前
高分求助中
Licensing Deals in Pharmaceuticals 2019-2024 3000
Cognitive Paradigms in Knowledge Organisation 2000
Effect of reactor temperature on FCC yield 2000
How Maoism Was Made: Reconstructing China, 1949-1965 800
Medical technology industry in China 600
Introduction to Spectroscopic Ellipsometry of Thin Film Materials Instrumentation, Data Analysis, and Applications 600
Shining Light on the Dark Side of Personality 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3311314
求助须知:如何正确求助?哪些是违规求助? 2944006
关于积分的说明 8516896
捐赠科研通 2619458
什么是DOI,文献DOI怎么找? 1432306
科研通“疑难数据库(出版商)”最低求助积分说明 664597
邀请新用户注册赠送积分活动 649856