BOND: BERT-Assisted Open-Domain Named Entity Recognition with Distant Supervision

命名实体识别 计算机科学 水准点(测量) 自然语言处理 人工智能 领域(数学分析) 语言模型 编码(集合论) 训练集 标记数据 机器学习 程序设计语言 数学分析 数学 管理 大地测量学 集合(抽象数据类型) 经济 任务(项目管理) 地理
作者
Liang Chen,Yue Yu,Haoming Jiang,Siawpeng Er,Ruijia Wang,Tuo Zhao,Chao Zhang
标识
DOI:10.1145/3394486.3403149
摘要

We study the open-domain named entity recognition (NER) problem under distant supervision. The distant supervision, though does not require large amounts of manual annotations, yields highly incomplete and noisy distant labels via external knowledge bases. To address this challenge, we propose a new computational framework -- BOND, which leverages the power of pre-trained language models (e.g., BERT and RoBERTa) to improve the prediction performance of NER models. Specifically, we propose a two-stage training algorithm: In the first stage, we adapt the pre-trained language model to the NER tasks using the distant labels, which can significantly improve the recall and precision; In the second stage, we drop the distant labels, and propose a self-training approach to further improve the model performance. Thorough experiments on 5 benchmark datasets demonstrate the superiority of BOND over existing distantly supervised NER methods. The code and distantly labeled data have been released in https://github.com/cliang1453/BOND.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
angewjacs完成签到,获得积分10
1秒前
jing发布了新的文献求助10
3秒前
3秒前
3秒前
科研通AI6.1应助guofd采纳,获得10
4秒前
5秒前
小米应助momo采纳,获得10
6秒前
7秒前
华仔应助流星雨采纳,获得10
8秒前
香蕉觅云应助细心的靖巧采纳,获得30
9秒前
9秒前
木子水告完成签到,获得积分10
10秒前
莫非完成签到,获得积分10
10秒前
玉玊发布了新的文献求助10
11秒前
量子星尘发布了新的文献求助10
11秒前
bbbb完成签到,获得积分10
12秒前
nianshu完成签到 ,获得积分0
13秒前
13秒前
陈豆豆完成签到,获得积分10
16秒前
16秒前
量子星尘发布了新的文献求助10
18秒前
Akim应助jing采纳,获得10
18秒前
20秒前
超超完成签到,获得积分10
21秒前
guofd发布了新的文献求助10
21秒前
沐song发布了新的文献求助10
22秒前
23秒前
Hiro完成签到 ,获得积分10
24秒前
玉玊完成签到,获得积分10
24秒前
BINGO完成签到,获得积分10
25秒前
文艺的熠彤完成签到,获得积分10
26秒前
百十余完成签到,获得积分10
26秒前
小谢发布了新的文献求助10
27秒前
桐桐应助宁静致远采纳,获得30
27秒前
27秒前
科研通AI6.1应助Zyc采纳,获得10
28秒前
月圆夜发布了新的文献求助20
29秒前
勤劳滑板完成签到 ,获得积分10
30秒前
zyc完成签到,获得积分10
31秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to strong mixing conditions volume 1-3 5000
Ägyptische Geschichte der 21.–30. Dynastie 2500
Human Embryology and Developmental Biology 7th Edition 2000
The Developing Human: Clinically Oriented Embryology 12th Edition 2000
Clinical Microbiology Procedures Handbook, Multi-Volume, 5th Edition 2000
„Semitische Wissenschaften“? 1510
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5742102
求助须知:如何正确求助?哪些是违规求助? 5405928
关于积分的说明 15343995
捐赠科研通 4883565
什么是DOI,文献DOI怎么找? 2625098
邀请新用户注册赠送积分活动 1573960
关于科研通互助平台的介绍 1530910