ESIE-BERT: Enriching sub-words information explicitly with BERT for intent classification and slot filling

计算机科学 安全性令牌 话语 语言模型 自然语言理解 人工智能 适配器(计算) 判决 F1得分 水准点(测量) 自然语言处理 机器学习 自然语言 大地测量学 地理 操作系统 计算机安全
作者
Yu Guo,Zhilong Xie,Xingyan Chen,Huangen Chen,Leilei Wang,Huaming Du,Shaopeng Wei,Yu Zhao,Qing Li,Gang Wu
出处
期刊:Neurocomputing [Elsevier BV]
卷期号:591: 127725-127725 被引量:2
标识
DOI:10.1016/j.neucom.2024.127725
摘要

Natural language understanding (NLU) has two core tasks: intent classification and slot filling. The success of pre-training language models resulted in a significant breakthrough in the two tasks. The architecture based on autoencoding (BERT-based model) can optimize the two tasks jointly. However, we note that BERT-based models convert each complex token into multiple sub-tokens by the Wordpiece algorithm, which generates an out-of-alignment between the lengths of the tokens and the labels. This leads to BERT-based models not performing well in label prediction, which limits the improvement of model performance. Many existing models can address this issue, but some hidden semantic information is discarded during the fine-tuning process. We addressed the problem by introducing a novel joint method on top of BERT. This method explicitly models multiple sub-token features after the Wordpiece tokenization, thereby contributing to both tasks. Our proposed method effectively extracts contextual features from complex tokens using the Sub-words Attention Adapter (SAA), preserving overall utterance information. Additionally, we propose an Intent Attention Adapter (IAA) to acquire comprehensive sentence features, assisting users in predicting intent. Experimental results confirm that our proposed model exhibits significant improvements on two public benchmark datasets. Specifically, the slot-filling F1 score improves from 96.5 to 98.2 (an absolute increase of 1.7%) on the Airline Travel Information Systems (ATIS) dataset.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
Baekhyun完成签到,获得积分10
1秒前
1秒前
芋头发布了新的文献求助10
2秒前
3秒前
蒋蒋蒋发布了新的文献求助10
4秒前
小右耳发布了新的文献求助10
5秒前
Kiutaka发布了新的文献求助10
5秒前
YYYY完成签到,获得积分10
5秒前
cola发布了新的文献求助10
5秒前
lyra1111完成签到,获得积分10
6秒前
田田田田发布了新的文献求助10
6秒前
乐融融完成签到,获得积分10
8秒前
萧笙完成签到 ,获得积分10
8秒前
博远完成签到,获得积分10
9秒前
闪闪新梅完成签到,获得积分10
9秒前
nightgaunt完成签到,获得积分10
9秒前
道不尽辛酸泪完成签到,获得积分10
10秒前
10秒前
小蘑菇应助zhangshixian采纳,获得30
10秒前
小仙女完成签到,获得积分10
11秒前
刘牛牛完成签到,获得积分10
12秒前
13秒前
博远发布了新的文献求助10
13秒前
tinner完成签到,获得积分10
14秒前
Rai完成签到,获得积分10
14秒前
刚果王子完成签到,获得积分10
14秒前
15秒前
Orange应助科研通管家采纳,获得10
15秒前
Luu应助科研通管家采纳,获得10
15秒前
大模型应助科研通管家采纳,获得10
15秒前
Luu应助科研通管家采纳,获得10
15秒前
xzn1123应助科研通管家采纳,获得10
15秒前
田様应助科研通管家采纳,获得10
16秒前
完美世界应助科研通管家采纳,获得10
16秒前
嘉熙完成签到,获得积分10
16秒前
16秒前
16秒前
16秒前
今后应助芋头采纳,获得10
18秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
晶种分解过程与铝酸钠溶液混合强度关系的探讨 8888
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6430390
求助须知:如何正确求助?哪些是违规求助? 8246433
关于积分的说明 17536799
捐赠科研通 5486781
什么是DOI,文献DOI怎么找? 2895869
邀请新用户注册赠送积分活动 1872372
关于科研通互助平台的介绍 1711927