Out-of-Domain Detection for Natural Language Understanding in Dialog Systems

计算机科学 自编码 分类器(UML) 自然语言理解 话语 人工智能 领域(数学分析) 自然语言 生成对抗网络 对话框 机器学习 自然语言处理 深度学习 数学 数学分析 万维网
作者
Yinhe Zheng,Guanyi Chen,Minlie Huang
出处
期刊:IEEE/ACM transactions on audio, speech, and language processing [Institute of Electrical and Electronics Engineers]
卷期号:28: 1198-1209 被引量:98
标识
DOI:10.1109/taslp.2020.2983593
摘要

Natural Language Understanding (NLU) is a vital component of dialogue systems, and its ability to detect Out-of-Domain (OOD) inputs is critical in practical applications, since the acceptance of the OOD input that is unsupported by the current system may lead to catastrophic failure. However, most existing OOD detection methods rely heavily on manually labeled OOD samples and cannot take full advantage of unlabeled data. This limits the feasibility of these models in practical applications. In this paper, we propose a novel model to generate high-quality pseudo OOD samples that are akin to IN-Domain (IND) input utterances and thereby improves the performance of OOD detection. To this end, an autoencoder is trained to map an input utterance into a latent code. Moreover, the codes of IND and OOD samples are trained to be indistinguishable by utilizing a generative adversarial network. To provide more supervision signals, an auxiliary classifier is introduced to regularize the generated OOD samples to have indistinguishable intent labels. Experiments show that these pseudo OOD samples generated by our model can be used to effectively improve OOD detection in NLU. Besides, we also demonstrate that the effectiveness of these pseudo OOD data can be further improved by efficiently utilizing unlabeled data.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
图喵喵完成签到,获得积分10
7秒前
8秒前
pgyq发布了新的文献求助10
11秒前
小乙猪完成签到 ,获得积分0
11秒前
小田完成签到 ,获得积分10
13秒前
20秒前
wBw完成签到,获得积分10
21秒前
阿鑫发布了新的文献求助10
24秒前
SHXSJN完成签到 ,获得积分10
36秒前
科研通AI2S应助科研通管家采纳,获得10
38秒前
41秒前
41秒前
左丘映易完成签到,获得积分0
43秒前
开心夏旋完成签到 ,获得积分10
44秒前
Shicheng发布了新的文献求助10
47秒前
勤恳的雪卉完成签到,获得积分0
50秒前
50秒前
小七完成签到 ,获得积分10
55秒前
胡强发布了新的文献求助10
56秒前
58秒前
聪明的秋天完成签到 ,获得积分10
1分钟前
晴心发布了新的文献求助10
1分钟前
mengmenglv完成签到 ,获得积分0
1分钟前
艾斯完成签到 ,获得积分10
1分钟前
是小小李哇完成签到 ,获得积分10
1分钟前
胡强完成签到,获得积分10
1分钟前
1分钟前
哈哈完成签到 ,获得积分10
1分钟前
晴心完成签到,获得积分10
1分钟前
刘歌完成签到 ,获得积分10
1分钟前
sss完成签到 ,获得积分10
1分钟前
Shicheng完成签到,获得积分10
1分钟前
1分钟前
自信放光芒~完成签到 ,获得积分10
1分钟前
dm完成签到 ,获得积分10
1分钟前
sunshine完成签到,获得积分10
1分钟前
2分钟前
蓝色花生豆完成签到,获得积分10
2分钟前
thanhmanhp完成签到,获得积分10
2分钟前
2分钟前
高分求助中
Production Logging: Theoretical and Interpretive Elements 2500
Востребованный временем 2500
Aspects of Babylonian celestial divination : the lunar eclipse tablets of enuma anu enlil 1500
Agaricales of New Zealand 1: Pluteaceae - Entolomataceae 1040
Healthcare Finance: Modern Financial Analysis for Accelerating Biomedical Innovation 1000
Classics in Total Synthesis IV: New Targets, Strategies, Methods 1000
体心立方金属铌、钽及其硼化物中滑移与孪生机制的研究 800
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3450467
求助须知:如何正确求助?哪些是违规求助? 3045952
关于积分的说明 9003800
捐赠科研通 2734611
什么是DOI,文献DOI怎么找? 1500096
科研通“疑难数据库(出版商)”最低求助积分说明 693341
邀请新用户注册赠送积分活动 691477