亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

QAAskeR+: A Novel Testing Method for Question Answering Software via Asking Recursive Questions

计算机科学 答疑 水准点(测量) 软件 考试(生物学) 情报检索 人工智能 数据挖掘 软件工程 程序设计语言 古生物学 大地测量学 生物 地理
作者
Xiaoyuan Xie,Shuo Jin,Songqiang Chen
出处
期刊:Research Square - Research Square
标识
DOI:10.21203/rs.3.rs-1563040/v1
摘要

Abstract Question Answering (QA) is an attractive and challenging area in NLP community. With the development of QA technique, plenty of QA software has been applied in daily human life to provide convenient access of information retrieval. To investigate the performance of QA software, many benchmark datasets have been constructed to provide various test cases. However, current QA software is mainly tested in a reference-based paradigm, in which the expected outputs (labels) of test cases are mandatory to be annotated with much human effort before testing. As a result, neither the just-in-time test during usage nor the extensible test on massive unlabeled real-life data is feasible, which keeps the current testing of QA software from being flexible and sufficient. In this work, we propose a novel testing method, QAAskeR+, with five new Metamorphic Relations for QA software. QAAskeR+ does not refer to the annotated labels of test cases. Instead, based on the idea that a correct answer should imply a piece of reliable knowledge that always conforms with any other correct answer, QAAskeR+ tests QA software by inspecting its behaviors on multiple recursively asked questions that are relevant to the same or some further enriched knowledge. Experimental results show that QAAskeR+ can reveal quite a few violations that indicate actual answering issues on various mainstream QA software without using any pre-annotated labels.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
聪聪忙忙发布了新的文献求助10
4秒前
14秒前
隐形曼青应助黄婷采纳,获得10
17秒前
wwww完成签到,获得积分10
24秒前
xuan发布了新的文献求助10
33秒前
Otter完成签到,获得积分10
34秒前
43秒前
Diss完成签到 ,获得积分10
46秒前
瘦瘦乌龟发布了新的文献求助10
47秒前
牛八先生完成签到,获得积分10
49秒前
瘦瘦乌龟完成签到,获得积分10
54秒前
57秒前
吾皇完成签到 ,获得积分10
58秒前
1分钟前
miooo发布了新的文献求助10
1分钟前
1分钟前
嗯哼应助科研通管家采纳,获得30
1分钟前
科研通AI2S应助科研通管家采纳,获得10
1分钟前
cocolu应助科研通管家采纳,获得10
1分钟前
Akim应助迷路筝采纳,获得10
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
溴氧铋发布了新的文献求助10
1分钟前
1分钟前
1分钟前
1分钟前
小z完成签到,获得积分20
1分钟前
溴氧铋发布了新的文献求助10
1分钟前
溴氧铋发布了新的文献求助10
1分钟前
溴氧铋发布了新的文献求助10
1分钟前
溴氧铋发布了新的文献求助10
1分钟前
溴氧铋发布了新的文献求助10
1分钟前
溴氧铋发布了新的文献求助10
1分钟前
溴氧铋发布了新的文献求助10
1分钟前
溴氧铋发布了新的文献求助10
1分钟前
高分求助中
Licensing Deals in Pharmaceuticals 2019-2024 3000
Cognitive Paradigms in Knowledge Organisation 2000
Mantiden: Faszinierende Lauerjäger Faszinierende Lauerjäger Heßler, Claudia, Rud 1000
PraxisRatgeber: Mantiden: Faszinierende Lauerjäger 1000
Natural History of Mantodea 螳螂的自然史 1000
A Photographic Guide to Mantis of China 常见螳螂野外识别手册 800
How Maoism Was Made: Reconstructing China, 1949-1965 800
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 内科学 物理 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 免疫学 细胞生物学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 3322522
求助须知:如何正确求助?哪些是违规求助? 2953852
关于积分的说明 8567034
捐赠科研通 2631396
什么是DOI,文献DOI怎么找? 1439859
科研通“疑难数据库(出版商)”最低求助积分说明 667250
邀请新用户注册赠送积分活动 653711