Duplicate Bug Report Detection Using an Attention-Based Neural Language Model

计算机科学 人工智能 自然语言处理 背景(考古学) 日食 软件 人工神经网络 分类器(UML) 机器学习 程序设计语言 情报检索 天文 生物 物理 古生物学
作者
Montassar Ben Messaoud,Asma Miladi,Ilyes Jenhani,Mohamed Wiem Mkaouer,Lobna Ghadhab
出处
期刊:IEEE Transactions on Reliability [Institute of Electrical and Electronics Engineers]
卷期号:72 (2): 846-858 被引量:8
标识
DOI:10.1109/tr.2022.3193645
摘要

Context: Users and developers use bug tracking systems to report errors that occur during the development and testing of software. The manual identification of duplicates is a tedious task especially with software that have large bug repositories. In this context, their automatic detection becomes a necessary task that can help prevent frequently fixing the same bug. Objective: In this article, we propose BERT-MLP , a novel pretrained language model using bidirectional encoder representations from ransformers (BERT) for duplicate bug report detection (DBRD) with the aim of improving the detection rate compared to existing works. Method: Our approach considers only unstructured data. These are fed into the BERT model in order to learn the contextual relationships between words. The output is fed into a multilayer perceptron (MLP) classifier, representing our base DBRD. Results: Our approach was evaluated on three projects: Mozilla Firefox, Eclipse Platform, and Thunderbird. It achieved an accuracy of 92.11, 94.08, and 89.03%, respectively, for Mozilla, Eclipse, and Thunderbird. A comparison with a dual-channel convolutional neural network (DC-CNN) model and other pretrained models, including RoBERTa and Sentence-Bert has been conducted. Results showed that BERT-MLP outperformed, the second best performing models (DC-CNN and Sentence-BERT) by 12% in accuracy for Eclipse and 9% for both Mozilla and Thunderbird, respectively.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
土土土完成签到,获得积分10
刚刚
俞晓完成签到 ,获得积分10
刚刚
刚刚
1sss发布了新的文献求助10
1秒前
Xiong完成签到,获得积分10
1秒前
1秒前
馒头发布了新的文献求助30
1秒前
调皮以筠发布了新的文献求助10
1秒前
2秒前
精明的灵寒完成签到,获得积分10
2秒前
2秒前
2秒前
XIEH完成签到,获得积分10
3秒前
3秒前
3秒前
3秒前
兔兔兔兔发布了新的文献求助10
3秒前
大个应助虚幻的依丝采纳,获得10
3秒前
汉堡包应助南城采纳,获得10
4秒前
YX1994发布了新的文献求助10
4秒前
JZ133完成签到,获得积分10
4秒前
4秒前
ZZZ完成签到,获得积分10
5秒前
星辰大海应助季喃采纳,获得10
6秒前
司空剑封完成签到,获得积分10
6秒前
7秒前
7秒前
zzx发布了新的文献求助10
7秒前
8秒前
8秒前
li发布了新的文献求助20
8秒前
8秒前
晓晓完成签到,获得积分10
8秒前
Jeremy完成签到,获得积分10
8秒前
JZ133发布了新的文献求助10
8秒前
9秒前
9秒前
chandangfo应助younger采纳,获得30
9秒前
mi完成签到,获得积分10
9秒前
顺心的雨雪完成签到,获得积分10
9秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
晶种分解过程与铝酸钠溶液混合强度关系的探讨 8888
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6422286
求助须知:如何正确求助?哪些是违规求助? 8241174
关于积分的说明 17516843
捐赠科研通 5476343
什么是DOI,文献DOI怎么找? 2892815
邀请新用户注册赠送积分活动 1869266
关于科研通互助平台的介绍 1706703