亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Efficient transformer with code token learner for code clone detection

计算机科学 抽象语法树 安全性令牌 编码(集合论) 编码 源代码 变压器 程序设计语言 人工智能 语法 操作系统 工程类 基因 电气工程 电压 集合(抽象数据类型) 化学 生物化学
作者
Aiping Zhang,Liming Fang,Chunpeng Ge,Piji Li,Zhe Liu
出处
期刊:Journal of Systems and Software [Elsevier BV]
卷期号:197: 111557-111557 被引量:13
标识
DOI:10.1016/j.jss.2022.111557
摘要

Deep learning techniques have achieved promising results in code clone detection in the past decade. Unfortunately, current deep learning-based methods rarely explicitly consider the modeling of long codes. Worse, the code length is increasing due to the increasing requirement of complex functions. Thus, modeling the relationship between code tokens to catch their long-range dependencies is crucial to comprehensively capture the information of the code fragment. In this work, we resort to the Transformer to capture long-range dependencies within a code, which however requires huge computational cost for long code fragments. To make it possible to apply Transformer efficiently, we propose a code token learner to largely reduce the number of feature tokens in an automatic way. Besides, considering the tree structure of the abstract syntax tree, we present a tree-based position embedding to encode the position of each token in the input. Apart from the Transformer that captures the dependency within a code, we further leverage a cross-code attention module to capture the similarities between two code fragments. Our method significantly reduces the computational cost of using Transformer by 97% while achieves superior performance with state-of-the-art methods. Our code is available at https://github.com/ArcticHare105/Code-Token-Learner.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
3秒前
ff发布了新的文献求助10
3秒前
andrele发布了新的文献求助100
9秒前
10秒前
哎呀完成签到,获得积分10
10秒前
William_l_c完成签到,获得积分10
12秒前
13秒前
徐垚发布了新的文献求助10
14秒前
Francis发布了新的文献求助10
16秒前
Dreamchaser完成签到,获得积分10
17秒前
隐形曼青应助poieu采纳,获得20
19秒前
21秒前
李爱国应助Francis采纳,获得10
22秒前
ff完成签到,获得积分10
24秒前
26秒前
整齐念之发布了新的文献求助10
27秒前
28秒前
脑洞疼应助Suli采纳,获得10
30秒前
幽森之魅发布了新的文献求助10
30秒前
徐垚完成签到,获得积分20
32秒前
33秒前
33秒前
42秒前
科研通AI2S应助幽森之魅采纳,获得30
43秒前
46秒前
Suli发布了新的文献求助10
46秒前
zhang完成签到,获得积分10
49秒前
50秒前
qz发布了新的文献求助10
1分钟前
niuniu顺利毕业完成签到 ,获得积分10
1分钟前
1分钟前
科研通AI6.4应助MatildaDownman采纳,获得10
1分钟前
打打应助整齐念之采纳,获得10
1分钟前
哎呀发布了新的文献求助10
1分钟前
Lucas应助xi_li采纳,获得10
1分钟前
芊芊墨客完成签到,获得积分10
1分钟前
Ccccn完成签到,获得积分10
1分钟前
芊芊墨客发布了新的文献求助10
1分钟前
1分钟前
谦让的振家完成签到,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Lewis’s Child and Adolescent Psychiatry: A Comprehensive Textbook Sixth Edition 2000
Continuing Syntax 1000
Encyclopedia of Quaternary Science Reference Work • Third edition • 2025 800
Signals, Systems, and Signal Processing 510
Pharma R&D Annual Review 2026 500
荧光膀胱镜诊治膀胱癌 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6217726
求助须知:如何正确求助?哪些是违规求助? 8042946
关于积分的说明 16765325
捐赠科研通 5304735
什么是DOI,文献DOI怎么找? 2826178
邀请新用户注册赠送积分活动 1804272
关于科研通互助平台的介绍 1664266