Callee: Recovering Call Graphs for Binaries with Transfer and Contrastive Learning

计算机科学 杠杆(统计) 学习迁移 模糊测试 人工智能 假阳性悖论 调用图 二进制数 传输(计算) 深层神经网络 机器学习 理论计算机科学 深度学习 程序设计语言 软件 操作系统 算术 数学
作者
Wenyu Zhu,Zhiyao Feng,Zihan Zhang,Jianjun Chen,Zhijian Ou,Min Yang,Chao Zhang
标识
DOI:10.1109/sp46215.2023.10179482
摘要

Recovering binary programs’ call graphs is crucial for inter-procedural analysis tasks and applications based on them. One of the core challenges is recognizing targets of indirect calls (i.e., indirect callees). Existing solutions all have high false positives and negatives, making call graphs inaccurate. In this paper, we propose a new solution Callee combining transfer learning and contrastive learning. The key insight is that, deep neural networks (DNNs) can automatically identify patterns concerning indirect calls. Inspired by the advances in question-answering applications, we utilize contrastive learning to answer the callsite-callee question. However, one of the toughest challenges is that DNNs need large datasets to achieve high performance, while collecting large-scale indirect-call ground truths can be computational-expensive. Therefore, we leverage transfer learning to pre-train DNNs with easy-to-collect direct calls and further fine-tune DNNs for indirect-calls. We evaluate Callee on several groups of targets, and results show that our solution could match callsites to callees with an F1-Measure of 94.6%, much better than state-of-the-art solutions. Further, we apply Callee to two applications – binary code similarity detection and hybrid fuzzing, and found it could greatly improve their performance.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Hello应助Chem is try采纳,获得10
刚刚
hhh发布了新的文献求助10
刚刚
刚刚
1秒前
落寞白曼完成签到,获得积分10
2秒前
2秒前
海鸥海鸥发布了新的文献求助10
3秒前
别让我误会完成签到 ,获得积分10
4秒前
4秒前
KK发布了新的文献求助30
4秒前
娃娃完成签到 ,获得积分20
4秒前
科研通AI5应助结实的冰真采纳,获得30
4秒前
冷静的小熊猫完成签到,获得积分10
5秒前
Donnie完成签到,获得积分10
5秒前
若尘完成签到,获得积分10
6秒前
椰子完成签到 ,获得积分10
6秒前
6秒前
细腻涵菱完成签到,获得积分10
7秒前
吕耀炜完成签到,获得积分10
7秒前
7秒前
7秒前
简称王完成签到 ,获得积分10
7秒前
蓝莓松饼完成签到,获得积分10
8秒前
一路高飛完成签到,获得积分10
8秒前
赘婿应助andyxrz采纳,获得10
8秒前
Zhang完成签到,获得积分10
8秒前
9秒前
年轻冥茗完成签到,获得积分10
9秒前
apple发布了新的文献求助10
10秒前
CarterXD完成签到,获得积分10
10秒前
紧张的友灵完成签到,获得积分10
10秒前
SciGPT应助之仔饼采纳,获得10
11秒前
liudiqiu应助追寻的易烟采纳,获得10
11秒前
Chem is try发布了新的文献求助10
11秒前
11秒前
vsoar完成签到,获得积分10
11秒前
12秒前
13秒前
GGGGGGGGGG发布了新的文献求助10
13秒前
13秒前
高分求助中
Continuum Thermodynamics and Material Modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Social media impact on athlete mental health: #RealityCheck 1020
Ensartinib (Ensacove) for Non-Small Cell Lung Cancer 1000
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Bacterial collagenases and their clinical applications 800
El viaje de una vida: Memorias de María Lecea 800
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 量子力学 光电子学 冶金
热门帖子
关注 科研通微信公众号,转发送积分 3527304
求助须知:如何正确求助?哪些是违规求助? 3107454
关于积分的说明 9285518
捐赠科研通 2805269
什么是DOI,文献DOI怎么找? 1539827
邀请新用户注册赠送积分活动 716708
科研通“疑难数据库(出版商)”最低求助积分说明 709672