Learning to Generate Pseudo-Code from Source Code Using Statistical Machine Translation

计算机科学 冗余代码 源代码 无法访问的代码 程序设计语言 KPI驱动的代码分析 无效代码 Python(编程语言) 系统代码 代码生成 目标代码 编码(集合论) 恒定重量代码 通用代码 静态程序分析 自然语言处理 算法 软件 软件开发 编码速率 解码方法 线性码 操作系统 集合(抽象数据类型) 区块代码 钥匙(锁)
作者
Yusuke Oda,Hiroyuki Fudaba,Graham Neubig,Hideaki Hata,Sakriani Sakti,Tomoki Toda,Satoshi Nakamura
标识
DOI:10.1109/ase.2015.36
摘要

Pseudo-code written in natural language can aid the comprehension of source code in unfamiliar programming languages. However, the great majority of source code has no corresponding pseudo-code, because pseudo-code is redundant and laborious to create. If pseudo-code could be generated automatically and instantly from given source code, we could allow for on-demand production of pseudo-code without human effort. In this paper, we propose a method to automatically generate pseudo-code from source code, specifically adopting the statistical machine translation (SMT) framework. SMT, which was originally designed to translate between two natural languages, allows us to automatically learn the relationship between source code/pseudo-code pairs, making it possible to create a pseudo-code generator with less human effort. In experiments, we generated English or Japanese pseudo-code from Python statements using SMT, and find that the generated pseudo-code is largely accurate, and aids code understanding.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
安雯完成签到 ,获得积分10
刚刚
G7完成签到,获得积分10
1秒前
Gauss完成签到,获得积分0
3秒前
初晴完成签到,获得积分10
9秒前
Double_N完成签到,获得积分10
13秒前
14秒前
13633501455完成签到 ,获得积分10
17秒前
andy应助科研通管家采纳,获得20
17秒前
andy应助科研通管家采纳,获得10
18秒前
18秒前
18秒前
18秒前
江晚发布了新的文献求助10
21秒前
852应助mizhou采纳,获得10
22秒前
Fan完成签到,获得积分10
24秒前
25秒前
蔡从安发布了新的文献求助10
26秒前
科研通AI2S应助沐风采纳,获得10
28秒前
健忘的晓小完成签到 ,获得积分10
29秒前
Janus完成签到 ,获得积分10
32秒前
韶可愁完成签到,获得积分10
36秒前
糖宝完成签到 ,获得积分0
45秒前
Pauline完成签到 ,获得积分0
45秒前
光亮向真完成签到,获得积分10
46秒前
昔昔完成签到 ,获得积分10
48秒前
jinyu完成签到,获得积分10
48秒前
贤惠的早晨完成签到,获得积分10
49秒前
懵懂的书本完成签到 ,获得积分10
50秒前
爱科研的小虞完成签到 ,获得积分10
53秒前
黄梓同完成签到 ,获得积分10
53秒前
56秒前
哭泣青烟完成签到 ,获得积分10
57秒前
胡杨树2006完成签到,获得积分10
59秒前
天天发布了新的文献求助10
59秒前
Tracy麦子完成签到 ,获得积分10
1分钟前
张大旭77完成签到 ,获得积分10
1分钟前
会飞的螃蟹完成签到,获得积分10
1分钟前
满意的寒凝完成签到 ,获得积分10
1分钟前
刻苦的新烟完成签到 ,获得积分0
1分钟前
过时的傲玉完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Various Faces of Animal Metaphor in English and Polish 800
Signals, Systems, and Signal Processing 610
Photodetectors: From Ultraviolet to Infrared 500
On the Dragon Seas, a sailor's adventures in the far east 500
Yangtze Reminiscences. Some Notes And Recollections Of Service With The China Navigation Company Ltd., 1925-1939 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6353195
求助须知:如何正确求助?哪些是违规求助? 8168047
关于积分的说明 17191522
捐赠科研通 5409215
什么是DOI,文献DOI怎么找? 2863646
邀请新用户注册赠送积分活动 1840978
关于科研通互助平台的介绍 1689834