Variable-to-Variable Huffman Coding: Optimal and Greedy Approaches

哈夫曼编码 算法 贪婪算法 变量(数学) 计算复杂性理论 计算机科学 编码(社会科学) 熵(时间箭头) 数学 数学优化 时间复杂性 启发式 数据压缩 统计 量子力学 物理 数学分析
作者
Kun Tu,Dariusz Puchała
出处
期刊:Entropy [MDPI AG]
卷期号:24 (10): 1447-1447 被引量:2
标识
DOI:10.3390/e24101447
摘要

In this paper, we address the problem of m-gram entropy variable-to-variable coding, extending the classical Huffman algorithm to the case of coding m-element (i.e., m-grams) sequences of symbols taken from the stream of input data for m>1. We propose a procedure to enable the determination of the frequencies of the occurrence of m-grams in the input data; we formulate the optimal coding algorithm and estimate its computational complexity as O(mn2), where n is the size of the input data. Since such complexity is high in terms of practical applications, we also propose an approximate approach with linear complexity, which is based on a greedy heuristic used in solving backpack problems. In order to verify the practical effectiveness of the proposed approximate approach, experiments involving different sets of input data were conducted. The experimental study shows that the results obtained with the approximate approach were, first, close to the optimal results and, second, better than the results obtained using the popular DEFLATE and PPM algorithms in the case of data that can be characterized by highly invariable and easy to estimate statistics.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
化学小学生完成签到,获得积分10
刚刚
刚刚
香蕉觅云应助愤怒的树叶采纳,获得10
1秒前
阳光的未来完成签到,获得积分20
2秒前
qiuqingzz发布了新的文献求助10
2秒前
2秒前
Chris完成签到,获得积分10
2秒前
ymxlcfc完成签到 ,获得积分10
3秒前
包容的剑完成签到 ,获得积分10
4秒前
滕擎发布了新的文献求助10
4秒前
阿信必发JACS完成签到,获得积分10
4秒前
4秒前
4秒前
酷酷紫蓝发布了新的文献求助10
7秒前
8秒前
独角兽完成签到 ,获得积分10
8秒前
YC2完成签到,获得积分10
8秒前
往事无痕完成签到 ,获得积分10
9秒前
日富一日完成签到,获得积分10
10秒前
10秒前
顽固分子发布了新的文献求助10
11秒前
11秒前
现代匪完成签到,获得积分10
12秒前
瘦瘦的小蘑菇完成签到,获得积分10
12秒前
杨烨华发布了新的文献求助10
13秒前
xiaozeng完成签到,获得积分10
16秒前
潇湘雪月完成签到,获得积分10
17秒前
小扑棱蛾子完成签到 ,获得积分10
17秒前
Alan完成签到,获得积分10
17秒前
17秒前
小火锅发布了新的文献求助10
17秒前
MZ完成签到,获得积分10
18秒前
与一完成签到 ,获得积分10
18秒前
某丞完成签到,获得积分10
19秒前
科研通AI5应助精明云朵采纳,获得10
20秒前
21秒前
逆时针完成签到,获得积分10
21秒前
大模型应助......采纳,获得10
21秒前
suan完成签到,获得积分10
21秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Population Genetics 3000
Continuum thermodynamics and material modelling 3000
Production Logging: Theoretical and Interpretive Elements 2700
Unseen Mendieta: The Unpublished Works of Ana Mendieta 1000
Theory of Block Polymer Self-Assembly 750
지식생태학: 생태학, 죽은 지식을 깨우다 700
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3497919
求助须知:如何正确求助?哪些是违规求助? 3082209
关于积分的说明 9171038
捐赠科研通 2775409
什么是DOI,文献DOI怎么找? 1523030
邀请新用户注册赠送积分活动 706360
科研通“疑难数据库(出版商)”最低求助积分说明 703416