Java数据结构和算法-赫夫曼编码的原理图解

赫夫曼编码

原理剖析

通信领域中信息的处理方式3---赫夫曼编码

i like like like java do you like a java // 共40个字符(包括空格)
d:1 y:1 u:1 j:2 v:2 o:2 l:4 k:4 e:4 i:5 a:5 :9 // 各个字符对应的个数
按照上面字符出现的次数构建一颗赫夫曼树, 次数作为权值。

传输的字符串
1)、i like like like java do you like a java
2)、d:1 y:1 u:1 j:2 v:2 o:2 l:4 k:4 e:4 i:5 a:5 :9 // 各个字符对应的个数
3)、按照上面字符出现的次数构建一颗赫夫曼树, 次数作为权值。

步骤:
1、从小到大排序,将每一个数据,每个数据都是一个节点,每个节点可以看成是一颗最简单的二叉树
2、取出根节点权值最小的两颗二叉树
3、组成一颗新的二叉树,新的二叉树的根节点的权值是前面两颗二叉树根节点权值的和
4、再将这颗新的二叉树,以根节点的权值大小再次排序,不断重复1-2-3-4的步骤,直到数列中,所有的数据都被处理,就得到一颗赫夫曼树

4)、根据赫夫曼树，给各个字符规定编码(前缀编码)，向左的路径为0向右的路径为1,编码如下:

o: 1000 u: 10010 d: 100110 y: 100111 i: 101
a : 110 k: 1110 e: 1111 j: 0000 v: 0001
l: 001 : 01

5)、按照上面的赫夫曼编码，我们的"i like like like java do you like a java" 字符串对应的编码为 (注意这里我们使用的无损压缩)
1010100110111101111010011011110111101001101111011110100001100001110011001111000011001111000100100100110111101111011100100001100001110
长度为： 133
说明:
原来长度是 359 , 压缩了 (359-133) / 359 = 62.9%
此编码满足前缀编码, 即字符的编码都不能是其他字符编码的前缀。不会造成匹配的多义性
赫夫曼编码是无损压缩

注意事项

注意,这个赫夫曼树根据排序方法不同,也可能不太一样,这样对应的赫夫曼编码也不完全一样,但是wpl是一样的,都是最小的,最后生成的赫夫曼编码的长度是一样的。

最后编辑于：2020.04.20 21:48:41

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

Java数据结构和算法-赫夫曼编码的原理图解

Java数据结构和算法-赫夫曼编码的原理图解

赫夫曼编码

原理剖析

通信领域中信息的处理方式3---赫夫曼编码

相关阅读更多精彩内容

友情链接更多精彩内容