Java 数据结构 哈夫曼编码

介绍

上一篇文章我们讲到了哈夫曼树,相信看官们对其也有一定的了解了
https://www.jianshu.com/p/bad3472aae5a(需先理解何为哈夫曼树)

哈夫曼编码(Huffman Coding),又称霍夫曼编码,是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种。Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,一般就叫做Huffman编码。

举个例子

我们有 A, B, C, D 四个字符,他们的出现频率分别是1,2,3,4(这也是他们的权值)
这个时候,我们根据哈夫曼树的生成方式,将其构建成一个哈夫曼树


huffman1.png

之后,我们再给它的路径添加上代码(左分支0,右分支1)
最后得出 A,B,C,D的哈夫曼编码分别是100,101,11,0


huffman2.png

java代码实现

package tree;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

/**
 * Created by Sheldon on 2019/4/11.
 * Project Name: alstudy.
 * Package Name: tree.
 */
// 数据类
class Data{
    public char key;
    public int value;
    public Data(char key, int value){
        this.key = key;
        this.value = value;
    }
}

// 结点结构
class CodeNode{
    // 权值
    Data data;
    // 左结点
    CodeNode leftChild;
    // 右结点
    CodeNode rightChild;

    public CodeNode(Data data){
        this.data = data;
    }

    public CodeNode(Data data, CodeNode leftChild, CodeNode rightChild){
        this.leftChild = leftChild;
        this.rightChild = rightChild;
        this.data = data;
    }
}

public class HuffmanCode {

    /**
     * 创建哈弗曼树
     * @param datas
     * @return
     */
    public static CodeNode createHuffmanTree(Data[] datas){
        // 将传进来的数组元素创建成结点
        List<CodeNode> nodes = new ArrayList<>();
        for (Data d: datas){
            nodes.add(new CodeNode(d));
        }
        // 循环处理以下操作
        while (nodes.size()>1){
            // 依据权值排序(选择排序算法)
            CodeNode temp;
            for (int i=0; i<nodes.size(); i++){
                int k = i;
                for (int j=nodes.size()-1; j>i; j--){
                    if (nodes.get(j).data.value < nodes.get(k).data.value){
                        k = j;
                    }
                }
                temp = nodes.get(i);
                nodes.set(i, nodes.get(k));
                nodes.set(k, temp);
            }
            // 取出权值最小的两个二叉树
            CodeNode leftNode = nodes.get(0);
            CodeNode rightNode = nodes.get(1);
            // 创建新的二叉树
            Data d = new Data('#', leftNode.data.value+rightNode.data.value);
            CodeNode parent = new CodeNode(d, leftNode, rightNode);
            // 移除取出的二叉树
            nodes.remove(leftNode);
            nodes.remove(rightNode);
            // 放入原来的二叉树集合中
            nodes.add(parent);
        }
        return nodes.get(0);
    }

    static StringBuilder sb = new StringBuilder();          // 存储编码字符
    static Map<String, String> huffcodes = new HashMap<>();  // 存储编码表

    /**
     * 创建哈夫曼编码编码表
     * @param codeNode
     * @return
     */
    public static Map<String, Integer> createCode(CodeNode codeNode){
        if (codeNode==null){
            return null;
        }
        getCode(codeNode.leftChild, "0", sb);
        getCode(codeNode.rightChild, "1", sb);
        return null;
    }

    public static void getCode(CodeNode codeNode, String code, StringBuilder sb){
        StringBuilder sb2 = new StringBuilder(sb);
        sb2.append(code);
        if (codeNode.data==null||codeNode.data.key=='#'){
            getCode(codeNode.leftChild,"0",sb2);
            getCode(codeNode.rightChild,"1",sb2);
        }else {
            huffcodes.put(String.valueOf(codeNode.data.key),sb2.toString());
        }
    }

    public static void main(String[] args) {
        String plaintext = "ABCBCDCDDD";
        char[] ch = plaintext.toCharArray();
        Map<String,Integer> textMap = new HashMap<>();
        // 统计字符出现次数
        for (char c : ch) {
            String cTo = String.valueOf(c);
            if (!textMap.containsKey(cTo)) {
                textMap.put(cTo, 1);
            } else {
                textMap.put(cTo, textMap.get(cTo) + 1);
            }
        }
        System.out.println(textMap.entrySet());
        // 创建结点数组
        Data[] datas = new Data[textMap.size()];
        int i = 0;
        // 结点数组的元素对象创建
        for (Map.Entry<String, Integer> entry: textMap.entrySet()) {
            datas[i] = new Data(entry.getKey().charAt(0),entry.getValue());
            i++;
        }
        // 创建哈夫曼树
        CodeNode root = HuffmanCode.createHuffmanTree(datas);
        // 创建哈夫曼编码表
        HuffmanCode.createCode(root);
        // 输出哈夫曼树
        System.out.println(HuffmanCode.huffcodes);
        StringBuilder textSb = new StringBuilder();
        // 加密文本信息
        for (char c: ch) {
            textSb.append(HuffmanCode.huffcodes.get(String.valueOf(c)));
        }
        // 输出加密前的信息
        System.out.println("加密前:"+plaintext);
        // 输出加密后的信息
        System.out.println("加密后:"+textSb);
    }
}

结果

结果.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,172评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,346评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,788评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,299评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,409评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,467评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,476评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,262评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,699评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,994评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,167评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,827评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,499评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,149评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,387评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,028评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,055评论 2 352

推荐阅读更多精彩内容