java实现huffman编码

    最近闲来无事,在小破站看到了Huffman编码原理,就想着用Java自己实现一波,Huffman编码的原理就是通过统计字符出现的次数作为权值来构建Huffman树,然后以左子树为0,右子树为1进行编码,因为字符对应的节点都是叶子节点,这样每一个字符的编码都是唯一的,以此实现对字符串的压缩编解码.话不多说,直接上代码:
    首先定义树节点对象
public static class HTNode<E> {

        /**
         * 左子节点
         */
        private HTNode left;

        /**
         * 右子节点
         */
        private HTNode right;

        /**
         * 权重
         */
        private int power;

        /**
         * 对应的字符
         */
        private E v;

        public HTNode(int power){
            this.setPower(power);
        }

        public HTNode(){

        }

        public HTNode(int power, E v){
            this.power = power;
            this.v = v;
        }

        public HTNode getLeft() {
            return left;
        }

        public void setLeft(HTNode left) {
            this.left = left;
        }

        public HTNode getRight() {
            return right;
        }

        public void setRight(HTNode right) {
            this.right = right;
        }

        public int getPower() {
            return power;
        }

        public void setPower(int power) {
            this.power = power;
        }

        public E getV() {
            return v;
        }

        public void setV(E v) {
            this.v = v;
        }

        /**
         * 前序遍历函数
         * @param node
         */
        public void printfVLR(HTNode node){
            if(node == null){
                return;
            }
            System.out.println(node.power+"     "+node.v);
            //遍历左子树
            printfVLR(node.left);
            //遍历右子树
            printfVLR(node.right);
        }
    }

接下来写个排序函数,就用快排吧

public static <T extends HTNode> void quickSortT(T[] arr, int start, int end){
        if(start >= end)
            return;
        int midIdx = subQuickSort(arr, start, end);
        quickSortT(arr, 0, midIdx -1);
        quickSortT(arr, midIdx+1, end);
    }

    public static <T extends HTNode> int subQuickSort(T[] arr, int start, int end){
        T mid = arr[start];
        while (start < end){
            if(arr[end].getPower() >= mid.getPower() && start < end){
                end--;
            }
            arr[start] = arr[end];
            while(arr[start].getPower() <= mid.getPower() && start < end){
                start++;
            }
            arr[end] = arr[start];
        }
        arr[start] = mid;
        return start;
    }

然后是构建Huffman树的函数:

public class TestHuffmanTree {

    private static HTNode root;
    

    public static <E> HTNode<E> getHuffmanTree(Map<E, Integer> map){
        return huffmanTree(transfer(map));
    }
    
    public static <E> HTNode[] transfer(Map<E, Integer> map){
        HTNode[] htNodes = new HTNode[map.size()];
        int i=0;
        Iterator<Map.Entry<E, Integer>> iterator = map.entrySet().iterator();
        while(iterator.hasNext()){
            Map.Entry<E, Integer> next = iterator.next();
            htNodes[i] = new HTNode(next.getValue(), next.getKey());
            i++;
        }
        return htNodes;
    }

    private static HTNode huffmanTree(HTNode[] arr){
        long start = System.nanoTime();
        if(null == arr || arr.length == 0)
            return null;
        while(arr.length > 1){
            for(int i=0;i< arr.length;++i){
                if(arr.length >= 2){
                    QuickSort.quickSortT(arr, 0, arr.length-1);
                }
                //取出两个节点,结合成新节点,
                HTNode n1 = arr[0];
                HTNode n2 = arr[1];
                HTNode newNode = new HTNode(n1.power+ n2.power);
                newNode.setLeft(n1);
                newNode.setRight(n2);
                arr = Arrays.copyOfRange(arr, 1, arr.length);
                arr[0] = newNode;
            }
        }
        root = arr[0];
        System.out.println("耗时:"+(System.nanoTime() - start));
        return root;
    }
}

然后是对huffman树进行编码

public class TestHuffmanCode {

    public static void main(String[] args) {
        String s = "i have a dream, this dream depends on american dream";
        Map<Character, Integer> charMap = getCharMap(s);
        TestHuffmanTree.HTNode<Character> huffmanTree = TestHuffmanTree.getHuffmanTree(charMap);
        huffmanTree.printfVLR(huffmanTree);
        getHuffmanCode(huffmanTree ,null);
        huffmanCodeMap.forEach((k, v) ->{
            System.out.println(k +"=="+v);
        });

        String result = "";
        for(int i=0;i< chars.length;++i){
            String hCode = huffmanCodeMap.get(chars[i]);
            result+=hCode;
        }
        System.out.println("最终编码为:"+result);
    }




    private static Map<Character, Integer> getCharMap(String s){
        Map<Character, Integer> map = new HashMap<>();
        chars = s.toCharArray();
        for(int i=0;i< chars.length;++i){
            char aChar = chars[i];
            if(map.containsKey(aChar)){
                Integer count = map.get(aChar);
                map.put(aChar, ++count);
            }else{
                map.put(aChar, 1);
            }
        }
        return map;
    }
    static Map<Character, String> huffmanCodeMap = new HashMap<>();

    static StringBuilder sb = new StringBuilder();

    static char[] chars;

    /**
     * 前序遍历获取各子节点Huffman编码,并缓存到 huffmanCodeMap 中
     * @param node
     * @param direction
     */
    private static void getHuffmanCode(TestHuffmanTree.HTNode<Character> node, Integer direction){

        if(node == null)
            return;
        if(direction != null){
            sb.append(direction);
        }
        if(node.getV() != null){
            huffmanCodeMap.put(node.getV(), sb.toString());
            sb = sb.deleteCharAt(sb.length()-1);
            return;
        }
        TestHuffmanTree.HTNode<Character> left = node.getLeft();
        getHuffmanCode(left, 0);
        TestHuffmanTree.HTNode right = node.getRight();
        getHuffmanCode(right, 1);
        //如果跳出本次递归调用,返回上一层递归,如果sb不为空,删除掉最后一个编码
        if(sb.length() > 0){
            sb = sb.deleteCharAt(sb.length()-1);
        }
    }
}

接下来是打印结果

耗时:698300
52     null
21     null
9      
12     null
5     d
7     a
31     null
14     null
7     null
3     i
4     m
7     e
17     null
8     null
4     null
2     s
2     null
1     p
1     o
4     r
9     null
4     null
2     h
2     null
1     v
1     c
5     null
2     null
1     ,
1     t
3     n
 ==00
a==011
c==111011
d==010
e==101
h==11100
i==1000
,==111100
m==1001
n==11111
o==110011
p==110010
r==1101
s==11000
t==111101
v==111010
最终编码为:1000001110001111101010100011000101101101011100111110000111101111001000110000001011011010111001000101011100101011111101011000001100111111100011100110111011000111011011111110001011011010111001

完毕!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,776评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,527评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,361评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,430评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,511评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,544评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,561评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,315评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,763评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,070评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,235评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,911评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,554评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,173评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,424评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,106评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,103评论 2 352

推荐阅读更多精彩内容