哈夫曼编码操作

/**
 * 哈夫曼编码表
 */
private static Map<Byte, String> map;
/**
 * 将原文所有字节进行哈夫曼编码后的二进制字符串拼接在一起的总长度
 */
private static int binaryStringLength;

/**
 * 使用哈夫曼编码解压文件
 *
 * @param source
 * @param destination
 * @throws IOException
 * @throws ClassNotFoundException
 */
 public static void unzipFiles(String source, String destination)
        throws IOException, ClassNotFoundException {
    /**
     * 获得源文件的对象输入流
     */
    FileInputStream fis = new FileInputStream(source);
    ObjectInputStream ois = new ObjectInputStream(fis);
    /**
     * 读取对象的顺序必须和写入对象的顺序一致
     *
     * 读取编码后的byte数组
     */
    byte[] zipFile = (byte[]) ois.readObject();
    /**
     * 读取哈夫曼编码表
     */
    Map<Byte, String> map = (Map<Byte, String>) ois.readObject();

    ois.close();
    fis.close(); 
    /**
     * 使用指定的哈夫曼编码表进行解码
     */
    byte[] bytes = decodeHuffmanCode(zipFile, map);
    /**
     * 创建文件输出流
     */
    FileOutputStream fos = new FileOutputStream(destination);
    /**
     * 将解压后的文件写到目标文件中
     */
    fos.write(bytes);

    fos.close();
 }

/**
 * 使用哈夫曼编码压缩文件
 */
 public static void zipFiles(String source, String destination) throws IOException {
    /**
     * 获得源文件的输入流
     */
    FileInputStream fis = new FileInputStream(source);
    /**
     * 创建一个和源文件大小相同的byte数组
     */
    byte[] bytes = new byte[fis.available()];
    /**
     * 将源文件读取到byte数组中
     */
    fis.read(bytes);

    fis.close();
    /**
     * 获得哈夫曼编码后的字节数组
     */
    byte[] zipFile = createHuffmanCoding(bytes);
    /**
     * 创建对象输出流
     */
    FileOutputStream fos = new FileOutputStream(destination);
    ObjectOutputStream oos = new ObjectOutputStream(fos);
    /**
     * 将编码后的byte数组和哈夫曼编码表写到目标文件中
     */
    oos.writeObject(zipFile);
    oos.writeObject(map);

    oos.close();
    fos.close();
}

/**
 * 使用指定的哈夫曼编码表进行解码
 *
 * @param huffmanCode
 * @param map
 * @return
 */
public static byte[] decodeHuffmanCode(byte[] huffmanCode, Map<Byte, String> map) {

    StringBuilder builder = new StringBuilder();

    for (int i = 0, len = huffmanCode.length; i < len; i++) {
        int value = huffmanCode[i];
        /**
         * 256的二进制表示为100000000,一个整型与100000000做或运算后,二进制表示的第9位一定为1,
         * 则最后整型的二进制表示长度至少有9位,便于后续截取8位长度的操作。
         * 否则二进制表示可能少于8位。例如:24的二进制表示为11000。
         */
        value |= 256;
        /**
         * 将字节转换成二进制字符串
         */
        String str = Integer.toBinaryString(value);
        if (i < len - 1) {
            /**
             * 截取二进制字符串的末尾8位
             */
            builder.append(str.substring(str.length() - 8));
        } else {
            int restLength = binaryStringLength - (len - 1) * 8;
            /**
             * 编码后的二进制字符串最后还剩几位就截取二进制字符串的末尾几位
             */
            builder.append(str.substring(str.length() - restLength));
        }
    }

    Map<String, Byte> dictionary = new HashMap<>();

    for (byte key : map.keySet()) {
        dictionary.put(map.get(key), key);
    }

    List<Byte> list = new ArrayList<>();

    for (int i = 0, len = builder.length(); i < len; ) {
        for (int cursor = 1; ; cursor++) {
            String key = builder.substring(i, i + cursor);

            Byte value;
            if ((value = dictionary.get(key)) != null) {
                list.add(value);
                i += cursor;
                break;
            }
        }
        if (i >= len) {
            break;
        }
    }

    byte[] arr = new byte[list.size()];

    for (int i = 0, size = list.size(); i < size; i++) {
        arr[i] = list.get(i);
    }

    return arr;
 }

/**
 * 获得哈夫曼编码后的字节数组
 *
 * @param bytes
 * @return
 */
public static byte[] createHuffmanCoding(byte[] bytes) {

    /**
     * 将字节数组转化为节点list
     */
     List<HuffmanCodingNode> list = getHuffmanCodingNodeList(bytes);
    /**
     * 创建哈夫曼树
     */
    HuffmanCodingNode node = createHuffmanTree(list);
    /**
     * 创建哈夫曼编码表
     */
    map = createHuffmanCodingTable(node);
    /**
     * 进行哈夫曼编码
     */
    byte[] huffmanCode = doHuffmanCoding(map, bytes);

    return huffmanCode;
}

/**
 * 进行哈夫曼编码
 */
public static byte[] doHuffmanCoding(Map<Byte, String> map, byte[] bytes) {

    StringBuilder builder = new StringBuilder();
    /**
     * 将所有字节拼接成一个二进制字符串
     */
    for (byte key : bytes) {
        builder.append(map.get(key));
    }
    /**
     * 将原文所有字节进行哈夫曼编码后的二进制字符串拼接在一起的总长度
     */
    binaryStringLength = builder.length();
    /**
     * 计算二进制字符串包含的字节数
     */
    int length = (int) Math.ceil(binaryStringLength * 1.0 / 8);

    byte[] huffmanCode = new byte[length];
    int index = 0;

    for (int i = 0; i < builder.length(); i += 8) {
        String subStr = i + 8 <= binaryStringLength ? builder.substring(i, i + 8) : builder.substring(i);
        /**
         * 将8位二进制字符串转化为一个字节
         */
        byte b = (byte) Integer.parseInt(subStr, 2);
        huffmanCode[index++] = b;
    }

    return huffmanCode;
}

/**
 * 创建哈夫曼编码表
 *
 * @param node
 * @return
 */
public static Map<Byte, String> createHuffmanCodingTable(HuffmanCodingNode node) {

    Map<Byte, String> map = new HashMap<>();

    if (node != null && node.getLeft() == null && node.getRight() == null) {
        map.put(node.getData(), "");
        return map;
    }

    if (node != null) {
        Map<Byte, String> leftMap = createHuffmanCodingTable(node.getLeft());
        Map<Byte, String> rightMap = createHuffmanCodingTable(node.getRight());

        for (byte key : leftMap.keySet()) {
            map.put(key, "0" + leftMap.get(key));
        }

        for (byte key : rightMap.keySet()) {
            map.put(key, "1" + rightMap.get(key));
        }
    }

    return map;
}

/**
 * 创建哈夫曼树
 *
 * @param list
 * @return
 */
public static HuffmanCodingNode createHuffmanTree(List<HuffmanCodingNode> list) {

    while (list.size() > 1) {
        /**
         * 将所有节点按照节点的权升序排序
         */
        Collections.sort(list, Comparator.comparingInt(HuffmanCodingNode::getWeight));

        HuffmanCodingNode left = list.get(0);
        HuffmanCodingNode right = list.get(1);
        HuffmanCodingNode node = new HuffmanCodingNode();
        node.setWeight(left.getWeight() + right.getWeight());
        node.setLeft(left);
        node.setRight(right);

        list.remove(left);
        list.remove(right);
        list.add(node);
    }
    return list.get(0);
}

/**
 * 将字节数组转化为节点list
 *
 * @param bytes
 * @return
 */
public static List<HuffmanCodingNode> getHuffmanCodingNodeList(byte[] bytes) {

    List<HuffmanCodingNode> list = new ArrayList<>();
    Map<Byte, Integer> map = new HashMap<>();
    /**
     * 统计每个字节出现的次数
     */
    for (byte value : bytes) {
        map.put(value, map.getOrDefault(value, 0) + 1);
    }

    for (byte key : map.keySet()) {
        int value = map.get(key);
        HuffmanCodingNode node = new HuffmanCodingNode();
        node.setData(key);
        node.setWeight(value);
        list.add(node);
    }

    return list;
}

测试

public static void main(String[] args) throws IOException, ClassNotFoundException {
    String str =
            "We hold these truths to be self-evident, that all men are created equal, that they are " +
                    "endowed by their Creator with certain unalienable Rights, that among these are " +
                    "Life, Liberty and the pursuit of Happiness.";

    byte[] bytes = str.getBytes();

    byte[] huffmanCode = createHuffmanCoding(bytes);

    byte[] bytes1 = decodeHuffmanCode(huffmanCode, map);
    /**
     * 输出:"We hold these truths to be self-evident, that all men are created equal, that they are " +
                    "endowed by their Creator with certain unalienable Rights, that among these are " +
                    "Life, Liberty and the pursuit of Happiness."
     */
    System.out.println(new String(bytes1));

    zipFiles("/Users/×××××/Desktop/pic.png", "/Users/×××××/Desktop/pic.zip");

    unzipFiles("/Users/×××××/Desktop/pic.zip", "/Users/×××××/Desktop/pic1.png");
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,029评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,395评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,570评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,535评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,650评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,850评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,006评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,747评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,207评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,536评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,683评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,342评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,964评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,772评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,004评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,401评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,566评论 2 349