算法 & 数据结构——霍夫曼编码

霍夫曼编码_简介

上周一个尝试入坑C++的朋友说, 打算用C++写一个霍夫曼编码, 用于压缩JPEG?

他吐槽C++要自己delete很麻烦. 很多人对C++都有这个误解, 主要原因是, 大多数人并不知道RAII, 更不知道怎么用RAII. 很多情况下, 是不需要自己写一堆delete的. 内存控制并不是C++的难点, 这更应该算是逻辑问题. 因为用任何语言去实现内存管理相关的功能, 都会面临这个问题. C++的难点应该是泛型/多范式/元编程/缺少高级标准库/语言自身的复杂度/(省略N条...).

以下是C++实现霍夫曼编码(也不知道这是不是霍夫曼编码, 毕竟已经很多年没听过这个词了), 需要手写delete的地方非常少, 只有两行, 而需要手动释放内存的地方压根就没有.

#include <algorithm>
#include <iostream>
#include <iterator>
#include <fstream>
#include <memory>
#include <vector>
#include <string>
#include <limits>
#include <queue>
#include <tuple>
#include <list>

#define SAFE_DELETE(p)          { delete p; p = nullptr; }
#define CHECK_RET(cod, ret)     { if (cod) return (ret); }

template <class T>
struct Node {
    Node(): lchild(nullptr), rchild(nullptr), weight(0), value(T())
    { }

    ~Node()
    {
        SAFE_DELETE(lchild);
        SAFE_DELETE(rchild);
    }

    size_t GetHeight() const
    {
        auto lh = lchild != nullptr ? lchild->GetHeight() : 0;
        auto rh = rchild != nullptr ? rchild->GetHeight() : 0;
        return std::max(lh, rh) + 1;
    }

    T value;
    Node * lchild;
    Node * rchild;
    size_t weight;
};

template <class T>
class HuffmanTree {
public:
    using Node_t = Node<T>;

    bool Init(const std::string & fname)
    {
        std::ifstream ifile(fname);
        return Init(ifile);
    }

    bool Init(std::ifstream & ifile)
    {
        CHECK_RET(!ifile, false);
        std::list<Node_t*> list;
        size_t w; T v;
        while (ifile >> w >> v)
        {
            Node_t *node = new Node_t();
            list.push_back(node);
            node->weight = w;
            node->value = v;
        }
        return Init(list);
    }

    const T & Translate(const std::string & coding) const
    {
        auto node = _root.get();
        for (const auto & code : coding)
        {
            if (code == '0')
            {
                node = node->lchild;
            }
            else if (code == '1')
            {
                node = node->rchild;
            }
        }
        return node->value;
    }

    std::vector<T> Translate(const std::vector<std::string> & codings) const
    {
        std::vector<T> result;
        for (const auto & coding : codings)
        {
            result.push_back(Translate(coding));
        }
        return std::move(result);
    }

    void Print(std::ostream & os) const
    {
        if (!IsEmpty())
        {
            std::queue<Node_t *> queue;
            queue.push(_root.get());
            while (!queue.empty())
            {
                auto node = queue.front();
                queue.pop();

                os  << "node: " << node << ", "
                    << "value: " << node->value << ", "
                    << "weight: " << node->weight << ", ";

                if (node->lchild != nullptr)
                {
                    os << "lchild: " << node->lchild << ", ";
                    queue.push(node->lchild);
                }

                if (node->rchild != nullptr)
                {
                    os << "rchild: " << node->rchild << ", ";
                    queue.push(node->rchild);
                }
                os << std::endl;
            }
        }
    }

    bool IsEmpty() const
    {
        return nullptr == _root;
    }

private:
    bool Init(std::list<Node_t *> & list)
    {
        CHECK_RET(list.size() == 0, false);
        if (list.size() == 1)
        {
            _root.reset(list.front());
        }
        else
        {
            auto[first, second] = MaxPair(list);
            auto parent = new Node_t();
            parent->weight = (*first)->weight 
                            + (*second)->weight;
            parent->rchild = *second;
            parent->lchild = *first;
            list.push_back(parent);
            list.erase(second);
            list.erase(first);
            return Init(list);
        }
        return !IsEmpty();
    }

    std::tuple<
        typename std::list<Node_t *>::iterator,
        typename std::list<Node_t *>::iterator>
    MaxPair(std::list<Node_t *> & list)
    {
        auto first = std::next(list.begin(), 0);
        auto second = std::next(list.begin(), 1);
        
        if ((*first)->weight < (*second)->weight)
        {
            std::swap(first, second);
        }

        for (auto it = std::next(list.begin(), 2); it != list.end(); ++it)
        {
            if ((*it)->weight > (*first)->weight)
            {
                second = first;
                first = it;
            }
            else if ((*it)->weight > (*second)->weight)
            {
                second = it;
            }
        }
        return { first, second };
    }

private:
    std::unique_ptr<Node_t> _root;
};

int main()
{
    HuffmanTree<int> tree;
    tree.Init("huffman.txt");

    std::cout << "----tree----" << std::endl;
    tree.Print(std::cout);
    
    std::cout << "----coding----" << std::endl;
    std::cout << "code: 01 value: " << tree.Translate("01") << std::endl;
    std::cout << "code: 001 value: " << tree.Translate("001") << std::endl;
    std::cout << "code: 0001 value: " << tree.Translate("0001") << std::endl;
    std::cout << "code: 0000 value: " << tree.Translate("0000") << std::endl;
    std::cin.get();
    return 0;
}
执行结果
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,463评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,868评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,213评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,666评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,759评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,725评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,716评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,484评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,928评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,233评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,393评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,073评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,718评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,308评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,538评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,338评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,260评论 2 352

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,920评论 2 89
  • 1.C和C++的区别?C++的特性?面向对象编程的好处? 答:c++在c的基础上增添类,C是一个结构化语言,它的重...
    杰伦哎呦哎呦阅读 9,513评论 0 45
  • 这条街的大多数时候,是沉默的,文艺的,没有金碧辉煌的气派,亦无音乐喇叭的喧嚣和狂躁,适合在一个午后慢慢地逛着...
    多依芽阅读 197评论 0 0
  • 我带着清澈的绝望 遥望远方 我的梦飘向了何方 躲在角落默默舔着我的伤 千言万语终成无语 以为自己很勇敢 以为我能做...
    山河界阅读 260评论 0 1
  • 凩州阅读 304评论 0 0