数据结构和算法-哈夫曼编码

一、概念

给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近

哈夫曼编码(Huffman Coding),又称霍夫曼编码,是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种。该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,一般就叫做Huffman编码(有时也称为霍夫曼编码)

二、构建哈夫曼树

由权值分别为5,15,40,30,10的字符ABCDE构建哈夫曼树
1、将权值最小的A,E作为树的左右孩子,生成一棵树,顶点为N1且权值为A和E的权值和15

BCA97988-F869-4C3B-A61C-1BD7F493FB49.png

2、继续遍历未加入到树中的字符和树的顶点,将权值最小的两个字符按左右孩子生成树,顶点为N2,权值是左右孩子权值和

截屏2020-05-10下午10.23.07.png

截屏2020-05-10下午10.28.00.png

截屏2020-05-10下午10.31.04.png

代码实现

const int MaxValue = 10000;//初始设定的权值最大值

//设定哈夫曼树为顺序存储
//哈夫曼树的结点结构
typedef struct HuffNode{
  int weight;       //权值
  int flag;         //标记是否已加入到树中 0为没加入,1为已加入
  int parent;       //该结点的双亲结点的下标
  int leftChild;    //该结点的左孩子结点的下标
  int rightChild;   //该结点的右孩子结点的下标
}HuffNode;

构建哈夫曼树

void huffmanTree(int weight[], int n, HuffNode *h){
  //有n个叶子结点的树共有2*n-1个结点
  for (int i = 0; i<2*n-1; i++) {
      if (i<n) {
          h[i].weight = weight[i];
      }else{
          h[i].weight = 0;
      }
      h[i].parent = 0;
      h[i].flag = 0;
      h[i].leftChild = -1;
      h[i].rightChild = -1;
  }
  int m1,m2,x1,x2;
  for (int i = 0; i<n-1; i++) {
      m1 = MaxValue;  //存储权值最小的值
      m2 = MaxValue;  //存储权值第二小的值
      x1 = 0;   //存储权值最小的值的下标
      x2 = 0;   //存储权值第二小的值的下标
      for (int j = 0; j<n+i; j++) {
          if (h[j].weight<m1 && h[j].flag == 0) {
              m2 = m1;
              x2 = x1;
              m1 = h[j].weight;
              x1 = j;
          }else if (h[j].weight<m2 && h[j].flag == 0){
              m2 = h[j].weight;
              x2 = j;
          }
      }
      h[x1].parent = n+i;
      h[x2].parent = n+i;
      h[x1].flag = 1;
      h[x2].flag = 1;
      
      h[n+i].leftChild = x1;
      h[n+i].rightChild = x2;
      h[n+i].weight = m1+m2;
  }
}

哈夫曼编码

const int MaxBit = 8;//初始设定的最大编码位数
typedef struct Code//存放哈夫曼编码的数据元素结构
{
  int bit[MaxBit];//数组
  int start;  //编码的起始下标
  int weight;//字符的权值
}Code;
void huffmanCode(HuffNode h[], int n, Code c[]){
  //创建一个结构为Code的结点
  Code *cd = (Code *)malloc(sizeof(Code));
  int child, parent;
  
  //求n个叶子结点的哈夫曼编码
  for (int i = 0; i<n; i++) {
      cd->start = 0;   //从0开始计数
      cd->weight = h[i].weight;  //获取结点的权值
      child = i;
      parent = h[i].parent;
      
      //由叶结点向上到根结点
      while (parent != 0) {
          if (h[parent].leftChild == child) {
              cd->bit[cd->start] = 0;//该结点为左孩子编码为0
          }else{
              cd->bit[cd->start] = 1;//该结点为右孩子编码为1
          }
          cd->start++;
          child = parent;
          parent = h[child].parent;
      }
      //将编码值反转
      for (int j = cd->start - 1; j>=0; j--) {
          int k = cd->start - 1- j;
          c[i].bit[k] = cd->bit[j];
      }
      c[i].weight = cd->weight;
      c[i].start = cd->start;
  }
}

demo

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。