数据结构--哈弗曼编码器

哈夫曼编码


本人比较懒....关于哈夫曼树知识点的介绍就不在博客上说了, 请同学们自行查阅相关资料, 直接上代码, 简单 ,粗暴.
如果有哪里没看明白或者是对程序有更好的见解, 请评论在博文的下方, 或者私信我, 我看到后会第一时间回复, 希望大家踊跃发言


语言: C

知识点: 哈夫曼编码


问题描述: 问题描述:设计一个赫夫曼编码译码系统,对某个英文文本文件(.txt)中的字符进行哈夫曼编码,并将该txt文件生成编码文件(.cod);反过来还可将一个编码文件(.cod)还原为一个文本文件(.txt)。


功能及界面要求

本题可采用console控制台或可视化界面,console控制台参考界面如下
                   哈夫曼编码译码器                           
*       1、选择需要进行编码的文件                                   
*       2、建立哈夫曼树                                             
*       3、建立密码本并对文件编码                                   
*       4、选择需要进行解码的文件并解码                             
*       5、按位压缩方式对文件进行压缩                               

功能说明

①“选择需要进行编码的文件”:选择该选项后,提示用户输入(或选择)要进行编码(加密)的文件(包括路径和文件名)。
②“建立哈夫曼树”: 选择该选项后,程序根据1中确定的文件建立哈夫曼树。
③“建立密码本并对文件编码”: 选择该选项后,程序根据2中建立好的哈夫曼树为1中出现的每个字符建立编码,并对文件进行编码,在进行编码前提示用户将编码文件存放在哪个文件(文件扩展名为cod)中。
④“选择需要进行解码的文件并解码”: 选择该选项后,提示用户输入(或选择)需要进行解码(译码)的文件(文件扩展名为cod),并输入(或选择)将解码(译码)后的文件存放到哪个文件(文件扩展名为txt),程序将cod文件根据3建立的密码本进行解码,解码到txt文件中。
⑤“按位压缩方式对文件进行压缩”:对cod文件进行压缩,显示压缩比(即压缩后的编码文件字节数/编码前的原txt文件字节数),并能对压缩后的cod文件进行解码。


存储要求:

 哈夫曼树采用数组存储
 密码本在内存中采用数组存储,也可根据用户选择将密码本存到文件中。
 编码文件和译码文件都采用文本文件存储。


算法及技术指导:

①为实现功能2,首先用对原txt文件进行扫描,得到每个字符(包括空格、标点符号和回车换行)出现的次数,并根据教材提供的算法得到哈夫曼树。
②为实现功能3,首先根据哈夫曼树及教材提供的算法得到每个出现字符的哈夫曼编码( 即建立密码本),并对原txt文件重新进行扫描,扫描到某个字符时在密码本中找到该字符的哈夫曼编码,写入到编码文件中。
③为实现功能4,要扫描编码文件,扫描(读)到‘0’或‘1’时,根据哈夫曼树进行相应的处理,直到扫描(读)到某个‘0’或‘1’后,哈夫曼树已经到达某个叶子,将该叶子对应的字符写入到解码文件中。
④为实现功能5,对编码后的cod文件进行处理,将每8个(‘0’或‘1’)字符串转化为相应的整数(用1个字节存储)并写入压缩文件中,注意对最后一个01串(长度<=8)的处理。


代码如下

#include<iostream>
#include<cstdio>
#include<cstring>
#include<cstdlib>

using namespace std;

char filenamemi[100];
char filefile[100];
char filebian[100];

typedef struct
{
    int weight;
    char flag;
    int parent, lchild, rchild;
} HTNode, *HuffmanTree;
typedef struct ASCII
{
    char flag;
    int c;
    struct ASCII *next;
} ASCII, *LinkList;
typedef struct txt
{
    char flag;
    char hafuman[5000];
} txtNode;

LinkList L;
typedef char **HuffmanCode;

bool InitList(LinkList &L)//初始化链表
{
    L = new ASCII;
    L->c  = 1;
    L->next = NULL;
    return true;
}

void Show(LinkList L)//显示链表
{
    LinkList p;
    p = L->next;
    while(p)
    {
        printf("  %c, %d\n", p->flag, p->c);
        p = p->next;
    }
    cout<<endl;
}

int Choice() //选择文件以及创建权重值
{
    FILE *fp;
    char a;
    int num = 0, key = 0;
    int instance = 0;
    LinkList  p, s, m;
    InitList(L);
    s = L;
    m = L;
    getchar();
    //char filefile[100] ;
    while(!key)
    {
        printf("请输入你要打开的文件名及路径,如c:\\users\\lenovo\\desktop\\7\\1.txt\n");
        gets(filefile);
        if ((fp=fopen(filefile,"r"))==NULL)
        {
            printf("打开文件%s出现错误\n",filefile);
            key = 0;
            return 0;
        }
        key = 1;
    }

    while((a = fgetc(fp)) != EOF)
    {
        s = L->next;
        printf("%c ", a);
        while(s)
        {
            if(s->flag == a)//如果在文本中出现了, 当前字符, 那么当前字符的权重值++
            {
                s->c++;
                instance = 1;
                break;
            }
            s = s->next;
        }
        if(instance == 0)//如果当前文本没有改字符, 那么, 创建该字符,插入到文本当中
        {
            p = new ASCII;
            p->flag = a;
            p->c = 1;
            m->next = p;
            p->next = NULL;
            m = p;
            num++;//文本中多少结点
        }
        instance = 0;
    }
    cout<<endl;
    Show(L);
    //fseek(fp,0,SEEK_SET);
    fclose(fp);
    return num;
}

void Select(HuffmanTree &HT, int num, int *s1, int *s2) //寻找两个最小的且双亲为0的最小节点
{
    int i, sec = 0, fir = 0;//a是次小, b是最小
    int second = -1, first = -1;
    HTNode L1, L2;//L1次小, L2最小
    for(i = num; i >= 1; i--)//选择两个双亲部不为0的结点
    {
        if(HT[i].parent == 0 && second == -1) second = i;
        else if(HT[i].parent == 0 && first == -1) first = i;

        if(first!=-1 && second!=-1) break;
    }
    //cout<<second<<" "<<first<<endl;
    if(HT[second].weight > HT[first].weight)
    {
        L1 = HT[second];
        L2 = HT[first];
        sec = second;
        fir = first;
    }
    else
    {
        L1 = HT[first];
        L2 = HT[second];
        sec = first;
        fir = second;
    }

    for(i = num; i >= 1; i--)//从剩下的节点中找到两个最小的节点
    {
        if( (HT[i].weight < L2.weight) &&(HT[i].parent == 0) && i!=second && i!=first)
        {
            L1 = L2;
            L2 = HT[i];
            sec = fir;
            fir = i;
        }
        else if( (HT[i].weight < L1.weight) && (HT[i].parent == 0) && i!=second && i!=first)
        {
            L1 = HT[i];
            sec = i;
        }
    }
    *s1 = fir;
    *s2 = sec;
}

bool CreatHuffmanaTree(HuffmanTree &HT, int num) //创建哈夫曼树
{
    int m, i;
    LinkList p;
    p = L->next;
    if(num <= 1) return false;
    m = 2*num-1;
    HT = new HTNode[m+1];
    for(i = 1; i <= m; i++)
    {
        HT[i].parent = 0;
        HT[i].lchild = 0;
        HT[i].rchild = 0;
    }
    for(i = 1; i <= num; i++)
    {
        HT[i].weight = p->c;
        HT[i].flag = p->flag;
        p = p->next;
    }

    int s1=0, s2=0;
    for(i = num+1; i <= m; i++)
    {
        Select(HT, i-1, &s1, &s2);
        //cout<<s1<<" "<<s2<<endl;
        HT[s1].parent = i;
        HT[s2].parent = i;
        HT[i].lchild = s1;
        HT[i].rchild = s2;
        HT[i].weight = HT[s1].weight + HT[s2].weight;
    }
    return true;
}

bool CreatHuffmanaCode(HuffmanTree HT, int num) //创建哈夫曼编码
{
    char  *cd;
    int i, c, f, start, key = 0;
    FILE *fp;
    char flag;
    getchar();
    while(!key)
    {
        printf("请输入你要保存密码本的文件名及路径,如c:\\users\\lenovo\\desktop\\7\\密码本.txt\n");
        gets(filenamemi);
        if ((fp=fopen(filenamemi,"w"))==NULL)
        {
            printf("保存文件%s出现错误, 请重新输入\n",filenamemi);
            key = 0;
        }
        key = 1;
    }
    cd = new char[num];
    cd[num-1] = '\0';
    for(i = 1; i <= num; i++)
    {
        start = num-1;
        c = i;
        f = HT[i].parent;
        flag = HT[i].flag;
        while(f != 0)
        {
            --start;
            if(HT[f].lchild == c) cd[start] = '0';
            else cd[start] = '1';
            c = f;
            f = HT[f].parent;
        }

        printf("%c %s\n", flag, &cd[start]);
        fprintf(fp,"%c %s\n", flag, &cd[start]);
    }
    delete cd;
    fclose(fp);
}

bool CreatTxtCode(int num)//创建文本编码
{
    FILE *fp, *fp1, *fp2;
    int key = 0;
    //char filename[100];
    txtNode txt[257];
    char a;
    getchar();
    while(!key)
    {
        printf("请输入你要保存编码的文件名及路径,如c:\\users\\lenovo\\desktop\\7\\1.cod\n");
        gets(filebian);
        if ((fp=fopen(filebian,"w"))==NULL)
        {
            printf("保存文件%s出现错误, 请重新输入\n",filebian);
            key = 0;
        }
        key = 1;
    }
    int i = 0, nu = 1, j;
    fp1 = fopen(filenamemi,"r");
    fp2 = fopen(filefile,"r");

    char interim[1000];
    fgets(interim, 100, fp1);
    while(!feof(fp1))
    {
        txt[nu-1].flag = interim[0];
        i = strlen(interim);
        for(j = 2; j < i-1; j++)
        {
            txt[nu-1].hafuman[j-2] = interim[j];
        }
        fgets(interim, 100, fp1);
        nu++;
    }
    for(i = 0; i <= nu; i++)
    {
        cout<<txt[i].flag<<"  "<<txt[i].hafuman<<endl;
    }
    while((a = fgetc(fp2)) != EOF)
    {
        for(i = 0; i <= nu; i++)
        {
            if(a == txt[i].flag)
            {
                fprintf(fp,"%s",txt[i].hafuman);
            }
        }
    }
    fclose(fp);
    fclose(fp1);
    fclose(fp2);
    return true;
}

bool ReductionTxt(HuffmanTree HT, int num)//创建文本节点
{
    FILE *fp, *fp1;//fp----编码文件    fp1------还原之后的文件
    int key = 0;
    char filename[100],  filename1[100];
    char a;
    getchar();
    if ((fp=fopen(filebian,"r"))==NULL)
    {
        printf("打开文件%s出现错误\n",filebian);
        key = 0;
        return false;
    }
    while(!key)
    {
        printf("请输入你要保存的文件名及路径,如c:\\users\\lenovo\\desktop\\7\\2.txt\n");
        gets(filename1);
        if ((fp1=fopen(filename1,"w"))==NULL)
        {
            printf("打开文件%s出现错误\n",filename1);
            key = 0;
            return false;
        }
        key = 1;
    }

    int kk = 2*num-1;
    while((a = fgetc(fp)) != EOF)
    {
        if(a == '0')
        {
            kk = HT[kk].lchild;
        }
        else
        {
            kk = HT[kk].rchild;
        }

        if( (HT[kk].lchild == 0)  && (HT[kk].rchild == 0) )
        {
            fprintf(fp1,"%c", HT[kk].flag);
            kk = 2*num-1;
        }
    }
    fclose(fp);
    fclose(fp1);
    return true;
}

void zip()//压缩文件
{
    FILE *fp, *fp1;//fp----编码文件    fp1------压缩文件
    int key = 0, in, i;
    char filename[100],  filename1[100];
    char a;
    int twopower[11] = {1,2,4,8,16,32,64,128,256,512,1024};
    getchar();
    if ((fp=fopen(filebian,"r"))==NULL)
    {
        printf("打开文件%s出现错误\n",filebian);
        key = 0;
        return;
    }
    key = 0;
    while(!key)
    {
        printf("请输入保存的文件名及路径,如C:\\users\\lenovo\\desktop\\7\\2.cod\n");
        gets(filename1);
        if ((fp1=fopen(filename1,"w"))==NULL)
        {
            printf("打开文件%s出现错误\n",filename1);
            key = 0;
            return ;
        }
        key = 1;
    }
    //fp1=fopen("C:\\users\\lenovo\\desktop\\7\\2.cod","w");
    in = 0;
    int sum = 0, fla = 2;
    a = fgetc(fp);
    while(!feof(fp))
    {
        sum = sum + int(a-'0')*twopower[7-in];
        //cout<<int(a-'0')<<" "<<twopower[in]<<" "<<sum<<endl;
        in++;
        a = fgetc(fp);
        if(in == 8 || feof(fp))
        {
            in = 0;
            fprintf(fp1, "%d ", sum);
            sum = 0;
        }
    }
    fclose(fp);
    fclose(fp1);
}


int main()
{
    int num;
    HuffmanTree L;
start:
    printf("******************************************************************\n\n");
    printf("哈夫曼编码译码器\n\n");
    printf("*\t1、选择需要进行编码的文件\t\t*\n\n");
    printf("*\t2、建立哈夫曼树\t\t\t\t*\n\n");
    printf("*\t3、建立密码本并对文件编码\t\t*\n\n");
    printf("*\t4、选择需要进行解码的文件并解码\t\t*\n\n");
    printf("*\t5、按位压缩方式对文件进行压缩\t\t*\n\n\n");
    printf("******************************************************************\n\n");
    int option = 0;
    cin>>option;
    while(1)
    {
        switch(option)
        {
        case 1:
            num = Choice();
            break;
        case 2:
            if(CreatHuffmanaTree(L, num))cout<<"成功"<<endl;
            break;
        case 3:
            CreatHuffmanaCode(L, num);
            if(CreatTxtCode(num)) cout<<"成功"<<endl;
            break;
        case 4:
            if(ReductionTxt(L, num)) cout<<"成功"<<endl;
            break;
        case 5:
            zip();
            break;
        }
        goto start;
    }


    //cout<<endl;
    //cout<<endl;

    //releasezip();
    return 0;
}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,657评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,662评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,143评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,732评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,837评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,036评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,126评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,868评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,315评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,641评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,773评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,859评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,584评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,676评论 2 351

推荐阅读更多精彩内容