文档详情

数据结构哈夫曼编码实验报告.doc

发布:2016-11-05约4.46千字共7页下载文档
文本预览下载声明
实验报告 实验课名称:数据结构实验 实验名称:文件压缩问题 班级学号: 姓名: 时间:2015-6-9 一、问题描述 哈夫曼编码是一种常用的数据压缩技术,对数据文件进行哈夫曼编码可大大缩短文件的传输长度,提高信道利用率及传输效率。要求采用哈夫曼编码原理,统计文本文件中字符出现的词频,以词频作为权值,对文件进行哈夫曼编码以达到压缩文件的目的,再用哈夫曼编码进行译码解压缩。 二、数据结构设计 首先定义一个结构体: struct head { unsigned char b; //记录字符 long count; //权重 int parent,lch,rch; //定义双亲,左孩子,右孩子 char bits[256]; //存放哈夫曼编码的数组 } header[512],tmp; //头部一要定设置至少512个,因为结点最多可达256,所有结点数最多可达511 三、算法设计 输入要压缩的文件读文件并计算字符频率根据字符的频率,利用Huffman编码思想创建Huffman树由创建的Huffman树来决定字符对应的编码,进行文件的压缩解码压缩即根据Huffman树进行译码 设计流程图如图1.1所示。 图1.1 设计流程图 (1)压缩文件 输入一个待压缩的文本文件名称(可带路径)如:D:\lu\lu.txt统计文本文件中各字符的个数作为权值,生成哈夫曼树将文本文件利用哈夫曼树进行编码,生成压缩文件压缩文件名称=文本文件名.COD 如:D:\lu\lu.COD压缩文件内容=哈夫曼树的核心内容+编码序列for(int i=0;i256;i++) { header[i].count=0; //初始化权重 header[i].b=(unsigned char)i; //初始化字符 } ifstream infile(infilename,ios::in|ios::binary); while(infile.peek()!=EOF) { infile.read((char *)temp,sizeof(unsigned char)); //读入一个字符 header[temp].count++; //统计对应结点字符权重 flength++; //统计文件长度 } infile.close(); //关闭文件 for(i=0;i256-1;i++) //对结点进行冒泡排序,权重大的放在上面,编码时效率高 for(int j=0;j256-1-i;j++) if(header[j].countheader[j+1].count) { tmp=header[j]; header[j]=header[j+1]; header[j+1]=tmp; } for(i=0;i256;i++) if(header[i].count==0) break; leafnum=i; //取得哈夫曼树中叶子结点数 pointnum=2*leafnum-1; //取得哈夫曼树中总结点数目 infile.open(infilename,ios::in|ios::binary); //打开待压缩的文件 infile.clear(); infile.seekg(0); ofstream outfile(outfilename,ios::out|ios::binary); //打开压缩后将生成的文件 outfile.write((char *)flength,sizeof(long)); //写入原文件长度 (2)哈夫曼编码 for(i=0;ileafnum;i++) { outfile.write((char *)header[i].b,sizeof(unsigned char)); //写入字符 header[i].count=strlen(header[i].bits); //不再设置其他变量,权值这时已无使用价值,可以用相应结点的权值变量记录长度 outfile.write((char *)header[i].count,sizeof(unsigned char)); //写入长度的ASCII码 if(header[i].count
显示全部
相似文档