数据结构哈夫曼编码实验报告.doc
文本预览下载声明
实验报告
实验课名称:数据结构实验 实验名称:文件压缩问题 班级学号: 姓名: 时间:2015-6-9
一、问题描述
哈夫曼编码是一种常用的数据压缩技术,对数据文件进行哈夫曼编码可大大缩短文件的传输长度,提高信道利用率及传输效率。要求采用哈夫曼编码原理,统计文本文件中字符出现的词频,以词频作为权值,对文件进行哈夫曼编码以达到压缩文件的目的,再用哈夫曼编码进行译码解压缩。
二、数据结构设计
首先定义一个结构体:
struct head
{
unsigned char b; //记录字符
long count; //权重
int parent,lch,rch; //定义双亲,左孩子,右孩子
char bits[256]; //存放哈夫曼编码的数组
}
header[512],tmp; //头部一要定设置至少512个,因为结点最多可达256,所有结点数最多可达511
三、算法设计
输入要压缩的文件读文件并计算字符频率根据字符的频率,利用Huffman编码思想创建Huffman树由创建的Huffman树来决定字符对应的编码,进行文件的压缩解码压缩即根据Huffman树进行译码
设计流程图如图1.1所示。
图1.1 设计流程图
(1)压缩文件
输入一个待压缩的文本文件名称(可带路径)如:D:\lu\lu.txt统计文本文件中各字符的个数作为权值,生成哈夫曼树将文本文件利用哈夫曼树进行编码,生成压缩文件压缩文件名称=文本文件名.COD 如:D:\lu\lu.COD压缩文件内容=哈夫曼树的核心内容+编码序列for(int i=0;i256;i++)
{
header[i].count=0; //初始化权重
header[i].b=(unsigned char)i; //初始化字符
}
ifstream infile(infilename,ios::in|ios::binary);
while(infile.peek()!=EOF)
{
infile.read((char *)temp,sizeof(unsigned char)); //读入一个字符
header[temp].count++; //统计对应结点字符权重
flength++; //统计文件长度
}
infile.close(); //关闭文件
for(i=0;i256-1;i++) //对结点进行冒泡排序,权重大的放在上面,编码时效率高
for(int j=0;j256-1-i;j++)
if(header[j].countheader[j+1].count)
{
tmp=header[j];
header[j]=header[j+1];
header[j+1]=tmp;
}
for(i=0;i256;i++)
if(header[i].count==0) break;
leafnum=i; //取得哈夫曼树中叶子结点数
pointnum=2*leafnum-1; //取得哈夫曼树中总结点数目
infile.open(infilename,ios::in|ios::binary); //打开待压缩的文件
infile.clear();
infile.seekg(0);
ofstream outfile(outfilename,ios::out|ios::binary); //打开压缩后将生成的文件
outfile.write((char *)flength,sizeof(long)); //写入原文件长度
(2)哈夫曼编码
for(i=0;ileafnum;i++)
{
outfile.write((char *)header[i].b,sizeof(unsigned char)); //写入字符
header[i].count=strlen(header[i].bits); //不再设置其他变量,权值这时已无使用价值,可以用相应结点的权值变量记录长度
outfile.write((char *)header[i].count,sizeof(unsigned char)); //写入长度的ASCII码
if(header[i].count
显示全部