数据结构课程设计模——哈夫曼编码译码器.doc
文本预览下载声明
《数据结构》课程设计报告
设计题目
专 业
班 级
姓 名
学 号
完成日期
目 录
1. 问题描述……………………………………………第 2页
2. 系统设计……………………………………………第 2页
3. 数据结构与算法描述………………………………第 5页
4. 测试结果与分析……………………………………第 6页
5. 总 结………………………………………………第10页
6. 参考文献……………………………………………第10页
附录 程序源代码………………………………………第11页
课程设计题目
1. 问题描述
利用哈夫曼编码进行信息通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。但是,这要求在发送端通过一个编码系统对待传数据预先编码,在接收端将传来的数据进行译码(复原)。试为这样的信息传输写一个哈夫曼编/译码系统。
2. 系统设计
2.1 设计目标
一个完整的系统应具有以下功能:
1)I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。输出哈夫曼树,及各字符对应的编码。哈夫曼编码(Huffman Coding)是一种编码方式,以哈夫曼树─即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这种方法是由David.A.Huffman发展起来的。例如,在英文中,e的出现概率很高,而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时,e极有可能用一个位(bit)来表示,而z则可能花去25个位(不是26)。用普通的表示方法时,每个英文字母均占用一个字节(byte),即8个位。二者相比,e使用了一般编码的1/8的长度,z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例图2-3 哈夫曼编/解码器的程序结构图
2.3.1 初始化算法:
程序从文件abc.txt中获取26个英文字母的权值。
2.3.2 编码算法: ?? (1)对输入的一段欲编码的字符串进行统计各个字符出现的次数,并它们转化为权值{w1,w2,……,wN}构成n棵二叉树的集合F={T1,T2,……,Tn}把它们保存到结构体数组HT[n]中,其中{Ti是按它们的ASC码值先后排序。其中每棵二叉树Ti中只有一个带权为Wi的根结点的权值为其左、右子树上根结点的权值之和。 ? (2)在HT[1..i]中选取两棵根结点的权值最小且没有被选过的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为左、右子树上根结点的权值之和。 ? (3)哈夫曼树已经建立后,从叶子到根逆向求每一个字符的哈夫曼编码。 译码算法: ? ? 译码的过程是分解电文中字符串,从根出发,按字符0,或1确定找左孩子或右孩子,直至叶子结点,便求的该子串相应字符并输出接着下一个字符。typedef struct
{ int weight;
int parent,lchild,rchild;
}HTNode,* HuffmanTree; //动态分配数组存储赫夫曼树??
typedef char **HuffmanCode;动态分配数组存储赫夫曼编码表int min(HuffmanTree t,int i) // ---------求赫夫曼编码-------------
3-3 void select(HuffmanTree t,int i,int s1,int s2) //----slect函数----
3-4
void HuffmanCoding(HuffmanTree HT,HuffmanCode HC,int *w,int n)
// w存放n个字符的权值(均0),构造赫夫曼树HT,并求出n个字符的赫夫曼编码HC
3-5 void Initialization() //----------初始化赫夫曼链表--------------
3-6 void InputCode() //---------获取报文并写入文件-------------
3-7 void Enco
显示全部