文档详情

数据结构实验三题目二哈夫曼树.docx

发布:2016-11-05约3.84千字共6页下载文档
文本预览下载声明
2008级数据结构实验报告实验名称: 实验三 树学生姓名: 班 级: 班内序号: 学 号: 日 期: 20013年11月26日1.实验要求实验目的通过选择下面两个题目之一进行实现,掌握如下内容:掌握二叉树基本操作的实现方法了解赫夫曼树的思想和相关概念学习使用二叉树解决实际问题的能力实验内容利用二叉树结构实现赫夫曼编/解码器。基本要求:初始化(Init):能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立赫夫曼树建立编码表(CreateTable):利用已经建好的赫夫曼树进行编码,并将每个字符的编码输出。编码(Encoding):根据编码表对输入的字符串进行编码,并将编码后的字符串输出。译码(Decoding):利用已经建好的赫夫曼树对编码后的字符串进行译码,并输出译码结果。打印(Print):以直观的方式打印赫夫曼树(选作)计算输入的字符串编码前和编码后的长度,并进行分析,讨论赫夫曼编码的压缩效果。2. 程序分析哈夫曼树结点的储存结构除了二叉树所有的双亲域parents,左子树域lchild,右子树域rchild。还需要有字符域word,权重域weight,编码域code。其中由于编码是一串由0和1组成的字符串,所以code是一个字符数组。进行哈夫曼编码首先要对用户输入的信息进行统计,将每个字符作为哈夫曼树的叶子结点。统计每个字符出现的次数(频度)作为叶子的权重,统计次数可以根据每个字符不同的ASCII码。并根据叶子结点的权重建立一个哈夫曼树。建立每个叶子的编码从根结点开始,规定通往左子树路径记为0,通往右子树路径记为1.由于编码要求从根结点开始,所以需要前序遍历哈夫曼树,故编码过程是以前序遍历二叉树为基础的。同时注意递归函数中能否直接对结点的编码域进行操作。编码信息只要遍历字符串中每个字符,从哈夫曼树中找到相应的叶子结点,取得相应的编码。最后再将所有找到的编码连接起来即可。译码则是将编码串从左到右诸位判别,直到确定一个字符。这可以用生成哈夫曼树的逆过程实现。由于每个字符的编码各不相同,且编码也是个字符串,所以只要遍历编码串,从哈夫曼树中找到相应的叶子结点,取得相应的字符再将找到的字符连接起来即可。2.1 存储结构哈夫曼树结点储存结构wordweightparentLChildRChild哈夫曼树顺序存储结构wordweightlchildparentsrchild0A35-13-11B25-13-12C15-14-13\0400414\0753-122.2 关键算法分析1、统计字符的频度自然语言描述:取出字符串中的一个字符遍历所有初始化的哈夫曼树结点如果结点中有记录代表的字符且字符等于取出的字符,说明该字符的叶子存在,则将该结点的权加一。如果所有结点均没有记录字符与取出字符一致,说明该字符的叶子不存在,则将结点的字符记为取出字符,并将权重设为1.重复(1)(2)(3)(4)步骤,如此遍历字符串中的所有字符。伪代码:1.for(int i=0;i字符长度;i++)1.1for (int j=0;j字符长度;j++)1.1.1 if (WordStr[i]==HuffTree[j].word)1.1.1.1权重++1.1.1.2 break;1.1.2否则取字符域为空的结点1.1.2.1 HuffTree[j].word=WordStr[i];1.1.2.2 HuffTree[j].weight=1;1.1.2.3 叶子数++;1.1.2.4 break;结束时间复杂度O(n2),空间复杂度S(0)2、构造哈夫曼树自然语言描述:将n个权值的叶子结点存放到数组huffTree的前n个分量中通过统计字符频度的算法给n个结点赋权值将数组huffTree中出叶子结点外的结点初始化:左右子树、双亲域为-1;权值为0;字符编号域为\0。不断将两棵子树合并为一棵子树,并将新子树的根节点顺序存放到数组huffTree的前n个分量的后面。伪代码描述:1.数组huffTree初始化,除叶子节点外,所有元素结点左右子树、双亲域为-1;权值为0;字符编号域为\0。2.进行n-1次合并2.1在二叉树集合中选取两个权值最小的根结点,其下标分别即为j1和j22.2将二叉树j1和j2合并为一棵新的二叉树结点k时间复杂度O(n),空间复杂度S(2)3、为每个叶子结点编码自然语言描述:初始化一个字符数组Code暂存每个叶子结点的编码。从叶子结点开始,如果是哈夫曼树的左孩子,则将编码表中的code值赋为0,否则为1将指针层层上移,重复2)直到根结点将所得编码逆置,并将编码最后一位赋为’\0’进行下一叶子结点的编码算法时间复杂度O(n2),空间复杂度S(60)4、为信息编码自然语言描述:定义字符串str1储存编码遍历信息字符串中的每一个字符对每一个字符
显示全部
相似文档