文档详情

信息检索与web搜索课件 07学习资料.pptx

发布:2025-05-06约小于1千字共30页下载文档
文本预览下载声明

信息检索与Web搜索;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;词项频率tf也存入倒排索引中;面向VSM的倒排索引;24;25;26;课后作业;

130的VB码生成:

130的二进制码先取后七位(mod128就相当于取一个数对应二进制的后七位)有0000010,并将原数右移7位(div128),剩下的是1

则现在的结果开头补零到8位)

再取后七位为0000001,此时剩下的为0

将之加入到结果前面(伪代码第3行的prepend是将数字添加到数组最前面的函数)

则此时结果00000010,

将最后一个字节的最高位置为1(+128),

最终结果10000010。

?;?

130的VB码解码:

从第一字节开始,

若当前字节大于等于128,说明最高位为1,则为结尾字节

对10000010,

第一字节的十进制是1,第二个字节为130

开始前置结果为0,

先从第一个开始,其小于128

则将之与结果乘以128(左移7位)相加,现在的结果为0*128+1=1,

第二个大于128,为结尾字节,

将其减去128(去掉最高位的1),并将原来的结果乘以128(左移7位)并与其相加,

为1*128+(130–128)=130

?;?

130的Y编码生成:

而对于γ编码,其偏移应为0000010(去掉最前边的1),

偏移长度为7,对应一元编码

所以结果0000010

?

解码先通过之前一元码得到其偏移的长度为7,读出其偏移为0000010,最高位加上一个1,

得到结转换为十进制为130

显示全部
相似文档