信息检索与web搜索课件 07学习资料.pptx
信息检索与Web搜索;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;21;词项频率tf也存入倒排索引中;面向VSM的倒排索引;24;25;26;课后作业;
130的VB码生成:
130的二进制码先取后七位(mod128就相当于取一个数对应二进制的后七位)有0000010,并将原数右移7位(div128),剩下的是1
则现在的结果开头补零到8位)
再取后七位为0000001,此时剩下的为0
将之加入到结果前面(伪代码第3行的prepend是将数字添加到数组最前面的函数)
则此时结果00000010,
将最后一个字节的最高位置为1(+128),
最终结果10000010。
?;?
130的VB码解码:
从第一字节开始,
若当前字节大于等于128,说明最高位为1,则为结尾字节
对10000010,
第一字节的十进制是1,第二个字节为130
开始前置结果为0,
先从第一个开始,其小于128
则将之与结果乘以128(左移7位)相加,现在的结果为0*128+1=1,
第二个大于128,为结尾字节,
将其减去128(去掉最高位的1),并将原来的结果乘以128(左移7位)并与其相加,
为1*128+(130–128)=130
?;?
130的Y编码生成:
而对于γ编码,其偏移应为0000010(去掉最前边的1),
偏移长度为7,对应一元编码
所以结果0000010
?
解码先通过之前一元码得到其偏移的长度为7,读出其偏移为0000010,最高位加上一个1,
得到结转换为十进制为130