多媒体数据压缩讲解.ppt
文本预览下载声明
第三章 多媒体数据压缩 本章提纲 多媒体数据压缩的概念和分类 常用的压缩编码方法 音频压缩标准 图像和视频压缩标准 3.1 多媒体数据压缩的概念和分类 多媒体数据压缩的重要性 数据冗余的类型 数据压缩技术的性能指标 数据压缩方法的分类 3.1.1 多媒体数据压缩的重要性 多媒体数据压缩编码是信息产业的关键技术 多媒体技术最大的难题是海量数据存储 以及电视信息数字化之后的数据传输 数据量是否等于信息量 电视信号 512*512*8*3=6291456=6.3Mb/s 6.3*30fps=188Mb/s 188/8=23.5MB/s 650MB光盘/23.5=27.5s 语音信号 正常人说话频率20Hz-4KHz 采样定律 采样精度8位 4KHz*2*8 =64Kb/s=8KB/s 与电视信号相比 23.5MB/8KB=3000倍 陆地卫星 陆地卫星(Land Sat-3)其水平和垂直分辨率分别为2340和3240,四波段,采样精度7位 2340*3240*4*7=212Mb 按每天30幅计,每天数据量为 212*30=6.36Gb 每年的数据量高达2300Gb 如此巨大的数据量给存储器的传输容量、通信干线的信道传输率以及计算机的运算速度都增加了极大的压力 单纯用扩大存储容量、增加通信干线的信道传输率是不现实的 数据压缩是行之有效的方法 信息量和数据量的关系 I=D-du I:信息量 D:数据量 du:冗余量 3.1.2 数据冗余的类型 冗余:信息存在的各种性质的多余度。 冗余例子 中文广播员一分钟180个汉字,一个汉字2个字节,共360字节 采样一分钟:8k*60*8/8=480kB/分钟 480kB/360B=1000倍冗余 冗余例子 中文百科全书扫描进计算机 200万字*2=4MB B5扫描(182*257mm 300dpi 12pixel/mm) 185*257*12*12*8/8=6.84MB 200万字以1000页计算,数据量6.84GB 图像、视频数据冗余量更大 数据冗余的类型 空间冗余 时间冗余 信息熵冗余 视觉冗余 听觉冗余 结构冗余 知识冗余 1、空间冗余 在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,在数字化图像中表现为冗余 示例 空间冗余 统计上认为其像素的信息存在冗余,这是冗余的一种。图像的冗余信息会产生生理视觉上的多余度,去掉这部分图像数据并不影响视觉上的图像质量,甚至对图像的细节也无多大影响,这说明数据具有可压缩性。 可以在允许保真度的范围内压缩待存储的图像数据,以大大节省存储空间,同时在图像传输时也会大大减少信道的负荷。 2、时间冗余 它反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。 示例 空间冗余和时间冗余是把图像信号看作概率信号时所反映出的统计特性,因此,这两种冗余也被称为统计冗余。 3、信息熵冗余 信息量:从N个相等的可能事件中选出一个事件所需的信息度量和含量 信息熵:指一堆数据所带的信息量,平均信息量就是信息熵(entropy) 例如:从64个数中选出某个数。 可先问是否大于32?从而消除半数的可能 这样只需6次即可选出某个数 每提问一次得到1 bit信息量,在64个数中选中某数所需的信息量是log2 64=6 bit 信息量和事件出现的概率有关,概率越大,信息量越小;概率越小,信息量越大 I(x)=I[P(x)] =loga(1/P(x)) =-logaP(x) 若a=2 则信息量度量单位为bit 若a=e 则信息量度量单位为nit 若a=10,则信息量度量单位为哈特莱 如果将信源所有可能事件的信息量进行平均,就得到了平均信息量。 信息熵 = 平均信息量 信息熵冗余 无失真编码定理: 无失真编码极限 = 信源所含平均信息量(熵) 信源编码时,当分配给第i个码元类的比特数 b(yi)=-logpi,才能使编码后单位数据量等于其信源熵,即达到其压缩极限。 但实际中各码元类的先验概率很难预知,比特分配不能达到最佳。实际单位数据量dH(S),即存在信息冗余熵。 4、视觉冗余 人眼对于图像场的注意是非均匀的,人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为26灰度等级,而一般图像的量化采用的是28灰度等级,即存在着视觉冗余。 5、听觉冗余 人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余 6、结构冗余 数字化图像中的物体表面纹理等结构往往存在着冗余,这种冗余称为结构冗余。当一幅图有很强的结构特性,纹理和影像色调等与物体表面结构有一定的规则时,其结构冗余很大。 例如,草席的纹理很规范
显示全部