文档详情

编解码和视频处理技术介绍.pptx

发布:2025-04-13约4.31千字共37页下载文档
文本预览下载声明

编解码和视频处理技术介绍焦华龙2010/11/04土豆网

编解码技术1.视音频采集和播放形式2.为什么要压缩及怎样压缩3.主要压缩标准介绍4.编解码的关键技术视频处理技术1.为什么要做视频处理2.视频处理的主要方面介绍Agenda

编解码及视频处理主要流程原始图像数据一般在摄像设备中需要经过ImageSignalProcessor芯片进行坏点修补、白平衡、颜色校正、锐利度、颜色插值、去噪、去抖动等,再编码成某个标准的格式,

视音频采集和播放形式〔1〕视频的采集单CMOS/CCDsensor〔非专业DV或DC〕采集Bayer模式形式,通过插值来得到缺省的像素颜色值;3CCDsensor〔专业DV〕可以直接采集得到每个像素的RGB值,有较好的色彩和清晰度。逐行和隔行扫描采集RGBBayer模式

视音频采集和播放形式〔2〕音频的采集以固定的频率〔比方48KHZ〕采集得到16bit/24bit的数据形式视音频的播放目前主要显示设备〔比方CRT,液晶/等离子显示器或电视机〕根本上都是将视频信息复原成一帧帧的RGB值最终显现出来;音频也都是复原成16bit/24bit的数据播放

为什么要压缩及怎样压缩〔1〕1.原始数据太大导致保存和传输受限一帧标清分辨率〔720x576〕原始视频数据要占用720x576x3=1,244,160BYTES=9,953,280BITS一秒的实时数据就是近250M(9,953,280x25)BITS当前的网络带宽显然无法到达这么高的要求其实硬盘存储空间也不能保存这么大的数据量,即使当前主流的1TB硬盘也只能保存10小时的DVD画质视频原始数据2.视音频有很多信息的冗余,具有进行高比例压缩的潜力

为什么要压缩及怎样压缩〔2〕无损压缩和有损压缩无损压缩主要有:游程编码(行程编码)RLE〔Run-LengthEncoding〕熵编码〔比方变长编码和算术编码〕JPEG/MPEG/H.264主流视频标准根本都有用到算术编码比变长编码效率高10%~15%,计算复杂度也高很多3.字典序压缩LZW算法主要有ZIP压缩,GIF图片等其它还有一些预测加熵编码的混合形式不过一般无损压缩的压缩率只有3倍左右,对于象视频这样的大数据流,纯粹的无损压缩不能满足要求。

为什么要压缩及怎样压缩〔2.1〕1.00000000010101020202-(4)00(3)01(3)022.00-001-1002-1100000000010101020202-00001010101111113.P00=0.4,P01=0.3,P10=0.3[0,0.4)-00,[0.4~0.7)-01,[0.7,1.0)-1000-0.0,00-0.0+0.4x0.0=0.0,00-0.0+0.4^2x0.0=0.0,00-0.0+0.4^3x0.0=0.001-0.0+0.4^4x0.4=1.024x10^(-2),01-1.024x10^(-2)+0.4^4x0.3x0.4=1.3312x10^(-2)01-1.3312x10^(-2)+0.4^4x0.3^2x0.4=1.42336x10^(-2)10-1.42336x10^(-2)+0.4^4x0.3^3x0.7,…;最后产生的那个小数的二进制表示就是压缩码

为什么要压缩及怎样压缩〔2.2〕LZW算法的优点就是可以动态生成字典,并且这个字典的信息已经包含在压缩后的数据流中了,不必再另外储存字典信息了原始数据:ABCCAABCDDAACCDB,ABCD可以用0~3的数来表示。那么注意这个符串中出现了好几个重复的字串:ABCCAABCDDAACCDB那么就可以用4来代表AB,5来代表CC等等,原来的字符串就变为压缩后的数据:45A4CDDAA5DB

为什么要压缩及怎样压缩〔3〕有损压缩主要思想是通过预测去除时空冗余,再用变换将信息集中到少数的几个局部,然后通过量化来精简数据量,最后用无损压缩的方法来压量化的结果。预测有空域预测和时域预测空域预测一般是利用一帧图像内部的信息,在需要预测编码的像素周边寻找相近像素来作为预测来减少数据量〔例如见左图〕;时域预测一般是通过前后几帧的图像信息来预测需要编码的帧,从而到达减少数据量的作用〔例如见右图〕。

为什么要压缩及怎样

显示全部
相似文档