第二篇 DIP基础.ppt
文本预览下载声明
第二章 DIP基础 人眼视觉基础 图像感知与获取 图像取样和量化 图像文件存储格式 1. BMP格式 JPEG文件格式 JPEG文件格式的特点 静止图像压缩 采用有损编码方式 是一种变换编码 对高频、低频信号区别对待 JPEG文件的标记 用以区分和识别图像数据及其相关信息 每个标记都是由2个字节组成,其前一个字节是固定值0xFF JPEG文件的组织 图像开始SOI(Start of Image)标记 APP0标记(Marker) (3) APPn标记(Markers),其中n=1~15(任选) APPn长度 详细信息 (4) 一个或者多个量化表DQT 量化表长度(quantization table length) 量化表数目(quantization table number) 量化表(quantization table) (6) 一个或者多个霍夫曼表DHT 霍夫曼表的长度(Huffman table length) 类型、AC或者DC(Type, AC or DC) 索引(Index) 位表(bits table) 值表(value table) (7) 扫描开始SOS(Start of Scan) 扫描开始长度(start of scan length) 颜色分量数(number of color components) 每个颜色分量 ID 交流系数表号 (AC table #) 直流系数表号 (DC table #) 压缩图像数据 (Compress image data) (8) 图像结束EOI(End of Image) JPEG编码原理 JPEG文件结构 3. GIF格式 GIF文件结构 4.TIFF文件格式 图像象素间的基本关系 图像信息头(2) 图像信息头(3) 图像信息头结构定义 位图数据 表示每个像素索引亮度或色彩的数据。像素间相对位置保持不变,但像素数据的具体存储试依图像尺寸、像素位数、压缩方式等共同决定。 对于8位灰度图像或256色彩色图像,每个像素占用一个字节。 对于真彩色图像,没有调色板,每个像素数据均为红、绿、篮三色值,每个色值为8位,一个字节,共三个字节。 注意:由于windows系统管理存储器要求以4个字节为单位,因此位图每行像素占用的字节总数必须为4的整数倍。如果不是,必须补0. 调色板(color palette)和图像数据 调色板是关于一种数字图像像素色彩描述技术的形象说法。其实质是一种索引存储结构。 (5) 帧图像开始SOF0(Start of Frame) 信息技术学院 广州中医药大学 人眼视觉要素 图像感知与获取 图像取样和量化 数字图像的基本格式 象素间的基本关系 本章主要介绍几个与数字图像有关的概念、几种基本的图像传感和获取的手段、图像取样和量化的相关概念、图像在计算机中的表现形式(格式)以及图像象素间的最主要关系。 虽然DIP主要是基于数学和概率等学科的理论体系发展起来的,但人的视觉直觉在选择某个DIP技术时扮演了中心的角色,一切DIP处理的效果可能都由人的视觉来衡量,尽管其带有很大的主观性。因此,对人视觉的基本了解应该作为我们课程的前提。 1. 人眼构造及视觉图像 人眼的平均直径近似为20m 虹膜中央开口(瞳孔)的直径在2~8mm之间 视网膜上有两类光接受器:锥状体(cones)和杆状体(rods) 每只眼睛锥状体数在600~700万之间,其主要位于视网膜的中间部分(中央凹,辨认图像细节,锥状视觉也称白昼视觉或亮视觉。 杆状体数约7 500到15 000万个,分布在视网膜表面,感受总体图像,称夜视觉或暗视觉。 中央凹是视网膜上直径约为1.5mm的圆形缺口,可以近似看作1.5×1.5的方形传感器阵列。该区域锥状体的密度大概为150 000/mm2,因此大概共有337 000个元素。根据原始分辨能力计算,一5mm×5mm大小的中等分辨率的电荷耦合器件(charge-coupled device, CCD)大约有这么多敏感元素。 人眼的横截面图 视网膜上杆状体和锥状体的分布曲线 人眼中的图像 焦深:晶状体的中央到视网膜间的距离,大约17mm~14mm,其折射能力最小到最大。 像大小计算:15/100=h/17 2. 亮度适应性和辨别力 在呈现图像处理结果时,人眼区分不同亮度/强度水平的能力是一个要考虑的重要方面。人视觉系统所能适应的的光强度范围是非常宽的,达1010数量级,主观亮度 (subjective brightness)是光强的对数函数。但人的视觉不可能同时在整个范围内工作,其能同时辨别的光强度级范围是很小的(brightness adaptation)。在所观察对象的亮度适应
显示全部