文档详情

多媒体技术应用 普通高等教育“十一五”国家级规划教材 教学课件 赵士滨 YDMT14.pdf

发布:2015-11-08约4.36千字共21页下载文档
文本预览下载声明
第十四章 多媒体识别技术 多媒体识别和机器视觉 文字识别的基本原理 声音识别的基本原理 图像识别的基本原理 生物特征的辨别与验证 常用的多媒体特征识别类型 常用的多媒体特征识别类型  1.指纹识别(fingerprinting )  2.虹膜识别  3.视网膜识别  4.面部识别  5.手掌几何学识别  6.声音识别  7.签字识别  8.文字识别 几类生物识别特点的比较 几类生物识别特点的比较 特征识别技术的测量因子 特征识别技术的测量因子  1. 拒假率(FRR )  1. 拒假率(FRR ) 在获取一个对像的特征信息进行生物测量时,所得结果与该对像 在获取一个对像的特征信息进行生物测量时,所得结果与该对像 已经记录在多媒体数据库中的模板不匹配,称为拒假事件。拒假 已经记录在多媒体数据库中的模板不匹配,称为拒假事件。拒假 事件的发生概率或者实际发生的频率就是拒假率。 事件的发生概率或者实际发生的频率就是拒假率。  2. 容假率(FAR ) 对一个对象的特征采样取得的数据与多媒体数据库中另外一个非 该对象的模板足够相似,以至于匹配,这种误认称为接受假事件 ,相关的概率叫做容假率FAR 。 多媒体识别技术的1 :1与1 :N方法 多媒体识别技术的1 :1与1 :N方法  1 :1技术  1 :1技术 1 :1技术可概括为:“是我吗?”1 :1技术是一个验证过程,是通 1 :1技术可概括为:“是我吗?”1 :1技术是一个验证过程,是通 过把一个现场采集到的特征与一个已经登记的特征进行一对一的 过把一个现场采集到的特征与一个已经登记的特征进行一对一的 比对,以确认身份的过程,验证是否是对应的对像。 比对,以确认身份的过程,验证是否是对应的对像。  1 :N技术 1 :N技术可概括为:“我是谁” 1:N技术是一个辨识过程,是把现 场采集到的特征同特征数据库中的特征逐一进行匹配,从中找出 与现场特征相匹配的库内数据。这也叫一对多匹配。 几种识别方法的误接受率和安全等级 几种识别方法的误接受率和安全等级 机器视觉的概念和原理 机器视觉的概念和原理 机器视觉就是用各种成像系统代替视觉器官作为输入敏感手段, 由计算机来代替大脑完成处理和解释。机器视觉的最终研究目标 就是使机器能像人那样通过视觉观察和理解世界,具有自主适应 环境的能力。 机器视觉系统通过图像摄取装置(分CMOS 和 CCD 两种)将被 摄取目标转换成图像信号,传送给专用的图像处理系统,根据像 素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这 些信号进行各种运算来抽取目标的特征,进而根据判别的结果来 控制现场的设备动作。 机器视觉系统的构成 机器视觉系统的构成 1.照明 2.镜头 3.相机 4. 图像采集卡 5.视觉处理器 光学字符识别OCR 光学字符识别OCR 光学字符识别OCR (Optical Character Recognition )技术,是 指使用扫描仪或数码相机等电子设备检查纸上打印的字符,通过 检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译 成计算机文字的过程,也是对文本资料进行扫描,然后对图像文 件进行分析处理,获取文字及版面信息的过程。 OCR 的工作原理 图像输入:要辨识处理的对像须通过光学仪器,如图像扫描仪、 图像输入:要辨识处理的对像须通过光学仪器,如图像扫描仪、 传真机或摄影器材,将图像转入计算机。 传真机或摄影器材,将图像转入计算机。 图像前处理:包含了图像正规化、去除噪声、图像矫正等的图像 图像前处理:包含了图像正规化、去除噪声、图像矫正等的图像 处理,及图文分析、文字行与字分离的文件前处理。 处理,及图文分析、文字行与字分离的文件前处理。 OCR 的工作原理 文字特征抽取:是OCR的核心,特征抽取的区分可分为两类, 文字特征抽取:是OCR的核心 一是统计的特征,如文字区域内的黑、白点数比,当文字区分成 好几个区域时,这一个个区域黑、白点数比之联合,就成了空间
显示全部
相似文档