文档详情

多媒体技术应用普通高等教育“十一五”国家级规划教材教学课件赵士滨 YDMT14.pdf

发布：2015-11-08约4.36千字共21页下载文档

文本预览下载声明

第十四章多媒体识别技术 多媒体识别和机器视觉 文字识别的基本原理 声音识别的基本原理 图像识别的基本原理 生物特征的辨别与验证 常用的多媒体特征识别类型 常用的多媒体特征识别类型  1.指纹识别（fingerprinting ）  2.虹膜识别  3.视网膜识别  4.面部识别  5.手掌几何学识别  6.声音识别  7.签字识别  8.文字识别 几类生物识别特点的比较 几类生物识别特点的比较 特征识别技术的测量因子 特征识别技术的测量因子  1. 拒假率（FRR ）  1. 拒假率（FRR ）在获取一个对像的特征信息进行生物测量时，所得结果与该对像在获取一个对像的特征信息进行生物测量时，所得结果与该对像已经记录在多媒体数据库中的模板不匹配，称为拒假事件。拒假已经记录在多媒体数据库中的模板不匹配，称为拒假事件。拒假事件的发生概率或者实际发生的频率就是拒假率。事件的发生概率或者实际发生的频率就是拒假率。  2. 容假率（FAR ）对一个对象的特征采样取得的数据与多媒体数据库中另外一个非该对象的模板足够相似，以至于匹配，这种误认称为接受假事件，相关的概率叫做容假率FAR 。 多媒体识别技术的1 ：1与1 ：N方法 多媒体识别技术的1 ：1与1 ：N方法  1 ：1技术  1 ：1技术 1 ：1技术可概括为：“是我吗？”1 ：1技术是一个验证过程，是通 1 ：1技术可概括为：“是我吗？”1 ：1技术是一个验证过程，是通过把一个现场采集到的特征与一个已经登记的特征进行一对一的过把一个现场采集到的特征与一个已经登记的特征进行一对一的比对，以确认身份的过程，验证是否是对应的对像。比对，以确认身份的过程，验证是否是对应的对像。  1 ：N技术 1 ：N技术可概括为：“我是谁” 1：N技术是一个辨识过程，是把现场采集到的特征同特征数据库中的特征逐一进行匹配，从中找出与现场特征相匹配的库内数据。这也叫一对多匹配。 几种识别方法的误接受率和安全等级 几种识别方法的误接受率和安全等级 机器视觉的概念和原理 机器视觉的概念和原理机器视觉就是用各种成像系统代替视觉器官作为输入敏感手段，由计算机来代替大脑完成处理和解释。机器视觉的最终研究目标就是使机器能像人那样通过视觉观察和理解世界，具有自主适应环境的能力。机器视觉系统通过图像摄取装置（分CMOS 和 CCD 两种）将被摄取目标转换成图像信号，传送给专用的图像处理系统，根据像素分布和亮度、颜色等信息，转变成数字化信号；图像系统对这些信号进行各种运算来抽取目标的特征，进而根据判别的结果来控制现场的设备动作。 机器视觉系统的构成 机器视觉系统的构成 1.照明 2.镜头 3.相机 4. 图像采集卡 5.视觉处理器 光学字符识别OCR 光学字符识别OCR 光学字符识别OCR （Optical Character Recognition ）技术，是指使用扫描仪或数码相机等电子设备检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程，也是对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。 OCR 的工作原理图像输入：要辨识处理的对像须通过光学仪器，如图像扫描仪、图像输入：要辨识处理的对像须通过光学仪器，如图像扫描仪、传真机或摄影器材，将图像转入计算机。传真机或摄影器材，将图像转入计算机。图像前处理：包含了图像正规化、去除噪声、图像矫正等的图像图像前处理：包含了图像正规化、去除噪声、图像矫正等的图像处理，及图文分析、文字行与字分离的文件前处理。处理，及图文分析、文字行与字分离的文件前处理。 OCR 的工作原理文字特征抽取：是OCR的核心，特征抽取的区分可分为两类，文字特征抽取：是OCR的核心一是统计的特征，如文字区域内的黑、白点数比，当文字区分成好几个区域时，这一个个区域黑、白点数比之联合，就成了空间

显示全部

相似文档

多媒体技术应用 普通高等教育“十一五”国家级规划教材 教学课件 赵士滨 YDMT14.pdf

多媒体技术应用普通高等教育“十一五”国家级规划教材教学课件赵士滨 YDMT14.pdf