多媒体技术应用 普通高等教育“十一五”国家级规划教材 教学课件 赵士滨 YDMT14.pdf
文本预览下载声明
第十四章
多媒体识别技术
多媒体识别和机器视觉
文字识别的基本原理
声音识别的基本原理
图像识别的基本原理
生物特征的辨别与验证
常用的多媒体特征识别类型
常用的多媒体特征识别类型
1.指纹识别(fingerprinting )
2.虹膜识别
3.视网膜识别
4.面部识别
5.手掌几何学识别
6.声音识别
7.签字识别
8.文字识别
几类生物识别特点的比较
几类生物识别特点的比较
特征识别技术的测量因子
特征识别技术的测量因子
1. 拒假率(FRR )
1. 拒假率(FRR )
在获取一个对像的特征信息进行生物测量时,所得结果与该对像
在获取一个对像的特征信息进行生物测量时,所得结果与该对像
已经记录在多媒体数据库中的模板不匹配,称为拒假事件。拒假
已经记录在多媒体数据库中的模板不匹配,称为拒假事件。拒假
事件的发生概率或者实际发生的频率就是拒假率。
事件的发生概率或者实际发生的频率就是拒假率。
2. 容假率(FAR )
对一个对象的特征采样取得的数据与多媒体数据库中另外一个非
该对象的模板足够相似,以至于匹配,这种误认称为接受假事件
,相关的概率叫做容假率FAR 。
多媒体识别技术的1 :1与1 :N方法
多媒体识别技术的1 :1与1 :N方法
1 :1技术
1 :1技术
1 :1技术可概括为:“是我吗?”1 :1技术是一个验证过程,是通
1 :1技术可概括为:“是我吗?”1 :1技术是一个验证过程,是通
过把一个现场采集到的特征与一个已经登记的特征进行一对一的
过把一个现场采集到的特征与一个已经登记的特征进行一对一的
比对,以确认身份的过程,验证是否是对应的对像。
比对,以确认身份的过程,验证是否是对应的对像。
1 :N技术
1 :N技术可概括为:“我是谁” 1:N技术是一个辨识过程,是把现
场采集到的特征同特征数据库中的特征逐一进行匹配,从中找出
与现场特征相匹配的库内数据。这也叫一对多匹配。
几种识别方法的误接受率和安全等级
几种识别方法的误接受率和安全等级
机器视觉的概念和原理
机器视觉的概念和原理
机器视觉就是用各种成像系统代替视觉器官作为输入敏感手段,
由计算机来代替大脑完成处理和解释。机器视觉的最终研究目标
就是使机器能像人那样通过视觉观察和理解世界,具有自主适应
环境的能力。
机器视觉系统通过图像摄取装置(分CMOS 和 CCD 两种)将被
摄取目标转换成图像信号,传送给专用的图像处理系统,根据像
素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这
些信号进行各种运算来抽取目标的特征,进而根据判别的结果来
控制现场的设备动作。
机器视觉系统的构成
机器视觉系统的构成
1.照明
2.镜头
3.相机
4. 图像采集卡
5.视觉处理器
光学字符识别OCR
光学字符识别OCR
光学字符识别OCR (Optical Character Recognition )技术,是
指使用扫描仪或数码相机等电子设备检查纸上打印的字符,通过
检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译
成计算机文字的过程,也是对文本资料进行扫描,然后对图像文
件进行分析处理,获取文字及版面信息的过程。
OCR 的工作原理
图像输入:要辨识处理的对像须通过光学仪器,如图像扫描仪、
图像输入:要辨识处理的对像须通过光学仪器,如图像扫描仪、
传真机或摄影器材,将图像转入计算机。
传真机或摄影器材,将图像转入计算机。
图像前处理:包含了图像正规化、去除噪声、图像矫正等的图像
图像前处理:包含了图像正规化、去除噪声、图像矫正等的图像
处理,及图文分析、文字行与字分离的文件前处理。
处理,及图文分析、文字行与字分离的文件前处理。
OCR 的工作原理
文字特征抽取:是OCR的核心,特征抽取的区分可分为两类,
文字特征抽取:是OCR的核心
一是统计的特征,如文字区域内的黑、白点数比,当文字区分成
好几个区域时,这一个个区域黑、白点数比之联合,就成了空间
显示全部