模式识别 图像.pptx
文本预览下载声明
模 式 识 别——图形图像应 用1、字符与文字识别 光学字符识别(OCR)、 手写体数字、文字识别。2、复杂图像中特定目标的识别 车牌号识别、人脸识别3、地质数据分析4、医学影像实 例PDF中图片转换成文字有道词典摄像头取词网页中验证码自动识别图形与图像分类矢量图与位图彩色图像 灰度图像 二值图像OCR工作原理1、图片的灰度化与二值化 这样做的目的是将图片的每一个象素变成0 或者255,以便以计算。同时,也可以去 除部分噪音。2、降噪与分割在图像的前期处理过程中,可能还会用到其他的处理,如反相,变形等。OCR工作原理若将彩色图像视为多维矩阵,则图像的灰度化就是将多维矩阵降维成一维矩阵,为下一步的降噪等前期处理做准备。案例中车牌文字清晰,是比较理想的状态,然而在实际应用中,文字可能不够清晰,还可能混杂着污渍等。我们把“弄脏”原来图像的点称为噪声或噪点。OCR工作原理A=imread(1.bmp);subplot(2,2,1);imshow(A);B=rgb2gray(A);subplot(2,2,2);imshow(B);Thr=graythresh(B);C=im2bw(B,Thr);subplot(2,2,3);imshow(C);D=~C;subplot(2,2,4);imshow(D);图像灰度化与二值化OCR工作原理图像分割OCR工作原理识别1、提取每一个字符的特征,生成特征矢量或特征矩阵2、分类直观上,我们会有这样一个思路,就是这张待识别的图片,最像样本库中的某张图片,那么我们就将它当作那张图片,将它识别为样本库中那张图片事先指定的字符。计算一个矢量与另一个矢量间的距离。这个距离越短,则认为这两个矢量越相似。OCR工作原理变态情况下的处理(1) 切线距离 (Tangent Distance) 可用于处理字符的各种变形,OCR的核心技术之一。(2) 霍夫变换(Hough Transform) 对噪音极其不敏感,常用于从图片中提取各种形状。 图像识别中最基本的方法之一。(3) 形状上下文(Shape Context) 将特征高维化,对形变不很敏感,对噪音也不很敏感。 新世纪出现的新方法。OCR常用的算法去噪中值滤波 均值滤波 维纳滤波 霍夫变换分类和识别K-Nearest Neighbor(K-NN) Bayes Classifier(贝叶斯算法)Principle Component Analysis(PCA;主元分析)几种算法的效果比较
显示全部