文档详情

图像处理算法及其Python实践 课件 第4-5章 图像分类、图像分割.pptx

发布:2025-04-22约1.71万字共110页下载文档
文本预览下载声明

第4章图像分类

4.1概述4.2图像分类常用数据集介绍4.3图像分类常用方法介绍4.4图像分类实战

4.1概述

4.1概述图像分类的定义:即给定一幅输入图像,通过某种分类算法来判断该图像所属的类别。图像分类的划分方式十分多样,划分依据不同,分类结果就不同。根据图像应用场景的不同,可以将图像分类任务为:对象分类、场景分类、事件分类和情感分类。传统与深度学习图像分类方法对比:传统方法按流程处理,性能依赖特征提取和分类器选择,人工选取特征虽有普适性但针对性不强且面对复杂场景难度大,常用分类器对复杂图像分类精度低;深度学习是新兴算法,无需人工提取特征,能自主从训练样本中学习更高维、抽象特征,解决了人工提取特征和分类器选择难题。

4.1概述 图像分类处理为什么出现?人类日常生活中图像承载超80%的信息量,随着互联网发展图像和视频数量大增,对其准确归类管理很重要,早期人工标注图像分类效率低、耗费大,于是图像分类处理技术应运而生。应用场景:它利用相关技术模拟人类视觉与认知能力来判别分类图像,该技术在诸多领域应用广泛,包括百度识图、生物特征识别、安全预防、医学影像检测等。

4.1概述图像分类的主要流程:主要流程含图像预处理(滤波、尺寸归一化等)、特征描述与提取(颜色、形状等)、分类器设计(选择合适的算法、判断图像类别)。传统方法性能依赖特征提取与分类器选择,存在一定局限,而深度学习作为新兴算法,可自主学习特征,解决了传统方法面临的部分难题。图像预处理特征描述与提取分类器设计

4.1概述图像分类处理-图像预处理:包括图像滤波(例如中值滤波、均值滤波、高斯滤波等)和尺寸的归一化等操作;其主要作用是过滤图像中的一些无关信息,在简化数据的前提下最大限度地保留有用信息,增强特征提取的可靠性。

4.1概述图像分类处理-特征提取:图像分类任务中最为关键的一部分,其将输入图像按照一定的规则变换生成另一种具有某些特性的特征表示,新的特征往往具有低维度、低冗余、低噪声、结构化等优点。从而降低了对分类器复杂度的要求,提高了模型性能。通过训练分类器对提取的特征进行分类,从而实现图像的分类。

4.1概述图像分类处理-分类器:主要包括K-近邻(KNN)、支持向量机(SVM)、决策树、逻辑回归、人工神经网络等方法,对于一些简单图像分类任务,这些分类器实现简单,效果良好,但对于一些类别之间差异细微、图像干扰严重等问题,其分类精度大打折扣,即传统分类器非常不适合复杂图像的分类。

4.2图像分类常用数据库

4.2图像分类常用数据集介绍常用的图像分类数据集:MNIST:70000张28像素x28像素的手写数字图像,共10个类别。Fashion-MNIST:70000张28像素x28像素的时尚服装图像,共10个类别。CIFAR-10:60000张32像素x32像素的彩色图像,由飞机、马、狗等十个类别。CIFAR-100:60000张32像素x32像素的彩色图像,共100个类别。ImageNet:1400万张图像,涵盖2万多个类别。 从1-5数据集在数据体量上及复杂程度上依次递增。

4.3图像分类的常用方法介绍

4.3图像分类常用方法介绍4.3.1决策树4.3.2K—邻近算法4.3.3逻辑回归4.3.4基于卷积神经网络的图像分类

4.3.1决策树决策树的原理:决策树:决策树是通过一系列规则对数据进行分类的过程。基于一定的判别条件,确定某一样东西属于一类还是另一类。实际上,样本所有特征中有一些特征在分类时起到决定性作用,决策树的构造本质是找出样本特征中起决定性作用的部分,依其决定性程度构建倒立的“树”,以决定性作用最大的特征为根节点,递归找出各分支下子数据集的决定性特征,直至子数据集中数据都属同一类,该过程实际是按数据特征对数据集分类的递归过程。决策树的构建过程可以分为:特征选择决策树生成剪枝

4.3.1决策树基于信息论的三种决策树算法:划分数据集的最大原则是:使无序的数据变的有序。 如果一个训练数据中有20个特征,那么选取哪个做划分依据?这就必须采用量化的方法来判断,量化其中一项就是“信息论度量信息分类”。基于信息论的决策树算法有ID3、CART和C4.5等算法,其中C4.5和CART两种算法从ID3算法中衍生而来。

4.3.1决策树基于信息论的决策树三种算法:ID3算法:由RossQuinlan发明,基于“奥卡姆剃刀”原则,通过信息增益选择特征,适用于标称型数据集,无内置剪枝过程,缺点是偏向取值较多的属性且无法处理连续数据。C4.5算法:是ID3的改进算法,用信息增益率选择属性,解决了信息增益偏向问题,可处理连续数据、不完整数据并剪枝提高性能,分类规则易理解但效率低且只适用于内存中的数据集。

显示全部
相似文档