文档详情

《模糊聚类-模糊聚类》课件.ppt

发布:2018-11-24约9.55千字共49页下载文档
文本预览下载声明
§3.4 基于模糊等价矩阵的模糊聚类分析 设被分类对象的集合为 U={u1,u2, …, un}, 每一个对象ui有m个特性指标(即反映对象特征的主要指标),并记 ui =(ui1,ui2, …, uim), i =1,2,…,n 其中uij表示第i个对象的第j个特性指标,则n个对象的所有特性指标构成一个矩阵,记作 称U*为U的特性指标矩阵. * 目 录 * 目 录 指标1 指标2 ? 指标m 对象1 对象2 ? 对象n 3.4.1 数据规格化 常用的数据规格化方法有如下几种: 1. 数据标准化 (i) 对特性指标矩阵U*的第j列,计算 (ii) 作变换 则以u?ij作为元素的特性指标矩阵就是数据规格化的特性指标矩阵,记作U* =(u?ij)n×m * 目 录 * 2. 均值规格化 (i) 对U*的第j列,计算 (ii) 作变换 则U* =(u?ij)n×m为规格化后的特性指标矩阵. 还有中心规格化、最大规格化、极差规格化、对数规格化等, 这些方法参见教材. 3.4.2 构造模糊相似矩阵 设数据u?ij (i =1,2,…,n; j =1,2,…,m)均已规格化,下面用多元分析的方法来确定对象ui=(u?i1, u?i2,…, u?im)和uj =(u?j1, u?j2,…, u?jm)之间的相似程度 rij =R (ui, uj)?[0,1], (i =1,2,…,n; j =1,2,…,m) 从而构造出一个对象与对象之间的模糊相似矩阵 * 目 录 * 下面介绍几种确定的常用方法. 1. 相似系数法 相似系数法包括:数量积法、夹角余弦法、相关系数法、指数相似系数法、非参数相似程度法等等,例如, (2) 夹角余弦法 (3) 相关系数法 2.距离法 设d(ui, uj)表示对象ui和uj的距离, 则d(ui, uj)越大, rij就越小, 而d(ui, uj)越小, rij就越大。 一般地, 可取 rij=1-c(d(ui, uj))? 其中c和?是两个适当选取的正数,使rij∈[0,1]。 在实际应用中, 常采用如下距离来确定rij * 目 录 * 3. 贴近度法 当对象ui=(ui1, ui2,…, uim)为模糊向量(即uik∈[0,1])时, ui与uj的相似程度rij可由如下方法确定 (1) 最大最小法 (2) 算术平均最小法 (3) 几何平均最小法 * 目 录 * 4.主观评定法 在一些实际问题中, 被分类对象的特性指标是定性指标, 这是可请有关专家和有实际经验的人员用评分的办法来主观评定被分类对象间的相似程度。 3.4.3 模糊分类 下面我们介绍四种常用的模糊分类方法. 1. 模糊传递闭包法 (1) 利用平方自合成方法求 (2) 对t(R)中的元素从大到小进行排序,设为 1=?1 ?2 ? ?m * (3) 对?= ?i (i =1,2,…,m),求出t(R)的?-截矩阵 然后按t(R)?进行分类, 所得到的分类就是在?水平上的等价分类,具体聚类原则为: 若 , 则在?水平上将对象ui和对象uj归为同一类. (4) 画动态聚类图 为了能直观地看到被分类对象之间的相关程度,通常将t(R)中所有互不相同的元素?= ?i (i =1,2,…,m)水平上的等价分类画在同一个图上, 即得动态聚类图. 目 录 * 例3.4.1 考虑某环保部门对该地区五个环境区域U={u1,u2, u3,u4, u5 }, 按污染情况进行分类, 设每个区域包含空气、水分、土壤、作物四个要素, 环境区域的污染情况有污染物在四个要素中的含量超过的程度来衡量。设这五个环境区域的污染数据为 u1 =(80,10,6,2), u2 =(50,1,6,4), u3 =(90,6,4,5), u4 =(40,5,7,3), u5 =(10,1,2,4) 试用模糊传递闭包法对U进行分类。 解: 由题设知特性指标为污染物在空气、水分、土壤、作物这四个要素中的含量.其特性指标矩阵为 (1) 数据规格化 采用最大值规格化, 作变换 把U*规格化为 * 目 录 * (2) 构造模糊相似矩阵R=(rij)5×5 采用最大最小法,即 确定模糊相似矩阵为 (3) 利用平方合成法求t(R) 因为 而R8 = R4
显示全部
相似文档