文档详情

数据挖掘中的聚类算法的综述_应劭霖.pdf

发布:2021-09-24约2.1万字共4页下载文档
文本预览下载声明
DOI:10.14127/j.cnki.jiangxihuagong.2014.02.110 2014 6 年 月 数据挖掘中的聚类算法的综述 21 数据挖掘中的聚类算法的综述 应劭霖 ( ) 江西省化学工业学校 : 。 摘 要 聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术 阐述了 , , , 聚类算法基本原理 总结了聚类算法的研究现状 按照聚类算法的分类 分析比较了三种 , 典型聚类的性能差异和各自存在的优点及问题 并结合应用需求指出了其今后的发展趋 势。 : 关键词 数据挖掘 聚类 聚类算法 分析 1 引言 (5) : 。 聚类结果评估 是指对聚类结果进行评估 评 , 3 : 、 随着信息技术和计算机技术的迅猛发展 人们面 估主要有 种 外部有效性评估 内部有效性评估和相 、 、 , 。 临着越来越多的文本 图像 视频以及音频数据 为帮 关性测试评估 助用户从这些大量数据中分析出其间所蕴涵的有价值 当人们使用数据挖掘工具对数据中的模型和关系 , (Data Mining ,DM ) 。 , , 的知识 数据挖掘 技术应运而生 进辨识的时候 通常第一个步骤就是聚类 其目的就是 [1] , 所谓数据挖掘 是指从大量无序的数据中提取隐含 将集中的数人为地划分成若干类 使簇内相似度尽可 、 、 、 , 、 , 的 有效的 可解的 对决策有潜在价值的知识和规则 能大 簇间相似度尽可小 以揭示这些数据分布的真实 。 。 为用户提供问题求解层的决策支持能力 情况 但任何聚类算法都对数据本身有一定的预先假 [1] , , , 聚类算法是一种有效的非监督的机器学习算法 设 根据文献 的理论 如果数据集本身的分布并不符
显示全部
相似文档