数据挖掘中的聚类算法的综述_应劭霖.pdf
文本预览下载声明
DOI:10.14127/j.cnki.jiangxihuagong.2014.02.110
2014 6
年 月 数据挖掘中的聚类算法的综述 21
数据挖掘中的聚类算法的综述
应劭霖
( )
江西省化学工业学校
: 。
摘 要 聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术 阐述了
, , ,
聚类算法基本原理 总结了聚类算法的研究现状 按照聚类算法的分类 分析比较了三种
,
典型聚类的性能差异和各自存在的优点及问题 并结合应用需求指出了其今后的发展趋
势。
:
关键词 数据挖掘 聚类 聚类算法 分析
1 引言 (5) : 。
聚类结果评估 是指对聚类结果进行评估 评
, 3 : 、
随着信息技术和计算机技术的迅猛发展 人们面 估主要有 种 外部有效性评估 内部有效性评估和相
、 、 , 。
临着越来越多的文本 图像 视频以及音频数据 为帮 关性测试评估
助用户从这些大量数据中分析出其间所蕴涵的有价值 当人们使用数据挖掘工具对数据中的模型和关系
, (Data Mining ,DM ) 。 , ,
的知识 数据挖掘 技术应运而生 进辨识的时候 通常第一个步骤就是聚类 其目的就是
[1]
,
所谓数据挖掘 是指从大量无序的数据中提取隐含 将集中的数人为地划分成若干类 使簇内相似度尽可
、 、 、 , 、 ,
的 有效的 可解的 对决策有潜在价值的知识和规则 能大 簇间相似度尽可小 以揭示这些数据分布的真实
。 。
为用户提供问题求解层的决策支持能力 情况 但任何聚类算法都对数据本身有一定的预先假
[1]
, , ,
聚类算法是一种有效的非监督的机器学习算法 设 根据文献 的理论 如果数据集本身的分布并不符
显示全部