文档详情

一种改进的K_means算法.pdf

发布:2017-05-21约1.1万字共3页下载文档
文本预览下载声明
24 4 ( 29 1) 39 : 1003-5850 ( 2011) 04-00 39-02 K-means - An Improved K means Algorithm 安建成 史德增 ( 太原理工大学 太原 0 30024) K -means 算法以其简单性和快速性在文本聚类中得到广泛应用, 但是传统的K -means 算法对初值的依 性很强, 需要事先给出要生成的簇的数目k, 而这 个参数k 的确定 一般是根据用户的经验知识给出的; 另外, 其初始聚类中心是随机选取的, 这种随机性往往导致聚类结果的不稳定。可以说, 不同的k 值和不同的初始聚类 中心对聚类质量和时间效率造成的影响是很大的。实验对改进K -means 算法的有效性进行了验证, 结果证明, 改 进K -m eans 算法能有效地解决传统K -means 算法的随机性所产生的聚类效果不稳定的问题, 其时间复杂度也有 所降低。 聚类, K 均值聚类算法, 初始质心 : T P 30 1. 6 : A - . , - ABSTRACT K means alg or i hm w i h i s simplici y and r apidi y is w idely u sed in he ex clu s ering Ho w ev er he r adi ional K means algo ri hm w as hig hly dependen on he ini ial value, and i needs o give he par ame er k in advance, w hich is alw ays . , , de ermined by know ledg e andex per ience of user s In addi ion he ini ia l clu s er cen er s o f i are r andomly selec ed hisr ando mness off en led o ins abili y o f clus er ing r esul s . So o speak , he diff er en k v alues anddiff eren ini ial clu s er cen ers had a gr ea impac . , - on clu s ering quali y and ime eff iciency r esul s show ed impr oved K means algo ri hm can solve he pro blem of he ins abili yo f clu s er ing eff ec g enera ed by r ando mness, and i s ime com plex i y w as also decr eased . , - , KEYWORDS clu s ering K means clu s ering algo ri hm ini ial cen r e of mass ( , ) , , , , ,
显示全部
相似文档