基于聚类分析的 K-means 算法研究及应用.pdf
文本预览下载声明
第 24 卷第 5 期 计 算 机 应 用 研 究 Vol. 24, No. 5
2007 年 5 月 Application Research of Computers May 2007
基于聚类分析的 K-means 算法研究及应用*
1 2
张建萍 , 刘希玉
( 1. 山东师范大学 信息科学与工程学院, 山东 济南 250014; 2. 山东师范大学 管理学院, 山东 济南 250014)
摘 要: 通过对聚类分析及其算法的论述, 从多个方面对这些算法性能进行比较, 同时以儿童生长发育时期的
数据为例通过聚类分析的软件和改进的 K-means 算法来进一步阐述聚类分析在数据挖掘中的实践应用。
关键词: 数据挖掘; 聚类分析 ; 数据库; 聚类算法
中图分类号: TP311 文献标志码: A 文章编号: 1001- 3695( 2007) 05- 0166- 03
Application in Cluster’s Analysis Is Analyzed in Children Development Period
1 2
ZHANG Jian-ping , LIU Xi-yu
( 1. College of Information Science Engineering, Shandong Normal University, Jinan Shandong 250014, China; 2. College of Management,
Shandong Normal University, Jinan Shandong 250014, China)
Abstract: This paper passed cluster’s analysis and its algorithm correctly, compared these algorithm performances from a lot
of respects, and explained that cluster analysis excavates the practice application of in datum further to come through software
and improved K-means algorithm, cluster of analysis at the same time practise application.
Key words: data mining; cluster analysis; database; cluster algorithm
随着计算机硬件和软件技术的飞速发展, 尤其是数据库技
术的普及, 人们面临着日益扩张的数据海洋, 原来的数据分析 2 聚类算法分析
工具已无法有效地为决策者提供决策支持所需要的相关知识, [ 6]
聚类 分析是直接比较各事物之间的性质, 将性质相近
从而形成一种独特的现象“丰富的数据, 贫乏的知识”。数据
的归为一类, 将性质差别较大的归入不同的类。在医学实践中
挖掘[ 1] 又称为数据库中知识发现 ( Knowledge Discovery from
也经常需要做分类工作, 如根据病人的一系列症状、体征和生
Database,
显示全部