文档详情

数据挖掘中聚类分析综述_张静.pdf

发布:2021-09-22约9.33千字共2页下载文档
文本预览下载声明
DOI:10.14018/j.cnki.cn13-1085/n.2014.15.143 ·226 · 价值工程 数据挖掘中聚类分析综述 Overview of Clustering Analysis in Data Mining 张静 ZHANG Jing (六安职业技术学院信息工程系,六安237000) (Department of Information Engineering ,Luan Vocational Technical College ,Luan 237000 ,China) 摘要: 数据挖掘中的聚类技术是一种非监督分类技术。概述了聚类分析算法中的数据结构和数据类型,分析了聚类分析的意义 及研究现状,比较了几种聚类算法的优点及问题,并结合通信领域的应用指出了K-Means 聚类技术的绝对优势。 Abstract: The clustering technology in data mining is a kind of unsupervised classification techniques. The paper analyses the data structure and data types of clustering analysis algorithm, the significance and resent research of cluster analysis, compares the advantages and disadvantages of several kinds of clustering algorithm, points out the absolute advantages of K-Means clustering technology combined with the application in communication feild. 关键词: 数据挖掘;聚类分析;K-Means 算法 Key words: data mining ;clustering analysis ;K-Means algorithm 中图分类号: 文献标识码: 文章编号: TP274 A 1006-4311 (2014)15-0226-02 0 引言 题,并指出K-Means[2]聚类技术在通信领域的绝对优势。 数据挖掘,也称知识发现数据库(KDD)[1] ,就是从实际 1 聚类的定义 [3] 的大量的、不完全的,含有噪声的数据中去提取出人们事 聚类分析 仅根据在数据中发现的描述对象及其关系 先不知道的、隐含在其中的对人们有用的知识和信息的过 的信息,将数据对象分组。其目标是,组内的对象相互之间 程。数据挖掘经常被企业决策者利用,通过挖掘企业中存 是相关的,而不同组的对象是不相关的,组内相似度越大, 储的大量数据中的潜在的有价值的信息,从而帮助企业经 组间差别度越大,聚内效果就越好。聚类分析技术作为强 营者做出正确的决策,为企业创造更多的利益。聚类技术 大的辅助工具在科学研究、社会服务、市场营销等多个领
显示全部
相似文档