文档详情

数据挖掘中聚类算法的应用设计.doc

发布:2017-02-01约1.34万字共25页下载文档
文本预览下载声明
吉林电子信息职业技术学院 毕业论文(设计) 题 目:数据挖掘中聚类算法的应用设计 系 部: 机电技术学院 专业班级: 12级机电17班 指导教师: 高岩 姓 名: 王增亮 摘 要 聚类分析是数据挖掘中的一个主要研究方向,目前已经深入到各个领域并取得了很好的进步。本文将从数据挖掘入手,详细探讨聚类算法在数据挖掘的发展过程中所起的作用,并对聚类算法在各个时期的理论和应用作相应分析。最后,我们将对聚类的K-Means算法进行实例操作,分析聚类算法存在的问题和一些解决方案。希望能总结对过去成果并对今后发展方向起到引导作用。 关键词: 信息;数据挖掘;聚类分析;K-Means算法 Abstract The analyse of clustering is a major part in the data mining,which have already been applied into several domains and earned a large advancement . In the paper ,we will give a detailed discuss with the function of clustering algorithm acted on the developing of data mining , starting with the introduction of data mining , and give a analysis on the theoretics and appiciation of the cluster algorithm in different phases. At last, we will validate the K-Means algorihm of clusering , analyse the problem existed in the algorithm and give some methods to reslove them through a given example . These maybe summarize the achievement and channel off the developing of data mining. KeyWords: Information; Data Mining; The Analyse of Clustering; The algorithm 目 录 摘 要 I Abstract II 目 录 III 引 言 1 第1章 聚类分析基本概念与算法 2 1.1 聚类分析 2 1.2 常见数据类型和距离公式 2 1.3 聚类的一般步骤 4 1.4 划分聚类 4 1.5 层次聚类 5 第2章 新发展的聚类算法 7 2.1 基于模糊的聚类方法 7 2.2 量子聚类 8 2.3 核聚类 8 2.4 谱聚类 9 第3章 程序调试 10 3.1 原理描述 10 3.2 数据的引入和处理 11 3.3 实验操作过程 13 结束语 20 参考文献 21 引 言 当我们步入二十一世纪时,信息产业在全世界范围内以信息的几何增长的速率快速发展起来。对各个领域和企业部门来说,增强对数据中信息价值的利用可以引导其在激烈的竞争环境中快速发展并力求胜出。在推行电子政务的今天,政府部门的数据也在进行数字化。科研机构更是收集了大量的科学研究数据,试图从中发现自然界和社会及经济运转的秘密。这些都是我们解读数字信息所需面临的一些新的挑战。比如,根据对客户销售关系的研究,我们可以知道,一个好的行为描述经常也是对行为本身的一种解释,至少提示从哪里寻找解释。这种解释通常来自我们对业务范围内的相关销售份额及客户和市场信息,所以要求我们通过不同模式进行“创意”分析,寻找利润的最大支撑点。 信息是由数据所表达的客观事实,而知识是信息经过智能性加工过后的产物。目前虽然能实现高效的数据录入、查询、统计、输出和积累等功能,但是却随之出现一个问题,大量的数据相对降低了人们分析数据的能力,使发现大数据集中数据间关联规则更加困难,从而对根据数据预测趋势的能力得不到保障。出现了“数据丰富而信息贫乏”的现象。数据挖掘的目的就是帮助决策者寻找数据间潜在的知识,对决策者在现
显示全部
相似文档