文档详情

《基于逐步判别分析的数据挖掘研究》-毕业论文(设计).doc

发布:2018-11-28约5.16万字共52页下载文档
文本预览下载声明
基于逐步判别分析的数据挖掘研究 摘 要 随着网络、计算机技术,特别是数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。而这些数据很多是无用的,如何从巨大的数据中提取有用的信息,数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动扮演着越来越重要的角色。数据挖掘技术将人们认识和利用数据的三个阶段数据、信息、和知识有机的结合在一起。数据挖掘是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的过程。 运用逐步判别分析原理,在多个评价因子中按其对数据挖掘判别能力贡献的大小进行筛选,从而确定主要的评价因子。应用改进的层次分析法对筛选后的评价因子进行赋权,使求得的判断矩阵满足一致性要求,避免了层次分析法后期检验过程中多次调整判断矩阵带来的过于主观性的问题。在评价因子的筛选和赋权的基础上进行了实例验证,结果表明,运用逐步判别分析法筛选后的评价因子客观、准确地反映了其影响因素,与传统方法所得结果相比更符合实际情况,可靠性更强。本题目应完成以下工作:理清逐步判别分析方法的数学原理,并在明晰该方法数学原理的基础上,编制出逐步判别分析方法的计算程序。 Abstract With the internet, computer technology ,especially database technology’s rapid development and the extensive application of database management systems. We have accumulated more and more data. While most of them is useless and how to get useful information from the abundant database is more important .As a new emergence of many and across subject field ,Data Mining is act as a more and more important role in support activities of different industry. The technology of data mining make the three phases of data(data, information, knowledge)together. Data Mining is such a process that getting the valuable, original, potential useful information from the broad database. 第一章 文献综述 1.1数据挖掘发展简述 1.1.1数据丰富与知识匮乏 计算机与信息技术经历了半个世纪的发展,给人类社会带来了巨大的变化与影响。在支配人类社会三大要素(能源、材料和信息)中,信息愈来愈显示出其重要性和支配力,它将人类社会由工业化时代推向信息化时代。 随着人类活动范围的扩展,生活节奏的加快,以及技术的进步,人们能以更快速更容易更廉价的方式获取和存储数据,这就使得数据及其信息量以指数方式增长。早在20世纪八十年代,据粗略估算,全球信息量每隔20个月就增加一倍。而进入九十年代,全世界所拥有的数据库及其所存储的数据规模增长更快。 据统计,1993年全球数据存贮容量约为二千TB,到2000年增加到三百万TB,面对这极度膨胀的数据信息量,人们受到“信息爆炸”、“混沌信息空间”(Information Chaotic Space)和“数据过剩”(Data glut)的巨大压力。 然而,人类的各项活动都是基于人类的智慧和知识,即对外部世界的观察和了解,做出正确的判断和决策以及采取正确的行动,而数据仅仅是人们用各种工具和手段观察外部世界所得到的原始材料,它本身没有任何意义。从数据到知识到智慧,需要经过分析加工处理精炼的过程。如 REF 图1 \h \* MERGEFORMAT 图1. 1所示,数据是原材料,它只是描述发生了什么事情,并不能构成决策或行动的可靠基础。通过对数据进行分析找出其中关系,赋予数据以某种意义和关联,这就形成所谓信息。 信息虽给出了数据中一些有一定意义的东西,但它往往和人们需要完成的任务没有直接的联系,也还不能作为判断、决策和行动的依据。对信息进行再加工,即进行更深入的归纳分析,方能获得更有用的信息,即知识。而所谓知识,可定义为“信息块中的一组逻辑联系,其关系是通过上下文或过程的贴近度发现的”。从信息中理解其模式,即形成知识。
显示全部
相似文档