文档详情

大数据及数据挖掘方法.pdf

发布:2020-09-19约4.16千字共5页下载文档
文本预览下载声明
山 东 科 技 大 学 本科毕业设计(论文) 题 目 大数据及数据挖掘方法 学 院 名 称 数学与系统科学学院 专 业 班 级 统计学 10 学 生 姓 名 大数据及数据挖掘方法 摘要 随着计算机技术的革新,互联网新媒体的快速发展,人们的生活已经进入 高速信息时代。我们每天的生活都要产生大量数据,因此我们获取数据的速度 和规模不断增长,大量数据不断的被存入存储介质中形成海量数据。海量数据 的存储、应用及挖掘已成为人们研究的重要命题。 数据挖掘是从存放在数据库、数据仓库或者其他信息库中大量的不完全的 有噪声的模糊的随机的数据中提取隐含在其中的人们事先未知、但潜在有用的 信息和知识过程。表现形式为:规则、概念、规律及模式等。数据挖掘是一门 广义的交叉学科,从一个新的角度把数据库技术、人工智能、统计学等领域结 合起来,从更深层次发掘存在于数据内部新颖、有效、具有潜在效用的乃至最 终可理解的模式。在数据挖掘中,数据分为训练数据、测试数据、和应用数据。 数据挖掘的关键是在训练数据中发现事实,以测试数据作为检验和修正理论的 依据,把知识应用到数据中去。 本文首先说明了大数据的概念及兴起与发展历程,然后介绍各种主流的数 据分析挖掘方法。 关键词:大数据 数据挖掘 数据分析方法 1 Abstract With the development of computer technology, the rapid development of Internet and new media, peoples life has entered the information era. Our everyday life is to have a large amount of data, so we get the growing data speed and scale, a large amount of data have been stored in the form of mass data storage medium.The storage, application and mining massive data has become an important proposition that people study. Data mining is stored in the database from the data warehouse, or other information in the library a lot of incomplete, noise fuzzy random data in which the extraction of implicit previously unknown, but potentially useful information and knowledge process. Manifestation: the rules, concepts, rules and patterns. Data mining is a crossed subject, database technology, artificial intelligence, statistics and other fields together to from a new point of view, from a more deep excavation in data within a novel, effective, with potentially useful and ultimately understandable pattern
显示全部
相似文档