文档详情

数据挖掘_8_数据挖掘技术概述.pdf

发布:2017-08-04约1.42万字共40页下载文档
文本预览下载声明
第八章数据挖掘技术概述 2015/6/3 1 8.1 背景  数据挖掘的替换词  数据库中的知识挖掘/发现(KDD)  知识提炼  数据/模式分析  数据考古  数据捕捞、信息收获等等。 2015/6/3 2 8.2 数据挖掘定义  数据挖掘(Data Mining):是指从模糊、随机、有 噪声的大型数据集中提取人们感兴趣的知识,这些 知识是隐含的、具有一定可信度的、对用户而言是 新颖的且有潜在价值的知识,提取的知识表示为概 念、规则、模式等多种形式。  这一定义包括好几层含义:  数据源必须是真实的、海量的、含噪声的;  发现的是用户感兴趣、新颖的知识;  发现的知识要可接受、可理解、可运用、有价值;  知识的形式可以是概念、规则、模式等形式。 2015/6/3 3 8.2 数据挖掘定义  数据挖掘环境  数据分析的层次 方法 simple database queries Surface (表面) statistical analysis Shallow (潜在) Hidden (隐藏) data mining 2015/6/3 4 数据挖掘的演化 进化阶段 商业问题 支持技术 产品厂家 产品特点 提供历史性的、 数据搜集 “过去五年中我的总 计算机、磁带和磁盘 IBM,CDC 静态的数据信 (60年代) 收入是多少?” 息 关系数据库(RDBMS), “在新英格兰的分部 Oracle、Sybase、在记录级提供 数据访问 结构化查询语言(SQL), 去年三月的销售额是 Informix、IBM、 历史性的、动 (80年代) ODBC Oracle、Sybase、 多少?” Microsoft 态数据信息 Informix、IBM、Microsoft “在新英格兰的分部 在各种层次上 数据仓库;
显示全部
相似文档