数据挖掘_8_数据挖掘技术概述.pdf
文本预览下载声明
第八章数据挖掘技术概述
2015/6/3 1
8.1 背景
数据挖掘的替换词
数据库中的知识挖掘/发现(KDD)
知识提炼
数据/模式分析
数据考古
数据捕捞、信息收获等等。
2015/6/3 2
8.2 数据挖掘定义
数据挖掘(Data Mining):是指从模糊、随机、有
噪声的大型数据集中提取人们感兴趣的知识,这些
知识是隐含的、具有一定可信度的、对用户而言是
新颖的且有潜在价值的知识,提取的知识表示为概
念、规则、模式等多种形式。
这一定义包括好几层含义:
数据源必须是真实的、海量的、含噪声的;
发现的是用户感兴趣、新颖的知识;
发现的知识要可接受、可理解、可运用、有价值;
知识的形式可以是概念、规则、模式等形式。
2015/6/3 3
8.2 数据挖掘定义
数据挖掘环境
数据分析的层次 方法
simple database queries
Surface (表面)
statistical analysis
Shallow (潜在)
Hidden (隐藏) data mining
2015/6/3 4
数据挖掘的演化
进化阶段 商业问题 支持技术 产品厂家 产品特点
提供历史性的、
数据搜集 “过去五年中我的总
计算机、磁带和磁盘 IBM,CDC 静态的数据信
(60年代) 收入是多少?”
息
关系数据库(RDBMS),
“在新英格兰的分部 Oracle、Sybase、在记录级提供
数据访问 结构化查询语言(SQL),
去年三月的销售额是 Informix、IBM、 历史性的、动
(80年代) ODBC Oracle、Sybase、
多少?” Microsoft 态数据信息
Informix、IBM、Microsoft
“在新英格兰的分部 在各种层次上
数据仓库;
显示全部