文档详情

第1章数据仓库的和体系结构.ppt

发布:2017-06-18约1.05万字共62页下载文档
文本预览下载声明
2015/11/6 数据仓库与数据挖掘 53 1.5 数据仓库的产生、发展与未来 三、数据仓库的未来(阅读) ? ? ? 在数据抽取方面,未来的技术发展将集中在系统集成化方面。 它将互连、转换、复制、调度、监控纳入标准化的统一管理, 以适应数据仓库本身或数据源可能的变化,使系统更便于管 理和维护。 在数据管理方面,未来的发展将使数据库厂商明确推出数据 仓库引擎,作为数据仓库服务器产品与数据库服务器并驾齐 驱。在这一方面,带有决策支持扩展的并行关系数据库将最 具发展潜力。 在数据表现方面,数理统计的算法和功能将普遍集成到联机 分析产品中,并与Internet/Web技术紧密结合。按行业应用 特征细化的数据仓库用户前端软件将成为产品作为数据仓库 解决方案的一部分。数据仓库实现过程的方法论将更加普及, 将成为数据库设计的一个明确分支,成为管理信息系统设计 的必备 2012/11/6 数据仓库与数据挖掘 20 举 例 2012/11/6 数据仓库与数据挖掘 21 1.1 数据仓库的概念、特点与组成 三、数据仓库的组成: ? ? ? ? 访问工具; 数据集市(Data Marts):从数据仓库中独立出 来的一部分数据,即部门主题数据。 数据仓库管理; 信息发布系统。 数据挖掘的社会需求 国民经济和社会的信息化 ? 社会信息化后,社会的运转是软件的运转 ? 社会信息化后,社会的历史是数据的历史 1.2 数据挖掘的概念与方法 2012/11/6 数据仓库与数据挖掘 23 1.2 数据挖掘的概念与方法 一、概念 ? 数据挖掘(Data Mining),就是从大量数据中获 取有效的、新颖的、潜在有用的、最终可理解 的模式的非平凡过程,简单的说,数据挖掘就 是从大量数据中提取或“挖掘”知识,又被称 为数据库中的知识发现(Knowledge Discovery in Database, KDD) 。 2012/11/6 数据仓库与数据挖掘 24 1.2 数据挖掘的概念与方法 一、概念 ? ? 数据挖掘是从数据中自动地抽取模式、关联、 变化、异常和有意义的结构; 数据挖掘大部分的价值在于利用数据挖掘技术 改善预测模型。 2012/11/6 数据仓库与数据挖掘 25 1.2 数据挖掘的概念与方法 二、数据挖掘的方法: ? ? 直接数据挖掘 间接数据挖掘 2012/11/6 数据仓库与数据挖掘 26 1.2 数据挖掘的概念与方法 三、数据仓库与数据挖掘的关系 ? ? 若将数据仓库(Data Warehouse)比作矿井, 那么数据挖掘(Data Mining)就是深入矿井 采矿的工作 数据挖掘是从数据仓库中找出有用信息的一种 过程与技术 2012/11/6 数据仓库与数据挖掘 27 1.3 数据仓库的技术、方法与产品 一、联机事务处理(OLTP)与 联机分析处理(OLAP)的比较 日常事务处理 负责的分析操作, 侧重决策支持 2012/11/6 数据仓库与数据挖掘 29 1.3 数据仓库的技术、方法与产品 二、联机分析处理(OLAP)有关概念 ? ? ? 维:人们观察数据的特定角度,从不同维属性上的数 据进行研究。例如,企业常常关心不同销售数据随 时间的变化情况,所以时间就是一个维 多维数据集 度量值:描述了要分析的数值,例如话费、用户数 量等; Country 数据立方体样本 全年度美国电视机 的销售量 sum TV PC VCR sum 1Qtr 2Qtr Date 3Qtr 4Qtr U.S.A Canada Mexico sum 2012/11/6 数据仓库与数据挖掘 30 1.3 数据仓库的技术、方法与产品 二、联机分析处理(OLAP)有关概念 多维分析: OLAP对数据仓库中数据的操作是针对多维数据视 图(又称为超立方体)进行的。对立方体的典型操作包括 :切片、切块以及旋转等。 1. 上卷(上钻): 数据的汇总 ? 通过一个维的概念分层向上攀升或者通过维归约来实现 2. 下钻 (下卷): 上卷的逆操作 ? 通过沿维的概念分层由高粒度向下下钻到低粒度的层次或者通过引 入新的维来实现 3. 4. 5. 切片 切块 旋转 选定多维数组的一个二维子集; 选定多维数组的一个三维子集; 改变一个立方体显示的维方向, 切片 切块 旋转 地 域 地域 产 品 年份 图2.1 对超立方体的典型
显示全部
相似文档