文档详情

数据仓库概念培训.pdf

发布:2017-08-24约1.36万字共29页下载文档
文本预览下载声明
数据仓库 数据仓库 概念、设计及应用 概念、设计及应用 提纲 提纲 1.为什么要建立数据仓库 1.为什么要建立数据仓库 2. 数据仓库的概念及特性 2. 数据仓库的概念及特性 3. 数据仓库的结构 3. 数据仓库的结构 4. 数据仓库的设计 4. 数据仓库的设计 5. 数据仓库的开发过程 5. 数据仓库的开发过程 6. 数据仓库的典型应用 6. 数据仓库的典型应用 事务处理环境不适宜DSS应用的原因 事务处理环境不适宜DSS应用的原因 事务处理和分析处理的性能特性不同 事务处理和分析处理的性能特性不同 操作型处理对数据的存取操作频率高而每次操作处理的 操作型处理对数据的存取操作频率高而每次操作处理的 时间短; 时间短; 在分析处理环境中,某个DSS应用程序可能需要连续几 在分析处理环境中,某个DSS应用程序可能需要连续几 个小时,从而消耗大量的系统资源。 个小时,从而消耗大量的系统资源。 数据集成问题 数据集成问题 数据动态集成问题 数据动态集成问题 历史数据问题 历史数据问题 数据的综合问题 数据的综合问题 抽取程序 抽取程序 用抽取程序能将数据从高性能联机事务处理方式中转移出 用抽取程序能将数据从高性能联机事务处理方式中转移出 来,在需要总体分析数据时就与联机事务处理性能不发生 来,在需要总体分析数据时就与联机事务处理性能不发生 冲突。 冲突。 用抽取程序能将数据从联机事务处理范围内移出时,数据 用抽取程序能将数据从联机事务处理范围内移出时,数据 的控制方式就发生了转变。 的控制方式就发生了转变。 蜘蛛网问题 蜘蛛网问题 数据缺乏可信性 数据缺乏可信性 数据无时基 数据无时基 数据算法上的差异 数据算法上的差异 抽取的多层次 抽取的多层次 外部数据问题 外部数据问题 无起始的公共数据源 无起始的公共数据源 生产率低 生产率低 根据全部数据生成企业报表 根据全部数据生成企业报表 定位数据需要浏览大量文件 定位数据需要浏览大量文件 抽取程序很多,并且每个都是定制的,不得不克服很多技术上 抽取程序很多,并且每个都是定制的,不得不克服很多技术上 的障碍。 的障碍。 数据转化为信息的不可行性 数据转化为信息的不可行性 数据没有集成化 数据没有集成化 体系结构设计环境的层次 体系结构设计环境的层次 原子/数据 原子/数据 仓库层 部门层 仓库层 部门层 个体层 个体层 操作层 操作层 数据操作层只保存原始数据并且服务于高性能事务处理领域; 数据操作层只保存原始数据并且服务于高性能事务处理领域; 数据仓库层存储不更新的原始数据,此外一些导出数据也在此存 数据仓库层存储不更新的原始数据,此外一些导出数据也在此存 在; 在; 数据的部门层几乎只存放导出数据; 数据的部门层几乎只存放导出数据; 在数据个体层中完成大多数启发式分析 在数据个体层中完成大多数启发式分析 数据仓库的概念 数据仓库的概念 数据仓库是在企业管理和决策中面向主题的、集成的、与 数据仓库是在企业管理和决策中面向主题的、集成的、与 时间相关的、不可修改的数据集合。 时间相关的、不可修改的数据集合。 [William H.Inmon] [William H.Inmon] 与其他数据库应用不同的是,数据
显示全部
相似文档