文档详情

数据仓库构建实施工作计划.doc

发布:2019-03-28约6.15千字共11页下载文档
文本预览下载声明
数据仓库构建实施工作计划 郑 疆 2008.12.14 指导思想 数据仓库是面向主题的、集成的、不可更新的、随时间的变化而不断变化的,这些特点决定了数据仓库的系统设计不能采用同开发传统的 HYPERLINK /searchwhatis/362/6025862.shtml \t _blank OLTP数据库一样的设计方法。 数据仓库系统的原始需求不明确,且不断变化与增加,最初很难确切了解到用户的明确而详细的需求,更不能较准确地预见到以后的需求;同时,数据仓库系统开发又是一个经过不断循环、反馈而使系统不断增长与完善的过程。因此,采用演化过程来进行数据仓库的开发是比较合适的。 该模型是显式地把增量模型扩展到需求阶段为了第二个构造增量,使用了第一个构造增量来精化需求 该模型是显式地把增量模型扩展到需求阶段 为了第二个构造增量,使用了第一个构造增量来精化需求 软件生存周期-演化模型 数据仓库是在现存数据库系统基础上进行开发,它着眼于有效地抽取、综合、集成和挖掘已有数据库的数据资源来服务于企业高层领导管理决策分析的需要,归根结底是一种数据驱动的开发。 由于数据仓库系统开发是一个经过不断循环、反馈而使系统不断增长与完善的过程,因此,在数据仓库的开发的整个过程中,需要自始至终决策人员和开发者的共同参与和密切协作,保持头脑灵活、思维开阔,不做或尽量少做无效工作或重复工作。 工作计划 数据仓库的设计大体上可以分为以下六个步骤: 概念模型设计 技术准备工作 逻辑模型设计 物理模型设计 数据仓库生成 数据仓库运行与维护 下面以六个主要设计步骤为主线,列出在各个设计步骤中设计的基本内容和工作安排计划。 概念模型设计 输入: 原有数据库系统 输出: 在原有的数据库的基础上建立了一个较为稳固的概念模型 所需时间: 1.5个月(2008.12-2009.1.31) 因为数据仓库是对原有数据库系统中的数据进行集成和重组而形成的数据集合,所以数据仓库的概念模型设计,首先要对原有数据库系统加以分析理解,看在原有的数据库系统中“有什么”、“怎样组织的”和“如何分布的”等,然后再来考虑应当如何建立数据仓库系统的概念模型。一方面,通过原有的数据库的设计文档以及在数据字典中的数据库关系模式,可以对企业现有的数据库中的内容有一个完整而清晰的认识;另一方面,数据仓库的概念模型是面向企业全局建立的,它为集成来自各个面向应用的数据库的数据提供了统一的概念视图。 概念模型的设计是在较高的抽象层次上的设计,因此建立概念模型时不用考虑具体技术条件的限制。进行概念模型设计所要完成的主要工作是: 界定系统边界 数据仓库是面向决策分析的数据库,我们无法在数据仓库设计的最初就得到详细而明确的需求,但是一些基本的方向性的需求还是摆在了我们的面前: 要做的决策类型有哪些 决策者感兴趣的是什么问题 这些问题需要什么样的信息 要得到这些信息需要包含原有数据库系统的哪些部分的数据 这样,我们可以划定一个当前的大致的系统边界,集中精力进行最需要的部分的开发。因而,从某种意义上讲,界定系统边界的工作也可以看作是数据仓库系统设计的需求分析,因为它将决策者的数据分析的需求用系统边界的定义形式反映出来。 确定主要的主题域及其内容 在这一步中,要确定系统所包含的主题域,然后对每个主题域的内容进行较明确的描述,描述的内容包括: 主题域的公共码键 主题域之间的联系 充分代表主题的属性组 技术准备工作 输入: 数据仓库概念模型 输出: 技术评估报告、软硬件配置方案、系统(软、硬件)总体设计方案 所需时间: 0.5个月(2009.2.1-2009.2.15) 管理数据仓库的技术要求与管理操作型数据库的技术要求区别很大,两者所考虑的方面也不同。也正因为此,我们在一般情况下总是将分析型数据与操作型数据分离开来单独集中存放,也就是用数据仓库来存放。 进行数据仓库开发的技术准备工作包括: 技术评估 进行技术评估,就是确定数据仓库的各项性能指标。一般情况下,需要在这一步里确定的性能指标包括: 管理大数据量数据的能力 进行灵活数据存取的能力 根据数据模型重组数据的能力 透明的数据发送和接收能力 周期性成批装载数据的能力 可设定完成时间的作业管理能力 技术环境准备 一旦数据仓库的体系化结构的模型大体建好后,下一步的工作就是确定我们应该怎样来装配这个体系化结构模型,主要是确定对软硬件配置的要求;我们主要考虑相关的问题: 预期在数据仓库上分析处理的数据量有多大 如何减少或减轻竞争性存取程序的冲突 数据仓库的数据量有多大 进出数据仓库的数据通信量有多大 根据这些考虑,我们就可以确定各项软硬件的配备要求。这些配备可能会涉及: 直接存取设备( HYPERLINK /searchwhatis/96/5947596.shtml \t _blank D
显示全部
相似文档