数据仓库开发方法.pdf
文本预览下载声明
数据仓库开发方法
1 、数据仓库风险
谈到数据仓库的开发方法,我们必须首先了解进行数据仓库的开发存在什么样的风险,它主要有三大
类风险:技术风险、工程管理风险和业务风险。
1.1 技术风险
技术风险是一种开发人员不能使技术正确地发挥的风险,主要反映在对技术不了解,对技术不精通,
不能解决开发过程中的技术问题等方面。
可以通过如下手段来减少这方面的风险:
经验:让有数据库或数据仓库经验的员工参加工程的开发,使用熟悉的开发工具。
培训:对不熟悉技术的开发人员进行培训。
避免使用未经证明的技术:尽量不要采用新的技术,如果一定要使用新技术,一定要先做两方面
的工作,一是对新的技术的性能做出评估,看是否真是工程开发所需要的技术。二是在新技术不
能达到预期要求的情况下采用一个备份的技术。
概念试验:也就是对工程中的关键技术进行前期的试验,确认其技术可行性。
结构复查:让开发团队以外的人员参与系统技术结构设计,并发表评论。
1.2 工程管理风险
即使开发团队采取了正确的技术,并正常地使用了它,但还是存在不能按时或按预算完成工程的开发
和实施。可以通过如下的手段来克服这种风险:
经验:具有数据仓库构建及其开发任务方面的知识能够让你和管理数据仓库的开发工作。
方法:一个强大的方法会起到工程管理和工程团队路标的作用,指导开发人员如何前进。
具有献身精神的工程管理员:一个工程管理员的任务包括:制定工程的工作计划、给团队成员下
达任务及任务完成的期限,跟踪每个任务的进度,分配工程所需的资源。要确定工程是按计划进
行的。
需求变更控制:一定要控制好需求变更。
1.3 业务风险
业务风险是指工程完工后却没有人使用它。可以通过如下的手段如下处理它。
开发工作始终让用户参与:要避免在收集了用户需求后,开发工作就脱离了用户。因为用户在提
出需求时的想法和最终在屏幕上看到的想法可能会是不一致的。
专注业务过程的实质:不同于业务系统,数据仓库的使用是一个可选的系统,也就是说用户可以
不使用它。一定要让数据仓库真正被最终用户使用起来,能帮助他们开展工作。
2、方法概述
对付数据仓库风险的最好方法是采用一套成熟的方法学(methodology),方法学可以看作一本开发数
据仓库的食谱,它列出你要执行的步骤,提供一些信息帮助,为这些步骤作计划和预算。好的方法学包含
人们在数据仓库构建实践中所积累的成功和失败的经验。
当使用数据仓库方法时,确信你明白其中的每一步,它会产生什么结果,以及按那样交付为什么是重
要的,方法学是可以裁剪的,可增可减其中的步骤以适应具体工作的需要。
此处提供的方法学由6个阶段组成:
阶 段 目 标
设想阶段 证明数据仓库是否正确,并定义一个数据仓库战略,通常这一步只执行一次,它
会产生一系列的数据仓库版本,在方法学中的蓁步骤教师针对这些而需要执行
的。
探索阶段 为一个功能领域获取详细的用户需求。
体系结构设计阶段 设计解决这些需求的技术方案
构造阶段 建立整个系统的原型
实现阶段 将系统交付用户使用
审查和反复阶段 收集所有反馈意见,并作出进一步的改进。
3 、第一阶段-设想阶段
设想是最初的设计阶段。
设想背后的观点是为公司决策支持和企业数据仓库(EDW)建立一个长期计划,它将产生一系列的版本,
因此它通常只产生一次。
设想一般是对企业一级的数据仓库进行研究计划,没有必要为一个数据集市进行。
3.1 设想阶段目标
确定在数据仓库及其相关技术的投资是否有保证。
确定数据仓库及相关技术在哪些方面能最好地服务于整个公司。
为企业数据仓库建立一个长期的计划。
3.2 设想的关键交付项
显示全部