文档详情

数据仓库实施方法研究.doc

发布:2017-11-24约4.29千字共8页下载文档
文本预览下载声明
数据仓库项目实施方法研究 摘 要 随着信息与决策支持系统的发展,越来越多的大企业选择利用数据仓库来帮助自己进行决策分析。本文简单介绍了数据仓库的概念,提出了一种数据仓库项目的实施方法论,阐述了从项目初期规划到中期建设实施以及后期回顾总结的过程,给数据仓库项目的实施提供指导。 关键词 数据仓库 实施 方法 引言 建立数据仓库的理由 数据仓库(Data Warehouse,简称DW)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。 研究发现,领导的需求度、信息技术基础设施、分析型的应用需要以及竞争的激烈程度这四项因素是影响企业实施数据仓库进度的关键因素。企业规模越大、历史数据越多,实施数据仓库的迫切性就越高; 中国的电信市场竞争日趋激烈,竞争方式已由最初的价格战演变到现在的服务战,企业需要以客户为中心,进行统一的客户关系管理数据仓库是中国电信业务拓展的强有力的工具,降低经营成本、提高客户满意度、增加经营利润、扩大市场份额。绝大多数数据仓库项目失败的原因并非在于数据仓库技术本身 确保业务部门与IT部门一致地为项目成功进行努力。 选择可以提供数据仓库完整解决方案的可靠和有能力的集成商。 进行应用推广,确保系统被真正使用。 以上列出了一些成功实施数据仓库项目的关键点,但这仅仅是一部分。数据仓库是一个复杂的项目,它与单位的许多部门交叉,要求额外的计划,交流和管理,最好汲取其它方面的经验并遵循一个合理的、经验证的方法论。在下面的章节中,本文提出了一个数据仓库实施方法论,用以指导数据仓库项目实施的具体过程。 数据仓库实施方法论 项目实施方法论是指导整个项目实施的详细的框架,它能有条理地组织项目实施各个阶段的项目活动,描述工作步骤、任务和每一阶段项目的里程碑。如图一所示,数据仓库项目整个实施过程中的工作和活动大致可以分为四个部分:任务和环境的评估、需求和数据分析、构造数据仓库、回顾总结再发展。 图一 数据仓库实施方法 任务和环境的评估 数据仓库是建立在原有运行系统之上的,因此要结合用户的现状,来明确数据仓库的目标任务。通过对业务需求、成本、风险等情况的评估,决定建立数据仓库这个任务是否可行,所建立的数据仓库是不是用户所期望的,有没有不可逾越的障碍。最好在这一步能确定将来评估数据仓库系统成功与否的基本原则。图二给出了任务和环境评估环节的各个工作步骤。 图二 任务和环境的评估 1系统定位 一个数据仓库系统应明显区别于业务处理系统,因为业务系统的要求往往是快速响应和界面简单等。而数据仓库与业务系统并不是平行的关系,它应该是基于所有业务系统之上的,对业务信息进行采集、分析、整理和发布等,应该是一个稳定的、带有时间参数的数据集合。 2明确业务需求 业务需求就是业务部门的真实需要,具体说就是能帮助业务部门解决实际问题的数据内容和形式。明确了用户的需求,开发者的工作将会事半功倍。 3评估目前DSS系统 如果已有的决策支持系统不能解决业务部门的问题,须要探究一下原因,是源数据的质量太差、应用推广力度不够还是培训不到位等。了解目前存在的问题,做到有的放矢,更有利于项目的开展。 4明确项目目标和范围 明确项目目标是项目实施的前提条件。在制定战略目标的同时,还要制定阶段性目标,为项目实施的每一个阶段指明方向,也避免初期目标过高达不到而影响项目团队的士气。 5制定项目计划 基于系统需求分析、成本估计、进度估计和可用资源等情况来制订实施计划,将范围局限在能够实施的范围之内。 6成本效益分析 首先,明确数据仓库项目的所有花费,包括购买软硬件、运维费用、培训花销等;其次,明确建成数据仓库项目后带来的效益。最后,计算ROI(投资回报率)并指出得到回报的大概时间。 7风险评估 由于数据仓库自身的一些特征:涉及面广、数据状况复杂、数据处理过程繁杂、需求经常变化等因素,所以数据仓库实施存在许多风险。风险评估阶段需要列出项目面临的所有风险项并画出一个风险评估的矩阵。 8撰写评估报告 完成上述步骤后,撰写评估报告,描述业务需求并给出一个或多个决策支持解决方案,包括成本效益分析和风险评估的关键内容。 需求和数据分析 数据仓库是为支持决策服务的,故首先要看决策者和数据分析人员的需求,即现在最重要的工作目标是什么、现在是怎样获得决策支持信息的、和竞争对手比差距是什么等。此外,在了解这些业务需求时,对数据源加以分析,如每一个数据源的物理存储状况、运行平台、数据质量如何等。图三描述了需求和数据分析阶段的工作。 图三 需求和数据分析 1定义技术架构相关需求 首先对
显示全部
相似文档