第6章 分布式数据仓库.pdf
文本预览下载声明
下载
第6章 分布式数据仓库
大部分企业建立和维护单一中央数据仓库环境。为什么单一中央数据仓库环境比较流
行?这有许多原因:
■ 数据仓库中的数据是全企业集成的数据,仅在总部使用集成视图。
■ 数据仓库中的大量数据使数据的单一的集中式存储具有意义。
■ 即使数据能被集成,但是若将它们分布于多个局部站点,则存取这些数据也是很麻烦
的。
总之,政策、经济和技术等诸多因素都更倾向于建立和维护单一中央数据仓库环境。但
是在某些特定场合,需要建立分布式数据仓库环境。
6.1 引言
为了便于理解分布式数据仓库何时有意义,我们先看一些处理的基本拓扑结构。图 6 - 1表
明了一种常见的处理拓扑结构:
站点A
站点C
总部
操作型处理
站点B
图6-1 许多企业处理的典型拓扑图
如图6 - 1所示,某企业设有一个总部,负责处理所有的业务。若在局部层上存在某些业务
处理,这些处理也是非常基本的。局部层上可能拥有一系列的哑终端,但是所作的处理工作
都是不太重要的。在这种拓扑结构中,不可能需要建立分布式数据仓库环境。
当局部层出现基本的捕获信息活动时,局部处理的复杂性将有所提高,如图 6 - 2所示。
在图6 - 2 中,局部层有少量的捕获信息活动。一旦承揽了某业务,即将它传送到总部去处
理。在这种简单的拓扑结构中,也不需要建立分布式数据仓库环境。
现在,看一下如图 6 - 3所示的拓扑结构。同前两种处理拓扑结构相比 ,在图6 - 3 中,局部层
有相对较多的处理过程。就拿操作型处理来说,局部站点是自主的。仅偶然或某些特定的处
理需要将数据和业务活动发送到总部处理。对于这类企业来说,采用某种形式的分布式数据
仓库就是必要的。
第6章 分布式数据仓库 117
下载
站点A
捕获信息活动
站点C
捕获信息活动
总部
操作型处理
站点B
捕获信息活动
图6-2 某些场合,在站点层处理一些基本业务活动
站点A
局部操作型处理
站点C
局部操作型处理
总部
全局操作型处理
站点B
局部操作型处理
图6-3 在分布式数据仓库谱系的另一端—在局部层要做许多操作型处理
正如即将讨论的,分布式数据仓库的种类很多。认为分布式数据仓库仅是一种两级模式
的思想是错误的。分布式数据仓库有许多层次(级别)。
局部自主性和处理过程较少的大多数企业一般拥有一个中央数据仓库,如图 6 - 4所示。
站点A
站点C
显示全部