文档详情

Orale数据库g新特性.doc

发布:2017-11-18约1.44万字共20页下载文档
文本预览下载声明
Oracle数据库11g新特性:数据仓库和OLAPOracle数据库11g面向DBA和开发人员的重要新特性:数据仓库和OLAP ??? 数据库驻留的按多维数据集组织的物化视图(无需任何特殊工具将 OLAP 多维数据集的强大功能同 SQL 的简单性集成在一起)、通过分区变化跟踪功能轻松识别刷新、新增的分析工作区管理器、扩展到子查询和远程表的查询重写以及许多其他新特性使 Oracle 数据库成为更强有力的数据仓库平台。 ??? 按多维数据集组织的物化视图 ??? 联机分析处理 (OLAP) 概念自 20 世纪 70 年代以来一直很活跃,并在 20 世纪 90 年代中期开始成为主流,Ted Codd 在 1992 年创造了术语“OLAP”。由于有点深奥,大多数企业当时都不知道如何正确利用 OLAP. ??? 多年以后,该技术已十分完善,使得 OLAP 依靠大型数据仓库变得切实可行,从而真正将“智能”引入业务智能中。与传统关系设计截然不同,OLAP 允许以最有效的方式存储和访问数据,即最终用户可以遍历具有许多维度的假定“多维数据集”的边缘。(请参见下面的多维数据集数据示例)。 ? 多维数据集的维度与事实(也称为“量度”)相关联。用关系术语来讲,事实与维度之间具有多对一关系。例如,Acme Computer Supplies 可能有一个销售数据库。维度通常包括客户、产品和时间元素(月份、季度等)。在特定的时间段(2008 年 8 月)内,特定产品(Cat5e 电缆)与特定客户 (Oracle Corp.) 之间对应的销售额是一个量度。维度和事实(例如销售额)都存储在单个表上。因此,用关系术语来讲,事实表是维度表的子表。 ??? 但是,这仅仅是一个比喻而已。在关系设计中,将通过在事实表的 customer、product 或 time 列上创建的索引来访问量度。而在 OLAP 方法中,特定单元格(量度)是通过遍历多维数据集进行访问的:本示例中的访问方法如下:先转至包含时间 Aug 08 的部分,再转至产品 Cat5e,最后转至客户 Oracle. ??? Oracle 像在数组(而不是表)中一样计算目的地,然后即可知道如何到达这些部分。例如,假定维度是按以下方式组织的: Dimension Time := {May,Jun,Jul,Aug} Dimension Customer := {Microsoft,IBM,Oracle,HP} Dimension Product := {Fiber,Cat6e,Cat5e,Serial} ??? 为了找到 Oracle + Aug + Cat5e 量度,OLAP 引擎将按如下方式执行导航: ??? 1、Aug 08 是 Time 数组的第四个元素,因此沿着多维数据集的时间维度转至第四个单元格。 ??? 2、Cat5e 是 Product 数组的第三个元素,因此转至第三个元素。 ??? 3、Oracle 是 Customer 数组的第三个元素,因此转至第三个元素。 ??? 就是这样!现在您已经找到了所需的量度。由于维度值充当数组指针,因此在执行此操作时不必使用索引。同样,如果您要计算 2008 年 8 月份所有客户的销售总额,可以执行同样的操作,只是在第 3 步中将数组各元素的量度加起来,而不是转至特定单元格。 ??? 以传统星型模式存储的纯关系形式数据的关系访问与上述方法不同,如下所示。 在关系数据库方法中,您必须将此“事实”表与所有维度联接。每次需要数据时,都需要从事实表中选择合适的数据(可能要通过索引),然后将其与所有维度逐个联接起来(再次通过索引)。虽然此方法在技术上是可行的,但在大型数据库中完全行不通。 ??? 作为替代方法,能否为所有这些选项创建物化视图 (MV) 呢?用户可以使用维度元素的任意组合: ??? ■? 8 月份针对所有客户的 Cat5e 销售额 ??? ■? 8 月份针对 Oracle 的串行电缆销售额与 IBM 销售额(针对同一产品和月份)的百分比 ??? ■? 针对 HP 的光缆销售额与针对 Microsoft 的串行电缆销售额的百分比 ??? 等等。但是,需要创建多少个 MV 呢?理论上讲,应该为每个组合创建一个 MV (4 x 4 x 4 = 64 MV)。除了空间,您还需要足够的时间和数据库资源,以便在数据发生变化时刷新 MV,可能会涉及数千个元素。这样,要创建和管理的 MV 的数量 ??? 将变得相当庞大。 ??? 相反,多维数据集是单个段,却可以同样轻松地处理任意类型的查询。虽然二者都可用于旨在加快汇总数据(与 OLTP 数据不同)处理速度的数据仓库设计中,却存在着巨大的根本区别:MV 存储预先计算的结果以避免联接和聚合,而多维数据集存储原始数据并即时计算大
显示全部
相似文档