数据仓库方案比较.doc
文本预览下载声明
数据仓库方案对比
概述
成功地实施一个数据仓库项目,通常需要很长的时间。如果仅仅着眼于短期成果,缺乏整体考虑,采用一种不健全的体系结构,不仅会增加系统开发和维护成本,而且必将对发挥数据仓库的作用造成不利的影响。
Oracle公司是世界上最大的数据仓库厂家,能够提供完整的数据仓库解决方案。根据第三方专业咨询机构TDWI-Forrester所做的市场调查显示,Oracle是大多数IT主管选择数据仓库平台时的首选。
IBM数据仓库的市场占有率低于Oracle。权威市场分析机构IDC发布《全球数据仓库平台工具2006年度供应商市场份额》报告,根据2006年度软件收入,把甲骨文评为数据仓库平台工具领域的领先供应商。IDC把甲骨文评为数据仓库管理领域的领先供应商,是因为甲骨文的市场份额已接近41%。在数据仓库管理工具市场,甲骨文排名最近的竞争对手的各项指标几乎只有甲骨文的一半,市场份额仅占22.8%。 OLTP和OLAP的支持 数据库在此项目中作为数据中心使用,其特性既有OLAP作用,已批量数据加载、查询为主,也有OLTP特性,以高速少量数据的增删改查为主 Oracle数据库既支持OLTP也支持OLAP,在TPC-C和TPC-H测试中,都有使用数据库集群或者不使用数据库集群的测试结果。 DB2 UDB对于OLTP的支持方式是不采用数据库分区(集群),如在OLTP标准测试TPC-C中,从未使用集群方式;对于大数据量的OLAP应用,采用数据库分区(集群),如在OLAP标准测试TPC-H中,全部采用集群方式。作为数据中心这种混合体应用,DB2不适合。 分区 是提高大量数据下性能的好方法,其实质是将达数据量分割为小数据量,通过并行、减少数据量等手段提高性能 Oracle数据库提供Range、List、Hash、Range+Hash、List+Hash、Range+List等多种分区方式;Oracle的分区技术从8i就开始,是非常成熟的特性 DB2 UDB只支持Range、Hash分区,而且Range分区技术从V9才开始支持 表压缩 Oracle数据库对数据、索引都进行压缩,并且无论数据增、删、改操作都可以进行压缩 DB2 UDB在数据删、改时不能进行数据压缩 数据库事故恢复 Oracle数据库可以在数据库运行和磁盘写入的同时分割镜像。
如果存档日志损坏,Oracle数据库能够通过LogMiner工具翻阅损坏的日志文件,恢复日志文件中记录的交易。采用Oracle数据库的块级介质恢复功能,当只有一个块损坏时,只是这个块需要恢复,文件的其余部分,即含有这个块的表仍然可以在线访问,从而提高了数据的可用性。 DB2必须在挂起数据库I/O时才能进行分割镜像备份功能;对于DB2来说,存档日志文件损坏意味着不仅特定日志文件中的交易全部丢失,而且损坏日志文件之后创建的存档日志文件也会丢失;DB2不能以块为单位恢复数据,因此需要将整个文件脱机、重建、恢复。 分析函数 Oracle数据库提供很多分析函数如回归、假设分析、统计函数等 查询结果缓存 提高查询性能 Oracle数据库提供查询结果缓存功能 DB2 UDB不提供
多维数据库
Hyperion Essbase Cognos PowerPlay 多维数据库定位
OLAP技术领域的引导者,业界唯一真正意义的多维数据库,第一个多线程并发处理引擎,支持多用户并发读/写,支持数据库触发多维数据立方体
适用分析主题
提供块存储和聚合存储两种存储方式,满足企业包括财务(财务高级智能)和非财务主题(大量稀疏数据,如客户分析、供应商分析等)全面的分析需求。 只提供聚合存储方式,满足小数据量、简单聚合的分析主题。
维度设计
1根据数据特征提供属性维、共享成员、混合存储等多种灵活维度设计,支持父子维;
2选用聚合存储方式,能轻松处理上千万成员维度的分析主题需求;
3对层次设计没有要求。 1 维度设计类型较单一;
2 处理维度成员在数十万级别,当父节点直接带超过1000个成员的时候立方体往往无法建立。 数据的加载和计算 1 支持不同数据源搭建立方体,数据可分批加载;
2 支持增量数据更新;
3 带自动的聚合计算,也可灵活定义计算脚本,完成复杂的计算规则,可以完成分摊、预测、复杂KPI计算等高级分析需求。 1 单一数据源搭建立方体;
2 每次数据添加或是数据库结构改变,PowerPlay的立方体都必须重新建立和部署;
3 只有简单聚合计算功能。 大数据量及性能处理能力
1目前有不少客户的单个立方体上数百GB规模。Essbase多次成为OLAP引擎的业界基准。
2支持动态聚合,也可设计数据上层节点的聚合存储, 实现大立方体下的查询响应速度也非常快。 1实际当立方体上升到几百M之后基本不可用;
显示全部