Oracle数据仓库-电信行业应用案例.doc
文本预览下载声明
转眼,从事电信行业BI/DW已经有三年时间了,一直想写点东西,给大家共同分享,感谢ERP 100给我了一个展示的平台!? ?? ?? ? 连载时间:一周一篇? ?? ?? ? 连载提纲:? ?? ?? ?? ?? ?? ?第一篇??数据仓库建设目标、系统规模及项目面临的技术挑战? ?? ?? ?? ?? ?? ?第二篇??选择数据仓库平台的考虑? ?? ?? ?? ?? ?? ?第三篇??选择Oracle产品的原因? ?? ?? ?? ?? ?? ?第四篇??系统现状分析、DW数据仓库建设原则及整体规划的实现? ?? ?? ?? ?? ?? ?第五篇??整体规划的实现、新增应用优先级的确定及螺旋式建设方法? ?? ?? ?? ?? ???第六篇??数据仓库的效益、成本和风险控制?? ?? ?? ?? ?? ?? ?第七篇??数据模型设计方法? ?? ?? ?? ?? ?? ?第八篇??构建闭环的信息流、数据模型-分层设计、DW中的数据功能划分??? ?? ?? ?? ?? ?? ?第九篇??数据抽取策略、数据抽取过程管理、对脏数据的管理、数据去重及元数据管理及? ?? ?? ?? ?? ?? ?第十篇??典型的应用流程、主题分析及应用推广方法? ??(第一篇)??数据仓库建设目标、系统规模及项目面临的技术挑战?1??数据仓库项目建设目标:? ???建立统一的数据信息平台,实现客户资料和生产数据的集中存储。利用先进的数据仓库技术和决策分析技术为市场营销和客户服务工作提供有效的支撑:2??目前系统规模:? ???包含12个月的话单;数据库容量为65TB,其中原始数据为25TB;最大的表包含1800亿话单? ?????3 项目面临的技术挑战:? ? 数据存储-系统要求存储12-18个月的详单数据;? ?数据装载-按小时装载详单数据,要求每天在8小时内装载5亿条详单;高峰时一个小时装载6500万条详单;在8小时内同时完成1亿7000万个汇总操作? ?数据访问-支持680个并发用户,支持8000个系统用户;5%的预定义查询操作在5秒钟内完成;每秒钟23个查询操作Sina微薄互动地址:/2186879022/zDx5x29Cw
感谢大家的参与和鼓励,pathwide的建议很好,下面列举出该连载的计划提纲,如下:? ?? ?连载周期:一周一篇? ?? ?连载提纲:? ?? ?第一篇??数据仓库建设目标、系统规模及项目面临的技术挑战? ???? ???第二篇??选择数据仓库平台的考虑? ?? ?第三篇??选择Oracle产品的原因? ?? ?第四篇??系统现状分析、DW数据仓库建设原则及整体规划的实现? ?? ?第五篇??整体规划的实现、新增应用优先级的确定及螺旋式建设方法? ?? ?第六篇??数据仓库的效益、成本和风险控制? ?? ?第七篇??数据模型设计方法? ?? ?第八篇??构建闭环的信息流、数据模型-分层设计、DW中的数据功能划分??? ?? ?第九篇??数据抽取策略、数据抽取过程管理、对脏数据的管理、数据去重及元数据管理及? ?? ?第十篇??典型的应用流程、主题分析及应用推广方法? ?? ? 希望大家积极参与,共同分享BI/DW的项目经验,同时,有不到位的地方,还请大家多多指正,谢谢!
选择数据仓库平台时的考虑
4 选择数据仓库平台时的考虑? ?4.1 强大的ETL支持能力 - 支持按小时的数据装载? ?4.2 高效的数据访问 - 硬件的支持:多CPU 大内存 并发处理? ?? ?分区技术? ?? ?索引技术? ?? ?数据库内置分析能力? ?4.3 高可用性 7 * 24小时不间断运行? ?4.4 数据访问 每秒钟23到100个并发查询操作; 95%的查询在1秒内完成? ?4.5 数据表分区 - 混合分区? ?? ?按地区建立列表分区;? ?? ?按时间建立范围分区;? ?4.6 可传输的表空间? ?? ?操作系统文件的直接复制;不需要数据的导入、导出
(第三篇) 选择Oracle产品的原因:? ?? ?? ?目前主要的数据仓库产品供应商包括Oracle、IBM、Microsoft、SAS、Teradata、Sybase、SAP Business Objects等.? ???? ?? ? 在数据仓库系列技术中,主要的支撑技术包括数据库技术、ETL技术、OLAP技术、报表技术、数据挖掘技术.??? ???1??数据库技术? ?数据库技术是支撑数据仓库技术的基础技术,在已有的数据仓库实践中,关系数据库仍然是实质的数据库存储工具,只是将数据库表改称为 事实表和维表, 将属性之间的关系重新定义为维度、指标和事
显示全部