数据仓库技术《精品》.ppt
文本预览下载声明
* 3、 数据仓库系统 连续文件1 1月份彩电销售 海尔 68 长虹 100 东芝 20 熊猫 10 …… …… 2月份彩电销售 海尔 150 长虹 90 东芝 40 熊猫 30 …… …… 海尔 1月份至今 218 长虹 1月份至今 190 东芝 1月份至今 60 熊猫 1月份至今 40 …… …… …… 最新. * 3、 数据仓库系统 连续文件2 连续文件 3月份彩电销售 海尔 75 长虹 60 东芝 80 熊猫 40 …… …… 海尔 1月份至今 293 长虹 1月份至今 250 东芝 1月份至今 140 熊猫 1月份至今 80 …… …… …… 海尔 1月份至今 218 长虹 1月份至今 190 东芝 1月份至今 60 熊猫 1月份至今 40 …… …… …… 最新. * 是一个小型的数据仓库,是针对企业中的某个或是几个部门提出的数据仓库解决方案,一般是为部门一级的管理人员提供决策支持的信息。 数据集市具备的特性包括:规模小、面向特定的应用、面向部门/工作组、快速实现、投资规模小、易使用、全面支持异构平台等。 数据集市一般只注意企业的一个较狭窄的范围,它通常只包含一个主题区域或一种分析。 3、 数据仓库系统 数据集市(Data Mart ) 最新. * 3、 数据仓库系统 数据仓库体系结构[Pieter ,1998] Source Databases Data Extraction, Transformation, load Warehouse Admin. Tools Extract, Transform and Load Data Modeling Tool Central Metadata Architected Data Marts Data Access and Analysis End-User DW Tools Central Data Warehouse Central Data Warehouse Mid- Tier Mid- Tier Data Mart Data Mart Local Metadata Local Metadata Local Metadata Metadata Exchange MDB Data Cleansing Tool Relational Appl. Package Legacy External RDBMS RDBMS 最新. * ? ? ? 数据仓库 ?MRDB ? MDDB 数据抽取 数据净化 数据载入 信息发布 系统 操作型数据和外界数据 数据集市 报表,查询, EIS工具 OLAP 工具 数据挖掘工具 管理平台 元数据 管理平台 数据仓库体系结构 最新. * 4、 ETL(抽取、转换和加载) ( Extract, Transform and Load ) 在数据仓库构建过程中,作业量最大、日常运行中问题最多的是将数据从业务数据库向数据仓库移动的过程。 由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从联机事务处理系统、外部数据源、脱机的数据存储介质中导入数据仓库。 需经过抽取、转换、清洗、加载和汇总等几个步骤。 最新. * 4、 ETL(抽取、转换和加载) 抽取 要访问源数据库中哪些文件或表? 从源数据库中可以提取哪些字段? 在产生的结果中,要调用的字段是什么? 什么是输出的目标和输出的数据库格式? 应该按照什么时间表重复提取? 最新. * 4、 ETL(抽取、转换和加载) 转换 就是对从多个不同业务数据库所抽取的数据,进行数据项名称的统一、位数的统一、编码的统一和度量标准的统一,消除数据之间的不一致性以及消除重复数据。 如:一个存储的数据值为“男”和“女”,而另一个为为“M”和“F”。这两个数据源的值都是正确的 最新. * 4、 ETL(抽取、转换和加载) 清洗 对进入数据仓库的数据进行全面检查并使它们尽可能无差错。
显示全部