第四章 数据仓库的建立与维护.pdf
文本预览下载声明
第四章数据仓库设计
1
数据仓库设计方法概述
DW的设计与DB的设计
DW设计的三级数据模型
数据仓库设计步骤
概念模型设计
逻辑模型设计
物理模型设计
Inmon的三级数据模型
2
高级数据模型:
采用E—R方法
中级数据模型:
称为dis (Data Item Set)
一个dis与E—R中的一个主题域(实体)对应
低级数据模型:
物理模型
DIS的基本结构
3
基本数据组
类型数据组
连接数据组 二级数据组
基本数据组:应包括主题的码和属性,一个主题只存在一个基本数据组。如:
顾客主题中的顾客号、顾客名、性别等。
联接数据组:反映主题之间的联系,往往是一个主题的公共码键。
二级数据组:相对稳定的数据组。如:顾客的地址、电话、文化程度等。
类型数据组:频繁变动的数据组。如:顾客的购物记录。
稳定性:基本数据组 二级数据组 类型数据组
DW设计的三级数据模型
4
概念模型: “信息世界”中的信息结构
用E—R方法,以主题替代实体
逻辑模型: 一般采用关系模型
物理模型: 物理存储结构、存储方法
如:建立数据分片、合并表,建立包括广义索引在
内的各种索引机制,引入冗余,生成导出数据等
数据仓库设计的基本步骤
5
数据仓库运行与维护
概念模型设计 分析主题域,针对每一个选定的实施的主题域
界定系统边界
逻辑模型设计 物理模型设计
确定主题域 数
粒度层次划分 确定存储结构 据 设 数
数据分割策略 确定索引结构 仓 计 据
库 接 装
技术准备工作 记录系统定义 确定存放位置 生 口 入
成
技术评估
关系模式定义 确定存储分配
技术环境准备
6
第五章数据仓库的建立和维护
第五章数据仓库的建立和维护
7
数据仓库的开发
数据仓库的建立过程
数据仓库的开发方法
数据仓库的维护
提高数据仓库性能
数据仓库的安全性
数据仓库开发过程
8
分析与设计阶段
数据获取阶段
决策支持阶段
维护与评估阶段
数据
显示全部