数据仓库主题建模点滴.pdf
文本预览下载声明
数据仓库主题建模点滴
沈志良 2007- 10
DW建模的原则
简单性
方便分析展现的实现。OLTP数据实现分析展现较难
完整性
保留业务数据的所有内容,不能因建模丢失信息
高效性
执行查询时,尽可能使连接减少,提升查询效率
通用性
符合业界标准的模型(如星型),可以用主流商业BI软件
来分析展示模型数据
一些概念
事实表和维表
事实表:维键和度量
维表:列上是属性,行是成员
有些表既是事实表又是维表
事实表的颗粒
刻画数据的细节程度
一些概念
根据数据粒度事实表的分类
事务粒度事实表(Transaction Grain )
周期快照粒度事实表(Periodic Snapshot Grain)
例子:i@Report中的月报。这种事实表一般都有报表期。
累计快照粒度事实表(Accumulating Snapshot Grain )。
例子:针对某合同,客户的付款累计。(另外对应付款Detail主题)
这种事实表一般有起止时间,止时间可能是 “将来”。
维表的分类
层级维
单级维
退化维
再议星型结构
产品维表
供应商ID
产品ID
供应商名称
类别
信用等级
大类别
电话
日期维表 销售主题表 供应商
日期ID
产品ID
日 客户ID
客户ID
月 客户名称
日期ID
季 市名
销售金额
年 省名
国名
星型模型 Star Schema 客户维表
通过冗余的方法,尽可能把雪花或其他复杂模型转变成星型模型
一个典型的星型维
完整的日期维
日期主键 年 季度 月 周序 星期 节假日 其他属性
2006 1 1 1 3 元旦
„„
2006 1 3 9 6 非
„„
2006 4
显示全部