数据仓库技术2011.pdf
文本预览下载声明
1、数据仓库 (Data Warehouse ) 数据仓库是信息的逻辑集合 ,
这些信息来自于许多不同的业务数
据库 ,并用于支持企业的分析活动
为什么使用数据仓库? 和决策任务。
传统的数据库对企业的决策支持作用有限
企业大量的数据资源没有得到充分的利用 哪些客户是
“ 数据爆炸而知识贫乏 ” 公司的金牌
客户 ?
提高数据存储和数据分析的效率
背景
背景
现代政府机构经常面临各种挑战和决策 ,如何最大限度地挖
掘和利用有用信息 ,更好地为政府工作服务已经成为计算机
信息处理技术领域中的一个新课题。
数据库中的处理可以大致分为操作型处理和分析型处理。为
了提高分析和决策的效率和有效性 ,必须把分析型数据从操
作型处理环境中提取出来 ,建立单独的分析处理环境。数据
仓库正是为了构建这种新的分析处理环境而出现的一种数据
存储和组织技术。
什么是数据仓库
数据仓库是面向主题的、集成的、稳定的、
不同时间的数据集合、用于支持经营管理中
决策的制定过程。
2 数据仓库的特征
2 数据仓库的特征
数据仓库是面向主题的
数据仓库的数据是集成的
数据仓库的数据是多维的
数据仓库的数据是相对稳定的
数据仓库支持决策而不是事务处理
面向主题的
面向主题的
数据仓库围绕一些主题 ,排除对于决策无
用的数据 ,提供特定主体的简明视图。
主题是归类的标准 ,一个主题对应一个宏
观的分析领域。
集成的
集成的
构造数据仓库是将多个异种数据源汇集
在一起 ,须经过加工与集成 ,确保命名
约定 ,编码结构 ,属性度量等一致性。
数据仓库的多维性
数据仓库的多维性
年份 顾客分类 信誉度
北 区
西南区
东南区
东 区
西 区
产 产 产 产
品 品 品 品
1 2 3 4
信用卡客户基本情况信息
信用卡客户基本情况信息
客户基本信息事实表
客户基本信息事实表
客户编号
客户编号
职业维表
职业维表 客户主卡帐号
客户主卡帐号
主卡人姓名
主卡人姓名
主卡人身份证
显示全部