数据仓库与数据挖掘实验一数据仓库的构建.doc
文本预览下载声明
昆明理工大学信息工程与自动化学院学生实验报告
( 2015 — 2016 学年 第 1 学期 )
课程名称:数据库仓库与数据挖掘 开课实验室:信自楼234 2015年11月12日
年级、专业、班
计科122
学号
201210405204
姓名
邹华宇
成绩
实验项目名称
实验一 数据仓库的构建
指导教师
周海河
教师评语
该同学是否了解实验原理: A.了解□ B.基本了解□ C.不了解□
该同学的实验能力: A.强 □ B.中等 □ C.差 □
该同学的实验是否达到要求: A.达到□ B.基本达到□ C.未达到□
实验报告是否规范: A.规范□ B.基本规范□ C.不规范□
实验过程是否详细记录: A.详细□ B.一般 □ C.没有 □
教师签名:
年 月 日
一、实验目的、内容与要求
目的:1.理解数据库与数据仓库之间的区别与联系;
2.掌握典型的关系型数据库及其数据仓库系统的工作原理以及应用方法;
3.掌握数据仓库建立的基本方法及其相关工具的使用。
内容:以SQL Server为系统平台,设计、建立数据库,并以此为基础创建数据仓库。
要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验项目,真实地记录实验中遇到的各种问题和解决的方法与过程,并绘出模拟实验案例的数据仓库模型。实验完成后,应根据实验情况写出实验报告。
二、实验原理及基本技术路线图(方框原理图)
数据库(DataBase,DB)是长期存储在计算机内、有组织的、统一管理的相关数据的集合。DB能为各种用户共享,具有较小的冗余度、数据间联系紧密而又有较高的数据独立性等特点。构成的三要素是数据结构、数据操作、约束性条件。
数据仓库是在原有关系型数据库基础上发展形成的,但不同于数据库系统的组织结构形式,它从原有的业务数据库中获得的数据形成当前基本数据层,经过综合后形成轻度综合数据层,轻度综合数据再经过综合后形成高度综合数据层。数据仓库结构包括当前基本数据(current detail data)、历史基本数据(older detail data)、轻度综合数据(lightly summarized data)、高度综合数据(highly summarized data)和元数据(meta data)。
数据仓库系统由数据仓库、仓库管理和分析工具3部分组成,结构形式如下图所示:
关系数据库数据文件
关系数据库
数据文件
其他数据
数据建模
抽取、转换
装载(ETL)
元数据
系统管理
综合数据
当前数据
历史数据
查询工具
OLAP工具
DM工具
C/S工具
数据仓库的逻辑数据模型是多维结构的数据视图,也称多维数据模型。对于逻辑数据模型,可以使用不同的存储机制和表示模式来实现多维数据模型。目前使用的多维数据模型主要有星型模型、雪花模型、星网模型、第三范式等。
ETL过程在开发数据仓库时,占去70%的工作量。ETL过程的主要步骤概括为:
(1)决定数据仓库中需要的所有的目标数据;
(2)决定所有的数据源,包括内部和外部的数据源;
(3)准备从源数据到目标数据的数据映射关系;
(4)建立全面的数据抽取规则;
(5)决定数据转换和清洗规则;
(6)为综合表制定计划;
(7)组织数据缓冲区域和检测工具;
(8)为所有的数据装载编写规程;
(9)维度表的抽取、转换和装载;
(10)事实表的抽取、转换和装载。
三、所用仪器、材料(设备名称、型号、规格等)
操作系统平台:Win 7
数据库平台:Microsoft SQL Server 2008
四、实验方法、步骤
本次实验使用Microsoft SQL Server的示例数据库Adventure Works,用其用户订单模型相关数据建立数据仓库。
Adventure Works由来:Adventure Works Cycles,Adventure Works示例数据库所基于的虚构公司,是一家大型跨国生产公司。公司生产金属和复合材料的自行车,产品远销北美、欧洲和亚洲市场。公司总部设在华盛顿州的伯瑟尔市,拥有 290 名雇员,而且拥有多个活跃在世界各地的地区性销售团队。
1、登录Microsoft SQL Server 2008
登录名:localhost
2、使用SQL语句构建数据库
(1)还原数据库
(2)建立数据
--建立数据
USE cd
CREATE DATABASE [DW] ON PRIMARY
( NAME = NDW, FILENAME
显示全部