数据仓库及数据挖掘实验指导书.doc
文本预览下载声明
潘怡 编著
《数据仓库与数据挖掘》
课程实验指导书
长 沙 学 院 计 算 机 科 学 与 技 术 系
2009年9月前 言
本书是《数据仓库与数据挖掘》课程及《数据分析与挖掘》的实验指导书。全书分为三个部分,第一部分为实验内容对每个实验的实验目的、实验类型、实验学时、实验原理及知识点、实验环境(硬件环境、软件环境)和实验内容及步骤进行简单介绍,第二部分为实验指导对每个实验的实验方法,实验步骤及补充的实验知识进行详细介绍,第三部分为实验报告。
本实践课程主要介绍数据仓库的工作机理及其构建过程,。要求学生熟练使用数据库管理系统MS SQL Server,掌握典型的数据仓库系统及其开发工具的使用,理解数据挖掘的工作原理与流程,掌握典型数据挖掘技术及其工具的使用方法,熟悉SQL SERVER BI DEV集成挖掘环境。
要求学生实验前认真准备,实验后提供实验报告,给出详细设计方法以及设计依据。
实验报告的格式应采用统一封面,统一的实验报告纸。封面应包括:课程名称、实验序号、名称、专业、班级、姓名、同组实验者、实验时间。实验报告内容应包括:实验名称、目的、内容、实验步骤、实验记录、数据处理(或原理论证、或实验现象描述、或结构说明等)。
目 录
第一部分 实验内容
实验1:实践SQL Server数据多维分析环境
实验2:实践关联规则挖掘方法
实验3:实践决策树挖掘方法
实验4:实践聚类挖掘方法
实验5:实践神经网络挖掘方法
第二部分 实验指导
实验1:实践SQL Server数据多维分析环境
实验2:实践关联规则挖掘方法
实验3:实践决策树挖掘方法
实验4:实践聚类挖掘方法
实验5:实践神经网络挖掘方法
第三部分 实验报告
第一部分
实验内容
实验1:实践SQL Server数据多维分析环境
一.实验目的
学习和掌握Sql Server 2005 Analysis Services 工具集,包括如何在 BI Development Studio 的 Analysis Services 项目中定义数据源、数据源视图、维度、属性、层次结构和多维数据集,如何查看多维数据集和维度,理解并掌握OLAP分析的基本过程与方法。
二.实验类型 验证型
三.实验学时 4学时
四.实验原理及知识点
1.SQL Server 服务
2.服务器注册
3.系统数据源连接
4.数据源视图处理
5.多维数据集
6.事实表和维度表;
7.星型架构模型;
8.元数据结构。
五.实验环境
1.硬件设备要求:
PC及其联网环境;
2.软件设备要求:
操作系统Windows, SQL Server 2005, SQL Server 2005 BI DEV STUDIO 。
六.实验内容及步骤
I. 建立Sql Server 2005 数据挖掘实验环境
启动SQL Server 服务,打开BI开发环境
注册服务器
建立系统数据源连接
建立数据库和数据源视图
浏览多维数据集数据
编辑多维数据集数据
II. 实践多维数据集分析
假设一连锁超市的用户需求如下,从无到有设计一个数据仓库的基本架构,要求能够满足以下查询:
查询公司在2005年的总销售金额
查询公司在2005年第一季度的销售金额
查询公司在2005年上半年的销售金额
查询某供应商s1于2005年提供产品p1的金额总量
查询某供应商s1于2005年提供某产品p1的金额总量
查询某门市店d1于2005年共销售某一种商品p1的总金额
查询公司在2005年度共销售多少金额类别为c1的商品p1的总金额
根据要求:
建事实表和维度表
设计星型架构模型
分析元数据结构。
七.思考与练习
1.什么是SQL Sever 2005 BI DEV STUDIO?它包含几个主要部分?
2.如何注册服务器?
3.如何设计数据源视图?
4.如何建立多维数据集?
5.什么是事实表和维度表?
6.什么是星型架构?
7.什么是元数据?
实验2:实践关联规则挖掘方法
一.实验目的
学习和掌握使用Sql Server 2005进行关联规则数据挖掘,了解并掌握挖掘结构、挖掘模型的基本概念,能够使用数据挖掘向导创建数据挖掘结构和模型,掌握数据挖掘设计器的使用方法,掌握模型查看器方法,能够使用挖掘准确性图表,了解模型的提升图,能够创建数据挖掘报告。
二.实验类型 设计型
三.实验学时 4学时
四.实验原理及知识点
1.SQL Server 挖掘结构
2.SQL Server 挖掘模型
3.事实表
4.嵌套表
5.键
6.输入列
7.可预测列
8.挖掘参数
五.实验环境
1.硬件设备要求:
显示全部