数据仓库与知识工程.DOC
文本预览下载声明
《数据仓库与知识工程》课程教学大纲
一、课程基本信息 中文名称:数据仓库与知识工程 英文名称: 开课学院:计算机科学学院 课程编码: 学分:2 总学时:32 适用专业:计算机科学与技术学术硕士,软件工程学术硕士,软件工程专业硕士 修读基础: 数据库原理及应用 主讲教师:李建(教授);肖斌(副教授) 二、课程目的任务
1.课程地位作用(课程在实现培养目标中的地位作用)
通过学习数据仓库的基本概念、数据仓库的开发模型和开发过程的知识,结合OLAP技术和数据挖掘技术, 使学生获得开发和利用数据仓库的基本技能,为学生以后从事数据仓库系统的开发和维护打下基础,对数据挖掘的关联规则,分类方法,聚类方法有深入的了解,并能够在软件开发过程中熟练掌握这些方法加以应用。本门课程的开设,旨在培养学生设计数据仓库的能力、分析问题和解决问题的能力。
2.课程主要内容(简述:主要内容、重点、难点等)
(1)数据仓库导论
主要内容
1)为何建立数据仓库
2)数据仓库的定义和基本特征
3)数据仓库的体系结构和数据组织
4)数据仓库的关键技术
重点:数据仓库概念及基本特征
难点:数据仓库的结构
(2)数据仓库的开发过程和模型
主要内容
1)数据仓库的生命周期
2)数据仓库的开发特点
3)数据仓库的模型
重点:概念模型、逻辑模型、物理模型
难点:元数据模型、粒度模型
(3)数据仓库设计
主要内容
1)企业模型设计
2)概念模型设计
3)逻辑模型设计
4)物理辑模型设计
重点:概念模型设计、逻辑模型设计
难点:物理模型设计
(4)OLAP技术
主要内容
1)OLAP基本概念
2)OLAP与多维分析
3)基于多维的OLAP
4)关系OLAP
重点:OLAP基本概念、关系OLAP
难点:多维的OLAP
第五章 数据挖掘(学时6)
主要内容
1)数据挖掘概述
2)关联挖掘
3)分类挖掘和预测
4)聚类挖掘
5)时间序列分析
重点:数据挖掘流程、关联规则挖掘、分类挖掘
难点:聚类挖掘、时间序列分析
3.学生应达到的基本要求
要求学生具备数据库系统的基本知识和数据库应用系统的开发经验。通过本课程学习,学生应该掌握数据仓库与数据挖掘领域的基本理论、基本原理和实现技术,对数据仓库及其实现技术与应用有一个整体的、系统的掌握,对OLAP技术以及各类模式的数据挖掘算法有较全面、深入的理解,以适应计算机科学技术新的发展趋势,并为实际应用打下坚实的基础。 三、教学内容与学时分配(课内22学时,实验10学时)
(一)课堂教学(22学时)
第一章 数据仓库导论(学时4)
1.1为何建立数据仓库
1.2数据仓库的定义和基本特征
1.3数据仓库的体系结构和数据组织
1.4数据仓库的关键技术
1.5数据仓库产品
第二章 数据仓库开发过程和模型(4学时)
2.1数据仓库的开发过程
2.2数据仓库的生命周期
2.3数据仓库的开发特点
2.4概念模型
2.5逻辑模型
2.6物理模型
第三章 数据仓库设计(4学时)
3.1 企业模型设计
3.2 概念模型设计
3.3 逻辑模型设计
3.4 物理辑模型设计
第四章 OLAP技术 (4学时)
4.1 OLAP基本概念4.2 OLAP与多维分析4.3 基于多维的OLAP4.4 关系OLAP
第五章 数据挖掘(学时6)
5.1 数据挖掘概述
5.2关联规则挖掘
5.3分类规则挖掘和预测
5.4聚类规则挖掘
5.5时间序列分析
(二)实验教学(10学时)
数据仓库与数据挖掘实验是学习数据仓库与数据挖掘的重要环节,通过实验,可以使学生全面地了解和掌握数据仓库与数据挖掘课程的基本概念、原理及应用技术,使学生系统科学地受到分析问题和解决问题的训练,提高运用理论知识解决实际问题的能力。
数据仓库与数据挖掘实验内容与基本要求:
实验一 数据仓库的构建和ETL
理解数据库与数据仓库之间的区别与联系,掌握数据仓库建立和ETL实现的基本方法及其Sql Server相关工具的使用。
实验二 多维数据组织与OLAP
理解维、成员等基本概念及其之间的关系,理解多维数据集创建的基本原理与流程,掌握OLAP分析的基本过程与方法;
实验三 关联挖掘
理解关联挖掘的原理,掌握利用Sql Server(或SPSS)进行关联分析的方法与步骤。
实验四 分类挖掘
理解分类挖掘的原理,掌握利用Sql Server(或SPSS)进行决策树分析的方法与步骤。
实验五 聚类挖掘
理解聚类挖掘的原理,掌握利用Sql Server(或SPSS)进行聚类分析的方法与步骤。 四、考核方式与成绩评定
1.考核方式:(笔试、论文、口试等)
完成课程论文一篇。
2.成绩评定办法:(平时成绩、期末考试成绩……等
显示全部