课程教学大纲_数据挖掘与机器学习.doc
文本预览下载声明
1 -
6 -
数据挖掘与机器学习
Data Mining and Machine Learning
一、课程基本信息
学 时:40(含实验学时12)
学 分:2.5
考核方式:考查
先修课程:概率论与随机过程、高级程序设计语言、算法分析与设计、数据库原理
课程简介:《数据挖掘与机器学习》是信息与计算科学专业的专业选修课。从数据分析的角度看,统计学主要是通过机器学习来实现数据挖掘,因此大多数数据挖掘技术都源自机器学习领域,而从计算机科学的角度看,机器学习算法和数据库原理则是数据挖掘的两大支撑技术。本课程的学习目的在于使学生掌握数据挖掘的基本概念、基本原理,常用的机器学习算法与数据分析方法,以及它们在工程实践中的应用。为从事数据挖掘算法设计、数据分析工作和工程实践打下必要的基础。
二、教学目的与要求
数据挖掘与机器学习作为计算机科学相关专业的一门专业课,其前续课程有《程序设计语言》、《数据结构》、《数据库原理》和《算法分析与设计》等。本课程的教学目的在于使学生掌握对数据进行分析和算法设计的能力,培养学生分析数据、获取知识的基本能力。
重点掌握以下几个方面的知识:
数据挖掘与机器学习基础知识;
分类、预测与回归;
聚类分析;
集成学习;
离群点挖掘;
数据挖掘的扩展与应用。
三、教学方法与手段
1、教学方法
数据挖掘与机器学习理论性较强,涉及较强的理论知识及数学知识,是本专业的具有广阔应用前景的理论课程。在课程的教学过程中,根据教学内容的不同,综合采用多种的教学方法,着重培养学生定性分析、定量估算和模拟实验研究的能力,以更好地完成教学任务。
课堂讲授:在课堂讲学的内容方面既要保持理论的系统性,又要注意联系工程实际,同时将大问题分成几个小问题进行讲解,然后再把小问题组装成大问题让学生更好理解。
编程教学:讲授过程中,对于某些算法,老师通过课堂编程进行详细讲解,让学生更好的理解和掌握相关技术。
课堂讨论:可以对学生分组进行组内讨论,由于与数据挖掘竞赛息息相关,可以以2~3位学生一组,通过组内队员分析与讲解,提高学生的学习与理解能力,同时培养学生的团队协作能力。
启发式教学:在教学过程中以学生为中心进行引导,教师与学生进行互动探讨。教师首先引入实际问题,让学生积极思考,并让学生通过学习教材进行分析与解决该问题,然后教师适当讲解解题思路。教师在讲解过程中鼓励学生多发问,与学生互动探讨在思考该问题时遇到的难点与解决方法,同时对该问题的解决思路及核心算法进行讲解。
2、教学手段
在教学中采用多种教学手段。
多媒体课件:本课程已制作了相应的多媒体演示课件,与传统板书相结合进行讲授。
教学网站:目前校外有很多优秀的数据挖掘与机器学习网站,可以指定学生在相关网站注册学习,既增加学生兴趣又可以提高学生在课外自主学习能力。
网上答疑:学生可以通过QQ平台或者电子邮件等方式和教师交流,教师及时解答学生的问题。
四、 教学内容及目标
教学内容
教学目标
学时分配
第一章 绪论
2
第一节 数据挖据与机器学习概述
了解
第二节 经典案例:天气问题与大豆分类
理解
第三节 其它应用领域
了解
2
重点与难点:掌握数据弯角的起源、过程与功能,以及面临的主要问题;要求学生对数据挖掘能够解决的问题和解决问题的思路有清晰的认识。
衡量学习是否达到目标的标准:通过课堂提问及实验考核的方式掌握学生学习的效果。
第二章 数据挖掘基础知识
3
第一节 输入和输出:实例、属性和知识表达
了解
第二节 算法:基本方法
理解
1
第三节 数据预处理
掌握
2
重点与难点:数据信息的呈现形式、基本知识的表达形式;数据清洗、集成、变换和规约等数据预处理方法。
衡量学习是否达到目标的标准:通过课堂提问及实验考核的方式掌握学生学习的效果。
第三章 分类、预测与回归
7
第一节 决策树
掌握
第二节 贝叶斯分类
理解
第三节 k-最近邻分类
掌握
3
第四节 人工神经网络
理解
第五节 分类与预测算法的评价
掌握
2
第六节 线性回归
理解
第七节 Logistic回归
理解
2
实验一 决策树模型的生成与预测
掌握
4
重点与难点:数据分类与预测的概念、算法原理及应用;回归分析、模型的拟合和过拟合问题;常用分类与回归算法的原理及其应用。
衡量学习是否达到目标的标准:通过课堂提问及实验考核的方式掌握学生学习的效果。
第四章 聚类分析
6
第一节 划分方法:k-means算法
掌握
2
第二节 层次分析方法
理解
1
第三节 基于模型的方法:神经网络
了解
1
第四节 聚类算法的评价
掌握
2
实验二 聚类分析
掌握
4
重点与难点:相似度的度量方法、常用聚类算法的原理及其应用。
衡量学习是否达到目标的标准:通过课堂提问及实验考核的方式掌握学生学习的效果。
第五章 集成学习
显示全部