《数据挖掘与应用》课程教学大纲.docx
《数据挖掘与应用》教学大纲
课程编号英文名称:DataMiningandItsApplications
学分:3
学时:总学时64学时,其中理论32学时,实践32学时
先修课程:Python编程技术
课程类别:专业主干课程
授课对象:数据科学与大数据技术专业学生
教学单位:机械与电气工程学院
修读学期:第5学期
一、课程描述和目标
数据挖掘作为高级数据处理和分析技术,是数据科学与大数据技术的专业课程,通过本课程学习让学生掌握数据预处理技术(包括数据度量、数据清理、数据集成和转换等方法)和数据挖掘技术(包括分类、预测、关联和聚类的概念与技术),并且熟悉数据挖掘的基本原理和发展方向。本课程以介绍基本概念和基本算法为主,以前沿问题的讨论与探索为辅,其目的是培养学生数据分析和处理的能力,锻炼创造性思维和创新性实践能力,具备初步的科研能力和创造能力。
本课程拟达到的课程目标:通过本课程的学习,学生的计算思维能明显提升,能够通过编写程序研究与计算机相关的复杂工程问题。具体的课程目标如下:
课程目标1:要求学生掌握数据挖掘的基本过程,掌握数据预处理技术,包括数据清理、数据集成和转换、数据归约等方法,能够根据需要对数据进行预处理,满足后续数据挖掘分析需要。
课程目标2:要求学生掌握经典的数据挖掘技术,包括分类、预测、关联和聚类等经典的数据挖掘算法,要求学生有动手实践能力,能够用高级语言实现相关算法。
课程目标3:要求学生了解数据挖掘的发展方向,根据具体问题能选择合适数据,选择和探索相关的新算法进行数据分析和解释,得到问题合理有效的结论。
二、课程目标对毕业要求的支撑关系
毕业要求指标点
课程目标
权重
1-3:能够将面向对象程序设计思想、数据库设计与数据管理思想用于复杂大数据系统的设计与优化。
课程目标1
H
3-1:针对大数据系统工程问题,能够在理解复杂工程问题的基础上定义功能、目标和限制,并设计开发复杂工程问题的解决方案。
课程目标2
M
5-1:能够针对大数据工程问题,为构建复杂工程问题的模拟环境选择和使用合适的现代工程工具和信息技术工具,并能理解其局限性。
课程目标3
H
9-1:能够在多学科背景下主动与团队中其他成员沟通、合作、开展工作。
课程目标2
L
12-1:具备持续更新和提高自我知识、能力与素质的终身学习意识。
课程目标3
M
三、教学内容、基本要求与学时分配
序号
教学内容
基本要求及重、难点(含德育要求)
学时
教学
方式
对应课程目标
1
数据挖掘导论
要求学生对数据挖掘技术有一个总体的认识。掌握数据挖掘技术的概念、分类和挖掘过程,对数据挖掘过程有完整的认识,构建完整的理论框架,培养职业道德和技术操守。
德育要求:积极向上、自主学习、团队合作、乐于分享。
4
讲授
演示
练习
课程目标1
2
数据与数据预处理
掌握相似性和相异性度量的概念和基本方法;了解数据中心趋势度量,数据离散程度度量和图形化表示等数据统计刻画的多种手段;掌握经典的数据清洗、集成和转换等预处理方法,能够根据数据挖掘需要对初始数据进行预处理
德育要求:积极向上、自主学习、团队合作、乐于分享。
4
讲授
演示
练习
课程目标1
3
关联规则挖掘
掌握基于频繁模式的关联规则挖掘的原理和过程;掌握Apriori算法的高级语言实现和数据分析;数据关联性的统计分析能力,能独立完成实际数据的关联分析实验
德育要求:积极向上、自主学习、团队合作、乐于分享。
4
讲授
演示
练习
课程目标2
4
聚类分析
掌握无监督学习和有监督学习的基本概念;掌握基于距离的聚类算法k-means算法;掌握基于密度聚类算法DBSACN算法
德育要求:积极向上、自主学习、团队合作、乐于分享。
4
讲授
演示
练习
课程目标2
5
分类和预测
理解分类的基本过程和分类方法的评价方式;理解预测的基本过程和预测方法的评价方式;掌握贝叶斯分类算法的过程和高级语言实现;掌握决策树ID3分类算法的过程和高级语言实现;掌握Logistic回归分析算法过程
德育要求:积极向上、自主学习、团队合作、乐于分享。
4
讲授
演示
练习
课程目标2
6
应用问题
能够对复杂工程问题进行分析,并能自行探索使用Python工具解决复杂问题的方案。(使用python进行数据挖掘案例,如预测建模、图像的聚类分割等)
德育要求:积极向上、自主学习、团队合作、乐于分享。
12
讲授
演示
练习
课程目标3
合计
32
序号
实验项目
实验内容与要求
学时
类型
对应课程目标
1
数据预处理
进行特定数据按照要求编程实现对数据清洗、转换和度量
4
验证
课程目标1
2
关联规则挖掘
编程针对特定数据实现Apriori算法频繁集和关联规则的产生
4
验证
课程目标2
3
聚类分析
Kmeans算法