《数据分析和可视化》教学大纲.docx
《数据分析和可视化》教学大纲
课程编号英文名称:Dataanalysisandvisualization
学分:1
学时:总学时48学时,其中理论16学时,实验32学时
先修课程:高等数学、智能电子商务、Python程序设计基础
课程类别:专业必修课程
授课对象:大数据管理与应用专业学生
教学单位:商学院
修读学期:第3学期
一、课程描述和目标
《数据分析与可视化》是大数据管理与应用专业的必修课,是一门重要的专业基础课程。通过《数据分析与可视化》课程的学习,培养学生对信息数据的处理、分析以及可视化表达的能力。能够使用NumPy对数据进行处理和科学计算;能够使用Pandas对数据进行筛选、缺省值处理、数据合并等操作;能够使用Matplotlib实现折线图、条形图、散点图、子图以及饼图等将数据可视化展示。
课程目标:
1.专业知识方面。学习与掌握数据分析知识,掌握数据分析技能。
2.专业能力方面。熟练使用Python编程进行实战操作,通过完整数据分析实例地学习,更好地掌握数据分析技能,做到理论与实践相结合,方法与应用相结合。
3.综合能力和素质方面。使用数据分析和可视化工具完成专业级别的数据处理、分析和可视化功能,解决学习和实践中遇到的问题,为更深入地学习打下良好地基础,打造可持续的竞争力。强化学生在数据分析中的基本技巧与能力,有效表达自己思想与意愿的能力,倾听与理解他人需求和意愿的能力,适应工作与人机环境变化的能力。
二、课程目标对毕业要求的支撑关系
毕业要求指标点
课程目标
权重
专业素养:2-1
课程目标1
M
实践应用能力:3-1、3-2
课程目标2、3
H
人文道德素养:1-3
课程目标3
M
三、教学内容、基本要求与学时分配
序号
教学内容
基本要求及重、难点(含德育要求)
学时
教学
方式
对应课程目标
1
数据分析概述与基本概念
了解数据分析的定义和历史背景;了解数据分析的目的和任务;了解数据分析与数据挖掘的关系;了解机器学习与数据分析的关系;了解数据分析的基本步骤,即数据收集、数据预处理、数据分析与知识发现和数据后处理,以及每个基本步骤的概念与内容;了解Python在数据分析领域所具有的优点。
2
集中讲授
课程目标1、2
2
Python基础知识
了解Python的发展史;了解Python及Panda、scikit-learn、Matplotlib的安装;掌握Python的基础知识及Python的一些特性,包括缩进在Python的重要性、Python包的使用方法、注释的使用方法、Python语法知识;了解Pandas、scikit-learn、Matplotlib等重要Python库;了解Jupyter交互式数据科学与科学计算开发环境。
2
集中讲授
课程目标1、2、3
3
数据预处理
了解数据的集中趋势、离散程度、相关性测量、数据缺失、噪声、离群点等概念;了解数据质量标准评估的完整性、一致性、准确性和及时性4个要素。了解数据清洗的概念及方式,包括缺失值的处理、噪声数据的处理、不一致数据的处理和异常数据的处理;了解数据的特征选择、特征构建和特征提取。
2
集中讲授
课程目标1、2
4
NumPy——数据分析基础工具
了解NumPy库的作用;掌握多维数组对象ndarray的使用,包括ndarray的创建、ndarray的索引、切片和迭代、ndarray的shape的操作、ndarray的基础操作等。
2
集中讲授、案例讨论
课程目标1、2、3
5
Pandas——处理结构化数据
了解Pandas库的作用和特色功能;了解Pandas中Series和DataFrame两种主要数据结构;掌握Series对象的创建、访问和操作;掌握DataFrame对象的创建、访问和操作;掌握基于Pandas的Index对象的访问操作;了解Pandas的相关数学统计和计算工具;了解Pandas的数学聚合和分组运算。
2
集中讲授、案例讨论
课程目标1、2、3
6
数据分析与知识发现
了解分类分析的基本概念;了解逻辑回归、线性判别分析、支持向量机、决策树、K近邻和朴素贝叶斯的相关知识;了解关联分析的基本概念,包括关联规则定义、指标定义和关联规则挖掘定义;了解关联分析的Apriori算法、FP-Tree
2
集中讲授、案例讨论
课程目标1、2
7
Matplotlib——交互式图表绘制
了解Matplotlib的作用;掌握Matplotlib中的基本布局对象的建立;掌握修改图表样式、修改装饰项和添加注释的方法;掌握基础图表的绘制,包括直方图、散点图、柱状图、折线图和表格;了解使用Matplot3D绘制三维图形的方法;了解Matplotlib与Jupyter结合使用的方法。
4
集中讲授
课程目标1、2
合计
16