python数据分析基础教程(第2版)教案 (第7章)pandas数据分析基础.doc
《Python数据分析基础教程(第2版)》
教
案
《Python数据分析基础教程(第2版)》人民邮电出版社 作者:郑丹青
PAGE19
课程基本信息
课程名称
Python数据分析基础教程
授课班级
授课课题名
pandas数据分析基础—
pandas的数据结构及常用操作
计划课时
4-6课时
授课时间
第周第课时
课型
教学做一体化
教学目标
了解pandas作用。
掌握pandas测试、安装与导入。
掌握Series对象及常用操作。
掌握DataFrame对象及常用操作。
教学重点
Series对象及常用操作
教学难点
DataFrame对象及常用操作
教法与学法
教法:案例教学法;
学法:探究学习、小组合作学习。
教学过程
【课前任务】
自主学习
pandas测试、安装与导入。
【课中任务】
分组讨论
针对pandas测试、安装与导入中遇到问题开展小组讨论,互帮互学,解决软件安装中问题。
教师组织小组讨论,并根据学生疑难问题,统一进行解答。
【新课讲授】
任务一:pandas作用
知识点讲解
pandas最初是由韦斯·麦金尼(WesMcKinney)于2008年开发,并于2009年实现开源。目前,pandas由专注于Python数据包开发的PyData团队进行日常的开发和维护工作。
pandas是以NumPy为基础进行设计的,在数据分析中pandas和NumPy这两个模块经常是一起使用的。另外,为了数据分析的需要,pandas专门设计了两种新型的数据结构。使用这两种数据结构管理与SQL关系数据库和Excel工作表具有类似特征的数据会非常方便。由于pandas最初是作为金融数据分析工具而开发出来的,因此,pandas为时间序列分析提供了很好的支持。
根据开发pandas时提出的需求,pandas的基本特点如下。
能按轴自动或显式数据对齐,这可以防止许多数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。
能集成时间序列数据。
既能处理时间序列数据,也能处理非时间序列数据的数据结构。
数学运算和简约(比如对某个轴求和)可以根据不同的元数据(轴编号)执行。
能灵活处理缺失数据。
合并及其他出现在常见数据库(例如基于SQL)中的关系运算。
抽答问题
任务二:pandas测试、安装与导入
知识点总结
1、测试Python环境中是否安装了pandas
当Python安装完成后,在Windows操作系统下,按【Windows】+【R】键,打开“运行”对话框,在打开栏中输入python,按【Enter】键,进入Python交互式终端。在Python命令提示符后中输入frompandasimport*导入pandas模块,如果在交互式终端中出现ModuleNotFoundError:Nomodulenamedpandas的错误提示,则需要安装pandas,否则表明已安装了pandas。
2、在Windows操作系统下安装pandas方法
第1种安装方法如下。
在计算机连接互联网的情况下,按【Windows】+【R】键,打开“运行”对话框,在打开栏中输入pipinstallpandas命令,按【Enter】键,进入pandas模块安装,安装成功就会提示安装成功的版本。
第2种安装方法如下。
①首先访问Python的第三方库网站,然后,根据计算机上所安装的Python版本和操作系统版本来选择下载相应的pandas软件包。
②将下载的软件包复制在Python安装目录的Scripts文件夹下,例如,Python3.10安装目录为D:\Python,则将下载的软件包复制到D:\Python\Scripts目录下。
③按【Windows】+【R】键,打开“运行”对话框,在打开栏中输入pipinstallD:\python\Scripts\下载的软件包名称,按【Enter】键,进入pandas模块安装。
④安装成功会出现软件安装成功的提示。
3、在PyCharm中安装pandas的方法
4、pandas的导入方法
importpandasaspd
或者
frompandasimport*
学生自主提问,教师对疑难问题进行解答。
任务三:Series对象及常用操作
提出问题
pandas有哪些数据结构?分别可以存储什么类型数据?
知识点讲解
Series对象
pandas的核心是Series和DataFrame两大数据结构,其中,Series数据结构是用于存储一个序列的一维数组,而DataFrame数据结构则是用于存储复杂的二维数组。
Seri