文档详情

python数据分析基础教程教案 (第7章 pandas数据分析基础).doc

发布:2025-06-09约1.61万字共26页下载文档
文本预览下载声明

《Python数据分析基础教程》

PAGE19

课程基本信息

课程名称

Python数据分析基础教程

授课班级

授课课题名

pandas数据分析基础—

pandas的数据结构及常用操作

计划课时

4-6课时

授课时间

第周第课时

课型

教学做一体化

教学目标

了解pandas作用。

掌握pandas测试、安装与导入。

掌握Series对象及常用操作。

掌握DataFrame对象及常用操作。

教学重点

Series对象及常用操作

教学难点

DataFrame对象及常用操作

教法与学法

教法:案例教学法;

学法:探究学习、小组合作学习。

教学过程

【课前任务】

自主学习

pandas测试、安装与导入。

【课中任务】

分组讨论

针对pandas测试、安装与导入中遇到问题开展小组讨论,互帮互学,解决软件安装中问题。

教师组织小组讨论,并根据学生疑难问题,统一进行解答。

【新课讲授】

任务一:pandas作用

知识点讲解

pandas最初是由韦斯·麦金尼(WesMcKinney)于2008年开发,并于2009年实现开源。目前,pandas由专注于Python数据包开发的PyData团队进行日常的开发和维护工作。

pandas是以NumPy为基础进行设计的,在数据分析中pandas和NumPy这两个模块经常是一起使用的。另外,为了数据分析的需要,pandas专门设计了两种新型的数据结构。使用这两种数据结构管理与SQL关系数据库和Excel工作表具有类似特征的数据会非常方便。由于pandas最初是作为金融数据分析工具而开发出来的,因此,pandas为时间序列分析提供了很好的支持。

根据开发pandas时提出的需求,pandas的基本特点如下。

能按轴自动或显式数据对齐,这可以防止许多数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。

能集成时间序列数据。

既能处理时间序列数据,也能处理非时间序列数据的数据结构。

数学运算和简约(比如对某个轴求和)可以根据不同的元数据(轴编号)执行。

能灵活处理缺失数据。

合并及其他出现在常见数据库(例如基于SQL)中的关系运算。

抽答问题

任务二:pandas测试、安装与导入

知识点总结

1、测试Python环境中是否安装了pandas

当Python安装完成后,在Windows操作系统下,按【Windows】+【R】键,打开“运行”对话框,在打开栏中输入python,按【Enter】键,进入Python交互式终端。在Python命令提示符后中输入frompandasimport*导入pandas模块,如果在交互式终端中出现ModuleNotFoundError:Nomodulenamedpandas的错误提示,则需要安装pandas,否则表明已安装了pandas。

2、在Windows操作系统下安装pandas方法

第1种安装方法如下。

在计算机连接互联网的情况下,按【Windows】+【R】键,打开“运行”对话框,在打开栏中输入pipinstallpandas命令,按【Enter】键,进入pandas模块安装,安装成功就会提示安装成功的版本。

第2种安装方法如下。

①首先访问Python的第三方库网站,然后,根据计算机上所安装的Python版本和操作系统版本来选择下载相应的pandas软件包。

②将下载的软件包复制在Python安装目录的Scripts文件夹下,例如,Python3.10安装目录为D:\Python,则将下载的软件包复制到D:\Python\Scripts目录下。

③按【Windows】+【R】键,打开“运行”对话框,在打开栏中输入pipinstallD:\python\Scripts\下载的软件包名称,按【Enter】键,进入pandas模块安装。

④安装成功会出现软件安装成功的提示。

3、在PyCharm中安装pandas的方法

4、pandas的导入方法

importpandasaspd

或者

frompandasimport*

学生自主提问,教师对疑难问题进行解答。

任务三:Series对象及常用操作

提出问题

pandas有哪些数据结构?分别可以存储什么类型数据?

知识点讲解

Series对象

pandas的核心是Series和DataFrame两大数据结构,其中,Series数据结构是用于存储一个序列的一维数组,而DataFrame数据结构则是用于存储复杂的二维数组。

Series是一种类似于一维数组的对象,它是由一组数据(可以是Numpy中任意类型的数据)以

显示全部
相似文档