《大数据导论》课件——第四章.pptx
大数据导论;ndarray的运算;ndarray数组的运算;Numpy数组运算:一元函数(1);Numpy数组运算:一元函数(2);Numpy数组运算:一元函数——示例;Numpy数组运算:二元函数;Numpy数组运算:二元函数——举例;Numpy数组的转置——ndarray的特殊T属性;Numpy的文件读取操作;np.savetxt():将Numpy数组保存到磁盘中
np.loadtxt():从磁盘中读取数据导Numpy中;CSV?(Comma‐Separated?Value,逗号分隔值)文件;Numpy的文件存储操作——举例;Numpy的文件读取操作;Numpy的文件读取操作——举例;课堂小任务;第一步:读入数据;第二步:排序、去重,并求出和、均值、标准差、方差、最小值、最大值;numpy练习1;1、创建一个5x5的二维数组,其中边界值为1,其余值为0;;代码如下:;2.使用数字0将一个全为1的5x5二维数组包围,效果如下:;代码如下:;3.创建一个10x10的二维数组,并使得1和0沿对角线间隔放置,效果如下:;代码如下:;numpy练习2;4、创建一个0-10的一维数组,并将(1,9]之间的数全部反转成负数,效果如下:
array([0,1,-2,-3,-4,-5,-6,-7,-8,-9,10]);代码如下:;5.创建一个5x5的矩阵,其中每行的数值范围从1到5,效果如下:
array([[1.,2.,3.,4.,5.],
[1.,2.,3.,4.,5.],
[1.,2.,3.,4.,5.],
[1.,2.,3.,4.,5.],
[1.,2.,3.,4.,5.]]);代码如下:;6.创建一个长度为5的一维数组,并将其中最大值替换成0;代码如下:;numpy练习3;7.将二维数组的前两行进行顺序交换,效果如下:
交换前
[[01234]
[56789]
[1011121314]
[1516171819]
[2021222324]]
交换后
[[56789]
[01234]
[1011121314]
[1516171819]
[2021222324]];代码如下:;8、找出给定一维数组中非0元素的位置索引;代码如下:;9.找出数组中缺失值的总数及所在位置,案例如下:;代码如下:;;任务一;任务一——解答;;任务二;任务二——解答;;任务三;任务三——解答;任务三——解答;;任务四;任务四——解答;任务四——解答;Pandas统计分析;;Pandas库的理解;Pandas库的理解(1);Pandas库的理解(2);Pandas库的理解(3);Pandas库的Series类型(1);Pandas库的Series类型(2);Series类型的创建方法;Series类型的创建方法——从标量值创建;Series类型的创建方法——从字典类型创建;Series类型的创建方法—??从ndarray类型创建;Series类型的基本操作;Series类型的基本操作;Series类型的基本操作——index和values操作(1);Series类型的基本操作——index和values操作(2);Series类型的基本操作——类似ndarray类型;Series类型的基本操作——类似ndarray类型的切片和运算;Series类型的基本操作——类似Python字典类型;Series类型的基本操作——通过index修改values的值;Pandas库索引操作;Pandas库——索引;Pandas库——索引类型的常用方法;Pandas库——索引类型的方法使用;Pandas库——删除指定索引对象;Pandas库的数据类型操作——重新索引;Pandas库的数据类型操作——重新索引reindex函数参数;Pandas库的数据类型操作——重新索引举例;Pandas库的数据类型操作;Pandas库数据的算术运算;Pandas库的数据的算术运算——+、-、*、/符号运算;Pandas库的数据的算术运算——加减乘除的方法形式的运算;Pandas库的数据的算术运算——加减乘除的方法形式的运算(1);Pandas库的数据的算术运算——加减乘除的方法形式的运算(2)
;Pandas库数据的比较运算;Pandas库的数据的比较运算(1);Pandas库的数据的比较运算(2);读写文本文件;1.文本文件读取;使用read_table来读取文本文件内容实操。;使用read_table来读取csv文件内容实操;2.文本文件储存;