Python数据分析基础与应用电子活页4-2创建Series对象与使用Series的常用方法.docx
Python数据分析基础与应用
模块
PAGE2
PAGE3
电子活页4-2创建Series对象与使用Series的常用方法和函数
【技能训练4-4】创建Series对象与使用Series的常用方法和函数
【训练要求】
在JupyterNotebook开发环境中创建j4-04.ipynb,然后编写代码创建一个Series对象,并使用Series的常用方法和函数。
【实施过程】
(1)使用方法head()和tail()查看数据
代码如下:
importpandasaspd
s1=pd.Series([1,2,3,4,5,6])
print(s1)
#输出前两行数据
print(s1.head(2))
#输出后两行数据
print(s1.tail(2))
输出结果:
01
12
23
34
45
56
dtype:int64
01
12
dtype:int64
45
56
dtype:int64
(2)使用方法isnull()和notnull()检测缺失值
代码如下:
importpandasaspd
#None代表缺失值
s2=pd.Series([1,2,5,None])
print(pd.isnull(s2))#如果值不存在或者缺失则返回True
print(pd.notnull(s2))#如果值不存在或者缺失则返回False
输出结果:
0False
1False
2False
3True
dtype:bool
0True
1True
2True
3False
dtype:bool
(3)使用函数unique()获取由Series对象去重后的元素所组成的数组
代码如下:
s3=pd.Series([6,5,3,4,3,2,2])
print(s3.unique())
输出结果:
[65342]
(4)使用函数value_counts()获取由Series对象去重后的元素所组成的数组
代码如下:
print(s3.value_counts())
输出结果:
32
22
61
51
41
dtype:int64
上述输出结果中左边是元素,右边是元素出现的次数。
(5)使用函数isin()判断指定元素在Series数据结构中是否存在
代码如下:
s4=pd.Series([5,1,4,3,6,2])
print(s4.isin([3]))
print(s4.isin([2,4,6]))
print(s4.isin([8]))
print(s4.isin([3,8]))
输出结果:
0False
1False
2False
3True
4False
5False
dtype:bool
0False
1False
2True
3False
4True
5True
dtype:bool
0False
1False
2False
3False
4False
5False
dtype:bool
0False
1False
2False
3True
4False
5False
dtype:bool