Python数据分析基础与应用电子活页4-11实现Pandas的字符串操作.docx
Python数据分析基础与应用
模块
PAGE2
PAGE3
电子活页4-11实现pandas的字符串操作
【技能训练4-15】实现pandas的字符串操作
【训练要求】
在JupyterNotebook开发环境中创建j4-15.ipynb,然后编写代码实现pandas的字符串操作。
【实施过程】
(1)使用strip()函数去除字符串两边的空格
代码如下:
importpandasaspd
s1=pd.Series([count,sum,mean,max,min,abs])
s2=s1.str.strip()
print(s2)
输出结果:
0count
1sum
2mean
3max
4min
5abs
dtype:object
(2)使用upper()函数将字符串中的字母转换为大写
代码如下:
print(s2.str.upper())
输出结果:
0COUNT
1SUM
2MEAN
3MAX
4MIN
5ABS
dtype:object
(3)使用len()函数获取字符串的长度
代码如下:
print(s1.str.len())
print(s2.str.len())
输出结果:
05
14
24
34
43
55
dtype:int64
05
13
24
33
43
53
dtype:int64
(4)使用cat()函数以指定的分隔符连接字符串元素
代码如下:
#自动忽略NaN
print(s2.str.cat(sep=_))
输出结果:
count_sum_mean_max_min_abs
(5)使用get_dummies()函数返回一个带有编码值的DataFrame对象
代码如下:
print(s2.str.get_dummies())
输出结果:
abscountmaxmeanminsum
0010000
1000001
2000100
3001000
4000010
5100000
(6)使用repeat函数以指定的次数重复每个元素
代码如下:
print(s2.str.repeat(2))
输出结果:
0countcount
1sumsum
2meanmean
3maxmax
4minmin
5absabs
dtype:object
(7)使用startswith函数判断Series中的元素是否以指定的字符串开头
代码如下:
#若以指定的m开头则返回True
print(s2.str.startswith(m))
输出结果:
0False
1False
2True
3True
4True
5False
dtype:bool
(8)使用find(pattern)函数返回指定字符在字符串中第一次出现的索引
代码如下:
#如果返回-1,则表示该字符串中没有出现指定的字符
print(s2.str.find(m))
输出结果:
0-1
12
20
30
40
5-1
dtype:int64
(9)使用findall(pattern)函数以列表的形式返回出现的字符串
代码如下:
print(s2.str.findall(m))
输出结果:
0[]
1[m]
2[m]
3[m]
4[m]
5[]
dtype:object
(10)使用isnumeric()函数判断Series中组成每个字符串的所有字符是否都为数字
代码如下:
#返回一个布尔值,用来判断是否存在数字型字符串
print(s2.str.isnumeric())
输出结果:
0False
1False
2False
3False
4False
5False
dtype:bool