文档详情

Python数据分析基础与应用电子活页4-11实现Pandas的字符串操作.docx

发布:2025-05-25约2千字共3页下载文档
文本预览下载声明

Python数据分析基础与应用

模块

PAGE2

PAGE3

电子活页4-11实现pandas的字符串操作

【技能训练4-15】实现pandas的字符串操作

【训练要求】

在JupyterNotebook开发环境中创建j4-15.ipynb,然后编写代码实现pandas的字符串操作。

【实施过程】

(1)使用strip()函数去除字符串两边的空格

代码如下:

importpandasaspd

s1=pd.Series([count,sum,mean,max,min,abs])

s2=s1.str.strip()

print(s2)

输出结果:

0count

1sum

2mean

3max

4min

5abs

dtype:object

(2)使用upper()函数将字符串中的字母转换为大写

代码如下:

print(s2.str.upper())

输出结果:

0COUNT

1SUM

2MEAN

3MAX

4MIN

5ABS

dtype:object

(3)使用len()函数获取字符串的长度

代码如下:

print(s1.str.len())

print(s2.str.len())

输出结果:

05

14

24

34

43

55

dtype:int64

05

13

24

33

43

53

dtype:int64

(4)使用cat()函数以指定的分隔符连接字符串元素

代码如下:

#自动忽略NaN

print(s2.str.cat(sep=_))

输出结果:

count_sum_mean_max_min_abs

(5)使用get_dummies()函数返回一个带有编码值的DataFrame对象

代码如下:

print(s2.str.get_dummies())

输出结果:

abscountmaxmeanminsum

0010000

1000001

2000100

3001000

4000010

5100000

(6)使用repeat函数以指定的次数重复每个元素

代码如下:

print(s2.str.repeat(2))

输出结果:

0countcount

1sumsum

2meanmean

3maxmax

4minmin

5absabs

dtype:object

(7)使用startswith函数判断Series中的元素是否以指定的字符串开头

代码如下:

#若以指定的m开头则返回True

print(s2.str.startswith(m))

输出结果:

0False

1False

2True

3True

4True

5False

dtype:bool

(8)使用find(pattern)函数返回指定字符在字符串中第一次出现的索引

代码如下:

#如果返回-1,则表示该字符串中没有出现指定的字符

print(s2.str.find(m))

输出结果:

0-1

12

20

30

40

5-1

dtype:int64

(9)使用findall(pattern)函数以列表的形式返回出现的字符串

代码如下:

print(s2.str.findall(m))

输出结果:

0[]

1[m]

2[m]

3[m]

4[m]

5[]

dtype:object

(10)使用isnumeric()函数判断Series中组成每个字符串的所有字符是否都为数字

代码如下:

#返回一个布尔值,用来判断是否存在数字型字符串

print(s2.str.isnumeric())

输出结果:

0False

1False

2False

3False

4False

5False

dtype:bool

显示全部
相似文档