文档详情

Python数据分析基础与应用电子活页5-4使用函数值替换缺失数据.docx

发布:2025-05-24约1.13千字共3页下载文档
文本预览下载声明

Python数据分析基础与应用

模块

PAGE2

PAGE3

电子活页5-4使用函数值替换缺失数据

【技能训练5-4】使用函数值替换缺失数据

【训练要求】

在JupyterNotebook开发环境中创建j5-04.ipynb,然后编写代码使用函数值替换缺失数据。

【实施过程】

(1)计算指定列的数据之和

代码如下:

importpandasaspd

path=rdata\testData01.csv

missing_values=[n/a,na,--]

df=pd.read_csv(path,na_values=missing_values)

df1=df.copy()

print(df1[highT].sum())

df1

输出结果:

55.0

(2)使用mean()函数计算指定列的平均值并用其替换缺失值

代码如下:

df2=df.copy()

high=df2[highT].mean()

df2[highT].fillna(high,inplace=True)

df2

输出结果:

(3)使用median()函数计算指定列的中位数并用其替换缺失值

代码如下:

df3=df.copy()

high=df3[highT].median()

df3[highT].fillna(high,inplace=True)

df3

输出结果:

(4)使用mode()函数计算指定列的众数并用其替换缺失值

代码如下:

df4=df.copy()

high=df4[highT].mode()

df4[highT].fillna(12,inplace=True)

df4

输出结果:

(5)使用replace()函数替换通用值

代码如下:

importpandasaspd

data1={date:pd.Series([2022/1/1,2022/1/2,2022/1/3,2022/1/4,2022/1/5]),

highT:pd.Series([12,15,66,12,7]),

lowT:pd.Series([1,4,8,88,5]),

AQI:pd.Series([167,145,123,212,999])}

df5=pd.DataFrame(data1)

#使用replace()函数替换通用值

df5.replace({66:12,88:6,999:104})

输出结果:

显示全部
相似文档