Python数据分析基础与应用电子活页5-4使用函数值替换缺失数据.docx
Python数据分析基础与应用
模块
PAGE2
PAGE3
电子活页5-4使用函数值替换缺失数据
【技能训练5-4】使用函数值替换缺失数据
【训练要求】
在JupyterNotebook开发环境中创建j5-04.ipynb,然后编写代码使用函数值替换缺失数据。
【实施过程】
(1)计算指定列的数据之和
代码如下:
importpandasaspd
path=rdata\testData01.csv
missing_values=[n/a,na,--]
df=pd.read_csv(path,na_values=missing_values)
df1=df.copy()
print(df1[highT].sum())
df1
输出结果:
55.0
(2)使用mean()函数计算指定列的平均值并用其替换缺失值
代码如下:
df2=df.copy()
high=df2[highT].mean()
df2[highT].fillna(high,inplace=True)
df2
输出结果:
(3)使用median()函数计算指定列的中位数并用其替换缺失值
代码如下:
df3=df.copy()
high=df3[highT].median()
df3[highT].fillna(high,inplace=True)
df3
输出结果:
(4)使用mode()函数计算指定列的众数并用其替换缺失值
代码如下:
df4=df.copy()
high=df4[highT].mode()
df4[highT].fillna(12,inplace=True)
df4
输出结果:
(5)使用replace()函数替换通用值
代码如下:
importpandasaspd
data1={date:pd.Series([2022/1/1,2022/1/2,2022/1/3,2022/1/4,2022/1/5]),
highT:pd.Series([12,15,66,12,7]),
lowT:pd.Series([1,4,8,88,5]),
AQI:pd.Series([167,145,123,212,999])}
df5=pd.DataFrame(data1)
#使用replace()函数替换通用值
df5.replace({66:12,88:6,999:104})
输出结果: