文档详情

Python数据分析基础与应用电子活页5-3使用fillna()函数填充缺失值.docx

发布:2025-05-24约小于1千字共3页下载文档
文本预览下载声明

Python数据分析基础与应用

模块

PAGE2

PAGE3

电子活页5-3使用fillna()函数填充缺失值

【技能训练5-3】使用fillna()函数填充缺失值

【训练要求】

在JupyterNotebook开发环境中创建j5-03.ipynb,然后编写代码使用fillna()函数填充缺失值。

【实施过程】

(1)从CSV文件中读取数据并创建DataFrame对象

从CSV文件中读取数据时使用na_values参数指定缺失值类型的代码如下:

importpandasaspd

path=rdata\testData01.csv

missing_values=[n/a,na,--]

df1=pd.read_csv(path,na_values=missing_values)

df1

输出结果:

(2)使用标量值填充所有列的缺失值

将缺失值填充为标量值0的代码如下:

#用0填充NaN

df1.fillna(0)

输出结果:

【说明】也可以用其他标量值填充缺失值。

(3)使用标量值填充指定列的缺失值

只针对某一个列来填充缺失值的代码如下:

df1[highT].fillna(0,inplace=True)

df1

输出结果:

(4)使用列方向相邻的数据填充缺失值

代码如下:

#列方向的前向填充

df1.fillna(method=ffill,axis=0)#等价于df1.fillna(method=ffill)

输出结果:

由于第1行前面没有数据,所以lowT列第1行、第2行的缺失值都没有被填充。

(5)使用行方向相邻的数据填充缺失值

代码如下:

#行方向的前向填充

df1.fillna(method=ffill,axis=1)

输出结果:

(6)不同的列使用不同的数值进行填充

代码如下:

df1.fillna({highT:8,lowT:4,AQI:50})

输出结果:

显示全部
相似文档