Python数据分析基础与应用电子活页5-3使用fillna()函数填充缺失值.docx
Python数据分析基础与应用
模块
PAGE2
PAGE3
电子活页5-3使用fillna()函数填充缺失值
【技能训练5-3】使用fillna()函数填充缺失值
【训练要求】
在JupyterNotebook开发环境中创建j5-03.ipynb,然后编写代码使用fillna()函数填充缺失值。
【实施过程】
(1)从CSV文件中读取数据并创建DataFrame对象
从CSV文件中读取数据时使用na_values参数指定缺失值类型的代码如下:
importpandasaspd
path=rdata\testData01.csv
missing_values=[n/a,na,--]
df1=pd.read_csv(path,na_values=missing_values)
df1
输出结果:
(2)使用标量值填充所有列的缺失值
将缺失值填充为标量值0的代码如下:
#用0填充NaN
df1.fillna(0)
输出结果:
【说明】也可以用其他标量值填充缺失值。
(3)使用标量值填充指定列的缺失值
只针对某一个列来填充缺失值的代码如下:
df1[highT].fillna(0,inplace=True)
df1
输出结果:
(4)使用列方向相邻的数据填充缺失值
代码如下:
#列方向的前向填充
df1.fillna(method=ffill,axis=0)#等价于df1.fillna(method=ffill)
输出结果:
由于第1行前面没有数据,所以lowT列第1行、第2行的缺失值都没有被填充。
(5)使用行方向相邻的数据填充缺失值
代码如下:
#行方向的前向填充
df1.fillna(method=ffill,axis=1)
输出结果:
(6)不同的列使用不同的数值进行填充
代码如下:
df1.fillna({highT:8,lowT:4,AQI:50})
输出结果: