Python数据分析基础与应用电子活页7-24使用DataFrame对象的方法分别绘制直方图、箱形图、面积图和散点图.docx
Python数据分析基础与应用
模块
PAGE2
PAGE3
电子活页7-24使用DataFrame对象的方法分别绘制直方图、箱形图、面积图和散点图
使用DataFrame对象的hist()方法基于数据集df3绘制直方图。
代码如下:
df3.plot.hist()
使用DataFrame对象的hist()方法基于数据集df3绘制的直方图如图1W所示。
图1W使用DataFrame对象的hist()方法基于数据集df3绘制的直方图
使用plot.hist()方法绘制直方图时,还可以设置参数bins,指定直方图的箱数。
给每一列数据都绘制一个直方图,需要使用以下方法:
df3.diff().hist(color=r,alpha=0.5,bins=10)
上述代码中的参数bins用于指定箱数,这里设置为10。
给最高气温、最低气温每一列数据绘制的直方图如图2W所示。
图2W给最高气温、最低气温每一列数据绘制的直方图
使用DataFrame对象的boxplot()方法基于数据集df3绘制箱形图。
通过调用Series.plot.box()、DataFrame.boxplot()或者DataFrame.plot.box()方法绘制箱形图,箱形图将每一列数据的分布情况以可视化的图形展示出来。
使用DataFrame对象的boxplot()方法基于数据集df3绘制箱形图的代码如下:
df3.boxplot()
长沙市指定时间范围内最高气温、最低气温的箱形图如图3W所示。
图3W长沙市指定时间范围内最高气温、最低气温的箱形图
③使用DataFrame对象的area()方法基于数据集df3绘制面积图。
面积图又称区域图,该图强调数量随时间而变化的程度,也可用于引起人们对总值变化趋势的注意。堆积面积图还可以显示部分与整体的关系。折线图和面积图都可以用来帮助我们对趋势进行分析,当数据集有合计关系或者想要展示局部与整体关系的时候,使用面积图为更好的选择。
与折线图相比,面积图看起来更加美观,能够突出每个类别数据所占的面积,展示整体趋势;不仅可以表示数量的多少,而且可以反映同一事物在不同时间里变化的情况;还可以纵向与其他类别数据进行比较,能够直观地反映出各类数据之间的差异。
使用Series.plot.area()或DataFrame.plot.area()方法绘制面积图。
绘制长沙市指定时间范围内最高气温、最低气温面积图的代码如下:
df3.plot.area()
长沙市指定时间范围内最高气温、最低气温的面积图如图4W所示。
图4W长沙市指定时间范围内最高气温、最低气温的面积图
④使用DataFrame对象的scatter()方法绘制散点图。
使用DataFrame.plot.scatter()方法绘制散点图的代码如下:
df3.plot.scatter(x=highT,y=lowT)
长沙市指定时间范围内最高气温、最低气温的散点图如图5W所示。
图5W长沙市指定时间范围内最高气温、最低气温的散点图