2.2.2–1众数、中位数、平均数.ppt
文本预览下载声明
用样本的有关情况去估计总体的相应情况,
这种估计大体分为两类,一类是用样本频率分
布估计总体分布,一类是用样本的某种数字特
征(例如平均数、方差等)去估计总体的相应
数字特征。 ;第一课时
众数、中位数、平均数;;平均数: 一组数据的算术平均数,即
x=; 解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.
上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;; 二 、 众数、中位数、平均数与频率分布直方图的关系;频率
组距; 2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.03t. ;频率
组距;说明:
2.03这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.; 3、平均数是频率分布直方图的“重心”.
是直方图的平衡点. n 个样本数据的平均数由公式:;频率
组距;三 三种数字特征的优缺点; 2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。; 3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。 ;说明:; 四 众数、中位数、平均数的简单应用;;拓展与延伸;练习:P76
显示全部