文档详情

第二章离散趋势.ppt

发布:2017-04-07约5.36千字共38页下载文档
文本预览下载声明
计量资料的统计描述 离散趋势的描述 离散趋势的描述 离散趋势的概念: 描述一群变量值分布特征时,除用平均数表示其集中位置外,还要说明变量值的分散或变异情况。说明变异情况的特征值称变异指标。 变异指标又称离散指标。它用于描述一群计量资料变量值之间参差不齐的程度,即离散程度或变异程度。 离散趋势统计指标 例2-11 试观察三组数据的离散状况。A组:26,28,30,32,34;B组:24,27,30,33,36;C组:26,29,30,31,34。将三组数据分别点在直线上,如图2-4所示。 离散趋势的描述 可见平均数只反映平均水平,还需用变异指标来反映离散度,两者结合起来才能全面说明一组变量值的分布特征。 描述离散趋势的统计指标 极差(Range) 四分位间距(Quartile range ) 方差(Variance) 标准差(Standard Deviation) 变异系数(Coefficient of Variation) 一、极差(Range) 符号:R 计算:R=最大值-最小值 R反映的是观察值变异的范围大小。 适用条件:任何资料 极差反映个体变异的范围,R大,变异度就大。 缺点:易受特大、特小值影响,不稳定;除最大、最小值,不能反映其他数据的变异度;样本量越大极差就会越大。 优点:简单明了 如上述三组数据中: 甲组数据的极差 R=34-26=8 乙组数据的极差 R=36-24=12 丙组数据的极差 R=34-26=8 甲组、丙组数据分布较乙组集中。 甲组与丙组的离散程度相同? 二、四分位间距(Quartile range ) 百分位数(Percentile) 以Px表示,是一种位置指标。它是指把全部数据由小到大排列后处于第X百分位置的数值。Px将总体或样本的全部观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比他大。 四分位数间距 quantile range 符号: Q QU~QL (中间一半观察值的极差) 计算 :Q=P75-P25 Q越大说明数据间的变异越大。 适用条件:可用于任何资料,主要用于偏态资料 特点:比极差要稳定 常与中位数一起,描述不对称分布资料的特征。 例 试求下列频数表数据的四分位数间距。 三、 方差 (variance) 方差 (variance)也称均方差(mean square deviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。 样本方差为什么要除以(n-1) 方差(variance) 方差越大,观察值的变异就越大 适用条件:对称分布、正态分布 特点:它反映的是所有观察值的变异情况 单位:原变量单位的平方 四、标准差 (standard deviation) 标准差 (standard deviation)即方差的正平方根;其单位与原变量X的单位相同。 计算 直接法: 加权法(频数表): 例 利用下表中的数据和频数表法计算标准差。 标准差 适用条件:对称分布、正态分布资料 意义:全面反映了一组观察值的变异程度.(越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好) 应用: 表示变量值的离散程度。均数相近,度量衡单位相同的条件下,标准差越大则变异程度越大。 结合均数描述正态分布特征 计算变异系数、标准误 标准差 例2-1 三组同龄男孩的身高值(cm) R S 甲组 90 95 100 105 110 100 20 7.91 乙组 96 98 100 102 104 100 8 3.16 丙组 96 99 100 101 104 100 8 2.92 标准差的意义: 反映一组变量值平均相差的水平,单位相同时,S越小,表示数据的变异程度越小,同时表示该组均数的代表性越大。 五、变异系数 ( coefficient of variation) 描述相对离散程度的指标 符号: CV(没有单位) 计算: 适用条件:①观察指标单位不同,如身高、体重 ②同单位资料,但均数相差悬殊 变异系数的两个特点及相应的用途 没有单位 反映标准差占均数的百分比或标准差是均数的几倍 可用来比较度量衡单位不同的资料的变异度 不受平均水平
显示全部
相似文档