统计资料的描述离散程度.ppt
文本预览下载声明
第 四 章 统计资料的描述第四节 离散程度的描述 离散程度的描述 主要内容 离中趋势,离散指标 全距,平均差,标准差 离散系数 集中趋势是一个说明同质总体各个变量值的代表值,其代表性如何?决定于被平均值之间的变异程度。在统计中,把反映现象总体中各个体的变量值之间的差异程度的指标成为离散程度。反映离散程度的指标有绝对数的和相对数的两类。 绝对数的指标: 全距(极差) 平均差 标准差 相对数的指标: 离散系数(平均差系数、标准差系数) 一、离中趋势和离散指标的概念: 离中趋势:就是变量分布中各变量值远离中心值的倾向。测度离中趋势的指标叫离散指标。 离散指标又称标志变异指标它是反映总体各单位标志值变动范围和差异程度的指标。它说明了变量分布中各变量值远离中心值或代表值程度的指标。 平均指标和离散指标是一对指标,集中趋势让我们知道用怎样的值去估计和预测总体,而离散趋势让我们知道估计值误差的大小。结合起来能更准确地说明变量分布的数量特征。 二、标志变异指标的作用 1、用标志变异指标衡量和比较平均指标的代表性。 2、用标志变异指标反映经济活动过程的均衡性、稳定性和节奏性。 3、标志变异指标在相关分析和抽样调查中的应用。 甲乙丙三车间都有7个工人,生产的零件数如下: 甲:72 73 74 75 76 77 78 乙:30 50 65 75 90 100 115 丙:75 75 75 75 75 75 75 平均数都为75件。但代表性谁好? 有甲乙两厂: 月计划完成% 上旬% 中旬% 下旬% 甲 100 10 20 70 乙 100 32 33 35 甲乙两厂哪个厂生产的稳定性,均衡性,节奏性谁好? 标志变异指标的测定方法 (一)全距(极差,Range ) 1、极差: 1)极差也称全距,它是统计总体中两个极端标志值之差,表明总体中标志值变动的范围。 2)计算公式: (未分组) (分组) 式中:Umax代表最高组的上限; Lmin代表最低组的下限。 某校某系有1,2两班,某科成绩抽样如下: 1班:100 80 85 70 60 40 10 2班:90 80 70 60 50 40 40 差异程度: R1=100-10=90 R2=90-40=50 优点: 缺点: 四分位差仅与50%的数值有关,而不考虑数据前后各占25%的数值。这样避免了全距易受极端值影响的缺陷,同时也表明了50%数据的离散趋势。此外,中位数经常与四分位差结合起来使用。由于中位数处于数据的中间位置,因此四分位差可以用于衡量中位数的代表性。数值越小,说明中间数据越集中。 其特点:四分位差避免了数列中极端值的影响,但去头弃尾,丢失大量的原始数据。此外没有量度各个单位间的差异性。 例如某校80名学生的成绩分为甲、乙、丙、丁四个等级,各等级次数如表所示: (四)平均差 要测定变量值的离中趋势,尤其是要测定各变量 值相对于平均数的差异情况,一个很自然的想法就是计 算各变量值与算术平均数的离差。 平均差是离差绝对值的算术平均数。 1.对于未分组资料(简单平均差) 一个工厂,其中有5名工人的日产量如下(件) 在两组进行对比的时候,平均差的作用? 如果两组平均数都是23的话,第二组平均差求得为2,那就代表,第一组的平均值更有代表性,第二组较第一组相比,离散程度较强。 (四)平均差 2.对于分组资料 (加权平均差) f:出现的次数 绝对数(f) 例:有200名工人,他们的日产量分布如下(kg) 日产量 (kg) 人数(人) 20-30 10 30-40 70 40-50 90 50-60 30 当平均值相同的时候,加权平均差较小的那组
显示全部