文档详情

《统计学案例分析》课件.ppt

发布:2018-08-06约3.6千字共22页下载文档
文本预览下载声明
案例分析 统计学 封面 封底 案例 分析 案例讨论四 案例讨论一 案例讨论三 案例讨论二 Contents Page 目录页 * 概念汇总 Transition Page 过渡页 * 概念汇总 案例讨论四 案例讨论一 案例讨论三 案例讨论二 概念 汇总 1.均数(average):   适用:对称分布或偏度不大的资料,尤其适合正态分布。   1、算术均数(mean):   2、加权均数:   3、几何均数: 2.中位数(median):观察值按照从小到大排列时,居中心位置的数值。   适用于1、分布明显成偏态时,2、频数分布的一端或两端无确切数值时。不便于统计计算。      M:中位数;LM:M所在组的上限;f L:M所在组之前积累的频数;fM:M所在组的频数;i:组距。 3.百分位数(percentile):Px。在一组中找到这样一个数值P,全部观察值的x%小于P。P75、P25描述资料离散程度。    4.众数:一组观察值中,出现频率最高的那个观察值。若为分组资料,则为频率最高组的组中值。适用于大样本,但粗糙。 1.1集中趋势的统计描述 概念 汇总 1.2 离散程度的统计描述 1.极差(range,R):即全距。粗略。适用于任何分布。 2.四分位数间距(quartile,Q):一组观察值按大小排序后,分成四个数目相等的段落,每个段落观察值的数目占总例数的25%。去掉两端含有极端数值的25%,取中间的50%的观察值的数据范围即为~。   越大则数据变异越大。适用于偏态分布。   Q=P75 - P25 4.方差(variance): 样本方差 总体方差 5.标准差(standard deviations):      适用于近似正态分布。   p.s.1、可用于合并资料的直接计算   2、与均数结合可以完整概括一个正态分布。        Transition Page 过渡页 * 概念汇总 案例讨论四 案例讨论一 案例讨论三 案例讨论二 案例讨论一 案例讨论一 某年某课题组检测了某企业238名无工作也接触史工人的发汞含量(μmol∕kg),整理结果见下表,适对该企业工人发功水平进行统计描述。 组段(μmol∕kg) 组中值X0 人数f 频率(%) 累计频数 累计频率(%) 1.5~ 2.5 20 8.4 20 8.4 3.5~ 4.5 66 27.7 86 36.1 5.5~ 6.5 60 25.2 146 61.3 7.5~~ 8.5 48 20.2 194 81.5 9.5~ 10.5 18 7.6 212 89.1 11.5~ 12.5 16 6.7 228 95.8 13.5~ 14.5 6 2.5 234 98.3 15.5~ 16.5 1 0.4 235 98.7 17.5~ 18.5 0 0 235 98.7 19.5~21.5 20.5 3 1.3 238 100 合计 — 238 100 — — 为描述该企业工人发汞含量的平均水平和变异程度,某研究者采用算术平均数和标准差两个统计指标。 按照频率表法计算算术均数为 =1699/238=7.14(μmol∕kg) 标准差为 (μmol∕kg) 因此该研究着认为该企业工人发汞的平均水平和变异程度为(7.14﹢/﹣3.23)μmol∕kg 你认为这样统计描述恰当么?为什么? 案例讨论一 经案例分析可知该发汞结果测定为偏态分布,因为均数(average)适用于对称分布或偏度不大的资料,尤其适合正态分布。标准差(standard deviations)同样适用于近似正态分布。所以不能选用均数与标准差来计算该企业法功的平均水平与变异程度。 因此通过统计描述类型的选择,中位数与四分位数间距更适合于描述变量值的平均水平与变异程度。    Q=P75 - P25 案例讨论一 综上所述: Q=P75 - P25=8.85-4.70=4.15(μmol∕kg) =5.5+2/60(238*50%-86)=6.6(μmol∕kg) Transition Page 过渡页 * 案例讨论四 案例讨论一 案例讨论三 案例讨论二 概念汇总 案例讨论二 案例讨论二 某单位1993年对1191名全体职工进行冠心病普查,按职业年龄分组统计,结果见下表,作者认为:该单位干部、工人的冠心病发病率均随年龄的增加而下降,发病率高峰都在40-50岁这一组,这与
显示全部
相似文档