文档详情

第4章数据的概括性度量.ppt

发布:2017-06-14约1.32万字共99页下载文档
文本预览下载声明
* * * * * * * * * * * * * Shape Concerned with extent to which values are symmetrically distributed. Kurtosis The extent to which a distribution is peaked (flatter or taller). For example, a distribution could be more peaked than a normal distribution (still may be 慴ell-shaped). If values are negative, then distribution is less peaked than a normal distribution. Skew The extent to which a distribution is symmetric or has a tail. Values are 0 if normal distribution. If the values are negative, then negative or left-skewed. * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 峰态 (kurtosis) 统计学家Pearson于1905年首次提出 数据分布扁平程度的测度 峰态系数=0扁平峰度适中 峰态系数0为扁平分布 峰态系数0为尖峰分布 峰态系数 (coefficient of kurtosis) 根据原始数据计算 根据分组数据计算 峰态系数 (例题分析) 结论:偏态系数为负值,但与0的差异不大,说明电脑销售量为轻微扁平分布 数据分布特征和描述统计量 数据分布特征 集中趋势 离散程度 分布形状 中位数 平均数 异众比率 四分位差 极差 偏态系数 平均差 方差或标准差 峰态系数 众数 离散系数 本章小节 1. 数据水平的概括性度量 2. 数据离散程度的概括性度量 数据分布形状的度量 用Excel计算描述统计量 * * * * * * * * * * * * * * * * * * * * * * * * * * * 三、数值型数据:方差和标准差 极差 (range) 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布 R = max(xi) - min(xi) 计算公式为 平均差 (mean deviation) 各变量值与其平均数离差绝对值的平均数 能全面反映一组数据的离散程度 数学性质较差,实际中应用较少 计算公式为 未分组数据 组距分组数据 平均差 (例题分析) 某电脑公司销售量数据平均差计算表 按销售量分组 组中值(Mi) 频数(fi) 140~150 150 ~ 160 160 ~ 170 170 ~ 180 180 ~ 190 190 ~ 200 200 ~ 210 210 ~ 220 220 ~ 230 230 ~ 240 145 155 165 175 185 195 205 215 225 235 4 9 16 27 20 17 10 8 4 5 40 30 20 10 0 10 20 30 40 50 160 270 320 270 0 170 200 240 160 250 合计 — 120 — 2040 平均差 (例题分析) 含义:每一天的销售量平均数相比, 平均相差17台 ? 方差和标准差 (Variance and Standard deviation) 1. 离散程度的测度值之一 2. 最常用的测度值 3. 反映了数据的分布 方差和标准差是根据全部数据计算的,反映了各变量值与均值的平均差异,能准确反映出数据的离散程度。 4 6 8 10 12 ?x = 8.3 方差和标准差 (Variance and Standard deviation) 5、根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差 6、总体方差和样本方差计算上的区别: 总体方差是用数据个数或总频数去除离差平方和; 样本方差是用样本数据个数或总频数减1去除离差平方和,即样本方差用自由度n-1去除! 总体方差和标准差 (Population variance and Standard deviation) 未分组数据: 组距分组数据: 未分组数据: 组距分组数据: 方差的计算公式 标准差的计算公式 样本方差和标准差 (sample variance and
显示全部
相似文档