文档详情

偏态数据分布偏斜程度的测度.PPT

发布:2018-09-13约6.07千字共48页下载文档
文本预览下载声明
第四章 数据分布特征的测度 学习目标 掌握众数、中位数的概念、特点及其计算方法; 了解四分位数概念; 掌握算术平均数、调和平均数、几何平均数的概念、特点及计算方法; 了解异众比率、四分位差、全距、方差及标准差的概念、及计算方法; 了解偏度和峰度的意义; 能够区分各种指标的应用场合,根据不同数据类型运用不同测度指标。 主要内容: 一、众数 ● 概念 在次数分布数列中,就是出现次数最多的变量值, 用 表示。 主要用于测度定类数据的集中趋势,当然也适用于作为定序数据以及定距和定比数据集中趋势的测度值。 ● 计算众数的方法 (1)单项分配数列的众数计算方法 出现次数最多的那一组变量值就是众数 某商场某日连续销售15双皮鞋的尺码组成情况如下: 38,37,38,40,40,41,40,42,44,40,41,39,40,40,43 出现次数最多的数是40,40就是某商场某日销售皮鞋尺码的众数。 (2)组距分配数列的众数计算方法 第一步:根据分配数列次数最多的组 确定为众数所在组。 第二步:根据该组与前后相邻两组 分配次数的关系推算众数。 众数与相邻两组的关系示意图 ,众数组的组中值即为众数的值。 ,众数会向其前一组靠,众数小于其组中值 ,众数会向其后一组靠,众数大于其组中值 其中,L,U分别表示众数所在组的下限值和上限值, i表示众数组的组距。 根据上述关系,可以利用相似三角形推导出组距分配数列的众数的计算公式如下: 某乡3000农户按人均年纯收入分组的资料如下表,试计算其众数。 从表中可以看出,众数所在的组为4000-5000,出现的最多次数为1050。 ● 众数的优缺点 二、中位数和四分位数 (一)中位数 ● 概念 是指对样本数据由小到大排序后,处于中间位置上的变量值,用 表示。 是一个位置代表值,它主要用于测度定序数据的集中趋势,当然也适用于定距数据和定比数据的集中趋势,但不适用于定类数据。 ● 计算中位数的方法 (1)变量值未分组情况下: 总体单位数n是奇数,中间位置的变 量值是中位数。 总体单位数n是偶数,中间位置的两个变量值的算术平均数为中位数。 (2)变量值分组情况下: 某乡人均年纯收入中位数计算表如下: 按下限公式计算中位数: 按上限公式计算中位数: ● 优缺点 (二)四分位数 中位数是从中间点将全部数据分为两部分。与中位数类似的还有四分位数、十分位数、百分位数、四分位数就是对数据集合四等分的三个数值,其中的第二个四分位数即为中位数。例如某数据集合有101项数据,则第26项、51项、76项三个数据可以把数据集合分为数目相等的四个等分,这三个数就分别是第一、第二、第三四分位数,其中第一个四分位数称为上四分位数,第三个四分位数称为下四分位数,第二个四分位数就为中位数。 三、数值平均数:算术平均数、调和平均数、几何平均数 ● 算术平均数 1、简单算术平均数 2、加权算术平均数 某中学100名高中一年级男生身高(单位:厘米)的频数分布如下表。求该校高一男生的平均身高。 请注意! ● 调和平均数—— ● 几何平均数 是n项变量值连乘积的n次方根。 适合于计算现象的平均比率或平均速度,反应现象增长率的平均水平。 1、简单几何平均数 适用于计算未分组数列的平均比率或平均速度 。 2、加权几何平均数 对于分组数列,应该采用加权几何平均数计算其平均比率或平均速度 。 一、异众比率 是非众数的次数与全部个案数目的比率 ,用 表示。 二、四分位差 ● 概念 也称为内距或四分间距,它是上四分位数与下四分位数之差,是对定序及定序以上测量尺度的变量离散程度的测量指标。 ● 计算方法 ①求出上四分位数和下四分位数的位置 ②计算这两个四分位数之差 ◆ 对原始资料 ◆ 对单值分组资料 ◆对组距分组资料 三、全距 四、方差及标准差 五、离散系数 偏态与峰度分布的形状 ◆ 偏态 1. 数据分布偏斜程度的测度,用 表示。
显示全部
相似文档