第三章 数据分布特征描述.ppt
文本预览下载声明
随机变量的数字特征 离散随机变量的CDF 思考题 比特啤酒公司雇用了468名员工,其中有56名管理人员,130名行政和技术人员,其余282人是工人。这三组人的周平均工资分别是500英镑、300英镑和200英镑。财务主管希望计算全体员工的平均工资。 正确的计算方法 如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。 比如有5笔付款: 9元,10元,10元,11元,60元 平均付款为100/5=20元。 很明显,这并不是一个好的代表值,而中位数10元是一个更好的代表值。 就同一资料计算时,有: x x x G H £ £ 设 x 取值为: 4、4、5、5、5、10 算术平均与几何平均更为常用一些,其中几何平均数对小的极端值敏感,算术平均数对大的极端值敏感。 是否为比率 或速度 各个比率或速 度的连乘积是否等于总比 率或总速度 是否为 其他比值 是 否 否 是 否 是 几何平均法 算术平均法 求解比值的平均数的方法 数值平均数计算公式的选用顺序 指标 二、平均指标的种类及计算方法 ㈠ 算术平均数 ㈡ 调和平均数 ㈢ 几何平均数 ㈣ 中位数 ㈤ 众数 数值平均数 位置平均数 ★ ★ ★ ★ 将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用 表示 中位数 (Median) 不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。 中位数的作用: 二、平均指标的种类及计算方法 中位数的位次为: 即第3个单位的标志值就是中位数 【例6】某售货小组5个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元,则 中位数的确定 (未分组资料) 中位数的位次为: 中位数应为第3和第4个单位标志值的算术平均数,即 【例7】若上述售货小组为6个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元、760元,则 中位数的确定 (未分组资料) 【例8】某企业某日工人的日产量资料如下: — 70 170 550 700 800 (人) 向上累计次数 800 合计 70 100 380 150 100 10 11 12 13 14 工人人数(人) 日产量(件) 计算该企业该日全部工人日产量的中位数。 中位数的位次: 中位数的确定 (单值数列) 中位数的确定 (组距数列) 【例9】某车间50名工人月产量的资料如下: — 3 10 42 50 (人) 向上累计次数 50 合计 3 7 32 8 200以下 200~400 400~600 600以上 工人人数(人) 月产量(件) 计算该车间工人月产量的中位数。 中位数的确定 (组距数列) 共 个单位 共 个单位 共 个单位 共 个单位 L U 中位数组 组距为d 共 个单位 假定该组内的单位呈均匀分布 共有单位数 中位数下限公式为 该段长度应为 二、平均指标的种类及计算方法 ㈠ 算术平均数 ㈡ 调和平均数 ㈢ 几何平均数 ㈣ 中位数 ㈤ 众数 数值平均数 位置平均数 ★ ★ ★ ★ ★ 指总体中出现次数最多的变量值,用 表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。 众数 (Mode) 二、平均指标的种类及计算方法 有时众数是一个合适的代表值 比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。 800 合计 70 100 380 150 100 10 11 12 13 14 工人人数(人) 日产量(件) 【例10】已知某企业某日工人的日产量资料如下: 众数的确定 (单值数列) 计算该企业该日全部工人日产量的众数。 众数的确定 (组距数列) 【例B】某车间50名工人月产量的资料如下: — 3 10 42 50 (人) 向上累计次数 50 合计 3 7 32 8 200以下 200~400 400~600 600以上 工人人数(人) 月产量(件) 计算该车间工人月产量的众数。 众数的原理及应用 83名女生身高原始数据 83名女生身高组距数列 当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数; 当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)。 众数的原理及应用 出生 1981.0 1980.0 1979.0 1978.0 1977.0 1976.0 1975.0 160 140 120 100
显示全部