文档详情

概率分布与参数估计课件.ppt

发布:2019-08-16约4.73千字共123页下载文档
文本预览下载声明
概率分布 试验实例 E1: 抛一枚硬币,分别用“H” 和“T” 表示出正面和反面; E2: 将一枚硬币连抛三次,考虑正反面出现的情况; E3:将一枚硬币连抛三次,考虑正面出现的次数; E4:掷一颗骰子,考虑可能出现的点数; E5:记录某网站一分钟内受到的点击次数; E6:在一批灯泡中任取一只,测其寿命; E7:任选一人,记录他的身高和体重。 事件发生的标志 由于事件是随机试验的每一个可能结果,可表示为样本空间的某个子集。 所以,事件A的发生,当且仅当试验的结果是子集A中的元素。 由此,必然事件即为一个试验中所有基本事件的集合,包含了样本空间的所有样本点;不可能事件不包含样本空间的任一样本点,为一空集。 事件关系的实质 由上可知,事件之间的关系由他们所包含的样本点所决定; 由此,事件之间的这种关系也可以用集合之间的关系来描述。 偏度的意义(三级动差) 表示偏度的指标实际上是z分数的三次方的算术平均数。 由公式可以看出,正态分布时,由于左右对称,z分数的三次方的总和应等于0;而正偏态时,由于平均数右边的z分数值较大,故z分数三次方总和的绝对值较左边为大,故z分数三次方的总和大于0;而负偏态则相反。 峰度的意义(四级动差) 表示峰度的指标实际上与z分数的四次方的算术平均数有密切关系。 当两曲线的标准差相同时,曲线越高狭,两极端分数的分布次数越多,峰度值就会越大;反之,曲线越低阔,两极端分数的分布次数越少,峰度值就会越小。 故,峰度值为0时,分布为正态;峰度值大于0时,分布为高狭峰;峰度值小于0时,分布为低阔峰。 二项分布的极限分布是正态分布 公式表达: 式中,y为次数,N为总人数,X为测量分数。 若左式中的N取为1,便是正态分布的密度函数,即: 连续和离散型随机变量概率分布的区别 连续型随机变量 1)连续型随机变量记做X; 2)随机变量特殊值记做x; 3)连续型概率分布(概率密度函数)记做f(x); 4)P(X=x)=0; 5) 6) 离散型随机变量 1)X表示离散型随机变量; 2)x表示随机变量特殊值; 3)离散型概率分布(概率分布函数)记做f(x); 4)P(X=x)=f(x); 5) 6) 大数原则与Z分布 大数原则 从公式可以看到,样本平均数的标准误与母总体的标准差成正比,而与样本容量n成反比,样本容量越大,样本平均数的标准误越小。 Z分布 无论母总体的分布,还是样本平均数的分布,都可以通过求标准分数Z,将各自的正态分布形式转换成标准正态分布。此时,标准正态分布的随机变量为z分数,故标准正态分布也称Z分布。 样本平均数的Z分布和t分布总结 参数估计 统计推断 (statistical inference) 被估计的总体参数 第一节 点估计、区间估计 一、点估计(point estimation) 从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计。 例如: 用样本均值作为总体未知均值的估计值。 注意:点估计没有给出估计值接近总体未知参数程度的信息。 二、良好估计的标准 无偏性:估计量的数学期望等于被估计的总体参数。(用多个样本的统计量作为总体μ的估计值,其偏差的平均数为零。) 是 μ的无偏估计, 是 的无偏估计。 有效性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量。 一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数 充分性:一个样本容量为n的样本统计量,是否充分反映了全部n个数据所反映总体的信息。 例如,平均数比众数、中位数的充分性高; 比Q、AD的充分性高。 三、区间估计(interval estimation) 根据一个样本的观察值给出总体参数所在的区间范围,并给出总体参数落在这一区间的概率。 例如: 总体均值落在50-70之间,置信度为 95%。 注意:区间估计是在点估计的基础之上进行的,并不具体指出总体参数等于什么。 决定区间边界值的因素 样本点估计值(如样本平均数) 联系总体参数和样本点估计的样本统计量(如Z统计量) 该统计量的抽样分布(如果样本平均数服从正态分布,则Z统计量的抽样分布是标准正态分布) 落在总体均值某一区间内的样本均值 置信水平 总体未知参数落在某一区间内的概率,表示为 1 - ?。此时,??为显著性水平,是总体参数未在某一区间内的概率?。 常用的置信水平值有0.99,0.95,0.90。相应的 ??为0.01,0.05,0.10。 区间与置信水平 区间估计的原理
显示全部
相似文档