第三讲抽样误差与区间估计.ppt
文本预览下载声明
第一页,共二十八页,2022年,8月28日 第一节 均数的抽样误差与标准误 抽样误差( sampling error ):由个体变异产生的、抽样造成的样本统计量与样本统计量之间、样本统计量与总体参数的差异。 无倾向性、不可避免 第二页,共二十八页,2022年,8月28日 100份样本的均数和标准差 第三页,共二十八页,2022年,8月28日 将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图3-1。 图3-1 随机抽样所得100个样本均数的分布 第四页,共二十八页,2022年,8月28日 100个样本均数的抽样分布特点: ①μ=4.83≠ ②100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。 ③样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。 ④样本均数的标准差明显变小: 第五页,共二十八页,2022年,8月28日 即样本均数的标准差,可用于衡量抽样误差的大小。 因通常σ未知,计算标准误采用下式: 标准误(standard error, SE) 通过增加样本含量n来降低抽样误差。 第六页,共二十八页,2022年,8月28日 3个抽样实验结果图示 第七页,共二十八页,2022年,8月28日 抽样实验小结 均数的均数围绕总体均数上下波动。 均数的标准差即标准误 与总体标准差 相差一个常数的倍数,即 从正态总体N(m,s2)中抽取样本,获得均数的分布仍近似呈正态分布N(m,s2/n) 。 第八页,共二十八页,2022年,8月28日 标准差与标准误的区别与联系 1、概念不同:标准差是描述样本中个体值的变异程度的指标,其值越小,表示变量值围绕均数的波动越小; 标准误是描述样本均数间变异度的指标,其值越小,表示样本均数围绕总体均数波动越小。 2、用途不同:标准差用于表示变量值对均数波动的大小,当资料呈正态分布时,与均数结合可估计正常值范围,计算变异系数等;标准误用于表示样本统计量(样本均数、样本率)对总体参数(总体均数、总体率)的波动情况,可估计参数的可信区间,进行假设检验。 第九页,共二十八页,2022年,8月28日 3、与样本例数关系不同:样本量足够大时,标准差趋向稳定,标准误随例数增加而减小,甚至趋近于0,若样本量趋向总例数,则标准误接近0; 4、二者联系:均为变异指标,若把总体中各样本均数看作一个变量,则标准误可称为样本均数的标准差,当样本量不变时,均数的标准误与标准差成正比。二者均可与均数结合运用,但描述的内容各不相同。 第十页,共二十八页,2022年,8月28日 第二节 t 分布(t-distribution) 随机变量X N(m,s2) 标准正态分布 N(0,12) Z变换 均数 标准正态分布 N(0,12) Student t分布 自由度:n-1 第十一页,共二十八页,2022年,8月28日 t分布的特征 ①以0为中心,左右对称的单峰分布; ②t 分布曲线是一簇曲线,其形态变化与自由度的大小有关。 自由度越小,则t 值越分散,曲线越低平; 自由度逐渐增大时,t 分布逐渐逼近Z 分布(标准正态分布);当趋于∞时,t 分布趋近Z 分布, Z 分布是t 分布的特例。 第十二页,共二十八页,2022年,8月28日 图4-2 不同自由度下的t 分布图 第十三页,共二十八页,2022年,8月28日 t 界值表 1.812 2.228 -2.228 t f (t) ν=10的t分布图 t0.05/2,10=t0.025,10=2.228 第十四页,共二十八页,2022年,8月28日 t界值表中的变化规律 相同自由度时,∣t∣值越大,概率P 越小; 在相同∣t∣值时,同一自由度的双侧概率是单侧概率的两倍,t0.05/2,10=t0.025,10 。 第十五页,共二十八页,2022年,8月28日 参数估计:用样本指标值(统计量)推断总体指标值(参数)。 包括点估计和区间估计 第三节 总体均数的可信区间估计 第十六页,共二十八页,2022年,8月28日 总体均数的点估计(point estimation)与区间估计(interval estimation) 参数的估计 点估计:由样本统计量 直接估计 总体参数 区间估计:在一定可信度(Confidence level) 下,同时考虑抽样误差 按预先给定的概率(1??),确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidence interval,CI) 第十七页,共二十八
显示全部