卫生统计学(钟崇洲)5-参数估计-抽样误差和区间估计.ppt
抽样误差与区间估计第一节均数的抽样误差与标准误100份样本的均数和标准差将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图4-1。图4-1随机抽样所得100个样本均数的分布01100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。02100个样本均数的抽样分布特点:标准误(standarderror,SE)通过增加样本含量n来降低抽样误差。即样本均数的标准差,可用于衡量抽样误差的大小。因通常σ未知,计算标准误采用下式:1样本均数的标准差称为均数的标准误,简称标准误。2均数的标准误是描述均数的抽样误差大小的统计指标.3均数的标准误越大.均数的抽样误差就越大,说明样本均数的离散程度越高,与总体均数的差异程度越大用来衡量样本均数的可靠性:均数标准误越少说明样本均数与总体均数的差异程度越小,因此用样本均数估计总体均数越可靠,反之亦然。结合样本均数和正态分布曲线下的面积分布规律可以用以估计总体均数的置信区间。用于均数的假设检验标准误的用途都是说明离散程度的指标,但标准差描述个体间的变异程度,凡同性质资料S大表示个体变异大,S小表示个体变异小。而标准误是样本均数的标准差,描述样本均数的抽样误差,即样本均数与总体均数接近程度,凡同性质资料,标准误大,说明用样本均数代表总体均数可靠性小,标准误小,则说明用样本均数代表总体均数可靠性大。0102标准误与标准差的区别二t分布正态分布抽取例数为n的样本样本均数服从正态分布标准正态分布N(01)即u分布。在实际工作中往往不知道,多用来估计,这时对正态变量采用的不是u变换而是t变换:不是u分布而是t分布。(t-distrbution)不同自由度下的t分布图以0为中心,左右对称的单峰分布;t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近U分布(标准正态分布);当趋于∞时,t分布即为U分布。0102t分布的特征t界值表8122282.228tν=10的t分布图1t分布曲线下的整个面积为1(100%)2当n=∝时,t分布趋向于标准正态分布,即均数为0,S为1的正态分布;3t值在±1.96范围内的面积占95%,4在±2.58的范围内占99%,t分布面积规律:总体均数的点估计(pointestimation)与区间估计(intervalestimation)第三节总体均数的可信区间估计按预先给定的概率(1??),确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidenceinterval,CI)参数的估计直接估计总体参数区间估计:在一定可信度(Confidencelevel)下,同时考虑抽样误差点估计:由样本统计量01(1??)称为可信度或置信度(confidencelevel),常取95%。置信区间的有关概念0201s未知,且n较小,按t分布02s已知,或s未知但n足够大,按U分布二、总体均数置信区间的计算(一)s未知,且n较小