优良性准则、区间估计.ppt
概率论与数理统计第十八讲从前面两节的讨论中可以看到:同一参数可以有几种不同的估计,这时就需要判断哪一种估计好.另一方面,对于同一个参数,用矩法和极大似然法即使得到的是同一个估计,也存在衡量这个估计优劣的问题.估计量的优良性准则就是:评价一个估计量“好”与“坏”的标准.7.3估计量的优良性准则01027.3.1无偏性定义1设总体的参数为?,对一切可能的?成立,对于样本X1,X2,?,Xn的不同取值,取不同的值.若是一个统计量,是随机变量.注意:称为?的无偏估计.参数?,有时可能估计偏高,有时可能偏低,但是平均来说它等于?.“一切可能的?”是指:在参数估计问题中,参数?一切可能的取值.我们之所以要求对一切可能的?都成立,是因为在参数估计问题中,我们并不知道参数?的真实取值.自然要求它在参数?的一切可能取值的范围内都成立说明无偏性的意义是:用估计量估计12例1设X1,X2,…,Xn为来自均值为?的总体的样本,考虑?的如下几个估计量的无偏性:例如若?指的是正态总体N(?,?2)的均值?,则其一切可能取值范围是(-∞,+∞).若?指的是方差?2,则其一切可能取值范围是(0,+∞).解即样本均值和样本方差分别是总体均值和总体方差的无偏估计.定理1设总体X的均值为?,方差为?2,X1,X2,…,Xn为来自总体X的随机样本,记与分别为样本均值与样本方差,即证明因为X1,X2,…,Xn独立同分布,所以这样前面两节中,我们曾用矩法和极大似然法分别求得了正态总体N(μ,σ2)中参数σ2的估计,均为很显然,它不是σ2的无偏估计.这正是我们为什么要将其分母修正为n-1,获得样本方差S2来估计σ2的理由.例2求证:样本标准差S不是总体标准差?的无偏估计.证明因E(S2)=?2,所以,D(S)+(E(S))2=?2,由D(S)>0,知(E(S))2=?2-D(S)<?2.所以,E(S)<?.故,S不是?的无偏估计.用S来估计?,平均来说偏低.用估计量估计?,估计误差01均方误差准则02是随机变量,通常用其均值衡量估计误差的大小.要注意:为了防止求均值时正、负误差相互抵消,我们先将其平方后再求均值,并称其为均方误差,记成,即03证明01注意:均方误差可分解成两部分:哪个估计的均方误差小,就称哪个估计比较优,这种判定估计优劣的准则为“均方误差准则”.02上式表明,均方误差由两部分构成:第一部分是估计量的方差,第二部分是估计量的偏差的平方和.注意:如果一个估计量是无偏的,则第二部分是零,则有:如果两个估计都是无偏估计,这时哪个估计的方差小,哪个估计就较优.这种判定估计量优劣的准则称为方差准则.例3设X1,X2,…,Xn为来自均值为?的总体的样本,考虑?的如下两个估计的优劣:定义故这两个估计都是?的无偏估计.表明:当用样本均值去估计总体均值时,使用全样本总比不使用全样本要好.01020304点估计就是利用样本计算出的值(即实轴上的点)来估计未知参数.7.4正态总体的区间估计(一)优点是:告诉人们“未知参数大致是多少”;缺点是:并未反映估计的误差范围(精度).例如:在估计正态总体均值μ的问题中,若根据一组实际样本,得到μ的极大似然估计为10.12.一个可以想到的估计办法是:给出一个区间,并告诉人们该区间包含未知参数μ的概率(可靠度、置信度、置信水平(系数)).实际上,μ的真值可能大于10.12,也可能小于10.12.010302甲估计的区间较乙估计的短,故精度较高.05乙估计:人的身高为[150,190];03如:估计某人的身高(cm).01但由于甲估计的区间短,包含该人真正身高的可能性(概率或置信度)小;乙估计的区间长,精度差,但置信度比甲的大.04甲估计:人的身高为[170,180];0201实际中,在保证置信度的条件下,尽可能提高精度,02(用区间的长度来度量)03与置信度04(用估计的区间包含未知量的概率来度量)05是矛盾的.06精度07即区间的长度尽可能短.定义1置信区间的定义实际应用上,一般取α=0.05或0.01.正态总体均值的区间估计或故也可简记为*