第四章已插图连续型随机变量的参数估计与检验..doc
文本预览下载声明
第四章
连续型随机变量的
参数估计与检验
数理统计的基本问题是根据样本所提供的信息,对总体的分布以及分布的数字特征做出统计推断。统计推断基本上包括两大部分:一是参数估计;二是假设检验。从本章起,将逐步介绍这两部分的内容。
§4-1 参 数 估 计
如果总体分布的类型已知,而它的某些参数未知,根据样本所取得的信息,估计出未知参数的值,这类问题称为参数估计问题。例如,已知总体服从正态分布N(μ,σ2),但未知其参数μ、σ2,因此需要我们根据样本所反映的信息,估计出参数值μ、σ2,我们把总体的知参数μ、σ2称为为待估计参数。
在参数估计中作估计结论的方式有两种:即参数的点估计和参数的区间估计。
4-1.1 点估计及其性质
设θ为总体X的一个待估计的未知参数,用样本X1,X2,…,Xn构造一个统计量=(X1,X2,…,Xn)作为θ的估计,称这个统计量为θ的一个估计量。由于抽样的随机性,是一个随机变量。对于样本的一组具体观测值x1,x2,…,xn,估计量=(x1,x2,…,xn)称为θ的一个具体观测的点估计值,简称估计值。实际上它是估计量的一个具体值。这种通过一次具体抽样值x1,x2…xn,估计出参数θ的可能取值的方法估称为参数的点估计问题。
点估计的目的是寻求作为未知参数θ的估计量,然后把样本值代入估计量而得到一个具体的估计值。但是对于同一个参数可以用不同的方法来求其估计量,例如估计总体均数θ可以用估计量(样本均数);也可以用=1/2()等。究竟哪一个估计量好?一般地认为参数θ的最佳估计量应当是在某种意义下最接近于θ的那一个为好,因此衡量估计量好坏的常用的标准有三条。
一、 无偏性
定义1 设θ为被估计的未知参数,为θ的估计量,若
(4-1)
则称为θ的无偏估计量。
对于无偏性的含义可以这样来理解:由于抽样误差的影响,每次抽样算得的估计量θ都不会相同,但随着抽样次数的增加,计移出的值会逐渐稳定在待估计参数θ的附近,即统计量的抽样值总体平均等于待估计参数θ。
前面提到样本均数、方差可以作为总体均数、方差的估计量。从无偏性的定义还可以证明它们是总体均数、方差的无偏估计量。事实上,设X1,X2,…,Xn是总体X的有相同分布的样本,X为样本均数,μ为总体均数,
=
由无偏估计量的定义得知样本均数是总体均数μ的无偏估计量。
同样,样本方差是总体方差σ2的无偏估计量。因为
我们还可以用样本的平均波动来估计总体的的方差DX,而
可以看出,不是总体方差DX的无偏估计量。因此我们将样本方差定义为,而不是。但是当n相当大时,两者相差甚微,n较小时,相差就比较大。所以当取的样本为大样时也可以用作为DX的估计量。在医学统计上,则于临床病历数一般比较大,常用来代替,而在药学研究中,则于取样值的数量一般不超过50,必须用作DX的统计估计值。否则,估计DX的偏差会增大。
这里还要指出一点:是总体方差DX的无偏估计量,但S却不是总体标准差的无偏估计量(证明从略),只能作为的估计量。
无偏性决不是衡量估计值好坏的唯一标准,有时同一个参数可以有多个不同的无偏估计量,那么究竟哪一个无偏估计量好呢?我们引进点估计的另一个标准:有效性。
二、 有效性
定义2 设1及2都是未知参数θ的无偏估计量,若
(4-2)
则称较有效。
实际上为了使抽样误差尽量地小,要求估计量围绕被估计值的变动愈小愈好。也就是说,要求估计量的离散程度要小,或者说其方差要小。例如,在正态总体的情况下,样本均数及样本中位数M都是总体均数的无偏估计量我们比较它们的有效性,均数,而样本中位数(证明从略)。可以看出,的方差D比M的方差DM小,说明用来估计总体均数比M有效。
应当指出的是统计量与样本容量n有关,为了明确起见,不妨记作,很自然地,我们希望当n越大时,对θ的估计越精确,于是引进点估计的第三个性质:一致性。
三、 一致性
定义3 设是未知参数的一个估计量,n为样本容量,若对任意一个ε>0,有
(4-3)
则称为θ的一致估计量。
例如由大数定理知道,对任意ε>0有,所以,也是总体均数μ的一致估计量。也可验证样本方差是总体方差的一致估计量。
综上所述,可知样本均数及样本方差S2分别是总体均数μ及总体方差σ2的无偏、有效、一致估计量,因此利用样本均数及样本方差代替总体均数及总体方差时,所产生的
显示全部