文档详情

ch5 分布的检验.pptx

发布:2018-02-09约8.09千字共64页下载文档
文本预览下载声明
  第5章 分布的检验;主要内容;设x1,x2,…,xn是来自总体X的一个样本,根据实践经验,可对总体X的分布提出如下假设:   H0:X的分布为F(x)=F0(x) 其中F0(x)可以是一个完全已知的分布,也可以是含有若干未知参数的已知分布,这类检验问题统称为分布的检验问题。这类问题很重要,是统计推断的基础性工作。明确了总体分布或其类型就可进一步做深入的统计推断。 这一章将先研究正态分布的检验问题,然后研究一般分布的检验问题。 ; 5.1 正态性检验;一个样本是否来自正态分布的检验称为正态性检验。在这种检验中“样本来自正态分布”是作为原假设H0而设立的,在H0为真下,人们根据正态分布特性构造一个统计量或一种特定方法,观察其是否偏离正态性。若偏离到一定程度就拒绝原假设H0,否则就接受原假设H0,所以“正态性检验”是指“偏离正态性检验”。;由于正态分布的重要性,吸引很多统计学家参与正态性检验的研究,先后提出几十种正态性检验的定量方法,经过国内外多人多次用随机模拟方法对它们进行比较,筛选出如下两种正态性检验: 夏洛皮·威尔克(Shapiro-Wilk)检验(8≤n≤50) 爱泼斯·普利(Epps-Pully)检验(n≥8); 夏洛克威尔克检验又简称W检验,于1965年提出,分以下几步来叙述W检验产生的思想和使用方法。 (1)设x1,x2,…,xn是来自正态总体N(μ,σ2)的一个样本,x(1),x(2),…,x(n)为其次序统计量。令u(i)=(x(i)-μ)/σ,则u(1),u(2),…,u(n)为来自标准正态分布N(0,1)的次序统计量,且有如下关系 x(i)=μ+σu(i), i=1,2,…,n(5.1.1) ;若把上式中u(i)用期望E(u(i))=mi代替,会产生误差,记此误差为εi,这样上式可改写为   x(i)=μ+σmi+εi, i=1,2,…,n(5.1.2) 这是一元线性回归模型。由于次序统计量的关系,其中诸εi是相关的。若记ε=(ε1,ε2,…,εn),则ε是均值为零向量,协方差矩阵为V=(vij)的n维随机向量。;若暂时不考虑诸εi间的相关性,只考察x(i)与mi间的线性相关性,则n个点(x(1),m1),…,(x(n),mn)应大致呈一条直线,其间误差是由εi引起的。x=(x(1),x(2),…,x(n))与m=(m1,m2,…,mn)间的线性相关程度可用其样本相关系数r的平方来度量。   r2= (5.1.3) r2越接近1,x与m间的线性关系越密切。 ;?;而 , 可以看出: 是σ的线性无偏估计(BLUE),这只要注意到 Ex(i)=μ+σmi和 mi=0即可。 还可看出,式(5.1.4)中除去一个与样本无关的因子,其主体是总体方差σ2的两个估计之比,其中   ● 分母:s2对任何总体方差σ2都是很好的估计,不依赖于正态性假设是否为真。  ● 分子:由于 依赖于诸mi,所以仅在正态性假设为 真时 才能成为正态总体σ2的估计。   ;可见,在正态性假设为真时,σ2的这两个估计之间应该相差不大。而当正态性假设不成立时,它们之间的相差就会增大。这种增大的趋势有利于我们识别正态性假设是否成立。这就是我们从σ2的估计量的角度来看r2所得到的启示。 ;(3)为了进一步扩大这个差异。夏皮洛和威尔克把 1换为σ的最小方差线性无偏估计 2(BLUE),由例2.5.2知,正态标准差σ的BLUE为: (5.1.5) 其中系数为 c=(c1,c2,…,cn)= (5.1.6) ;假如说前面的 仅依赖于一阶矩向量m,那么如今的 还依赖于协方差阵V,所以, 比 更强烈地依赖于正态性假设。倘若正态性假设不成立, 和s2之间的差异就会更大一些,这种差异的增大,对检验正态性假设更为有利一些。 将r2中的 换为 ,所得到的式子记为 。显然, 已不再是n个数对(x(1),m1),…,(x(n),mn)之间的相关系数的平方。夏皮洛和威尔克为了仍保持相关系数的特性,对 的系数又作了规范化处理,即令 (5.1.7)
显示全部
相似文档