文档详情

非参数统计.ppt

发布:2017-05-25约字共43页下载文档
文本预览下载声明
符号检验 我们知道表示数据的中心位置(或平均大小)的方法有平均数(包括切尾平均数)、中位数和众数。在参数数据分析方法中,总体的中心位置常用总数的均值表示,所以关于中心位置的检验问题就是关于均值的检验问题。例如,在总体分布服从正态分布时,使用t检验方法检验均值。而在非参数数据分析方法中,总体的中心位置常用中位数表示,所以关于中心位置的检验问题就是关于中位数的检验问题。 现在由我们第二组的成员(喻江红、张茜、年先美、刘亚飞)和大家一起来讨论中位数检验问题的符号检验问题。      下面请大家看到P28 例3.1   用我们之前学过的中位数的一般计算方法,得出这50名高级技师年收入的中位数为23276,超过了全市高级技师年收入的中位数21700.那么总体中该行业高级技师年收入的中位数23276是否比全市高级技师年收入的中位数21700高?    原假设H0:me=21700 备择假设H1:me21700    前面中位数的计算太过于复杂,而符号检验的计算很简单,只需将每一个样本数据与21700比较,然后计算一下,有多少个样本数据大于21700.本例中由32个样本数据大于221700.不妨假设P(Xme)=P(Xme)=1/2,其中X为该行业高级技师的年收入。    于是若me21700,则P(X21700)P(Xme)=1/2,P(X21700)P(Xme)=1/2.所以一般来说,观察到的大于21700的样本数据的个数比较多,而小于21700的样本数据的个数比较少,即S+比较大。因而我们拒绝原假设H0:me=21700,从而认为总体中该行业高级技师的年收入的中位数me21700.   中位数的符号检验问题的一般提法如下. 样本x1,x2,....,xn独立同分布,总体为X.符号检验对于总体X的分布不妨作假设:P(Xme)=P(Xme)=1/2.由此可见P(X=me)=0 符号检验问题的原假设和备择假设有三种情景: 原假设H0 me=me0 备择假设H1 meme0 由于P(X=me)=0,所以不妨假设样本单元x1,x2,.....xn都不等于me0。符号检验的检验统计量为 (3.1) 记号“#”表示计数 S+也可以等价的表示为 若meme0,则P(Xme)P(Xme0)=1/2,P(Xme)P(Xme0)=1/2,即S+比较大,此时拒绝原假设H0:me=me0,而认为meme0. 由于在me=me0时,S+~b(n,1/2),所以检测的水平为α的拒绝域为S+=c,其中c满足条件: (3.3) 也可以通过p值来完成检验   P值等于二项分布b(n,1/2)的随机变量大于等于S+的概率:P(b(n,1/2)=S+)。P值越小,表示S+越大。   若p值≤α,则拒绝原假设H0;   若p值α,则接受原假设H0. 由Excel可以算得p值。如果在excel中输入“=binomdist(k,n,p,1)”,就可以求得累计概率P(b(n,p)≤k)的值;如果在excel中输入“=binomdist(k,n,p,0)”,则求得概率P(b(n,p)=k)的值。所以在excel中输入“=binomdist(S+ —1,n,0.5,1)”就可以得到符号检验的p值,即P(b(n,1/2)≥S+)的值。 前面第二章我们已经用到了excel,大家可以回去操作一下,计算一下例3.1,可以算得p值为P(b(50,1/2)≥32)=0.03245.由于p值较小,我们可以拒绝原假设,级认为在总体中该行业高级技师年收入的中位数me比全市高级技师年收入的中位数21700高。 若根据观察值所得的S+拒绝原假设,那么p值也可以用来度量犯第一类错误的概率。 如果me<me0 P(X<me0)>P(X<me)=1/2 P(X>me0)>P(X>me)=1/2 一般来说,这时观察到的大于me0的样本数据的个数比较少,小于me0的样本数据的个数比较多,及S+比较小 ∴ 我们在S+比较小的时候拒绝原假设H0:me=me0,而认为me<me0. 由于在me=me0时,S+~b(n,1/2), ∴检验
显示全部
相似文档