新非参数第九章.ppt
例1(数据:wid.txt)对于某种疾病有三种处理方法.某医疗机构分别对22,15和19个病人用这三种方法处理,处理的结果分改善和没有改善两种,并且列在下表中:改善没有改善合计处理A101222处理B7815处理C61319合计233356问:不同处理的改善比例是不是一样第2页,共20页,星期六,2024年,5月例9.2(数据:shop.txt,shopA.txt)在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商场中的哪个,结果如下:年龄段商场1商场2商场3总和≤3083704519831-509186151925041381089总和21519470479问:人们对这三个商场的选择和他们的年龄是否独立?第3页,共20页,星期六,2024年,5月以上两个例子的数据都有下面的两因子列联表形式:B1B2…Bc总和A1n11n12…n1cn1.Arnr1nr2…nrcnr.总和n.1n.2…n.cn..这里,行频数总和,列频数总和,而为行因子的个水平,为列因子的个水平.第4页,共20页,星期六,2024年,5月关于齐性的检验对于例9.1所代表的一类问题,要检验的是行分布的齐性(homogeneity).一般来说,对齐性的检验就是检验H0:“对所有行,(给定行的)条件列概率相同”.用数学语言,记(给定第i行后)第j列条件概率为,零假设则为而备择假设为H1:“零假设中的等式至少有一个不成立”.第5页,共20页,星期六,2024年,5月对于例9.1关于不同处理下患者状况的改善情况的具体问题,零假设为:对于各种不同的处理,改善的比例(或概率)相同.在零假设下,第个格子的期望值应该等于,但未知,在零假设下,可以用其估计代替.这样期望值第6页,共20页,星期六,2024年,5月而观测值为,则Pearson统计量为在样本量较大时,近似地服从自由度为的分布第7页,共20页,星期六,2024年,5月y=matrix(scan(E:/data/wid.txt),3,2,b=T)Read6itemsy[,1][,2][1,]1012[2,]78[3,]613chisq.test(y)PearsonsChi-squaredtestdata:yX-squared=1.076,df=2,p-value=0.5839第8页,共20页,星期六,2024年,5月关于独立性的检验对于例9.2那一类问题,要检验的是行和列变量的独立性(independence).当行列变量独立时,一个观测值分配到第个格子的理论概率应该等于行列两个概率之积,即零假设为:在零假设下,它的估计值为而第格子的期望值因此为第9页,共20页,星期六,2024年,5月由此可以得到和上面检验齐性时导出的同样的统计量Q:第10页,共20页,星期六,2024年,5月y=matrix(scan(E:/data/shop.txt),3,3,b=T)Read9itemsy[,1][,2][,3][1,]837045[2,]918615[3,]413810chisq.test(y)PearsonsChi-squaredtestdata:yX-squared=18.6508,df=4,p-value=0.0009203第11页,共20页,星期六,2024年,5月关于独立性检验还可以采用另一个基于多项分布的似然函数的检验统计量,称为似然比检验统计量(likelihoodratioteststatistic).它是用一般的最大似然函数与在零假设下的最大似然