文档详情

非参数检验分析.ppt

发布:2018-12-24约4.61千字共27页下载文档
文本预览下载声明
* * 13.2.1 二项检验 称名量表的测量水平最低,常用二分类,(two-category)或二分总体(dichotomous population) 请同学举例说明有那些二分总体? 男女,对错,正反,阴阳,有无文化…………. 定义:二分总体中, p 为一类所占的比例,q=1-p为另一类所占比例。 例题:某大学教导主任说,自从学校禁售香烟以来,吸烟学生比例下降到70%以下。但是对其他学校观察发现,禁售对吸烟影响不大,仍然有70%的人在吸烟。请检验教导主任的说法是否正确。 随机抽取40名同学,询问发现其中有12名吸烟。则不吸烟的同学数量为: X=28 用 P0 表示总体吸烟比例 1. 虚无假设:吸烟学生总体比例P0≥0.7 2. 备择假设:样本所在总体比例P0<0.7 4. 统计检验: 二分总体 , 采用二项式检验 5. 抽样分布: 统计量为 X , 在附表N中列出N≤50时,不同p,q的单侧临界值。 3. 显著水平:α=0.05,单尾检验 6. 临界区间:参照表N,N=40,p=0.30,q=0.70,发现0.05的临界值为18,单尾检验。 7. 因为X=28>18,拒绝H0,认为教导主任是对的 31 34 31 33 … … 21 23 ……. 4 5 3 4 0.01 0.05 49 … … … … … … … … … 26 28 26 28 … … 20 18 …. ….. 3 4 3 3 0.01 0.05 40 …. … …. … …. …. ….. … …. - - - - …… — — …. …. 2 2 1 2 0.01 0.05 3 - - - - …… — — …. … 1 2 1 1 0.01 0.05 2 0.50 0.50 0.49 0.51 … … 0.30 0.70 … … 0.02 0.98 0.01 0.99 p q N 表N 当N=2~49时, α=0.01和0.05时,p和q各种取值下的临界值 N=40,α=0.05,因为X=28>18,拒绝H0,认为教导主任是对的 13.2.2 当N比较大时,二项分布近似正态曲线 当p=q=0.5,或p、q接近0.5时,二项分布接近正态分布 简便法则:当pq接近0或1时,Npq至少等于9,当p=q=0.5时,N≥25。 此时,二项变量X~N(Np, ) 的正态分布 13-1 z ~N(0, 1 ) ,X的概率= z 对应的概率 例题 已知 X=5,N=20,p=q=0.5,α=0.05,双尾检验。计算P(X≤5) 或P(X≥15) 当α=0.05,双尾检验时,| z |1.96,所以拒绝H0 如果我们从附表M中查找, X=5,N=20,双尾检验,发现:拒绝H0需要N-X≥15,本题N-X=15,所以拒绝H0。这和利用正态分布计算是一致的。表M只列出了N=50的临界值,建议N50时才使用正态分布。 13.3 单变量的χ2 检验 肥胖与健康问题有关,亚特兰大疾控中心定期进行全国青少年危机监督调查,对11631名男女青年(9到12年级)自身体重观的部分调查结果。 5816 1995 3402 419 合计 过胖 正常 偏瘦 这个问题可以使用单变量χ2 检验或拟合优度检验(goodness-of-fit test) 观测值与虚无假设下的期望值之间是否存在差异? 观测值分布是否与理论分布相吻合? 表13-1 女生的自身体重观 5816 f3 f2 f1 合计 过胖 正常 偏瘦 H0: f1=f2=f3 如果观察值与期望值比较接近,则χ2 很小,不拒绝H0 , 否者χ2 会增大, χ2 越大,则越有可能拒绝H0. 在 t 分布中,自由度与样本量有关,而χ2 分布的自由度与类别 k 有关,单变量,df=k-1。此题的k=3, df=3 - 1=2 判断方法,如果χ2≥ χ2临界值,则拒绝H0。 表13-2 χ2 部分临界值表 χ2=2297.138 1.370 1104.544 1191.224 (fo-fe)2/fe 3173.41 2141343.40 2309387.70 (fo-fe)2 0 56.333 1463.667 -1519.667 fo-fe 5816 1938.667 1938.667 1938.667 期望值 5816 1995(34%) 3402(58%) 419(7%) 实际值 合计 体重偏重 体重正常 体重偏低 表13-3 女生对自身体重观念,H0下的期望值及χ2 值计算表 因为χ2=2297.138 9.210,拒绝H0。 34%远远超过7%,这些女生有80%正在减肥 13.4 独立类别变量的χ2检验 问题1. 不同社会经济背景的儿
显示全部
相似文档