第2讲样本描述性统计与假设检验.ppt
文本预览下载声明
数据分析-何帆 假设检验一般理论 对H0 进行检验: (1)寻找检验统计量 (2)对给定小概率?,寻找拒绝域?0 P{(x1,x2,…,xn) ??0 | H0 为真时}= ? 接受域?1 : ?1∪?0= ?(样本空间) 当样本观测值: (x1,x2,…,xn) ??0 时,拒绝H0 (x1,x2,…,xn) ??1 时,接受H1 数据分析-何帆 假设检验一般理论 什么是显著性水平 是一个概率值 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 表示为α(alpha) 常用的α值有0.01, 0.05, 0.10 由研究者事先确定 数据分析-何帆 假设检验一般理论 什么是P值? 是一个概率值 如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率 左侧检验时,P-值为曲线下方小于等于检验统计量部分的面积 右侧检验时,P-值为曲线下方大于等于检验统计量部分的面积 被称为观察到的(或实测的)显著性水平 数据分析-何帆 双侧检验的P值 数据分析-何帆 左侧检验的P值 数据分析-何帆 右侧检验的P值 数据分析-何帆 假设检验一般理论 如何利用P值进行决策判断? 单侧检验 若p-值 α,不能拒绝 H0 若p-值 ≤α, 拒绝 H0 双侧检验 若p-值 α/2, 不能拒绝 H0 若p-值 ≤ α/2, 拒绝 H0 数据分析-何帆 假设检验一般理论 检验分类 样本平均数与总体平均数的比较检验(单个样本) 两独立样本平均数的比较 两个配对样本平均数的比较检验 多个平均数的样本检验 成数假设检验,方差或标准差假设检验 分布检验:正态分布检验、均匀分布检验 非参数检验:χ2检验法、F—检验法等。 数据分析-何帆 分组平均数比较 问题描述 某医师测得40人的血红蛋白值(g%),试比较男性和女性的血红蛋白值是否有差异? (数据见血红蛋白值.sav) 分组平均数比较是为了比较同一个总体抽样中不同类别的均数的差异性 数据分析-何帆 分组平均数比较 菜单 Analyze-Compare Means-Means 点击弹出如下对话框 主要功能 分组计算均值 对均值进行差异比较 数据分析-何帆 分组平均数比较 对分组变量进行单因素方差分析,并计算用于度量变量相关程度的eta值 检验线性相关性,实际上就是上面的单因素方差分析 数据分析-何帆 分组平均数比较-结果分析 F:统计量的值 Sig. 观测显著性水平 即P值 数据分析-何帆 单一样本T检验 用于检验样本平均与总体平均数的差异 统计量:T统计量 其中S是修正的样本标准差 主要检验某一个均值是否和某一固定值相符合。 数据分析-何帆 单一样本T检验 例4 前面给出的血红蛋白值的均值是否等于11,12,13 数据分析-何帆 单一样本T检验 数据分析-何帆 单一样本T检验 结果分析 t统计量值 自由度 P值 置信区间的上下限 数据分析-何帆 练习1 有一种新型农药防治柑桔红蜘蛛,进行了9个小组的实验,其防治效果为:95%,92%,88%,92%,93%,95%,89%,98%,92% 与原用农药的防治效果90%比较,分析其效果是否高于原用农药。 数据分析-何帆 练习2 在有小麦丛矮病的麦田里,调查了13株病株和11株健株的植株高度,分析健株高度是否高于病株?其调查数据如下: 健株 26.0 32.4 37.3 37.3 43.2 47.3 51.8 55.8 57.8 64.0 65.3?病株 16.7 19.8 19.8 23.3 23.4 25.0 36.0 37.3 41.4 41.7 45.7 48.2 57.8 该数据保存在“丛矮病的麦田.SAV”文件中 数据分析-何帆 配对样本T检验 配对样本 是相对独立样本而言的,指一个样本在不同时间做了两次试验,或者有两个类似的记录,从而比较其差异。 例如:下列哪个属于配对样本? 一班和二班的数学分析成绩 一班的期中和期末成绩 数据分析-何帆 配对样本T检验 问题陈述 例1 某制鞋厂为比较用来做鞋后跟的两种材料的质量,随机选取了15名男子,让他们每人穿一双新鞋,每双鞋中有一只是用材料A作后跟的,另外一只是用材料B作后跟的,其厚度均为10cm,一个月以后再次测量其厚度,数据如下: 数据分析-何帆 配对样本T检验 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 材料A 6.6 7.0 8.3 8.2 6.2 9.3 7.9 8.5 7.8 7.5 6.1 8.9 6.1 9.4 9.1 材料B 7.4 5.4 8.8 8.0 6.8 9.1 6.3 7.5 7.0 6.5 4.4 7.7 4.2 9.4 9.1
显示全部