文档详情

讲单样本显著性检验.ppt

发布:2017-11-16约3.3千字共29页下载文档
文本预览下载声明
* * 第5章 单样本显著性检验 第一节 导论:平均数的抽样分布 1. 如何比较抽样分布的均数与样本来自的总体均数? 2. 当增加抽样分布的样本量时,样本平均数如何变化? 例1:大学生艾滋病知识问卷测试。设总体μ=50,σ=10。有多少大学生在40分到60分之间呢? 图5-1a 有68%的大学生测试分数在40-60分之间 随机抽取一个大样本,其个体分数的分布见图5-1(a) 如果抽取样本量N=3的100个个样本,计算每个样本平均数,图5-1b 包含68%的样本均数,每个样本平均数会是一样吗? 如果抽取N=20的100个个样本,计算每个样本平均数,图5-1c 样本平均数与总体平均数相差较小 如果抽取样本容量N=40的100个样本,计算每个样本平均数,图5-1d 样本平均数与总体平均数相差更小 从总体抽取一个样本的分布 总面积的68% =个体分数方差 样本平均数的分布 总面积的68% =样本均数的方差 =样本均数的标准差 样本平均数的平均数的标准差,就称为均数的标准误(standard error of mean),如果总体标准差已知,则标准误: 5-1 如果总体标准差未知,则标准误: 5-2 无论总体标准差已知还是未知,标准误的大小取决于总体的变异与样本大小。 标准误= μ=50 σ=2 总体中个体分数 小样本 大样本 第二节 统计假设检验:已知总体均数和标准差 图a, 知总体μ和σ,从中抽取大量样本,见图b 图b,可以描述这些大量样本的平均数和标准差,可用来确定正态曲线下的概率值。 图c ,通过已知正态分布的概率关系,可计算任意一个样本的平均数有关的概率 2.1 样本平均数落在特定区间的概率 如前述,任一正态变量都可转化为标准正态分布,可根据 z 分数与正态曲线下的面积关系求概率 换言之,任给一个原始分数,只要知道该分数之外的面积比例,就可以知道与此相应的 z 值。 同理,任给一个样本平均数,只要知道该平均数之外的面积比例,就可以知道与此相应的 z 值 =2/2=1 P(z≥1)=0.1587 例2:已知μ=50,σ=10,从该总体随机抽取一个N=25的样本,问该 ≥52的概率为多少? P(48≤X≤52)=P(-1≤z≤1)=2×0.34=68% 2.2 样本平均数的假设检验 1. H0:μ≤20 2. H1:μ>20 3. 统计检验:因为σ已知,所以使用 z 检验 4. 显著性水平:α=0.01 单尾 5. 抽样分布:正态概率曲线 6. 拒绝H0的临界区间:| z |≥2.33 例5-2 安眠药睡眠时间服从正态分布,标准差1.5小时,10人服用后,测得平均睡眠时间为21.15小时,该批号安眠药睡眠时间的总体均数是否高于20小时? 0.0049 0.4951 2.580 尾部 面积 Z 0.0099 0.4901 2.33 尾部 面积 Z 0.0250 0.4750 1.960 尾部 面积 Z 0.0505 0.4495 1.64 尾部 面积 Z 因为z2.33, 所以P0.01,拒绝H0,差异有统计学意义。可以认为该批安眠药睡眠时间的总体均数高于20?小时。犯错误的风险为0.01。 例5-2 安眠药睡眠时间服从正态分布,标准差1.5小时,10人服用后,测得平均睡眠时间为21.15小时,该批号安眠药睡眠时间的总体均数是否高于20小时? 第三节 通过样本数据进行参数估计—点估计 人口普查中的资料可以获得总体信息,多数情况不能获得总体信息,尽管如此,我们仍然可以采用样本统计量推测总体参数。 实际工作中是抽取单一样本,利用样本统计量对总体进行的估计称为点估计。 已知方差 用方差描述样本的变异有没有问题? 没有问题 再问:用方差估计总体方差有没有问题? 答:有问题,一般地,样本方差估计总体方差是偏低的。 如果用大样本估计总体方差,得到的是无偏估计: σ2的无偏估计: 5-3 σ的无偏估计: 5-4 因此,平均数抽样分布的总体方差估计值: 5-5 平均数抽样分布的标准误: 5-6 或者 本课件一律采用下式计算标准误: 5-7 表5-1 温习平均数、方差和标准差的符号 S σ 标准差 S2 σ2 σ2 方差 μ ,μ0 平均数 样本统计量 (经验上的) 总体参数 (理论上的) 平均数抽样分布的无偏总体估计 (经验上的) 平均数的抽样分布参数 (理论上的) 图5-6 样本数据可以用来估计总体方差(σ2)的无偏估计 以及平均数的标准误 ,样本方差越大,总体方差的估计值和平均数的估计标准误也越大 样本数据 或 第四节 参数未知时统计假设检验— t 检验 如果总体方差已知,用 如果总体方差未知,用 图5-
显示全部
相似文档