文档详情

第节均数的抽样误差和总体均数估计临本.ppt

发布:2016-09-11约4.75千字共62页下载文档
文本预览下载声明
注意: 假设针对的是总体; H0和 H1是互斥的; 单侧、双侧的选择。 样本均数所代表的未知总体均数?与 已知总体均数?0的比较        目的     H0     H1 双侧检验 是否?≠ ?0   ? = ?0   ?≠ ?0 单侧检验 是否? ?0 ? = ?0 ? ?0       是否? ?0   ? =?0    ? ?0 检验水准(size of test) 也称显著性水准(significance level),符号为α,常取0.05或0.01。 是小概率事件的概率标准,也是假设检验时发生第一类错误的概率。 (二)选定检验方法和计算检验统计量   根据资料类型、研究设计的类型及分析目的选用适当的检验方法,计算相应的检验统计量。 具体有t检验和u检验。 (三)确定P值,做出推断结论   用计算得的检验统计量与相应界值表中的界值比较,确定P值。 P值是指在H0所规定的总体中做随机抽样,获得等于及大于(或等于及小于)现有统计量的概率。 如果P≤α,则按α水准拒绝H0,接受H1,称差异有显著性,或差异有统计学意义; 如果P>α,则按α水准不能拒绝H0,从而接受它。称差异无显著性或无统计学意义。 假设检验的基本原理与t检验 ■ 假设检验的基本原理 3. 确定P值,作出结论 P值是指在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量t值的概率。 3.确定概率P值作出结论 谢 谢! * 均数 标准正态分布 N(0,12) Student t分布 自由度:n-1 0 t 分布 一簇曲线 0 N(0,1) n足够大时, (1) (2) (3) 以固定 n 随机抽样 * 英国统计学家Gosset (二)t 分布的图形与特征 分布只有一个参数,即自由度 图 不同自由度下的t 分布图 t 分布与标准正态分布 * * 1.特征: 2、 t界值表: 详见P312,可反映t分布曲线下的面积。 单侧概率或单尾概率:用 表示; 双侧概率或双尾概率:用 表示。 -t t 0 由t界值表可知: ★相同自由度时,︱t︱越大,概率P越 小。 ★相同t值时,双侧概率是单侧概率的两倍。 ★ν=∞时,t 分布即为Z分布,故t界值表中最后一行是Z界值。 t分布的分位数(双侧t界值) ?/2 ?/2 1-? t?/2,? -t?/2,? * ? 1-? t?,? t分布的分位数(单侧t界值) * 举例: 三、总体均数的置信区间估计 用样本统计量推断总体参数。 总体均数估计:用样本均数推断总体均数。 点估计(point estimation): 用相应样本统计量直接作为其总体参数的估计值。如用 估计μ、s估计? 等。其方法虽简单,但未考虑抽样误差的大小。 按预先给定的概率(1??)所确定的包含未知总体参数的一个范围。 总体均数的区间估计:按预先给定的概率(1??)所确定的包含未知总体均数的一个范围。 如给定?=0.05,该范围称为参数的95%可信区间或置信区间; 如给定?=0.01,该范围称为参数的99%可信区间或置信区间。 2.区间估计(interval estimation): 计算总体均数可信区间 需考虑: (1)总体标准差?是否已知, (2)样本含量n的大小 通常有两类方法: (1)t分布法 (2)z分布法 1.当?未知且n 较小时,由于 服从 t分布,可按 t 分布原理估计总体均数的可信区间。 由于 即 故总体均数(1-?)?100%的可信区间为 * 2、当?未知但n足够大时( n 100),t分布近似u分布,可以 u 界值代替 t 界值,估计总体均数的可信区间。 3、当?已知时,可按正态分布的原理,估计总体均数的可信区间。 * 例 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。 故该地正常成年人血清胆固醇均数的95%可信区间为(3.47, 3.81)mmol?L。 * 四、置信区间的确切涵义 * 1. 95%的可信区间的理解: (1)我们所估计的可信区间有95%的可能包含所要估计的总体参数。 (2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可
显示全部
相似文档