文档详情

第4章抽样误差与假设检验.ppt

发布:2017-04-19约1.83千字共38页下载文档
文本预览下载声明
流行病与卫生统计学教研室;本章主要内容:;第一节 均数的抽样误差与标准误差;1. 156.7 5.16 158.1 5.21 155.6 5.32 99. 154.6 5.15 100. 156.6 5.25 ;抽样误差(smpling error) 这种由抽样造成的样本统计量与总体参数之间的差异成为抽样误差.;若从正态总体N(μ, σ 2)中,反复多次随机抽取样本含量固定为n的样本,那么这些样本均数 也服从正态分布。样本均数 的总体均数仍为μ,样本均数的标准差为 ,其计算公式为:;SAMPLE 1:x11 x12 x13 x14...x1n;标准误(standard error,SE) 样本均数的标准差。 它反映了来自同一总体的样本均数之间的离散程度以及样本均数和总体均数的差异程度,即均数的抽样误差的大小。;由于在实际工作中,总体标准差σ往往未知,而是用样本标准差S来代替σ,故只能求得样本均数标准误的估计值S X ,其计算公式为:;例 4.1 某市随机抽查成年男子140人,得红细胞均数4.77×1012/L,标准差0.38×1012/L,计算其标准误。;第二节 总体均数的估计;2.参数估计(parameter estimation)是指由样本统计量估计总体参数,是统计推断的一个重要内容。 (1)点估计(point estimation) 用样本统计量直接作为总体参数的估计值。 (2)区间估计(interval estimation)又称可信区间(置信区间,CI) 按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。;μ=155.4cm;3.可信区间有两个要素:;t分布是t检验的基础,亦称 student t检验,是计量资料中最常用的假设检验方法。; 1899年作为一名酿酒师进入爱尔兰的都柏林一家啤酒厂工作,在那里他涉及到有关酿造过程的数据处理问题。 由于酿酒厂的规定禁止戈塞特发表关于酿酒过程变化性的研究成果,因此戈塞特不得不于1908年,首次以“学生” (Student)为笔名,在《生物计量学》杂志上发表了“平均数的概率误差”。Gosset在文章中使用Z统计量来检验常态分配母群的平均数。由于这篇文章提供了“学生t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。;随机变量X N(m,s2);均数 ; f(t);1、以0为中心,左右对称的单峰分布。 2、t分布曲线是一簇曲线,其形态变化与自由度ν的大小有关???( ν =n-1)。;为便于使用,统计学家编制了不同自由度ν对应的t界值表。;s未知 且 n较小 (n50) 按t分布 但n足够大(n50) 按u分布 s已知 按u分布;(一)σ已知;(二)σ未知;2.n较大(n50);例4.2 某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32g/L,标准差为0.57g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。;例4.3 试计算例4.1中该地成年男子红细胞总体均数的95%可信区间。;第三节 假设检验的意义和步骤;例4.4 以往通过大规模调查已知某地新生儿出生体重为3.30kg. 从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg, 标准差为0.40kg。;;;二、假设检验的基本步骤;例如:要比较经常参加体育锻炼的中学男生心率是否低于一般中学男生的心率,就属于单侧检验。;2.选择检验方法和计算统计量 根据资料的类型和分析目的选择适当的检验方法,并根据选择的方法计算相应的统计量。;样本统计量值的概率P;用P值与检验水准α进行比较,根据比较结果作出统计推断。;1. 对于H0只能说拒绝与不拒绝,而对H1只能说接受。 2. P≤α,则拒绝H0 ,接受H1 ,差异有统计学意义,可???为……不同或不等。 3. Pα,则不拒绝H0 ,差异无统计学意义,尚不能认为……不同或不等。 4. 应事先确定α。选α=0.05只是一种习惯,而不是绝对的标准。;
显示全部
相似文档