文档详情

抽样分布与参数估计–研.ppt

发布:2017-05-04约3.73千字共39页下载文档
文本预览下载声明
计量资料的统计推断 几个重要概念的回顾: 总体: 样本: 统计量: 参数: 统计分析:统计描述 统计推断:参数估计、假设检验 欲了解某地2000年正常成年男性血清总胆固醇的平均水平,随机抽取该地200名正常成年男性作为样本。 由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。 第一节 抽样研究与抽样误差 一、抽样研究 用样本信息推断总体特征的研究方法称为抽样研究。 二、抽样误差 (一)抽样误差:由于个体差异和抽样引起的样本统计量与总体参数之间的差异或各样本统计量之间的差异。 均数的抽样误差:?X ? ? 率的抽样误差: p ? π 正态总体中样本均数抽样分布具有如下特点: ①各样本均数未必等于总体均数; ②各样本均数间存在差异; ③样本均数围绕总体均数呈正态分布; ④样本均数变异范围较原变量变异范围大大缩小。 在非正态分布总体中可进行类似抽样。 1、从正态总体N(?,?2)中,随机抽取例数为n的样本,样本均数?X也服从正态分布;即使从偏态总体抽样,当n足够大时?X也近似正态分布。 2、从均数为?,标准差为?的正态或偏态总体中抽取例数为n的样本,样本均数?X的总体均数也为?,标准差为??X 样本均数的标准差称为均数的标准误(standard error of mean, SEM) 计算: 标准误 意义: 反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。 与样本量的关系:S 一定,n↑,标准误↓ 标准误 用途: 衡量抽样误差大小 估计总体均数可信区间 用于假设检验 (三)率的抽样误差 率的抽样误差:由抽样造成的样本率(p)与总体率(π)的差异。 率的标准误(σp):表明率的抽样误差的大小 第二节 t 分布与总体均数的估计 对正态变量样本均数?X做正态变换(u变换): t分布与标准正态分布的比较 1、二者都是单峰分布,以0为中心左右对称 2、t分布的峰部较矮而尾部翘得较高说明远侧的t值个数相对较多即尾部面积(概率P值)较大。当ν逐渐增大时,t分布逐渐逼近标准正态分布,当ν→?时,t分布完全成为标准正态分布 二、总体均数的估计 统计推断:用样本信息推论总体特征。 包括参数估计和假设检验 参数估计:用样本统计量估计总体参数。 1、 点(值)估计:用样本统计量作为对总体参数的估计值 2、 区间估计:根据选定的置信度(或可信度,用概率表示)估计总体参数所在的范围 可信度:估计正确的概率。1- ? 可信区间(confidence level, CI): 总体均数的可信区间 总体均数的95%可信区间 总体均数的95%可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误) 均数的标准差和标准误的区别 总体均数可信区间与参考值范围的区别 (1)t分布 法 ?未知、n小时按t分布原理 总体均数的100(1-α)%CI: 例3.2:P33 (2)u 分布 法 ?未知但n足够大时按正态分布原理 总体均数100(1-α)%CI : (3)u 分布法 ?已知时按正态分布原理 100(1-α)%CI : 95%的CI: 区间估计的准确度:说对的可能性大小, 用 (1-?) 来衡量。99%的可信区间好于95%的可信区间(n, S 一定时)。 区间估计的精确度:指区间范围的宽窄,范围越宽精确度越差。99%的可信区间差于95%的可信区间(n, S 一定时)。 准确度与精确度的关系: … … 计算 用于表示抽样误差大小、总体均数的区间估计和均数的假设检验等 描述资料的频数分布状况,可用于制定医学参考值范围 用途 描述样本均数的变异程度,说明抽样误差的大小。其值越小,估计总体均数的可靠性越大… 描述观察值的变异程度。其值越小,观察值的变异程度越小,均数的代表性越好… 意义 标准误 标准差 正态分布法或 百分位数法 U分布法或t分布法 计算 方法 绝大多数观察对象某项指标的分布范围 总体均数的区间估计 用途 “正常人”的解剖、生理、生化某项指标的波动范围 个体值的波动范围 按预先给定的概率确定的未知参数μ的可能范围 总体均数的可能范围 含义 参考值范围 总体均数的可信区间 * * 样本 总体 统计推断:用样本信息推论总体特征的过程。 包括: 参数
显示全部
相似文档