文档详情

正态分布及均数抽样误差题库.ppt

发布:2017-03-16约3.31千字共61页下载文档
文本预览下载声明
直方图 一、正态分布的密度函数 二、 正态分布的特征 1.正态分布在横轴上方,均数处最高,以均数μ为中心,左右对称。 2.正态分布的X取值范围理论上没有边界,X离μ越远,f(X)值越接近0,但不会等于0。 3.正态分布曲线下的面积分布有一定的规律。 三、正态分布的应用 不少医学现象服从正态分布或近似正态分布 估计医学参考值范围 质量控制 正态分布是很多统计方法的理论基础 医学参考值范围的估计 1. 医学参考值范围的概念 指特定的“正常”人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。 2. 医学参考值范围的确定要求 确定研究总体,例如 “正常人”。 选择足够数量的观察对象。 统一测定方法,控制实验误差,保证数据的可靠性。 决定取单侧范围还是双侧范围值 选择恰当的百分范围 医学参考值范围的估计 3. 医学参考值范围的计算方法 百分位数法: 适用于偏态分布资料 例如白细胞数的95%参考值范围:因为白细胞数无论过高或过低均属异常,则分别计算P2.5和P97.5,这是双侧95%参考值范围。 一、均数的抽样分布与抽样误差 抽样研究的目的就是要用样本信息来推断总体特征。由于存在个体变异,样本均数(X)往往不等于总体均数(?),因此抽样后各个样本均数也往往不等于总体均数,且各个样本均数间也不一定都相等。这种由抽样造成的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避免的。 已知Σf=110,ΣfX=19000,需要在该表中增加fx2栏,由第(3)、(4)栏相乘,再将该栏数据相加,将ΣfX2=3283646代入公式 重复100次刚才的抽样,得到100个样本(每个样本含量均为10个),可算得100个样本均数X。 各样本均数的均数X=172.66(cm) μ=172.73cm 总体均数为μ,标准差σ 样本1( ,s) 样本2( ,s) 样本3( ,s) 样本m( ,s) 抽样,样本量为n … 根据正态分布原理,若随机变量X服从正态分布,则样本均数X也服从正态分布。 随机变量 X:N(μ, ?2) 样本均数 X:N(μ, ?x2) 样本均数的抽样分布具有以下特点: 各样本均数未必等于总体均数; 样本均数之间存在差异; 样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布; 样本均数的变异较之原变量的变异大大缩小。 均数的标准误及计算 反映均数抽样误差大小的指标是样本均数 X 的标准差简称标准误(理论值),用 表示,或SE、SEM。 由于在实际抽样研究中?往往未知,通常用某一样本标准差s来替代?,得标准误的估计值 (通常也简称为标准误),其计算公式为: 以X1=173.22,s1=4.05为例: 一般情况下?未知,常用 估计抽样误差的大小。 作为 的估计值。 例 2000年某研究者随机调查某地健康成年男子27人,得到血红蛋白量的均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。 将X=125g/L,s= 15g/L,n=27代入 例:已知 s=6.85, n=100 则样本均数的抽样误差 为多少? 标准误的应用 1.反映样本均数的可靠性; 标准误反映抽样误差的大小。标准误大,表示抽样误差大,则样本均数估计总体均数的可靠性差。反之,标准误小,抽样误差小,样本均数估计总体均数的可靠性好。 2.估计总体均数的可信区间; 3.用于均数的假设检验。 二、总体均数的可信区间估计 即用样本指标(统计量)估计总体指标(参数) 有两种常用方法:点估计和区间估计。 (一)点估计:样本均数(X)就是总体均数的点估计值(μ) 该法简单,但未考虑抽样误差,而抽样误差在抽样研究中是不可忽视的。 (二)区间估计: 结合样本统计量和标准误可以确定一个具有一定可信度的包含总体参数的区间,该区间称为总体参数的1-α可信区间(confidence interval,CI) * * 例2.1 某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表2-1 5.95 3.82 正态分布和医学参考值范围 0.7 1 5.90 5.80~6.00 1.4 2 5.70 5.60 ~ 2.9 4 5.50 5.40 ~ 9.3 13 5.30 5.20 ~ 12.1 17 5.10 5.00 ~ 19.3 27 4.90 4.80 ~ 22.9 32 4.70 4.60 ~ 17.9 25 4.50 4.40 ~ 7.9 11 4.30 4.20 ~ 4.3 6 4.1
显示全部
相似文档