(精)数值变量的统计描述.ppt
文本预览下载声明
第四节 正态分布及标准正态分布 某地120例正常人血清铜含量的直方图。 设想观察人数逐渐增多、组距不断细分,作直方图。 将各直方顶端的中点连接,形成一条光滑的曲线,近似于数学上的正态分布曲线。 一、正态分布(normal distribution) 又称Gauss分布或常态分布,是一种最重要 的连续型分布。 正态分布曲线是高峰位于中央,两侧逐渐 下降,左右对称,永远不与横轴相交的曲线。 正态分布的概率密度函数 (–∞<x<∞) 则称X服从正态分布,记作X~N(μ,σ2) 二、正态分布的特征 1.在X轴上方,均数所在处最高。 2.正态分布以均数为中心,左右对称。 3.正态分布有两个参数μ和σ。 4.正态曲线下的面积分布有一定规律。 X f(X) m 正态曲线下面积分布的规律: 曲线下横轴上的总面积为100%或1。 曲线下对称于μ的区间面积相等。 (1)正态分布区间(?-?,?+?)下的面积,即???范围的面积占总面积为68.27%; (2)正态分布区间(?-1.96?,?+1.96?),即??1.96?范围的面积占总面积为95.00%; (3)正态分布区间(?-2.58?,?+2.58?),即??2.58?范围的面积为99.00%。 三、标准正态分布 标准正态分布 由于不同的μ和σ,对应不同的正态分布曲线,显得非常麻烦。为寻求一个通用的方法,进行标准正态变换 (即u变换):u=(x -μ)/σ 此变换实质上是作了一个坐标轴的平移和尺度变换,使原来的正态分布变换为μ=0、σ=1的标准正态分布,记为N(0,1)。 三、正态分布的应用 正态分布是很多分布的基础,应用及其广泛。 估计频率分布 制定医学参考值范围 质量控制 处理对数正态分布资料 已计算出某药100片的含量均数 ,标准差 。试估计:①含药量在49.0mg以下者占药片总数的百分比;②在49.0~ 58.0mg之间者占药片总数的百分比;③在58.0mg以上者占药片总数的百分比。 (一)估计频率分布 ?(?)= ?(u) ?(X) X ?(?) ?(u) 1- ?(u) 通过u变换,一般正态分布转换为标准正态分布,再查u值表可得某区间的频数分布比例。 据上可得: ①含药量在49.0mg以下者占药片总数的百分 比为46.02%; ②在49.0~ 58.0mg之间者占药片总数的百分 比为49.89%[?(1.74) - ?(-0.10) ]; ③在5.08mg以上者占药片总数的百分比为4.09% [1-?(1.74) = ?(-1.74) ]。 医学参考值范围(reference range)是指 包括特定健康状况的人群的解剖、生理及生化 等各指标的数据波动范围,也称正常值范围。 采用医学参考值范围作为判定正常和异常 的参考标准。 (二)医学参考值范围的估计 并不是指机体任何器官,组织的形 态和机能都正常的健康人,而是排除 了影响所研究指标的疾病和异常的同 质人群。 “ 特定健康状况的人”的含义 双侧 : 血糖值无论过低或过高均属异常 白细胞数无论过低或过高均属异常 单侧 : 血清转氨酶仅过高异常(单侧上限) 肺活量仅过低异常 (单侧下限) 确定单、双侧(结合专业知识) 1、医学参考值范围有80%、90%、95%、99% 等,最常用的为95% 。 确定百分比 2、根据该指标所诊断疾病在临床中误诊与漏诊危害性大小来选择,若误诊危害大,则可考虑选99%,反之选80%。 计算医学参考值范围的常用方法: 正态分布法:资料分布(近似)正态 百分位数法:资料分布呈偏态 选择计算方法(结合资料分布) 要求: ,资料呈正态分布 双侧参考值范围: 常用的双侧95%参考值范围: 单侧参考值范围: 常用的单侧95%参考值范围: (下限)或 (上限) 1、正态分布法 估计某地108名正常成年女子血清总蛋白( , )的95%参考值范围。 例 如 故 下限: 上限: ) / ( 5 . 81 9 . 3 96 . 1 9 . 73 2 / 05 . 0 L g S u X = ? + = + ) / ( 3 . 66 9 . 3 96 . 1 9 . 73 2
显示全部