第二章数值变量统计描述.ppt
文本预览下载声明
第二章 数值变量的统计描述 统计分析方法分类 一、描述性分析 有一些统计指标来反映变量的基本特征。 二、统计推断 有样本的信息(统计量)推断总体的特征(参数)。 一、频数分布表的制作 1.全距 R=最大值-最小值=160.9-125.9=35(cm) 2.定组段和组距 组距=全距/组数 8~15组 i=R/组数=35/10=3.5≈4(cm) 确定上限与下限 3.列频数分布表 二、集中趋势与离散趋势 (一)集中趋势指标 平均数:是用于描述一组同质定量资料的集中趋势,反应一组观察值的平均水平的指标体系。 1. 算术平均数(均数):一组观察值之和除以观察值个数所得的商。 (1)直接法 例14.2 有8名正常人的血清球蛋白含量(g/L)分别为31, 25, 29, 26,26,30,26, 26, 求这8名正常人血清球蛋白的平均含量。 (2)加权法 2.几何均数:n个观察值的乘积开n次方所得的根。 直接法: 几何均数运用条件: 数值呈等比级数、对数正态分布等。 例: 有5人, 其血清抗体效价分别为1:10, 1:100, 1:1000, 1: 10000, 1:100000。求其效价的平均水平。 该5份血清的平均抗体效价为1:1000。 例: 40名麻疹易感儿, 皮下注射长春47麻疹减毒活疫苗后1 个月, 血凝抑制抗体滴度见表第(1)、(2)栏, 求平均滴度。 加权法: 平均滴度为1:64 3.中位数:是一组由小到大排列的观察值位置居中的数值。 3 5 7 11 12 M=7 3 5 7 9 11 12 M=(7+9)/2=8 适宜条件: 数据偏态分别、分布不清、数据一端或两端为开放数据。 例: 现有164人患某种沙门氏菌食物中毒潜伏期资料如表,分别求P25, P50, P75, P95。 第三章 离散趋势的统计描述 (二)离散趋势指标 1.全距(极差):是一组观察值中最大值与最小值之差。 R=最大值-最小值=183.5-162.9=20.6(cm) 2.四分位数间距 (IQR) 百分位数:把一组数据由小到大排列,第x百分位数(Px)将数列分成两部分,有x%的数据比Px小,有(1-x%)的数据比Px大。 P25:下四分位数 P75:上四分位数 IQR= P75- P25 ( 居中一半数据波动的间距) 3.方差 为克服全距不能反映每个观察值之间的离散情况的缺点,用每个观察值X与总体均属 3.标准差 例:有3组同龄男孩体重(kg)如下,均数都是30(kg),试分析其离散程度。 甲组: 26 28 30 32 34 乙组: 24 27 30 33 36 丙组: 26 29 30 31 34 全距 s CV 甲组: 8 40 3.16 10.54 乙组: 12 90 4.74 15.81 丙组: 8 34 2.92 9.72 4.变异系数 (CV) CV常用于(1)均数相差悬殊 (2)比较的均数单位不同 例: 某地1990年调查10岁男孩 身高: =125.62cm =5.01cm, 体重: =23.92kg =2.82kg, 试比较其身高和体重的变异程度。 身高 体重 10岁男孩体重的变异程度比身高的变异程度大 三、正态分布 正态分布曲线以总体均数μ为中心,两侧逐渐降低,左右对称,不与横轴相交的光滑钟形曲线。 正态分布曲线的位置与形状取决与两个参数(μ,σ)。 μ位置参数 σ形状参数 正态分布曲线下面积规律。 正常值的确定: 95%正常值范围 99%正常值范围 单侧95% 单侧99% 四、正态分布的应用 1.估计正常值范围; 2.估计总体参数的置信区间; 3.差异显著性检验; 4.质量控制。 * * (137.05,149.05) 95%正常值范围 (131.29,154.81) 99%正常值范围 * * * 几何均数加权法计算表
显示全部