统计学教案习题02计量资料的统计描述.doc
文本预览下载声明
第二章 计量资料的统计描述
一、教学大纲要求
(一)掌握内容
1. 频数分布表与频数分布图
(1)频数表的编制。
(2)频数分布的类型。
(3)频数分布表的用途。
2. 描述数据分布集中趋势的指标
掌握其意义、用途及计算方法。算术均数、几何均数、中位数。
3. 描述数据分布离散程度的指标
掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。
(二)熟悉内容
连续型变量的频数分布图:等距分组、不等距分组。
二、 教学内容精要
计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制
频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下:
1.求数据的极差(range)。
(2-1)
2.根据极差选定适当“组段”数(通常8—10个)。
确定组段和组距。每个组段都有下限L和上限U,数据χ归组统一定为L≤χU 。
3.写出组段,逐一划记。
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标
描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
1.算术均数
算术均数(arithmetic mean)简称均数,描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用表示,其计算方法如下:
(1)直接法:直接用原始观测值计算。
(2-2)
(2)加权法:在频数表基础上计算,其中为组中值,为频数。
(2-3)
2.几何均数
几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。其计算公式为:
(1)直接法
(2-4)
(2)加权法
(2-5)
3.中位数
中位数(median)将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
为奇数时 (2-6)
为偶数时 (2-7)
2-1 常用平均数的意义及其应用场合
平均数 意义 应用场合 均数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布 几何均数 平均增(减)倍数 等比资料;对数正态分布 中位数 位次居中的观察值水平 偏态分布;分布不明;分布末端无确定值
(一)反映数据变异程度大小的变异指标
变异指标的应用亦根据资料的不同而选取不同指标进行描述。常用的变异指标有极差、四分位数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。
1.极差
极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
(2-1)
2.百分位数与四分位数间距
(1)百分位数(percentile)是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学正常参考值范围。 百分位数用Px表示,0<?x?<100,如25%位数表示为P25。在频数表上,百分位数的计算公式为:
(2-8)
(2)四分位数间距(inter-quartile range)是由第3四分位数(Q3= P75)和第1四分位数(Q1=
显示全部