数值变量统计描述解析.ppt
文本预览下载声明
随机抽样两个班各3名同学的体重(Kg),测量结果分别为 A班:59 60 61 均数=60 (Kg) B班:30 60 90 均数=60 (Kg) 问两组资料的分布特征是否相同? 第三节 数值变量资料的离散趋势描述 离散趋势描述用以反映一组同质观察值的离散性或变异程度。 一、极差(R):用于反映个体变异的范围 1、未顾及全部数据间的变异, 2、例数越多,R可能越大。(不稳定) A: 1 2 3 4 5 6 7 8 9 10 11 23 B: 1 3 6 8 10 11 13 16 18 19 20 22 AR =22 BR =21 A: 1 2 3 4 5 6 7 8 9 10 11 23 B: 1 3 6 8 10 11 13 16 18 19 20 22 A: 4 5 6 7 8 9 B : 8 10 11 13 16 18 AR = 5 BR =10 二、四分位数间距(Q,QR):上下四分位数之差;即Q = QU-QL; 四分位数间距 (Q) =P75 - P25 (四分位数间距可以看成一半变量值的极差) Q的主要用途: (1)Q适用于任何分布的资料,结果比极差稳定,尤其适用于大样本偏态分布的资料。 (2)与M共同描述 偏态分布资料的分布特征,简写成M(Q); (3)计算参考值范围(百分位数P2.5,P97.5的范围) x - 表示变量值与均数的离散程度 ∑(X- ) =0 (离均差和) A组 (59-60)+(60-60) + (61-60)= 0 B组 (30-60) + (60-60) + (90-60)= 0 ∑(X- )2 ≠ 0(离均差平方和) ★ 自由度的概念 物理学:事物在N度空间中能自由活动的度数, 统计学:一定条件下能自由取值的变量个数。以符号?表示。 (1) X1+X2=1 ?=n-1=2-1=1 (2) 四个数的均数为5,只有三个数据能自由取值。 ?=n-1=4-1=3 ?=N-限制条件个数 Page ? * (二)离均差平方和(SS) (三)方差:也叫均方,就是将离均差平方和再取平均,用S 2 或MS表示; V指随机变量中能自由取值的个数。 从公式可知,MS越大,观察值间的变异程度越大。 自由度(V) 从方差计算式可知,方差使观察值的原变量单位变成相应的平方单位,不便于进行比较,故主要用于假设检验中的方差分析。 四、标准差(符号s):即方差的算术平方根,这样就将方差中观察值的平方单位还原,便于比较,是常用的离散性指标;s越大,表示观察值的变异程度越大。 直接法:用于小样本资料(n30),公式为 例9-11 测得7名外感风寒女性的体温为37.8,38.0,38.1,38.2,38.3,38.5,39.4。求s 时间 分组 2W 4W 8W 12W 24W 正常对照组 2686±223 2664±247 2697±246 2661±226 2658±237 B组 对照 2674±239 2681±237 2700±258 2660±248 2655±232 试验* 2350±183 2086±153 1754±158 1320±177 1365±101 t 8.673 8.301 5.516 10.772 12.004 P 0.001 0.001 0.005 0.000 0.000 兔咬肌IIb型纤维平均横截面积 (n=5 ±s,μm2) 五、变异系数(CV): 一组观察值的s与均数的百分比。 CV的主要用途: (1)比较度量单位不同或均数相差悬殊时几组样本资料的离散性; (2)评价精密度。 应用变异指标的注意事项 极差适用于任何分布的资料,用于资料的粗略分析。 四分位数间距适用于偏态分布的资料 M(Q) 。 标准差适用于正态分布或近似正态分布的资料。 ( ±s) 变异系数适用于度量衡单位不同的指标间的比较以及均数相差比较悬殊的变异程度的比较。 (2)负偏态:峰偏右(频数大多偏于数值大的右侧),长尾向左伸延;(与正偏态相反) 频数分布的类型 正态分布、对称分布
显示全部