文档详情

第十章单变量描述统计.doc

发布:2017-02-06约7.88千字共12页下载文档
文本预览下载声明
第十章 单变量的描述统计 调查所得的原始资料经过审核、整理与汇总后,还需要进行系统的统计分析,才能揭示出调查资料所包含的众多信息,才能得出调查的结论。根据变量数量的差别统计分析划分为单变量分析、双变量分析和多变量分析。在这一讲中我们先介绍单变量的统计分析。 单变量统计分析可以分为两个大的方面,即描述统计和推论统计。描述统计是用最简单的概括形式反映出大量数据资料所容纳的基本信息。推论统计是用样本调查中所得到的数据资料来推断总体的情况。这一讲我们讲解单变量的描述统计方法。 一、变量的分布 (Distributions) 变量的分布分为两类,一类是频数分布,一类是频率分布。频数分布就是变量的每一取值出现的次数;频率分布是用变量每一取值的频数除以总个案数,它是一个相对指标,可以用来比较不同样本。频数分布与频率分布一般以统计表与统计图的形式表达。 统计表 (1)统计表就是以表格的形式来表示变量的分布。如下表所示: 表9-1甲校学生的父亲职业 职业 f p ( 工人 农民 干部 152 288 110 276 524 0.200 27.6 52.4 20.0 总数 550 1.000 100.0 数值中的小数的取舍: 通俗的做法是“四舍五入”。“四舍”没有问题,但无原则的“五入”就会产生一定的误差。例如数值6.25、4.45、3.75、和7.15的总合是21.60。如果对原数的最后一位小数作简单的四舍五入,原数就变成6.3、4.5、3.8、7.2,其总合是21.8,把原来的总合变大了。近代统计学有一项新原则,就是“前单五入”,即“五”前面是单数就进位,若是双数就舍掉(0也算双数)。 (2)对于定序及以上层次的变量我们更多的是使用累加频数和累加频率。如下所示: 表9-2甲校学生之父亲教育水平 教育 f cf ( cf( ( c ( ( c(( 一级 二级 三级 四级 五级 68 550 68 90 482 158 106 392 264 193 286 457 93 93 550 12.4 100.0 12.4 16.3 87.6 28.7 19.3 71.3 48.0 35.1 52.0 83.1 16.9 16.9 100.0 总数 550 100.0 统计图 统计图是以图形表示变量的分布情况。与统计表相比,统计图更直观、生动、醒目,但不够精确。统计图有圆瓣图、条形图、直方图和折线图。 (1)圆瓣图:多用于描述定类变量的分布,主要目的为显示各部分在整体中所占的比重,以及各部分之间的比较。如表9-1的资料可用下图(图1)所示: 农民部分=360°×52.4%=188.64° 工人部分=360°×27.6%=99.36° 干部部分=360°×20.2%=72° (图一)甲校学生的父亲职业分布 (2)条形图:多用于描述定类与定序变量的分布,它是以长条的高度表示变量不同取值的频数(率)分布的,其中长条的宽度没有意义,一般均画成等宽长条。为求清楚,长条之间可以分开。如表9-2的资料可用下图(图2)所示: (图二)甲校学生的父亲教育水平 (3)直方图:直方图是由紧挨着的长条构成的,但与长条图不同,它的条的宽度是有意义的,实际上它不是用长条的高度而是用长条的面积表示频数(率)的大小,长条的纵轴高度表示频数(频率)密度{密度=频数(率)/组距},长条的宽度表示组距。直方图仅适用于定距变量。如表9-3的资料可用下图(图3)所示: 表9-3 甲校学生的家庭每月总收入 收入 f cf ↑ cf↓ 1500~1899 1300~1499 1100~1299 900~1099 700~899 500~699 40 550 40 141 510 181 158 369 339 136 211 475 65 75 540 10 10 550
显示全部
相似文档