第二章 统计资料的整理及程序.ppt
文本预览下载声明
第一节 数据的概念与种类 一、数据的概念与特点 (一)数据的概念 数据即带有单位的数,它是通过对具体事物进行计数或者测量所得到描述事物特征的数量依据。 换句话说,数据是从数量关系的角度反映事物的存在状态。 (二)数据的特点 变异性 数据的变异性是指对客观事物观察或测量得到的一组数据,其数值大小总是在一定范围内不断变化,表示出不同程度上的差异。 规律性 数据的规律性是指在一定范围内,其数值呈现出差异的同时又存在着一定的规律性,即数据的分布具有规律性。 二、数据的种类 (一)按变量的测量水平分,可分为: 称名变量、等级变量和比率变量 1.称名变量:是指根据事物的某一特征,用 来划分、区别事物的不同种类所形成的变量。 例如:用“1”表示男性,用“0”表示女性。 2.等级变量:又称顺序变量,是指在对事物的分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。 3.等距变量:是指在观测标识事物某一特定属性时,具有相对参照点、相等单位的变量。 4.比率变量:是指既有绝对参照点,又有相同单位的变量。如物体的长度、重量、体积等。 (二)按数据的获得方式分,可分成计数数据和测量数据 1.计数数据:是以计算个数的方式得到的数据。如:学校数、教师数、学生数等。 2.测量数据:需要借助一定的测量工具来获得。如:身高、体重、考试分数等。 (三)按数据分布的形式分,可分为离散变量和连续变量 1.离散变量:是指在量尺上其取值有限且彼此不连续的数据。 特点:代数轴上可能取到的有限个点值;以整数的形式出现,小数或分数没有实际含义。 2.连续变量:是指在一定范围内连续变化、取值无限多的变量。 特点:代表数轴上的一段距离;具有实数的稠密性。 确定实限的方法: 连续变量取值的表述形式加上它最末一个数位的半个单位值,为实上限;减去它最末一个数位的半个单位值,为实下限。 例:确定连续变量取值19的实限。 解:19的最末一个数位的单位值是1,一半是0.5,所以19的上限是19+0.5=19.5,下限为19-0.5=18.5。即19的实际代表范围是[18.5 ,19.5)这一左闭右开区间。 练习: 1.确定连续变量取值15.6的实限 2.确定连续变量取值10.00的实限 第二节 统计资料整理的意义与程序 一、统计资料整理的意义 首先,统计资料的整理是对统计调查的进一步深化。 其次,统计资料的整理是统计分析的前提。 二、统计资料整理的程序 (一)分组 分组:即根据研究的任务及统计事项内在的特征,按一定的标志把数据资料进行归类,将性质相同的数据归为一组。有简单分组和复合分组。 标志:指统计总体内各单位所具有的区别于其他单位的属性或特征。分为:品质标志和数量标志。 (二)汇总 (三)列统计表 统计表:就是把统计指标和被说明的统计事项用表格的形式表示出来,使人一目了然。如: 第三节 统计表 一、统计表的作用与种类 (一)统计表的作用 统计表作为统计资料的最主要的表现形式之一,是自下而上定期地向上级行政部门传送统计资料的重要载体。 (二)统计表的种类 1.简单表:又称单项表,只按一个标志简单列出调查单位(名称、地点)、时序(年、月)或统计指标名称的统计表。如: 表 2 某中学教师2002——2005年度公开发表论文统计表 表 3 某学校男女学生人数统计表 2.分组表:将统计资料按某个标志(品质或数量)进行分组列成的统计表 例如: 3.复合表:按两个或两个以上标志分组列成的 例如: 表4 客户产品销售情况统计表 二、次数分布表 表现总体单位在各组的次数分配情况的统计表,叫做次数分布表。 (一)简单次数分布表 编制简单次数分布表的一般步骤如下: 1.求全距:全距(range)是指所有数据中最大值与最小值之间的差距。用符号R表示,全距的计算公式是: 2.定组数 定组数就是将全距分为若干组。用符号k表示。组数多少没有严格规定,视资料的性质和数据多少而定。组数不宜太多,太多不但计算麻烦,而且范围太小,不能明显表示出分布的主要趋势。但也不宜太少,太少则可能把很多不同事实归于一类,其分布的主要特征被掩盖。一般分组以10——20组以下为宜。 3.求组距 组距就是每组的间隔,常以i表示,组距一般是相等的,组距的大小是由全距的长短以及组数的多少决定的。 组距(i)=全距( R )/组数(k) 一般是取5的倍数,如5
显示全部