统计资料的整理知识课件.ppt
文本预览下载声明
经济统计学 统计资料的整理;二、资料整理的内容
(一)对原始资料进行审核
1. 完整性审核
应调查的总体单位是否齐全
调查项目(标志)的回答是否完整
答案缺失的三种表现:
A. 全部不回答
B. 部分不回答
C. 隐含不回答;2.准确性审核
逻辑检查:分析标志、数据之间是否符合逻辑,有无矛盾及违背常理的地方。
比较审查法:利用指标数据之间的关系及规律进行审查。
设置疑问框审查:利用指标之间存在一定的量值与比例关系,规定疑问框,审查数据。
通过审核发现数据差错,应根据情况及时纠正或处理:
属于填报错误,可通知填报者重新填报;
属汇总过程错误应根据情况予以修正。
;(二)检查分类方法:
是否合理、周到、可行,如有需要,进行修改。
(三)归纳与汇总:
按最后确定的分类方法,将各总体单位归入相应的组,并汇总各组和总体数据。
(四)制表、制图:
将汇总结果,编制成统计表、统计图,以备分析之用。
(五)资料积累:
将汇总资料存入数据库。如有条件可把原始资料一并存入,以便进一步加工,用于特定课题研究。;第二节 统计分组
一、统计分组的意义
即根据某种标志将总体区分为若干部分或组。
在保证调查资料准确的前提下,分组是否合理、科学关系到统计研究的成败。
是统计整理最重要的环节。
分组的基本原则:组内同质,组间相异.
二、统计分组的作用
(一)区分现象的性质,划分现象的类型
(二)揭示现象的内部结构,并可通过各组数量在总体中所占比重,表明总体结构的类型。
(三)分析现象之间的依存关系或因果关系;三、分组标志的选择
(一)根据研究目的选择分组标志
(二)在有几个标志可供选择时,应选择最能反映现象本质特征的标志
(三)标志的选择要考虑经济条件的变化
;四、简单分组与复合分组
根据分组时采用标志的多少,分为:
(一)简单分组:只按一个标志对总体进行分组。
(二)复合分组:按两个以上的标志连续进行分组。;简单分组和复合分组的选择:
要根据分组目的和资料特点选择采用简单分组或 复合分组。
如总体单位数众多,情况复杂,可采用复合分组。
复合分组采用标志不宜过多。
;第三节 分配数列
一、分配数列的意义
根据一定标志(品质标志或数量标志)对总体进行分组,并按一定顺序排列,即形成分配数列。
分配数列的构成或要素:
1.总体分组或分组
2.总体单位在各组的分配次数(或出现次数),可用绝对数表示(频数frequency),也可用相对数(%,频率lative frequency ,或比重)来表示。
;二、分配数列的分类
根据分组标志不同,可分为:
(一)品质数列。按品质标志分组的数列
(二)变量数列。按数量标志分组的数列
变量数列分为:
1.单项数列。每个组的组值只用一个变量值来表示。适用于离散变量,且组数不多、组值变动幅度不大的情况。
2. 组距数列。每个组的组值是由一对表示一定范围或距离的两个变量值形成的组。适用于连续变量,或离散变量,其变量值很多、变量波动的范围很大的情况。
;下限;在组距数列中的几个基本概念:
上限(upper limit):组的最大值
下限(low limit):组的最小值
上限-下限=组距
最大组的上限-最小组的下限=全距
组中值=(上限值+下限值)/2
组中值(class midpoint)即各组上、下限的中点
如变量值分布均匀,组中值便与组平均数一致
组中值常用来代表各组的平均水平,在统计分析中被广泛采用。;在组距数列中:
各组组距相等的,称等距数列
组距不相等的,称不等距数列或异距数列
采用等距还是不等距数列,要根据资料的特点和研究需要而定,要能反映分布的规律。
组距数列还分为:
闭口组:上、下组限齐全
开口组:缺上组限或下组限
缺下限的开口组组中值=上限-邻组组距/2
缺上限的开口组组中值=下限+邻组组距/2;三、变量数列的编制方法
(一)确定组距和组数
1.将原始资料排序,找出最大值、最小值
2.确定全距
3.确定组距和组数
组距和组数互为制约
一般可先确定组距,再根据组距确定组数。
在经济统计中,一般5-15组较合适。
应将总体单位的性质区别及其分布特征、集中趋势显示出来。
;(二)组限的确定
原则:
最小组的下限应低于或等于最小变量值
最大组的上限应高于或等于最大变量值
必要时,可采用开口组
; 组限表示方法;四、累计次数表
累计次数(cumulative frequencies)即从数列的头或尾开始,截止到某一组的上限或下限止,累计出现的次数。
分为:
1.较小制累计次数。从最小一组算起,小于该组上限的累计次数
2.较大制累计次数。从最大一组算起,大于该组下限的累计次数
;根据累计次数表可以
显示全部