数据收集与整理讲解.ppt
文本预览下载声明
第二章 统计数据的收集与整理 ; 主要内容
?
(一)数据的计量
(二)数据的搜集方式与方法???
(三)统计数据的整理
(四)统计数据的质量;1、定类尺度(列名尺度) Nominal scale
将研究对象按某种属性特征对其进行平行的分类或分组,并给每一类别定名。定类尺度是最粗略、精度最低的计量尺度,也是最基本的尺度。
按现象性质差异进行的辨别与区分。确切的值是以文字表述的。各类别间是平等的,没有高低、大小、优劣之分。性别、种族、运动项目等等;2、定序尺度(顺序尺度) Ordinal scale
是对事物之间等级差别或顺序差别的一种测度。 它是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。
按现象顺序差异进行的辨别与区分。确切的值是以文字表述的,也可以用???值标识,也仅起标签作用。各类别间有高低优劣之分,不能随意排列。
; 是把定序排列的各类事物间的差距,以一定的度量单位明确起来,构成定距的数据。这是比前两种尺度更精确的计量尺度,一般要求建立某种物理的量度单位。
按现象绝对数量差异进行的辨别与区分。值以数字表述,有计量单位。可以进行加减运算。各类别间自然有大小之分,但没有绝对的零点,不能乘除计算。
;天气预报:石河子
9月5日最高温度28℃,最低17℃
3月20日最高温度4℃ ,最低-2℃; 是量度层次最高的数据测定尺度。它是在定距尺度的基础上增加了一个绝对零点,并抽象掉事物的度量差异的测定尺度。
按现象绝对差异与相对差异进行的辨别与区分。确切的值也以数字表述,有计量单位 ,可以进行加减运算。有绝对意义上的零点,既可以加减运算,也可以乘除运算。
;高 层次 低; 对 宗教、种族、民族、性别、党派、国别、职业等等品质方面的差异进行测量;第二节 统计数据的来源;统计调查方式; 普查是一种专门组织的、对总体全部单位进行的一次性调查。普查往往涉及面广,资料要求细,需要耗费较多的人、物、财力和时间。一方面不宜多采用,另一方面要搞好普查的组织工作。(人口普查、农业普查、经济普查)
中华人民共和国成立以来,已成功地进行了六次人口普查,这些普查分别于1953、1964、1982、1990、2000年进行,第六次为2010年。 ;;特点:;;调查范围:全面报表、非全面报表
全面报表:要求调查对象每一个单位都填报。
非全面报表:要求调查对象中的部分单位填报。
内容和实施范围:国家统计报表/部门~/地方~
报送周期长短:日报、旬报、月报、季报、半年报、年报
报送单位不同:基层统计报表、综合统计报表。;; 是在对研究对象进行全面分析的基础上,有意识地选择部分有代表性单位进行调查
优点:调查范围小、省时力、具体深入
缺点:具有主观性; 直接数据获取的方法;;三大国际组织与中国国家统计局中国GDP数据对比表 (单位:10亿元) ;间接数据取得的途径;提供统计数据的部分政府网站;三、统计数据的误差 ;1.登记性误差(非抽样误差)
是指由于调查者或被调查者的人为因素所造成的误差。
调查者所造成的误差:
调查方案中有关的规定或解释不明确导致的填报错误;
调查员粗心,在记录调查结果时出现错误;
调查员的态度、情绪以及责任心等。
被调查者所造成的误差:
不理解调查方案中有关规定或解释不明确导致的填报错误;
因人为因素干扰形成的有意虚报或瞒报调查数据等。
注:登记性误差理论上讲是可以消除的。;2.代表性误差(抽样误差)
是指用样本数据进行推断时所产生的误差。所有
样本可能的结果与总体真值之间的平均性差异。依据随机原则抽取样本,样本不同,就会得到不同的观测结果。代表性误差通常无法消除,但事先可以进行控制和计算。
影响代表性误差大小的主要因素:
样本容量:样本容量越大,代表性误差就越小
总体的离散程度:总体中各个体间的差异越大,
抽样误差也就越大;第三节 数据整理和频数分布;;;;;;;;;第一,数据排序
第二,分组数目的确定
采用斯特吉斯经验公式,即k=1+3.322lgN
k为组数;N为总体中的个体数。;第三,组距的确定 组
显示全部