2019年电大《社会统计学》期末考试简答题与计算题复习资料必备必考重点.doc
文本预览下载声明
PAGE
PAGE 5
电大社会统计学复习材料小抄
简答题
1、统计数据的质量要求:
1、精度:最低的抽样误差或随机误差;
2、准确性:最小的非抽样误差或偏差;
3、关联性:满足用户决策、管理和研究的需要;
4、及时性:在最短的时间里取得并公布数据;
5、一 致 性:保持时间序列的可比性;
6、最低成本:以最经济的方式取得数据。
2、抽样误差及其影响因素:
1、由于抽样的随机性所带来的误差;
2、所有样本可能的结果与总体真值之间的平均性差异;
3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。
3、判断计量优劣的评判标准:
用样本的估计量直接作为总体参数的估计值,
无偏性:估计量抽样分布的数学期望等于被估计的总体参数 ;
有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;
一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。
4、假设检验的一般步骤:
(1)陈述原假设和备择假设;
(2)从所研究的总体中抽出一个随机样本;
(3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;
(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域;
(5)将统计量的值与临界值进行比较,作出决策;
(6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。
5、假设检验中的两类错误及其之间的关系
错误:
1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a,即显著性水平;
2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b。
a和b的关系就像翘翘板,a小b就大,a大b就小。因此,在样本容量n固定情况下,不能同时减少两类错误!一般采用增加样本容量的办法来解决。
关系:当显著性水平a减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是接受域增大了,因此纳伪的概率b要增大。反之亦然(P235)。也就是说如果要减小b,就增大显著性水平a。
6、置信区间与置信度的关系表达式:
称作置信区间。称作置信度,可信度,或置信水平。称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度下降了。(P201)
7、正态分布曲线的特征:
(1)一个高峰:曲线是单峰,有一个最高点。
(2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。
(3)一个渐近线。曲线无论向左或向右延伸,都愈来愈接近横轴,但不会和横轴相交,以横轴为渐近线。
4.正态分布一般用表示。(P139)
8、方差分析的基本假定:
(二)e的分布为正态分布
要求每一个Ai所对应yi的分布都呈正态。
总结起来,进行方差分析,要求总体中每一个自变量的取值对应的因变量yi满足正态分布
9、方差分析的基本原理和逻辑:
基本原理:变异的可加性。
根据这一原理,将数据的总变异分解为不同来源的变异(组间、组内),根据不同来源的变异在总变异中所占的比重对造成数据变异的原因作出解释。
10、非参数检验的优缺点:
优点:没有严格的前提假设,对总体分布无需加以限制,计算量也比较少。
缺点:在同等情况下,检验的效率较差。未能充分利用资料的全部信息,目前还不能处理交互作用。(整理人:燕梅 我会整理小组工作,其他科目有同学整理的请大家一起分享下哈这样大家备考都会更有效)。
其他知识点
随机现象:事先无法确定会出现那种结果的现象
总体:所研究的全部元素的集合,其中的每一个元素称为个体,分为有限总体和无限总体。
样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。
参数:研究者想要了解的总体的某种特征值。
统计量:根据样本数据计算出来的一个量。
变量:说明现象某种特征的概念。
分类变量:说明事物类别的一个名称。
顺序变量:说明事物有序类别的一个名称。
数值型变量:说明事物数字特征的一个名称。
离散变量:取有限个值; 连续变量:可以去无穷多个值。
普查:为特定目的专门组织的非经常性全面调查。
典型调查:从调查对象的全部单位中选择少数典型单位进行调查。
重点调查:从调查对象的全部单位中选择少数重点单位进行调查。
数据质量的要求
误差:测量值与真实值之间的差异。
随机误差:在同一条件下,对同一量值进行多次测量时,其数值和符号以不可预见的方式而变化的那部分误差。
系统误差:在一定的测量条件下,对同一被测物进行多次重复测量时,误差值的大小和符号保持不变,或者在条件变化时,按一定规律变化的误差。
抽样误差:由于抽样的随机性所带来的误差。
非抽样误差:除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异。
分类数
显示全部