[第四章抽样.ppt
文本预览下载声明
第四章 抽样 第一节 抽样的概念与作用 抽样的概念 为了更好地理解抽样的概念我们将其与其他一些相关的概念同时进行介绍。(1)总体(Population)。总体通常与构成它的元素(Element )共同定义:总体是构成它的所有元素的集合,而元素则是构成总休的最基本单位。在社会调查中最常见的总体是由社会中的某些个人组成的,这些个人便是构成总体的元素。比如,当我们做一项有关某省大学生择业倾向的社会调查时,该省的每一个在校大学生便是构成总体的元素,而该省所有在校大学生的集合就是调查的总体。总体中所包含的元素数目常用大写字母N 表示。(2)样本(Sample)。样本就是从总体中按一定方式抽取出的一部分元素的稽核。比如,从某省总数为12.8万的大学生总体中,按一定凡是抽取出1000名大学生进行调查,这l000名大学生就构成该总体的一个样本。(当然,从一个总体中可以抽取出若干个不同的样本。)在社会调查中,资料的收集工作或者说调查的实施正是在样本中完成的。样本中的元素数目通常用小写字母n 表示。( 3 )抽样(Sampling)。明白了总体和样本的概念,再来理解抽样的概念就十分容易了。所谓抽样,指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程。比如,从3000名工人所构成的总体中按一定方式抽取200 名工人的过程,或者从l000户家庭构成的总体中按一定方式抽收一个由100 户家庭构成的样本的过程,都是抽样。( 4 )抽样单位(Sampling Unit)。抽样单位就是一次直接的抽样所使用的基本单位。抽样单位与构成总体的元素有时是相同的,有时又是不同的。比如,上面所举的例子中,单个的大学生既是构成某省12.8 万名大学生这一总体的元素,又是我们从总体中一次直接抽取出1000名大学生的样本时所用的抽样单位。但是,当我们从这一总体中一次直接抽取出40 个班级,而以这40 个班级中的全部学生(假定正好l 。000名)作为我们的调查样本时,抽样单位(班级)与构成总体的元素(学生)就不是一样的了。( 5 )抽样框(Sampling Frame)。抽样框又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。比如,从一所中学的全体学生中直接抽取200名学生作为调查的样本,那么,这所中学全体学生的名单就是这次抽样的抽样框;如果是从这所中学的所有班级中抽取部分班级的全体学生作为调查的样本,那么,此时的抽样框就不再是全校学生的名单,而是全校所有班级的名单了。因为此时的抽样单位已不再是单个的学生,而是单个的班级了。 ( 6 )参数值(Parameter )。参数值也称为总体值,它是关于总体中某一变量的综合描述或者说是总体中所有元素的某种特征的综合数量表现。在统计中,最常见的参数值是总体某一变量的平均数,比如,某市待业青年的平均年龄、某厂l000 人的平均收人等等,它们分别是关于某市待业青年这一总体在年龄这一变量的综合描述,以及某厂工人这一总体在收人这一变量上的综合描述。需要说明的是,参数值只有对总体中的每一个元素都进行调查或测量才能得到。 ( 7 )统计值(Slatistic )。统计值也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量的表现。统计值是从样本中计算出来的,它是相应的参数值的估计量。比如,样本平均数是通过调查样本中的每一个元素后计算出来的,它是总体平均数的估计估计量 ,二者是一一对应的。按照习惯,参数值通常以希腊字母表示,而统计值通常以罗马字母表示,如总体平均数用μ表示,而样本平均数X用表示;又如总体标准差用σ表示,而样本标准差则用S表示。参数值和统计值之间有一个重要的区别;参数值是确定不变的、唯一的,并且通常是未知的;而统计值则是变化的,即对于同一个总体来说,不同样本所得的统计值是有差别的;同时,对于任一特定的样本来说,统计值是已知的,或者说是可以通过计算得到的。从样本的统计值来推论总体的参数值,正是社会调查的一项重要内容。( 8 )置信度〔Confidence Level〕置信度又称为置信水平,它指的是总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间中的把握性程度。它反映的是抽样的可靠性程度。比如,置信度为95 % , 指的是总体参数值落在样本统计值某一区间的概率为95 % ,或者说,我们有95 %的把握认为样本统计值将落在总体参数值周围的某一区间内。 ( 9 )置信区间(Confidence Interval)上面介绍置信度时所说的“某一区间”,就是置信区间。它是指在一定的置信度下,样本统计值与总体参数值之间的误差范围。置信区间反映的是抽样的精确
显示全部