文档详情

抽样方法和样本量估计.ppt

发布:2017-06-05约5.43千字共25页下载文档
文本预览下载声明
抽样方法和样本量估计 报告人:常 捷 关于抽样的概念 研究对象(unit of analysis) 根据研究目的确定研究对象。 总体(population) 在明确研究对象的基础上,确定其同质范围。 调查对象(sampling element)被抽中的研究对象。 抽样单位(sampling unit) (如县、乡、村、医疗机构等等) 观察对象(observation unit) 如调查户主,户主填写户中各个家庭成员情况 抽样表(sampling frame)列出所有抽样单位的名册 抽样方法(sampling design) 抽样误差(sampling error)只是因为抽样个体差异产生的随机误差 抽样偏移(sampling bias)造成系统误差,样本层面的系统的偏差,对总体的代表性偏差 抽样方法可分为概率抽样法与非概率抽样法两类 概率抽样法(probability sampling ) 总体中每个个体被抽中的概率是已知且不为零的,可以计算抽样误差并在此基础上做统计推断。 主要包括:简单随机抽样;系统抽样;整群抽样;分层抽样 非概率抽样法(non-probability sampling) 不知道总体中每个个体被抽中的概率,选择样本的过程往往不是随机的。抽样误差无法计算,选择偏移无法控制。 主要包括:方便抽样;配额抽样;目的抽样;滚雪球抽样 单纯随机抽样 simple random sampling 单纯随机抽样就是在总体中以完全随机的方法抽取一部分观察单位组成样本。常见的办法是先对总体中全部观察单位编号,然后用抽签、随机数字表或计算机产生的随机数字的方法从中抽取一部分观察单位组成样本。但是当总体例数较多时,这种方法不太适用。 单纯随机抽样法是其他概率抽样法的基础。 Random Number Generator /statistics/random-number-generator.aspx 系统抽样 systematic sampling 系统抽样又称机械抽样或等距抽样,先将总体的观察单位按某一顺序分成n个部分,再从第一部分随机抽取k号观察单位,一次用相等间隔,从每一部分各抽取一个观察单位。 系统抽样常作为单纯随机抽样的替代。 整群抽样 cluster sampling 整群抽样是先将总体按照某种与主要研究指标无关的特征划分为K个群,每个群包含若干观察单位,然后再随机抽取k个群,由抽取的各个群的全部观察单位组成样本。 与前两种方法不同在于抽样单位不同,不是直接抽取个体,而是抽群。 单层整群抽样single-stage cluster sampling 多层整群抽样multi-stage cluster sampling 群的变异越小,群越多,抽样误差越小 样本量一定情况下,增加群、减少每群中样本数,能提高总样本的代表性 成本低 代表性差 分层抽样 stratified sampling 分层抽样是先按照对研究指标影响较大的某个特征将总体分成若干类别(即“层”),再从每一层内抽取观察单位,合起来组成样本。 优点1)相同样本量,抽样误差最小 优点2)不同的层中,根据实际情况可以选择不同的抽样方法 各层观察单位数的分配:等比例分配;最优分配 1) 2) ; 非概率抽样法(non-probability sampling) 虽然在对总体的代表性上很差,在此基础上做统计推断也不科学,但在很多情况下,也是适用的。 方便抽样 Convenience Sampling 方便获得的个体即选为样本,样本中每个个体的获得都是偶然性的。最终,样本不能够代表总体。不能在此基础上做统计推断。可以用于研究的初始阶段,目的可以是为了发现了解相关信息,发现值得研究的问题,为下一步提出假设准备信息。 配额抽样 Quota Sampling 配额抽样为保证样本的代表性,其样本中具有某种特征的比例几乎和母体中具有此种特征的比例相等。譬如某大学有10000名学生,我们要抽取1000名。将学生依年级分成如下四个子母体。 年级 学生数 在母体之百分比 样本人数 一 3200 32% 320 二 2600 26% 260 三 2200 22% 220 四 2000 20%
显示全部
相似文档