文档详情

chap3简单随机抽样.ppt

发布:2017-05-17约4.13千字共41页下载文档
文本预览下载声明
本章主要内容 3.1概述 3.2总体均值和总体总量的简单估计 3.3总体比例的简单估计 3.4样本量的确定 3.5放回简单随机抽样 3.1概述 简单随机抽样(单纯随机抽样) 概念:考虑一个包含N个单元的总体,从中随机的抽取n个作为样本,每个样本抽中的概率都相同。 分类: 放回简单随机抽样(重复抽样),每个样本抽中的概率: 不放回简单随机抽样(无重复抽样,每个样本抽中的概率: 实施方法 抽取方法1:一次抽n个签 抽取方法2:逐个抽取n个签 抽取方法3:实际运用中,常用抽取随机数 随机数产生方法: 随机数骰子:均匀材质的20面体, 每两个面标了数字0,1,2……9。m个不同颜色的骰子一次可产生m位随机数,或一个甩子掷m次产生。若m个数字均为0时,代表 10m 。 随机数表:由0~9的随机数字组成的表,排列顺序也是随机的。 【例1(P35)】 计算机产生 :伪随机数。对于抽取数额较大的样本时,一般均采用计算机操作,可以很快获得所需样本。 3.地位作用 地位:其他抽样方法的基础,效率、精度高。 局限性: 当N比较大的时候,抽样框难以编码。 抽得的样本常很分散,实际实施调查中会遇到很多困难。 3.2总体均值和总体总量的简单估计 回顾:(有限总体) 总体均值: 总体总量:     总体方差: 为大多数结论简便起见,定义总体方差: 样本均值: 样本方差: 简单估计法:用样本均值 估计总体均值 , 用 估计总体总量Y的方法 【例2】 考虑从一个N=6的总体中抽取n=3的样本,设这6个单元的值分别为 Y1=21,Y2=12,Y3=15,Y4=24,Y5=6,Y6=18,则总共可能有 个样本,每个样本所包含的单元号及其数值见表3.1 (P33) 总体均值:  总体方差: 秘密:样本均值的均值=总体均值     样本方差的均值=总体方差 这是偶然的吗? 先证明: 先引入N个随机变量: 第i 个单元的入样概率为 第i ,j个单元的同时入样的概率为 对无偏估计,其均方误差等于其方差,故 的直观意义 首先,对于大总体(N很大,f≈0), 取决于样本量,与抽样比无关。 其次, 与总体变异程度成正比。 再证明: 易得结论: 量 是 的无偏估计. 量 是 的无偏估计。 3.3总体比例的简单估计 如死亡率的调查 ;问卷调查中对某个问题回答"是"或"否"的比例 设特殊的总体 则总体中具有该特征的个体的总数 所需估计的比例 因此对P的估计即为对总体均值估计的特殊情形。 样本与总体类似处理 可设 则样本中具有该特征的个体的总数为 样本比例 方差用比例表示 总体方差 类似样本方差 简单估值法:用p去估计P,用Np去估计A 估计量p的均值和方差分别为 此方差的无偏估计为 类似易得A的估计量Np有下列性质: 方差V(Np)的无偏估计为 3.4区间估计 理论表明,抽样调查中常用的估计量在大样本时是渐近正态的。故n充分大(n30,)时,近似有 其他情况 总体总量Y的置信度为1-α的区间估计 总体比例P的置信度为1-α的区间估计 总体部分总量A的置信度为1-α的区间估计 【例3】(P46例 3.5) 为调查某城镇成年居民的服装消费水平,在全体N=5443个成年人中,用简单随机抽样抽得一个n=36的样本,对每个抽中的成年人调查上一年中购买成衣的件数xi与支出金额yi如表3.4。试估计该城镇成年居民成衣平均支出金额及其95%的置信区间。 【例4】(例 3.6) 3.5样本量的确定 一.考虑费用决定样本量 调查费用一般形式为:F=F0+F1n 式中F0为基本调查费;F1为平均调查一个样本单元所需的费用。若F受到限制,F0和F1给定,n就随之确定. 样本量要在费用与精度两者间权衡。 二.考虑精度决定样本量 1.按绝对精度d决定样本量 以估计总体均值为例,估计量的绝对精度d满足: 其他情况时按绝对精度d决定样本量 估计总体总量Y时 估计总体比例P时 估计总体部分总量A时 按估计量的相对精度r决定样本量 估计总体均值
显示全部
相似文档