新编统计学第五章.ppt
文本预览下载声明
第五章 抽样调查与抽样分布 学习内容 第一节 抽样调查概述 第二节 抽样调查的组织形式 第三节 抽样误差 第四节 抽样分布 学习目标 掌握抽样调查的基本概念,了解抽样调查的特点及应用范围; 理解和掌握抽样调查的相关概念; 理解和掌握常用的抽样调查组织方式; 掌握常用统计量和它们的抽样分布。 第一节 抽样调查的概述 是专门组织的一次性非全面调查 以样本指标的数值去推断和估计总体指标的数值 按随机原则从总体中抽取样本单位 抽样误差可以计算并可采取措施加以控制,从而使抽样调查具有一定的可靠性。 无法或 很难进行全面调查而又需要了解其全面情况时 对于一些以破坏或损伤使用价值为手段的检验调查方法 可用于生产过程的质量控制 进行假设检验 总体与样本 参数和统计量 样本容量和样本数目 抽样框 我们把研究对象的总体叫做全及总体,简称总体。 把按随机抽样方法从总体中抽出的部分单位所组成的集合体称为样本总体或抽样总体,简称样本。 统计量是根据样本总体中各单位的标志值或标志属性计算得来的综合指标。 常用的统计量: 样本平均数 样本方差 样本标准差 样本容量是指一个样本所包含的单位数,一般用n表示。通常样本量n≧30为大样本,n<30为小样本。 样本数目是按照一定的抽样方法和组织方式,从总体N中抽取n个单位构成样本,一共可以抽出的不同样本的数量,一般用M表示. 抽样框又称“抽样框架”、“抽样结构”,是包含全部抽样单位的名单框架。 抽样框主要有三种形式: 一是名单抽样框,即包含全部总体的名录一览表 ; 二是区域抽样框,即按地理位置将总体划分为各个抽样单位; 三是时间表抽样框,即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个小的时间单位,以此时间单位作为抽样单位 第二节 抽样调查的组织形式 可以提高样本的代表性 可以缩小总体变异程度对抽样误差的影响,只受组内方差影响,不受组间方差影响. 直接抽取的不是总体单位,而是群,总体群数用R表示,样本群数用r表示. 只有群间方差影响抽样误差 一般采用不重复抽样 第三节 抽样误差 抽样平均误差的计算 1、抽样平均数的抽样平均误差 前面已经举例说明了直接按照可能抽样平均数求标准差的方法计算,但该方法太繁。 可以证明: (1)在重复抽样下 抽样平均误差 例:从40、50、70、80中抽取3个组成样本,在重复抽样下,求抽样平均误差。 解:求总体标准差,直接用计算器统计功能键可以求出: (2)在不重复抽样下 抽样平均误差 例:从40、50、70、80中抽取3个组成样本,在不重复抽样下,求抽样平均误差。 解:求总体标准差,直接用计算器统计功能键可以求出: 2、抽样成数的抽样平均误差 总体标准差 例:要估计一批产品的合格率,从1000件产品中抽取200件,其中有10件不合格品,如果确定抽样极限误差的范围为2%,试估计产品合格率的范围。 样本合格率 p=190/200=95% 总体合格率下限=95%-2%=93% 总体合格率上限=95+2%=97% 即该产品合格率在93%~97%之间。 t——称为概率度。又称为置信度。 可信程度是表示估计的可靠程度 如果估计区间越大,则可靠程度越大; 估计区间越小,则可靠程度越小。 而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t决定的。 因而可靠程度与t之间有一定正比关系。 概率度t与概率保证程度(可靠程度)之间的关系例:若概率为0.95,查表得t=1.96 概率度t与概率保证程度(可靠程度)之间的关系。 第四节 抽样分布 概率与概率分布 概率:随机事件发生的可能性大小 概率分布:随机变量的取值与其概率构成的分布 均匀分布 如果连续型随机变量X取值范围在a、b之间,且变量值落在取值范围内任一个相同长度的区间的概率都相同,这个随机变量就会服从均匀分布 抽样分布 样本统计量的概率分布 thank you very much! 离散型随机变量的概率分布(函数) i=1,2,3… 掷骰子结果的概率分布 性质 掷骰子结果的概率分布 … 1/6 … 1/6 1/6 P(xi) … 6 … 2 1 X 掷骰子结果的概率分布 连续型随机变量的概率分布 概率密度函数 连续型随机变量的概率分布的性质 0 5 等车时间 [例]班车每5分钟准时发一辆,某人随机赶到车站,请问他刚好等车2分钟的概率是多少?等车时间在2-3分钟的概率是多少? 0 5 等车时间 概率密度 1/5 f(x) 正态分布 正态分布概率密度曲线 随机起点等距抽样 确定抽样距离(间隔) 随机
显示全部