第六章 抽样推断(统计学原理-陈利昌).ppt
文本预览下载声明
第六章 抽样推断分析 第一节 抽样推断的基本概念 一、抽样推断的意义 (一)概念:它是按随机原则从全部研究对象中,抽取一部分单位(即样本)进行观察,并依据获得的数据对总体的数量特征作出估计和判断,以达到对总体的认识。 (二)抽样推断的特点 二、几个基本概念 (一)全及总体和样本总体 (二)总体指标和样本指标 (三)重复抽样和不重复抽样 第二节 抽样误差 本节主要介绍抽样平均误差和抽样极限误差的计算方法。 一、抽样误差的概念及影响因素 (一)概念:是指抽样估计值与被估计的未知的真实参数(即总体特征值)之差。 (二)影响因素(有四个方面) 1.总体各单位标志值 2.样本单位数(n) 3.抽样方法:重复抽样和不重复抽样 4.抽样组织形式 二、抽样平均误差 (一)含义:抽样平均误差是反映样本指标与总体指标的离差的一般水平的指标,通常用样本平均数的标准差来表示。 (二)计算:1.样本平均数的平均误差: 在重复抽样条件下:抽样平均误差与总体标准差成正比,与样本容量的平方根成反比,用公式表示为μx= σ/n1/2 不重复抽样下:μx= [(σ2/n)*(N-n/ N-1)]1/2 2.样本成数的平均误差 重复抽样:μp= σ/n1/2=[P(1-P)/n]1/2 不重复抽样:μx= [P(1-P)/n(N-n/ N-1)]1/2 例1:某企业生产一批出口商品20000件,现随机抽选100件作使用寿命试验,结果为:样本平均使用寿命3600小时,样本标准差150小时,求重复抽样和不重复抽样下的抽样平均误差。 例 2 有一袋种子,从中任意抽取500粒作发芽试验,结果:其中有40粒没发芽。试计算该袋种子发芽率的抽样平均误差。 三、抽样极限误差 含义:是指样本指标与总体指标之间误差的可能范围。 样本平均数与样本成数的抽样极限误差 第三节 参数估计 一、点估计(或定值估计):即直接用样本平均数、样本成数估计总体平均数和总体成数,而不考虑任何的抽样误差。 优点:估算简便、原理直观。不足之处:没有表明抽样误差,更没有指明估计的可靠程度。 例如:广州市对29寸纯平彩电销售价格进行调查,则可以以天河城该种型号的彩电价格来估计整个城市这一型号的彩电价格。 二、区间估计 区间估计:在作出估计的结论时,把给出总体指标X的置信区间和置信概率这一方式称为区间估计。 其中,置信区间:是指依据样本指标和抽样误差去推算总体指标时,只是确定了总体指标的估计范围,没有确定具体值,这个范围就称为置信区间。而总体指标在这个范围的可能性或可靠性就是置信概率。 三、抽样估计的概率度及可靠程度 抽样平均误差是所有可能样本值与总体指标值之间的平均离差,它表明抽样估计的准确度;而抽样极限误差是样本指标值与总体指标值的离差绝对值是表明抽样估计的准确程度的范围。这也就决定了两者存在一定的联系。通常,把抽样极限误差与抽样平均误差相比,从而使单一样本的抽样极限误差标准化,一般称为概率度或相对误差范围,即置信度。 四、区间估计的要点 1.依据样本指标和抽样误差去推算总体指标时,只是确定了总体指标的估计范围,并没有确定其具体值。这个范围表现为一个上限和一个下限,从而构成一个区间。 2.所得的估计区间表示的只是一个可能范围,而不是绝对的范围。总体指标在这个范围内的可能性为置信概率(F) 3.扩大抽样极限误差可以提高抽样推断的可靠程度,但准确程度会降低;反之,缩小抽样极限误差会降低抽样推断的可靠程度,但准确程度会提高。 例3 某港口年出口某种货物15万集装箱,抽样结果为:抽样平均值是每个集装箱重4800公斤,抽样平均误差为60公斤,试以95%的置信概率推算该港口年出口该种货物的每个集装箱平均重量和货物总重量的可能范围。 例题答案 解:由所给条件可知,N=15万箱,每箱平均重量X=4800公斤,u=60公斤,再由概率F=95%查书后附录二得概率度t=1.96 则抽样极限误差= tu=1.96*60=117.6(公斤),平均每个集装箱重量的置信区间为[4800-117.6,4800+117.6],即[4682.4,4917.6]公斤。总重量的置信区间为[4682.4*15万,4917.6*15万],即[70236,73644]万公斤。 五、样本容量的确定 一、估计总体平均数的样本容量的确定:1.在重复抽样条件下.2.在不重复抽样条件下 二、估计总体成数的样本容量的确定:1.在重复抽样条件下.2.在不重复抽样条件下(以上可详见教材P137) * *
显示全部