文档详情

第七章总体数估计2.ppt

发布:2018-12-30约5.3千字共43页下载文档
文本预览下载声明
第七章 总体参数估计 Population Parameter Estimation 第一节 总体均值与方差的点估计 (Point estimation of the population mean and variance) 一、点估计和区间估计 (point estimation and interval estimation) ? 1.点估计 点估计:当总体参数不清楚时,用一个特定值(一般用样本统计量)对其进行估计,称为点估计。 2.区间估计 区间估计:是指用数轴上的一段距离表示未知参数可能落入的范围。 概括地说: 经常需要对总体进行估计的两个数字特征是:总体的均值和方差。如果将总体的均值和方差视为数轴上的两个点,这种估计称为点估计。如果要求估计总体的均值或方差将落在某一段数值区间,这种估计称为区间估计。 二、用样本平均数、方差和标准差估计总体平均数、方差和标准差 ? ? 1. 用样本平均数估计总体平均数 样本平均数是总体均值的良好估计。。 公式: 2. 用样本方差估计总体方差 ? 同理,用样本标准差估计总体标准差 3. 一个好的样本统计量估计总体参数的要求 无偏性 是指如果用多个样本的统计量作为总体参数的估计值时,有的偏大,有的偏小,而偏差的平均数为0,这时,这个统计量就是无偏估计量。 一致性 是指当样本容量无限增大时,估计值应能越来越接近它所估计的总体参数。 即: 当N??时, X??, S2n-1??2。 有效性 是指当总体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。 充分性 是指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息,这就是充分性。 4.举例 (1)一项关于赞同提高汽油税的调查 用计算机随机从一个投赞同票的人数为60%的总体中抽出10个样本,每个样本容量为500个观测值,算出每个样本中赞同提高汽油税的人的百分比,其结果如下: 58.0 57.8 61.0 59.4 55.8 63.2 59.0 60.6 57.4 58.6 (2)二战中德国人制造了多少辆坦克? 问题: 在第二次世界大战进行过程中,盟军缴获了一些德军的坦克,并记录了他们的生产编号。怎样用这些号码来估计德军坦克的总数呢? 解决问题的思路: 设定总体参数和样本统计量 在这个问题中,总体参数是未知的生产出的坦克总数N,而样本则是缴获的坦克编号。 对坦克总数的估计 首先我们能够肯定:制造出来的坦克总数肯定大于等于记录中的最大编号。 解决方法: 2种点估计方法: (1)求出被缴获的坦克编号的平均值,并把它作为全部编号的中点。然后将样本均值乘以2就是总数的一个估计值。 估计坦克总数N的公式: N=全部编号的均值×2 前提条件:是先要假设缴获的坦克代表了所有坦克的一个随机样本 缺点:不能保证均值的2倍一定大于记录中的最大编号,故常常低估真值。 (2) 估计N的另一个点估计公式 用观测到的最大编号乘以因子1+1/n,其中n是被缴获的坦克个数。 公式: N=(1+1/n)×最大编号 此种方法的前提是我们认为实际数略大于最大编号。 例如,缴获了10辆坦克,其中最大编号是50,那么坦克总数的估计值是: N=(1+1/n)×50=55 第二节 总体平均值的区间估计 (Interval estimation of the population mean) 一、基本概念 总体均值的区间估计,置信度,置信区间: 日常用语表达: 就是估计总体均值可能在什么范围之内。 精确的数学语言表达: 总体均值的区间估计就是确定总体均值将以特定概率落入其间的数值界限。 这个特定概率称为置信度(或称显著性水平),用?表示,这个数值界限称为置信界限,置信界限上下限之间的区间,称为置信区间。 二、总体方差?2已知,对总体平均数的估计 1.计算公式 如果一个随机变量Z服从标准正态分布(?=0,?2=1的正态分布), 那么 P{-1.96Z1.96}=0.95 P{-2.58Z2.58}=0.99 对总体参数?进行区间估计的方法: 如果一个随机变量X服从均值为?,标准差为?的正态分布,那么通过变量替换: 令 :
显示全部
相似文档