概率论和数理统计课件21.ppt
文本预览下载声明
函数与极限 * 前面,我们讨论了参数的点估计. 它是用样本算的一个值去估计未知参数. 但是,点估计仅仅给出了未知参数的一个近似值,它没有反映出这种估计的精度.区间估计正好弥补了点估计的这个不足之处. 可信度:越大越好 估计你的年龄 八成在21-28岁之间 被估参数 可信度 范围、区间 区间:越小越好 引例 在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数N的最大似然估计为1000条. 实际上,N的真值可能大于1000条, 也可能小于1000条. 为此,我们希望确定一个区间 来估计参数真值 a 使我们能以比较高的可靠程度相信它包含真参数值. 湖中鱼数的真值 [ ] 这里所说的“可靠程度”是用概率来度量的 b 区间估计的精度要高. §7.4 正态总体的区间估计 设X1 ,X2,…,Xn为来自总体X?F(x;?)的一个样本,? ? ?是未知参数. 若对于给定的 ?(0 ? 1),存在两个统计量 使得对任意的? ? ? 满足 一 置信区间的定义 则称随机区间 为参数? 的置信水平(confidence level)为1-? 的置信区间(confidence interval). 置信水平又称为置信度,置信区间的左端点 又称为置信下界,置信区间的右端点 又称为置信上界. 1. 要求 以很大的可能被包含在区间 内,就是说,概率 要尽可能大. 2. 估计的精度要尽可能的高. 如要求区间 长度 尽可能短,或能体现该要求 的其它准则. 即要求估计尽量可靠. 可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下 尽可能提高精度. (1)从未知参数? 的某个点估计 出发,构造 与? 的一个函数W( ,? ) , 使得 W的分布已知,且不依赖于未知参数? 该函数通常称为枢轴量. 二 构造置信区间的方法 1. 枢轴量法 (3) 利用不等式运算,将不等式 (2) 适当选取两个常数a, b,使对给定的?,有 等价变形为 即 此时参数? 的置信水平为1-? 的置信区间为 2. 如何确定a , b 我们总是希望置信区间尽可能短. 任意两个数a和b,只要它们的纵标包含f(u)下95%的面积,就确定一个95%的置信区间. 在 概率密度为单峰且对称的情形,当a =-b时求得的置信区间的长度为最短. a =-b 即使 的概率密度不对称的情形,如 分布,F分布,习惯上仍取对称的百分位点来计算未知参数的置信区间. 三 正态总体均值与方差的区间估计 ~N(0, 1) 选 的点估计为 求参数 的置信水平为 的置信区间. 例1 设X1,…,Xn是取自 的样本, 解: 寻找一个待估参数和 估计量的函数 ,要求 其分布为已知. 有了分布,就可以求出 Z取值于任意区间的概率. 对给定的置信水平 对于给定的置信水平, 根据Z的分布, 确定一个区间, 使得Z取值于该区间的 概率为置信水平. 使 对给定的置信水平 使 从中解得 的一个置信水平为 的置信区间 置信区间的长度为 说明: (2)置信区间的中心是样本均值 (3)置信水平 越大, 越大,因此置信区间越长 (4)样本容量n越大,置信区间越短 置信区间的长度为 (1)L越小,置信区间提供的信息越精确 因方差未知,则 不是统计量. 想法:用样本均方差 S 代替σ. 于是取 对给定的置信水平 ,确定分位数 使 即 均值 的置信水平为 的置信区间. 即为 从中解得 例2 有一大批糖果.现从中随机的取16袋,称得重量(以克记)如下: 设每袋糖果的重量近似服从正态分布,试求总体均值 的置信水平为0.95的置信区间 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 解:这是单总体方差未知,总体均值 的区间估计问题. 根据给出的数据,算得 这里 均值 的置信水平为 的置信区间为 均值 的置信水平为0.95 的置信区间为 取枢轴量 从中解得 (2)方差 的置信水平为 的置信区间. 对给定的置信水平 ,确定分位数 使 方差 的置信水平为 的置信区间为 标准差 的置信水平为
显示全部