第四讲 用样本推断总体.ppt
文本预览下载声明
用样本推断总体 问题一: 二战中的点估计—德军有多少辆坦克? 二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?我们可以通过本点估计的方法解决这个问题。 问题二 某人想知道自己所承包的池塘的鱼的总数N,第一次随机捞出50条,将这50条鱼作标记后又放回池塘,等它们完全融入其他鱼后又随机捕捞100条,发带有标记的鱼有2条,你能帮他估计出鱼塘里现鱼的数量N吗? 解:已作记号的鱼的样本比例为 那么总体(池塘里的所有鱼)中作记号的鱼的比例为 既有:50/N=0.02 故:N=50/0.02=2500 这是一个典型的用样本比例来估计总体比例从而再推断总体单位总量的实例。 问题三 政府部门想知道到底有多大比例的上海人同意上海大力发展轨道交通;由于不大可能询问所有的近两千万上海市民,人们只好进行抽样调查以得到样本,并用样本中同意发展轨道交通的比例来估计真实的比例。尽管会存在如下问题: ①从不同的样本得到的结论也不会完全一样。 ②真实的比例在这种抽样过程中永远也不知道;但是我们可以通过参数估计的方法得到这个比例的范围和落入这个范围的概率。可以知道估计出来的比例和真实的比例大致差多少。 问题四:每次民调中所需调查人数 为了调查对总统候选人的支持率,临近11月份大选前夕,希望得到更高的精确度即更小的极限误差,求每次调查中所需的样本容量(置信度95%)。 统计推断的过程 参数估计的方法 点估计 从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计 例如: 用样本均值作为总体未知均值的估计值就是一个点估计 2. 点估计没有给出估计值接近总体未知参数程度的信息 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等 被估计的总体参数 估计量 1. 用于估计总体某一参数的随机变量 如样本均值,样本比例、样本中位数等 例如: 样本均值就是总体均值?的一个估计量 如果样本均值 ?x = 3 ,则 3 就是 ? 的估计值 理论基础是抽样分布 区间估计 1. 根据一个样本的观察值给出总体参数的估计范围 给出总体参数落在这一区间的概率 例如: 总体均值落在50~70之间,置信度为 95% 置信区间估计(内容) 落在总体均值某一区间内的样本 置信水平 总体未知参数落在区间内的概率 表示为 (1 - ???? ??为显著性水平,是总体参数未在区间内的概率? 常用的显著性水平值有 99%, 95%, 90% 相应的 ??为0.01,0.05,0.10 置信区间与置信水平 总体均值的区间估计(正态总体) 总体均值的区间估计(非正态总体) 总体比例的置信区间 总体比例的置信区间实例 估计总体均值时样本容量的确定 根据均值区间估计公式可得样本容量n为 样本容量的确定实例 估计总体比例时样本容量的确定 根据比例区间估计公式可得样本容量n为 样本容量的确定实例 【例】一家市场调研公司想估计某地区有彩色电视机的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)。 利用Excel计算置信区间 Excel进行样本比例的区间估计 样本比例区间估计的计算结果 样本比例的区间估计 利用Excel计算必要样本数 例: 某县进行农村经济情况调查,已知农户平均年收入标准差为30元,要求把握程度(置信度)为95.45%,抽样极限误差为5元,计算应抽取的样本户数?如下图所示。 工作表 结果 区间估计总结 注: 区间估计必要样本容量n的确定 帮想节约调查费用的广告公司拿主意 某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例(收视率),要设计一个简单随机样本的抽样方案。该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。为了节约调查费用,在这种情况下应该抽取多少样本? 总统选举的民意调查(背景) 据美国竞选业专业杂志 Campaigning Reports统计历次美国总统竞选的花费: 2004年为6.93亿美元;2008年高达13亿美元。整个总统竞选过程中,候选人一般会花费10-15%的竞选经费在民意调查上。如何确定被调查的人数是首先要考虑的问题。 每次民调中所需调查人数 为了调查对总统候选人的支持率,临近11月份大选前夕,希望得到更高的精确度即更小的极限误差,求每次调查中所需的样本容量(置信度95%)。 学生每天上网的时间的区间 一、某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间(单位:小时)
显示全部