管理定量分析第4章 区间估计.ppt
文本预览下载声明
标准误与标准差的比较: 标准误与标准差是常用的两种统计指标,两者均为变异指标,标准差表示个体变量值之间的离散程度。 标准误是表示样本均数间离散程度的指标,标准误小则抽样误差小,说明样本均数与总体均数接近。标准差可结合均数估计正常参考值范围;标准误结合均数估计总体均数的可信区间。 置信区间:是指由样本统计量所推算的总体参数所在区间。 4.2总体均值的区间估计 区间估计是根据样本统计量来估计总体未知参数所在的可能区间的方法。由于这种估计的区间能以一定的置信度来保证估计的准确性,因此,也称该区间为置信区间。 根据统计学理论,为了估计总体均值而进行的多次抽样样本均值符合一种概率分布: t分布,或称学生分布。 t分布的形状与正态分布相似,但是比正态分布平坦。与正态分布不同的是, t分布因样本容量不同而不同。 自由度与样本容量相当,并用来确定对应的 t值。对于样本均值,自由度就是n-1。 总体X ~ N (m,s 2),求均值m 的置信区间 置信区间的求解 1)取统计量T 用样本 X1, X2,…, Xn的标准差 S 替代总体标准差s 后,得统计量 2) 确定两个常数a 与 b,保证 P{a T b }= 1– a 对给定的置信度 1– a , 按上a 分位数定义, 取ta / 2(n -1)使 ta / 2(n -1) - ta / 2(n -1) 主讲人:刘兰剑 3)解出的置信区间 主讲人:刘兰剑 可得所求的置信度为 1– a 的置信区间为: 主讲人:刘兰剑 案例一: 某高级中学的教学质量受到了社会的广泛指责,原因是该校绝大多数高中毕业生的阅读能力达不到9级水平。 为了提高学生的阅读能力,该校专门开设了一门特殊的阅读课程来加强这方面的训练。校长想知道,这一新开设的阅读课程对于提高学生的阅读能力究竟是否有作用。如果有作用的话,他将邀请教育评价机构对学校来进行评估,以挽回学校的声誉。如果开设这一课程后学生的阅读能力达不到10.0(高中二年级水平),校长将不邀请评价机构前来。 如何通过抽样的办法了解学生总体的阅读水平? 为确定高三学生的平均阅读水平,随机选取10名高三年级学生。假定学生的阅读成绩呈正态分布。这10名高三年级学生的阅读成绩列入表4-2。 代入下式,请试算一下 可得:在0.05的显著性水平上,学生的平均阅读水平在10.55-0.99528及10+0.99528之间,即在区间:(9.55472,10.99528)上, 无法判断学生的平均阅读水平是否超过10分。 校长想使结论更可靠些,有没有办法? 根据公式分析: 如果均值的标准误能够减小,就能够获得更大的可靠性。 让我们把样本容量增大到100。抽取的容量为100的样本,其均值也是10.6,标准差也是1.4。请计算新的标准误(差) 。(0.14) 由于自由度是99,可以使用正态曲线来近似t分布。 10.55±0.14×1.96=10.55±0.2744=10.2756-10.8244 根据以上计算结果,我们能得出什么结论? 区间估计的基本要求: 置信度:区间估计时,希望区间包含总体参数的概率越大越好; 精确度:区间估计时,希望区间的平均长度越短越好。 案例二: 对某地家庭收入进行抽样检查,随机抽取100个家庭,其样本平均值为11900元,据现有资料,总体家庭收入的标准差是1500元。求置信度为99%的家庭收入均值的置信区间。 4.3总体比例的区间估计 例题三: 某部门在进行一项关于职工流动原因的研究,研究人员从该部门的离职职工中随机抽取了25人组成一个样本。在对其进行访问时,有13人说他们离开该部门是由于同上级领导不能融洽相处。 试对由于这种原因而离开该部门的人员的真实比例构造95%的置信区间。 可得,在0.05的显著性水平上,真正由于该原因离开该部门的人员的比例区间是(0.314,0.726)。 4.4样本容量的确定 民政局想知道特困家庭的年平均纯收入水平,要求在把握性是95%的情况下,使平均收入的估计值与实际值的差距在100元以内,抽取的样本容量应该是多大? 一个样本数据 家庭 年纯收入 1 3500 2 3200 3 3000 4 2820 5 2300 6 1850 7 3300 8 3150 9 1750 10 1950 样本容量可由如下公式确定 本章到此结束! 谢谢各位! 第4章 区间估计 样本就是总体的一个子集,所有样本都是从总体中随机抽取的。所谓随机抽样是指总体中的每一个成员都有相同的被抽中的机会。如果一个样本不是随机抽取的,那么这里所介绍的统计学法则不一定适用。 统计量是用来概括样本特征的测度值。样本的均值、标
显示全部