第七章抽样推断.pptx
第七章
————抽样推断;本章教学目的与要求;本章教学内容;本章教学的重点;本章教学难点;关键词:;质——量——质;第一节抽样推断的一般问题;抽样推断的理论基础——大数定律、中心极限定理;总体分布;11;总体N;第二节
抽样推断中的几个基本概念;总体和样本;参数和统计量;2、统计量——根据样本值计算的综合指标,是反映样本数量特征的指标;17;样本容量和样本个数;第三节
抽样误差;一、抽样误差;二、影响抽样误差大小的主要因素;抽样平均误差——抽样平均数(成数)的标准差,反映了抽样误差的一般水平
1)——是抽样平均数(成数)与其均值之间的平均差异程度
2)——反映了抽样平均数(成数)与总体平均数(总体成数)之间的平均离散程度;23;当总体成数未知时,则用样本成数替代。;四、抽样极限误差(也称允许误差范围)
——是按要求确定的误差的可能范围,是个误差区间。;五、概率度t;t=1:F(t)=68.27%;t=1.64:F(t)=90%;
t=1.96:F(t)=95%;t=2:F(t)=95.45%;
t=3时,F(t)=99.73%;六、抽样估计的精度;第四节抽样估计的方法;即用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为100(1-?)%;即:用同样方法构造的总体参数的多个区间中,有100(1-?)%的区间比例包含了总体平均数;二、抽样估计的特点:;2)一致性——根据大数定律,当样本容量n充分大时,则样本值无限接近总体值;3)有效性——用样本指标估计总体时,要求作为优良估计量的方差应比其他估计量(非优良估计量)的方差小;四、两种具体的抽样估计方法;耐用时数(小时);解:1)根据抽样资料计算样本平均数和标准差,由此可得到抽样平均误差;3)根据给定的允许误差范围和平均误差,确定总体参数置信区间的上下限:;例2:仍利用例1的资料:设该厂的产品质量检验标准规定,元件耐用时数达1000小时与上为合格品,要求合格率估计的误差范围不超过5%。试估计该批电子元件的合格率;说明:有概率92.16%的保证程度认为该批电子元件的合格率在86%~96%之间;给出概率或概率度,求解抽样极限误差和置信区间;说明:
有95%的概率保证程度认为该市居民家庭年均耐用消费品支出在19516~20784元之间。;练习1:为了了解某市电信营业厅大客户对该电信的服务的满意状况,调查人员随机访问了30名去该电信营业厅办理业务的大客户,发现受访的大客户中有9人认为营业厅的服务质量比两年前好。试在95%(t=1.96)的置信水平下对大客户中认为营业厅现在的服务质量比两年前好的比率进行区间估计。(N未知,按重复抽样计算);解:;练习2:A企业生产一种新型灯泡5000只,随机抽取100只作耐用时间测试。测试结果:平均寿命为4500小时,标准差为300小时。
1)试在90%概率保证下估计该新型灯泡平均寿命区间(不重复抽样);;以90%的把握程度认为该新式灯泡的平均寿命落在4451.3~4548.7小时之间。;即需抽取约522只新式灯泡进行测试才能满足现有的要求;练习3:
1)样本粮食平均亩产=750公斤,又知抽样平均误差=15公斤,求总体粮食亩产在725~775公斤之间的估计置信度是多少?;置信区间:
750±30?(720~780)公斤;第五节抽样方案设计;一、简单随机抽样(或纯随机抽样);注:一个总体如果同时需要满足抽样平均数和抽样成数对样本单位数的要求时,则按“多”的单位数进行抽样。;例:对生产的某型号电池进行电流强度检验。以往电流强度的标准差=0.4安培,而合格率为90%。现用重复抽样的方式,要求在95.45%的概率保证下抽样平均电流强度的极限误差不超过0.08安培,抽样合格率的极限误差不超过5%,问必要的抽样单位数应为多少?;二、类型抽样(分层抽样);2)按比例(n/N)抽取样本单位数:n1+n2+…nk=n;4)类型抽样的平均误差——只取决于组内方差,与组间方差无关;例:某高校2年级共1000名学生,现按分层抽样抽取100名学生,目的是了解全校2年级学生英语学习成绩水平。抽取的结果如下(每组按10%的比例抽取单位数):;要求:用95.45%的概率估计全校2年级学生的英语平均成绩;其余组一样可计算出各自的组平均数和组内方差(具体值见前表)。由此可得:;即:有95.45%的把握认为该校2年级学生的英语平均成绩在72.71~73.95分之间;明确类型抽样的两个重要结论:
1)类型抽样的平均误差一般小于简单随机抽样误差;练习:某地区有1000家商店,按大中小分为三层,其商店数量分别是:N1=200