文档详情

统计学-第四章-抽样估计.ppt

发布:2025-05-30约5.45千字共113页下载文档
文本预览下载声明

第一节抽样分布

第二节抽样误差

第三节参数估计方法

第四节各种抽样组织形式的参数估计

;第一节抽样分布;医生抽取病人少量的血化验

工厂质检员抽样检测灯泡寿命

超市设免费品尝产品

抿一口茶,试凉热

买书,随便翻几页看印刷质量

;大学生每周上网花多少时间?;大学生每周上网花多少时间?;

抽样估计是以样本观测结果去估计未知的总体数量特征。

如何根据概率抽样的样本去估计总体的理论与方法,因此首先要明确总体分布、样本分布与抽样分布三者的关系。

;

〔一〕总体分布及其特征

总体分布就是总体中所有个体关于某个变量〔标志〕的取值所形成的分布。

同一变量不同的总体或同一总体不同的变量,其分布是不同的。

变量分布的形态很多,例如J型分布、U型分布和钟型分布等,不同的分布会有不同的特征,认识总体分布特征是统计研究的任务之一。;总体参数的值应由总体全部单位的标志值计算而来:

对于特定的总体,总体参数值是唯一的。

对于无限总体和非全面调查的有限总体,总体参数的值通常未知,只能通过样本来估计。;⒈总体均值〔总体平均数〕:;2、总体方差:;3、总体标准差:;4、总体成数〔总体比例〕;标志值x;5、总体是非标志的均值;如前是非标志的平均数为P;6、总体是非标志的方差;〔二〕样本分布及其特征

样本分布就是样本中所有个体关于某个变量〔标志〕的取值所形成的分布。

同一变量不同的样本或同一样本不同的变量,其分布是不同的。

由于样本来自于总体,包含了一局部关于总体的信息,所以样本分布是一种经验分布。当样本容量很大,或者是当逐渐增大时,样本分布会接近总体分布。如果样本容量很小,那么样本分布就有可能与总体分布相差很大,抽样估计的结果就会很差。

;反映样本分特征的指标叫样本统计量,通常用T来表示。

样本统计量是随机变量,它的取值随样本的不同而发生变化。

样本统计值:是样本统计量的值,由样本单位

的标志值计算而来,用来估计总体参数。

;与总体参数相对应,???用的样本统计量有

样本均值〔或样本成数〕

样本方差〔或样本标准差〕;⒈样本均值:;2.样本方差:;3.样本标准差:;4.样本成数〔样本比例〕:;反映样本分布特征的样本统计量的值〔即样本统计值〕是可知的。但是由于抽样的随机性,样本统计值不是惟一确定的,因此样本统计量是随机变量,其值随样本不同而不同。

抽样估计,就是要以可知但非惟一的样本统计值去估计惟一却未知的总体参数的值。

;

〔三〕抽样分布及其特征

1.抽样分布的概念及影响因素

一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率所组成。如果说样本分布是关于样本观测值的分布,那么抽样分布那么是关于样本统计值的分布,而样本统计值是由样本观测值计算而来的。

;实际的抽样分布形成取决于以下五个因素:;抽样方法;简单随机抽样;随机数表:事先按随机原那么抽取的数字,写成的表。《随机数字表》是根据摇码器或计算机模拟产生的。其中不仅0-9出现的概率相等,而且由这10个数码组成的两位数、三位——等出现的概率也是相等的。

应用随机数表,可以从任一行、任一数字、任一方向开始,位数也可任意组合,甚至还可以略去其中一行或一列不用。关键在于要先建立一个原那么,然后从头到尾都依这个原那么去做。;

—当N很大时,不易构造抽样框,有时得不到完整的抽样框。

抽出的单位很分散,给实施调查增加了困难。

没有利用其他辅助信息以提高估计的效率,该方法可能不是最精确的。;分层抽样就是先将总体按一种或几种特征(性别\班级\教育\地理位置等)分为几个同质性的总体〔类、群〕,每一个子总体称为一层,然后从每一层中随机抽取一个子样本,将它们合在一起,即为总体的样本,称为分层样本。;例如,某地居民中成年人有6000人,其中老年人有800人,中年人有2000人,青年人有3200人,现从中调查300人,问如何确定各层调查人数?

抽样比例:p=300/6000=5%

老年层抽取样本数为:800*5%=40(人)

中年层抽取样本数为:2000*5%=100(人)

青年层抽取样本数为:3200*5%=160(人);

当总体中某一层人数过少,但又具有较高的研究价值,这时可增大这一层的抽样比例。如对老年人的研究。但这样做的结果,统计分析时要做适当的修正。

另外,实践中分层抽样还有其他如分层最正确抽样、最低本钱抽样等方法。;分层抽样的随机性表达在按总体分组比例每

显示全部
相似文档