02-3平均数抽样分布﹝正式﹞.ppt
文本预览下载声明
第二章 概率与理论分布;研究总体与从中抽取的样本之间的关系是统计学的中心内容 。对这种关系的研究可从两方面着手:
(1)抽样分布:从总体到样本 ,这就是研究抽样分布(sampling distribution)的问题,统计量的概率分布称为抽样分布;
(2)统计推断: 从样本到总体,这就是统计推断(statistical inference)问题。; 统计推断是以总体分布和样本抽样分布的理论关系为基础的。为了能正确地利用样本去推断总体,并能正确地理解统计推断的结论,须对样本的抽样分布有所了解。
我们知道,由总体中随机地抽取若干个体组成样本,即使每次抽取的样本含量相等,其统计量(如,S)也将随样本的不同而有所不同,因而样本统计量也是随机变量, 也有其概率分布。我们把统计量的概率分布称为抽样分布。 ; 由总体随机抽样(random sampling)的方法可分为有复置抽样和不复置抽样两种。
复置抽样:指每次抽出一个个体后,这个个体应返回原总体;
不复置抽样:指每次抽出的个体不返回原总体。
对于无限总体,返回与否都可保证各个体被抽到的机会相等。
对于有限总体,就应该采取复置抽样,否则各个体被抽到的机会就不相等。 ; 一、抽样的目的go
二、样本平均数及其分布go
三、样本平均数差数及其分布go
四、t分布go
;导言;导言;二、样本平均数及其分布:;标 准 误
标 准 误(平均数抽样总体的标准差) 的大小反映样本平均数 的抽样误差的大小,即精确性的高低 。 标准误大,说明各样本平均数 间差异程度大,样本平均数的精确性低。反之, 小,说明各样本平均数 间的差异程度小 , 样本平均数的精确性高。 的大小与原总体的标准差σ成正比,与样本含量n的平方根成反比。从某特定总体抽样 ,因为σ是一常数 ,所以只有增大样本含量才能降低样本平均数 的抽样误差。 ; 注意,样本标准差与样本标准误是既有联系又有区别的两个统计量。二者的区别在于:
样 本 标 准 差 S 是 反 映 样 本中各 观测值 x1 ,x2 ,…xn,变 异 程 度大小的一个指标,它的大小说明了 对 该 样本代表性的强弱。
样本标准误是样本平均数 , ,……
的标准差,它是抽样误差的估计值, 其大小说明了样本间变异程度的大小及精确性的高低。; 对于大样本资料,常将样本标准差S与样本平均数 配合使用,记为 ±S,用以说明所考察性状或指标的优良性与稳定性。
对于小样本资料,常将样本标准误 与样本平均数 配合使用,记为 ± , 用 以表示 所考察性状或指标的优良性与 抽样误差的大小。 ;3、若原分布为正态分布,平均数分布亦为正态分布。
若原分布是非正态分布,当n增大时,平均数分布亦趋向正态分布。
所以n30时,可以认为新分布符合正态分布。;例3-4,某品种葡萄总体,果穗长μ=30cm,σ=10.8cm, 随机抽50个果穗,所得样本平均数与μ相差不超过3cm的概率是多少?
解:已知U=
查附表3得
P (≤yU +0.28σ,以及y ≤U -0.28σ) =0.78
P (U -0.28σ≤y< U +0.28σ) =1-0.78=0.22=22%
以上做法对不对
不对!
分析:已知μ、σ,求 | -μ|≦3cm的概率,求样本平均数的信息,算U值须用 ,上面的解答错用 。;;;例3-5 某枇杷单果重μ=30g, σ=9.6g, 今从中抽取50个
分析:已知总体分布μ=30,σ=9.6, 问
解:
;;例:在江苏沛县调查336个平方米小地老虎虫危害情况的结果, μ=4.37头, σ=2.63,试问样本容量n=30时,由于随机抽样得到样本平均数 等于或小于4.37的概率为多少?
查附表2,(u≤-0.75)=0.2266,即概率为22.66%(属于一尾概率)。因所得概率较大,说明差数-0.36是随机误差,从而证明这样本平均数4.37是有代表性的。相对精确度估计为:
;;平均数有没有变异系数?
反映样本平均数的离散(变异)情况。
每一个
都代表总体平均数μ,
可是它们之间存在差异。
为什么
因为存在抽样误差。;
所以也是抽样误差的反映,即精确度。
因而, 又称为精确度。
越大,
显示全部