文档详情

第3章-常用概率分布.ppt

发布:2019-02-16约1.59万字共127页下载文档
文本预览下载声明
显然,样本平均数也是一个随机变量,其概率分布叫做样本平均数的抽样分布。由样本平均数构成的总体称为样本平均数的抽样总体。 其平均数和标准差分别记为 和 。 是样本平均数抽样总体的标准差,简称标准误,它表示平均数抽样误差的大小。 统计学上已证明总体的两个参数与x 总体的两个参数有如下关系: 设有一个包含4个个体的有限总体(N=4) ,变数为2、3、3、4。 根据μ=Σx/N和σ2=Σ(x-μ)2/N求得该总体的μ、σ2、σ为: μ=3, σ2=1/2, σ= =0.707 从有限总体作返置随机抽样,所有可能的样本数为 Nn,其中n为样本含量 。 以上述总体而论,如果从中抽取n=2的样本, 共 可得 42=16 个样本;如果样本含量n为4 ,则 一 共 可抽 得44=256个样本。 分别求这些样本的平均数 ,其次数分布如表3-2 所示。 在n=2的试验中,样本平均数抽样总体的平均数、 方差与标准差分别为: =4/16=1/4=(1/2)/2= 表3—2 N=4, n=2和n=4时的次数分布 n=4时: 这就验证了 =μ, 的正确性。 若将表3—2中两个样本平均数的抽样总体 作次数分布图,则如图3-12所示。 由以上模拟抽样试验可以看出 ,虽然原总体并非正态分布,但从中随机抽取样本, 即使样本含量很小(n=2, n=4),样本平均数的分布却趋向于正态分布形式。随着样本含量 n 的增大, 样本平均数的分布愈来愈从不连续趋向于连续的正态分布。比较图3—12两个分布,在n由2增到4时,这种趋势表现得相当明显。 当n>30时, 的分布就近似正态分布了。 x 变量与 变量概率分布间的关系可由下 列两个定理说明: 2、若随机变量x服从平均数是μ,方差是σ2的分布(不是正态分布);则 统 计 量 的概率分布,当n相当大时逼近正态分布N(μ,σ2/n)。这就是中心极限定理。 1、 若 , 则 中心极限定理告诉我们:不论x变量是连续型还是离散型,也无论x服从何种分布,一般只要 n>30 ,就可认为 的分布是正态的。 若x的分布不很偏倚,在n>20时 , 的分布就近似于正态分布了。 的大小与原总体的标准差σ成正比,与样本含量n的平方根成反比 。 从某特定总体抽样 ,因为σ是一常数,所以只有增大样本含量才能降低样本平均数 的抽样误差。 二、标 准 误 标准误(平均数抽样总体的标准差) 的大小反映样本平均数 的抽样误差的大小,即精确性的高低 。 在实际工作中,总体标准差σ往往是未知的,因而无法求得 。此时,可用样本标准差S估计σ。于是,以 估计 。记 为 ,称作样本标准误或均数标准误。样本标准误 是平均数抽样误差的估计值。若样本中各观测值为 , ,…, ,则 样本标准误是样本平均数 的标准差,它是抽样误差的估计值, 其大小说明了样本间变异程度的大小及精确性的高低。 样 本 标 准 差 S 是 反 映 样 本中各 观测值 , ,…, 变 异 程 度大小的一个指标,它的大小说明了 对 该 样本代表性的强弱。 注意,样本标准差与样本标准误是既有联系又有区别的两个统计量,(3—24) 式已表明了二者的联系。二者的区别在于: 对于小样本资料,常将样本标准误 与样本平均数 配合使用,记为 ± , 用 以表示所考察性状或指标的优良性与抽样误差的大小。 对于大样本资料,常将样本标准差S与样本平均数 配合使用,记为 ±S,用以说明所考察性状或指标的优良性与稳定性。 第六节 t 分布、 分布与F分布 当总体标准差σ未知时, 以样本标准差S代替σ所得到的统计量 记为t。即 一、 t 分 布 若x~N(μ, σ2), 则 。 将随机变量 标准化
显示全部
相似文档