抽样误差与及t检验 .ppt
文本预览下载声明
抽样误差及t检验 盛法林,华海峰 抽样误差的概念 抽样研究的过程中,样本统计量与总体参数间的差异称为抽样误差。这在抽样研究中是不可避免的。 抽样误差的表现形式: 1)总体参数与样本统计量之间的差异;如μ与 之间的差异 2)样本统计量与样本统计量之间的差异;如 与 之间的差异 理论上,如果进行n次抽样,可能会得到n个各个不相同的样本统计量。如果我们的抽样方法一致的话则n多个统计量之间存在着规律可循。 而基于这样本统计量的抽样分布的规律,才使我们用抽样的方法去推测总体参数的情况。 抽样误差产生的条件 1)抽样研究的方法 2)个体变异的存在 因此抽样误差是不可避免的。且抽样误差是有规律的! 均数的抽样误差及标准误 各样本均数未必等于总体均数; 样本均数间存在差异; 的分布很有规律,围绕着?,中间多,两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大大缩小;且分布很有规律,围绕着?,中间多,两边少,左右基本对称; 统计理论上将样本统计量的标准差称为统计量的标准误(SE),用来衡量抽样误差的大小。 如样本均数的标准差称为均数的标准误, 均数的标准误表示样本均数的变异度 当总体标准差未知时,用样本方差代替, 前者称为理论标准误,后者称为样本标准误 因为标准差S随着样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。 n 越大,均数的均数就越接近总体均数; n 越大,变异越小,分布越窄; 对称分布接近正态分布的速度,大于非对称分布。分布越偏,接近正态分布所需样本含量就越大。 1908年,W.S.Gosset (1876-1937)以笔名Student发表了著名的t分布,即样本均数的确切分布。 设从正态分布N(?,?2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设: T分布的特征 1)t分布为一簇单峰分布曲线 2)t分布以0为中心,左右对称 3)t分布与自由度υ有关。每一自由度下则对应一条t分布曲线。 * 了解抽样误差的重要性 总体 同质、个体变异 总体参数 未知 样本 代表性、抽样误差 随机 抽样 样本统计量已知 统计推断 风 险 与标准差的关系 1、意义上 标准差描述个体值之间的变异,即观察值间的离散程度; 而标准误是描述统计量的抽样误差,即样本统计量和总体参数的接近程度; 2、用途上 标准差常用于表现观察值的波动范围; 标准误常表示抽样误差的大小,估计总体参数可信区间。 3、与样本含量 标准差是随着样本含量的增多,逐渐趋于稳定。 标准误是随着样本含量的增多,逐渐减少。 区 别 与标准差的关系 首先,标准差和标准误都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。 其次,当样本含量不变时,标准差大,标准误亦越大,均数的标准误与标准差成正比。 联 系 则t值服从自由度为n-1的t分布(t-distribution)。 t 分布的概念 正态分布的标准化变化 若 X ~ N(μ,σ) , 则 。 因 ,则 。 标准正态分布 t分布 *
显示全部