抽样误差与均数估计于 .ppt
文本预览下载声明
第四章 统计推断基础抽样误差、参数估计Sampling error and Parameter estimation 主要内容 抽样误差 中心极限定理 标准误 抽样分布(t分布?2 分布F分布) 参数估计 1. 抽样误差 Sampling error 结论 1 各样本均数未必等于总体均数; 样本均数间存在差异; 由抽样实验所得的100个样本作出其均数 分布直方图如图4.1。曲线是对抽样得到的100个 数据拟合的分布曲线。 结论2 的分布很有规律,围绕着?,中间多,两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大大缩小; 2.中心极限定理 central limit theorem 中心极限定理(central limit theorem) (一)从均数为?、标准差为? 的正态总体中,独立随机抽取例数为n的样本,样本均数 的分布服从正态分布; ■样本均数的均数为 μ; ■样本均数的标准差为 。 中心极限定理 (二)从非正态(nonnormal)分布总体(均数为μ,方差为σ)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则只要样本含量足够大(n50),样本均数也近似服从正态分布。 ■样本均数的均数为 μ; ■样本均数的标准差为 。 3.标准误 standard error 4. 抽样分布(1) t-distribution 1908年,W.S.Gosset (1876-1937)以笔名Student发表了著名的t分布,证明了: 设从正态分布N(?,?2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设: t分布的特征 t分布是一簇曲线,当ν不同时,曲线形状不同; 单峰分布,以0为中心,左右对称; 当ν逼近∞时,t分布逼近u分布,故标准正态分布是t分布的特例; t分布曲线下面积是有规律的。 例如,当?=10,单尾概率?=0.05时,查表得单尾t0.05,10=1.812,则: P(t≤-1.812)=0.05 或P(t≥1.812)=0.05 例如,当?=10,双尾概率?=0.05时,查表得双尾t0.05,10=2.228,则: P(t≤-2.228)+P(t≥2.228)=0.05 或:P(-2.228t2.228)=1-0.05=0.95。 单尾:P(t≤- t?,?)=?,或P(t≥t?,?)=? 双尾:P(t≤- t?/2,?)+P(t≥t?/2,?)=?, 即P(-t?/2,?t t?/2,?)=1-? ?2 分布 设从正态分布N(?,?2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设: ?2值服从自由度为n-1的?2分布(?2-distribution) ?2分布的特征 (1) ?2分布为一簇单峰正偏态分布曲线 ;随?的逐渐加大,分布趋于对称。 (2) 自由度为?的?2分布,其均数为?,方差为2?。 (3) 自由度为?的?2分布实际上是?个标准正态分布变量之平方和。 ?2=u12+ u22+……+ uv2 (4) 每一自由度下的?2分布曲线都有其自身分布规律。 ?2分布的特征 ?2分布是方差的抽样分布。 ?2分布说明,从正态分布的总体中随机抽样,所得样本的方差s2接近于总体方差?2的可能性大,远离总体方差的可能性小。 即?2值接近其均数n-1的可能性大,远离n-1的可能性小。 ?2分布的特征 自由度=10时,?20.025,10=20.48,?20.975,10=3.25。 从正态分布的总体中随机抽样,得到的样本其?2值大于等于20.48的概率为0.025,小于等于3.25的概率亦为0.025。 P(?2≤3.25)+P(?2≥20.48)=0.05 ?2分布近似描述具有某种属性的实际频数Ai与理论频数Ti之间的抽样误差 F分布 设从两个方差相等的正态分布N(?1,?2)和N(?2,?2)总体中随机抽取含量分别为n1和n2的样本,样本均数和标准差分别为 、s1和 和s2。设: 则F值服从自由度为(n1-1,n2-1)的F分布(F-distribution)。 F分布的特征 (1) F分布为一簇单峰正偏态分布曲线,与两个自由度有关。 (2) 若F服从自由度为(?1,?2)的F分布,则其倒数1/F服从自由度为(?2,?1)的F分布。 (3) 自由度为(?1,?2)的F分
显示全部