抽样误差与和t分布 .ppt
文本预览下载声明
抽样误差和 t 分布 抽样误差的概念 由抽样引起的样本统计量与总体参数间的差异 两种表现形式 样本统计量与总体参数间的差异 样本统计量间的差异 抽样研究 个体变异 均数的抽样误差及标准误 表现一:样本均数与总体均数之差值 表现二:多个样本均数间的离散度 中心极限定理(central limit theorem) 从均数为?、标准差为?的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布的均数为?,标准差为 。 标准误(standard error,SE), 样本统计量的标准差称为标准误,用来衡量抽样误差的大小。 样本均数的标准差称为标准误。此标准误与个体变异? 成正比,与样本含量n的平方根成反比。 实际工作中,? 往往是未知的,一般可用样本标准差s代替? : 因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。 中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋于正态分布 ,见图3.1 。 图3.1描述了来自不同总体的样本均数之抽样误差和抽样分布规律。事实上,任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论基础。 标准差与标准误的联系和区别 联系 都是变异指标。S反映个体观察值的变异;反映统计量的变异。 当n不变时,标准差↑,标准误↑ t分布 设从正态分布N(?,?2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设: 则t值服从自由度为n-1的t分布(t-distribution)。Gosset于1908年在《生物统计》杂志上发表该论文时用的是笔名“Student”,故t分布又称Student t分布。 t分布的特征 t分布为一簇单峰分布曲线 t分布以0为中心,左右对称 t分布与自由度?有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高,;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。 每一自由度下的t分布曲线都有其自身分布规律 t分布表明,从正态分布总体中随机抽取的样本,由样本计算的t值接近0的可能性较大,远离0的可能性较小。t0.05,10=2.228,表明,从正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025。 P(t≤-2.228)+P(t≥2.228)=0.05 或:P(-2.228t2.228)=1-0.05=0.95。 請問SD與SE的差別。多除了一個n有什麼差別。我查過了課本,他說有時候SD會等於SE那是在什麼情況下阿。感覺有一點點奇怪,除非n很小不然SE會比SD小 ? 回答者: 統計老兵yhliu 回答時間: 2008-01-15 20:06:34 ?如果 SE = SD/√n, 怎可能 SE=SD? 除非 n=1. 實際上 SD (標準差, standard deviation) 與 SE (standard error)說起來頗複雜...複雜的原因是: 因為它們都代表了不只一個量! 簡單地說, 每一個資料分布, 不管是群體或樣本, 基本上都可以算出一個標準差 (當然, 就理論上的群體分布而言, 是有可能不存在標準差.) 從群體抽樣, 可以計算樣本平均數, 樣本標準差等等. 但這些由樣本算出的量, 所謂 統計量(statistic), 本身也有個機率分布, 稱為這統計量的 抽樣分布(sampling distribution). 舉個簡單的例子, 群體數據是 {1,2,3,4,5,6}. 你可以計算這群體的平均數, 標準差, 中位數, 四分位數等等一堆量. 現在從這群體去抽樣, 假設 n=3. 如果不重複 (抽出後不放回, 或一次抓3個), 可能抽到 (1,2,3), 也可能抽到 (1,3,6). 有 20 種不同組合. 每一種組合就是一個可能的樣本. 以 (1,3,6) 這樣本來說, 樣本平均數是 10/3=3.33; 但以 (1,2,3) 這個樣本來說, 樣本平均數是 2. 有 20 種不同樣本組合, 就有20個或相等或不等的樣本平均數. 這20個樣本平均數當做資料, 它也構成一個分布,就是 從 {1,2,3,4,5,6} 這群體隨機抽取 n=3 之樣本的樣本平 均數抽樣分布.(好長的名詞!) 這個分布本身也有個標準差. 現在問題來了! 名詞從這裡開始有點混亂. 還是簡單地說. 我說 名詞混亂, 是因為有新舊不同說法.[以前] 如上述樣本平均數抽樣分布的標準差, 就稱為 樣本平均數的標準誤. 類似地, 我們可以有樣本比例的
显示全部