文档详情

第七章母数的估计步骤.doc

发布:2017-04-18约5.04千字共8页下载文档
文本预览下载声明
社會統計 關秉寅 母數估計之步驟 (Estimation Procedures) 本單元目標: 說明估計的邏輯以及樣本、抽樣分配與母群體的角色。 定義及解釋偏誤(bias)與有效性(efficiency)的概念。 建構及解釋樣本平均數與樣本比例之信賴區間(confidence intervals)。 說明信賴水準(confidence level)、樣本大小,及信賴區間之間的關係。 前言   在了解了抽樣分配(sampling distribution)的概念及其兩個重要定理後,我們即可從事推論統計兩大任務之一:由樣本得到的統計值(statistic)來推估母群體之數值或母數(parameters)。在日常生活中常看到的民意調查或選舉調查,就是這種估計的運用。 估計的方法有兩種:一為點估計(a point estimate),也就是從樣本得到的統計值來估計母群體的數值。如果您做了一個民意調查後,報告說全部選民中有42%的人會投給某候選人,此即為點估計的例子(就是估計有42%選民會投給此人)。另一為區間估計(an interval estimate)。此涉及信賴區間(confidence intervals)的估計步驟。信賴區間是估計在一個範圍內的數值,而非單一數值。如果您報告說大約有「39%到45%的選民」會投給某人,就是一種區間估計之例子。 參、偏誤(Bias)與有效性(Efficiency)   不論是點估計或區間估計,我們都是用樣本統計值(sample statistics)來做為推估母數之估計數(estimators),那麼在我們目前所學的諸多統計值中,那一項是可用來當估計數呢?問此問題是因做為一個「好」的估計數要有兩大特性,一即為不偏性(unbiased),另一為具有相當有效性(efficiency)。 Bias:   一個不偏的(unbiased)估計數是「若且唯若」(if and only if),此估計數(即樣本統計值)之「抽樣分配」的平均數(mean)是與(此估計數所要推估之)母數相等。如我們上個單元已經學到的兩個定理,使我們知道算術平均數(eq \x \to(X))是一種具有此不偏性的,因為eq \x \to(X)(樣本平均數)之抽樣分配之平均數(eq \x \to(eq \x \to(X))或μ )即為μ(母群體之平均數)。   其次,我們已學到的樣本比例(proportion)也是有此特性,即Ps (樣本比例)之抽樣分配的平均數,μp,等於母群體之比例,Pμ。   要求一估計數有不偏性,最主要的理由是和此估計數之抽樣分配的特性有關。以樣本之平均數(eq \x \to(X))為例,其抽樣分配為一常態分配(為什麼?),且此分配之平均數為μ。因此,我們可知約有68%的樣本平均數是在μ ± 1σ的範圍內(見圖一),以此類推。例如,如果我們從一個社區500戶隨機樣本資料中,算出此社區家戶的平均每月收入是$35,000,那麼我們可以推估此社區整個母群體的平均收入就是$35,000。此外,由於平均數的抽樣分配是常態分配,所以我們還可知道,$35,000這個估計數有68%的機率是在母群體的平均月收入加減一個σ的範圍內,有95%的機率是在母數加減兩個σ的範圍內。(在此例中的σ是多少?) 圖一 樣本平均數之抽樣分配各種面積 μ-3σ μ-2σ μ-1σ μ=μ μ+1σ μ+2σ μ+3σ (相對應於Z scores的樣本平均數) Efficiency ─   所謂一個估計要有相當好的有效性(efficiency),是說此估計數之抽樣分配之標準差要小,也就是說所有可能的此種樣本估計數應要集中在抽樣分配之平均數(即母數)附近。如我們已學到的,樣本平均數(eq \x \to(X))之抽樣分配的標準差(σ)是等於。由此公式可知,此σ之值和成反比,所以要σ小,就要增加N的數目。(要注意的是當N以某種倍數增加時,σ不是以同樣倍數減少,為什麼?) (*在一些教科書中,除了提到好的估計數要有不偏性及有效性外,還提及一致性(consistency)這個概念。所謂一致性是說,當樣本數增大時,一個不偏的估計數與母數的差距會減小。) 肆、估計之步驟   點估計之步驟是相當簡單的,你只要確定樣本是以EPSEM抽樣方法取得的後,求得樣本之平均數或比例。用此樣本平均數或比例,即可推論母群體之平均數或比例和樣本是一樣的。當然,如果樣本越大,我們知道以樣本的估計數的有效性越好,也越可能是與母數相同。但要注意的是,不論抽樣方法如何嚴謹,樣本不論多大,估計數永遠有可能是非常不準的。   相對於點估計而言,區間估計是比較保險之估計法,因為我們是在推
显示全部
相似文档