作业一中央极限定理之模拟实验-SitesDuke.doc
文本预览下载声明
PAGE 1
PAGE 32
作業一 中央極限定理之模擬實驗
一、以 twnvillage96vote.sav 資料為母體。
二、選擇一個變數(例如1996總統選舉各村里kmt得票數或得票率)。
三、先偷看母體參數(如平均數,標準差)。
四、以 SRS 方式抽出 n=25 個樣本。
五、計算樣本平均數及樣本標準差。
六、重複步驟四、五,做 100次。
七、檢驗這一百個樣本平均數是不是接近中央極限定理所說的:
(一)樣本平均數的平均數等於母體平均數,
(二)樣本平均數的標準差等於母體標準差除以根號 n ,
(三)樣本平均數呈常態分布,其平均數是母體平均數,標準差是
母體標準差除以根號 n ? (npar test chisquare)
(四)有多少樣本平均數落在母體平均數加減兩倍的標準誤之間?
(五)有多少區間估計會包含母體平均數?
八、重複步驟四至七,但 n=100。
九、重複步驟四至七,但 n=225。
十、寫下此一模擬實驗的結論與心得。
執行程序
開始—程式集—SPSS—,開啟SPSS
(2)在SPSS的視窗下,執行「File」—「Open」—「Data」d:\homework\twvillage96vote
(圖1-1)
圖1-1
選擇一個數字資料變數(例如:dpp得票率)
偷看母體參數
在「Analyze」下點選「Descriptive statistics」→選擇「Descriptives」(圖1-2)
點選「96dpp得票率」此變數(圖1-3)
最後點選「確定」,至output1-SPSS瀏覽器視窗,便可看到結果(圖1-4)。
圖1-2
圖1-3
Descriptive Statistics
圖1-4
說明
如(圖1-4)中,母體平均數μ=20.6618,標準差σ=8.33678
『記得要將母體參數先抄下來喔』!
以SRS方式抽出n=25個樣本。(sample 25 from 7462)
回到SPSS畫面,在「Data」下點選「Select cases」(圖1-5),
點選「Random sample of cases」,再點進入「Sample」(圖1-6),
點選第二行寫著「exactly」那一行,填入要抽樣的個數(25 or 100)以及母體總數(7462)(圖1-7),
點選「continue」後,再點選「OK」,則系統自動幫忙隨機抽出25個樣本(圖1-8)。
圖1-5
圖1-6
圖1-7
圖1-8
計算樣本平均數及樣本標準差
接下來我們再回到SPSS畫面,到「Analyze」下點選「Descriptive statistics」→選擇「Descriptives」,選擇「96dpp得票率」之後,點選「確定」。
至output1可看到系統已計算出這25個樣本的統計資料(這是第一次抽出25個樣本數的結果,可稍稍和母體資料做比較)(圖1-9)。
圖1-9
重複三、四,做100次。(亦即複製語法99次,總共變成100次)
在output1可看到三、四的語法(圖1-10),並將其複製。
新開一個語法檔:在SPSS視窗選「File」→「New」→「Syntax」(圖1-11)。
將複製的語法貼上,共貼99次(圖1-12)。
USE ALL.
do if $casenum = 1.
compute #s_$_1=25.
compute #s_$_2=7462.
end if.
do if #s_$_2 0.
compute filter_$ = uniform(1)* #s_$_2 #s_$_1.
compute #s_$_1 = #s_$_1 - filter_$.
compute #s_$_2 = #s_$_2 - 1.
else.
compute filter_$ = 0.
end if.
VARIABLE LABEL filter_$ 25 from the first 7462 cases (SAMPLE).
FORMAT filter_$ (f1.0).
FILTER BY filter_
显示全部