文档详情

个别回归系数的检定.PPT

发布:2018-04-01约5.34千字共53页下载文档
文本预览下载声明
例子 用公式 [14-3] 計算複判定係數: 如何解釋這個值?我們說:獨立變數(平均室外溫度、屋頂天花板厚度、暖爐使用年數)可解釋暖氣花費總變異的 80.4%。換句話說,19.6% 的變異是由於誤差或是由沒考慮的變數所造成。ANOVA 表格中,19.6% 是誤差的平方和除以平方總和。 14-* 例子 continued 暖氣花費的範例,調整複判定係數如下: 請比較判定係數 R2 為 0.8,而調整複判定係數 為 0.77。 14-* 聯合檢定:檢定複迴歸模式是否有效 能夠檢定獨立變數對相依變數 Y 的解釋能力有多少。以問句的方式詮釋:可以不依賴獨立變數來估計相依變數嗎?這個檢定稱為聯合檢定(global test)。 14-* 聯合檢定 檢定統計量為 F 分配,其自由度為 k 與 n-(k + 1) ,其中 n 為樣本個數。 14-* 找尋F臨界值 14-* 找出計算之F值 14-* 解讀 14-* 計算出F值為21.90,在拒絕域內,故拒絕H0。 虛無假設之所有複迴歸參數皆為0,故拒絕之。 解讀:某些獨立變數(amount of insulation, etc.)具有解釋相依(heating cost)變異能力。 個別迴歸係數的檢定 個別檢定為對個別變數進行檢定,判斷哪些迴歸係數為 0 哪些不為 0。 如果一個β值等於 0,則代表該獨立變數無法解釋相依變數的任何變異。因此,當發現係數不能拒絕時,就必須將它從迴歸方程式中剔除。 檢定統計量為 t 分配,以及其自由度為 n-(k + 1) 。 14-* 個別迴歸係數的檢定 公式如下: 其中 bj 為任何一個迴歸係數,sbi 為迴歸係數 bj 之分配的標準差。 14-* 斜率之臨界t-stat 14-* 計算斜率之 t-stat 14-* 斜率顯著性結論 14-* 殘差分析 殘差為實際變數 Y 與預測變數 Y 間的差異。 想要了解殘差是否服從常態分配 ,可以使用直方圖來表示。 繪製殘差與相對應的 Y 值可以顯示在這些殘差中是否出現某種趨勢或型態。 14-* 殘差圖 14-* 殘差直方圖 14-* 評估複迴歸的假設 線性關係:獨立變數與相依變數間必須具有線性關係。 大與小的 值產生相同的殘差變異:不管的大小, 是不相關的。 殘差服從常態機率分配:殘差 是實際值 Y 與估計值 的差異,它近似常態分配,且平均數為0。 14-* 評估複迴歸的假設 獨立變數之間不應該有相關。 殘差是獨立的。即相依變數的相鄰觀測值是不相關的。但當時間因素被考慮進樣本觀測值,則這項假設經常不滿足。 14-* 變異膨脹因子 變異膨脹因子(variance inflation factor )公式如下: 是判定係數,挑選的獨立變數被使用作為相依變數,剩下的獨立變數仍然作為獨立變數。若 VIF 10,則顯示獨立變數應被刪除。 14-* 獨立的觀測 迴歸分析與相關分析的第五個假設是:殘差應該是獨立的。即殘差應該沒有固定的形式,它們應該不會相關。如果殘差有相關,這種情況稱為自相關(autocorrelation)。自相關經常發生在資料蒐集的過程持續一段時間。 14-* 質變數 通常希望在分析中使用名目尺度的變數──例如:性別區分、房屋是否有游泳池、或是球賽在主客場等。因為它們描述了一個特定的性質,所以稱為質變數(qualitative variables)。 14-* 虛擬變數 為了將質變數利用在迴歸分析中,使用虛擬變數來表示兩個可能的條件,並將之編碼為 0 或 1。 虛擬變數(dummy variables):一種只有兩個可能結果的變數。進行分析時,將其中一個結果編碼為 1 ,另一個結果編碼為 0。 14-* 範例 表 14-1 的範例,有三個獨立變數與暖氣的成本有關:戶外溫度、天花板厚度、暖氣爐的使用年數。為所有獨立變數建立相關矩陣。是否有多重共線性的問題?為每個獨立變數求出變異膨脹因子,並解釋之。 14-* 範例 continued 運用 MINITAB 套裝軟體來建立相關矩陣。部分輸出如下: 14-* 範例 continued 沒有一個獨立變數的相關性超過-0.7 與 0.7 以外,所以沒有多重共線性的問題。獨立變數最大的相關性是-0.486 出現在使用年數與戶外溫度。 為了確定這個結論,我們為每個獨立變數求出變異膨脹因子。首先考慮戶外溫度。把戶外溫度當作相依變數,把天花板厚度與暖氣爐使用年數當作獨立變數,求戶外溫度的複判定係數。部分 MINITAB 輸出如下頁所示。 14-* 範例 continued 部分 M
显示全部
相似文档