定量分析之回归分析课件.ppt
n-2123456789100.050.010.9970.9500.8780.8110.7540.7070.6660.6320.6020.5761.0000.9900.9590.9170.8740.8340.7980.7650.7350.708n-2111213141516171819200.050.010.5530.5320.5140.4790.4820.4680.4560.4440.4330.4130.6840.6610.6410.6230.6060.5900.5750.5610.5490.537n-2212223242526272829300.050.010.4130.4040.3960.3880.3810.3740.3670.3640.3550.3490.5260.5150.5050.4960.4870.4780.4700.4630.4560.449相關係數臨界值表xyr=1xyr=-1(a)完全正相關(b)完全負相關xyr=0(a)無相關xyr=0(b)曲線關係高度相關,r絕對值(0.7,1];中度相關,r絕對值(0.3,0.7];低度相關,r絕對值(0.1,0.3]。TSS0當截取1837個有效數據中的200個數據時的分析結果。三、多元回歸分析例為研究考試成績與性別間的關係,從某大學一學院A專業隨機抽取男女學生各8名,得到他們的B課程的考試成績。試建立考試成績與性別的線性回歸方程。Y=66.875+14.875x性別例研究工資水準與工作年限和性別之間的關係,在某行業隨機抽取10名職工,所得數據如下表.*************說有表示各類別的虛擬變數的回歸係數b,表示該類別與參照類均值之差,因此有成為差別截距。*定量分析方法一、回歸分析必備的數學知識1.最小二乘法原則2.矩陣的加減和相乘1.最小二乘法普通最小二乘法(ordinaryleastsquares,簡記OLS);基本原則是:最優擬合直線應該使各點到直線的距離的和最小,也可表述為距離的平方和最小。直線上的yt值,記為,稱為擬合值(fittedvalue),實際值與擬合值的差,記為,稱為殘差(residual),可以看作是隨機誤差項的估計值。根據OLS的基本原則,使直線與各散點的距離的平方和最小,實際上是使殘差平方和(residualsumofsquares,簡記RSS)最小,即最小化:RSS==2.1基本知識矩陣相乘:必須滿足矩陣A的列數與B矩陣的行數相等;相乘後的矩陣:C的列數為A的行數,B的列數。2.矩陣知識兩個非零矩陣的乘積可能是零矩陣,AB=0,未必A=0或B=0。矩陣乘法不滿足交換律:AB≠BA表示一個m*n矩陣當m=n時,稱為m階矩陣單位矩陣:一個?n階方陣的主對角線上的元素都是1??,而其餘元素都是零N階下三角矩陣N階上三角矩陣*A為m*1,B為1*n2.2逆矩陣如對方陣A,有一方陣B,使AB=E(單位矩陣),則矩陣B為A的逆矩陣。講解課本例子第113頁二、一元回歸分析1.確定回歸係數當某年數據出現不符合發展規律時應加以修正2.相關性檢驗R檢驗*************說有表示各類別的虛擬變數的回歸係數b,表示該類別與參照類均值之差,因此有成為差別截距。*