標準化殘差.ppt
文本预览下载声明
第 14 章 簡單迴歸 統計實例 Alliance Data Systems(ADS)公司是快速崛起的顧客關係管理(customer relationship management, CRM)產業的一員。 ADS提供的行銷服務之一是設計目錄及促銷活動。該公司的資料庫中有超過一億名消費者的購買習慣紀錄,ADS可以利用資料庫來找出最可能對直接郵寄型錄的促銷活動感興趣的顧客名單。 Analytical Development Group運用迴歸分析建立模型,模型可用來衡量及預測消費者對直接郵寄型錄的促銷活動的反應。 本章就要介紹如何建立此類估計迴歸方程式。 第14章 簡單迴歸 14.1 簡單線性迴歸模型 迴歸術語 應變數 (y):想預測的變數 自變數 (x):用來預測應變數之數值的變數 例如 在分析廣告費用對銷售額的影響時,行銷經理要預測的是銷售額,所以銷售額為應變數;廣告費用則是用來預測銷售額之自變數。以統計符號而言,y 代表應變數,而 x 代表自變數。 簡單線性迴歸模型 簡單線性迴歸:僅牽涉到單一自變數與單一應變數,而且兩變數間的關係近似一條直線。這種類型稱為簡單線性迴歸(simple linear regression)。 複迴歸分析:牽涉兩個以上自變數的迴歸分析稱為複迴歸分析(multiple regression analysis) 簡單線性迴歸模型 簡單線性迴歸模型 簡單線性迴歸模型 簡單線性迴歸模型 簡單線性迴歸模型 估計的簡單線性迴歸方程 估計過程 14.2 最小平方法 最小平方法 最小平方法 估計迴歸方程式的斜率與 y 截距 最小平方法 最小平方法(實例) 以亞曼披薩屋為例說明最小平方法。假定資料來自10間鄰近大學校園的分店。對於樣本中第 i 個觀察值或第 i 間餐廳而言,xi 為學生人數(單位:千人);yi為每季銷售額(單位:$1,000)。10間餐廳之 x 與 y 值彙整於表14.1。 我們可看到餐廳1之 x1=2且 y1=58;即其鄰近學生人數為2,000人之校園且每季銷售額為$58,000。餐廳2之 x2=6且 y2=105,表示它鄰近學生人數為6,000人之校園且每季銷售額為$105,000。銷售額最大的是餐廳10,其鄰近學生人數為26,000人之校園,每季銷售額為$202,000。 最小平方法(實例) 最小平方法(實例) 圖14.3為表14.1之資料的散佈圖(scatter diagram),學生人數為橫軸,每季銷售額為縱軸。迴歸分析的散佈圖係將自變數 x 之值置於橫軸,應變數 y 之值置於縱軸繪製而成。散佈圖讓我們能由圖形來觀察資料,並得到變數間可能關係的初步結論。 靠近學生人數愈多之校園的餐廳,每季銷售額似乎愈高。再者,由這些資料可發現學生人數與每季銷售額的關係近似直線;的確,x與y間似乎存在正向的直線關係。因此,我們選擇簡單線性迴歸模型來表示學生人數與每季銷售額的關係。這個選擇的下個步驟即是利用表14.1的樣本資料來決定估計的簡單線性迴歸方程式中b0和b1的值。 最小平方法(實例) 對第 i 個餐廳而言,估計迴歸方程式為其中 = 第i間餐廳每季銷售額的估計值($1,000) b0= 估計迴歸線之 y 截距 b1= 估計迴歸線之斜率 xi= 第 i 間餐廳鄰近校園的學生人數(千人)? 以yi表示餐廳 i 每季銷售額的觀察(實際)值,而以式(14.4)中之 表示餐廳 i 之估計銷售額,如此樣本中每間餐廳均有銷售額的實際觀察值 yi與估計值 。為了使估計迴歸線能非常配適這些資料,我們希望yi與 間的差距很小。 最小平方法(實例) 求算亞曼披薩屋的最小平方估計迴歸方程式時所需之部分計算列於表14.2。在此例子中,因有10間餐廳(觀察值) 計算亞曼披薩屋之估計迴歸方程式中的斜率與截距 最小平方法(實例) 最小平方法(實例) 利用最小平方法得到的估計迴歸方程式為圖14.4為此方程式的散佈圖。 估計迴歸方程式的斜率(b1=5)為正,表示當學生人數增加時,銷售額亦會增加。事實上,我們可得到結論為(銷售額單位為$1,000,學生人數單位為千人):學生人數每增加1,000人,每季期望銷售額可提高$5,000;換言之,我們預期每名學生可增加 $5的銷售額。 最小平方法(實例) 如果我們相信最小平方估計迴歸方程式能適當地描述x與y的關係,則利用估計迴歸方程式預估已知的x值所對應的y值似乎是很合理的。例如,如果我們要預測鄰近學生人數為16,000人校園的餐廳的每季銷售額,可計算如下因此,我們將預期此餐廳每季的銷售額為$140,000。 14.3 判定係數 SST、SSR與SSE間的關係 判定係數(實例) 在亞曼披薩屋的例子中,我們建立估計迴
显示全部