方差分析课件.ppt
方差分析
7.1方差分析引論方差分析及其有關術語方差分析的基本思想和原理方差分析的基本假定問題的一般提法
方差分析及其有關術語
什麼是方差分析(ANOVA)?
(analysisofvariance)檢驗多個總體均值是否相等通過分析察數據的誤差判斷各總體均值是否相等研究分類型引數對數值型因變數的影響一個或多個分類尺度的引數2個或多個(k個)處理水準或分類一個間隔或比率尺度的因變數有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個分類的引數雙因素方差分析:涉及兩個分類的引數
什麼是方差分析?
(例題分析)消費者對四個行業的投訴次數行業觀測值零售業旅遊業航空公司家電製造業12345675766494034534468392945565131492134404451657758【例7.1】為了對幾個行業的服務品質進行評價,消費者協會在四個行業分別抽取了不同的企業作為樣本。最近一年中消費者對總共23家企業投訴的次數如下表
什麼是方差分析?
(例題分析)分析四個行業之間的服務品質是否有顯著差異,也就是要判斷“行業”對“投訴次數”是否有顯著影響作出這種判斷最終被歸結為檢驗這四個行業被投訴次數的均值是否相等如果它們的均值相等,就意味著“行業”對投訴次數是沒有影響的,即它們之間的服務品質沒有顯著差異;如果均值不全相等,則意味著“行業”對投訴次數是有影響的,它們之間的服務品質有顯著差異
為什麼不同T檢驗進行兩兩比較兩兩比較是建立在統計概率的基礎上的。在統計上,由於檢驗是可能出錯誤的,因此,不能得到A=B且B=C,故A=B=C的結論。比如:一次兩兩比較不犯第一類錯誤的概率為1-0.05。如果有k個樣本要進行兩兩比較,共需比較次。這時犯第一類錯誤的概率就是:這顯然大於0.05。如果有五個樣本作兩兩比較,則犯錯誤的概率為0.4013!
方差分析中的有關術語因素或因數(factor)所要檢驗的對象要分析行業對投訴次數是否有影響,行業是要檢驗的因素或因數水準或處理(treatment)因數的不同表現零售業、旅遊業、航空公司、家電製造業就是因數的水準觀察值在每個因素水準下得到的樣本值每個行業被投訴的次數就是觀察值
方差分析中的有關術語試驗這裏只涉及一個因素,因此稱為單因素四水準的試驗總體因素的每一個水準可以看作是一個總體比如零售業、旅遊業、航空公司、家電製造業可以看作是四個總體樣本數據被投訴次數可以看作是從這四個總體中抽取的樣本數據
方差分析的基本思想和原理
方差分析的基本思想和原理
(圖形分析)零售業旅遊業航空公司家電製造
從散點圖上可以看出不同行業被投訴的次數是有明顯差異的即使是在同一個行業,不同企業被投訴的次數也明顯不同家電製造也被投訴的次數較高,航空公司被投訴的次數較低行業與被投訴次數之間有一定的關係如果行業與被投訴次數之間沒有關係,那麼它們被投訴的次數應該差不多相同,在散點圖上所呈現的模式也就應該很接近方差分析的基本思想和原理
(圖形分析)
僅從散點圖上觀察還不能提供充分的證據證明不同行業被投訴的次數之間有顯著差異這種差異也可能是由於抽樣的隨機性所造成的需要有更準確的方法來檢驗這種差異是否顯著,也就是進行方差分析所以叫方差分析,因為雖然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助於方差這個名字也表示:它是通過對數據誤差來源的分析判斷不同總體的均值是否相等。因此,進行方差分析時,需要考察數據誤差的來源。方差分析的基本思想和原理
1. 比較兩類誤差,以檢驗均值是否相等2. 比較的基礎是方差比3. 如果系統(處理)誤差顯著地不同於隨機誤差,則均值就是不相等的;反之,均值就是相等的4. 誤差是由各部分的誤差占總誤差的比例來測度的方差分析的基本思想和原理
方差分析的基本思想和原理
(兩類誤差)隨機誤差因素的同一水準(總體)下,樣本各觀察值之間的差異比如,同一行業下不同企業被投訴次數是不同的這種差異可以看成是隨機因素的影響,稱為隨機誤差系統誤差因素的不同水準(不同總體)下,各觀察值之間的差異比如,不同行業之間的被投訴次數之間的差異這種差異可能是由於抽樣的隨機性所造成的,也可能是由於行業本身所造成的,後者所形成的誤差是由系統性因素造成的,稱為系統誤差
方差分析的基本思想和原理
(兩類方差)數據的誤差用平方和(sumofsquares)表示,稱為方差組內方差(withingroups)因素的同一水準(同一個總體)下樣本數據的方差比如,零售業被投訴次數的方差組內方差只包含隨機誤差組間方差(betweengroups)因素的不同水準(不同總體)下各樣本之間的方差比如,四個行業被投訴次數之間的方差組間方差既包括