13_多重回歸模版課件_第1頁
13_多重回歸模版課件_第2頁
13_多重回歸模版課件_第3頁
13_多重回歸模版課件_第4頁
13_多重回歸模版課件_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 多重線性回歸與相關 多重回歸(multiple linear regression)與多重相關(multiple correlation)是研究一個因變量和多個自變量之間線性關系的統(tǒng)計學分析方法。 第一節(jié) 多重線性回歸的概念及其統(tǒng)計描述 例13-1 為了研究空氣中一氧化氮NO的濃度與汽車流量等因素的關系,有人測定了某城市交通點在單位時間內過往的汽車數、氣溫、空氣濕度、風速以及空氣中的NO的濃度,數據如表13-1所示。 bj為自變量Xj 的偏回歸系數partial regression coefficient,是j的估計值,表示當方程中其他自變量保持常量時,自變量Xj變化一個計量單位,反響變量

2、Y的平均值變化的單位數。 標準化偏回歸系數standardized partial regression coefficient,又稱為通徑系數path coefficient。標準化偏回歸系數bj較大的自變量在數值上對反響變量Y的作用較大。 回歸參數的估計: 前提條件:LINE。 最小二乘法 (least square method)。 根本原理是:利用觀察或收集到的因變量和自變量的一組數據建立一個因變量關于自變量的線性函數模型,使得這個模型的理論值和觀察值之間的殘差平方和盡可能地小。第二節(jié) 多重線性回歸的假設檢驗 表13-2顯示,P 0.0001,拒絕H0。說明從整體上而言,用這四個自變量

3、構成的回歸方程解釋空氣中NO濃度的變化是有統(tǒng)計學意義的。 偏回歸系數的 t 檢驗 偏回歸系數的 t 檢驗是在回歸方程具有統(tǒng)計學意義的情況下,檢驗某個總體偏回歸系數等于零的假設,以判斷是否相應的那個自變量對回歸確有奉獻。 H0: i = 0 H1: i 0第三節(jié) 復相關系數與偏相關系數 復相關系數的平方稱為確定系數coefficient of determination, 或決定系數,記為R2,用以反映線性回歸模型能在多大程度上解釋反響變量Y的變異性。其定義為 復相關系數 復相關系數(multiple correlation coefficient) R 定義為確定系數的算術平方根,表示變量Y與

4、k個自變量X1,X2,Xk線性相關的密切程度。 調整的R2(Adjusted R-Square):當回歸方程中包含有很多自變量,即使其中有一些自變量如本例中的X3 對解釋反響變量變異的奉獻極小,隨著回歸方程的自變量的增加,R2 值表現為只增不減,這是復相關系數R2的缺點。調整的R2記為 ,定義為 偏相關系數 暑假期間雙胞胎兄弟大明和小明參加勤工儉學,大明在超級市場幫助賣冷飲,小明在游泳池收門票。每天晚上,二人閑聊。昨天大明冷飲賣得多,小明門票也收得多,今天,大明賣得少,小明門票也收得少。一個月下來,他們發(fā)現,超級市場冷飲銷售量和游泳人數呈正相關。是不是愛吃冷飲的人想游泳?或愛游泳的人喜歡冷飲?

5、 r0.05=0.602原來冷飲銷售量和氣溫正相關,游泳人數和氣溫也正相關,冷飲銷售量和游泳人數的正相關是氣溫造成的假象,扣除氣溫的影響之后兩者就不相關了。 一般地,扣除其他變量的影響后,變量Y與X的相關,稱為Y與X的偏相關系數。偏相關系數 第四節(jié) 自變量篩選 為確?;貧w方程包含所有對反響變量有較大影響的自變量,而把對反響變量作用不大或可有可無的自變量排除在方程之外,這一統(tǒng)計過程稱為自變量的選擇。 一、自變量篩選的標準與原那么 1. 殘差平方和SSE縮小與確定系數R2增大; 2. 殘差均方MSE縮小與調整確定系數Ra2增大3. 統(tǒng)計量: 二、自變量篩選的常用方法 1. 所有可能自變量子集選擇

6、(all possible subsets selection) ,又稱全局擇優(yōu)法;2. 前向選擇forward selection;3. 后向選擇backward selection;4. 逐步選擇stepwise selection。1. 全局擇優(yōu)法 根據某種變量的選擇準那么,通過比較各子集符合準那么的程度,從中選擇出一個或幾個最優(yōu)的回歸,稱為“最優(yōu)子集回歸。2. 前向選擇forward selection 3. 后向選擇 (backward selection) 4.逐步選擇stepwise selection 第五節(jié) 多元線性回歸的應用 及其本卷須知一、應用影響因素分析,控制混雜因素預

7、測:由自變量值推出應變量Y的值控制:指定應變量Y的值查看自變量的改變量二、應用條件應用的本卷須知樣本含量 觀察個體數n與變量個數m的比例一般至少應為:n : m510統(tǒng)計“最優(yōu)與專業(yè)的“最優(yōu)不同準那么、方法得出的“最優(yōu)方程不同;不同的引入、剔除標準獲得的“最優(yōu)方程不同;方程還受數據的正確性、共線性影響多重共線性 自變量間存在著線性關系,使一個或幾個自變量可以由另外的自變量線性表示時,稱為該變量與另外的自變量間存在有共線性(collinearity)。回歸系數的符號與由專業(yè)知識不符變量的重要性與專業(yè)不符多重共線性的識別與解決方法 整個方程決定系數R2高,但各自變量對應的回歸系數均不顯著。解決共線性的主要方法:篩選自變量用主成分回歸嶺回歸。交互作用 當某一自變量對應變量的作用大小與另一個自變量的取值有關時,那么表示兩個變量有交互作用interaction。 檢驗兩變量間有無交互作用,普遍的做法是在方程中參加它們的乘積項再做檢驗。如考察X1、X2間的交互作用,可在模型中參加X1X2項。幾個相關系數的區(qū)別

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論