偏最小二乘回歸方法_第1頁
偏最小二乘回歸方法_第2頁
偏最小二乘回歸方法_第3頁
偏最小二乘回歸方法_第4頁
偏最小二乘回歸方法_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、偏最小二乘回歸方法,講演人:,簡言之,偏最小二乘回歸是一種集多元線性回歸分析、典型相關分析和主成分分析的基本功能為一體的新型多元統(tǒng)計分析方法。,此方法的優(yōu)點:,(1)能在自變量存在嚴重多重相關性的條件下進行回歸建模;,(2)允許在樣本點個數(shù)少于自變量個數(shù)的條件下進行回歸建模;,此方法的優(yōu)點:,(3)偏最小二乘回歸在最終模型中將包含原有的所有自變量,易于辨識系統(tǒng)信息與噪聲,而且其自變量的回歸系數(shù)也將更容易解釋。,此方法的優(yōu)點:,(4)偏最小二乘回歸方法與其他的建模方法相比,具有計算簡單、預測精度高,易于定性解釋的優(yōu)點。,多因變量偏最小二乘算法推導,首先將數(shù)據(jù)做標準化處理。,原自變量數(shù)據(jù)表,經(jīng)標準

2、化后的數(shù)據(jù)矩陣記為,原因變量數(shù)據(jù)表,經(jīng)標準化后的數(shù)據(jù)矩陣記,多因變量偏最小二乘算法推導,第一步:記 是 的第一個成分, , 是 的第一個軸,它是一個單位向量,即有 。 記 是 的第一個成分 , 是 的第一個軸,它是一個單位 向量,即 。,多因變量偏最小二乘算法推導,如果要使 , 能很好的代表 與 中的數(shù)據(jù)變異信息,根據(jù)主成分分析原理,應該有 , 。,多因變量偏最小二乘算法推導,另一方面,由于回歸建模的需要,又要求 對 有最大的解釋能力,由典型相關分析的思路,與 的相關度應達到最大值,即,多因變量偏最小二乘算法推導,因此,綜合起來,在偏最小二乘回歸中,我們要求 與 的協(xié)方差達到最大,即,多因變量

3、偏最小二乘算法推導,正規(guī)的數(shù)學表述應該是求解下列優(yōu)化問題,即,多因變量偏最小二乘算法推導,采用拉格朗日算法,記,對 分別求關于 , ,和 的偏導數(shù),并令之為零,有,多因變量偏最小二乘算法推導,(1)式,(2)式,(3)式,(4)式,多因變量偏最小二乘算法推導,由上述四個式子可以推出,記 ,所以 正是優(yōu)化問題的目標函數(shù)值。,多因變量偏最小二乘算法推導,把(1)和(2)式寫成,將(6)代入(5),有,(5)式,(6)式,(7)式,多因變量偏最小二乘算法推導,同理,可得,易知, 是矩陣 的特征向量,對應的特征值為 。 是目標函數(shù),它要求取最大值。,所以, 是對應于矩陣 的最大特征值的單位特征向量。,

4、多因變量偏最小二乘算法推導,易知, 是對應于矩陣 的最大特征值 的單位特征向量。,求得軸 和 后,即可得到成分 , 。然后,分別求 和 對 與 的三個回歸方程,多因變量偏最小二乘算法推導,其中,多因變量偏最小二乘算法推導,而 , , 分別是三個回歸方程的殘差矩陣。,多因變量偏最小二乘算法推導,第二步:用殘差矩陣 和 取代 和 。然后,求第二個軸 和 以及第二個成分 , ,有,多因變量偏最小二乘算法推導,是對應于矩陣 的最大特征值 的特征向量; 是對應于矩陣 的最大特征值 的特征向量。,多因變量偏最小二乘算法推導,計算回歸系數(shù),因此,有回歸方程,(8)式,多因變量偏最小二乘算法推導,如此計算下去

5、,如果的 秩是 ,則會有,由于 均可以表示成 的線性組合。,多因變量偏最小二乘算法推導,因此,(8)式還可以還原成 關于 的回歸方程形式,即,是殘差矩陣 的第 列。,偏最小二乘回歸的簡化算法,(1)求矩陣 最大特征值所對應的單位特征向量 ,求成分 ,得,其中,偏最小二乘回歸的簡化算法,(2)求矩陣 最大特征值所對應的單位特征向量 ,求成分 ,得,其中,偏最小二乘回歸的簡化算法,至第h步,求成分 , 是 矩陣最大特征值所對應的特征向量。,如果根據(jù)交叉有效性,確定共抽取h個主成分 可以得到一個滿意的預測模型。,偏最小二乘回歸的簡化算法,則求 在 上的普通最小二乘回歸方程為,其中,交叉有效性具體的步驟:,記 為原始數(shù)據(jù), 是在偏最小二乘回歸過程中提取的成分, 是使用全部樣本點并取h 個成分回歸建模后,第 個樣本點的擬合值, 是在建模時刪除樣本點 ,,交叉有效性具體的步驟:,取 h 個成分回歸建模后,再用此模,型計算的 的擬合值,記,交叉有效性具體的步驟:,當 即 時,引進新的成分 會對模型的預測能力有明顯的改善作用。,典型相關分析中的精度分析,在偏最小二乘回歸計算過程中,所提取的自變量成分 ,盡可能多地代表 中的變異信息。,對某自變量 的解釋能力為,典型相關分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論