




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、多元線性回歸主成分及其回歸第9講多元線性回歸解決的問題系數(shù)矩陣系數(shù)矩陣 Y=XA建模:求解建模:求解回歸系數(shù)回歸系數(shù)A,該過程稱為建,該過程稱為建模模預報:在預報:在A已知時,對于新測已知時,對于新測Xnew,預報預報Ynew,稱為稱為預報預報例子某保健品含片產品,說明書標明:由營養(yǎng)某保健品含片產品,說明書標明:由營養(yǎng)物質物質A、B、C組成,產品標注中寫出了每組成,產品標注中寫出了每片中片中A、B、C物質的含量。問,如何認定物質的含量。問,如何認定?配置配置A、B、C的一組溶液,建立濃度與光的一組溶液,建立濃度與光吸收的關系。既建模求回歸系數(shù)吸收的關系。既建模求回歸系數(shù)將藥片配置成溶液,測吸光
2、,利用上面的將藥片配置成溶液,測吸光,利用上面的模型,預報濃度。模型,預報濃度。建模公式推導Y=XAXtY=XtXA(XtX)-1XtY=AE:學校教學pythonX.txtE:學校教學pythonY.txt問題求解的關鍵步驟是什么?問題求解的關鍵步驟是什么?方程數(shù)與未知數(shù)的關系設有規(guī)律上符合如下方程的一設有規(guī)律上符合如下方程的一 組實驗數(shù)據(jù)組實驗數(shù)據(jù) y= ax+b通過實驗,不斷變更通過實驗,不斷變更x,測得對應的,測得對應的y求求a,b的值,需要幾組這樣的數(shù)據(jù)?的值,需要幾組這樣的數(shù)據(jù)?唯一解唯一解最小二乘解最小二乘解y1y2ynx1 1x2 1 1xn 1ab=矩陣形式矩陣形式XtX是是
3、2*2的矩陣的矩陣方程數(shù)與未知數(shù)的關系設有規(guī)律上符合如下方程的一設有規(guī)律上符合如下方程的一 組實驗數(shù)據(jù)組實驗數(shù)據(jù) y= 1.2 x1 + 0.9 x2 + 3.3 x3通過實驗,不斷變更通過實驗,不斷變更x1、x2、x3,測得對應的,測得對應的y需要幾組這樣的數(shù)據(jù)?需要幾組這樣的數(shù)據(jù)?唯一解唯一解最小二乘解最小二乘解方程數(shù)小于未知數(shù),一定無解嗎y= 1.2 x1 + 0.9 x2 + 3.3 x3當當X1,X2,X3存在線性相關時,問題會怎樣?存在線性相關時,問題會怎樣?如果如果x個數(shù)很多,樣本打不到要求,怎么辦個數(shù)很多,樣本打不到要求,怎么辦?現(xiàn)實中存在這樣的問題嗎不同濃度成分相同的溶液,在
4、不同波長不同濃度成分相同的溶液,在不同波長x1、x2下下的吸光值的比值,溶液濃度變化,比值不變。的吸光值的比值,溶液濃度變化,比值不變。既既X1和和X2之間是線性相關的。之間是線性相關的。怎樣知道變量之間有相關性?答案:通過線性變化答案:通過線性變化主成分算法能解決這類問題主成分算法能解決這類問題死計算:檢查死計算:檢查XtX有沒有逆,沒逆,則線性相關有沒有逆,沒逆,則線性相關10主成份分析主成份分析 PCA Principle Component Analysis能有效的提取測量數(shù)據(jù)的有用信息能有效的提取測量數(shù)據(jù)的有用信息解決變量之間的相關性問題解決變量之間的相關性問題有效去除誤差,建立有效
5、的模型有效去除誤差,建立有效的模型11PCA分解算法原理分解算法原理采用非線性迭代偏最小二乘法采用非線性迭代偏最小二乘法(Nonlinear Iterative Partial Least Squares, NIPALS)方法方法分解量測矩陣分解量測矩陣S S = T Pt + E =tipi + E主成分示例主成分示例12方差最大方向方差最大方向NIPALS算法每次只求一個主成分,目前最大散差方向算法每次只求一個主成分,目前最大散差方向儀器的信噪比儀器的信噪比儀器測量時,信號強度要遠遠大于噪聲儀器測量時,信號強度要遠遠大于噪聲信號的數(shù)據(jù)的方差要遠遠大于噪聲的方差信號的數(shù)據(jù)的方差要遠遠大于噪聲
6、的方差所以,所以,PCA可以區(qū)別噪聲可以區(qū)別噪聲樣例樣例x0.91.10.80.87 22.21.92.1y1.21.00.92 1.11.81 1.91.72.5原數(shù)據(jù)圖PCA后15通過特征值比值判斷有效變量數(shù)通過特征值比值判斷有效變量數(shù)在在i/ i+i,應該達到最大應該達到最大值值根據(jù)根據(jù)i值,取值,取T和和P的前的前i列,即可扔掉噪聲列,即可扔掉噪聲16主成分回歸主成分回歸PCRPrinciple Component Regression是多元線性回歸!原來 Y=XA 現(xiàn)在 Y=TAT為X的主成分得分,即X經PCA分解后的得分因為T只是X的線性組合,提取了線性相關的部分,且只取前i列,所
7、以模型穩(wěn)定,去掉噪聲numpy中主成分中主成分分解分解SVD分解分解實矩陣的實矩陣的SVD(Singular Value Decomposition,奇,奇異值分解異值分解 )分解分解:分解結果:分解結果:A=USV其中其中S是對角矩陣是對角矩陣numpy中主成分中主成分分解分解-SVD程序代碼:程序代碼: B = np.linalg.svd(A,full_matrices=False)full_matrices=False一定要寫,否則會按復數(shù)一定要寫,否則會按復數(shù)分解分解分解結果:U=B0lamda=B1V = B2Lamda是所有的特征值,可以計算相鄰比值,決定主成分,它不是一個矩陣實例
8、光譜矩陣的SVD分解數(shù)據(jù):E:學校教學教改項目教材數(shù)據(jù)S-093790.txt是一個16*6的矩陣看看能求解個特征值?16個? 6個?96個?實例光譜矩陣的SVD分解data=np.mafromtxt(E:學校教學教改項目教材數(shù)據(jù)S-093790.txt)data=data.dataB = np.linalg.svd(data,full_matrices=False) B1array( 5.48250094e+00, 1.10440342e+00, 3.27012276e-01, 3.23153080e-03, 2.19720845e-03, 1.11546885e-03)實例光譜矩陣的SVD
9、分解 ld = B1 for i in range(len(ld)-1):temp = ldi/ldi+1print (temp)4.964219451633.37725370576101.1942313561.470743841531.96976226926矩陣中有3個有效特征值根據(jù)有效特征值,設定PCA的得分和載荷實例光譜矩陣的SVD分解根據(jù)主成分,規(guī)劃得分U和載荷矩陣PSVD :X=USVPCA:X=TPtT=US ,P=Vt i=len(lamda) S=np.zeros (i,i) S:i,:i=np.diag (lamda) T = np.dot (U,S)V=V.TP = VT
10、= T:,:kP = P:,:k可否編寫PCA類傳遞矩陣給類求得T、P矩陣,特征值比值列表根據(jù)特征值比值,規(guī)劃T和PPCA類import numpy as npclass PCA: def _init_(self, A): self.A=A def SVDdecompose(self): B = np.linalg.svd(self.A,full_matrices=False) U=B0 lamda=B1 V = B2 i=len(lamda) S=np.zeros (i,i) S:i,:i=np.diag (lamda)PCA類 self.T = np.dot (U,S) V=V.T sel
11、f.P = V compare= for i in range(len(lamda)-1): temp = lamdai/lamdai+1 compare.append(temp) return U,S,V,compare def PCAdecompose(self,k): T = self.T:,:k P = self.P:,:k return T,PPCA類調用p應該先調用decompose方法,根據(jù)返回的特征之比值,確定主成分p再調用PCAdecompose方法,設定得分和載荷矩陣主成分回歸原來 Y=XA現(xiàn)在 Y=TATtY=TtTATtT-1TtY=A求得最終的回歸系數(shù):主成分 X=T
12、Pt因為P是正交矩陣,所以 T=XPY=TA=XPA=XAnew主成分回歸數(shù)據(jù)E:學校教學pythonS-093843.txtE:學校教學pythonC-093843.txt求解方程 C=SAS是6*16的矩陣 所以StS的逆不存在S是光譜矩陣,光譜的不同波長間線性相關,所以可以用PCR程序代碼建模過程S=np.mafromtxt(“E:學校教學pythonS-093843.txt )S=S.dataC=np.mafromtxt(“E:學校教學pythonC-093843.txt )C=C.dataB = np.linalg.svd(data,full_matrices=False)U=B0l
13、amda=B1i=len(lamda)S=np.zeros (i,i)S:i,:i=np.diag (lamda)T = np.dot (U,S)V=B2程序代碼建模過程P=V.Tfor i in range(len(lmada)-1):temp = lamdai/lamdai+1print (temp)k=int(input(“主成分數(shù)為:”)T = T:,:kP = P:,:kTtT=np.dot(T.T,T)inv = np.linalg.inv(TtT)A=np.dot(inv, T.T)Alast=np.dot(P,A)程序代碼預報對新測定Snew:C=np.dot(Snew, Al
14、ast)擴展-能否用MLR、PCA類PCR類傳遞X,Y給PCRPCR內,以X調用PCA,確定主成分數(shù)根據(jù)確定的主成分數(shù),確定T、P,以T,Y建模,并結合P確定回歸系數(shù)建立預報方法。擴展-能否用MLR、PCA類PCR類import numpy as npfrom PCA import PCAfrom MLR import MLRclass PCR: def _init_(self,X,Y): self.X=X self.Y=Y def confirmPCs(self): pca=PCA(self.X) U,S,V,compare=pca.SVDdecompose() return compare擴展-能否用MLR、PCA類def model(self,PCs): pca=PCA(self.X) U,S,V,compare=pca.SVDdecompose() T,P=pca.PCAdecompose(PCs) mlr=MLR(T,self.Y) mlr.modelling() self.A=np.dot(P,mlr.A) def predict(self,Xnew): ans = np.dot(Xnew,self.A) return ans調用函數(shù)S=np.mafromt
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZZB Q071-2024 酶底物法微生物智能培養(yǎng)計數(shù)一體機
- T-ZJHIA 16-2024 特殊醫(yī)學用途配方食品臨床營養(yǎng)治療營養(yǎng)篩查數(shù)據(jù)集
- 二零二五年度離婚協(xié)議中夫妻共同財產清算補充協(xié)議
- 二零二五年度直播帶貨主播合作權益保障合同
- 2025年度智能制造合作伙伴協(xié)議書
- 二零二五年度木制家具生產廠木工用工協(xié)議書
- 二零二五年度車輛掛靠運輸合同車輛運輸合同安全保障協(xié)議
- 二零二五年度個人租賃帶太陽能熱水系統(tǒng)住宅合同
- 二零二五年度餐飲行業(yè)知識產權保護協(xié)議
- 二零二五年度兼職攝影師聘用合同模板
- 家校共育之道
- DeepSeek入門寶典培訓課件
- 西安2025年陜西西安音樂學院專職輔導員招聘2人筆試歷年參考題庫附帶答案詳解
- 《作文中間技巧》課件
- 廣東省2025年中考物理仿真模擬卷(深圳)附答案
- 2025屆八省聯(lián)考 新高考適應性聯(lián)考英語試題(原卷版)
- 新蘇教版一年級下冊數(shù)學第1單元第3課時《8、7加幾》作業(yè)
- 2024年山東電力高等專科學校高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 2024年電力交易員(高級工)職業(yè)鑒定理論考試題庫(單選題、多選題、判斷題)
- 《平面廣告賞析》課件
- 【公開課】同一直線上二力的合成+課件+2024-2025學年+人教版(2024)初中物理八年級下冊+
評論
0/150
提交評論