




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、164 多元線性回歸 一元線性和非線性回歸辦法對(duì)單原因試驗(yàn)很管用,但是我們?cè)谠囼?yàn)中經(jīng)常碰到是多原因情況。譬如分析化學(xué)中常見多組分分析問題,如何做?老式辦法是采用化學(xué)掩蔽或分離等辦法,將其轉(zhuǎn)化為單原因進(jìn)行研究。但這樣經(jīng)常費(fèi)時(shí)費(fèi)力,還得到不一定是最好條件。尚有如前面提到均勻設(shè)計(jì)法數(shù)據(jù)分析,要求出多個(gè)原因最優(yōu)水平,如何做?在這時(shí)就必須采用多元回歸。第1頁第1頁2多元回歸有各種,除了多元線性、非線性回歸外,其它如化學(xué)計(jì)量學(xué)中主成份分析、偏最小二乘法、聚類分析等也是比較慣用回歸分析辦法。多元線性回歸是一個(gè)使用非常廣泛校正辦法,在均勻設(shè)計(jì)中就要用到。第2頁第2頁3對(duì)于一個(gè)多原因(X1、X2、Xn)試驗(yàn),試
2、驗(yàn)響應(yīng)指標(biāo)為Y,假如Y與各原因之間為線性關(guān)系,則有: (11) 這里,b0為常數(shù)項(xiàng),b1、bn稱為多元線性回歸偏回歸系數(shù)。和一元線性回歸辦法類似,用最小二乘法來擬定建立模型系數(shù),從而能夠建立起Y對(duì)Xi線性回歸方程。 第3頁第3頁4當(dāng)Xi取不同水平(如m個(gè)水平)時(shí),經(jīng)過試驗(yàn)?zāi)軌虻玫讲煌憫?yīng)指標(biāo)值Yi: (12) 注意這里mn1,想一想為何? 方程組(12)能夠用最小二乘法來擬定b0bn值。第4頁第4頁5即: (13) 同樣,為了得到極小值,對(duì)(13)式求導(dǎo): (14) 第5頁第5頁6方程組(14)可變形為: (14) (14)稱為正規(guī)方程組,其方程數(shù)目與未知數(shù)數(shù)目相等。 第6頁第6頁7方程組(1
3、4)右邊系數(shù)矩陣為: XTXm而左邊為: XTY第7頁第7頁8因此(14)式矩陣形式就是: XTYXTXB (15) 假如XTX逆矩陣(XTX)-1存在,則系數(shù)矩陣為: B(XTX)-1 XTY (16) 假如將(16)式代入(12)式,則有: YXBX(XTX)-1XTY (17) (17)式表示了試驗(yàn)值Yi與擬和值Yi關(guān)系,也許很靠近,也也許不相符,甚至相差很大。因而也需要對(duì)擬和結(jié)果進(jìn)行檢查。第8頁第8頁9對(duì)于多元回歸分析,通常采用復(fù)相關(guān)系數(shù)r來評(píng)價(jià)擬和值Yi和試驗(yàn)值Yi之間關(guān)系。 依據(jù)方差分析思想,將Y總差方和ssT(total)分解為兩部分,一部分是由自變量改變引起Y波動(dòng),即回歸差方和
4、ssReg(regression);另一部分是隨機(jī)誤差或其它未知原因引起波動(dòng),即殘余差平方和ssRes(residual)。 第9頁第9頁10(18) ssT、ssReg、ssRes自由度分別是m-1, n, 和m-n-1。 (19) r越靠近1,闡明Y與自變量相關(guān)性越好。 r在回歸分析中是非常主要指標(biāo)。 但是應(yīng)注意:r不但是回歸方程中自變量個(gè)數(shù)n函數(shù),還與觀測(cè)水平數(shù)m相關(guān)。當(dāng) m相對(duì)于n不很大時(shí),常有較大r,尤其是當(dāng)mn+1時(shí),即使n個(gè)自變量與y不相關(guān),也恒有r=1 (Q= 0)。因而在實(shí)際計(jì)算中,要注意m和n百分比問題。 普通認(rèn)為,m至少為n5倍。第10頁第10頁1165 多元非線性回歸
5、多元非線性回歸是另一個(gè)很慣用回歸辦法,其回歸原理也和一元非線性回歸相同。 普通有兩種辦法: (1) 變量代換法。 (2)非線性最小二乘法,它就是采用最小二乘法預(yù)計(jì)非線性模型中參數(shù),從而建立非線性回歸模型。 普通,當(dāng)我們不知道回歸模型時(shí),則多元非線性回歸可轉(zhuǎn)化成多元多次多項(xiàng)式進(jìn)行擬合,這是基于泰勒展開基礎(chǔ)。通過這樣轉(zhuǎn)換即可對(duì)其進(jìn)行多元非線性擬合 。第11頁第11頁1266 逐步回歸分析法簡介(stepwise regression) 在上一節(jié)中討論了多元回歸分析。當(dāng)我們不知道指標(biāo)(因變量)和多個(gè)原因(自變量)之間關(guān)系模型時(shí),如何進(jìn)行回歸分析? 尚有, 在一些實(shí)際問題中也許有這樣情況:參與回歸n個(gè)
6、變量x1、x2、 xn 中,單獨(dú)觀測(cè),有些原因與因變量y相關(guān)程度很密切,但當(dāng)綜合觀測(cè)n個(gè)原因與y相關(guān)性時(shí),這些原因也許顯得不太主要。第12頁第12頁13若把這些變量保留,不但增長計(jì)算工作量,并且會(huì)增長回歸方程不穩(wěn)定性,因此希望從n個(gè)變量中選出與y最密切、最具代表性變量來描述y改變情況。即希望所得回歸方程包括一切對(duì)y作用明顯原因,不包括對(duì)y不明顯變量。原因:這些原因與n個(gè)變量中其它變量之間本來就有相關(guān)關(guān)系,當(dāng)做回歸時(shí),它們對(duì)y作用被其它因子替換了。這時(shí)候就要用到逐步回歸分析法。逐步回歸分析是在多元回歸基礎(chǔ)上派生出來一個(gè)算法技巧。第13頁第13頁14逐步回歸辦法基本思想:對(duì)所有自變量x1,x2,.
7、,xn,按它們對(duì)Y奉獻(xiàn)大小進(jìn)行比較,并通過F檢查法,選擇偏回歸平方和明顯變量進(jìn)入回歸方程,每一步只引入一個(gè)變量,同時(shí)建立一個(gè)偏回歸方程。當(dāng)一個(gè)變量被引入后,對(duì)原已引入回歸方程變量,逐一檢查他們偏回歸平方和。假如由于引入新變量而使得已進(jìn)入方程變量變?yōu)椴幻黠@時(shí),則及時(shí)從偏回歸方程中剔除。上面簡介是“逐步引入”辦法。另外尚有“逐步剔除”、“有進(jìn)有出”等辦法。第14頁第14頁15自變量x明顯性如何檢查?假定在n個(gè)自變量中已經(jīng)建立了x1、x2、xL對(duì)y回歸方程,對(duì)各變量奉獻(xiàn)進(jìn)行比較,找出最小奉獻(xiàn)xj,要檢查xj明顯性,則可由xj對(duì)y方差奉獻(xiàn)Qj來衡量。通慣用Qj與x1、x2、xL整體方差Q之比Qj/Q來
8、量度。采用F檢查:FFa,闡明xj奉獻(xiàn)較大,保留;FFa,則剔除xj。第15頁第15頁16在引入了兩個(gè)自變量以后,便開始考慮是否有需要剔除變量。只有當(dāng)回歸方程中所有自變量對(duì)Y都有明顯影響而不需要剔除時(shí),再考慮從未選入方程自變量中,挑選對(duì)Y有明顯影響新變量進(jìn)入方程。無論引入還是剔除一個(gè)變量都稱為一步。這一過程不斷被重復(fù),直至無法剔除已引入變量,也無法再引入新自變量時(shí),逐步回歸過程結(jié)束。普通逐步回歸分析都需要借助專用軟件完畢。 第16頁第16頁17逐步回歸分析邏輯結(jié)構(gòu)圖輸入基本參數(shù)、讀入原始數(shù)據(jù)計(jì)算各變量均值、離差矩陣、相關(guān)矩陣開始逐步計(jì)算是否為前三步?是否引入處理剔除處理是否剔除?是否是否引入?
9、否結(jié)束處理,打印計(jì)算結(jié)果對(duì)相關(guān)陣進(jìn)行變換是否有待預(yù)報(bào)樣品?否結(jié)束預(yù)報(bào)計(jì)算是第17頁第17頁18多元線性回歸舉例。例14. 已知水泥在凝固過程中放出熱量y(J/g)與下列四種成份含量相關(guān):x1: 3CaOSiO2; x2: 2CaOSiO2; x3: 3CaOAl2O3; x4: 4CaOAl2O3Fe2O3;原始數(shù)據(jù)下列表:詳細(xì)處理見EXCEL表。第18頁第18頁19試驗(yàn)號(hào)mx1x2x3x4y(J/g)172666078.52129155274.331156820104.34113184787.6575263395.961155922105.27371176102.78131224472.59
10、254182293.1102147426115.911140233483.8121160912113.3131068812109.4第19頁第19頁2067 回歸分析法慣用軟件簡介 1. EXCEL2. Origin3. SPSS5. MatLab4. Dab/第20頁第20頁21第21頁第21頁22第22頁第22頁23第23頁第23頁24第24頁第24頁25第25頁第25頁26第26頁第26頁27第27頁第27頁28第28頁第28頁29SPSS(Statistical Package for the Social Science)社會(huì)科學(xué)應(yīng)用軟件包是世界上著名統(tǒng)計(jì)分析軟件之一。它和SAS(Statistical Analysis System,統(tǒng)計(jì)分析系統(tǒng))、BMDP(Biomedical Programs,生物醫(yī)學(xué)程序)并稱為國際上最有影響三大統(tǒng)計(jì)軟件。 Dab/浙江大學(xué), 唐啟義第29頁第29頁30MatLab Matlab是一個(gè)廣泛應(yīng)用于工程計(jì)算及數(shù)值分析領(lǐng)域新型高級(jí)語言。自 1984 年推向市場(chǎng)以來,歷經(jīng)二十多年發(fā)展與競爭,現(xiàn)已成為國際公認(rèn)最優(yōu)秀工程應(yīng)用開發(fā)環(huán)境。 在歐美各高等院校,Matlab 已經(jīng)成為線性代數(shù)、數(shù)值分析、數(shù)理統(tǒng)計(jì)、自動(dòng)控制理論、數(shù)字信號(hào)處理、時(shí)間序列分析、動(dòng)態(tài)系統(tǒng)仿
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- D打印技術(shù)在個(gè)性化教育資源的開發(fā)考核試卷
- 期刊出版論文的開源出版趨勢(shì)考核試卷
- 教育音像制品策劃與制作考核試卷
- 文具行業(yè)個(gè)性化服務(wù)考核試卷
- 工業(yè)園區(qū)電動(dòng)汽車充電需求分析考核試卷
- 健康生活方式與營養(yǎng)健康考核試卷
- 個(gè)人培訓(xùn)課件大全
- 買杭州新房合同范本
- 私人店鋪?zhàn)赓U合同范本
- 2025屆吉林省吉林地區(qū)高三上學(xué)期二模英語試題及答案
- GB/T 15934-2008電器附件電線組件和互連電線組件
- GA/T 765-2020人血紅蛋白檢測(cè)金標(biāo)試劑條法
- 第2章-西周-春秋戰(zhàn)國時(shí)期的音樂-1-3節(jié)課件
- 提高白云石配比對(duì)燒結(jié)生產(chǎn)的影響
- 公安基礎(chǔ)知識(shí)考試題庫(含各題型)
- 選礦試車方案
- 小課題專題研究參考題目
- 《最好的未來》合唱曲譜
- GB∕T 8081-2018 天然生膠 技術(shù)分級(jí)橡膠(TSR)規(guī)格導(dǎo)則
- 教學(xué)課件個(gè)人理財(cái)-2
- 航空航天概論(課堂PPT)
評(píng)論
0/150
提交評(píng)論