![利用MATLAB進(jìn)行回歸分析_第1頁](http://file4.renrendoc.com/view/d0e2ca8c1f8cbcc79244a1b05f88f8a0/d0e2ca8c1f8cbcc79244a1b05f88f8a01.gif)
![利用MATLAB進(jìn)行回歸分析_第2頁](http://file4.renrendoc.com/view/d0e2ca8c1f8cbcc79244a1b05f88f8a0/d0e2ca8c1f8cbcc79244a1b05f88f8a02.gif)
![利用MATLAB進(jìn)行回歸分析_第3頁](http://file4.renrendoc.com/view/d0e2ca8c1f8cbcc79244a1b05f88f8a0/d0e2ca8c1f8cbcc79244a1b05f88f8a03.gif)
![利用MATLAB進(jìn)行回歸分析_第4頁](http://file4.renrendoc.com/view/d0e2ca8c1f8cbcc79244a1b05f88f8a0/d0e2ca8c1f8cbcc79244a1b05f88f8a04.gif)
![利用MATLAB進(jìn)行回歸分析_第5頁](http://file4.renrendoc.com/view/d0e2ca8c1f8cbcc79244a1b05f88f8a0/d0e2ca8c1f8cbcc79244a1b05f88f8a05.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 /19利用MATLAB進(jìn)行回歸分析一、實(shí)驗(yàn)?zāi)康模毫私饣貧w分析的基本原理,掌握MATLAB實(shí)現(xiàn)的方法;練習(xí)用回歸分析解決實(shí)際問題。二、實(shí)驗(yàn)內(nèi)容:題目1社會(huì)學(xué)家認(rèn)為犯罪與收入低、失業(yè)及人口規(guī)模有關(guān),對(duì)20個(gè)城市的犯罪率y(每10萬人中犯罪的人數(shù))與年收入低于5000美元家庭的百分比x】、失業(yè)率花和人口總數(shù)勺(千人)進(jìn)行了調(diào)查,結(jié)果如下表。序號(hào)yxiXr召序號(hào)y逅花X3111.216.56.25871114.518.16.07895213.420.56.46431226.923.17.4762340.726.39.36351315.719.15.8279345.316.55.36921436.22
2、4.78.6741524.819.27.312481518.118.66.5625612.716.55.96431628.924.98.3854720.920.26.419641714.917.96.7716835.721.37.615311825.822.48.692198.717.24.97131921.720.28.4595109.614.36.47492025.716.96.73353表12.26(1)若X廠X3中至多只許選擇2個(gè)變量,最好的模型是什么?(2)包含3個(gè)自變量的模型比上面的模型好嗎?確定最終模型。(3)對(duì)最終模型觀察殘差,有無異常點(diǎn),若有,剔除后如何。理論分析與程序設(shè)計(jì):
3、為了能夠有一個(gè)較直觀的認(rèn)識(shí),我們可以先分別作出犯罪率y與年收入低于5000美元家庭的百分比X】、失業(yè)率花和人口總數(shù)x3(千人)之間關(guān)系的散點(diǎn)圖,根據(jù)大致分布粗略估計(jì)各因素造成的影響大小,再通過逐步回歸法確定應(yīng)該選擇哪幾個(gè)自變量作為模型。編寫程序如下:clc;clearall;y=11.213.440.75.324.812.720.935.78.79.614.526.915.736.218.128.914.925.821.725.7;$犯罪率(人/十萬人)xl=1652D.526316.51921G.5二0221317.214318.123119118.624.917.922.420.216.9
4、;電低收入家庭百分比x2=6.26.49.35.37.35.96.47.64.96.46.07.45.88.66.58.38.68.46.7;*失業(yè)率x3=587643635692124864319641531713749789576227937416258547169215953353;*總?cè)丝跀?shù)(千人)figure(1),plot(xl,yzf*f);figure(2),plot(x2/yff*f);figure(3),plot(x3zy,f*1);Xl=xlTzx2f,x3f;stepwise(Xlzy)運(yùn)行結(jié)果與結(jié)論:4540353025201510161820222426010002
5、000300040006000600070008000犯罪率與低收入散點(diǎn)圖4511111111140-4-.35-*-30*25-*半-20*羋15-%*-+*10*51i111111114.555.566.517.588.599.5犯罪率與失業(yè)率散點(diǎn)圖45403530252015105犯罪率與人II總數(shù)散點(diǎn)圖3/19CoefficientswithErrorBarsCcefft-statp-valNextstep:Movenoterms /19III-223932154000459IIIIIIIWF14.398942.88230.0103IIIIIIIII-III00007629371199
6、0024802468X1X2X3UJi24G810低收入與失業(yè)率作為自變量1214丨III259552643G00.0000IIJ719823.08390.0071IIIIIII+IIIlliXIO.OOC4198060.54700.591568CoefficientswithErrorBarsCcefft-statp-valNextstep:MoveX2inintercept=-34.0725R-uare=0.801993F=34.4278RMSE=4.64640AdjR-sq=0776698p=1.05143e-C06ModelHistoryCoefficientswithErrorBar
7、sCcefft-statp-valNextstep:Movenoterms #/19CoefficientswithErrorBarsCcefft-statp-valNextstep:Movenoterms #/19Irtercept-31.2152陽-0.710325F-20.8433RMSE=5.82245AdjR-sq=0676247p=266827e-005ModalHistoryCoefficientswithErrorBarsCcefft-statp-valNextstep:Movenoterms #/19141G681012低收入與人II總數(shù)作為自變量Nextstep:Movei
8、n /19CoefficientswithErrorBarsCceffp-valX111921721226004”X2一.11117.351877.4620O.GOOOX3i1111111000C8266272184202S20246810intercept=-31.5998RMSE=5.04083R-uare=0.767157AdjR-sq=0709764F=28.0054p=416898e-CO6ModelHistoryIUiIiiiiiG-64Iif11*ITl-T*424681012141618失業(yè)率與人II總數(shù)作為自變量在圖中可以明顯看出前兩圖的線性程度很好,而第三個(gè)圖的線性程度較差
9、,從這個(gè)角度來說我們應(yīng)該以失業(yè)率和低收入為自變量建立模型。并且我們也可以從相關(guān)性角度來選取自變量,可以看出低收入與失業(yè)率作為自變量時(shí)的RMSE二4.64848;低收入與人口總數(shù)作為自變量時(shí)的RMSE二5.62245;失業(yè)率與人口總數(shù)作為自變量時(shí)的RMSE二5.04083o我們看到當(dāng)?shù)褪杖肱c失業(yè)率作為自變量時(shí)RMSE最小,因此如果選擇兩個(gè)變量作為自變量的會(huì),它們是最適合的。并且可以得到三者的關(guān)系為:y=-34.0725+1.22393馮+4.39894馮:對(duì)同時(shí)選取三個(gè)自變量的模型分析:如果我們將其三者同時(shí)選為自變量,我們發(fā)現(xiàn)RMSE二4.58978,比低收入與失業(yè)率二者作為自變量時(shí)稍微小了一點(diǎn)
10、,不過我們也發(fā)現(xiàn)此時(shí)的X3系數(shù)為0.00076937,幾乎為零,是可以忽略的,因此我們?nèi)匀贿x取兩個(gè)自變量做最終的模型。關(guān)系函數(shù)仍為:y=-34.0725+1.22393逅+4.39894馮Coefficientsv/ithErrorBarsCoefft-scatp-valNextstepMoveX3oui /1911;1119217212200497冷.11114.719823.08390007111*1Illi0000762937199002480X1X2X3Coefficientsv/ithErrorBarsCoefft-scatp-valNextstepMoveX3oui #/19Coe
11、fficientsv/ithErrorBarsCoefft-scatp-valNextstepMoveX3oui #/19Irtercepl=-38.7649R-squ6re=0.818318F=24.022RMSE=4.5897BAdjR陰=0.784252p=3.G29a3e-O36Coefficientsv/ithErrorBarsCoefft-scatp-valNextstepMoveX3oui #/19Coefficientsv/ithErrorBarsCoefft-scatp-valNextstepMoveX3oui /1942468101214161820低收入、失業(yè)率與人口總數(shù)
12、都作為自變量殘差分析:對(duì)我們?cè)O(shè)定的最終模型運(yùn)用殘差分析,編寫程序如下:clc;clearall;y=11.213.440.75.324.812.720.935.78.79.614.526.915.736.218.128.914.925.821.725.7;*犯罪率(人/十萬人)xl=16520526316519二1G.520221.317.214.318123119118.624.917.922.420.216.9;針氐收入家庭百分比x2=6.26.49.35.37.35.96.47.64.96.46.07.45.88.66.58.38.68.46.7;$失業(yè)率x3=5876436356921
13、24864319641531713749789576227937416258547169215953353;$總?cè)丝跀?shù)(千人)n=20;X2=ones(nz1)/xlf,x2f;bzbint,r,rintzs=regress(yffX2);rcoplot(rzrint)運(yùn)行結(jié)果如下: /19ResidualCaseOrderPlot1510S-Erlp一S芒5aseNumber161820我們應(yīng)該剔除第新的結(jié)果如下:18、20組數(shù)據(jù),剔除后,運(yùn)行源程序得到ResidualCaseOrderPlotS-Enp一sCDcr:-24-6-8O81012CaseNumb
14、er141618 /19這時(shí)我們?cè)谥貜?fù)本題開始時(shí)的做法,就可以得到最終的關(guān)系函數(shù)了。CoefficientswithErrorBarsCceff匸一p-val1Nextstep:X1111-60228141000009MovenotermsX211113.392593.32310.0046NextStep1aistepsX3111111*11X0.000286580.63910.5331E.poit.0123456Irtercept-35.7095R-sqg陽-0.912583F-78.3937RMSE=3.03AdjR-sq=0901041p=114353e-00810ModalHistor
15、yiI50-iiI-123剔除不符數(shù)據(jù)后再次運(yùn)行程序得到結(jié)果那么最終的函數(shù)關(guān)系便為:y=一35.7095+1.60228芻+3.39259馮簡要分析:從最終得到的結(jié)果上來看,失業(yè)率與低收入都將導(dǎo)致犯罪的上升。通過本道例題讓我們學(xué)會(huì)運(yùn)用逐步回歸命令stepwise來分析多自變量情況下的最優(yōu)模型問題,得到最優(yōu)模型后,我們?cè)龠\(yùn)用殘差法找到不符的數(shù)據(jù),將其剔除,這樣我們就會(huì)得到一個(gè)比較科學(xué)準(zhǔn)確的關(guān)系式,這個(gè)思路對(duì)我們分析回歸問題很有效。題目2一家洗衣粉制造公司新產(chǎn)品實(shí)驗(yàn)時(shí),關(guān)心洗衣粉泡沫的高度y與攪拌程度XI和洗衣粉用量X2之間的關(guān)系,其中攪拌程度從弱到強(qiáng)分為3個(gè)水平。實(shí)驗(yàn)得到的數(shù)據(jù)如下表:XIX2Y
16、1628.11732.31834.81938.211043.5XIX2Y2665.32767.72869.42972.221076.9XIX2Y3682.23785.33888.13990.731093.6表1230(1)將攪拌程度XI作為普通變量,建立y與XI和X2的回歸模型,從殘差圖上發(fā)現(xiàn)問題。(2)將攪拌程度XI視為沒有定量關(guān)系的3個(gè)水平,用0-1變量表示,建立回歸模型,與(1)比較,從殘差圖上還能發(fā)現(xiàn)什么問題。(3)加入攪拌程度與洗衣粉用量的交互項(xiàng),看看模型有無改進(jìn)。理論分析與程序設(shè)計(jì):仿照題目1中的程序,我們對(duì)攪拌程度(當(dāng)成普通變量)與洗衣粉用量建立回歸模型,并且進(jìn)行殘差分析。編寫程
17、序如下:clc;clearall;y=28132.334838243.5653W7769472276982285388193.6;$洗衣粉泡沫高度xl=l11112222233333;%攪拌程度x2=678910678910678910;$洗衣粉用量figure(1)/plot(xlzyr1*1);figure(2)/plot(x2,yr1*r);Xl=xlx2f;stepwise(Xlfy)運(yùn)行結(jié)果如下:100908070605040rint)運(yùn)行程序: /19CoefficientswithErrorBarsp-valX19402OOGNextStepX230866736469AlStep
18、sX3Nextstep:Movenoterms1010120130lrtercept=-12.74R-suare=0.965433F=167.575RMSE=4.63584AdjR-sq=0959672p=17C6e-C097002ModelHistory302010將攪拌程度為普通變量的運(yùn)行結(jié)果CoefficientswithErrorBarsCceffp-valX1I5288292.43420.0000X2-39483338.48640.0000X3-28416739.75570.0000X4,4-一0601667Y565000026X5-00.0000l.COOOX61Illi-1-0.13-064920540301020304050Nextstep:Movenoterms #/19 /19Irtercept-12.67R-sqg陽-0.99932F-21879.6RMS
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 干貨食品購銷合同書
- 高考藝術(shù)類考生數(shù)學(xué)考前突圍專題 算法初步與復(fù)數(shù)基礎(chǔ)篇 原卷
- 建設(shè)工程施工合同住建部模板
- 滅火藥劑與泡沫滅火
- 高考數(shù)學(xué)(理)一輪復(fù)習(xí)教案:第十三篇 推理證明、算法、復(fù)數(shù)第5講 復(fù) 數(shù)
- 《交通工具的使用》課件
- 預(yù)約合同司法認(rèn)定的解釋論重述
- L12相強(qiáng)化定向凝固高熵合金組織演變及力學(xué)性能研究
- 油墊結(jié)構(gòu)參數(shù)對(duì)靜壓推力軸承油膜剛度及形貌影響研究
- 暖氣清洗合同(2篇)
- 《立體倉庫鋼結(jié)構(gòu)貨架技術(shù)規(guī)范(征求意見稿)》
- 2024年貴州蔬菜集團(tuán)有限公司招聘筆試參考題庫附帶答案詳解
- 2024江蘇省四校聯(lián)考高三下學(xué)期開學(xué)考化學(xué)試題及答案
- 《玩手機(jī)的危害》課件
- 《社區(qū)康復(fù)》課件-第二章 社區(qū)康復(fù)的內(nèi)容
- 約束帶的健康宣教課件
- EAM資產(chǎn)管理的人工智能與大數(shù)據(jù)應(yīng)用
- 向流程設(shè)計(jì)要效率
- 安全文明施工的管理要點(diǎn)
- 中醫(yī)中風(fēng)病(腦梗死)診療方案
- GMP-基礎(chǔ)知識(shí)培訓(xùn)
評(píng)論
0/150
提交評(píng)論