SAS第三十三課逐步回歸分析_第1頁(yè)
SAS第三十三課逐步回歸分析_第2頁(yè)
SAS第三十三課逐步回歸分析_第3頁(yè)
SAS第三十三課逐步回歸分析_第4頁(yè)
SAS第三十三課逐步回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

#/12程序的輸出包括所有只含一個(gè)變量的6種回歸,含2個(gè)變量的15種回歸,……??偣灿?3種不同形式的回歸模型。例如,含2個(gè)自變量按R2第二個(gè)大值選擇回歸模型為,R2=0.76142381,擬合的回歸模型為oxygen=93?0888—O?0735mnp“he—3?1402runtime若對(duì)每種變量個(gè)數(shù),只要保留R2最大的兩種情況,可在model語(yǔ)句中加入選項(xiàng)best=2,即提交procregdata二fitness;modeloxygen=ageweightrstpulsemaxpulserunpulseruntime/selection二rsquarebbest=2;run;這N二:31RegressionModelsforDependentVariable:OXYGENNumberinModel11R-square0.743380100.15838344ParameterRUNTIME-3.3106EstimatesIntercept82.421882.4582AGEWEIGHTRSTPULSEMAXPULSERUNPULSE-0.206820.7642469388.4623-0.1504-3.204020.7614238193.0888-0.0735-3.140230.81109446111.7-0.2564-0.1309-2.825430.8099884480.90080.3542-0.3751-2.970240.8368181598.1479-0.19770.2705-0.3481-2.7676表33.4只保留R2最大兩種情況的逐步回歸分析結(jié)果通過(guò)上面的逐步回歸分析,我們已經(jīng)得到回歸模型的自變量個(gè)數(shù)確定時(shí)的最優(yōu)子集或次優(yōu)子集,但問(wèn)題是我們到底應(yīng)該選擇幾個(gè)自變量的回歸模型呢?如上表33.4中的3個(gè)自變量、4個(gè)自變量、5個(gè)自變量、6個(gè)自變量的回歸模型中哪一個(gè)模型呢?一種最簡(jiǎn)便確定回歸模型的自變量個(gè)數(shù)的方法是Mallows的Cp方法。確定好模型的自變量個(gè)數(shù)后,根據(jù)上表33.4就很容易確定在這個(gè)固定自變量數(shù)下,最優(yōu)的自變量組合和相應(yīng)的參數(shù)值估計(jì)。以下的程序是對(duì)所有可能的回歸按C由小到大進(jìn)行排序并保留其前5種,并繪制C圖。PPgoptionsreset二globalgunit=pctcback二whiteborderhtitle=6htext=3ftext二swissbcolors=(back);

title'CpplotwithReferenceLines';procregdata二fitness;modeloxygen=ageweightrstpulsemaxpulserunpulseruntime

/selection二cpadjrsqbest=5;plotcp.*np./chocking二redcmallows二bluevaxis=0to15by2haxis=0to8by1;run;Model語(yǔ)句中的selection=cp選項(xiàng)請(qǐng)求計(jì)算Mallows的C統(tǒng)計(jì)量。選項(xiàng)adjrsq表示要顯示每種回歸模型的統(tǒng)計(jì)量Adj-R2。選項(xiàng)best=5表示保留Cp值最小的前5種。plot語(yǔ)句中的cp.*np.表達(dá)式(注意統(tǒng)計(jì)量關(guān)鍵字母后的小圓點(diǎn))表示Y軸為C值X軸為P值(P值包括截距項(xiàng))。plot語(yǔ)句的選項(xiàng)chocking=red,表示畫Cp=2P_P鐘紅色參考虛線,其中P是子模型中含截距的參數(shù)個(gè)數(shù),Pfull是全模型中不含截距的參數(shù)個(gè)數(shù)。Hoching(1976)建議選擇滿足CW2P—P且CWP的模型。plot語(yǔ)句的選項(xiàng)cmallows=blue,表示畫C=P藍(lán)色參考實(shí)線,pfullpp其中P是子模型中含截距的參數(shù)個(gè)數(shù)。Mallows(1973)建議考慮所有滿足C較小且接近P的模型。這一程序的輸出結(jié)果見(jiàn)表33.5和見(jiàn)圖33-1所示。"表33.5按C由小到大進(jìn)行排序并保留其前5種逐步回歸分析結(jié)果pc(p)N=31R-squareRegressionModelsforDependentVariable:OXYGENInAdjustedR-squareVariablesinModel4.766090.8368181540.81171325AGEMAXPULSERUNPULSERUNTIME5.000210.8480018150.81760218AGEWEIGHTMAXPULSERUNPULSERUNTIME6.752590.8369035950.80428431AGERSTPULSEMAXPULSERUNPULSERUNTIME6.827800.81109446―3—0.79010496AGERUNPULSERUNTIMECpplotwithReferenceLinesCQtYGEN=WQF4-C.2S9AJGE-0.0724WBGHT-OjOOCffinSTPULSE+GJ047MAXPULSE-0.3732RUNPULSERUNTIMEP31RsqRtMSE2.3321CQtYGEN=WQF4-C.2S9AJGE-0.0724WBGHT-OjOOCffinSTPULSE+GJ047MAXPULSE-0.3732RUNPULSERUNTIMEP31RsqRtMSE2.3321CP-PPlot十十十CP*PCP-PrCP2P—(Pforftillmod?I)+1圖33T帶有Mallows和Hocking參考線的Cp散點(diǎn)圖

從輸出結(jié)果可看出,以Mallows的建議為標(biāo)準(zhǔn),age,maxpulse,runpulse和runtime四個(gè)變量進(jìn)人回歸模型時(shí)C最小(4.76609),且與P=4+l=5最接近,因?yàn)?—4.76609<6—5.00021,所以應(yīng)該選擇Cp=4.76609的模型。以Hocking的建議為標(biāo)準(zhǔn),Cp=4.76609的模型不滿足要求,因?yàn)?.76609>2X5—6=4。而C=5.00021的模型滿足要求,因?yàn)?.00021<2X6—6=6且5.00021V6。而Cp=6.75259的模型:無(wú)論以Mallows的建議還是以Hocking的建議都不滿足要求。其實(shí)我們不必具體計(jì)算,只要看圖33-1中,表示Cp值大小位置的“+”

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論