SAS入門到精通第7章_第1頁
SAS入門到精通第7章_第2頁
SAS入門到精通第7章_第3頁
SAS入門到精通第7章_第4頁
SAS入門到精通第7章_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章回歸分析一元線性回歸多元線性回歸曲線回歸非線性回歸

Logistic回歸一、一元線性回歸1、根本模型一、一元線性回歸1、根本模型一、一元線性回歸2、模型的檢驗(yàn)一、一元線性回歸2、模型的檢驗(yàn)一、一元線性回歸3、利用回歸方程進(jìn)行預(yù)測一、一元線性回歸4、REG過程REG過程是SAS系統(tǒng)中提供的用于一般線性回歸的過程,通過此過程可以實(shí)現(xiàn)一元回歸分析,包括模型的建立和檢驗(yàn)等。REG過程中有很多的語句和選項(xiàng),其中用于一元回歸的根本語句格式為:PROCREGDATA=數(shù)據(jù)集名<選項(xiàng)>;MODEL因變量名=自變量名</選項(xiàng)>;PLOT縱軸變量名*橫軸變量名<=符號></選項(xiàng)>;BY分組變量名;RUN;其中,PROC語句和MODEL語句是必須的,其他語句可以根據(jù)用戶需要進(jìn)行選用。一、一元線性回歸4、REG過程語句說明:〔1〕PROC語句規(guī)定開始運(yùn)行REG過程并指定要分析的數(shù)據(jù)集名?!?〕MODEL語句用于規(guī)定回歸模型中的因變量和自變量。MODEL語句中常用的選項(xiàng)有:CLB——規(guī)定計(jì)算參數(shù)估計(jì)值的置信區(qū)間。CLI——規(guī)定計(jì)算預(yù)測值的置信區(qū)間。CLM——規(guī)定計(jì)算因變量估計(jì)值〔期望值〕的置信區(qū)間。P——規(guī)定計(jì)算預(yù)測值。ALPHA=值——規(guī)定顯著性水平?!?〕PLOT語句用于對兩個變量繪制散點(diǎn)圖,前一個變量為縱軸變量,后一個變量為橫軸變量。符號選項(xiàng)用來指定散點(diǎn)圖中表示點(diǎn)的符號。二、多元線性回歸1、根本模型二、多元線性回歸2、模型的檢驗(yàn)二、多元線性回歸2、模型的檢驗(yàn)二、多元線性回歸2、模型的檢驗(yàn)二、多元線性回歸3、逐步回歸在實(shí)際問題中,影響因變量的因素可能很多,其中有些因素的影響顯著,而有些因素的作用可以忽略,如何從大量的因素中挑出對因變量有顯著影響的自變量來,這就涉及到變量的選擇問題。逐步回歸是在建立模型的過程中對變量進(jìn)行逐個篩選的回歸方法,其根本思想是:在建立回歸模型時,逐個引入自變量,每次引入的變量都經(jīng)過檢驗(yàn)對因變量的影響是顯著的,同時對已有的變量也進(jìn)行檢驗(yàn),將不顯著的變量剔除。這樣最后得到的回歸方程中,所有變量都是顯著的。二、多元線性回歸3、逐步回歸二、多元線性回歸3、逐步回歸二、多元線性回歸4、回歸診斷回歸診斷的主要任務(wù)是檢驗(yàn)回歸假設(shè)是否成立,回歸模型的形式是否恰當(dāng),如何識別數(shù)據(jù)中的異常點(diǎn)等?;貧w診斷的根本方法包括殘差分析和共線性診斷。以殘差為縱坐標(biāo)、因變量的預(yù)測值為橫坐標(biāo)繪制散點(diǎn)圖,稱為殘差圖。表現(xiàn)在殘差圖中,數(shù)據(jù)點(diǎn)應(yīng)該對稱地緊密分布在橫軸附近,如果表現(xiàn)為其他異常的類型,那么模型或數(shù)據(jù)存在各種異常的情況。共線性是指在建立的回歸模型中出現(xiàn)幾個自變量高度相關(guān)的情況。自變量間的這種線性關(guān)系會掩蓋檢驗(yàn)的顯著性,造成模型的不穩(wěn)定,并可能引起估計(jì)值的較大誤差。共線性診斷就是要找出那些變量間存在共線性關(guān)系,然后采取相應(yīng)的方法來消除這些影響。判斷共線性的常用指標(biāo)有方差膨脹因子、條件指數(shù)和方差比例等。二、多元線性回歸5、REG過程REG過程具有強(qiáng)大的功能,可以實(shí)現(xiàn)多元回歸分析,包括模型建立、模型檢驗(yàn)、逐步回歸和回歸診斷等。REG過程的語句格式為:PROCREGDATA=數(shù)據(jù)集名<選項(xiàng)>;MODEL因變量名=自變量名列表</選項(xiàng)>;PLOT縱軸變量名*橫軸變量名<=符號></選項(xiàng)>;RUN;其中,PROC語句和MODEL語句是必須的,其他語句可以根據(jù)用戶需要進(jìn)行選用。二、多元線性回歸5、REG過程語句說明:〔1〕PROC語句規(guī)定開始運(yùn)行REG過程并指定要分析的數(shù)據(jù)集名?!?〕MODEL語句用于規(guī)定回歸模型中的因變量和所有要考慮的自變量。選項(xiàng):SELECTION=選項(xiàng)——規(guī)定逐步回歸中所采用的變量篩選方法COLLIN——規(guī)定進(jìn)行共線性分析VIF——規(guī)定計(jì)算方差膨脹因子〔3〕PLOT語句用于對兩個變量繪制散點(diǎn)圖。除了自變量和因變量外,PLOT語句還可以對一些重要統(tǒng)計(jì)量進(jìn)行繪圖以進(jìn)行更深入的分析和回歸診斷。當(dāng)使用這些統(tǒng)計(jì)量作為繪圖變量時,注意應(yīng)該在表示統(tǒng)計(jì)量的關(guān)鍵字后加一個圓點(diǎn)。二、多元線性回歸6、GLM過程GLM過程用來分析符合一般線性模型〔GeneralLinearModeling〕的數(shù)據(jù),利用該過程也可以實(shí)現(xiàn)一元線性回歸和多元線性回歸,其語句格式為:PROCGLMDATA=數(shù)據(jù)集名<選項(xiàng)>;MODEL因變量名=自變量名列表</選項(xiàng)>;BY分組變量名;RUN;其中,PROC語句和MODEL語句是必須的,其他語句可以根據(jù)用戶需要進(jìn)行選用。三、曲線回歸1、可化為線性的曲線回歸由于曲線回歸沒有固定的模型和方法,因而很難進(jìn)行處理和分析。但是對于一些根本的曲線模型,我們可以通過變換將它們轉(zhuǎn)化為線性模型,繼而利用線性回歸的方法進(jìn)行分析。三、曲線回歸2、REG過程由于局部曲線回歸可以轉(zhuǎn)化為線性回歸,所以利用REG過程就可以實(shí)現(xiàn)對轉(zhuǎn)換后的線性模型的擬合。其中,REG過程的語句和選項(xiàng)與直接實(shí)現(xiàn)線性回歸的情形完全相同。進(jìn)行這類曲線回歸的關(guān)鍵在于變量替換,這一步驟一般在數(shù)據(jù)步完成,根據(jù)變換形式建立新的變量,然后在過程步對新的變量建立線性回歸模型。三、曲線回歸3、GLM過程如果曲線回歸的模型是多項(xiàng)式形式,那么可以不進(jìn)行變量替換,使用GLM過程來直接擬合模型。GLM過程實(shí)現(xiàn)多項(xiàng)式曲線回歸的語句格式為:PROCGLMDATA=數(shù)據(jù)集名<選項(xiàng)>;MODEL因變量名=自變量效應(yīng)列表</選項(xiàng)>;RUN;GLM過程的語句說明和選項(xiàng)與線性回歸的情形完全相同,其中自變量效應(yīng)列表用于規(guī)定模型中自變量的形式。四、非線性回歸1、非線性模型四、非線性回歸2、迭代法在非線性回歸中,通常用迭代法來實(shí)現(xiàn)對非線性模型參數(shù)的最小二乘估計(jì),常用的迭代方法有:最速下降法〔SteepestDescent〕牛頓法〔Newton〕高斯-牛頓法〔Gauss-Newton〕Marquardt法四、非線性回歸3、NLIN過程N(yùn)LIN過程是SAS系統(tǒng)中專門用于實(shí)現(xiàn)非線性回歸的過程。由于非線性模型要比線性模型更難作出估計(jì),因此對于某些模型,NLIN過程并不能保證進(jìn)行成功的擬合。NLIN過程的語句格式為:PROCNLINDATA=數(shù)據(jù)集名<選項(xiàng)>;MODEL因變量名=表達(dá)式;PARAMETERS參數(shù)名=值;BOUNDS表達(dá)式;DER.參數(shù)名=表達(dá)式;DER.參數(shù)名.參數(shù)名=表達(dá)式RUN;其中PROC語句、MODEL語句和PARAMETERS語句是必須的,其他語句可根據(jù)用戶以及模型的需要而進(jìn)行選用。四、非線性回歸3、NLIN過程語句說明〔1〕PROC語句用于規(guī)定運(yùn)行NLIN過程,并制定要分析的數(shù)據(jù)集名。選項(xiàng)有:METHOD=選項(xiàng)——規(guī)定NLIN過程所使用的迭代方法。SMETHOD=選項(xiàng)——規(guī)定迭代過程中所使用的步長搜索方法?!?〕MODEL語句用于規(guī)定因變量和要擬合的模型表達(dá)式?!?〕PARAMETERS語句用于規(guī)定模型中的參數(shù)名,以及它們的初始值?!?〕BOUNDS語句用于限定參數(shù)估計(jì)的范圍?!?〕DER語句用來規(guī)定對參數(shù)的一階或二階導(dǎo)數(shù)的表達(dá)式。五、Logistic回歸1、根本模型LOGISTIC過程是SAS系統(tǒng)中專門用于實(shí)現(xiàn)Logistic回歸的過程。LOGISTIC過程的語句格式為:PROCLOGISTICDATA=數(shù)據(jù)集名<選項(xiàng)>;MODEL因變量名=自變量名列表;FREQ頻數(shù)變量名;BY分組變量名;RUN;其中,PROC語句和MODEL語句是必須的,其他語句可根據(jù)用戶以及模型的需要而進(jìn)行選用。五、Logistic回歸2、LOGISTIC過程語句說明為:〔1〕PROC語句用于規(guī)定運(yùn)行LOGISTIC過程,并指定要分析的數(shù)據(jù)集名?!?〕MODEL語句用于規(guī)定Logistic回歸模型中的因變量和自變量。其中,因變量可以是兩值變量或多值有序變量,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論