統(tǒng)計分析系統(tǒng)SAS軟件 第六章 線性相關(guān)、回歸分析與logistic回歸_第1頁
統(tǒng)計分析系統(tǒng)SAS軟件 第六章 線性相關(guān)、回歸分析與logistic回歸_第2頁
統(tǒng)計分析系統(tǒng)SAS軟件 第六章 線性相關(guān)、回歸分析與logistic回歸_第3頁
統(tǒng)計分析系統(tǒng)SAS軟件 第六章 線性相關(guān)、回歸分析與logistic回歸_第4頁
統(tǒng)計分析系統(tǒng)SAS軟件 第六章 線性相關(guān)、回歸分析與logistic回歸_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、協(xié)方差分析過程格式PROC GLM 選項;CLASS 變量表;MODEL 依變量=效應(yīng)/選項;MEANS 效應(yīng)/選項;LSMEANS 效應(yīng)/選項;PROC GLM 語句選項可設(shè)定分析數(shù)據(jù)集等;CLASS 指明分類變量,協(xié)方差分析時必須設(shè)定,必須在MODEL語句之前;MODEL 定義協(xié)方差分析的線性數(shù)學(xué)模型, model y=a t;一般的協(xié)方差分析模型 model y=t x(t);分離斜率模型 model y=t x x*t;共斜率模型 model后SOLUTION的選項給出參數(shù)的估計值MEANS 語句用于計算依變量的平均數(shù),選項用于多重比較;LSMEANS 語句計算效應(yīng)的最小二乘估計的平均

2、數(shù)(LSM) 選項E=效應(yīng),設(shè)定測驗誤差項,缺省為試驗分析誤差. STDERR給出LSM的標(biāo)準(zhǔn)誤, TDIEF, PDIEF要求顯示測驗H0:LSM(i)=LSM(j)的t值和概率值.應(yīng)用舉例單向分組資料的協(xié)方差分析兩向分組資料的協(xié)方差分析單因素試驗的協(xié)方差分析第六章 線性相關(guān)、回歸分析與logistic回歸相關(guān)分析(CORR)回歸分析(REG)廣義線型模型(GLM)REG過程 語法格式 語法說明 MODEL語句,必需語句,定義回歸分析模型 VAR語句為可選的,指定用于計算交叉積的變量 PLOT語句為可選的,用于繪制變量間的散點圖,還可添加回歸線。 【過程選項】OUTEST=數(shù)據(jù)集名 指定統(tǒng)計

3、量和參數(shù)估計輸出的新數(shù)據(jù)集名。 NOPRINT 禁止統(tǒng)計結(jié)果在OUTPUT視窗中輸出。 SIMPLE 輸出REG過程中所用的每個變量的基本統(tǒng)計量。 CORR 輸出MODEL語句或VAR語句中所列變量的相關(guān)矩陣。 ALL 等價于MODEL語句加上全部選項,即輸出該語句所有選項分析結(jié)果?!綧ODEL語句】 MODEL語句定義模型中的因變量、自變量、模型選項及結(jié)果輸出選項。語句中的變量只能是數(shù)據(jù)集中的變量,任何形式的變換都必須先產(chǎn)生一個新變量,然后用于分析。如X1的二次項,不能在模型中直接指定X1*X1,而要產(chǎn)生另一個新變量代表X1*X1,方可引入模型。MODEL語句中常用的選項NOINT 在模型中

4、不擬合常數(shù)項。 STB 輸出標(biāo)準(zhǔn)化回歸系數(shù)。 CLI 輸出個體預(yù)測值的95%可信區(qū)間上下限。 CLM 輸出因變量期望值(均值)的95%可信區(qū)間上下限。 R 輸出個體預(yù)測值、殘差及其標(biāo)準(zhǔn)誤。 P 輸出實際值Yi、預(yù)測值 和殘差等。如已選擇了CLI、CLM和R,則無需選擇P。【關(guān)鍵字】 結(jié)果解釋 如果在MODEL語句中使用CLI、CLM選項,則系統(tǒng)輸出因變量均值以及個體預(yù)測值的95可信區(qū)間上下限,輸出如下 CORR過程PROC CORR 選項 ;VAR 變量名列 ;1WITH 變量名列;2WEIGHT 變量名;FREQ 變量名;BY 變量名列;語法說明 除了PROC語句為必需,其他語句都是可選的,

5、如果省略所有的可選語句,則對所有變量作相關(guān)分析。VAR語句,可選的語句,定義相關(guān)分析的變量 WITH語句,可選的語句,定義分析相關(guān)性的另一組變量PROC CORR;VAR A B;WITH X Y Z ;結(jié)果解釋 例 下表給出了12名不同年齡(歲,X)婦女的收縮壓測量值(mmHg,Y),試進(jìn)行回歸分析。 (1) 制作散點圖;(2) 建立由X預(yù)報的回歸方程,制作回歸直線;(3) 對回歸方程及回歸系數(shù)b進(jìn)行假設(shè)檢驗;(4) 繪制的95可信區(qū)間;(5) 建立單個Y值的預(yù)報方程;(6) 計算積矩相關(guān)系數(shù),并進(jìn)行假設(shè)檢驗。多元線性回歸 REG過程: 只要把要分析的多個自變量名放在MODEL語句中應(yīng)變量后

6、即可。 語法選項 (MODEL語句選項)SELECTION=method,規(guī)定變量篩選的方法,method可以是以下幾種選項FORWARD(或F),前進(jìn)法,按照SLE規(guī)定的P值從無到有依次選一個變量進(jìn)入模型 BACKWARD(或B),后退法,按照SLS規(guī)定的P值從含有全部變量的模型開始,依次剔除一個變量 STEPWISE(或S),逐步法,按照SLE的標(biāo)準(zhǔn)依次選入變量,同時對模型中現(xiàn)有的變量按SLS的標(biāo)準(zhǔn)剔除不顯著的變量 MODEL語句選項NONE,即不選擇任何選項,不作任何變量篩選,此時使用的是含有全部自變量的全回歸模型MODEL語句選項SLE=概率值,入選標(biāo)準(zhǔn),規(guī)定變量入選模型的顯著性水平,

7、前進(jìn)法的默認(rèn)是0.5,逐步法是0.15 SLS=概率值,剔除標(biāo)準(zhǔn),指定變量保留在模型的顯著水平,后退法默認(rèn)為0.10,逐步法是0.15 標(biāo)準(zhǔn)化偏回歸系數(shù) STB 可用來比較各個自變量作用的大小 COLLIN 要求詳細(xì)分析自變量之間的共線性,給出信息矩陣的特征根和條件數(shù),來判斷自變量之間有無多重共線性。 應(yīng)用實例 現(xiàn)有20名糖尿病人的血糖(y,mmol/L)、胰島素(X1,mU/L)及生長素(X2,g/L)的測量數(shù)據(jù)列于中,試進(jìn)行多元線性回歸分析 程序如下 data bk4_1;input id y x1 x2; cards;proc reg data=bk4_1;model y=x1 x2/s

8、tb;model y=x1 x2/ selection=stepwise stb;run;程序運行的主要結(jié)果 相關(guān)和偏相關(guān)分析REG過程 logistic回歸 如果應(yīng)變量為分類的變量,則不符合一般回歸分析模型的要求,可用logistic回歸來分析。Logistic回歸按反應(yīng)變量的類型分為:兩分類的Logistic回歸 多分類有序反應(yīng)變量的Logistic回歸 多分類無序反應(yīng)變量的Logistic回歸按照設(shè)計類型可分為:非條件Logistic回歸,即研究對象未經(jīng)過配對條件Logistic回歸,即研究對象為1:1或1:m配對 語法格式 語法說明 LOGISTIC過程,用最大似然法對應(yīng)變量擬合一個L

9、ogistic模型。除了PROC 和MODEL語句為必需,其他都可省略?!具^程選項】OUTEST=數(shù)據(jù)集名 指定統(tǒng)計量和參數(shù)估計輸出的新數(shù)據(jù)集名。 NOPRINT 禁止統(tǒng)計結(jié)果在OUTPUT視窗中輸出。ORDER=DATA|FORMATTED|INTERNAL 規(guī)定擬和模型的應(yīng)變量的水平順序 DATA :應(yīng)變量的順序與數(shù)據(jù)集中出現(xiàn)的順序一致 FORMATTED:按照格式化值的順序,為默認(rèn)的選項,相當(dāng)于應(yīng)變量所賦值的大小順序 INTERNAL:按照非格式化值的順序DESCENDING|DES 顛倒應(yīng)變量的排列順序,如果同時指定了選項ORDER,則系統(tǒng)先按照ORDER規(guī)定的順序排列,然后則降序排列

10、。就是說,如果應(yīng)變量的賦值,死亡為1,存活0,為了得到死亡對存活的概率(或者說是死亡的風(fēng)險),應(yīng)選擇此選項,否則得到的是存活對死亡的概率?!綧ODEL語句】 MODEL語句指定模型的自變量、應(yīng)變量,模型選項及結(jié)果輸出選項,如要擬和交互作用項,需先產(chǎn)生一個表示交互作用的新變量??梢詳M合帶有一個或多個自變量的Logistic回歸模型,用最大似然估計法估計模型的參數(shù),打印出模型估計的過程和模型參數(shù)的可信區(qū)間。NOINT 在模型中不擬合常數(shù)項,在條件的Logistic回歸中用到。 SELECTION= FORWARD(或F)| BACKWARD(或B)| STEPWISE|SCORE 規(guī)定變量篩選的方

11、法,分別為向前、向后、逐步和最優(yōu)子集法。缺省時為NONE,擬合全回歸模型。 SLE=概率值,指定變量進(jìn)入模型的顯著水平,缺省為0.05 SLS=概率值,指定變量保留在模型的顯著水平,缺省為0.05 CL|WALDCL,要求估計所有回歸參數(shù)的可信區(qū)間 CLODDS=PL|WALD|BOTH, 要求計算OR值的可信區(qū)間 PLRL,對所有自變量估計OR的可信區(qū)間應(yīng)用實例 某工作者在探討腎細(xì)胞癌轉(zhuǎn)移的有關(guān)臨床病理因素研究中,收集了一批行根治性腎切除術(shù)患者的腎癌標(biāo)本資料,現(xiàn)從中抽取26例資料作為示例進(jìn)行l(wèi)ogistic回歸分析。 表中有關(guān)符號意義說明:i: 樣品序號x1:確診時患者的年齡(歲)x2:腎細(xì)胞癌血管內(nèi)皮生長因子(VEGF), 其陽性表述由低到高共3個等級x3:腎細(xì)胞癌組織內(nèi)微血管數(shù)(MVC)x4:腎癌細(xì)胞核組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論