實習(xí)四回歸分析_第1頁
實習(xí)四回歸分析_第2頁
實習(xí)四回歸分析_第3頁
實習(xí)四回歸分析_第4頁
實習(xí)四回歸分析_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、簡單線性回歸、多重線性回歸、簡單線性回歸、多重線性回歸、Logistic回歸、回歸、Cox回歸回歸盧潔盧潔Email: 鄭州大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室鄭州大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室實習(xí)四實習(xí)四 回歸分析回歸分析回歸分析回歸分析1個因變量個因變量Y1個自變量個自變量X 2個以上自變量個以上自變量XY是數(shù)值是數(shù)值變量變量Y是分類是分類型變量型變量兩個因變量兩個因變量(結(jié)局分類變量(結(jié)局分類變量+時間)時間)生存分析生存分析Cox回歸回歸一元回歸一元回歸Simple regression Logistic 回歸回歸Logistic regression 多重回歸多重回歸Multiple

2、regression 常用的回歸分析中分類:常用的回歸分析中分類:曲線回歸線性回歸回歸回歸分析分析簡單線性:簡單線性:多重線性:多重線性:logistic回歸回歸線性回歸線性回歸iiXXXY.22110kkkkxxxxkkeexXX1101101.1ln22110或110011)-1Ln(-)-1Ln()(LneORORXY只只1個個X: (簡單簡單)多個多個X:XXeeX0011ln0或Cox回歸回歸).exp()()(22110ppXXXththjjRRln)exp(jjRR實習(xí)內(nèi)容實習(xí)內(nèi)容u簡單回歸分析簡單回歸分析:例例10-1(P183,實驗實驗10-1)u多重回歸分析多重回歸分析:例

3、例11-1(P207,實驗實驗11-1)uLogistic回歸分析回歸分析: 例例18-1(P365,實驗實驗18-1);例例18-3(P366,實驗實驗18-3); 自選實習(xí)內(nèi)容:自選實習(xí)內(nèi)容:uCox回歸分析:回歸分析: 例例19-2(P390,實驗實驗19-2,實驗實驗19-3)(一)線性回歸分析(一)線性回歸分析例例12-1 :試對大氣污染一氧化氮(:試對大氣污染一氧化氮(NO)的濃度和汽)的濃度和汽車流量、氣溫、氣濕、風(fēng)速等的關(guān)系進(jìn)行回歸分析。車流量、氣溫、氣濕、風(fēng)速等的關(guān)系進(jìn)行回歸分析。例:例: 只考慮只考慮NO濃濃度和車流量的度和車流量的關(guān)系,問之間關(guān)系,問之間是否存在數(shù)量是否存

4、在數(shù)量依存關(guān)系?依存關(guān)系?1. 簡單線性回歸適用條件簡單線性回歸適用條件u僅適用于僅適用于1個因變量個因變量 x和和1個應(yīng)變量個應(yīng)變量 y。u要求數(shù)據(jù)滿足要求數(shù)據(jù)滿足線性線性、獨立性獨立性、正態(tài)性正態(tài)性、方方差齊性差齊性的要求。的要求。u注意樣本中的極端值,必要時可剔除或進(jìn)注意樣本中的極端值,必要時可剔除或進(jìn)行變量變換。行變量變換。簡單線性回歸簡單線性回歸(simple linar regression)線性回歸分析的步驟線性回歸分析的步驟:繪制繪制散點圖散點圖:1.線性趨勢?線性趨勢? 2. 異常值或強影響點?異常值或強影響點?估計回歸系數(shù)估計回歸系數(shù)b和常數(shù)項和常數(shù)項a回歸方程和回歸系數(shù)回

5、歸方程和回歸系數(shù) 的假設(shè)檢驗的假設(shè)檢驗參數(shù)估計參數(shù)估計:總體回歸系數(shù):總體回歸系數(shù)的區(qū)間估計的區(qū)間估計回歸方程的統(tǒng)計應(yīng)用回歸方程的統(tǒng)計應(yīng)用n方程:方差分析方程:方差分析n回歸系數(shù):回歸系數(shù):t 檢驗法檢驗法預(yù)測和控制、影響因素分析預(yù)測和控制、影響因素分析XbYa21)()(XXYYXXbiniii最小二乘估計最小二乘估計【電腦實現(xiàn)電腦實現(xiàn)】簡單線性回歸分析簡單線性回歸分析 1. 數(shù)據(jù)錄入數(shù)據(jù)錄入 2. 作散點圖:作散點圖: 3. 讀散點圖,作線性趨勢判斷:讀散點圖,作線性趨勢判斷:4.線性回歸分析線性回歸分析:SPSS電腦實現(xiàn)電腦實現(xiàn)5. 結(jié)果及結(jié)果輸出:結(jié)果及結(jié)果輸出: 回歸分析結(jié)果:回歸分

6、析結(jié)果:車流量158. 0135. 0 y1. 當(dāng)車流量為當(dāng)車流量為0時,空氣中時,空氣中NO濃度的預(yù)測值是濃度的預(yù)測值是 - 0.135,(顯然這只是個理論值,因為此值不可能為負(fù))(顯然這只是個理論值,因為此值不可能為負(fù))2.車流量每增加一個單位,空氣中車流量每增加一個單位,空氣中NO深度的預(yù)測值增加深度的預(yù)測值增加0.158。3.確定系數(shù)確定系數(shù)R2=65.27%,說明空氣中,說明空氣中NO濃度總變異的濃度總變異的65.27%與車流量有關(guān),說明車流量在空氣污染中影響還與車流量有關(guān),說明車流量在空氣污染中影響還是很大的。是很大的。統(tǒng)計應(yīng)用統(tǒng)計應(yīng)用預(yù)測:預(yù)測:當(dāng)車流量為當(dāng)車流量為1300輛,求

7、空氣中一氧輛,求空氣中一氧化氮化氮95%的容許區(qū)間。的容許區(qū)間。答答:XY1584. 01353. 0已知回歸方程已知回歸方程0707. 03 . 11584. 01353. 0YX=1.300時時:故空氣中故空氣中NO的的98%容許區(qū)間容許區(qū)間為為:62101467. 00000. 01124. 24035. 13 . 124110358. 0074. 20707. 0回歸方程應(yīng)用回歸方程應(yīng)用預(yù)測預(yù)測個體預(yù)測值個體預(yù)測值和和其其95%參考值區(qū)間參考值區(qū)間的保存的保存 統(tǒng)計應(yīng)用統(tǒng)計應(yīng)用控制控制:該城市為降低空氣中:該城市為降低空氣中NO的含量,擬的含量,擬對車流量進(jìn)行適當(dāng)?shù)目刂?,根?jù)空氣污染指

8、數(shù)分級,要對車流量進(jìn)行適當(dāng)?shù)目刂?,根?jù)空氣污染指數(shù)分級,要求空氣中氮氧化合物含量不超過求空氣中氮氧化合物含量不超過0.1000.15010-6 。XY1584. 01353. 0已知回歸方程已知回歸方程答答:千輛時當(dāng)千輛時當(dāng)801. 11584. 0/135. 0150. 010150. 0485. 11584. 0/135. 0100. 010100. 0162161,XY,XY故該城市單位時間內(nèi)車流量應(yīng)控制在故該城市單位時間內(nèi)車流量應(yīng)控制在1500輛以內(nèi),輛以內(nèi),最多不超過最多不超過1800輛,否則會導(dǎo)致輕度污染的發(fā)生。輛,否則會導(dǎo)致輕度污染的發(fā)生。例例12-1 :試對大氣污染一氧化氮(:

9、試對大氣污染一氧化氮(NO)的濃度和汽)的濃度和汽車流量、氣溫、氣濕、風(fēng)速等的關(guān)系進(jìn)行回歸分析。車流量、氣溫、氣濕、風(fēng)速等的關(guān)系進(jìn)行回歸分析。2. 多重線性回歸適用條件多重線性回歸適用條件u僅適用于僅適用于1個應(yīng)變量個應(yīng)變量 y和和多個因變量多個因變量 x。u要求要求1個應(yīng)變量個應(yīng)變量 y和和該組因變量該組因變量 x 間滿足間滿足線性線性、獨立性獨立性、正態(tài)性正態(tài)性、方差齊性方差齊性的要求。的要求。u注意樣本中的極端值,必要時可剔除或進(jìn)行變注意樣本中的極端值,必要時可剔除或進(jìn)行變量變換。量變換。多重線性回歸多重線性回歸(multiple linar regression)3. 多重線性回歸分析

10、的基本步驟: 估計b0、 b1、 b2 、bP最小二乘法回歸方程和系數(shù) 的假設(shè)檢驗列出回歸方程,統(tǒng)計應(yīng)用方差分析和 t 檢驗ppXbXbXbbY.22110預(yù)測和控制、影響因素分析關(guān)聯(lián)趨勢的圖形考察u確定變量篩選的方法u數(shù)據(jù)預(yù)處理:強影響點用多重共線性u模型診斷:殘差分析是否適合該模型(Line)建模準(zhǔn)備散點圖、散點圖矩陣、重疊/三維散點圖【電腦實現(xiàn)電腦實現(xiàn)】多重線性回歸分析多重線性回歸分析1.數(shù)據(jù)錄入數(shù)據(jù)錄入2. 散點圖矩陣散點圖矩陣圖形輸出:圖形輸出:【Method】(自變量的選入方法)(自變量的選入方法) Enter(強行進(jìn)入法)(強行進(jìn)入法) Stepwise(逐步法)(逐步法) Re

11、move(強制剔除法)(強制剔除法) Backward(向后法)(向后法) Forward(向前法)(向前法) 自變量篩選方法的選擇:自變量篩選方法的選擇:【Statistics 】Regression Coefficients:回歸系數(shù):回歸系數(shù)nEstimate:非標(biāo)準(zhǔn)化及標(biāo)準(zhǔn)化回歸系數(shù):非標(biāo)準(zhǔn)化及標(biāo)準(zhǔn)化回歸系數(shù)、標(biāo)準(zhǔn)誤,及其顯、標(biāo)準(zhǔn)誤,及其顯著性檢驗結(jié)果(著性檢驗結(jié)果(t值和值和P值)。值)。nConfidence intervals:非標(biāo)準(zhǔn)化回歸系數(shù)的:非標(biāo)準(zhǔn)化回歸系數(shù)的95%可信區(qū)間??尚艆^(qū)間。nModel fit:模型擬合優(yōu)度檢驗,給出復(fù)相關(guān)系數(shù):模型擬合優(yōu)度檢驗,給出復(fù)相關(guān)系數(shù)R

12、,決定系,決定系數(shù)數(shù)R2,調(diào)整,調(diào)整R2及方差分析結(jié)果及方差分析結(jié)果 nR squared change:每剔出或引入一個自變量所引趨同的:每剔出或引入一個自變量所引趨同的R2的變化量及相應(yīng)的的變化量及相應(yīng)的F值和值和P值。值。nDescriptives:輸出每個變量的均數(shù)、標(biāo)準(zhǔn)差,樣本容量,:輸出每個變量的均數(shù)、標(biāo)準(zhǔn)差,樣本容量,相關(guān)系數(shù)及單側(cè)檢驗相關(guān)系數(shù)及單側(cè)檢驗P值的矩陣。值的矩陣。 nPart and partial correlations:簡單相關(guān)系數(shù)及偏相關(guān)系數(shù)。:簡單相關(guān)系數(shù)及偏相關(guān)系數(shù)。nCollinearity diagnostics:輸出共線性診斷的統(tǒng)計量。:輸出共線性診

13、斷的統(tǒng)計量。Residuals:用于選擇輸出殘差診斷的信息:用于選擇輸出殘差診斷的信息All cases:給出所:給出所有觀察單位的殘差、標(biāo)準(zhǔn)化殘差和預(yù)測值。有觀察單位的殘差、標(biāo)準(zhǔn)化殘差和預(yù)測值?!綪lots】標(biāo)準(zhǔn)化殘差標(biāo)準(zhǔn)化殘差標(biāo)準(zhǔn)化預(yù)測值標(biāo)準(zhǔn)化預(yù)測值 1. 前提條件和殘差分析前提條件和殘差分析模型假設(shè)診斷模型假設(shè)診斷2. 多重共線性的問題多重共線性的問題3. 啞變量的設(shè)置啞變量的設(shè)置4.交互作用交互作用結(jié)果輸出:結(jié)果輸出:1.多重共線性分析的應(yīng)用條件診斷:多重共線性分析的應(yīng)用條件診斷:1. 線性和方差齊性:線性和方差齊性:殘差散點圖殘差散點圖 residual plot模型假設(shè)診斷:模型假

14、設(shè)診斷:LINE散點均勻分布在以散點均勻分布在以0 0為中心,與橫軸平為中心,與橫軸平行的帶狀區(qū)域內(nèi),可以認(rèn)為基本滿足線行的帶狀區(qū)域內(nèi),可以認(rèn)為基本滿足線性和方差齊性的假定條件。性和方差齊性的假定條件。散點呈現(xiàn)曲線趨勢,提示散點呈現(xiàn)曲線趨勢,提示資料不滿足線性的假定。資料不滿足線性的假定。散點隨預(yù)測值的變化散點隨預(yù)測值的變化而變化,提示資料不而變化,提示資料不滿足方差齊性的假定。滿足方差齊性的假定。散點隨預(yù)測值的變化而變化散點隨預(yù)測值的變化而變化且呈曲線趨勢,提示資料不且呈曲線趨勢,提示資料不滿足線性和方差齊性的假定。滿足線性和方差齊性的假定。SPSS電腦實現(xiàn)電腦實現(xiàn)3. 線性和方差齊性檢驗結(jié)

15、果線性和方差齊性檢驗結(jié)果殘差散點圖:殘差散點圖: 散點均勻分布在以散點均勻分布在以0為中心,與橫軸平行的帶狀區(qū)域為中心,與橫軸平行的帶狀區(qū)域內(nèi),可認(rèn)為基本滿足線性和方差齊性的假定條件。內(nèi),可認(rèn)為基本滿足線性和方差齊性的假定條件。2.正態(tài)性:正態(tài)性:殘差圖殘差圖residual plot 或或正態(tài)概率圖正態(tài)概率圖提示殘差滿提示殘差滿足正態(tài)分布足正態(tài)分布3. 獨立性:獨立性: 應(yīng)用應(yīng)用殘差圖殘差圖 或或Durbin-Watson統(tǒng)計量統(tǒng)計量判斷判斷 Durbin-Watson統(tǒng)計量的取值一般在統(tǒng)計量的取值一般在0-4之之間,如果殘差之間相互獨立,則取值在間,如果殘差之間相互獨立,則取值在2左右,左

16、右,如果取值接近如果取值接近0或或4,則提示不滿足獨立性。,則提示不滿足獨立性。SPSS電腦實現(xiàn)電腦實現(xiàn)M Mo od de el l S Su um mm ma ar ry yd d.808a.653.637.035801.851b.725.698.032640.887c.787.755.0293871.593Model123RR SquareAdjustedR SquareStd. Error ofthe EstimateDurbin-WatsonPredictors: (Constant), 車流量(X1)a. Predictors: (Constant), 車流量(X1), 風(fēng)速(X4

17、)b. Predictors: (Constant), 車流量(X1), 風(fēng)速(X4), 氣溫(X2)c. Dependent Variable: NO(Y)d. 3. 獨立性檢驗:獨立性檢驗: 若殘差之間相互獨立,則取值在若殘差之間相互獨立,則取值在2左右左右。11.3.3 多重共線性多重共線性在進(jìn)行多重線性回歸分析時,除了要滿足在進(jìn)行多重線性回歸分析時,除了要滿足LINE 外,外,還要求各變量之間不能存在共線性,即各變量之間還要求各變量之間不能存在共線性,即各變量之間要相互獨立。為此,需要進(jìn)行共線性診斷;要相互獨立。為此,需要進(jìn)行共線性診斷;當(dāng)自變量均為隨機變量時,若它們之間高度相關(guān),當(dāng)自

18、變量均為隨機變量時,若它們之間高度相關(guān),則稱變量間存在多重共線性則稱變量間存在多重共線性(multicollinearity);自自變量之間不存在多重共線性,即稱其互相獨立。變量之間不存在多重共線性,即稱其互相獨立。相關(guān)系數(shù)相關(guān)系數(shù) Correlation容忍度容忍度 Torelance方差膨脹因子方差膨脹因子 VIF條件數(shù)條件數(shù) Condition index方差比例方差比例Variance proportions, VP 方差相關(guān)矩陣方差相關(guān)矩陣Variance Matrix可用來判斷變量可用來判斷變量之間的獨立性、之間的獨立性、或說多重共線性或說多重共線性C Co or rr re el

19、 la at ti io on ns s1.000.808.017.279-.680.8081.000-.141.395-.568.017-.1411.000-.073.384.279.395-.0731.000-.146-.680-.568.384-.1461.000.000.468.094.000.000.255.028.002.468.255.368.032.094.028.368.247.000.002.032.247.24242424242424242424242424242424242424242424242424NO(Y)車流量(X1)氣溫(X2)氣濕(X3)風(fēng)速(X4)NO(Y

20、)車流量(X1)氣溫(X2)氣濕(X3)風(fēng)速(X4)NO(Y)車流量(X1)氣溫(X2)氣濕(X3)風(fēng)速(X4)Pearson CorrelationSig. (1-tailed)NNO(Y)車流量(X1)氣溫(X2)氣濕(X3)風(fēng)速(X4)如果兩個自變量之間的相關(guān)系數(shù)超過如果兩個自變量之間的相關(guān)系數(shù)超過0.9,則會帶來共,則會帶來共線性問題,如果在線性問題,如果在0.8以下,一般不會出現(xiàn)多大問題。以下,一般不會出現(xiàn)多大問題。共線性診斷1.兩個自變量之間的相關(guān)系數(shù)2.容忍度容忍度 Tolerance /方差膨脹因子 VIFC Co oe ef ff fi ic ci ie en nt ts s

21、a a-.135.035-3.829.001-.209-.062.158.025.8086.432.000.107.2101.0001.000-.050.049-1.027.316-.151.051.122.027.6234.476.000.065.179.6771.477-.025.011-.325-2.338.029-.048-.003.6771.477-.142.058-2.452.024-.263-.021.116.025.5924.699.000.065.168.6701.493-.035.010-.448-3.316.003-.057-.013.5831.716.004.002.2

22、732.430.025.001.008.8441.185(Constant)車流量(X1)(Constant)車流量(X1)風(fēng)速(X4)(Constant)車流量(X1)風(fēng)速(X4)氣溫(X2)Model123BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower BoundUpper Bound95% Confidence Interval for BToleranceVIFCollinearity StatisticsDependent Variable: NO(Y)a. 容忍度容忍度 =1/V

23、IF經(jīng)驗表明:經(jīng)驗表明:VIF大于大于5或或10時,存在嚴(yán)重的共線性;一時,存在嚴(yán)重的共線性;一般要求般要求Tolerance必須大于必須大于0.1,或,或 VIF必須小于必須小于10。C Co ol ll li in ne ea ar ri it ty y D Di ia ag gn no os st ti ic cs sa a1.9781.000.01.01.0229.566.99.992.7721.000.00.00.02.2173.574.00.04.48.01115.731.99.96.513.7551.000.00.00.01.00.2194.137.00.03.43.00.018

24、14.367.02.67.54.41.00722.717.97.30.02.58Dimension121231234Model123EigenvalueConditionIndex(Constant)車流量(X1)風(fēng)速(X4)氣溫(X2)Variance ProportionsDependent Variable: NO(Y)a. 3.條件數(shù)條件數(shù)condition index / 方差比例方差比例variance proportions, VP 一般地,當(dāng)一般地,當(dāng)條件數(shù)條件數(shù)大于大于10,且有兩個以上的自變量對,且有兩個以上的自變量對應(yīng)的應(yīng)的方差比例方差比例大于大于0.5時,可以認(rèn)為這些自

25、變量是嚴(yán)時,可以認(rèn)為這些自變量是嚴(yán)重相關(guān)的。重相關(guān)的。 2.多重線性回歸分析的結(jié)果輸出:多重線性回歸分析的結(jié)果輸出: 決定系數(shù)越大,說明構(gòu)建的回歸方程越好 Enter:強制引入法:強制引入法 未標(biāo)準(zhǔn)化的未標(biāo)準(zhǔn)化的 回歸系數(shù)及標(biāo)準(zhǔn)誤回歸系數(shù)及標(biāo)準(zhǔn)誤回歸系數(shù)回歸系數(shù)的的t t檢驗檢驗標(biāo)準(zhǔn)化的標(biāo)準(zhǔn)化的回歸系數(shù)回歸系數(shù)4321035. 0000006. 0004. 0116. 0142. 0 xxxxyM Mo od de el l S Su um mm ma ar ry yd d.808a.653.637.035801.851b.725.698.032640.887c.787.755.0293871

26、.593Model123RR SquareAdjustedR SquareStd. Error ofthe EstimateDurbin-WatsonPredictors: (Constant), 車流量(X1)a. Predictors: (Constant), 車流量(X1), 風(fēng)速(X4)b. Predictors: (Constant), 車流量(X1), 風(fēng)速(X4), 氣溫(X2)c. Dependent Variable: NO(Y)d. 決定系數(shù)越大,說明構(gòu)建的回歸方程越好。 STEPWISE:逐步回歸方程的決定系數(shù):逐步回歸方程的決定系數(shù)A AN NO OV VA Ad d.

27、0531.05341.376.000a.02822.001.08123.0592.02927.623.000b.02221.001.08123.0643.02124.687.000c.01720.001.08123RegressionResidualTotalRegressionResidualTotalRegressionResidualTotalModel123Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 車流量(X1)a. Predictors: (Constant), 車流量(X1), 風(fēng)速(X4)b. Predictor

28、s: (Constant), 車流量(X1), 風(fēng)速(X4), 氣溫(X2)c. Dependent Variable: NO(Y)d. STEPWISE:逐步回歸方程的方差分析表:逐步回歸方程的方差分析表C Co oe ef ff fi ic ci ie en nt ts sa a-.135.035-3.829.001-.209-.062.158.025.8086.432.000.107.210-.050.049-1.027.316-.151.051.122.027.6234.476.000.065.179-.025.011-.325-2.338.029-.048-.003-.142.058

29、-2.452.024-.263-.021.116.025.5924.699.000.065.168-.035.010-.448-3.316.003-.057-.013.004.002.2732.430.025.001.008(Constant)車流量(X1)(Constant)車流量(X1)風(fēng)速(X4)(Constant)車流量(X1)風(fēng)速(X4)氣溫(X2)Model123BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower BoundUpper Bound95% Confidence Inte

30、rval for BDependent Variable: NO(Y)a. 未標(biāo)準(zhǔn)化的未標(biāo)準(zhǔn)化的 回歸系數(shù)及標(biāo)準(zhǔn)誤回歸系數(shù)及標(biāo)準(zhǔn)誤回歸系數(shù)回歸系數(shù)的的t t檢驗檢驗標(biāo)準(zhǔn)化的標(biāo)準(zhǔn)化的回歸系數(shù)回歸系數(shù) STEPWISE:逐步回歸方程的參數(shù)估計:逐步回歸方程的參數(shù)估計421035. 0004. 0116. 0142. 0 xxxy 回歸分析結(jié)果回歸分析結(jié)果:421035. 0004. 0116. 0142. 0 xxxy2. 影響因素分析:根據(jù)影響因素分析:根據(jù)SPSS輸出結(jié)果,可以認(rèn)為車流輸出結(jié)果,可以認(rèn)為車流量、氣溫和風(fēng)速是影響空氣中量、氣溫和風(fēng)速是影響空氣中NO濃度的主要因素:濃度的主要因素:

31、u車流量增加車流量增加1千輛,估計千輛,估計NO濃度平均升高濃度平均升高0.11610-6;u氣溫上升氣溫上升1,估計,估計NO濃度平均升高濃度平均升高0.00410-6;u風(fēng)速增加風(fēng)速增加1m/s,估計,估計NO濃度平均減少濃度平均減少0.03510-6。3. 根據(jù)標(biāo)準(zhǔn)化偏回歸系數(shù),認(rèn)為作用車流量根據(jù)標(biāo)準(zhǔn)化偏回歸系數(shù),認(rèn)為作用車流量氣溫氣溫風(fēng)速。風(fēng)速。4. 根據(jù)確定系數(shù),方程根據(jù)確定系數(shù),方程3因素可解釋污染變異的因素可解釋污染變異的78.7%。1. 回歸方程回歸方程(二)(二)Logistic回歸分析回歸分析例例18-1 為了解某藥引發(fā)臨床上消化道出血情況,開展為了解某藥引發(fā)臨床上消化道出

32、血情況,開展了大樣本安全性評價?;仡櫺哉{(diào)查了大樣本安全性評價?;仡櫺哉{(diào)查47136例服用該藥例服用該藥的患者中,有的患者中,有155例上消化道出血;同期沒有服用該例上消化道出血;同期沒有服用該藥的藥的44634例對照中,有例對照中,有96例上消化道出血。例上消化道出血。X=1:服藥:服藥 X=0:未服藥:未服藥賦值:賦值: Y=1:有消化道出血:有消化道出血 Y=0:無消化道出血:無消化道出血3. logistic回歸模型擬合步驟:回歸模型擬合步驟: 估計參數(shù):估計參數(shù):0、 1 、 2、 i回歸方程的假設(shè)檢驗回歸方程的假設(shè)檢驗統(tǒng)計應(yīng)用統(tǒng)計應(yīng)用極大似然法極大似然法列出回歸方程列出回歸方程回歸系

33、數(shù)的區(qū)間估計回歸系數(shù)的區(qū)間估計1.檢驗整個模型檢驗整個模型 似然比檢驗似然比檢驗2.檢驗單個自變量檢驗單個自變量 Wald檢驗檢驗iiiiXXXXXXee.221102211011. 預(yù)測預(yù)測某陽性事件發(fā)生概率大小某陽性事件發(fā)生概率大小2. 分析影響因素分析影響因素,定量描述其作用,定量描述其作用【電腦實現(xiàn)電腦實現(xiàn)】SPSS1. 數(shù)據(jù)錄入數(shù)據(jù)錄入Logistic 回歸分析:回歸分析:注意:注意:一般將陽性事件定義為一般將陽性事件定義為1;陰性事件定義為;陰性事件定義為0。2. 數(shù)字加權(quán)數(shù)字加權(quán)3. SPSS過程過程Model SummaryModel Summary3452.912a.000.

34、003Step1-2 LoglikelihoodCox & SnellR SquareNagelkerkeR SquareEstimation terminated at iteration number 9 becauseparameter estimates changed by less than .001.a. 3. 結(jié)果及結(jié)果輸出:結(jié)果及結(jié)果輸出: Enter:強制進(jìn)入法:強制進(jìn)入法與線性回歸中的決與線性回歸中的決定系數(shù)有相似之處定系數(shù)有相似之處 -2倍的對數(shù)似然值,用來倍的對數(shù)似然值,用來表示模型的擬合效果,越接表示模型的擬合效果,越接近于與,說明效果越好。近于與,說明效果

35、越好。是是 Cox & Snell R square的的校正,取值校正,取值0-1,越接近,越接近1,說明方程的擬合效果越好。說明方程的擬合效果越好。Variables in the EquationVariables in the Equation.426.13010.7141.0011.531-6.140.1023611.0831.000.002服藥ConstantStep1aBS.E.WalddfSig.Exp(B)Variable(s) entered on step 1: 服藥.a. 回歸系數(shù)回歸系數(shù)回歸系數(shù)的回歸系數(shù)的Wald x2檢驗檢驗回歸系數(shù)回歸系數(shù)的標(biāo)準(zhǔn)誤的標(biāo)準(zhǔn)誤

36、Enter: 強制進(jìn)入法回歸方程的參數(shù)估計強制進(jìn)入法回歸方程的參數(shù)估計OR值值X426. 0140. 61ln列入方程:列入方程:XXee426.0140.6426.0140.61或或 常數(shù)項常數(shù)項是未服用該藥品人群是未服用該藥品人群“發(fā)生出血癥狀發(fā)生出血癥狀”優(yōu)勢估優(yōu)勢估計值的自然對數(shù)計值的自然對數(shù), 自變量自變量X的回歸系數(shù)的回歸系數(shù)是是優(yōu)勢比估計值的自然對數(shù)優(yōu)勢比估計值的自然對數(shù)。 1.樣本優(yōu)勢比樣本優(yōu)勢比OR值:值:exp(0.426)=1.5306; 3.總體總體OR的的95%置信區(qū)間為:置信區(qū)間為:1.1861.975, 置信區(qū)間下限大于置信區(qū)間下限大于1,因此服用非甾體抗炎藥是上

37、消化,因此服用非甾體抗炎藥是上消化道出血癥狀的危險因素。道出血癥狀的危險因素。X426. 0140. 61ln 回歸模型的解釋:回歸模型的解釋: 結(jié)果報告結(jié)果報告: 為評價服用非甾體類藥物是否引起消化道出血的癥狀,為評價服用非甾體類藥物是否引起消化道出血的癥狀,用回顧性調(diào)查的跟蹤調(diào)查了用回顧性調(diào)查的跟蹤調(diào)查了47136例服藥患者的消化道出血情例服藥患者的消化道出血情況,另外用況,另外用44634例未服藥的患者作為對照。例未服藥的患者作為對照。 logistic 回歸分析顯示:服用非甾體類藥物與消化道出血的回歸分析顯示:服用非甾體類藥物與消化道出血的癥狀有關(guān)(癥狀有關(guān)(P0.001),服藥組對非

38、服藥組的優(yōu)勢比為),服藥組對非服藥組的優(yōu)勢比為1.513,其其95%置信區(qū)間為置信區(qū)間為1.1861.975。variableCoefficient Stand errorWald x2POdd ratio95%CIalimentary tract hemorrhage0.4260.13010.7140.0011.5131.1861.975Constant-6.1400.1023611.0830.0000.002附表附表 非甾體類藥物與消化道出血的非甾體類藥物與消化道出血的logistic回歸分析結(jié)果回歸分析結(jié)果 性別性別 X1 年齡年齡 X2 年人均收入年人均收入 X3 醫(yī)療保障醫(yī)療保障 X

39、4 距就近醫(yī)療點時間距就近醫(yī)療點時間 X5 自感疾病嚴(yán)重程度自感疾病嚴(yán)重程度 X6 發(fā)病時間發(fā)病時間 X7 就診就診 Y (二)多自變量的(二)多自變量的LogisticLogistic回歸回歸例:研究居民兩周患病例:研究居民兩周患病未治療未治療的影響因素,采用多階段的影響因素,采用多階段分層整群抽樣,對某地分層整群抽樣,對某地11,790名居民進(jìn)行了調(diào)查,其中名居民進(jìn)行了調(diào)查,其中兩周患病者兩周患病者1649人,未就醫(yī)者人,未就醫(yī)者720人,試作回歸分析。人,試作回歸分析。 變變 量量 賦賦 值值X1 性別性別男:男:0,女:,女:1X2 年齡年齡5歲歲:1, 5歲歲:2, 15歲歲:3,

40、45歲歲:4, 65歲歲:5X3 年人均收入年人均收入不低于平均水平不低于平均水平:0,低于平均水平,低于平均水平:1X4 醫(yī)療保障醫(yī)療保障有有:0,無,無:1X5 距就近醫(yī)療點時間距就近醫(yī)療點時間10min:1 ,10min:2,30min:3X6 自感疾病嚴(yán)重程度自感疾病嚴(yán)重程度不嚴(yán)重不嚴(yán)重:1,一般,一般:2,嚴(yán)重,嚴(yán)重:3X7 發(fā)病時間發(fā)病時間急診病兩周內(nèi)發(fā)生急診病兩周內(nèi)發(fā)生:1,急診病兩周前發(fā)生延續(xù)到兩周內(nèi)急診病兩周前發(fā)生延續(xù)到兩周內(nèi):2,慢性病持續(xù)到兩周內(nèi)慢性病持續(xù)到兩周內(nèi):3Y 就診就診就診就診:0,未就診,未就診:1指標(biāo)賦值:指標(biāo)賦值:分類變量或分類變量或(名義變量)(名義變量

41、)【電腦實現(xiàn)電腦實現(xiàn)】SPSS1. 數(shù)據(jù)錄入數(shù)據(jù)錄入2. SPSS過程過程自變量的選入方法自變量的選入方法EnterForward: ConditionalForward: LRForward: WaldBackward: ConditionalBackward: LR1.Backward: Wald注意:基于條件參數(shù)估計(注意:基于條件參數(shù)估計(Condional)和偏最大似然估計)和偏最大似然估計(LR)的篩選方法都)的篩選方法都 比較可靠,尤以后者為佳;比較可靠,尤以后者為佳; 但基于但基于Wald檢驗的結(jié)果,因未考慮各因素的綜合作用,當(dāng)因素間存檢驗的結(jié)果,因未考慮各因素的綜合作用,當(dāng)因

42、素間存在共線性時要不可靠,應(yīng)慎用。在共線性時要不可靠,應(yīng)慎用。 ?!綧ethod】Enter:所有自變量強制進(jìn)入回歸方程;:所有自變量強制進(jìn)入回歸方程;Forward - Conditional:基于條件參數(shù)的向前:基于條件參數(shù)的向前逐步回歸法;逐步回歸法;Forward - LR:基于最大似然估計的向前逐步:基于最大似然估計的向前逐步回歸法;回歸法;Forward - Wald:基于:基于Ward統(tǒng)計量的向前逐步統(tǒng)計量的向前逐步回歸法;回歸法;Backward - Conditional:基于條件參數(shù)的向后:基于條件參數(shù)的向后逐步回歸法;逐步回歸法;Backward - LR:基于最大似然估

43、計的向后逐:基于最大似然估計的向后逐步回歸法;步回歸法;Backward - Wald:基于:基于Ward統(tǒng)計量的向后逐統(tǒng)計量的向后逐步回歸法;步回歸法;即:計算出來的即:計算出來的i是以該變量是以該變量的最后一個作為參照水平的最后一個作為參照水平 【 Categorical】如果自變量是無序分類變量(如血型等)如果自變量是無序分類變量(如血型等)和不等距有有序變量,須將其啞變量化,那么就要用該和不等距有有序變量,須將其啞變量化,那么就要用該按鈕將該變量指定為分類變量,如果有必要,可用里面按鈕將該變量指定為分類變量,如果有必要,可用里面的選擇按鈕進(jìn)行詳細(xì)的定義,如以哪個取值作為基礎(chǔ)水的選擇按鈕

44、進(jìn)行詳細(xì)的定義,如以哪個取值作為基礎(chǔ)水平,默認(rèn)的是以最大取值為基礎(chǔ)水平。平,默認(rèn)的是以最大取值為基礎(chǔ)水平。 【Option】:Removal: 設(shè)為設(shè)為0.05(和課本保持一致)(和課本保持一致)3. 結(jié)果輸出:(結(jié)果輸出:( Backward LR Method)賦賦值結(jié)果:值結(jié)果:“發(fā)病時間發(fā)病時間”啞變量化結(jié)果:啞變量化結(jié)果: 運行結(jié)果:運行結(jié)果: 對回歸模型對回歸模型假設(shè)檢驗:假設(shè)檢驗:727162340. 0500. 0609. 0233. 0467. 0)1ln(XXXXPP列方程:列方程:727162727162340. 0500. 0609. 0233. 0467. 0340.

45、 0500. 0609. 0233. 0467. 01XXXXXXXXeeP或:或:結(jié)果報告:結(jié)果報告: 為研究過去兩周內(nèi)患病居民未治療率的影響因素,采用為研究過去兩周內(nèi)患病居民未治療率的影響因素,采用現(xiàn)況調(diào)查方法,調(diào)查了過去兩周內(nèi)患病者現(xiàn)況調(diào)查方法,調(diào)查了過去兩周內(nèi)患病者1 649人,采用非條人,采用非條件件logistic回歸分析,向后逐步篩選變量,結(jié)果顯示:年齡、自回歸分析,向后逐步篩選變量,結(jié)果顯示:年齡、自感疾病嚴(yán)重程度和發(fā)病時間三個變量有統(tǒng)計學(xué)意義感疾病嚴(yán)重程度和發(fā)病時間三個變量有統(tǒng)計學(xué)意義( P0.001 ),OR值的估計值分別為值的估計值分別為1.262、0.544、0.606

46、(類別類別1與與3相比相比)和和0.712(類別(類別2與與3比),比),OR值的值的95%置信敬意分別為(置信敬意分別為(1.128,1.412)、()、(0.468、0.632)、()、(0.480,0.766)和()和(0.495,1.022)。)。variableCoefficient Stand errorWald x2POdd ratio95%CIalimentary tract hemorrhage0.4260.13010.7140.0011.5131.1861.975Constant-6.1400.1023611.0830.0000.002(四)(四)Cox 回歸分析回歸分析例:例:某醫(yī)院泌尿外科醫(yī)師對某醫(yī)院泌尿外科醫(yī)師對可能影響膀胱腫瘤術(shù)生生可能影響膀胱腫瘤術(shù)生生存的因素存的因素進(jìn)行了調(diào)查,選擇進(jìn)行了調(diào)查,選擇1996-2000年間手術(shù)治療的年間手術(shù)治療的膀胱

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論