版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Poisson回歸回歸馮國(guó)雙馮國(guó)雙主要內(nèi)容主要內(nèi)容p一、二項(xiàng)分布與一、二項(xiàng)分布與Poisson分布分布p二、廣義線性模型二、廣義線性模型p三、三、Poisson回歸回歸p四四、Poisson回歸的回歸的SAS分析分析p五、五、Poisson回歸需注意的統(tǒng)計(jì)問(wèn)題回歸需注意的統(tǒng)計(jì)問(wèn)題二項(xiàng)分布二項(xiàng)分布p指指在只會(huì)產(chǎn)生兩種可能在只會(huì)產(chǎn)生兩種可能結(jié)果(如結(jié)果(如“陽(yáng)性陽(yáng)性”或或“陰陰性性”)的)的n次獨(dú)立試驗(yàn)中,當(dāng)每次試驗(yàn)的次獨(dú)立試驗(yàn)中,當(dāng)每次試驗(yàn)的“陽(yáng)性陽(yáng)性”概率保持不變時(shí),概率保持不變時(shí),出現(xiàn)出現(xiàn)“陽(yáng)性陽(yáng)性”的次數(shù)的次數(shù) X=0,1,2, ,n的一種概率分布的一種概率分布。pn為試驗(yàn)次數(shù),為試驗(yàn)次數(shù)
2、, 為為“陽(yáng)性陽(yáng)性”概率概率。 n,0,1,2,x )1(x)!-(nx!n! )1()(xnxxnxxnCxp表示從表示從n個(gè)不同元素中每次取出個(gè)不同元素中每次取出x個(gè)不同元素的組合個(gè)不同元素的組合Cxn二項(xiàng)分布二項(xiàng)分布二項(xiàng)分布的條件:二項(xiàng)分布的條件:1.每次每次試驗(yàn)只會(huì)發(fā)生兩種對(duì)立的結(jié)果之一,兩種互試驗(yàn)只會(huì)發(fā)生兩種對(duì)立的結(jié)果之一,兩種互斥結(jié)果的概率之和恒等于斥結(jié)果的概率之和恒等于1;2.每次試驗(yàn)產(chǎn)生某種結(jié)果(如每次試驗(yàn)產(chǎn)生某種結(jié)果(如“陽(yáng)性陽(yáng)性”)的概率)的概率固固定不變;定不變;3.各次試驗(yàn)是互相獨(dú)立的,即任何一次試驗(yàn)結(jié)果的各次試驗(yàn)是互相獨(dú)立的,即任何一次試驗(yàn)結(jié)果的出現(xiàn)不會(huì)影響其它試驗(yàn)結(jié)
3、果出現(xiàn)的概率。出現(xiàn)不會(huì)影響其它試驗(yàn)結(jié)果出現(xiàn)的概率。二項(xiàng)分布二項(xiàng)分布二項(xiàng)分布舉例:二項(xiàng)分布舉例:p假定某疫苗的不良事件發(fā)生率是假定某疫苗的不良事件發(fā)生率是10%,現(xiàn)在有,現(xiàn)在有3個(gè)個(gè)人接種了該疫苗,可能會(huì)出現(xiàn)的各種結(jié)局的概率人接種了該疫苗,可能會(huì)出現(xiàn)的各種結(jié)局的概率是多少?是多少?二項(xiàng)分布二項(xiàng)分布3個(gè)人中,個(gè)人中,k個(gè)人出現(xiàn)不良事件的概率為個(gè)人出現(xiàn)不良事件的概率為:二項(xiàng)分布二項(xiàng)分布p二項(xiàng)分布的概率分布:二項(xiàng)分布的概率分布:p在在n次獨(dú)立試驗(yàn)中,令次獨(dú)立試驗(yàn)中,令x表示事件表示事件A發(fā)生的次數(shù),發(fā)生的次數(shù),則隨機(jī)變量則隨機(jī)變量x所有可能的取值為所有可能的取值為0、1、2、,其概率函數(shù)為:其概率函數(shù)
4、為:p兩個(gè)參數(shù):兩個(gè)參數(shù):pn為試驗(yàn)次數(shù),為試驗(yàn)次數(shù), 為事件發(fā)生為事件發(fā)生率率。二項(xiàng)分布二項(xiàng)分布p二項(xiàng)分布的性質(zhì):二項(xiàng)分布的性質(zhì):p平均數(shù)平均數(shù) p = np標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差)1(n二項(xiàng)分布二項(xiàng)分布Poisson分布分布pPoisson分布主要用于描述單位時(shí)間、面積、體積分布主要用于描述單位時(shí)間、面積、體積等單位內(nèi)稀有事件個(gè)數(shù)的相對(duì)頻率。等單位內(nèi)稀有事件個(gè)數(shù)的相對(duì)頻率。pPoisson隨機(jī)變量隨機(jī)變量x的分布是:的分布是:p一個(gè)參數(shù)一個(gè)參數(shù)p0,是一常數(shù),是一常數(shù)Poisson分布分布Poisson分布分布的條件:的條件:1.試驗(yàn)是在給定的時(shí)間、面積、體積等單位內(nèi)發(fā)生試驗(yàn)是在給定的時(shí)間、面積、體
5、積等單位內(nèi)發(fā)生的事件次數(shù);的事件次數(shù);2.事件發(fā)生在給定的時(shí)間事件發(fā)生在給定的時(shí)間、面積、面積、體積等單位內(nèi)的體積等單位內(nèi)的概率對(duì)每一單位都是相同的;概率對(duì)每一單位都是相同的;3.發(fā)生在一個(gè)時(shí)間、面積、體積等單位的事件與發(fā)發(fā)生在一個(gè)時(shí)間、面積、體積等單位的事件與發(fā)生在其它單位的事件是互相獨(dú)立的生在其它單位的事件是互相獨(dú)立的Poisson分布分布Poisson分布的分布的條件示意圖:條件示意圖:Poisson分布分布pPoisson分布舉例:分布舉例:p為監(jiān)測(cè)飲用水的污染情況,某疾控中心對(duì)一社區(qū)為監(jiān)測(cè)飲用水的污染情況,某疾控中心對(duì)一社區(qū)的飲用水進(jìn)行檢測(cè),下面是每毫升飲用水的細(xì)菌的飲用水進(jìn)行檢測(cè),
6、下面是每毫升飲用水的細(xì)菌數(shù),試分析該結(jié)果是否服從數(shù),試分析該結(jié)果是否服從Poisson分布分布Poisson分布分布pdatadata aa;input x f;cards;0 2431 1202 313 6;procproc meansmeans mean var;freq f;var x;runrun;Poisson分布分布p計(jì)算計(jì)算Poisson分布分布 =1 =2 =3 =4Poisson分布分布 =5 =6負(fù)二項(xiàng)分布負(fù)二項(xiàng)分布負(fù)二項(xiàng)分布負(fù)二項(xiàng)分布Negative Binominal Distribution (NB):p負(fù)二項(xiàng)分布常用于度量某事件發(fā)生前所需要的時(shí)負(fù)二項(xiàng)分布常用于度量某
7、事件發(fā)生前所需要的時(shí)間長(zhǎng)度間長(zhǎng)度p如顧客一直排隊(duì)直到得到服務(wù)的時(shí)間,設(shè)備到失如顧客一直排隊(duì)直到得到服務(wù)的時(shí)間,設(shè)備到失效的時(shí)間等效的時(shí)間等p其結(jié)果與二項(xiàng)分布一樣,為兩類:發(fā)生和不發(fā)生其結(jié)果與二項(xiàng)分布一樣,為兩類:發(fā)生和不發(fā)生但描述的不是發(fā)生的次數(shù),而是直至發(fā)生時(shí)實(shí)驗(yàn)但描述的不是發(fā)生的次數(shù),而是直至發(fā)生時(shí)實(shí)驗(yàn)的次數(shù)的次數(shù)pkykykyYPyp)1 ()(111)1()(yyp負(fù)二項(xiàng)分布負(fù)二項(xiàng)分布p負(fù)二項(xiàng)分布的性質(zhì):負(fù)二項(xiàng)分布的性質(zhì):p均值均值p方差方差p很明顯看出,負(fù)二項(xiàng)分布的均值小于方差很明顯看出,負(fù)二項(xiàng)分布的均值小于方差負(fù)二項(xiàng)分布負(fù)二項(xiàng)分布)1( k22)1(kp負(fù)二項(xiàng)分布與負(fù)二項(xiàng)分布與Po
8、isson分布的關(guān)系:分布的關(guān)系:pPoisson分布中,設(shè)定分布中,設(shè)定是常數(shù),當(dāng)是常數(shù),當(dāng)不是常數(shù),而不是常數(shù),而是一個(gè)隨機(jī)變量,且服從是一個(gè)隨機(jī)變量,且服從分布時(shí),分布時(shí),此時(shí)復(fù)合此時(shí)復(fù)合Poisson分布就是負(fù)二項(xiàng)分布分布就是負(fù)二項(xiàng)分布p負(fù)二項(xiàng)分布中的負(fù)二項(xiàng)分布中的是變化的,換句話說(shuō),個(gè)體事是變化的,換句話說(shuō),個(gè)體事件發(fā)生的概率不等,有的出現(xiàn)的概率大,有的出件發(fā)生的概率不等,有的出現(xiàn)的概率大,有的出現(xiàn)概率小,從而導(dǎo)致方差變大。現(xiàn)概率小,從而導(dǎo)致方差變大。p實(shí)際意義也就是說(shuō),不同地區(qū)、時(shí)間等發(fā)生的概實(shí)際意義也就是說(shuō),不同地區(qū)、時(shí)間等發(fā)生的概率不等,有的發(fā)生概率高,有的發(fā)生概率低,可率不等
9、,有的發(fā)生概率高,有的發(fā)生概率低,可能存在一定的聚集性。能存在一定的聚集性。負(fù)二項(xiàng)分布負(fù)二項(xiàng)分布p負(fù)二項(xiàng)分布常用于:負(fù)二項(xiàng)分布常用于:p描述生物的聚集性,如釘螺在土壤的分布、昆蟲(chóng)描述生物的聚集性,如釘螺在土壤的分布、昆蟲(chóng)的空間分布等;醫(yī)學(xué)上描述傳染性疾病的分布和的空間分布等;醫(yī)學(xué)上描述傳染性疾病的分布和致病生物的分布。致病生物的分布。p需要注意:需要注意:p描述的事件發(fā)生率應(yīng)比較低,其描述的事件發(fā)生率應(yīng)比較低,其“單位單位”應(yīng)足夠應(yīng)足夠大大負(fù)二項(xiàng)分布負(fù)二項(xiàng)分布p離散參數(shù)(離散參數(shù)(dispersion parameter):pNB分布的均數(shù)與方差:分布的均數(shù)與方差:p令令 ,則,則px的均數(shù)為
10、:的均數(shù)為:p方差為:方差為:p將將k-1稱為離散參數(shù),當(dāng)稱為離散參數(shù),當(dāng)k-1趨于趨于0時(shí),負(fù)二項(xiàng)分布時(shí),負(fù)二項(xiàng)分布退化為退化為Poisson分布分布)1 ( k22)1 (k1kkk/)1(22負(fù)二項(xiàng)分布負(fù)二項(xiàng)分布廣義線性模型廣義線性模型p廣義線性模型廣義線性模型“廣廣”在什么在什么地方?地方?p主要主要是是“廣廣”在因變量上在因變量上。p廣義線性模型廣義線性模型是一般線性模型的推廣,一般線性模型中的是一般線性模型的推廣,一般線性模型中的因變量只能是定量因變量只能是定量變量變量p廣義線性模型廣義線性模型則拓寬了這一范圍,因變量不再僅限于定量則拓寬了這一范圍,因變量不再僅限于定量變量,還可以
11、是諸如二項(xiàng)分布、變量,還可以是諸如二項(xiàng)分布、Poisson分布、負(fù)二項(xiàng)分分布、負(fù)二項(xiàng)分布等非定量變量。布等非定量變量。廣義線性模型廣義線性模型p廣義線性模型(廣義線性模型(Generalized Linear Model)p其中,等式右邊是自變量其中,等式右邊是自變量x1,x2,xm,可以是一,可以是一個(gè),也可以是多個(gè),形式可以是分類的,也可以是定個(gè),也可以是多個(gè),形式可以是分類的,也可以是定量的量的。p等式等式左邊是一個(gè)聯(lián)接函數(shù),通過(guò)指定聯(lián)接函數(shù)及數(shù)據(jù)左邊是一個(gè)聯(lián)接函數(shù),通過(guò)指定聯(lián)接函數(shù)及數(shù)據(jù)分布,廣義線性模型可轉(zhuǎn)化成相應(yīng)的具體模型分布,廣義線性模型可轉(zhuǎn)化成相應(yīng)的具體模型。mmxxx)(g2
12、211廣義線性模型廣義線性模型p常用的聯(lián)接函數(shù)常用的聯(lián)接函數(shù)分布分布聯(lián)接函數(shù)聯(lián)接函數(shù)數(shù)學(xué)表達(dá)式數(shù)學(xué)表達(dá)式模型模型正態(tài)分布恒等函數(shù)g()= 線性回歸模型二項(xiàng)分布Logit 函數(shù)g()= ln(/1-) logistic 回歸模型Poisson分布對(duì)數(shù)g()= ln()Poisson 回歸模型廣義線性模型廣義線性模型p當(dāng)指定分布為正態(tài)(當(dāng)指定分布為正態(tài)(normal)分布,且聯(lián)接函數(shù)直接就是)分布,且聯(lián)接函數(shù)直接就是時(shí),廣義線性模型就成了多重線性回歸模型。時(shí),廣義線性模型就成了多重線性回歸模型。p當(dāng)指定分布為二項(xiàng)(當(dāng)指定分布為二項(xiàng)(binomial)分布,指定聯(lián)接函數(shù)為)分布,指定聯(lián)接函數(shù)為log
13、it()即即 時(shí),廣義線性模型就是時(shí),廣義線性模型就是logistic回歸模型。回歸模型。p當(dāng)指定分布為當(dāng)指定分布為Poisson分布,聯(lián)接函數(shù)為分布,聯(lián)接函數(shù)為log()時(shí),廣義線時(shí),廣義線性模型就轉(zhuǎn)化成性模型就轉(zhuǎn)化成Poisson回歸模型?;貧w模型。p當(dāng)指定分布為負(fù)二項(xiàng)(當(dāng)指定分布為負(fù)二項(xiàng)(negative binomial)分布,聯(lián)接函)分布,聯(lián)接函數(shù)為數(shù)為log()時(shí),廣義線性模型就轉(zhuǎn)化為負(fù)二項(xiàng)回歸。時(shí),廣義線性模型就轉(zhuǎn)化為負(fù)二項(xiàng)回歸。p廣義線性模型更進(jìn)一步地將多重線性回歸、廣義線性模型更進(jìn)一步地將多重線性回歸、logistic回歸、回歸、Poisson回歸、負(fù)二項(xiàng)回歸等統(tǒng)一回歸、負(fù)二
14、項(xiàng)回歸等統(tǒng)一起來(lái)起來(lái)Poisson回歸回歸模型模型pPoisson回歸常用于單位時(shí)間或單位空間內(nèi)某稀有事件發(fā)回歸常用于單位時(shí)間或單位空間內(nèi)某稀有事件發(fā)生數(shù)的影響因素生數(shù)的影響因素分析分析p醫(yī)學(xué)醫(yī)學(xué)中有不少現(xiàn)象均符合這種條件,尤其在腫瘤隊(duì)列研究中有不少現(xiàn)象均符合這種條件,尤其在腫瘤隊(duì)列研究中中,如如對(duì)淺表性胃炎病人長(zhǎng)期隨訪一段時(shí)間后的胃癌發(fā)生對(duì)淺表性胃炎病人長(zhǎng)期隨訪一段時(shí)間后的胃癌發(fā)生數(shù)數(shù)。p這種數(shù)據(jù)也這種數(shù)據(jù)也稱之為事件數(shù)資料(稱之為事件數(shù)資料(count data)。其特征就)。其特征就是發(fā)生數(shù)能夠一個(gè)一個(gè)地清點(diǎn)(是發(fā)生數(shù)能夠一個(gè)一個(gè)地清點(diǎn)(counting),不能有小數(shù)),不能有小數(shù)點(diǎn)。點(diǎn)
15、。Poisson回歸回歸模型模型pPoisson回歸模型的表達(dá)形式為:回歸模型的表達(dá)形式為:p系數(shù)系數(shù)i表示表示xi每每增加一個(gè)單位,增加一個(gè)單位,log()的變動(dòng)的變動(dòng)p或者說(shuō)或者說(shuō)xi每增加一個(gè)單位每增加一個(gè)單位, 對(duì)對(duì)產(chǎn)生產(chǎn)生ei的效應(yīng)的效應(yīng)mmxxx2211)log(Poisson回歸回歸模型模型pPoisson回歸的應(yīng)用條件:回歸的應(yīng)用條件:p線性:因變量的對(duì)數(shù)與自變量呈線性關(guān)系線性:因變量的對(duì)數(shù)與自變量呈線性關(guān)系p獨(dú)立性:各觀測(cè)之間相互獨(dú)立獨(dú)立性:各觀測(cè)之間相互獨(dú)立p方差等于均值:各自變量水平上的因變量的方差方差等于均值:各自變量水平上的因變量的方差與均值相等與均值相等Poisso
16、n回歸回歸模型模型pPoisson回歸回歸模型模型p參數(shù)檢驗(yàn):參數(shù)檢驗(yàn):(1)Wald檢驗(yàn)檢驗(yàn): 檢驗(yàn)回歸系數(shù)檢驗(yàn)回歸系數(shù)是否為是否為零零 。22)( WaldjjsePoisson回歸回歸模型模型p參數(shù)檢驗(yàn):參數(shù)檢驗(yàn):(2)似然比檢驗(yàn))似然比檢驗(yàn)(likelihood ratio test)p比較比較兩個(gè)嵌套模型的對(duì)數(shù)似然值兩個(gè)嵌套模型的對(duì)數(shù)似然值p似然比統(tǒng)計(jì)量服從似然比統(tǒng)計(jì)量服從2分布,其自由度為兩個(gè)模型分布,其自由度為兩個(gè)模型自變量數(shù)的差值,根據(jù)自變量數(shù)的差值,根據(jù)2值和相應(yīng)的自由度可計(jì)值和相應(yīng)的自由度可計(jì)算出算出P值值Poisson回歸回歸模型模型p模型評(píng)價(jià):模型評(píng)價(jià):pPearson
17、 2 比較期望值比較期望值和觀測(cè)值的和觀測(cè)值的差別差別pyi表示不同自變量組合水平下的觀測(cè)數(shù),表示不同自變量組合水平下的觀測(cè)數(shù), i表示表示期望數(shù),期望數(shù),V (i)表示方差表示方差JjjjjjVyw12)()(Poisson回歸回歸模型模型p模型評(píng)價(jià):模型評(píng)價(jià):pDeviance比較飽和模型和現(xiàn)有模型的差別比較飽和模型和現(xiàn)有模型的差別pLs表示現(xiàn)有模型,表示現(xiàn)有模型,Lf表示飽和模型表示飽和模型p飽和模型解釋了模型系統(tǒng)部分的所有變動(dòng),反映飽和模型解釋了模型系統(tǒng)部分的所有變動(dòng),反映一種一種理想狀態(tài)。理想狀態(tài)。pDeviance值越小,現(xiàn)有模型與飽和模型的偏差越小,值越小,現(xiàn)有模型與飽和模型的偏
18、差越小,擬合效果越好。擬合效果越好。)ln(ln2)ln(2fsfsLLLLDPoisson回歸回歸模型模型pPoisson回歸回歸模型模型p模型診斷:模型診斷:p多重共線性多重共線性(multi-collinearity)p容忍容忍度度(tolerance):小于:小于0.1時(shí),可能存在共線性時(shí),可能存在共線性p方差擴(kuò)大因子方差擴(kuò)大因子(variance inflation factor, VIF):大于:大于10時(shí),可能存在共線時(shí),可能存在共線性性p分類分類資料最好不用條件指數(shù)資料最好不用條件指數(shù)Poisson回歸回歸模型模型p模型診斷:模型診斷:p異常點(diǎn)診斷異常點(diǎn)診斷p離離群點(diǎn)群點(diǎn)(ou
19、tliers):因變量預(yù)測(cè)值與實(shí)際值差別較大。:因變量預(yù)測(cè)值與實(shí)際值差別較大。 診斷指標(biāo):診斷指標(biāo):Pearson殘差、殘差、Deviance殘差殘差p杠桿點(diǎn)杠桿點(diǎn)(high leverage points):自變量遠(yuǎn)離其它值。:自變量遠(yuǎn)離其它值。 診斷指標(biāo):杠桿值診斷指標(biāo):杠桿值hip強(qiáng)影響點(diǎn)強(qiáng)影響點(diǎn)(influential points):對(duì)模型估計(jì)影響較大。:對(duì)模型估計(jì)影響較大。 診斷指標(biāo):診斷指標(biāo):DFBETA,Cook距離(距離(Cooks Distance)Poisson回歸回歸模型模型pkk/)1(22Poisson回歸回歸模型模型p廣義線性模型在廣義線性模型在SAS中可通過(guò)中可
20、通過(guò)proc genmod命令實(shí)現(xiàn)。其命令實(shí)現(xiàn)。其常用語(yǔ)句有:常用語(yǔ)句有:pProc genmod ;pClass 分類變量分類變量;pModel 因變量因變量=自變量自變量;pWeight 變量變量:pRun;Poisson回歸回歸模型模型pModel語(yǔ)句常用的選項(xiàng)有:語(yǔ)句常用的選項(xiàng)有:指定分布和聯(lián)接函數(shù)的選項(xiàng)指定分布和聯(lián)接函數(shù)的選項(xiàng)Dist=該選項(xiàng)指定數(shù)據(jù)分布,常用的分布有:該選項(xiàng)指定數(shù)據(jù)分布,常用的分布有:binomial(二項(xiàng)分(二項(xiàng)分布,默認(rèn)聯(lián)接為布,默認(rèn)聯(lián)接為logit)、)、poisson(Poisson分布,默認(rèn)聯(lián)接分布,默認(rèn)聯(lián)接為為log)、)、negbin(負(fù)二項(xiàng)分布,默認(rèn)
21、聯(lián)接為(負(fù)二項(xiàng)分布,默認(rèn)聯(lián)接為log)、)、normal(正態(tài)分布,默認(rèn)聯(lián)接為(正態(tài)分布,默認(rèn)聯(lián)接為identity)、)、multinomial(多項(xiàng)分布,默認(rèn)聯(lián)接為(多項(xiàng)分布,默認(rèn)聯(lián)接為cumlogit,即累積,即累積logit)Link=該選項(xiàng)指定與分布對(duì)應(yīng)的聯(lián)接函數(shù),常用的有:該選項(xiàng)指定與分布對(duì)應(yīng)的聯(lián)接函數(shù),常用的有:logit(對(duì)(對(duì)應(yīng)二項(xiàng)分布)、應(yīng)二項(xiàng)分布)、log(對(duì)應(yīng)(對(duì)應(yīng)Poisson分布和負(fù)二項(xiàng)分布)、分布和負(fù)二項(xiàng)分布)、identity(對(duì)應(yīng)正態(tài)分布)、(對(duì)應(yīng)正態(tài)分布)、cumlogit(對(duì)應(yīng)多項(xiàng)分布,用(對(duì)應(yīng)多項(xiàng)分布,用于多分類于多分類logit模型)模型)Poisso
22、n回歸回歸模型模型pModel語(yǔ)句常用的語(yǔ)句常用的選項(xiàng):選項(xiàng):結(jié)果輸出選項(xiàng)結(jié)果輸出選項(xiàng)Type1給出似然比的給出似然比的1型分析結(jié)果,型分析結(jié)果,1型分析結(jié)果跟各變量型分析結(jié)果跟各變量進(jìn)入模型的順序有關(guān)。模型中每一個(gè)自變量的結(jié)果進(jìn)入模型的順序有關(guān)。模型中每一個(gè)自變量的結(jié)果僅僅校正了在它之前進(jìn)入模型的變量,而在它之后僅僅校正了在它之前進(jìn)入模型的變量,而在它之后進(jìn)入模型的變量則沒(méi)有校正進(jìn)入模型的變量則沒(méi)有校正Type3給出似然比的給出似然比的3型分析結(jié)果,型分析結(jié)果,3型分析結(jié)果跟各變量型分析結(jié)果跟各變量進(jìn)入模型的順序無(wú)關(guān)。模型中每一個(gè)自變量的結(jié)果進(jìn)入模型的順序無(wú)關(guān)。模型中每一個(gè)自變量的結(jié)果都是校
23、正了所有其它變量的結(jié)果,不管是在它之前都是校正了所有其它變量的結(jié)果,不管是在它之前進(jìn)入模型還是在它之后進(jìn)入模型進(jìn)入模型還是在它之后進(jìn)入模型Poisson回歸回歸模型模型pModel語(yǔ)句常用的語(yǔ)句常用的選項(xiàng):選項(xiàng):結(jié)果輸出選項(xiàng)結(jié)果輸出選項(xiàng)Pred輸出預(yù)測(cè)值輸出預(yù)測(cè)值Residuals輸出各種殘差,包括輸出各種殘差,包括Pearson殘差、殘差、Deviance殘殘差等差等diagnostics輸出杠桿值、強(qiáng)影響點(diǎn)診斷等結(jié)果輸出杠桿值、強(qiáng)影響點(diǎn)診斷等結(jié)果Offset指定一個(gè)位移變量,該選項(xiàng)在指定一個(gè)位移變量,該選項(xiàng)在Poisson回歸中比回歸中比較有用,它類似于指定一個(gè)分母(即觀察的總較有用,它類
24、似于指定一個(gè)分母(即觀察的總?cè)藬?shù)或總?cè)四辏?。由于人?shù)或總?cè)四辏?。由于Poisson回歸的因變量是回歸的因變量是log形式,因此位移變量通常指定總?cè)藬?shù)或總?cè)诵问?,因此位移變量通常指定總?cè)藬?shù)或總?cè)四甑膶?duì)數(shù)年的對(duì)數(shù)。Poisson回歸回歸模型模型pClass語(yǔ)句與語(yǔ)句與logistic回歸中的回歸中的class語(yǔ)句相似,也可以通過(guò)語(yǔ)句相似,也可以通過(guò)param=和和ref=這兩個(gè)選項(xiàng)產(chǎn)生虛擬變量,并根據(jù)這兩個(gè)選項(xiàng)產(chǎn)生虛擬變量,并根據(jù)ref=的指的指定確定參照組。定確定參照組。Param=指 定 分 類 變 量 的 參 數(shù) 估 計(jì) 方 法 , 一 般 指 定指 定 分 類 變 量 的 參 數(shù) 估 計(jì)
25、方 法 , 一 般 指 定param=referenceRef=可指定可指定ref=first、ref=last或或ref=“某類別賦值某類別賦值”,以指,以指定參照組定參照組Poisson回歸回歸模型模型p例例1: 某某腫瘤醫(yī)院為探索幽門(mén)螺桿菌及不同胃黏膜病變對(duì)胃癌的影響腫瘤醫(yī)院為探索幽門(mén)螺桿菌及不同胃黏膜病變對(duì)胃癌的影響,在某地隨機(jī)抽取了,在某地隨機(jī)抽取了3400名居民,檢測(cè)他們的幽門(mén)螺桿菌感染狀況以名居民,檢測(cè)他們的幽門(mén)螺桿菌感染狀況以及胃黏膜病變情況,并對(duì)他們的胃癌發(fā)病情況進(jìn)行隨訪。隨訪及胃黏膜病變情況,并對(duì)他們的胃癌發(fā)病情況進(jìn)行隨訪。隨訪7年后年后,共發(fā)現(xiàn),共發(fā)現(xiàn)59例胃癌,欲分析幽
26、門(mén)螺桿菌、基礎(chǔ)胃黏膜病變對(duì)胃癌發(fā)生例胃癌,欲分析幽門(mén)螺桿菌、基礎(chǔ)胃黏膜病變對(duì)胃癌發(fā)生的影響。的影響。病變幽門(mén)螺桿菌陰性幽門(mén)螺桿菌陽(yáng)性人數(shù)發(fā)病數(shù)發(fā)病率(%)人數(shù)發(fā)病數(shù)發(fā)病率(%)Sg/Cag98110.102101060.594Im23052.174604203.311Dys9766.186287217.317合計(jì)1308120.9171901472.472Poisson回歸回歸模型模型pDATA example10_2;pINPUT hp path c n;pln=log(n); /*產(chǎn)生一個(gè)新變量產(chǎn)生一個(gè)新變量ln,其值為例數(shù),其值為例數(shù)n的對(duì)數(shù),作為后面的對(duì)數(shù),作為后面model語(yǔ)句中的語(yǔ)
27、句中的位移變量位移變量*/pCARDS;p011981p025230p03697p1161010p1220604p1321287p;pPROC GENMOD;pCLASS path(param=ref ref=first);pMODEL c=hp path/dist=poisson link=log offset=ln type1 type3 ;p/*dist指定分布為指定分布為Poisson分布,分布,link指定聯(lián)接函數(shù)為指定聯(lián)接函數(shù)為log,type1和和type3輸出似然比的輸出似然比的1型型和和3型結(jié)果。型結(jié)果。Offset選項(xiàng)非常關(guān)鍵,它起到一個(gè)分母的作用,因?yàn)橐蜃兞恐皇侵付宋高x
28、項(xiàng)非常關(guān)鍵,它起到一個(gè)分母的作用,因?yàn)橐蜃兞恐皇侵付宋赴┌l(fā)生數(shù)癌發(fā)生數(shù)c,因此通過(guò),因此通過(guò)offset選項(xiàng)設(shè)定一個(gè)位移變量。由于指定的聯(lián)接函數(shù)為對(duì)數(shù)形式選項(xiàng)設(shè)定一個(gè)位移變量。由于指定的聯(lián)接函數(shù)為對(duì)數(shù)形式,因此位移變量不是直接用總例數(shù),而是總例數(shù)的對(duì)數(shù),因此位移變量不是直接用總例數(shù),而是總例數(shù)的對(duì)數(shù)*/pRUN;Poisson回歸回歸模型模型pDeviance和和Pearson 2值分別為值分別為1.1535和和1.0455,我們可根,我們可根據(jù)相應(yīng)的自由度據(jù)相應(yīng)的自由度DF求得對(duì)應(yīng)的求得對(duì)應(yīng)的P值分別為值分別為0.5617和和0.5929,遠(yuǎn)遠(yuǎn)大于,遠(yuǎn)遠(yuǎn)大于0.05,提示模型擬合較好。,提
29、示模型擬合較好。Poisson回歸回歸模型模型pSAS 9.3結(jié)果中增加了結(jié)果中增加了AIC、AICC、BIC等模型評(píng)價(jià)指標(biāo)等模型評(píng)價(jià)指標(biāo)Poisson回歸回歸模型模型pWald檢驗(yàn)檢驗(yàn)結(jié)果,結(jié)果,hp的影響無(wú)統(tǒng)計(jì)學(xué)意義(的影響無(wú)統(tǒng)計(jì)學(xué)意義(P=0.1370),),path的影響有統(tǒng)計(jì)學(xué)意義。的影響有統(tǒng)計(jì)學(xué)意義。Poisson回歸回歸模型模型p似然比檢驗(yàn),似然比檢驗(yàn),分別給出了分別給出了型和型和型的結(jié)果型的結(jié)果。p型和型和型的型的結(jié)果結(jié)果不同,說(shuō)明了什么?不同,說(shuō)明了什么?Poisson回歸回歸中的過(guò)離散問(wèn)題中的過(guò)離散問(wèn)題p例例2:某研究觀察馬蹄蟹殼寬(:某研究觀察馬蹄蟹殼寬(wcat)與居住周圍同伴數(shù)()與居住周圍同伴數(shù)(satell)的關(guān)系,將殼寬從)的關(guān)系,將殼寬從23-30cm分了分了8組,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年廠房轉(zhuǎn)租賃協(xié)議范本
- 2024年度公司車輛租賃協(xié)議樣本
- 2024道路安全員招聘協(xié)議樣本
- 2024年聘用協(xié)議規(guī)范化樣本
- 2023-2024學(xué)年鄭州市高三下學(xué)期5月月考數(shù)學(xué)試題(A卷)
- 2024安全生產(chǎn)與環(huán)保綜合管理協(xié)議
- 二手車交易過(guò)戶協(xié)議范本2024
- 2024年度專項(xiàng)宣傳品訂制協(xié)議
- 2024年項(xiàng)目實(shí)施階段服務(wù)協(xié)議范本
- 天津市河北區(qū)2024-2025學(xué)年高二上學(xué)期11月期中英語(yǔ)試題(無(wú)答案)
- 破產(chǎn)法PPT課件
- 金融衍生工具ppt課件
- 光電效應(yīng)測(cè)定普朗克常數(shù).ppt
- “讓學(xué)引思”高效課堂推進(jìn)策略的研究
- 《培訓(xùn)機(jī)構(gòu)教師薪酬制度》
- 點(diǎn)子圖方格紙合計(jì)
- 乘法的故事(小學(xué)二年級(jí)課前小故事).ppt
- 《骨盆重要性》PPT課件.ppt
- WHO癌痛的三階梯止痛的原則
- 第二節(jié)絡(luò)合物的分子軌道理論
- 高等電力系統(tǒng)分析
評(píng)論
0/150
提交評(píng)論