應(yīng)用統(tǒng)計(jì)學(xué)多重線性回歸模型_第1頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)多重線性回歸模型_第2頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)多重線性回歸模型_第3頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)多重線性回歸模型_第4頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)多重線性回歸模型_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用統(tǒng)計(jì)學(xué)多重線性回歸模型第一頁(yè),共八十一頁(yè),2022年,8月28日

內(nèi)容提要

模型簡(jiǎn)介簡(jiǎn)單實(shí)例分析

逐步回歸殘差分析

模型進(jìn)一步診斷與修正小結(jié)第二頁(yè),共八十一頁(yè),2022年,8月28日模型簡(jiǎn)介

生活中發(fā)生的許多現(xiàn)象都不是獨(dú)立的,而是相互作用、相互影響的。一種結(jié)果的出現(xiàn)往往是多個(gè)因素、多個(gè)環(huán)節(jié)共同作用的結(jié)果。拋開(kāi)其他因素,僅考察其中一個(gè)影響因素對(duì)結(jié)果的影響,所得出的結(jié)論是片面的,甚至可能是錯(cuò)誤的。本章所要討論的問(wèn)題是如何同時(shí)考慮多個(gè)因素對(duì)同一結(jié)果的影響。此時(shí),因變量只有一個(gè),也稱反應(yīng)變量,常用y表示。自變量也稱解釋變量,有多個(gè)。第三頁(yè),共八十一頁(yè),2022年,8月28日模型簡(jiǎn)介

多重線性回歸模型其中,βj是偏回歸系數(shù)(Partialregressioncoefficient),它表示在其它自變量固定不變的情況下,Xj每改變一個(gè)測(cè)量單位時(shí)所引起的應(yīng)變量Y的平均改變量,p為自變量的個(gè)數(shù),ε為殘差,獨(dú)立服從N(0,σ2)分布。第四頁(yè),共八十一頁(yè),2022年,8月28日

自變量與因變量之間存在線性關(guān)系,可以通過(guò)繪制“散點(diǎn)圖矩陣”予以考察;各觀測(cè)間相互獨(dú)立;殘差服從正態(tài)分布;方差齊性。模型簡(jiǎn)介-應(yīng)用條件

多重線性回歸模型使用最小二乘法來(lái)解決方程的估計(jì)和檢驗(yàn)問(wèn)題。第五頁(yè),共八十一頁(yè),2022年,8月28日簡(jiǎn)單分析實(shí)例例1為研究男性高血壓患者血壓與年齡、身高、體重等變量的關(guān)系,隨機(jī)測(cè)量了32名40歲以上男性的血壓y、年齡x1、體重指數(shù)x2,試建立多重線性回歸方程。數(shù)據(jù)文件見(jiàn)mreg2.sav。第六頁(yè),共八十一頁(yè),2022年,8月28日簡(jiǎn)單分析實(shí)例-初步分析初步分析:與簡(jiǎn)單線性回歸相類似,先繪制散點(diǎn)圖,以便在進(jìn)行回歸分析之前了解各變量之間是否存在線性關(guān)系。本例有兩個(gè)自變量與一個(gè)反應(yīng)變量,繪制散點(diǎn)圖矩陣,如下。第七頁(yè),共八十一頁(yè),2022年,8月28日

繪制散點(diǎn)圖矩陣簡(jiǎn)單分析實(shí)例-初步分析第八頁(yè),共八十一頁(yè),2022年,8月28日簡(jiǎn)單分析實(shí)例第九頁(yè),共八十一頁(yè),2022年,8月28日簡(jiǎn)單分析實(shí)例第十頁(yè),共八十一頁(yè),2022年,8月28日簡(jiǎn)單分析實(shí)例結(jié)果分析

給出了自變量進(jìn)入模型的方式,此處尚未涉及變量篩選問(wèn)題,因?yàn)閮蓚€(gè)變量是被強(qiáng)行納入模型的(Method為Enter),當(dāng)然就不存在剔除變量的事情了。第十一頁(yè),共八十一頁(yè),2022年,8月28日簡(jiǎn)單分析實(shí)例結(jié)果分析

模型擬合優(yōu)度情況的檢驗(yàn),結(jié)果顯示,復(fù)相關(guān)系數(shù)為0.840,決定系數(shù)為0.706,調(diào)整的決定系數(shù)為0.686,還輸出了剩余標(biāo)準(zhǔn)差。第十二頁(yè),共八十一頁(yè),2022年,8月28日簡(jiǎn)單分析實(shí)例結(jié)果分析

回歸模型的假設(shè)檢驗(yàn)結(jié)果,顯示F=34.808,P<0.001,說(shuō)明所建立的回歸模型是有統(tǒng)計(jì)學(xué)意義的,至少有一個(gè)自變量的回歸系數(shù)不為0。第十三頁(yè),共八十一頁(yè),2022年,8月28日簡(jiǎn)單分析實(shí)例結(jié)果分析

給出了模型的常數(shù)項(xiàng)以及兩個(gè)自變量的偏回歸系數(shù)及其檢驗(yàn)結(jié)果,可以寫出回歸方程如下:Y=54.798+1.379x1+4.513x2主要結(jié)果第十四頁(yè),共八十一頁(yè),2022年,8月28日SPSS結(jié)果中輸出偏回歸系數(shù)的同時(shí),也輸出了各自的標(biāo)準(zhǔn)偏回歸系數(shù)。年齡的標(biāo)準(zhǔn)化偏回歸系數(shù)為0.664,體重指數(shù)的標(biāo)準(zhǔn)化偏回歸系數(shù)為0.247,因此,可以認(rèn)為,年齡對(duì)血壓的影響比體重指數(shù)對(duì)血壓的影響大。簡(jiǎn)單分析實(shí)例結(jié)果分析第十五頁(yè),共八十一頁(yè),2022年,8月28日例2

仍以例1的資料為例,試作逐步回歸分析。數(shù)據(jù)文件見(jiàn)mreg2.sav。逐步回歸第十六頁(yè),共八十一頁(yè),2022年,8月28日逐步回歸第十七頁(yè),共八十一頁(yè),2022年,8月28日逐步回歸第十八頁(yè),共八十一頁(yè),2022年,8月28日逐步回歸

輸出SPSS在逐步回歸過(guò)程中擬合的步驟中,每一步引入模型的變量情況,此處只有一個(gè)變量引入。結(jié)果分析第十九頁(yè),共八十一頁(yè),2022年,8月28日逐步回歸結(jié)果分析

分別輸出擬合的模型中,擬合優(yōu)度情況的檢驗(yàn)結(jié)果:復(fù)相關(guān)系數(shù)、決定系數(shù)、調(diào)整的決定系數(shù)以及剩余標(biāo)準(zhǔn)差。本例只有一步,故結(jié)果很簡(jiǎn)單,僅擬合一個(gè)模型。第二十頁(yè),共八十一頁(yè),2022年,8月28日逐步回歸結(jié)果分析

給出各個(gè)擬合模型的常數(shù)項(xiàng)以及各自變量的偏回歸系數(shù)、95%可信區(qū)間及其檢驗(yàn)結(jié)果(此處為僅有一步的結(jié)果)。第二十一頁(yè),共八十一頁(yè),2022年,8月28日逐步回歸結(jié)果分析

給出擬合模型過(guò)程中被剔除的變量情況及其檢驗(yàn)結(jié)果(此處為僅有一步)。第二十二頁(yè),共八十一頁(yè),2022年,8月28日殘差分析非標(biāo)準(zhǔn)化殘差(原始?xì)埐睿?biāo)準(zhǔn)化殘差(Pearson殘差)學(xué)生化殘差剔除殘差學(xué)生化剔除殘差

殘差種類第二十三頁(yè),共八十一頁(yè),2022年,8月28日殘差分析

模型適用條件的檢驗(yàn)-因變量與自變量之間存在線性關(guān)系的檢驗(yàn)(以例1為例:年齡)第二十四頁(yè),共八十一頁(yè),2022年,8月28日殘差分析

模型適用條件的檢驗(yàn)-因變量與自變量之間存在線性關(guān)系的檢驗(yàn)(以例1為例:體重指數(shù))第二十五頁(yè),共八十一頁(yè),2022年,8月28日殘差分析

模型適用條件的檢驗(yàn)-獨(dú)立性的檢驗(yàn)通過(guò)LinearRegression過(guò)程的statistics按鈕中的Durbin-Watson檢驗(yàn)進(jìn)行判斷。若自變量數(shù)少于4個(gè),統(tǒng)計(jì)量接近2,基本上可以肯定殘差間相互獨(dú)立。仍以例1為例,結(jié)果如下。第二十六頁(yè),共八十一頁(yè),2022年,8月28日殘差分析

模型適用條件的檢驗(yàn)-方差齊性的檢驗(yàn)第二十七頁(yè),共八十一頁(yè),2022年,8月28日殘差分析

模型適用條件的檢驗(yàn)-正態(tài)性的檢驗(yàn)繪制殘差的直方圖及PP圖的復(fù)選框第二十八頁(yè),共八十一頁(yè),2022年,8月28日殘差分析

模型適用條件的檢驗(yàn)-正態(tài)性的檢驗(yàn)結(jié)果第二十九頁(yè),共八十一頁(yè),2022年,8月28日模型的進(jìn)一步診斷與修正

強(qiáng)影響點(diǎn)的識(shí)別1.殘差:以標(biāo)準(zhǔn)化殘差最常用。一般地,標(biāo)準(zhǔn)化殘差大于3時(shí)幾乎可以肯定該條記錄為強(qiáng)影響點(diǎn)。在LinearRegression過(guò)程中statistics按鈕提供了Casewisediagnostics復(fù)選框用于在output窗口中輸出可能為強(qiáng)影響點(diǎn)的記錄編號(hào)和相關(guān)統(tǒng)計(jì)量。第三十頁(yè),共八十一頁(yè),2022年,8月28日模型的進(jìn)一步診斷與修正仍以例2為例,沒(méi)有記錄標(biāo)準(zhǔn)化殘差大于3,可要求輸出2倍標(biāo)準(zhǔn)差以內(nèi)的殘差值,結(jié)果如下:

強(qiáng)影響點(diǎn)的識(shí)別第三十一頁(yè),共八十一頁(yè),2022年,8月28日模型的進(jìn)一步診斷與修正2.強(qiáng)影響點(diǎn)統(tǒng)計(jì)量:在SPSS中,可以通過(guò)Save子對(duì)話框中的InfluenceStatistics復(fù)選框,提供一系列用于強(qiáng)影響點(diǎn)識(shí)別的統(tǒng)計(jì)量。

強(qiáng)影響點(diǎn)的識(shí)別第三十二頁(yè),共八十一頁(yè),2022年,8月28日強(qiáng)影響點(diǎn)的診斷樣本中的異常值和強(qiáng)影響點(diǎn)是指遠(yuǎn)離均值的數(shù)據(jù)點(diǎn)。探測(cè)因變量的異常值:標(biāo)準(zhǔn)化殘差、學(xué)生化殘差、剔除殘差;絕對(duì)值>3的觀測(cè)為異常值。探測(cè)自變量中強(qiáng)影響點(diǎn):杠桿值,hij大于2或3倍的平均值即為異常;庫(kù)克距離>1為異常;標(biāo)準(zhǔn)化回歸系數(shù)和標(biāo)準(zhǔn)化預(yù)測(cè)值的變化;模型的進(jìn)一步診斷與修正第三十三頁(yè),共八十一頁(yè),2022年,8月28日

強(qiáng)影響點(diǎn)的處理模型的進(jìn)一步診斷與修正⑴考慮是否錄入錯(cuò)誤,如果是,予以改正;否則予以刪除強(qiáng)影響點(diǎn)記錄;⑵進(jìn)行穩(wěn)健回歸,如最小一乘法和加權(quán)最小二乘法;⑶進(jìn)行非參數(shù)回歸及變量變換等。第三十四頁(yè),共八十一頁(yè),2022年,8月28日

多重共線性的識(shí)別模型的進(jìn)一步診斷與修正多重共線性:是指自變量間存在相關(guān)關(guān)系,即一個(gè)自變量可以用其他一個(gè)或幾個(gè)自變量的線性表達(dá)式進(jìn)行表示。有以下表現(xiàn)形式:

整個(gè)模型的方差分析結(jié)果為P<,但各自變量的偏回歸系數(shù)的統(tǒng)計(jì)學(xué)結(jié)果卻為P>;

專業(yè)上認(rèn)為應(yīng)該有統(tǒng)計(jì)學(xué)意義的自變量檢驗(yàn)結(jié)果卻無(wú)統(tǒng)計(jì)學(xué)意義;自變量的偏回歸系數(shù)取值大小甚至符號(hào)明顯與實(shí)際情況違背,難以解釋;增加或刪除一條記錄或一個(gè)自變量,偏回歸系數(shù)發(fā)生很大變化。第三十五頁(yè),共八十一頁(yè),2022年,8月28日

多重共線性的識(shí)別模型的進(jìn)一步診斷與修正可以通過(guò)statistics子對(duì)話框中的CollinearityDiagnostics復(fù)選框予以實(shí)現(xiàn)。其中提供了以下統(tǒng)計(jì)量:容忍度方差膨脹因子條件指數(shù)變異構(gòu)成第三十六頁(yè),共八十一頁(yè),2022年,8月28日容忍度(Toli=1-Ri2):Ri2是自變量xi與其他自變量間的決定系數(shù)。方差膨脹因子(VIF=1/Toli)≥10,表明共線性嚴(yán)重特征根λ:最大特征根遠(yuǎn)遠(yuǎn)大于其他特征根,說(shuō)明自變量間有大量的信息重疊。條件指數(shù)ki=SQRT(λm/λi):≥10,表明存在共線性。模型的進(jìn)一步診斷與修正第三十七頁(yè),共八十一頁(yè),2022年,8月28日

多重共線性的識(shí)別(例2分析結(jié)果)模型的進(jìn)一步診斷與修正第三十八頁(yè),共八十一頁(yè),2022年,8月28日

多重共線性的處理模型的進(jìn)一步診斷與修正

增加樣本量逐步回歸(當(dāng)共線性很嚴(yán)重時(shí),仍然不行);嶺回歸(RidgeRegression,為有偏估計(jì));主成分回歸;路徑分析。第三十九頁(yè),共八十一頁(yè),2022年,8月28日小結(jié)

回歸模型的建立步驟回歸分析已經(jīng)被應(yīng)用的非常廣泛,作為一個(gè)嚴(yán)肅的統(tǒng)計(jì)學(xué)模型,它有著自己嚴(yán)格的適用條件,在擬合時(shí)需要不斷進(jìn)行這些適用條件的判斷。但是,許多使用者往往忽視了這一點(diǎn),只是把模型做完就好了。這不僅浪費(fèi)信息,更有可能得出錯(cuò)誤的結(jié)論。這里給出一個(gè)比較合適的回歸分析操作步驟,供大家參考。第四十頁(yè),共八十一頁(yè),2022年,8月28日小結(jié)

回歸模型的建立步驟⑴繪制散點(diǎn)圖,觀察變量間的趨勢(shì)。(不能隨意省略)⑵考察數(shù)據(jù)分布,進(jìn)行必要的預(yù)處理。⑶進(jìn)行直線回歸分析。⑷殘差分析。(最重要和直觀的方法是圖示法)⑸強(qiáng)影響點(diǎn)的診斷和多重共線性的判斷。第四十一頁(yè),共八十一頁(yè),2022年,8月28日小結(jié)建立一個(gè)“完美”的多重線性回歸模型是一個(gè)需要反復(fù)進(jìn)行的過(guò)程,不能指望一蹴而就。第四十二頁(yè),共八十一頁(yè),2022年,8月28日基本操作:Analyze-Regression-LinearDependent:因變量Independent:自變量Method:自變量篩選方法,默認(rèn)為EnterBlock:不同變量有不同篩選方法時(shí)可定義BlockSelectionVariable:變量值滿足條件的樣本才參與分析CaseLabels:指定圖示中數(shù)據(jù)點(diǎn)的標(biāo)志變量第四十三頁(yè),共八十一頁(yè),2022年,8月28日第四十四頁(yè),共八十一頁(yè),2022年,8月28日第四十五頁(yè),共八十一頁(yè),2022年,8月28日第四十六頁(yè),共八十一頁(yè),2022年,8月28日第四十七頁(yè),共八十一頁(yè),2022年,8月28日第四十八頁(yè),共八十一頁(yè),2022年,8月28日對(duì)于呈非線性關(guān)系的變量之間的統(tǒng)計(jì)關(guān)系進(jìn)行大體估計(jì)(但經(jīng)變量變換可轉(zhuǎn)化為線性關(guān)系——本質(zhì)線性關(guān)系)。繪制擬合曲線并進(jìn)行預(yù)測(cè)。做為線性回歸分析的預(yù)分析步驟:選擇變量變換的方法。曲線估計(jì)第四十九頁(yè),共八十一頁(yè),2022年,8月28日常用的幾種非線性模型(一)拋物線模型(二次曲線模型)具體形式為:

式中β0、β1和β2為待估計(jì)參數(shù)。判斷某種現(xiàn)象是否適合應(yīng)用拋物線,可以利用“差分法”。其步驟如下:首先將樣本觀察值按X的大小順序排列,然后按以下兩式計(jì)算X和Y的一階差分△Xt、△Yt以及Y的二階差分△Y2t?!鱔t=Xt-Xt-1;△Yt=Yt-Yt-1△Y2t=△Yt-△Yt-1當(dāng)△Xt接近于一常數(shù),而△Y2t的絕對(duì)值接近于常數(shù)時(shí),Y與X之間的關(guān)系可以用拋物線模型近似加以反映。第五十頁(yè),共八十一頁(yè),2022年,8月28日(二)雙曲線模型假如Y隨著X的增加而增加(或減少),最初增加(或減少)很快,以后逐漸放慢并趨于穩(wěn)定,則可以選用雙曲線來(lái)擬合。雙曲線模型形式是: Y=β0+β1(1/X)+ε第五十一頁(yè),共八十一頁(yè),2022年,8月28日(三)冪函數(shù)模型冪函數(shù)模型的一般形式是:這類函數(shù)的優(yōu)點(diǎn)在于:方程中的參數(shù)可以直接反映因變量Y對(duì)于某一個(gè)自變量的彈性。所謂Y對(duì)于Xj的彈性,是指在其他情況不變的條件下,Xj變動(dòng)1%時(shí)所引起Y變動(dòng)的百分比。彈性是一個(gè)無(wú)量綱的數(shù)值,它是經(jīng)濟(jì)定量分析中常用的一個(gè)尺度。它在生產(chǎn)函數(shù)分析和需求函數(shù)分析中,得到了廣泛的應(yīng)用。第五十二頁(yè),共八十一頁(yè),2022年,8月28日(四)指數(shù)函數(shù)模型指數(shù)函數(shù)模型為:這種曲線被廣泛應(yīng)用于描述社會(huì)經(jīng)濟(jì)現(xiàn)象的變動(dòng)趨勢(shì)。例如產(chǎn)值、產(chǎn)量按一定比率增長(zhǎng),成本、原材料消耗按一定比例降低。第五十三頁(yè),共八十一頁(yè),2022年,8月28日(五)邏輯曲線模型邏輯曲線的方程式如下:邏輯曲線具有以下性質(zhì)。Y是X的非減函數(shù),開(kāi)始時(shí)隨著X的增加,Y的增長(zhǎng)速度也逐漸加快,但是Y達(dá)到一定水平之后,其增長(zhǎng)速度又逐漸放慢。最后無(wú)論X如何增加,Y只會(huì)趨近于L,而永遠(yuǎn)不會(huì)超過(guò)L。第五十四頁(yè),共八十一頁(yè),2022年,8月28日可擬合的曲線本質(zhì)線性關(guān)系:形式上呈非線性關(guān)系,但可通過(guò)變量變換化為線性關(guān)系。擬合原則:一般來(lái)說(shuō),涉及的變量越多,變量的冪次越高,計(jì)算量就越大,誤差也將越大。一般盡量避免采用多元高次多項(xiàng)式。能擬合的曲線見(jiàn)下頁(yè)第五十五頁(yè),共八十一頁(yè),2022年,8月28日第五十六頁(yè),共八十一頁(yè),2022年,8月28日基本操作:Analyze-Regression-CurveEstimation第五十七頁(yè),共八十一頁(yè),2022年,8月28日Independent:X2DependentMthRsqd.f.FSigfb0b1b2b3X5QUA.98710382.64.000252.698-.14752.5E-05X5CUB.9949516.46.000-41.314.0754-2.E-052.6E-09X5COM.995112086.35.00020.95501.0004X5POW.95411229.58.0003.6E-051.8460第五十八頁(yè),共八十一頁(yè),2022年,8月28日第五十九頁(yè),共八十一頁(yè),2022年,8月28日例:打開(kāi)‘年人均消費(fèi)支出和教育’數(shù)據(jù),對(duì)居民在外就餐的趨勢(shì)進(jìn)行分析,預(yù)測(cè)2003年和2004年度的居民在外就餐的費(fèi)用。第六十頁(yè),共八十一頁(yè),2022年,8月28日操作:Graphs-Sequence第六十一頁(yè),共八十一頁(yè),2022年,8月28日第六十二頁(yè),共八十一頁(yè),2022年,8月28日Dependentvariable..X4Method..EXPONENTListwiseDeletionofMissingDataMultipleR.96856RSquare.93810AdjustedRSquare.93501StandardError.26294AnalysisofVariance:DFSumofSquaresMeanSquareRegression120.95600420.956004Residuals201.382742.069137F=303.10787SignifF=.0000--------------------VariablesintheEquation--------------------VariableBSEBBetaTSigTTime.153837.008836.96855617.410.0000(Constant)12.5217901.7511837.150.0000Thefollowingnewvariablesarebeingcreated:NameLabelFIT_6FitforX4fromCURVEFIT,MOD_6EXPONENTIAL1newcaseshavebeenadded.第六十三頁(yè),共八十一頁(yè),2022年,8月28日二項(xiàng)Logistic回歸適用于進(jìn)行二分類因變量的影響因素分析用于控制混雜因素,描述自變量對(duì)因變量的獨(dú)立作用下的影響程度用于預(yù)測(cè)或判別分析第六十四頁(yè),共八十一頁(yè),2022年,8月28日與線性回歸的不同之處被解釋變量為0/1二分類定性變量時(shí),不適合線性回歸模型分析:被解釋變量取值范圍不一致殘差為二值離散型分布而非正態(tài)分布等方差性不再滿足第六十五頁(yè),共八十一頁(yè),2022年,8月28日二項(xiàng)Logistic回歸將yi=1的概率值直接擬合線性回歸模型:Py=1=β0+βixi可對(duì)概率P值做變量變換,使之取值范圍為-∞~+∞解釋變量與被解釋變量概率值的實(shí)際關(guān)系一般呈增長(zhǎng)曲線發(fā)生比(Odds)Ω=p/(1-p)LogitP轉(zhuǎn)換:ln(Ω)

=ln(p/(1-p))=β0+βixi第六十六頁(yè),共八十一頁(yè),2022年,8月28日βi為解釋變量增加一個(gè)單位時(shí),ln(Ω)的變化量經(jīng)變換,Ω=exp(β0+βixi)固定其他變量,研究變量x1的作用exp(βi)稱為固定其他變量的作用時(shí),變量xi增加一個(gè)單位引起的發(fā)生比之比(OddsRatio,OR).二項(xiàng)Logistic回歸-參數(shù)意義第六十七頁(yè),共八十一頁(yè),2022年,8月28日最大似然估計(jì)法,通過(guò)最大化對(duì)數(shù)似然值(loglikelihood)估計(jì)參數(shù)。最大似然估計(jì)法是一種迭代算法,它以一個(gè)預(yù)測(cè)估計(jì)值作為參數(shù)的初始值,根據(jù)算法確定能增大對(duì)數(shù)似然值的參數(shù)的方向和變動(dòng)。估計(jì)了該初始函數(shù)后,對(duì)殘差進(jìn)行檢驗(yàn)并用改進(jìn)的函數(shù)進(jìn)行重新估計(jì),直到收斂為止(即對(duì)數(shù)似然不再顯著變化)。二項(xiàng)Logistic回歸-參數(shù)估計(jì)第六十八頁(yè),共八十一頁(yè),2022年,8月28日-2對(duì)數(shù)似然值(-2LogLikelihood,-2LL)似然(likelihood)即概率,反映該模型能較好地?cái)M合樣本數(shù)據(jù)的可能性。對(duì)數(shù)似然值(loglikelihood,LL)是它的自然對(duì)數(shù)形式,取值在0至-∞之間。對(duì)數(shù)似然值通過(guò)最大似然估計(jì)的迭代算法計(jì)算而得。LL最大為0,越大意味著回歸方程的擬合程度越好。因?yàn)閿?shù)學(xué)上較方便,常計(jì)算-2LL。二項(xiàng)Logistic回歸-檢驗(yàn)統(tǒng)計(jì)量第六十九頁(yè),共八十一頁(yè),2022年,8月28日比分檢驗(yàn)(ScoreTest)

以未包含某個(gè)(或幾個(gè))參數(shù)的模型為基礎(chǔ),保留模型中參數(shù)的估計(jì)值,并假設(shè)新增加的參數(shù)為0,計(jì)算似然函數(shù)的一階偏導(dǎo)數(shù)及信息矩陣,二者乘積即為比分檢驗(yàn)統(tǒng)計(jì)量S,樣本量大時(shí),S服從卡方分布,比分檢驗(yàn)結(jié)果一般與似然比檢驗(yàn)一致。二項(xiàng)Logistic回歸-檢驗(yàn)統(tǒng)計(jì)量第七十頁(yè),共八十一頁(yè),2022年,8月28日回歸方程的顯著性檢驗(yàn)——似然比卡方檢驗(yàn)H0:各回歸系數(shù)同時(shí)為0檢驗(yàn)統(tǒng)計(jì)量:似然比卡方服從近似卡方分布L0為解釋變量未引入方程時(shí)的對(duì)數(shù)似然函數(shù)值,L為解釋變量引入方程后的對(duì)數(shù)似然函數(shù)值.第七十一頁(yè),共八十一頁(yè),2022年,8月28日回歸方程的擬合優(yōu)度檢驗(yàn)回歸方程能夠解釋的被解釋變量變異程度越高,擬合優(yōu)度越高.Cox&SnellR2統(tǒng)計(jì)量=1-(L0/L)2/nNaglkerkeR2=Cox&SnellR2/(1-(L0)2/n),取值0~1回歸方程預(yù)測(cè)值與實(shí)際值之間的吻合程度,總體預(yù)測(cè)準(zhǔn)確率越高,擬合優(yōu)度越高.錯(cuò)判矩陣Hosmer-Lemeshow統(tǒng)計(jì)量服從n-2個(gè)自由度的卡方分布:當(dāng)自變量較多且多為連續(xù)性變量時(shí)殘差分析第七十二頁(yè),共八十一頁(yè),2022年,8月28日回歸系數(shù)的顯著性檢驗(yàn)H0:βi=0檢驗(yàn)統(tǒng)計(jì)量:Wald統(tǒng)計(jì)量服從近似卡方分布Waldi=(βi/Sβi)2Wald檢驗(yàn)統(tǒng)計(jì)量的缺點(diǎn):它考慮因素的綜合作用,當(dāng)因素間存在多重共線性的時(shí)候,結(jié)果不可靠,較不宜于拒絕零假設(shè),使得本應(yīng)保留在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論