第7章 5邏輯回歸分析講義_第1頁
第7章 5邏輯回歸分析講義_第2頁
第7章 5邏輯回歸分析講義_第3頁
第7章 5邏輯回歸分析講義_第4頁
第7章 5邏輯回歸分析講義_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第第頁第7章5邏輯回歸分析講義

7.5規(guī)律回來分析

統(tǒng)計學(xué)上的定義和計算公式

定義:規(guī)律回來分析是對定性變量的回來分析。

現(xiàn)實中的許多現(xiàn)象可以劃分為兩種可能,或者歸結(jié)為兩種狀態(tài),這兩種狀態(tài)分別用0和1表示。買汽車回受到家庭、收入等因素的影響,但最終的結(jié)果只能是兩個:買或不買。假如我們采納多個因素對0-1表示的某種現(xiàn)象進(jìn)行因果關(guān)系說明,就可能應(yīng)用到logistic回來。例如,想探討胃癌發(fā)生的危急因素,可以選擇兩組人群,一組是胃癌組,一組是非胃癌組,兩組人群確定有不同的體征和生活方式等。這里的因變量就是是否胃癌,即“是”或“否”,為兩分類變量,自變量就可以包括許多了,例如年齡、性別、飲食習(xí)慣等。自變量既可以是連續(xù)的,也可以是分類的。通過logistic回來分析,就可以大致了解究竟哪些因素是胃癌的危急因素。

可用于處理定性因變量的統(tǒng)計分析方法有:判別分析〔Discriminantanalysis〕、Probit分析、Logistic回來分析和對數(shù)線性模型等。在社會科學(xué)中,應(yīng)用最多的是Logistic回來分析。Logistic回來分析依據(jù)因變量取值類別不同,又可以分為BinaryLogistic回來分析和Multi-nominalLogistic回來分析。

BinaryLogistic回來模型中因變量只能取兩個值1和0〔虛擬因變量〕,而MultinomialLogistic回來模型中因變量可以取多個值。本節(jié)將只爭論BinaryLogistic回來,并簡稱Logistic回來〔與7.5節(jié)曲線估量中介紹的Logistic曲線模型相區(qū)分〕。Logistic函數(shù)的形式為

實例操作

在一次關(guān)于某城鎮(zhèn)居民上下班運用交通工具的社會調(diào)查中,因變量y=1表示居民主要乘坐公共汽車上下班;y=0表示主要騎自行車上下班;自變量*1表示被調(diào)查者的年齡;*2表示被調(diào)查者的月收入;*3表示被調(diào)查者的性別〔*3=1為男性,*3=0為女性〕。

試建立y與自變量間的Logistic回來,數(shù)據(jù)如表所示。數(shù)據(jù)“上下班交通調(diào)查表.sav”表:運用交通工具上下班狀況

〔22.0版本〕

Step1

〔22.0版本〕

Step2

〔22.0版本〕

Step3

〔22.0版本〕

結(jié)果分析:

〔1〕第一部分輸出結(jié)果有兩個表格,第一個表格說明全部個案〔10個〕都被選入作為回來分析的個案。

個案處理

〔4〕ClassificationTable分類表說明第一次迭代結(jié)果的擬合效果,從該表格可以看出對于y=0,有100%的精確性;對于y=1,有0%精確性,因此對于全部個案總共有70%的精確性。

VariablesintheEquation表格列出了Step1中各個變量對應(yīng)的系數(shù),以及該變量對應(yīng)的Wald統(tǒng)計量值和它對應(yīng)的相伴概率。從該表格中可以看出*3相伴概率最小,Wald統(tǒng)計量最大,可見該變量在模型中很重要。

方程式中沒有的變量

a

步驟0

變量

*1*2*3

得分8.423.601.476

自由度

111

顯著性

.004.438.490

a.由于冗余,未計算殘差卡方。

〔22.0版本〕

〔5〕OmnibusTestsofModelCoefficients表格列出了模型系數(shù)的OmnibusTests結(jié)果。

模型系數(shù)的Omnibus檢驗

步驟1

步長(T)塊模型

卡方12.21712.21712.217

自由度

333

顯著性

.007.007.007

〔22.0版本〕

〔6〕ModelSummary表給出了-2對數(shù)似然值、Co*和Snell的R2以及Nagelkerke的R2檢驗統(tǒng)計結(jié)果。

模型

Hosmer和Lemeshow檢驗的列聯(lián)表

上下班方式=主要乘坐公共汽車上

上下班方式=主要騎自行車上下班

下班

觀測值

000000012

期望值(E)

.000.000.000.000.000.000.0001.0002.000

總計

111111112

步驟1

123456789

觀測值

111111100

期望值(E)

1.0001.0001.0001.0001.0001.0001.000.000.000

〔22.0版本〕

〔8〕規(guī)律回來的最末一個輸出表格是CasewiseList,列出殘差大于2的個案,由下表可知沒有這樣的個案。

個案列表a

a.由于找不到界外值,未生成casewise繪圖。

〔22.0版本〕

7.5規(guī)律回來分析

統(tǒng)計學(xué)上的定義和計算公式

定義:規(guī)律回來分析是對定性變量的回來分析。

現(xiàn)實中的許多現(xiàn)象可以劃分為兩種可能,或者歸結(jié)為兩種狀態(tài),這兩種狀態(tài)分別用0和1表示。買汽車回受到家庭、收入等因素的影響,但最終的結(jié)果只能是兩個:買或不買。假如我們采納多個因素對0-1表示的某種現(xiàn)象進(jìn)行因果關(guān)系說明,就可能應(yīng)用到logistic回來。例如,想探討胃癌發(fā)生的危急因素,可以選擇兩組人群,一組是胃癌組,一組是非胃癌組,兩組人群確定有不同的體征和生活方式等。這里的因變量就是是否胃癌,即“是”或“否”,為兩分類變量,自變量就可以包括許多了,例如年齡、性別、飲食習(xí)慣等。自變量既可以是連續(xù)的,也可以是分類的。通過logistic回來分析,就可以大致了解究竟哪些因素是胃癌的危急因素。

可用于處理定性因變量的統(tǒng)計分析方法有:判別分析〔Discriminantanalysis〕、Probit分析、Logistic回來分析和對數(shù)線性模型等。在社會科學(xué)中,應(yīng)用最多的是Logistic回來分析。Logistic回來分析依據(jù)因變量取值類別不同,又可以分為BinaryLogistic回來分析和Multi-nominalLogistic回來分析。

BinaryLogistic回來模型中因變量只能取兩個值1和0〔虛擬因變量〕,而MultinomialLogistic回來模型中因變量可以取多個值。本節(jié)將只爭論BinaryLogistic回來,并簡稱Logistic回來〔與7.5節(jié)曲線估量中介紹的Logistic曲線模型相區(qū)分〕。Logistic函數(shù)的形式為

實例操作

在一次關(guān)于某城鎮(zhèn)居民上下班運用交通工具的社會調(diào)查中,因變量y=1表示居民主要乘

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論