《商務(wù)統(tǒng)計(jì)分析 第2版》 課件 第11章 邏輯回歸_第1頁
《商務(wù)統(tǒng)計(jì)分析 第2版》 課件 第11章 邏輯回歸_第2頁
《商務(wù)統(tǒng)計(jì)分析 第2版》 課件 第11章 邏輯回歸_第3頁
《商務(wù)統(tǒng)計(jì)分析 第2版》 課件 第11章 邏輯回歸_第4頁
《商務(wù)統(tǒng)計(jì)分析 第2版》 課件 第11章 邏輯回歸_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第11章

邏輯回歸1第11章邏輯回歸分析——目錄11.1邏輯回歸模型11.2估計(jì)邏輯回歸模型11.3顯著性檢驗(yàn)11.4回歸系數(shù)的含義11.5案例分析2許多社會(huì)科學(xué)問題中的因變量往往是分類變量。比如,政治學(xué)中經(jīng)常研究的是否選舉某候選人,候選人的類型等;又如,經(jīng)濟(jì)學(xué)研究中所涉及的是否銷售或購買某種商品、是否簽訂一份合同,保險(xiǎn)是否違約,違約有哪些類型等等。這些分類變量中有一類特殊的變量,遵循二值取值原則,要么“是”或“發(fā)生”,要么“否”或“未發(fā)生”。統(tǒng)計(jì)上我們將這樣的變量稱作二分類變量(Binaryvariable)。3應(yīng)用背景多元回歸模型分析二分類變量的局限性被解釋變量的取值區(qū)間受限制自變量的邊際分析不符合實(shí)際分析二分類變量的方法利用概率轉(zhuǎn)化模型調(diào)整二分類變量使其線性化,也即,使其隨著自變量的變化,這一概率的值總是在0到1之間變化。11.1邏輯回歸模型Logistic函數(shù)Logistic回歸方程11.1邏輯回歸模型——概率轉(zhuǎn)換方法

似然函數(shù)其中,11.2估計(jì)邏輯回歸模型——最大似然估計(jì)追求似然函數(shù)最大值的過程就是追求對(duì)數(shù)似然函數(shù)值最大值的過程。對(duì)數(shù)似然函數(shù)值越大,意味著模型較好地?cái)M合樣本數(shù)據(jù)的可能性也越大,所得模型的擬合優(yōu)度越高。整體模型的檢驗(yàn)和評(píng)價(jià)11.3顯著性檢驗(yàn)

整體模型的檢驗(yàn)和評(píng)價(jià)11.3顯著性檢驗(yàn)判錯(cuò)矩陣預(yù)測值01正確率觀測值01總體正確率判錯(cuò)矩陣是一種極為直觀的評(píng)價(jià)模型優(yōu)劣的方法,它通過矩陣表格的形式展現(xiàn)預(yù)測值與實(shí)際觀測值的吻合程度。整體模型的檢驗(yàn)和評(píng)價(jià)11.3顯著性檢驗(yàn)Cox&SnellR2統(tǒng)計(jì)量Cox&SnellR2統(tǒng)計(jì)量與一般線性回歸分析中的R2有相似之處,也是方程對(duì)被解釋變量變差解釋程度的反映。缺點(diǎn)是取值范圍不易確定,因此使用時(shí)不方便。NagelkerkeR2統(tǒng)計(jì)量Cox&SnellR2統(tǒng)計(jì)量取值在0~1之間,越接近1說明方程的擬合優(yōu)度越高。回歸系數(shù)的顯著性檢驗(yàn)

11.3顯著性檢驗(yàn)

Wald統(tǒng)計(jì)量多重共線性檢驗(yàn)

應(yīng)當(dāng)注意,如果解釋變量存在多重共線性會(huì)對(duì)Wald檢驗(yàn)統(tǒng)計(jì)量產(chǎn)生影響。由于用于logistic回歸建模的很多軟件包,如

Excel,SPSS,和R并不提供共線性的問題檢驗(yàn),所以如果用戶想檢驗(yàn)共線性問題,可以就給定的自變量做一個(gè)線性回歸模型,并輸出共線性診斷指標(biāo),就可以了解自變量的相關(guān)情況。11.4邏輯回歸系數(shù)的意義平均個(gè)人偏效應(yīng)和平均偏效應(yīng)Logistic回歸模型的解釋涉及到對(duì)建立回歸方程所包含的自變量的分析。也即,我們常常想估計(jì)xi對(duì)響應(yīng)概率P(y=1|X)的影響。若xi是(大致)連續(xù)的,則對(duì)xi的較小變化,有:比例因子

11.4邏輯回歸系數(shù)的意義平均個(gè)人偏效應(yīng)和平均偏效應(yīng)

平均個(gè)人偏效應(yīng)表示將每個(gè)解釋變量都代之以樣本平均值而得到常數(shù)比例因子,利用該常數(shù)比例因子乘以對(duì)應(yīng)的xi的系數(shù)βi

即得到平均個(gè)人偏效應(yīng)。數(shù)學(xué)表達(dá)式為:平均個(gè)人偏效應(yīng)(PEA)平均偏效應(yīng)表示將樣本中所有個(gè)體的偏效應(yīng)取平均而得到常數(shù)比例因子。數(shù)學(xué)表達(dá)式為:平均偏效應(yīng)(PEA)11.4邏輯回歸系數(shù)的意義

根據(jù)平均個(gè)人偏效應(yīng)的定義,將年齡的樣本均值40.00代入公式可計(jì)算年齡對(duì)購買該產(chǎn)品響應(yīng)概率影響的平均個(gè)人偏效應(yīng)PEA;將根據(jù)個(gè)人偏效應(yīng)的定義,將年齡的樣本所有取值代入公式可得年齡對(duì)購買該產(chǎn)品響應(yīng)概率影響的個(gè)人偏效應(yīng)APE。

由于logistic模型中,自變量與響應(yīng)概率之間的關(guān)系是非線性的,因此平均個(gè)人偏效應(yīng)和平均偏效應(yīng)存在差異。11.4邏輯回歸系數(shù)的意義發(fā)生比Logistic回歸模型的解釋涉及到對(duì)建立回歸方程所包含的自變量的分析。利用logistic回歸,直接解釋自變量和y=1的概率之間的關(guān)系非常困難,統(tǒng)計(jì)學(xué)上,通過定義發(fā)生比和比值比對(duì)logistic回歸方程做出解釋。發(fā)生比

發(fā)生比被定義為事件將要發(fā)生的概率與該事件將不會(huì)發(fā)生的概率之比。11.4邏輯回歸系數(shù)的意義比值比比值比(Oddsratio)度量了當(dāng)一組自變量中只有一個(gè)自變量增加了一個(gè)單位時(shí)對(duì)事件發(fā)生概率(Odds)的影響。比值比是當(dāng)給定的一組自變量中一個(gè)自變量增加了一個(gè)單位,y=1發(fā)生概率(Odds1)除以該組自變量的值都沒有變化時(shí)y=1發(fā)生概率(Odds0)

比值比(Oddsratio)11.4邏輯回歸系數(shù)的意義

此時(shí),我們想要知道去年消費(fèi)支出為2萬元,且擁有信用卡的顧客使用優(yōu)惠券的機(jī)會(huì)比與去年消費(fèi)支出為2萬元,但沒有信用卡額度顧客使用優(yōu)惠券的機(jī)會(huì)比精細(xì)比較,也即,當(dāng)解釋變量x2增加一個(gè)單位時(shí)的影響:

因此,去年消費(fèi)支出為2萬元,且擁有信用卡的顧客使用優(yōu)惠券的機(jī)會(huì)比是去年消費(fèi)支出為2萬元,但沒有信用卡的顧客使用優(yōu)惠券的機(jī)會(huì)比的3倍。11.5案例分析一、案例背景

某商品銷售人員在長期推銷該產(chǎn)品的過程中發(fā)現(xiàn),消費(fèi)者是否購買該產(chǎn)品受到很強(qiáng)的消費(fèi)者人口結(jié)構(gòu)特征的影響。比如性別、年齡以及收入水平。為了驗(yàn)證自己的猜想,以及在未來的銷售活動(dòng)中能更好的,有針對(duì)性的,對(duì)可能購買該產(chǎn)品的顧客提供更好的服務(wù)。經(jīng)與銷售主管的商議,該銷售團(tuán)隊(duì)對(duì)到達(dá)商鋪的顧客進(jìn)行隨機(jī)的問卷調(diào)查,并對(duì)顧客最終是否購買該產(chǎn)品做了詳細(xì)的記錄。對(duì)數(shù)據(jù)進(jìn)行初步的整理以后,團(tuán)隊(duì)成員計(jì)劃通過運(yùn)用logistic回歸的方法來檢驗(yàn)消費(fèi)者人口特征對(duì)其是否購買該產(chǎn)品的影響。11.5案例分析二、數(shù)據(jù)及其說明剔除無效樣本,并對(duì)數(shù)據(jù)進(jìn)行編碼后發(fā)現(xiàn),收集到有效樣本431份。數(shù)據(jù)項(xiàng)包括:是否購買(purchase)、性別(gender)、年齡(age)、收入水平(income)。是否購買作為被解釋變量(0/1二分類變量),其余各變量作為解釋變量,且其中性別和收入水平為類別變量,年齡為數(shù)值型變量。11.5案例分析三、數(shù)據(jù)分析表11-4分類表a,b

已觀測已預(yù)測

是否購買百分比校正

不購買購買步驟0是否購買不購買2690100.0購買1620.0總計(jì)百分比

62.4a.模型中包括常量。b.切割值為.50011.5案例分析三、數(shù)據(jù)分析表11-5方程中的變量

BS.E,WalsdfSig.Exp(B)EXP(B)的95%C.I.下限上限步驟1aage.025.0181.9741.1601.026.9901.062gender.511.2095.9541.0151.6671.1062.513income

12.3052.002

income(1)-.787.2539.6761.002.455.277.748income(2)-.686.2437.9451.005.503.312.811常量-1.836.7865.4571.019.159

a.在步驟1中輸入的變量:age,gender,income.

11.5案例分析三、結(jié)論

通過運(yùn)用logistic

回歸分析的方法發(fā)現(xiàn),消費(fèi)者是否購買該產(chǎn)品顯著的受到性別和收入水平的影響。其中女性消費(fèi)者比男性消費(fèi)者更青睞于購買該產(chǎn)品。此外,該產(chǎn)品更適合于低收入群體,因?yàn)橹小?/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論