版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第11章
邏輯回歸1第11章邏輯回歸分析——目錄11.1邏輯回歸模型11.2估計(jì)邏輯回歸模型11.3顯著性檢驗(yàn)11.4回歸系數(shù)的含義11.5案例分析2許多社會(huì)科學(xué)問題中的因變量往往是分類變量。比如,政治學(xué)中經(jīng)常研究的是否選舉某候選人,候選人的類型等;又如,經(jīng)濟(jì)學(xué)研究中所涉及的是否銷售或購買某種商品、是否簽訂一份合同,保險(xiǎn)是否違約,違約有哪些類型等等。這些分類變量中有一類特殊的變量,遵循二值取值原則,要么“是”或“發(fā)生”,要么“否”或“未發(fā)生”。統(tǒng)計(jì)上我們將這樣的變量稱作二分類變量(Binaryvariable)。3應(yīng)用背景多元回歸模型分析二分類變量的局限性被解釋變量的取值區(qū)間受限制自變量的邊際分析不符合實(shí)際分析二分類變量的方法利用概率轉(zhuǎn)化模型調(diào)整二分類變量使其線性化,也即,使其隨著自變量的變化,這一概率的值總是在0到1之間變化。11.1邏輯回歸模型Logistic函數(shù)Logistic回歸方程11.1邏輯回歸模型——概率轉(zhuǎn)換方法
似然函數(shù)其中,11.2估計(jì)邏輯回歸模型——最大似然估計(jì)追求似然函數(shù)最大值的過程就是追求對(duì)數(shù)似然函數(shù)值最大值的過程。對(duì)數(shù)似然函數(shù)值越大,意味著模型較好地?cái)M合樣本數(shù)據(jù)的可能性也越大,所得模型的擬合優(yōu)度越高。整體模型的檢驗(yàn)和評(píng)價(jià)11.3顯著性檢驗(yàn)
整體模型的檢驗(yàn)和評(píng)價(jià)11.3顯著性檢驗(yàn)判錯(cuò)矩陣預(yù)測值01正確率觀測值01總體正確率判錯(cuò)矩陣是一種極為直觀的評(píng)價(jià)模型優(yōu)劣的方法,它通過矩陣表格的形式展現(xiàn)預(yù)測值與實(shí)際觀測值的吻合程度。整體模型的檢驗(yàn)和評(píng)價(jià)11.3顯著性檢驗(yàn)Cox&SnellR2統(tǒng)計(jì)量Cox&SnellR2統(tǒng)計(jì)量與一般線性回歸分析中的R2有相似之處,也是方程對(duì)被解釋變量變差解釋程度的反映。缺點(diǎn)是取值范圍不易確定,因此使用時(shí)不方便。NagelkerkeR2統(tǒng)計(jì)量Cox&SnellR2統(tǒng)計(jì)量取值在0~1之間,越接近1說明方程的擬合優(yōu)度越高。回歸系數(shù)的顯著性檢驗(yàn)
11.3顯著性檢驗(yàn)
Wald統(tǒng)計(jì)量多重共線性檢驗(yàn)
應(yīng)當(dāng)注意,如果解釋變量存在多重共線性會(huì)對(duì)Wald檢驗(yàn)統(tǒng)計(jì)量產(chǎn)生影響。由于用于logistic回歸建模的很多軟件包,如
Excel,SPSS,和R并不提供共線性的問題檢驗(yàn),所以如果用戶想檢驗(yàn)共線性問題,可以就給定的自變量做一個(gè)線性回歸模型,并輸出共線性診斷指標(biāo),就可以了解自變量的相關(guān)情況。11.4邏輯回歸系數(shù)的意義平均個(gè)人偏效應(yīng)和平均偏效應(yīng)Logistic回歸模型的解釋涉及到對(duì)建立回歸方程所包含的自變量的分析。也即,我們常常想估計(jì)xi對(duì)響應(yīng)概率P(y=1|X)的影響。若xi是(大致)連續(xù)的,則對(duì)xi的較小變化,有:比例因子
11.4邏輯回歸系數(shù)的意義平均個(gè)人偏效應(yīng)和平均偏效應(yīng)
平均個(gè)人偏效應(yīng)表示將每個(gè)解釋變量都代之以樣本平均值而得到常數(shù)比例因子,利用該常數(shù)比例因子乘以對(duì)應(yīng)的xi的系數(shù)βi
即得到平均個(gè)人偏效應(yīng)。數(shù)學(xué)表達(dá)式為:平均個(gè)人偏效應(yīng)(PEA)平均偏效應(yīng)表示將樣本中所有個(gè)體的偏效應(yīng)取平均而得到常數(shù)比例因子。數(shù)學(xué)表達(dá)式為:平均偏效應(yīng)(PEA)11.4邏輯回歸系數(shù)的意義
根據(jù)平均個(gè)人偏效應(yīng)的定義,將年齡的樣本均值40.00代入公式可計(jì)算年齡對(duì)購買該產(chǎn)品響應(yīng)概率影響的平均個(gè)人偏效應(yīng)PEA;將根據(jù)個(gè)人偏效應(yīng)的定義,將年齡的樣本所有取值代入公式可得年齡對(duì)購買該產(chǎn)品響應(yīng)概率影響的個(gè)人偏效應(yīng)APE。
由于logistic模型中,自變量與響應(yīng)概率之間的關(guān)系是非線性的,因此平均個(gè)人偏效應(yīng)和平均偏效應(yīng)存在差異。11.4邏輯回歸系數(shù)的意義發(fā)生比Logistic回歸模型的解釋涉及到對(duì)建立回歸方程所包含的自變量的分析。利用logistic回歸,直接解釋自變量和y=1的概率之間的關(guān)系非常困難,統(tǒng)計(jì)學(xué)上,通過定義發(fā)生比和比值比對(duì)logistic回歸方程做出解釋。發(fā)生比
發(fā)生比被定義為事件將要發(fā)生的概率與該事件將不會(huì)發(fā)生的概率之比。11.4邏輯回歸系數(shù)的意義比值比比值比(Oddsratio)度量了當(dāng)一組自變量中只有一個(gè)自變量增加了一個(gè)單位時(shí)對(duì)事件發(fā)生概率(Odds)的影響。比值比是當(dāng)給定的一組自變量中一個(gè)自變量增加了一個(gè)單位,y=1發(fā)生概率(Odds1)除以該組自變量的值都沒有變化時(shí)y=1發(fā)生概率(Odds0)
比值比(Oddsratio)11.4邏輯回歸系數(shù)的意義
此時(shí),我們想要知道去年消費(fèi)支出為2萬元,且擁有信用卡的顧客使用優(yōu)惠券的機(jī)會(huì)比與去年消費(fèi)支出為2萬元,但沒有信用卡額度顧客使用優(yōu)惠券的機(jī)會(huì)比精細(xì)比較,也即,當(dāng)解釋變量x2增加一個(gè)單位時(shí)的影響:
因此,去年消費(fèi)支出為2萬元,且擁有信用卡的顧客使用優(yōu)惠券的機(jī)會(huì)比是去年消費(fèi)支出為2萬元,但沒有信用卡的顧客使用優(yōu)惠券的機(jī)會(huì)比的3倍。11.5案例分析一、案例背景
某商品銷售人員在長期推銷該產(chǎn)品的過程中發(fā)現(xiàn),消費(fèi)者是否購買該產(chǎn)品受到很強(qiáng)的消費(fèi)者人口結(jié)構(gòu)特征的影響。比如性別、年齡以及收入水平。為了驗(yàn)證自己的猜想,以及在未來的銷售活動(dòng)中能更好的,有針對(duì)性的,對(duì)可能購買該產(chǎn)品的顧客提供更好的服務(wù)。經(jīng)與銷售主管的商議,該銷售團(tuán)隊(duì)對(duì)到達(dá)商鋪的顧客進(jìn)行隨機(jī)的問卷調(diào)查,并對(duì)顧客最終是否購買該產(chǎn)品做了詳細(xì)的記錄。對(duì)數(shù)據(jù)進(jìn)行初步的整理以后,團(tuán)隊(duì)成員計(jì)劃通過運(yùn)用logistic回歸的方法來檢驗(yàn)消費(fèi)者人口特征對(duì)其是否購買該產(chǎn)品的影響。11.5案例分析二、數(shù)據(jù)及其說明剔除無效樣本,并對(duì)數(shù)據(jù)進(jìn)行編碼后發(fā)現(xiàn),收集到有效樣本431份。數(shù)據(jù)項(xiàng)包括:是否購買(purchase)、性別(gender)、年齡(age)、收入水平(income)。是否購買作為被解釋變量(0/1二分類變量),其余各變量作為解釋變量,且其中性別和收入水平為類別變量,年齡為數(shù)值型變量。11.5案例分析三、數(shù)據(jù)分析表11-4分類表a,b
已觀測已預(yù)測
是否購買百分比校正
不購買購買步驟0是否購買不購買2690100.0購買1620.0總計(jì)百分比
62.4a.模型中包括常量。b.切割值為.50011.5案例分析三、數(shù)據(jù)分析表11-5方程中的變量
BS.E,WalsdfSig.Exp(B)EXP(B)的95%C.I.下限上限步驟1aage.025.0181.9741.1601.026.9901.062gender.511.2095.9541.0151.6671.1062.513income
12.3052.002
income(1)-.787.2539.6761.002.455.277.748income(2)-.686.2437.9451.005.503.312.811常量-1.836.7865.4571.019.159
a.在步驟1中輸入的變量:age,gender,income.
11.5案例分析三、結(jié)論
通過運(yùn)用logistic
回歸分析的方法發(fā)現(xiàn),消費(fèi)者是否購買該產(chǎn)品顯著的受到性別和收入水平的影響。其中女性消費(fèi)者比男性消費(fèi)者更青睞于購買該產(chǎn)品。此外,該產(chǎn)品更適合于低收入群體,因?yàn)橹小?/p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 倉儲(chǔ)人員培訓(xùn)與績效管理
- 2024年度學(xué)校食堂食品采購配送合同3篇
- 2024年展覽海報(bào)制作保密合同版B版
- 2024年度CAD技術(shù)員培訓(xùn)與就業(yè)服務(wù)合同3篇
- 2024年度水利工程項(xiàng)目安全生產(chǎn)及文明施工管理協(xié)議2篇
- 2024年汽車模具互換合同
- 2024年民事離婚和解合同模板版B版
- 2024年標(biāo)準(zhǔn)肥料物流配送服務(wù)協(xié)議模板版
- 2024年度綠色環(huán)保產(chǎn)業(yè)商業(yè)策劃合同3篇
- 供苗草坪合同范例
- 廣東省陽江市江城區(qū)2023-2024學(xué)年部編版八年級(jí)歷史上學(xué)期期末試卷
- 《中藥膏方講座》課件
- 上消化道穿孔教學(xué)查房課件
- 暴發(fā)性心肌炎的治療及護(hù)理
- 現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)園總體規(guī)劃方案
- 氣割廢鐵施工方案
- 道路危險(xiǎn)貨物運(yùn)輸車輛的安全檢查和隱患排查
- 2023-2024學(xué)年杭州市上城區(qū)數(shù)學(xué)六年級(jí)第一學(xué)期期末調(diào)研試題含答案
- 職稱評(píng)聘評(píng)委承諾書
- 游泳安全保障制度和措施
- 超聲設(shè)備維修與保養(yǎng)教學(xué)課件
評(píng)論
0/150
提交評(píng)論