版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第11章
邏輯回歸1第11章邏輯回歸分析——目錄11.1邏輯回歸模型11.2估計邏輯回歸模型11.3顯著性檢驗11.4回歸系數(shù)的含義11.5案例分析2許多社會科學(xué)問題中的因變量往往是分類變量。比如,政治學(xué)中經(jīng)常研究的是否選舉某候選人,候選人的類型等;又如,經(jīng)濟(jì)學(xué)研究中所涉及的是否銷售或購買某種商品、是否簽訂一份合同,保險是否違約,違約有哪些類型等等。這些分類變量中有一類特殊的變量,遵循二值取值原則,要么“是”或“發(fā)生”,要么“否”或“未發(fā)生”。統(tǒng)計上我們將這樣的變量稱作二分類變量(Binaryvariable)。3應(yīng)用背景多元回歸模型分析二分類變量的局限性被解釋變量的取值區(qū)間受限制自變量的邊際分析不符合實際分析二分類變量的方法利用概率轉(zhuǎn)化模型調(diào)整二分類變量使其線性化,也即,使其隨著自變量的變化,這一概率的值總是在0到1之間變化。11.1邏輯回歸模型Logistic函數(shù)Logistic回歸方程11.1邏輯回歸模型——概率轉(zhuǎn)換方法
似然函數(shù)其中,11.2估計邏輯回歸模型——最大似然估計追求似然函數(shù)最大值的過程就是追求對數(shù)似然函數(shù)值最大值的過程。對數(shù)似然函數(shù)值越大,意味著模型較好地擬合樣本數(shù)據(jù)的可能性也越大,所得模型的擬合優(yōu)度越高。整體模型的檢驗和評價11.3顯著性檢驗
整體模型的檢驗和評價11.3顯著性檢驗判錯矩陣預(yù)測值01正確率觀測值01總體正確率判錯矩陣是一種極為直觀的評價模型優(yōu)劣的方法,它通過矩陣表格的形式展現(xiàn)預(yù)測值與實際觀測值的吻合程度。整體模型的檢驗和評價11.3顯著性檢驗Cox&SnellR2統(tǒng)計量Cox&SnellR2統(tǒng)計量與一般線性回歸分析中的R2有相似之處,也是方程對被解釋變量變差解釋程度的反映。缺點是取值范圍不易確定,因此使用時不方便。NagelkerkeR2統(tǒng)計量Cox&SnellR2統(tǒng)計量取值在0~1之間,越接近1說明方程的擬合優(yōu)度越高?;貧w系數(shù)的顯著性檢驗
11.3顯著性檢驗
Wald統(tǒng)計量多重共線性檢驗
應(yīng)當(dāng)注意,如果解釋變量存在多重共線性會對Wald檢驗統(tǒng)計量產(chǎn)生影響。由于用于logistic回歸建模的很多軟件包,如
Excel,SPSS,和R并不提供共線性的問題檢驗,所以如果用戶想檢驗共線性問題,可以就給定的自變量做一個線性回歸模型,并輸出共線性診斷指標(biāo),就可以了解自變量的相關(guān)情況。11.4邏輯回歸系數(shù)的意義平均個人偏效應(yīng)和平均偏效應(yīng)Logistic回歸模型的解釋涉及到對建立回歸方程所包含的自變量的分析。也即,我們常常想估計xi對響應(yīng)概率P(y=1|X)的影響。若xi是(大致)連續(xù)的,則對xi的較小變化,有:比例因子
11.4邏輯回歸系數(shù)的意義平均個人偏效應(yīng)和平均偏效應(yīng)
平均個人偏效應(yīng)表示將每個解釋變量都代之以樣本平均值而得到常數(shù)比例因子,利用該常數(shù)比例因子乘以對應(yīng)的xi的系數(shù)βi
即得到平均個人偏效應(yīng)。數(shù)學(xué)表達(dá)式為:平均個人偏效應(yīng)(PEA)平均偏效應(yīng)表示將樣本中所有個體的偏效應(yīng)取平均而得到常數(shù)比例因子。數(shù)學(xué)表達(dá)式為:平均偏效應(yīng)(PEA)11.4邏輯回歸系數(shù)的意義
根據(jù)平均個人偏效應(yīng)的定義,將年齡的樣本均值40.00代入公式可計算年齡對購買該產(chǎn)品響應(yīng)概率影響的平均個人偏效應(yīng)PEA;將根據(jù)個人偏效應(yīng)的定義,將年齡的樣本所有取值代入公式可得年齡對購買該產(chǎn)品響應(yīng)概率影響的個人偏效應(yīng)APE。
由于logistic模型中,自變量與響應(yīng)概率之間的關(guān)系是非線性的,因此平均個人偏效應(yīng)和平均偏效應(yīng)存在差異。11.4邏輯回歸系數(shù)的意義發(fā)生比Logistic回歸模型的解釋涉及到對建立回歸方程所包含的自變量的分析。利用logistic回歸,直接解釋自變量和y=1的概率之間的關(guān)系非常困難,統(tǒng)計學(xué)上,通過定義發(fā)生比和比值比對logistic回歸方程做出解釋。發(fā)生比
發(fā)生比被定義為事件將要發(fā)生的概率與該事件將不會發(fā)生的概率之比。11.4邏輯回歸系數(shù)的意義比值比比值比(Oddsratio)度量了當(dāng)一組自變量中只有一個自變量增加了一個單位時對事件發(fā)生概率(Odds)的影響。比值比是當(dāng)給定的一組自變量中一個自變量增加了一個單位,y=1發(fā)生概率(Odds1)除以該組自變量的值都沒有變化時y=1發(fā)生概率(Odds0)
比值比(Oddsratio)11.4邏輯回歸系數(shù)的意義
此時,我們想要知道去年消費支出為2萬元,且擁有信用卡的顧客使用優(yōu)惠券的機會比與去年消費支出為2萬元,但沒有信用卡額度顧客使用優(yōu)惠券的機會比精細(xì)比較,也即,當(dāng)解釋變量x2增加一個單位時的影響:
因此,去年消費支出為2萬元,且擁有信用卡的顧客使用優(yōu)惠券的機會比是去年消費支出為2萬元,但沒有信用卡的顧客使用優(yōu)惠券的機會比的3倍。11.5案例分析一、案例背景
某商品銷售人員在長期推銷該產(chǎn)品的過程中發(fā)現(xiàn),消費者是否購買該產(chǎn)品受到很強的消費者人口結(jié)構(gòu)特征的影響。比如性別、年齡以及收入水平。為了驗證自己的猜想,以及在未來的銷售活動中能更好的,有針對性的,對可能購買該產(chǎn)品的顧客提供更好的服務(wù)。經(jīng)與銷售主管的商議,該銷售團(tuán)隊對到達(dá)商鋪的顧客進(jìn)行隨機的問卷調(diào)查,并對顧客最終是否購買該產(chǎn)品做了詳細(xì)的記錄。對數(shù)據(jù)進(jìn)行初步的整理以后,團(tuán)隊成員計劃通過運用logistic回歸的方法來檢驗消費者人口特征對其是否購買該產(chǎn)品的影響。11.5案例分析二、數(shù)據(jù)及其說明剔除無效樣本,并對數(shù)據(jù)進(jìn)行編碼后發(fā)現(xiàn),收集到有效樣本431份。數(shù)據(jù)項包括:是否購買(purchase)、性別(gender)、年齡(age)、收入水平(income)。是否購買作為被解釋變量(0/1二分類變量),其余各變量作為解釋變量,且其中性別和收入水平為類別變量,年齡為數(shù)值型變量。11.5案例分析三、數(shù)據(jù)分析表11-4分類表a,b
已觀測已預(yù)測
是否購買百分比校正
不購買購買步驟0是否購買不購買2690100.0購買1620.0總計百分比
62.4a.模型中包括常量。b.切割值為.50011.5案例分析三、數(shù)據(jù)分析表11-5方程中的變量
BS.E,WalsdfSig.Exp(B)EXP(B)的95%C.I.下限上限步驟1aage.025.0181.9741.1601.026.9901.062gender.511.2095.9541.0151.6671.1062.513income
12.3052.002
income(1)-.787.2539.6761.002.455.277.748income(2)-.686.2437.9451.005.503.312.811常量-1.836.7865.4571.019.159
a.在步驟1中輸入的變量:age,gender,income.
11.5案例分析三、結(jié)論
通過運用logistic
回歸分析的方法發(fā)現(xiàn),消費者是否購買該產(chǎn)品顯著的受到性別和收入水平的影響。其中女性消費者比男性消費者更青睞于購買該產(chǎn)品。此外,該產(chǎn)品更適合于低收入群體,因為中、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024至2030年中國短信門禁考勤系統(tǒng)行業(yè)投資前景及策略咨詢研究報告
- 2024至2030年音頻適配器項目投資價值分析報告
- 2024年電子式燃?xì)鈺r控保險閥項目可行性研究報告
- 2024年工商兩用型條碼列印機項目可行性研究報告
- 2024年大型異型巖棉管殼項目可行性研究報告
- 2024年噴霧膠項目可行性研究報告
- 中國柔光燈行業(yè)發(fā)展現(xiàn)狀及盈利前景預(yù)測研究報告(2024-2030版)
- 中國無紡布袋市場競爭態(tài)勢與前景動態(tài)分析研究報告(2024-2030版)
- 中國數(shù)據(jù)中心服務(wù)器電源行業(yè)現(xiàn)狀趨勢與需求前景預(yù)測研究報告(2024-2030版)
- 中國寵物飼料市場深度調(diào)查研究報告(2024-2030版)
- 翻轉(zhuǎn)課堂講解培訓(xùn)PPT反轉(zhuǎn)課堂式教學(xué)模式介紹PPT課件(帶內(nèi)容)
- 批創(chuàng)思維導(dǎo)論(答案)
- 基礎(chǔ)教育改革專題課件
- 市場開發(fā)培訓(xùn)課件
- 聚乳酸(PLA)生物可降解材料課件
- 初中歷史人教九年級上冊(統(tǒng)編2023年更新) 資本主義制度的初步確立 教學(xué)設(shè)計(正式版)
- DB11-T1884-2021供熱與燃?xì)夤艿拦こ淌┕ぐ踩夹g(shù)規(guī)程
- 企業(yè)風(fēng)險分析表格
- 公安派出所建筑外觀形象設(shè)計規(guī)范1
- 產(chǎn)品標(biāo)識控制程序文件
- (施工方案)雙梁橋式起重機安裝施工方案
評論
0/150
提交評論