Probit回歸概率單位回歸_第1頁
Probit回歸概率單位回歸_第2頁
Probit回歸概率單位回歸_第3頁
Probit回歸概率單位回歸_第4頁
Probit回歸概率單位回歸_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

會計學1Probit回歸概率單位回歸Logistic回歸因變量二項Logistic回歸多項Logistic回歸有序回歸Probit回歸第1頁/共29頁第15章Probit回歸(概率單位回歸)15.1Probit回歸的基本原理15.2Probit回歸的案例分析第2頁/共29頁15.1Probit回歸的基本原理Probit回歸即概率單位回歸,主要用來測試分析刺激強度與反應比例之間關系的關系。例如,對于指定數(shù)量的病人,分析他們的給藥劑量與治愈比例之間的關系。此方法應用的典型例子是分析殺蟲劑濃度和殺死害蟲數(shù)量之間的關系,并據(jù)此判斷什么樣的劑量濃度是最佳的。Probit回歸適用于對反應變量(因變量)為分類變量的資料進行統(tǒng)計分析,也存在反應變量為二分類、有序多分類、無序多分類三種情況,但目前最常用的是二分類的情形,SPSS也僅能處理反應變量為二分類的資料。第3頁/共29頁15.1Probit回歸的基本原理Probit回歸與Logistic回歸相似,也是擬合0-1型因變量回歸的方法,即把取值分布在實數(shù)范圍內(nèi)的變量通過累積概率函數(shù)轉換成取值分布在(0,1)區(qū)間的概率值。所得概率分布的表達式為:Probit回歸常用的累積概率函數(shù)有兩個:(1)logit概率函數(shù):通過變換可以得到另一種等價形式:第4頁/共29頁(2)標準正態(tài)累計概率函數(shù):單一解釋變量:多變量:分別為標準正態(tài)分布的分布函數(shù)與密度函數(shù)。15.1Probit回歸的基本原理據(jù)此建立的Probit回歸模型:或第5頁/共29頁Probit模型的邊際分析自變量的變化對響應概率(p)的影響:

一般情況下對連續(xù)變量,X取樣本均值,指的是X在平均意義上每增加一個單位會導致事件發(fā)生的概率將會變化多少個單位。第6頁/共29頁15.1Probit回歸的基本原理Probit回歸的數(shù)據(jù)要求因變量(響應變量)應該是計數(shù)信息,記錄在指定的自變量條件下,有響應的觀測個數(shù)。自變量(因子變量)必須是分類變量且須用整數(shù)編碼。觀測量應該是獨立的。如果自變量值的數(shù)量與觀察值的數(shù)量相比過多,否則卡方檢驗和擬合優(yōu)度檢驗是不適宜的對Probit過程的參數(shù)估計同樣采用極大似然估計法,構建Probit過程時要求樣本采取隨機抽取方式抽取,即要求樣本分布與總體分布具有同一性。概率回歸時,最有用的是半數(shù)發(fā)生量。如收入到多少時,有一半家庭會購買。毒素濃度達到多少時,有一半的小白鼠會死亡。第7頁/共29頁15.1Probit回歸的基本原理Probit回歸與logistic回歸的關系當Probit回歸過程選擇了Logit變換時,進行的統(tǒng)計分析過程就是Logistic回歸。Logistic模型強調因變量的最終結果是發(fā)生還是不發(fā)生,其取值有明顯的0~1分化。而概率回歸研究的是在因變量具有兩種相反屬性時,隨著自變量的變化,因變量取某屬性的比例變化情況。如家庭購買電腦的比例與家庭人均收入之間的關系,研究的不是在某各收入水平下是否會購買,而是在不同的收入水平下購買的比例。一般情況下:Probit回歸更適用于從有計劃的試驗中獲得的數(shù)據(jù),而Logistic回歸更適用于直接的觀測數(shù)據(jù)。Probit回歸輸出對各種響應比例有效值的估計,Logistic回歸輸出對自變量發(fā)生比(OR)的估計。第8頁/共29頁Probit曲線和logit曲線很相似。兩條曲線都是在pi=0.5處有拐點,但logit曲線在兩個尾部要比Probit曲線厚。累積正態(tài)概率分布曲線

Logistic分布函數(shù)第9頁/共29頁實際應用中,對于同一資料用Probit回歸與Logistic回歸分析的結果非常接近。但Logistic回歸的應用比Probit回歸更廣泛。這是因為:Logistic回歸中的偏回歸系數(shù)可以計算其exp(b),即OR值,可以得到很好的直觀解釋與應用。Probit回歸模型中偏回歸系數(shù)的含義為其他自變量取值保持不變時自變量每改變一個單位,出現(xiàn)某結果的概率密度函數(shù)值的改變量。顯然解釋起來比較麻煩,遠不如Logistic模型中,這也導致了研究者更喜歡使用Logistic模型。目前有很多針對Logistic回歸模型的診斷及補救措施,而對于Probit回歸而言而有信方面相對缺乏。當然,這類似"先有雞還是先有蛋"的問題,很難說是因為模型診斷措施較多而導致了Logistic回歸的更多應用,還是說因為Logistic回歸更多的應用促進了其模型診斷措施的發(fā)展。第10頁/共29頁15.2Probit回歸的案例分析例1:某醫(yī)師希望研究病人的年齡(歲)、性別co為女性,1為男性)、心電圖檢驗是否異常(ST段壓低,0為正常、1為輕度異常、2為重度異常)與患冠心病是否有關,數(shù)據(jù)文件為“冠心病影響.sav”擬合Logistic回歸模型因變量:ca;協(xié)變量:sex,ecg、ageexp(B):自變量增加一個單位,

總體研究對象患病率與未患病率的比值/倍數(shù)(優(yōu)勢比的變化率)。第11頁/共29頁15.2Probit回歸的案例分析擬合probit回歸模型SPSS默認變量取值=1表示出現(xiàn)陽性結果(患?。┯捎赟PSS默認的是對頻數(shù)表資料進行Probit回歸分析,而本例資料并非各自變量不同取值水平組合的頻數(shù)表資料,每一條記錄表示一個觀察對象,此處需指定一個頻數(shù)變量count=1。其方法有如下幾種:直接定義頻數(shù)變量count,并錄入數(shù)據(jù)1轉換——計算變量:count=1語法:COMPUTEcount=1.

EXECUTE.第12頁/共29頁15.2Probit回歸的案例分析擬合probit回歸模型SPSS操作:分析——回歸——probit前者為用標準正態(tài)累計概率函數(shù)的反函數(shù)來轉換響應比例,后者為logit變換代表在自變量的指定水平下,對有響應的觀測的計數(shù)信息,取值非負代表在自變量的指定水平下,總的觀測計數(shù),取值不能小于相應的響應頻數(shù)變量值須為整數(shù)編碼的分類變量,須指定最大和最小值代表不同的實驗刺激條件設置變量轉換函數(shù),當協(xié)變量與概率之間不存在現(xiàn)行關系時,需要選擇對協(xié)變量的轉換方式默認為無,自動給出控制組第13頁/共29頁輸出觀測頻數(shù)、預測頻數(shù)、觀測值的殘差等。輸出因素變量水平間的半數(shù)效應及其致信區(qū)間對所有因子水平具有共同的斜率這一假設的檢驗,若沒有因子變量,則相關中位數(shù)力不可用輸出指定響應比例的刺激劑量的置信區(qū)間當選入多個些變量,相關中位數(shù)力和信仰置信區(qū)間不可用,只有選入一個因素變量,兩者才可以用指定在沒有刺激的條件下(即劑量為0),是否有一個自然響應率無:沒有自然響應率從樣本數(shù)據(jù)估計其自然響應率值:輸入指定的自然響應率,取值必須小于1。例如,如果當激勵為0時響應在10%的時間里發(fā)生,則輸入0.10。第14頁/共29頁共有78條非頻數(shù)表資料記錄納入分析,其中66條記錄出現(xiàn)陰性結果(ControlGroup)回歸系數(shù)/標準誤,即Z檢驗統(tǒng)計量p=Φ(-3.364+0.804?sex+0.520?ecg+0.056?

age)或者寫成:probit(p)=-3.364+0.804?sex+0.520?ecg+0.0564?

age)顯著!第15頁/共29頁參數(shù)估計值得協(xié)方差和相關性卡方檢驗:原假設是模型能很好地擬合數(shù)據(jù),根據(jù)P>a接受原假設,故模型擬合較好平行檢驗:P>a,可以認為因素變量個分組的回歸方程具有相同的斜率。第16頁/共29頁Probit回歸系數(shù)的解釋問題:以年齡age為例,其偏回歸系數(shù)為0.056,表示當性別、心電圖保持不變時,年齡每增加一歲,患冠心病的概率密度函數(shù)值增加0.056。進一步舉例如下:設對于性別為男性、心電圖檢驗結果為輕度異常、年齡30歲的人患冠心病的概率為0.40,則相應的概率密度函數(shù)值為-0.253,則相同性別、相同心電圖檢驗結果,年齡為31歲者患冠心病的概率密度函數(shù)值為-0.253+0.056=-0.197,相應的概率為0.422。則30歲、31歲時患病與未患病的比值比分別為0.4/(1-0.4)=0.667、0.422/(1-0.422)=0.729,此時的OR值為0.729/0.667=1.094,與Logistic回歸分析結果中的exp(β)=1.097一致。p=Φ(-3.364+0.804?sex+0.520?ecg+0.0564?

age)或者寫成:probit(p)=-3.364+0.804?sex+0.520?ecg+0.0564?

age)第17頁/共29頁15.2Probit回歸的案例分析例2:某公司在不同營業(yè)所(網(wǎng)上、貨架、店鋪)采用了不同的促銷價格,請使用probit回歸對不同促銷價格和對促銷有反饋的顧客數(shù)量之間的關系進行分析,并擬合響應模型。數(shù)據(jù)文件為:“促銷效果評價數(shù)據(jù).sav”第18頁/共29頁協(xié)變量和三個截距項對方程的作用都有顯著意義顯著!由此可得對三種營業(yè)場所的probit回歸方程:網(wǎng)上:probit(p)=-7.219+1.88*ln(促銷價格)貨架:probit(p)=-7.613+1.88*ln(促銷價格)店鋪:probit(p)=-7.982+1.88*ln(促銷價格)第19頁/共29頁自然響應率估計值:在沒有促銷活動的情況下,總顧客中仍會有4.1%的人購買產(chǎn)品。模型擬合非常好,因素變量各分組的回歸方程具有相同的斜率,滿足平行性假設條件第20頁/共29頁置信區(qū)間表:顯示的是制定銷售地點的相應概率。響應概率probit=0.5時,促銷價格半數(shù)響應估計值:網(wǎng)上為46.518,貨架為57.905,店鋪69.8,可見網(wǎng)上促銷最有效刺激強度反應比例第21頁/共29頁相對中位數(shù)強度估計值,即相對半數(shù)效應表。以第一行為例說明:第一行為網(wǎng)上促銷(地點取值為1)對貨架促銷(地點取值為2)的相對半數(shù)效應,網(wǎng)上與貨架半數(shù)效應比值的估計值為0.803,且其95%的直線區(qū)間不包含1,說明兩者是有明顯區(qū)別的,也就是說網(wǎng)上促銷更有效,因為它能以較小的促銷價格促使50%的顧客購買產(chǎn)品(即達到50%的響應率。)第22頁/共29頁響應概率與對數(shù)促銷價格呈明顯的現(xiàn)行趨勢,說明對促銷價格選擇自然對數(shù)轉換是比較合適的。如果不呈現(xiàn)明顯線性趨勢,可以嘗試其他轉換方法分析。網(wǎng)上促銷的probit普遍大于其他兩種方式第23頁/共29頁第24頁/共29頁序號性別年齡(歲)月收入(千元)序號性別年齡(歲)月收入(千元)10183.850151204.00020214.200161254.20030233.851171274.30040233.951181284.50050284.201191303.95160313.850201324.00070364.501211334.80080424.001221334.00090463.951231384.200100484.200241414.500110554.801251454.801120565

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論