




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第8章回歸分析1、回歸分析概述2、線性回歸3、非線性回歸分析4、含定性自變量的回歸5、含定性因變量的回歸12某地區(qū)電影票房分析票房受到疫情影響的當下,人們還愿意看電影嗎?看電影應考慮哪些因素呢?當打開電影票購買界面,面對一部一無所知的電影,我們一眼看到的經常是票價、評分、是否有差評,這些成為快速判斷電影是否值得看的因素。究竟這些因素和電影票房有沒有直接關系?評分高是否票房更高?都是中評的電影是否會比好壞參半的電影票房高?便宜的電影票價是否更具有吸引力?某地區(qū)20個電影的票房數(shù)據如表8-1所示,試圖通過它們在當?shù)啬秤^影軟件上的評分、評分標準差、平均票價等3個元素分別與票房的關系,得到上面問題的答案像本例一樣,研究一個或多個變化的量對某一個量帶來的影響,就是回歸分析的基本思想。本例的問題將在后述正文中逐步解決。引入案例35699.12.14245038.22.02354557.81.93364217.81.64364067.51.68403807.61.61323567.41.56393307.21.53383167.11.52363117.11.53382626.71.51382446.61.46342036.31.44331886.51.42371716.41.41381576.11.50361326.01.35351186.01.3137985.51.2838675.21.2838234.41.2638表8-1某地區(qū)20個電影的票房數(shù)據第1節(jié)回歸分析概述1、基本思想2、數(shù)據的適用范圍48.1.1基本思想Galton發(fā)現(xiàn)∶身材高的父母,他們的孩子身材也高,但這些孩子平均身高并不像他們的父母那樣高;對于比較矮的父母情形也類似,他們的孩子比較矮,但這些孩子的平均身高會高于他們的父母的平均身高。Galton把這種孩子的身高向平均值靠近的趨勢稱為一種回歸效應,而他發(fā)展的研究兩個數(shù)值變量的方法稱為回歸分析?;貧w分析指的是確定兩種以上變量間相互依賴的定量關系的一種統(tǒng)計分析方法。在回歸分析中最基礎的研究對象就是因變量與自變量。5回歸的提出8.1.1基本思想定義8.1因變量∶在回歸分析中被預測或被解釋的變量,也稱為響應變量。定義8.2自變量∶在回歸分析中,用來預測或用來解釋的一個或多個變量。在描述變量之間的關系時,常通過數(shù)學模型描述,也將這個數(shù)學模型稱為回歸模型。從模型本身的構成角度進行定義。68.1.1基本思想
78.1.2數(shù)據的適用范圍根據自變量與因變量的數(shù)據類型不同:分為自變量與因變量均為定量數(shù)據、自變量是定性數(shù)據、因變量是定性數(shù)據、自變量與因變量均為定性數(shù)據等四種類型。從時間角度上看,回歸分析可以用于分析橫截面數(shù)據、時間序列數(shù)據、面板數(shù)據。88.1.2數(shù)據的適用范圍橫截面數(shù)據:同—時間截面上不同統(tǒng)計單位相同統(tǒng)計指標組成的數(shù)據列。橫截面數(shù)據不要求統(tǒng)計對象及其范圍相同、但要求統(tǒng)計的時間相同。時間序列數(shù)據:不同時間點上收集到的數(shù)據,這類數(shù)據反映了某—事物,現(xiàn)象等隨時間的變化狀態(tài)或程度。面板數(shù)據:截面數(shù)據與時間序列數(shù)據綜合起來的一種數(shù)據類型,它有時間序列和截面兩個維度。面板數(shù)據是排在一個平面上,與只有一個維度的數(shù)據排在一條線上有著明顯的不同。9第2節(jié)線性回歸1、線性回歸模型2、參數(shù)的最小二乘估計3、擬合優(yōu)度4、顯著性檢驗5、殘差分析6、回歸方程的預測與估計7、線性回歸與正則化8、常見的違背經典假設的情況9、SPSS回歸分析實例10第2節(jié)線性回歸
118.2.1線性回歸模型
128.2.1線性回歸模型
138.2.1線性回歸模型
148.2.1線性回歸模型當k=1時,是一元線性回歸方程,圖像是一條直線,稱為直線回歸方程。當k≥2時,是多元線性回歸方程,以含有兩個自變量的線性回歸方程為例,它的圖像是三維空間中的一個平面。158.2.2參數(shù)的最小二乘估計
168.2.2參數(shù)的最小二乘估計
178.2.2參數(shù)的最小二乘估計
188.2.2參數(shù)的最小二乘估計
19年份201120122013201420152016201720182019x/億元789.51827.61950.68994.901331.031594.441769.491733.762087.07y/(元/平方米)10925.8412000.8813954.014739.014083.016346.017685.0021581.7824015.00
8.2.2參數(shù)的最小二乘估計208.2.3擬合優(yōu)度21最小二乘法得到了估計的回歸方程,它可以描述自變量x與因變量y之間的關系,即可以根據x的取值估計出y的取值。而估計出的精度取決于對數(shù)據的擬合程度,這種回歸圖像與觀測點的接近程度稱為回歸圖像對數(shù)據的擬合優(yōu)度。8.2.3擬合優(yōu)度22
離差平方和的分解8.2.3擬合優(yōu)度23
離差平方和的分解由于可以證明因此8.2.3擬合優(yōu)度24定義8.8總平方和(totalsumofsquares,SST)
cE(y-y)稱為總平方和或離差平方和。定義8.9殘差平方和(sumofsquaresoferror,SSE)∶二(y-)2稱為殘差平方和或誤差平方和。定義8.10回歸平方和(sumofsquaresofregression,SSR)∶之(3-元)2稱為回歸平方和。SST=SSR+SSE。離差平方和的分解8.2.3擬合優(yōu)度25
估計標準誤差8.2.3擬合優(yōu)度26
估計標準誤差8.2.4顯著性檢驗27
8.2.4顯著性檢驗28
8.2.4顯著性檢驗29線性關系檢驗是對整體的模型進行顯著性檢驗,只能檢驗出因變量與所有的自變量之間的線性關系是否顯著。定義8.12均方回歸(meansquareduetoregression,MSR)∶將SSR除以相應的自由度(自變量的個數(shù)k)后的結果稱為均方回歸。定義8.13均方殘差(meansquarederror,MSE)∶將SSE
除以相應的自由度(n-k-1)后的結果稱為均方殘差。線性關系的檢驗(F檢驗)8.2.4顯著性檢驗30
線性關系的檢驗(F檢驗)8.2.4顯著性檢驗31在對回歸系數(shù)進行檢驗時,需要對回歸系數(shù)檢驗的個數(shù)進行限制,以避免犯過多第I類錯誤。在檢驗時,對每一個自變量都要單獨進行檢驗。計算檢驗統(tǒng)計量t∶回歸系數(shù)的檢驗(t檢驗)其中8.2.4顯著性檢驗32
回歸系數(shù)的檢驗(t檢驗)8.2.5殘差分析33
誤差項假定分析8.2.5殘差分析34
誤差項假定分析8.2.5殘差分析351、誤差的均值為0圖8-5a:隨機模型結果,殘差看起來比較隨機地分布在0水平線附近,是一個比較理想的殘差圖。圖8-5b所示為非隨機模型結果,殘差呈二次曲線的形狀,隨機誤差的均值在x取值范圍內可能不為0。因此可說明該回歸模型所對應的誤差的均值為0的假設不成立,需要重新檢查回歸模型。誤差項假定分析8.2.5殘差分析36
誤差項假定分析8.2.5殘差分析37
誤差項假定分析8.2.5殘差分析38
誤差項假定分析8.2.5殘差分析393、誤差的方差齊性方差不相等的情況下分為很多種情況,如圖殘差范圍呈梭子狀,殘差取值范圍先隨著x的增大而增大,方差也增大;然后又隨著x的增大而減小,方差也減小很顯然殘差也不是恒定的值。誤差項假定分析8.2.5殘差分析404、誤差的獨立性誤差的獨立性假設就是隨機誤差項之間彼此不相關。為了驗證在該類數(shù)據中的誤差獨立性假設是否滿足,可以繪制殘差與x的關系圖來實現(xiàn)。誤差與x沒有遵循某種規(guī)律,則誤差之間具有獨立性。誤差項假定分析8.2.5殘差分析414、誤差的獨立性如果殘差-x圖呈現(xiàn)了某種規(guī)律,說明各個殘差之間可能存在某種相關性,可能不滿足獨立性要求。圖8-8a中,誤差正負交替出現(xiàn)且周期峰值大致相同,不滿足獨立性要求;圖8-8b中,誤差值出現(xiàn)了隨著x遞減的規(guī)律,不滿足獨立性要求。誤差項假定分析8.2.5殘差分析42
檢測異常值和有影響的觀測值8.2.5殘差分析431、檢測異常值第一種方法是通過散點圖觀察,如圖所示,散點圖中與其他點的趨勢不吻合的點,有可能是異常點,或者稱它為離群點。檢測異常值和有影響的觀測值8.2.5殘差分析441、檢測異常值第二種方法是通過標準化殘差來識別。根據標準化殘差的性質,如果標準化殘差落在(-2,2)區(qū)間以外,可在95%置信度將其判為異常實驗點。如果異常值是一個錯誤的數(shù)據,則應當修正數(shù)據改善回歸的效果;如果標準化殘差偏大,則需要考慮使用更加合適的模型;如果有些異常值是由在可接受范圍內的隨機因素造成的,則應當視情況保留。檢測異常值和有影響的觀測值8.2.5殘差分析452、檢測有影響的觀測值有影響的觀測值,就是指在有這個點和沒有這個點的前后,回歸的結果有很大的不同。這個有影響的觀測值很可能是異常值,即它偏離了其他觀測值形成的趨勢;也可能它的值在趨勢上,但是它對應的自變量x值遠離了其他的觀測值所對應的x。檢測異常值和有影響的觀測值8.2.5殘差分析462、檢測有影響的觀測值第一種方法是通過散點圖觀察,即可以判斷出是異常值的那部分觀測值。由于存在左下角的觀測值,導致回歸直線斜率大于0;而刪去這個觀測點后,回歸直線的斜率就小于0了,像這個觀測點這種能產生巨大影響的值檢測異常值和有影響的觀測值8.2.5殘差分析47
檢測異常值和有影響的觀測值8.2.5殘差分析48
檢測異常值和有影響的觀測值8.2.5殘差分析49
檢測異常值和有影響的觀測值8.2.6回歸方程的預測與估計50
8.2.6回歸方程的預測與估計51
8.2.6回歸方程的預測與估計52
8.2.6回歸方程的預測與估計53
8.2.6回歸方程的預測與估計54置信區(qū)間、預測區(qū)間與回歸方程之間一般滿足某些關系,例如,一元線性方程,存在置信區(qū)間的寬度<預測區(qū)間的寬度,且回歸直線在它們之中的關系8.2.7線性回歸與正則化55
8.2.7線性回歸與正則化56解決方法第一種方法,可盡量減少選取的變量數(shù)量,即舍棄一些變量,保留更為重要的特征變量,但這個方法的缺陷是很明顯的,當舍棄掉一些變量時,同時也會丟失部分有用信息第二種方法,可通過正則化調整,即保留所有的特征,但同時降低參數(shù)的值。8.2.7線性回歸與正則化57
8.2.7線性回歸與正則化58
8.2.7線性回歸與正則化59
8.2.8常見的違背經典假設的情況60在經典假設下,采用最小二乘法可以得到無偏、有效的參數(shù)估計量。實際情況中,設定的模型容易違背經典假設,導致無法得到無偏、有效的參數(shù)估計量,因此要對這些模型進行修正變換。常見的違背經典假設的情況有多重共線性、異方差、自相關三種。8.2.8常見的違背經典假設的情況61
多重共線性8.2.8常見的違背經典假設的情況62多元線性回歸模型中的兩個以上自變量彼此相關的現(xiàn)象。2、多重共線性的負面影響(1)無法判斷單個自變量與因變量之間是否存在顯著的線性相關性,使回歸結果混亂。多重共線性不會影響總體的線性關系檢驗(即F檢驗),但會導致參數(shù)的估計值不穩(wěn)定,對樣本的變化敏感,很難通過t檢驗來判斷單個自變量與因變量之間是否線性相關。(2)使得樣本回歸系數(shù)遠離實際的總體參數(shù),導致違背常理的結果。由于自變量之間的關系產生的"多余信息",多重共線性可能會對參數(shù)估計值的正負號產生影響。當存在多重共線性時,對回歸系數(shù)的解釋是危險的。。多重共線性8.2.8常見的違背經典假設的情況63
多重共線性8.2.8常見的違背經典假設的情況64
異方差8.2.8常見的違背經典假設的情況651、異方差產生的原因(1)模型設定誤差。在求解問題時選擇了錯誤的解釋變量或是錯誤的數(shù)學模型,例如,將對數(shù)模型誤選為線性模型將帶來較大誤差。(2)存在測量誤差。測量誤差往往難以避免,而且隨著時間積累、測量范圍變大以及測量技術的更改,都會導致測量誤差產生變化。(3)模型中缺少某些解釋變量。若是忽略了模型中本該含有的解釋變量,則這個被忽略的變量的影響就會在誤差項中體現(xiàn),從而易產生異方差性。(4)各種因素導致的異常值出現(xiàn)。人類、社會的行為會導致異常值的產生,比如宏觀政策的變動、經濟形勢變化等等。異方差8.2.8常見的違背經典假設的情況66
異方差8.2.8常見的違背經典假設的情況673、異方差的檢驗及補救方法檢驗方法有圖示法、Park檢驗、Glejser檢驗、Goldfeld-Quandt檢驗和White檢驗,可以參閱計量經濟學方面書籍補救方法(1)加權最小二乘法。加權最小二乘法具體而言就是對原最小二乘法模型進行加權,使其不再具有異方差性,之后再進行參數(shù)估計。其基本思路是∶對較小的殘差平方和賦以較高的權重,而對較大的殘差平方和賦以較小的權重,以此來對殘差平方和表現(xiàn)出的偏離中心程度的信息加以修正。異方差8.2.8常見的違背經典假設的情況68
異方差8.2.8常見的違背經典假設的情況69
自相關8.2.8常見的違背經典假設的情況70
自相關8.2.8常見的違背經典假設的情況712、自相關產生的主要原因(1)慣性。經濟時間序列往往存在明顯的慣性,或者可以理解為一種沖擊的滯后效應,具體表現(xiàn)是經濟時間序列變化能持續(xù)一段時間地保持原有的發(fā)展勢頭。(2)模型設定誤差。模型設定誤差往往表現(xiàn)為錯誤選擇函數(shù)模型和忽略了帶有自相關的解釋彎量。與異方美性的產生相似,選擇錯誤的數(shù)學模型以及忽略了該含而未含的變量,都可能產生自相關性。(3)數(shù)據處理過程帶來的自相關。在數(shù)據使用中人們會對數(shù)據進行一定的處理,數(shù)據內插、外推、平均等操作都可能會引入自相關。自相關8.2.8常見的違背經典假設的情況72
自相關8.2.8常見的違背經典假設的情況73
自相關8.2.9SPSS回歸分析實例74在引入案例中,選取20個總票房最高的電影的數(shù)據),使用SPSS求數(shù)據中的豆瓣評分、評分標準差、平均票價,三個元素分別與總票房的關系。第一步在【數(shù)據區(qū)】輸入需要進行分析的數(shù)據,并在【變量視圖】修改變量名字、確定計算精度,最終結果如圖8-14所示,圖中僅顯示部分數(shù)據。8.2.9SPSS回歸分析實例75第二步選擇【圖形】→【舊對話框】→【散點圖/點圖】。8.2.9SPSS回歸分析實例76第三步通過票房與評分、票房與評分標準差、票房與平均票價的散點圖,判斷它們是線性關系還是非線性關系,并得到線性回歸方程,如圖8-16、圖8-17、圖8-18所示。由圖可知,平均票價對電影的票房影響較小,且不呈線性關系,因此接下來主要考慮評分與評分標準差。8.2.9SPSS回歸分析實例778.2.9SPSS回歸分析實例788.2.9SPSS回歸分析實例798.2.9SPSS回歸分析實例80第四步選擇【分析】→【回歸】→【線性】,如圖8-19所示。8.2.9SPSS回歸分析實例81第五步將自變量與因變量移動至相應框內,選擇【統(tǒng)計】、在功能框中可以根據要求勾選多種功能,如圖8-20所示;同時,在【圖】、【選項】中還有其他一些參數(shù)設置。選擇功能后點擊【繼續(xù)】→【確定】則可得到最終結果。8.2.9SPSS回歸分析實例82第六步我們可以通過判定系數(shù)初步判定擬合效果較好;如表8-5所示,方差分析的顯著性值=0.000<0.01<0.05,表明由自變量和因變量建立的線性關系回歸模型具有極顯著的統(tǒng)計學意義。表8-4模型摘要模型RR方調整后
R方標準估算
的錯誤更改統(tǒng)計德賓-沃森R方
變化量F變化量自由度1自由度2顯著性
F變化量10.9850.9710.96827.055530.971301.4512180.0000.573注:預測變量為(常量),評分標準差,評分;因變量為票房。表8-5顯著性情況模型平方和自由度均方F顯著性1回歸441325.7762220662.888301.4510.000殘差13176.03318732.002總計454501.81020注:因變量為票房;預測變量為(常量),評分標準差,評分。第3節(jié)非線性回歸分析831、雙曲線回歸2、冪函數(shù)曲線回歸3、對數(shù)曲線回歸4、SPSS操作實例第3節(jié)非線性回歸分析84
8.3.1雙曲線回歸85
8.3.2冪函數(shù)曲線回歸86
8.3.3對數(shù)曲線回歸87
8.3.4SPSS操作實例88流通費用率,又稱為流通費用水平,是商品流通費用總額對商品銷售額的百分比。一定時期內,在實現(xiàn)的銷售額一定的情況下,支出的費用越少,表明費用節(jié)約程度越高,體現(xiàn)為經濟效益越好。即流通費用率越低,勞動耗費越節(jié)約?,F(xiàn)隨機調查了9個商店的銷售額與流通費率,其關系如下∶x銷售額/萬元:1.54.57.510.513.516.519.522.525.5y流通費率/%:7.04.83.63.12.72.52.42.32.2試分析流通費率與銷售額之間的關系。使用SPSS軟件解決此問題有兩個思路,分別是"曲線估算"與"非線性回歸"功能。本書介紹比較簡單的"曲線估算"思路。8.3.4SPSS操作實例89第一步在【數(shù)據區(qū)】輸入需要進行分析的數(shù)據,并在【變量視圖】修改變量名字、確定計算精度,最終結果如圖8-24所示(圖中僅顯示部分數(shù)據)。8.3.4SPSS操作實例90第二步選擇【分析】→【回歸】→【曲線估算】,如圖8-25。8.3.4SPSS操作實例91第三步將因變量、自變量移動至右側位置,并選擇打算用來估算的曲線類型。在模型選項中,可以選擇二次、對數(shù)等模型。8.3.4SPSS操作實例92第四步得到各曲線估算的數(shù)據,如表8-6所示,可以看出,對數(shù)曲線的擬合效果最好。表8
-
6模型摘要和參數(shù)估算值方程模型摘要參數(shù)估算值R方F自由度1自由度2顯著性常量對數(shù)0.973255.177170.0007.398-1.713二次0.95461.831260.0007.246-0.5220.013三次0.995354.952350.0008.165-0.9170.049
-0.001冪0.993963.557170.0008.517-0.426S0.84337.605170.0000.8741.781指數(shù)0.85039.731170.0005.685-0.044注:因變量為流通費率;自變量為銷售額。8.3.4SPSS操作實例93
8.3.4SPSS操作實例94第五步采用對數(shù)曲線,得到結果∶由圖8-27可得回歸方程8.3.4SPSS操作實例95補充方法∶非線性回歸分析除了上述的【分析】→【回歸】→【曲線估算】方法,還可以使用【分析】→【回歸】→【非線性】的方法,但是此方法較為復雜。簡單來說,就是通過寫出確定參數(shù)初始值和參數(shù)范圍,輸入模型表達式并調整參數(shù),經過多次迭代后得到計算結果,如圖8-28所示。第4節(jié)含定性自變量的回歸
968.4.1定性自變量的引入97定性自變量的取值本身是用文字來描述的。在回歸分析中、對于一些自變量是定性變量的情形先給予數(shù)量化處理,要想把定性自變量引入模型,必須將其文字描述轉換為數(shù)字代碼。在對定性變量進行回歸分析時,需要將定性變量轉換為虛擬變量(dummyvariables)引入回歸方程,所得的回歸結果才有明確意義。8.4.1定性自變量的引入98
8.4.1定性自變量的引入99
8.4.1定性自變量的引入100
8.4.1定性自變量的引入101虛擬自變量的引入使得定性數(shù)據的回歸系數(shù)具有物理意義。例如,如果是單—虛擬變量,如性別(1=男,0=女),以此對y回歸,這一虛擬變量的系數(shù)含義為“在其他條件不變的情況下,男性相對于女性的y值高出/低出多少”。高出或低出取決于系數(shù)正負號。如果是多類別變量生成的虛擬變量,比如所在方位(東=1,西=2,南=3,北=4),以東為基準生成3個虛擬變量,變量2的系數(shù)表示,在其他條件不變的情況下,西方相對于東方的y值高出/低出多少;其他兩個系數(shù)也是相對于東方而言的。8.4.1定性自變量的引入102理論上,虛擬變量取“0”值通常代表比較基礎的類型;而虛擬變量取“1”值通常代表被比較的類型。即“0”代表基期,為比較的基礎;“1”代表報告期,為被比較的效應,類似于假設檢驗中的原假設和備擇假設的意思。例如,比較改革開放前后的國民經濟水平時,研究的是改革開放后的經濟水平是否高于改革開放之前,是將改革開放前的經濟水平作為比較的基礎,故將該虛擬變量設置為“0”和“1”選取原則8.4.1定性自變量的引入103虛擬變量是非此即彼的問題,一般情形下,虛擬變量的取值為0和1。當虛擬變量取值為0時,表示某種屬性或狀態(tài)的類型或水平不出現(xiàn)或不存在;當虛擬變量取值為1時,表示某種屬性或狀態(tài)的類型或水平出現(xiàn)或存在。0、1代表是否,1、2、3、4表示等級,本書涉及的定性變量的回歸問題大部分都是關于是否的問題,很少涉及等級問題。“0”和“1”選取原則8.4.1定性自變量的引入104
屬性因素與虛擬變量數(shù)量的關系8.4.1定性自變量的引入105
屬性因素與虛擬變量數(shù)量的關系8.4.2含定性自變量的回歸模型106
8.4.3含一個定量自變量和一個二值定性自變量的回歸107
無交互作用的模型108無交互作用的模型8.4.3含一個定量自變量和一個二值定性自變量的回歸109解由題意可以構建模型因此,對于非股份制公司,對于股份制公司,如圖8-29所示,對于不同類型的公司,因變量之差體現(xiàn)在截距上。無交互作用的模型圖8-29不同類型公司的回歸線8.4.3含一個定量自變量和一個二值定性自變量的回歸110
無交互作用的模型8.4.3含一個定量自變量和一個二值定性自變量的回歸111
具有交互作用的模型8.4.3含一個定量自變量和一個二值定性自變量的回歸112
具有交互作用的模型8.4.3含一個定量自變量和一個二值定性自變量的回歸113
具有交互作用的模型8.4.3含一個定量自變量和一個二值定性自變量的回歸114
具有交互作用的模型圖8-30含交互作用的不同類型公司的回歸圖像8.4.3含一個定量自變量和一個二值定性自變量的回歸115
具有交互作用的模型8.4.3含一個定量自變量和一個二值定性自變量的回歸116含定性數(shù)據的回歸分析中的定性自變量也可能有多個取值,此時其回歸模型和交互項的設定均與二值定性自變量不同。例如,研究員工年薪與年齡和學歷水平的關系,可將學歷分為三個互相排斥的水平∶高中以下、高中、大學或以上。當我們認為年齡與學歷水平之間無交互作用時,引入的虛擬變量為∶無交互作用的模型8.4.4含一個定量自變量和一個多值定性自變量的回歸117
無交互作用的模型8.4.4含一個定量自變量和一個多值定性自變量的回歸118
具有交互作用的模型8.4.4含一個定量自變量和一個多值定性自變量的回歸119
8.4.4一個定量自變量和兩個定性自變量的回歸120
8.4.4一個定量自變量和兩個定性自變量的回歸121
8.4.4一個定量自變量和兩個定性自變量的回歸122
8.4.4一個定量自變量和兩個定性自變量的回歸第5節(jié)含定性因變量的回歸
1238.5.1邏輯回歸124
邏輯回歸模型8.5.1邏輯回歸125
邏輯回歸模型8.5.1邏輯回歸126
邏輯回歸模型8.5.1邏輯回歸127
估計的邏輯回歸模型8.5.1邏輯回歸128似然函數(shù)的函數(shù)值反映了在所確定的擬合模型為真時,該模型能夠較好地擬合樣本數(shù)據的可能性,似然函數(shù)值實際上也是一種概率值,取值在0~1之間。在回歸分析中,通常對似然函數(shù)值取對數(shù),得到對數(shù)似然的數(shù),對數(shù)似然函數(shù)值越大意味著模型擬合樣本數(shù)據的可能性越大,擬合優(yōu)度越高。對數(shù)似然函數(shù)為∶估計的邏輯回歸模型
8.5.1邏輯回歸129
邏輯回歸系數(shù)的意義8.5.1邏輯回歸130
邏輯回歸系數(shù)的意義8.5.1邏輯回歸131定義8.23平均偏效應(averagemarginaleffect,APE)表示將樣本中所有個體的偏效應取平均而得到的常數(shù)比例因子,對一個連續(xù)解釋變量,平均偏效應表示為∶由于平均個人偏效應(PEA)中使用了變量平均值的非線性函數(shù),而平均偏效應(APE)中使用的是非線性函數(shù)的平均,因此兩種方法計算得到的偏效應值往往不同。邏輯回歸系數(shù)的意義8.5.1邏輯回歸132【例8.11】某商場在推廣某一產品時發(fā)現(xiàn)顧客的購買傾向受顧客年齡的影響。為了驗證這一現(xiàn)象,該商場通過調查取得數(shù)據,構造了邏輯回歸模型。其中,顧客是否愿意購買該產品為因變量,顧客年齡為自變量。根據回歸模型的參數(shù)估計值和樣本的數(shù)據可以計算得出平均個人偏效應(PEA)和平均偏效應(APE)。邏輯回歸系數(shù)的意義8.5.1邏輯回歸133
邏輯回歸系數(shù)的意義8.5.1邏輯回歸134從結果中可以看出,由于邏輯回歸模型中,自變量與購買概率之間的關系是非線性的,年齡對購買概率影響的平均個人偏效應和平均偏效應存在差異。年齡對顧客購買傾向的影響的平均個人偏效應可以理解為當年齡變量在樣本均值附近時,顧客購買該產品的概率增加了PEA年齡對顧客購買的影響的平均偏效應可以理解為在自變量值域范圍內,年齡每增長1個單位,顧客購買該產品的概率平均增加APE。邏輯回歸系數(shù)的意義8.5.1邏輯回歸135
邏輯回歸系數(shù)的意義8.5.1邏輯回歸136
邏輯回歸系數(shù)的意義8.5.1邏輯回歸137
邏輯回歸系數(shù)的意義8.5.1邏輯回歸138
顯著性檢驗與評價8.5.1邏輯回歸139
顯著性檢驗與評價8.5.1邏輯回歸1402、整體模型的評價為了了解Logistic回歸模型的擬合情況和解釋能力,統(tǒng)計學家也提出了許多偽判定系數(shù)(Pseudo-R2)指標作為近似量度。SPSS軟件默認輸出兩種以創(chuàng)建者命名的Pseudo-R2(Cox&SnellR2和NagelkerkeR2),它們都是參照線性回歸中的判定系數(shù)R2人為定義得到的。然而,Cox&SnellR2偽判定系數(shù)的上限不確定,即當模型能夠完美地預測解釋變量時,該指標的值無法取到1,Nagelkerke對該公式進行了修正:顯著性檢驗與評價8.5.1邏輯回歸141
顯著性檢驗與評價8.5.2對數(shù)線性回歸142對數(shù)線性回歸的基本思想:是把列聯(lián)表資料的網格頻數(shù)的對數(shù)表示為各變量及其交互效應的線性模型,然后運用類似方差分析的基本思想,以及邏輯變換來檢驗各變量及其交互效應的作用大小。利用對數(shù)線性模型的好處:不僅可以直接進行預測,而且可以增加定量變量作為模型的一部分。8.5.2對數(shù)線性回歸143根據表中的交叉單元格以及單元格內的頻數(shù)數(shù)據,聯(lián)想到可以使用卡方檢驗來分析分類變量A和分類變量B的相關關系,但不適用于多個分類變量對數(shù)線性模型與混合線性模型有類似之處,兩者都是圍繞分類變量展開的,多項分布對數(shù)線性模型8.5.2對數(shù)線性回歸144
多項分布對數(shù)線性模型8.5.2對數(shù)線性回歸145
多項分布對數(shù)線性模型8.5.2對數(shù)線性回歸146
多項分布對數(shù)線性模型8.5.2對數(shù)線性回歸147
多項分布對數(shù)線性模型8.5.2對數(shù)線性回歸148
Poisson對數(shù)線性模型8.5.2對數(shù)線性回歸149Poisson對數(shù)線性模型表8
-
16不同年齡、性別和購買能力與商品預購件數(shù)數(shù)據#SPAC#SPAC#SPAC11112.27211311.69412212.5821118.63221317.23422218.3931125.38231324.510432226.0741133.611241331.07442230.9751138.67251337.96452239.91161143.85261345.210462246.31171152.89271352.56472252.21081160.16281358.29482258.5591164.76291365.38492266.510101172.76301371.49502273.61211128.912312113.5351239.67121219.65322117.64522317.511131225.913332124.88
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 寫代言合同標準文本標準文本
- 0利息購車合同標準文本
- 建設工程施工合同
- 買房合同欺詐合同標準文本
- 臨時買賣合同標準文本
- 喪葬服務合同范例
- 做抵押合同范例
- 出口合同范例中文
- 會計崗位聘用合同標準文本
- 餐飲小吃基礎知識培訓
- 全國各省龐氏輩分收集
- 五金噴涂(噴粉)件檢驗規(guī)范28455
- 電光八組合開關
- 畢業(yè)設計生活垃圾資源化處理系統(tǒng)設計——DN滾筒篩
- 教育實習鑒定表模板(共3頁)
- (完整版)污水處理廠運維方案
- 【精選】方劑學清熱劑練習題
- 下肢靜脈血栓護理查房
- 納稅信用修復申請表
- 最新蘇教版五年級數(shù)學下冊第四單元 數(shù)學教案
- 以化妝用品與手法的古今對比探討昆曲的歷史變遷
評論
0/150
提交評論