多元相關(guān)與回歸分析ppt課件_第1頁(yè)
多元相關(guān)與回歸分析ppt課件_第2頁(yè)
多元相關(guān)與回歸分析ppt課件_第3頁(yè)
多元相關(guān)與回歸分析ppt課件_第4頁(yè)
多元相關(guān)與回歸分析ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩77頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 10 章 多元線性回歸10.1 多元線性回歸模型多元線性回歸模型 10.2 回歸方程的擬合優(yōu)度回歸方程的擬合優(yōu)度10.3 顯著性檢驗(yàn)顯著性檢驗(yàn)10.4 多重共線性多重共線性10.5 啞變量回歸啞變量回歸10.6 非線性回歸非線性回歸學(xué)習(xí)目的1. 回歸模型、回歸方程、估計(jì)的回歸方程回歸模型、回歸方程、估計(jì)的回歸方程2. 回歸方程的擬合優(yōu)度回歸方程的擬合優(yōu)度回歸方程的顯著性檢驗(yàn)回歸方程的顯著性檢驗(yàn)利用回歸方程進(jìn)展估計(jì)和預(yù)測(cè)利用回歸方程進(jìn)展估計(jì)和預(yù)測(cè)非線性回歸非線性回歸用用 SPSS 進(jìn)展回歸分析進(jìn)展回歸分析10.1 多元線性回歸模型10.1.1 多元回歸模型與回歸方程多元回歸模型與回歸方程10

2、.1.2 估計(jì)的多元回歸方程估計(jì)的多元回歸方程10.1.3 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘估計(jì)多元回歸模型與回歸方程多元回歸模型 (multiple regression model)一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量的回歸描畫因變量 y 如何依賴于自變量 x1 , x2 , xk 和誤差項(xiàng) 的方程,稱為多元回歸模型涉及 k 個(gè)自變量的多元回歸模型可表示為kkxxxy22110多元回歸模型(根本假定) 誤差項(xiàng)是一個(gè)期望值為0的隨機(jī)變量,即E()=0對(duì)于自變量x1,x2,xk的一切值,的方差 2都一樣誤差項(xiàng)是一個(gè)服從正態(tài)分布的隨機(jī)變量,即N(0,2),且相互獨(dú)立多元回歸方程 (multiple

3、regression equation)描畫因變量 y 的平均值或期望值如何依賴于自變量 x1, x2 ,xk的方程多元線性回歸方程的方式為 E( y ) = 0+ 1 x1 + 2 x2 + k xk二元回歸方程的直觀解釋22110 xxy22110)(xxyE估計(jì)的多元回歸方程估計(jì)的多元回歸的方程估計(jì)的多元回歸的方程(estimated multiple regression equation)(estimated multiple regression equation)用樣本統(tǒng)計(jì)量 估計(jì)回歸方程中的 參數(shù) 時(shí)得到的方程由最小二乘法求得普通方式為k,210k,210kkxxxy22110

4、k,210k,210y 參數(shù)的最小二乘估計(jì)參數(shù)的最小二乘法最小niiniiikeyyQ1212210)(),()21(00000kiQQiii, k,210參數(shù)的最小二乘法(例題分析)10.2 10.2 回歸方程的擬合優(yōu)度回歸方程的擬合優(yōu)度10.2.1 多重?cái)喽ㄏ禂?shù)多重?cái)喽ㄏ禂?shù)10.2.2 估計(jì)規(guī)范誤差估計(jì)規(guī)范誤差多重?cái)喽ㄏ禂?shù)多重?cái)喽ㄏ禂?shù)(multiple coefficient of determination) 回歸平方和占總平方和的比例回歸平方和占總平方和的比例計(jì)算公式為計(jì)算公式為因變量取值的變差中,能被估計(jì)的多元回歸方程因變量取值的變差中,能被估計(jì)的多元回歸方程所解釋的比例所解釋的比例

5、 SSTSSESSTSSRyyyyRniinii112122 在樣本容量一定的條件下,不斷向模型中在樣本容量一定的條件下,不斷向模型中添加自變量,即使新增的變量與添加自變量,即使新增的變量與Y Y不相關(guān),不相關(guān),模型的模型的R2R2也能夠上升,至少不會(huì)下降。也能夠上升,至少不會(huì)下降。 在實(shí)踐運(yùn)用中,研討人員更歡迎簡(jiǎn)單的模在實(shí)踐運(yùn)用中,研討人員更歡迎簡(jiǎn)單的模型,這樣的模型更簡(jiǎn)單和易于解釋。假設(shè)型,這樣的模型更簡(jiǎn)單和易于解釋。假設(shè)根據(jù)根據(jù)R2R2來(lái)選擇模型,顯然會(huì)傾向于復(fù)雜的來(lái)選擇模型,顯然會(huì)傾向于復(fù)雜的模型。模型。 更常用的目的是更常用的目的是“修正后的修正后的Ra2Ra2。修正的斷定系數(shù)修正的

6、斷定系數(shù)修正多重?cái)喽ㄏ禂?shù)(adjusted multiple coefficient of determination) 用樣本量n和自變量的個(gè)數(shù)k去修正R2得到 計(jì)算公式為防止添加自變量而高估 R2意義與 R2類似數(shù)值小于R2111122knnRRa估計(jì)規(guī)范誤差 Se對(duì)誤差項(xiàng)的規(guī)范差 的一個(gè)估計(jì)值衡量多元回歸方程的擬合優(yōu)度計(jì)算公式為MSEknSSEknyySniiie111212.3 顯著性檢驗(yàn)12.3.1 線性關(guān)系檢驗(yàn)線性關(guān)系檢驗(yàn)12.3.2 回歸系數(shù)檢驗(yàn)和推斷回歸系數(shù)檢驗(yàn)和推斷線性關(guān)系檢驗(yàn)線性關(guān)系檢驗(yàn)檢驗(yàn)因變量與一切自變量之間的線性關(guān)系能否顯著也被稱為總體的顯著性檢驗(yàn)檢驗(yàn)方法是將回歸均方

7、(MSR)同殘差均方(MSE)加以比較,運(yùn)用 F 檢驗(yàn)來(lái)分析二者之間的差別能否顯著假設(shè)是顯著的,因變量與自變量之間存在線性關(guān)系假設(shè)不顯著,因變量與自變量之間不存在線性關(guān)系線性關(guān)系檢驗(yàn)提出假設(shè)提出假設(shè)H0H0:1 12 2k=0 k=0 線性關(guān)系不顯線性關(guān)系不顯著著H1H1:1 1,2 2, k k至少有一個(gè)不等于至少有一個(gè)不等于0 0) 1,() 1() 1(1212knkFknyykyyknSSEkSSRFniinii回歸系數(shù)檢驗(yàn)和推斷回歸系數(shù)檢驗(yàn)和推斷 回歸方程顯著,并不意味著每個(gè)解釋變量對(duì)因回歸方程顯著,并不意味著每個(gè)解釋變量對(duì)因變量變量Y Y的影響都重要的影響都重要, ,因此需求進(jìn)展檢

8、驗(yàn):因此需求進(jìn)展檢驗(yàn):回歸系數(shù)檢驗(yàn)的必要性回歸系數(shù)檢驗(yàn)的必要性回歸方程顯著回歸方程顯著每個(gè)回歸系每個(gè)回歸系數(shù)都顯著數(shù)都顯著回歸系數(shù)的檢驗(yàn)回歸系數(shù)的檢驗(yàn)( (步驟步驟) )提出假設(shè)H0: bi = 0 (自變量 xi 與 因變量 y 沒(méi)有線性關(guān)系) H1: bi 0 (自變量 xi 與 因變量 y有線性關(guān)系) 計(jì)算檢驗(yàn)的統(tǒng)計(jì)量 t) 1(kntStii回歸系數(shù)的推斷 (置信區(qū)間)回歸系數(shù)在(1-)%置信程度下的置信區(qū)間為 isknti2) 1(2xxssiei10.4 多重共線性10.4.1 多重共線性及其所產(chǎn)生的問(wèn)題多重共線性及其所產(chǎn)生的問(wèn)題10.4.2 多重共線性的判別多重共線性的判別10.

9、4.3 多重共線性問(wèn)題的處置多重共線性問(wèn)題的處置多重共線性及其產(chǎn)生的問(wèn)題多重共線性及其產(chǎn)生的問(wèn)題多重共線性多重共線性回歸模型中兩個(gè)或兩個(gè)以上的自變量彼此相關(guān)回歸模型中兩個(gè)或兩個(gè)以上的自變量彼此相關(guān)多重共線性帶來(lái)的問(wèn)題有多重共線性帶來(lái)的問(wèn)題有t t檢驗(yàn)值會(huì)減小、系數(shù)的顯著性下降。檢驗(yàn)值會(huì)減小、系數(shù)的顯著性下降。對(duì)于一組存在高度多重共線性的自變量,很難對(duì)單對(duì)于一組存在高度多重共線性的自變量,很難對(duì)單個(gè)系數(shù)進(jìn)展解釋。個(gè)系數(shù)進(jìn)展解釋。 有能夠?qū)е赂骰貧w系數(shù)的符號(hào)同我們的預(yù)期相反有能夠?qū)е赂骰貧w系數(shù)的符號(hào)同我們的預(yù)期相反 。多重共線性的識(shí)別多重共線性的識(shí)別多重共線性的識(shí)別多重共線性的識(shí)別檢測(cè)多重共線性的

10、最簡(jiǎn)單的一種方法是計(jì)算模型檢測(cè)多重共線性的最簡(jiǎn)單的一種方法是計(jì)算模型中各對(duì)自變量之間的相關(guān)系數(shù),并對(duì)各相關(guān)系數(shù)中各對(duì)自變量之間的相關(guān)系數(shù),并對(duì)各相關(guān)系數(shù)進(jìn)展顯著性檢驗(yàn)進(jìn)展顯著性檢驗(yàn)假設(shè)有一個(gè)或多個(gè)相關(guān)系數(shù)顯著,就表示模型中假設(shè)有一個(gè)或多個(gè)相關(guān)系數(shù)顯著,就表示模型中所用的自變量之間相關(guān),存在著多重共線性所用的自變量之間相關(guān),存在著多重共線性假設(shè)出現(xiàn)以下情況,暗示存在多重共線性假設(shè)出現(xiàn)以下情況,暗示存在多重共線性模型中各對(duì)自變量之間顯著相關(guān)模型中各對(duì)自變量之間顯著相關(guān)當(dāng)模型的線性關(guān)系檢驗(yàn)當(dāng)模型的線性關(guān)系檢驗(yàn)(F(F檢驗(yàn)檢驗(yàn)) )顯著時(shí),幾乎一顯著時(shí),幾乎一切回歸系數(shù)的切回歸系數(shù)的t t檢驗(yàn)卻不顯著

11、檢驗(yàn)卻不顯著 回歸系數(shù)的正負(fù)號(hào)與預(yù)期的相反回歸系數(shù)的正負(fù)號(hào)與預(yù)期的相反多重共線性(例題分析)【例】判別各自變量之間能否存在多重共線性【例】判別各自變量之間能否存在多重共線性貸款余額、應(yīng)收貸款、貸款工程、固定資產(chǎn)投資額之間的相關(guān)矩陣貸款余額、應(yīng)收貸款、貸款工程、固定資產(chǎn)投資額之間的相關(guān)矩陣多重共線性(例題分析)【例】判別各自變量之間能否存在多重共線性【例】判別各自變量之間能否存在多重共線性相關(guān)系數(shù)的檢驗(yàn)統(tǒng)計(jì)量相關(guān)系數(shù)的檢驗(yàn)統(tǒng)計(jì)量多重共線性(例題分析) t(25-2)=2.0687,一切統(tǒng)計(jì)量,一切統(tǒng)計(jì)量t t(25-2)=2.0687,所以均回絕原假設(shè),闡明這,所以均回絕原假設(shè),闡明這4個(gè)自變量

12、兩個(gè)自變量?jī)蓛芍g都有顯著的相關(guān)關(guān)系兩之間都有顯著的相關(guān)關(guān)系由 表 中 的 結(jié) 果 可 知 , 回 歸 模 型 的 線 性 關(guān) 系 顯 著由 表 中 的 結(jié) 果 可 知 , 回 歸 模 型 的 線 性 關(guān) 系 顯 著(Significance-F1.03539E-06=0.05) 。這也暗示了模型中。這也暗示了模型中存在多重共線性存在多重共線性固定資產(chǎn)投資額的回歸系數(shù)為負(fù)號(hào)固定資產(chǎn)投資額的回歸系數(shù)為負(fù)號(hào)(-0.029193) ,與預(yù),與預(yù)期的不一致期的不一致多重共線性問(wèn)題的處置多重共線性問(wèn)題的處置多重共線性(問(wèn)題的處置)將一個(gè)或多個(gè)相關(guān)的自變量從模型中剔除,將一個(gè)或多個(gè)相關(guān)的自變量從模型中剔除

13、,使保管的自變量盡能夠不相關(guān)使保管的自變量盡能夠不相關(guān)假設(shè)要在模型中保管一切的自變量,那么假設(shè)要在模型中保管一切的自變量,那么應(yīng)應(yīng)防止根據(jù)防止根據(jù) t t 統(tǒng)計(jì)量對(duì)單個(gè)參數(shù)進(jìn)展檢驗(yàn)統(tǒng)計(jì)量對(duì)單個(gè)參數(shù)進(jìn)展檢驗(yàn)對(duì)因變量值的推斷對(duì)因變量值的推斷( (估計(jì)或預(yù)測(cè)估計(jì)或預(yù)測(cè)) )的限定在的限定在自變量樣本值的范圍內(nèi)自變量樣本值的范圍內(nèi)多元回歸中的變量挑選多元回歸中的變量挑選 在多元回歸中,預(yù)先選定的自變量不一定都對(duì)在多元回歸中,預(yù)先選定的自變量不一定都對(duì)Y Y有顯著的影響。有一些統(tǒng)計(jì)方法可以協(xié)助我們有顯著的影響。有一些統(tǒng)計(jì)方法可以協(xié)助我們從眾多能夠的自變量中挑選出重要的自變量。從眾多能夠的自變量中挑選出重

14、要的自變量。SPSSSPSS軟件提供了多種挑選自變量的方法:軟件提供了多種挑選自變量的方法: “向前引入法向前引入法ForwardForward “向后剔除法向后剔除法BackwardBackward “逐漸引入逐漸引入剔除法剔除法StepwiseStepwise變量選擇過(guò)程在建立回歸模型時(shí),對(duì)自變量進(jìn)展挑選在建立回歸模型時(shí),對(duì)自變量進(jìn)展挑選選擇自變量的原那么是對(duì)統(tǒng)計(jì)量進(jìn)展顯著性檢驗(yàn)選擇自變量的原那么是對(duì)統(tǒng)計(jì)量進(jìn)展顯著性檢驗(yàn)將一個(gè)或一個(gè)以上的自變量引入到回歸模型中時(shí),能將一個(gè)或一個(gè)以上的自變量引入到回歸模型中時(shí),能否使得殘差平方和否使得殘差平方和(SSE)(SSE)有顯著的減少。假設(shè)添加一有顯

15、著的減少。假設(shè)添加一個(gè)自變量使個(gè)自變量使SSESSE的減少是顯著的,那么闡明有必要將的減少是顯著的,那么闡明有必要將這個(gè)自變量引入回歸模型,否那么,就沒(méi)有必要將這這個(gè)自變量引入回歸模型,否那么,就沒(méi)有必要將這個(gè)自變量引入回歸模型個(gè)自變量引入回歸模型確定引入自變量能否使確定引入自變量能否使SSESSE有顯著減少的方法,就是有顯著減少的方法,就是運(yùn)用運(yùn)用F F統(tǒng)計(jì)量的值作為一個(gè)規(guī)范,以此來(lái)確定是在模統(tǒng)計(jì)量的值作為一個(gè)規(guī)范,以此來(lái)確定是在模型中添加一個(gè)自變量,還是從模型中剔除一個(gè)自變量型中添加一個(gè)自變量,還是從模型中剔除一個(gè)自變量變量選擇的方法主要有:變量選擇的方法主要有: 逐漸回歸、向前選擇、向后

16、剔除逐漸回歸、向前選擇、向后剔除向前選擇 (forward selection)從模型中沒(méi)有自變量開(kāi)場(chǎng)從模型中沒(méi)有自變量開(kāi)場(chǎng)對(duì)對(duì)k k個(gè)自變量分別擬合對(duì)因變量的一元線性回歸模個(gè)自變量分別擬合對(duì)因變量的一元線性回歸模型,共有型,共有k k個(gè),然后找出個(gè),然后找出F F統(tǒng)計(jì)量的值最高的模型統(tǒng)計(jì)量的值最高的模型及其自變量,并將其首先引入模型及其自變量,并將其首先引入模型 分別擬合引入模型外的分別擬合引入模型外的k-1k-1個(gè)自變量的線性回歸模個(gè)自變量的線性回歸模型型 如此反復(fù)進(jìn)展,直至模型外的自變量均無(wú)統(tǒng)計(jì)顯如此反復(fù)進(jìn)展,直至模型外的自變量均無(wú)統(tǒng)計(jì)顯著性為止著性為止向后剔除 (backward el

17、imination)先對(duì)因變量擬合包括一切先對(duì)因變量擬合包括一切k k個(gè)自變量的回歸模型。然后調(diào)查個(gè)自變量的回歸模型。然后調(diào)查p(pk)p(pk)個(gè)去掉一個(gè)自變量的模型個(gè)去掉一個(gè)自變量的模型( (這些模型中每一個(gè)都有的這些模型中每一個(gè)都有的k-1k-1個(gè)自變量個(gè)自變量) ),使模型的,使模型的SSESSE值減小最少的自變量被挑選出值減小最少的自變量被挑選出來(lái)并從模型中剔除來(lái)并從模型中剔除調(diào)查調(diào)查p-1p-1個(gè)再去掉一個(gè)自變量的模型個(gè)再去掉一個(gè)自變量的模型( (這些模型中在每一個(gè)這些模型中在每一個(gè)都有都有k-2k-2個(gè)的自變量個(gè)的自變量) ),使模型的,使模型的SSESSE值減小最少的自變量被值

18、減小最少的自變量被挑選出來(lái)并從模型中剔除挑選出來(lái)并從模型中剔除如此反復(fù)進(jìn)展,不斷將自變量從模型中剔除,直至剔除一如此反復(fù)進(jìn)展,不斷將自變量從模型中剔除,直至剔除一個(gè)自變量不會(huì)使個(gè)自變量不會(huì)使SSESSE顯著減小為止顯著減小為止逐漸回歸的思想逐漸回歸的思想 將變量逐一引入回歸方程,先建立與將變量逐一引入回歸方程,先建立與y y相關(guān)最親相關(guān)最親密的一元線性回歸方程,然后再找出第二個(gè)變量,密的一元線性回歸方程,然后再找出第二個(gè)變量,建立二元線性回歸方程,建立二元線性回歸方程,。 在每一步中都要對(duì)引入變量的顯著性作檢驗(yàn),僅在每一步中都要對(duì)引入變量的顯著性作檢驗(yàn),僅當(dāng)其顯著時(shí)才引入,而每引入一個(gè)新變量后

19、,對(duì)當(dāng)其顯著時(shí)才引入,而每引入一個(gè)新變量后,對(duì)前面已引進(jìn)的變量又要逐一檢驗(yàn),一旦發(fā)現(xiàn)某變前面已引進(jìn)的變量又要逐一檢驗(yàn),一旦發(fā)現(xiàn)某變量變得不顯著了,就要將它剔除。量變得不顯著了,就要將它剔除。 這些步驟反復(fù)進(jìn)展,直到引入的變量都是顯著的這些步驟反復(fù)進(jìn)展,直到引入的變量都是顯著的而沒(méi)有引入的變量都是不顯著的時(shí),就終了挑選而沒(méi)有引入的變量都是不顯著的時(shí),就終了挑選變量的任務(wù)。變量的任務(wù)。 可以設(shè)定引入和刪除變量的條件??梢栽O(shè)定引入和刪除變量的條件。 10.5 啞變量回歸 10.5.1 在模型中引進(jìn)啞變量 10.5.2 含有一個(gè)啞變量的回歸10.5.1 在模型中引進(jìn)啞變量啞變量(dummy varia

20、ble)也稱虛擬變量。用數(shù)字代碼表示的定性自變量啞變量可有不同的程度只需兩個(gè)程度的啞變量比如,性別(男,女) 有兩個(gè)以上程度的啞變量貸款企業(yè)的類型(家電,醫(yī)藥,其他) 啞變量的取值為0,1女男01x在回歸中引進(jìn)啞變量回歸模型中運(yùn)用啞變量時(shí),稱為啞變量回歸當(dāng)定性變量只需兩個(gè)程度時(shí),可在回歸中引入一個(gè)啞變量比如,性別(男,女) 普通而言,假設(shè)定性自變量有k個(gè)程度,需求在回歸中模型中引進(jìn)k-1個(gè)啞變量其他水平水平其他水平水平其他水平水平011,021,011121kxxxk在回歸中引進(jìn)啞變量(例題分析)例為研討考試?yán)秊檠杏懣荚嚦晒c性別之成果與性別之間的關(guān)系,從間的關(guān)系,從某大學(xué)商學(xué)院某大學(xué)商學(xué)院隨

21、機(jī)抽取男女隨機(jī)抽取男女學(xué)生各學(xué)生各8 8名,名,得到他們的市得到他們的市場(chǎng)營(yíng)銷學(xué)課程場(chǎng)營(yíng)銷學(xué)課程的考試成果如的考試成果如右表右表 10.5.2 含有一個(gè)啞變量的回歸 在回歸中引進(jìn)啞變量(例題分析)啞變量回歸 (例題分析)引進(jìn)啞變量時(shí),回歸方程表示為引進(jìn)啞變量時(shí),回歸方程表示為E(y) =E(y) =0+ 0+ 1x1x男男(x=0)(x=0):E(y) =E(y) =00男學(xué)生考試成果的期望值男學(xué)生考試成果的期望值女女(x=1)(x=1):E(y) =E(y) =0+ 0+ 11女學(xué)生考試成果的期望女學(xué)生考試成果的期望值值留意:當(dāng)指定啞變量留意:當(dāng)指定啞變量0 0,1 1時(shí)時(shí)0 0總是代表與啞

22、變量值總是代表與啞變量值0 0所對(duì)應(yīng)的那個(gè)分類變量程所對(duì)應(yīng)的那個(gè)分類變量程度的平均值度的平均值1 1總是代表與啞變量值總是代表與啞變量值1 1所對(duì)應(yīng)的那個(gè)分類變量程所對(duì)應(yīng)的那個(gè)分類變量程度的平均值與啞變量值度的平均值與啞變量值0 0所對(duì)應(yīng)的那個(gè)分類變量所對(duì)應(yīng)的那個(gè)分類變量程度的平均值的差值,即程度的平均值的差值,即 平均值的差值平均值的差值 =( =(0+ 0+ 1) - 1) - 0= 0= 1 1啞變量回歸 (例題分析) 考試成果與性別的回歸男學(xué)生考男學(xué)生考試 分 數(shù) 的試 分 數(shù) 的平均值平均值女學(xué)生與女學(xué)生與男 學(xué) 生 平男 學(xué) 生 平均 考 試 分均 考 試 分?jǐn)?shù)的差值數(shù)的差值用SP

23、SS進(jìn)展啞變量回歸(有一個(gè)啞變量和有一個(gè)數(shù)值變量)第第1步:選擇【步:選擇【Analyze】,并選擇【】,并選擇【General Linear Model-Univaiate】進(jìn)入主對(duì)話框】進(jìn)入主對(duì)話框第第2步:將因變量步:將因變量(考試成果考試成果)選入【選入【Dependent Variable】,】,將自變量將自變量(性別性別)選入【選入【Fixed Factor(s)】(模型中還含有一個(gè)模型中還含有一個(gè)數(shù)值自變量時(shí),將數(shù)值自變量選入【數(shù)值自變量時(shí),將數(shù)值自變量選入【Covariate(s)】)第第3步:點(diǎn)擊【步:點(diǎn)擊【Model】,并點(diǎn)擊【】,并點(diǎn)擊【Custom】;將性別】;將性別F

24、選選入【入【Model】(假設(shè)模型中還含有任務(wù)年限自變量時(shí),將任務(wù)假設(shè)模型中還含有任務(wù)年限自變量時(shí),將任務(wù)年限年限C也選入【也選入【Model】;在【】;在【Build Term(s)】下選擇】下選擇【Main effects】。點(diǎn)擊【】。點(diǎn)擊【Continue】回到主對(duì)話框。點(diǎn)擊】回到主對(duì)話框。點(diǎn)擊【Options】,在【】,在【Display】下選中【】下選中【Parameter estimates】(估計(jì)模型中的參數(shù)估計(jì)模型中的參數(shù))。點(diǎn)擊【。點(diǎn)擊【Continue】回到主】回到主對(duì)話框。點(diǎn)擊【對(duì)話框。點(diǎn)擊【OK】啞變量回歸啞變量回歸 (例題分析例題分析只含一個(gè)啞變量只含一個(gè)啞變量)SP

25、SS的輸出結(jié)果的輸出結(jié)果 T Te es st ts s o of f B Be et tw we ee en n- -S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable: 考試成績(jī)885.063a1885.0635.326.03788357.563188357.563531.731.000885.0631885.0635.326.0372326.37514166.17091569.000163211.43815SourceCorrected ModelIntercept性別ErrorTotalCorrected T

26、otalType III Sumof SquaresdfMean SquareFSig.R Squared = .276 (Adjusted R Squared = .224)a. P Pa ar ra am me et te er r E Es st ti im ma at te es sDependent Variable: 考試成績(jī)81.7504.55817.937.00071.97591.525-14.8756.445-2.308.037-28.699-1.0510a.ParameterIntercept性別=男性別=女BStd. ErrortSig.Lower Bound Upper

27、 Bound95% Confidence IntervalThis parameter is set to zero because it is redundant.a. 方差分析表:方差分析表:F=5.326,Sig.=0.037,回歸模型,回歸模型顯著顯著男男=1,女,女=0。女學(xué)生考試成果的期女學(xué)生考試成果的期望值望值=81.75分;男學(xué)分;男學(xué)生 比 女 學(xué) 生 平 均 低生 比 女 學(xué) 生 平 均 低14.875分分啞變量回歸(例題分析)【例】為研討【例】為研討工資程度與任工資程度與任務(wù)年限和性別務(wù)年限和性別之間的關(guān)系,之間的關(guān)系,在某行業(yè)中隨在某行業(yè)中隨機(jī)抽取機(jī)抽取10名職名職工,

28、所得數(shù)據(jù)工,所得數(shù)據(jù)如右表如右表啞變量回歸 (例題分析Excel) Excel輸出的結(jié)果輸出的結(jié)果啞變量回歸 (例題分析SPSS) 啞變量回歸 (例題分析SPSS) 用任務(wù)年限和性別預(yù)測(cè)的月工資程度及其殘差用任務(wù)年限和性別預(yù)測(cè)的月工資程度及其殘差 啞變量回歸啞變量回歸( (例題分析例題分析) )引進(jìn)啞變量時(shí),回歸方程寫為引進(jìn)啞變量時(shí),回歸方程寫為 E(y) =E(y) =0+ 0+ 1x1+ 1x1+ 2x22x2女女(x2=0)(x2=0):E(y|E(y|女性女性) =) =0 +0 +1x11x1男男(x2=1)(x2=1):E(y|E(y|男性男性) =() =(0 + 0 + 2 )

29、 +2 ) +1x11x10 0 的含義表示:女性職工的期望月工資收入的含義表示:女性職工的期望月工資收入(x1=0(x1=0時(shí)時(shí)) ) ( (0+ 0+ 2)2)的含義表示:男性職工的期望月工資收入的含義表示:男性職工的期望月工資收入 (x1=0(x1=0時(shí)時(shí)) ) 1 1含義表示:任務(wù)年限每添加含義表示:任務(wù)年限每添加1 1年,男性或女性工資的平均添加值年,男性或女性工資的平均添加值 2 2含義表示:男性職工的期望月工資收入與女性職工的期望月工資含義表示:男性職工的期望月工資收入與女性職工的期望月工資收入之間的差值收入之間的差值 ( (0+ 0+ 2) - 2) - 0= 0= 2 2例題

30、分析例題分析【例】某經(jīng)濟(jì)學(xué)家想調(diào)查文化程度對(duì)家庭儲(chǔ)蓄的【例】某經(jīng)濟(jì)學(xué)家想調(diào)查文化程度對(duì)家庭儲(chǔ)蓄的影響,在一個(gè)中等收入的樣本框中,隨機(jī)調(diào)查了影響,在一個(gè)中等收入的樣本框中,隨機(jī)調(diào)查了13戶高等學(xué)歷家庭與戶高等學(xué)歷家庭與14戶中低學(xué)歷的家庭。因變量戶中低學(xué)歷的家庭。因變量y為為上一年家庭儲(chǔ)蓄添加額,自變量上一年家庭儲(chǔ)蓄添加額,自變量 為上一年家庭總收為上一年家庭總收入,自變量入,自變量 表示家庭學(xué)歷。高學(xué)歷家庭表示家庭學(xué)歷。高學(xué)歷家庭 ,低,低學(xué)歷家庭學(xué)歷家庭 ,調(diào)查數(shù)據(jù)見(jiàn)下表。,調(diào)查數(shù)據(jù)見(jiàn)下表。1x2x21x 20 x 序號(hào)序號(hào) (元元) (萬(wàn)元萬(wàn)元)1234567891011121314152

31、353463654686588671085123612381345236523653256325632562.33.22.83.52.63.22.63.42.22.82.33.74.02.93.801010101010110158822023711246131330188696797230915421153714034552372104732291011851326217846725851985207415171412y1x2xieide序號(hào)序號(hào) (元元) (萬(wàn)元)16171819202122232425262732653567365845886436904779858950986598661

32、0235101404.64.23.73.54.85.04.23.94.84.64.84.211101100000026588261178827252159310820055242431542047402324166928911505453200239471924257822944157y1x2xieideModel Summaryb.938a.879.8691288.563Model1RR SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), X2, X1a. Dependent Variable: Yb.

33、 ANOVAb2.9E+08214519733187.448.000a4.0E+07241660394.2983.3E+0826RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), X2, X1a. Dependent Variable: Yb. 建立建立 對(duì)對(duì) 的線性回歸,并計(jì)算殘差的線性回歸,并計(jì)算殘差iey12,x xCoefficientsa-7976.8751093.346-7.296.0003826.148304.564.92112.563.000-3701.03151

34、3.399-.529-7.209.000(Constant)X1X2Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: Ya. 兩個(gè)自變量?jī)蓚€(gè)自變量 與與 的系數(shù)都是顯著的,多重?cái)喽ㄏ禂?shù)的系數(shù)都是顯著的,多重?cái)喽ㄏ禂?shù) ,回歸方程為,回歸方程為1x2x20.879R 12797638263701yxx 該結(jié)果闡明,中等收入的家庭每添加該結(jié)果闡明,中等收入的家庭每添加1萬(wàn)元收入,平均萬(wàn)元收入,平均拿出拿出3826元作為儲(chǔ)蓄。高學(xué)歷家庭每年的平均儲(chǔ)蓄額元作為儲(chǔ)蓄

35、。高學(xué)歷家庭每年的平均儲(chǔ)蓄額少于低學(xué)歷的家庭,平均少少于低學(xué)歷的家庭,平均少3701元。元。假設(shè)不引入學(xué)歷定性變量假設(shè)不引入學(xué)歷定性變量 ,用,用 對(duì)家庭年收入對(duì)家庭年收入 作作一元線性回歸,得一元線性回歸,得 闡明擬合效果不好。闡明擬合效果不好。 對(duì)對(duì) 的一元回歸殘差的一元回歸殘差 見(jiàn)表中。見(jiàn)表中。2x1x20.618,R yy1xideModel Summaryb.786a.618.6032246.211Model1RR SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), X1a. Dependent

36、 Variable: Yb. Coefficientsa-7728.1171904.962-4.057.0003264.366513.239.7866.360.000(Constant)X1Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: Ya. Coefficientsa5059.357928.7415.448.000-2050.7421338.458-.293-1.532.138(Constant)X2Model1BStd. ErrorUnstand

37、ardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: Ya. 假設(shè)不思索家庭年收入假設(shè)不思索家庭年收入 ,13戶高學(xué)歷家庭的平均年戶高學(xué)歷家庭的平均年儲(chǔ)蓄添加額為儲(chǔ)蓄添加額為3008.62元,元,14戶低學(xué)歷家庭的平均年戶低學(xué)歷家庭的平均年儲(chǔ)蓄添加額為儲(chǔ)蓄添加額為5059.36元,高學(xué)歷家庭每年的儲(chǔ)蓄額元,高學(xué)歷家庭每年的儲(chǔ)蓄額比低學(xué)歷的家庭平均少比低學(xué)歷的家庭平均少5059.363008.622050.74元,元,而用前面的回歸法算出的值是而用前面的回歸法算出的值是3701元,兩者并不相等。元,兩者并不

38、相等。3701元是在假設(shè)兩者的家庭年收入相等的根底上的儲(chǔ)元是在假設(shè)兩者的家庭年收入相等的根底上的儲(chǔ)蓄差值,反映了學(xué)歷高低對(duì)儲(chǔ)蓄額的真實(shí)差別。蓄差值,反映了學(xué)歷高低對(duì)儲(chǔ)蓄額的真實(shí)差別。1x10.6 非線性回歸非線性回歸10.6.1 雙曲線雙曲線10.6.2 冪函數(shù)曲線冪函數(shù)曲線10.6.3 對(duì)數(shù)曲線對(duì)數(shù)曲線非線性回歸非線性回歸1.1. 因變量因變量 y y 與與 x x 之間不是線性關(guān)系之間不是線性關(guān)系2.2. 可經(jīng)過(guò)變量代換轉(zhuǎn)換成線性關(guān)系可經(jīng)過(guò)變量代換轉(zhuǎn)換成線性關(guān)系用最小二乘法求出參數(shù)的估計(jì)值用最小二乘法求出參數(shù)的估計(jì)值并非一切的非線性模型都可以化為線性模并非一切的非線性模型都可以化為線性模型

39、型雙曲線xxy根本方式:線性化方法令:y = 1/y,x= 1/x, 那么有y = + x圖像冪函數(shù)曲線根本方式:線性化方法兩端取對(duì)數(shù)得:lg y = lg + lg x令:y = lgy,x= lg x,那么y = lg + x圖像xy 對(duì)數(shù)曲線根本方式:線性化方法x= lnx , 那么有y = + x圖像xylnSPSS中可以進(jìn)展的曲線回歸包括:曲線回歸的計(jì)算機(jī)實(shí)現(xiàn): Spss:analyzeregressioncurve estimation; Eviews:quickestimate equation。例題:我國(guó)19782002年人均GDP數(shù)據(jù)1978年不變價(jià),試建立人均GDP與時(shí)間之

40、間的回歸方程。1 1、畫出散點(diǎn)圖、畫出散點(diǎn)圖2 2、計(jì)算相關(guān)系數(shù)、計(jì)算相關(guān)系數(shù)CorrelationsCorrelations1.972*.99852*.98353*.000.000.00025252525.972*1.971*.921*.000.000.00025252525.999*.971*1.986*.000.000.00025252525.984*.921*.986*1.000.000.00025252525Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson Correlation

41、Sig. (2-tailed)NPearson CorrelationSig. (2-tailed)N元,78不變,人均年度序號(hào)年度序號(hào)二次方年度序號(hào)三次方元,78不變,人均年度序號(hào)年度序號(hào)二次方年度序號(hào)三次方Correlation is significant at the 0.01 level (2-tailed).*. 3 3、進(jìn)展回歸、進(jìn)展回歸M Mo od de el l S Su um mm ma ar ry y a an nd d P Pa ar ra am me et te er r E Es st ti im ma at te es sDependent Variable: 元,78不變,人均.945398.132123.00026.87084.708.99720 3922.449222.000387.4904.571 3.082.99728 2566.953321.000368.93712.379 2.346.019EquationLinearQuadraticCubicR SquareFdf1df2Sig.Model SummaryConstantb1b2b3Pa

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論