第三章-回歸分析預(yù)測方法_第1頁
第三章-回歸分析預(yù)測方法_第2頁
第三章-回歸分析預(yù)測方法_第3頁
第三章-回歸分析預(yù)測方法_第4頁
第三章-回歸分析預(yù)測方法_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 第三章第三章 回歸分析預(yù)測方法回歸分析預(yù)測方法5 非線性非線性回歸預(yù)測法回歸預(yù)測法1 引言引言2 一元線性一元線性回歸預(yù)測法回歸預(yù)測法3 多元線性多元線性回歸預(yù)測法回歸預(yù)測法4 虛擬變量虛擬變量 回歸預(yù)測回歸預(yù)測要求掌握以下內(nèi)容:要求掌握以下內(nèi)容:概念部分:概念部分:n1. 1. 變量之間的關(guān)系可以分成哪兩類變量之間的關(guān)系可以分成哪兩類 n2. 2. 回歸分析與相關(guān)分析的區(qū)別和聯(lián)系回歸分析與相關(guān)分析的區(qū)別和聯(lián)系n3. 3. 一元線性回歸(一元線性回歸(Linear regressionLinear regression)n4. 4. 最小二乘回歸法的基本思想最小二乘回歸法的基本思想n5. 5

2、. 回歸方程的顯著性檢驗(yàn)回歸方程的顯著性檢驗(yàn)n6. 6. 區(qū)間估計區(qū)間估計n7. 7. 虛擬變量虛擬變量計算部分:計算部分:n8. 8. 一元線性回歸預(yù)測法一元線性回歸預(yù)測法 第一節(jié)第一節(jié) 引言引言本章學(xué)習(xí)目的與要求:本章學(xué)習(xí)目的與要求: 通過本章的學(xué)習(xí),了解回歸分析預(yù)測法通過本章的學(xué)習(xí),了解回歸分析預(yù)測法的概念,掌握回歸分析中各系數(shù)的計算方法的概念,掌握回歸分析中各系數(shù)的計算方法及回歸預(yù)測方法,能夠運(yùn)用及回歸預(yù)測方法,能夠運(yùn)用ExcelExcel工具來進(jìn)行工具來進(jìn)行預(yù)測。預(yù)測?;乇菊履夸?案例:案例: n 有有2020戶家庭,冬天戶家庭,冬天的取暖費(fèi)用與的取暖費(fèi)用與3 3個因素個因素有關(guān):日

3、間戶外的平均有關(guān):日間戶外的平均溫度,閣樓絕緣層的厚溫度,閣樓絕緣層的厚度,以及爐子的使用年度,以及爐子的使用年數(shù)。如果某一家庭的平數(shù)。如果某一家庭的平均戶外溫度是均戶外溫度是F30F30度,度,閣樓絕緣層的厚度為閣樓絕緣層的厚度為5 5英寸,爐子已使用過英寸,爐子已使用過1010年,它的冬天取暖費(fèi)用年,它的冬天取暖費(fèi)用為多少?為多少? 一、回歸與回歸分析預(yù)測方法一、回歸與回歸分析預(yù)測方法 “回歸回歸”一詞的涵義一詞的涵義n “回歸回歸”最初是遺傳學(xué)中的一個名詞,由英最初是遺傳學(xué)中的一個名詞,由英國生物學(xué)家兼統(tǒng)計學(xué)家高爾登首先提出。他在研國生物學(xué)家兼統(tǒng)計學(xué)家高爾登首先提出。他在研究人類的身高時

4、,發(fā)現(xiàn)子女身高有回歸于人類的究人類的身高時,發(fā)現(xiàn)子女身高有回歸于人類的平均身高的趨勢。平均身高的趨勢。 n回歸現(xiàn)代涵義回歸現(xiàn)代涵義研究自變量與因變量之間的關(guān)系形式的分析方法。研究自變量與因變量之間的關(guān)系形式的分析方法。目的:根據(jù)已知自變量來估計和預(yù)測因變量的值。目的:根據(jù)已知自變量來估計和預(yù)測因變量的值。例如:例如:農(nóng)作物畝產(chǎn)量農(nóng)作物畝產(chǎn)量施肥量施肥量降雨量降雨量氣溫氣溫n 在研究某一社會經(jīng)濟(jì)現(xiàn)象的發(fā)展變化在研究某一社會經(jīng)濟(jì)現(xiàn)象的發(fā)展變化規(guī)律時,經(jīng)過分析可以找到影響這一現(xiàn)規(guī)律時,經(jīng)過分析可以找到影響這一現(xiàn)象變化的原因。在回歸分析中,把某一象變化的原因。在回歸分析中,把某一現(xiàn)象稱為現(xiàn)象稱為因變量

5、因變量,它是預(yù)測的對象,把,它是預(yù)測的對象,把引起這一現(xiàn)象變化的因素稱為引起這一現(xiàn)象變化的因素稱為自變量自變量,它是引起這一現(xiàn)象變化的原因。而因變它是引起這一現(xiàn)象變化的原因。而因變量則反映了自變量變化的結(jié)果。量則反映了自變量變化的結(jié)果。n 回歸分析預(yù)測方法回歸分析預(yù)測方法就是從各種經(jīng)濟(jì)就是從各種經(jīng)濟(jì)現(xiàn)象之間的相互關(guān)系出發(fā),通過對與預(yù)現(xiàn)象之間的相互關(guān)系出發(fā),通過對與預(yù)測對象有聯(lián)系的現(xiàn)象變動趨勢的分析,測對象有聯(lián)系的現(xiàn)象變動趨勢的分析,推算預(yù)測對象未來狀態(tài)數(shù)量表現(xiàn)的一種推算預(yù)測對象未來狀態(tài)數(shù)量表現(xiàn)的一種預(yù)測方法。預(yù)測方法。二、回歸分析和相關(guān)分析二、回歸分析和相關(guān)分析n1、變量之間的關(guān)系、變量之間的

6、關(guān)系n 現(xiàn)實(shí)世界中,每一事物都與它周圍的事現(xiàn)實(shí)世界中,每一事物都與它周圍的事物相互聯(lián)系、相互影響,反映客觀事物運(yùn)動物相互聯(lián)系、相互影響,反映客觀事物運(yùn)動的各種變量之間也就存在著一定的關(guān)系。變的各種變量之間也就存在著一定的關(guān)系。變量之間的關(guān)系可以分成兩類:量之間的關(guān)系可以分成兩類:函數(shù)關(guān)系函數(shù)關(guān)系和和相相關(guān)關(guān)系。關(guān)關(guān)系。 (1 1)函數(shù)關(guān)系)函數(shù)關(guān)系。函數(shù)關(guān)系反映客觀事物之。函數(shù)關(guān)系反映客觀事物之間存在著嚴(yán)格的依存關(guān)系,是一種間存在著嚴(yán)格的依存關(guān)系,是一種確定確定性關(guān)系,性關(guān)系,亦即當(dāng)其它條件不變時,對于亦即當(dāng)其它條件不變時,對于某一自變量或幾個自變量的每一數(shù)值,某一自變量或幾個自變量的每一數(shù)值

7、,都有因變量的一個的確定值與之相對應(yīng),都有因變量的一個的確定值與之相對應(yīng),并且這種關(guān)系可以用一個確定的數(shù)學(xué)表并且這種關(guān)系可以用一個確定的數(shù)學(xué)表達(dá)式反映出來。達(dá)式反映出來。 n設(shè)有兩個變量設(shè)有兩個變量x和和y,y與與x一起變化并完全依一起變化并完全依賴于賴于x,當(dāng),當(dāng)x取某個數(shù)值時,取某個數(shù)值時,y依確定的關(guān)系取依確定的關(guān)系取相應(yīng)的值,則稱相應(yīng)的值,則稱y是是x的函數(shù),記作的函數(shù),記作y=f(x)。n如,企業(yè)的原材料消耗金額如,企業(yè)的原材料消耗金額y與產(chǎn)量與產(chǎn)量x1、單位、單位產(chǎn)量消耗產(chǎn)量消耗x2、原材料價格、原材料價格x3之間的關(guān)系可表示之間的關(guān)系可表示為為y=x1x2x3。例:圓面積對于半徑

8、的依存關(guān)。例:圓面積對于半徑的依存關(guān)系,正方形的面積對于邊長的依存關(guān)系等等。系,正方形的面積對于邊長的依存關(guān)系等等。n變量間的函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系。變量間的函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系。(2)相關(guān)關(guān)系)相關(guān)關(guān)系n相關(guān)關(guān)系相關(guān)關(guān)系。反映事物之間的非嚴(yán)格、不確定的線性依存。反映事物之間的非嚴(yán)格、不確定的線性依存關(guān)系。關(guān)系。有兩個顯著的特點(diǎn):有兩個顯著的特點(diǎn):事物之間在數(shù)量上確實(shí)存在一定的內(nèi)在聯(lián)系。表現(xiàn)在一事物之間在數(shù)量上確實(shí)存在一定的內(nèi)在聯(lián)系。表現(xiàn)在一個變量發(fā)生數(shù)量上的變化,要影響另一個變量也相應(yīng)地個變量發(fā)生數(shù)量上的變化,要影響另一個變量也相應(yīng)地發(fā)生數(shù)量上的變化。發(fā)生數(shù)量上的變化。例:例:

9、事物之間的數(shù)量依存關(guān)系不是確定的,具有一定的隨機(jī)事物之間的數(shù)量依存關(guān)系不是確定的,具有一定的隨機(jī)性。表現(xiàn)在給定自變量一個數(shù)值,因變量會有若干個數(shù)性。表現(xiàn)在給定自變量一個數(shù)值,因變量會有若干個數(shù)值和它對應(yīng),并且因變量總是遵循一定規(guī)律圍繞這些數(shù)值和它對應(yīng),并且因變量總是遵循一定規(guī)律圍繞這些數(shù)值平均數(shù)上下波動。其原因是影響因變量發(fā)生變化的因值平均數(shù)上下波動。其原因是影響因變量發(fā)生變化的因素不止一個。素不止一個。例例:影響:影響工業(yè)總產(chǎn)值工業(yè)總產(chǎn)值的因素除了的因素除了職工數(shù)職工數(shù)外,還有固定外,還有固定資產(chǎn)資產(chǎn)原值原值、流動資金流動資金和和能耗能耗等因素。等因素。成本成本勞動生產(chǎn)率勞動生產(chǎn)率n相關(guān)關(guān)系

10、的特點(diǎn)相關(guān)關(guān)系的特點(diǎn) 1 1變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)。變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)。 2 2一個變量的取值不能由另一個變量唯一確定。一個變量的取值不能由另一個變量唯一確定。 3 3對于線性相關(guān),各觀測點(diǎn)分布在直線周圍。對于線性相關(guān),各觀測點(diǎn)分布在直線周圍。 -3-2-1012-2-1012(a)xy-2-1012-2-1012(b)xy-2-1012-2-1012(c)xy-3-2-1012302468(d)xy-3-2-1012-2-1012(a)xy-2-1012-2-1012(b)xy-2-1012-2-1012(c)xy-3-2-1012302468(d)xy不相關(guān)正相關(guān)負(fù)

11、相關(guān)相 關(guān) 但 無線性關(guān)系2、回歸分析與相關(guān)分析、回歸分析與相關(guān)分析研究和測度兩個或兩個以上變量之間關(guān)系的方研究和測度兩個或兩個以上變量之間關(guān)系的方法有法有回歸分析回歸分析和和相關(guān)分析相關(guān)分析。n相關(guān)分析相關(guān)分析。研究兩個或兩個以上隨機(jī)變量之。研究兩個或兩個以上隨機(jī)變量之間線性依存關(guān)系的緊密程度。通常用相關(guān)系間線性依存關(guān)系的緊密程度。通常用相關(guān)系數(shù)表示,多元相關(guān)時用復(fù)相關(guān)系數(shù)表示。數(shù)表示,多元相關(guān)時用復(fù)相關(guān)系數(shù)表示。n回歸分析回歸分析。研究某一隨機(jī)變量(因變量)與。研究某一隨機(jī)變量(因變量)與其他一個或幾個普通變量(自變量)之間的其他一個或幾個普通變量(自變量)之間的數(shù)量變動的關(guān)系。數(shù)量變動的

12、關(guān)系。區(qū)區(qū)別別相關(guān)分析相關(guān)分析研究變量都是隨機(jī)變量,不分自變量與因變量研究變量都是隨機(jī)變量,不分自變量與因變量回歸分析回歸分析明確的自變量和因變量,自變量是確定的普通變量,明確的自變量和因變量,自變量是確定的普通變量,因變量是隨機(jī)變量。因變量是隨機(jī)變量。聯(lián)聯(lián)系系相關(guān)分析相關(guān)分析事物之間相互依存關(guān)系的兩個不可分割的方面。在事物之間相互依存關(guān)系的兩個不可分割的方面。在實(shí)際工作中,一般先進(jìn)行相關(guān)分析,由相關(guān)系數(shù)的實(shí)際工作中,一般先進(jìn)行相關(guān)分析,由相關(guān)系數(shù)的大小決定是否需要進(jìn)行回歸分析。在相關(guān)分析的基大小決定是否需要進(jìn)行回歸分析。在相關(guān)分析的基礎(chǔ)上建立回歸模型,以便進(jìn)行推算、預(yù)測。礎(chǔ)上建立回歸模型,以

13、便進(jìn)行推算、預(yù)測?;貧w分析回歸分析 n相關(guān)分析相關(guān)分析相關(guān)關(guān)系線性相關(guān)非線性相關(guān)完全相關(guān)(R=1)(即線性相關(guān))不相關(guān)(R=0)正相關(guān)負(fù)相關(guān)正相關(guān)負(fù)相關(guān)n相關(guān)系數(shù)相關(guān)系數(shù)對變量之間關(guān)系密切程度的度量對變量之間關(guān)系密切程度的度量 n 的取值范圍是的取值范圍是 -1,1:-1,1:完全相關(guān)完全相關(guān) / /完全正相關(guān)完全正相關(guān) / /完全負(fù)相關(guān)完全負(fù)相關(guān) / /不存在線性相關(guān)關(guān)不存在線性相關(guān)關(guān)系系 / /負(fù)相關(guān)負(fù)相關(guān) / /正相關(guān)正相關(guān) 一般,一般,r r0.70.7為高度相關(guān);為高度相關(guān);r r0.30.3為低度相關(guān);為低度相關(guān);0.30.3 r r0.70.7 為中度相關(guān)。為中度相關(guān)。r r22

14、2)()(*)()(iiiiiyyxxyyxxn相關(guān)系數(shù)的缺點(diǎn):相關(guān)系數(shù)的缺點(diǎn):r r接近于接近于1 1的程度與的程度與n n有有關(guān)。當(dāng)關(guān)。當(dāng)n n較小時較小時r r的波動較大,當(dāng)?shù)牟▌虞^大,當(dāng)n n較大時較大時r r的絕對值容易偏小。例如,的絕對值容易偏小。例如,n=2n=2時,時,r r的的絕對值總為絕對值總為1 1(兩點(diǎn)連線總為一條直線)(兩點(diǎn)連線總為一條直線)。n例例3-13-1 設(shè)有設(shè)有1010個廠家的投入和產(chǎn)出如下,根據(jù)這些數(shù)據(jù),我個廠家的投入和產(chǎn)出如下,根據(jù)這些數(shù)據(jù),我們可以認(rèn)為投入和產(chǎn)出之間存在相關(guān)性嗎?們可以認(rèn)為投入和產(chǎn)出之間存在相關(guān)性嗎?(相關(guān)數(shù)據(jù))(相關(guān)數(shù)據(jù))廠家1234

15、5678910投入20402030101020202030產(chǎn)出30604060304040503070n 回歸分析回歸分析是研究某一隨機(jī)變量是研究某一隨機(jī)變量( (因變量因變量) )與其與其他一個或幾個普通變量他一個或幾個普通變量( (自變量自變量) )之間的數(shù)量變之間的數(shù)量變動的關(guān)系。其動的關(guān)系。其基本思路基本思路是:從一組樣本數(shù)據(jù)出是:從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式,對這些關(guān)系發(fā),確定變量之間的數(shù)學(xué)關(guān)系式,對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計檢驗(yàn),并從影響某式的可信程度進(jìn)行各種統(tǒng)計檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響一特定變量的諸多變量中找出哪些變量的影響顯

16、著,哪些不顯著。然后利用所求的關(guān)系式,顯著,哪些不顯著。然后利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù)測或控制另一根據(jù)一個或幾個變量的取值來預(yù)測或控制另一個特定變量的取值,并給出這種預(yù)測或控制的個特定變量的取值,并給出這種預(yù)測或控制的精確程度。精確程度。3 3、回歸分析的基本思路、回歸分析的基本思路三、回歸模型的種類三、回歸模型的種類n (1)(1)根據(jù)根據(jù)自變量自變量的多少,回歸模型可以分為一元回歸模的多少,回歸模型可以分為一元回歸模型和多元回歸模型。型和多元回歸模型。n (2) (2)根據(jù)模型中自變量與因變量之間根據(jù)模型中自變量與因變量之間是否線性是否線性,可以分,可以分為線性回歸模型

17、和非線性回歸模型。為線性回歸模型和非線性回歸模型。n (3)(3)根據(jù)回歸模型是否帶有根據(jù)回歸模型是否帶有虛擬變量虛擬變量,回歸模型可以分,回歸模型可以分為普通回歸模型和帶虛擬變量的回歸模型。為普通回歸模型和帶虛擬變量的回歸模型。應(yīng)用回歸分析預(yù)測需滿足條件:應(yīng)用回歸分析預(yù)測需滿足條件:1.數(shù)據(jù)量不能太少(以多于數(shù)據(jù)量不能太少(以多于20個較好);個較好);2.預(yù)測對象與影響因素之間必須存在相關(guān)關(guān)系;預(yù)測對象與影響因素之間必須存在相關(guān)關(guān)系; 第二節(jié)第二節(jié) 一元線性回歸預(yù)測法一元線性回歸預(yù)測法n 一元線性回歸(一元線性回歸(Linear regressionLinear regression)是指

18、成對的兩個是指成對的兩個變量數(shù)據(jù)分布大體上呈直線趨勢時,運(yùn)用合適的參數(shù)估變量數(shù)據(jù)分布大體上呈直線趨勢時,運(yùn)用合適的參數(shù)估計方法,求出一元線性回歸模型,然后根據(jù)自變量與因計方法,求出一元線性回歸模型,然后根據(jù)自變量與因變量之間的關(guān)系,預(yù)測因變量的趨勢。變量之間的關(guān)系,預(yù)測因變量的趨勢。n 現(xiàn)實(shí)中,很多社會經(jīng)濟(jì)現(xiàn)象之間都存在相關(guān)關(guān)系,現(xiàn)實(shí)中,很多社會經(jīng)濟(jì)現(xiàn)象之間都存在相關(guān)關(guān)系,因此,一元線性回歸預(yù)測有很廣泛的應(yīng)用。進(jìn)行一元線因此,一元線性回歸預(yù)測有很廣泛的應(yīng)用。進(jìn)行一元線性回歸預(yù)測時,必須選用合適的統(tǒng)計方法估計模型參數(shù),性回歸預(yù)測時,必須選用合適的統(tǒng)計方法估計模型參數(shù),并對模型及其參數(shù)進(jìn)行統(tǒng)計檢驗(yàn)

19、。并對模型及其參數(shù)進(jìn)行統(tǒng)計檢驗(yàn)?;乇菊履夸浺?、一元線性回歸模型一、一元線性回歸模型n一元線性回歸(一元線性回歸(Linear regression),),只研究一個只研究一個自變量與一個因變量之間的統(tǒng)計關(guān)系。自變量與一個因變量之間的統(tǒng)計關(guān)系。 n對于只涉及一個自變量的簡單線性回歸模型可表對于只涉及一個自變量的簡單線性回歸模型可表示為:示為:n其中,其中,b b0 0和和b b1 1稱為模型的參數(shù);稱為模型的參數(shù);e e是隨機(jī)誤差項(xiàng),是隨機(jī)誤差項(xiàng),又稱隨機(jī)干擾項(xiàng),有又稱隨機(jī)干擾項(xiàng),有 01yxbbe20,Ne在線性回歸模型中加入隨機(jī)誤差項(xiàng)是基于在線性回歸模型中加入隨機(jī)誤差項(xiàng)是基于以下原因:以下原

20、因:n 第一,模型不可能包含所有的解釋變量。第一,模型不可能包含所有的解釋變量。n 第二,模型的設(shè)定誤差。第二,模型的設(shè)定誤差。 n 第三,測量誤差的影響。第三,測量誤差的影響。n 第四,其他隨機(jī)因素的影響。第四,其他隨機(jī)因素的影響。n簡單線性回歸方程簡單線性回歸方程的形式為的形式為 也稱為也稱為直線回歸方程直線回歸方程。其中,。其中, b b0 0是回歸直線在是回歸直線在y y軸上的截距;軸上的截距; b b1 1是直線的斜率,稱為回歸系數(shù),表示當(dāng)是直線的斜率,稱為回歸系數(shù),表示當(dāng)x x每變動一個單位每變動一個單位時,時,y y的平均變動值。的平均變動值。n總體回歸參數(shù)總體回歸參數(shù)b b0

21、0和和b b1 1是未知的,必需利用樣本數(shù)據(jù)去估計。是未知的,必需利用樣本數(shù)據(jù)去估計。用樣本統(tǒng)計量用樣本統(tǒng)計量b b0 0和和b b1 1代替回歸方程中的未知參數(shù)代替回歸方程中的未知參數(shù)b b0 0和和b b1 1 ,就得到了估計的回歸方程:就得到了估計的回歸方程:n其中,其中, b b0 0是估計的回歸直線在是估計的回歸直線在y y軸上的截距,軸上的截距,b b1 1是直線的是直線的斜率。斜率。 01,yxbbe01 ybb x二、參數(shù)二、參數(shù)b b0 0和和b b1 1的最小二乘估計的最小二乘估計n對對例例3-1中中兩個變量的數(shù)據(jù)進(jìn)行線性回歸,兩個變量的數(shù)據(jù)進(jìn)行線性回歸,就是要找到一條直線

22、來適當(dāng)?shù)卮韴D中的那就是要找到一條直線來適當(dāng)?shù)卮韴D中的那些點(diǎn)的趨勢。些點(diǎn)的趨勢。 n用數(shù)據(jù)尋找一條直線的過程也叫做擬合用數(shù)據(jù)尋找一條直線的過程也叫做擬合一條直線。一條直線。02004006008001000120019921993 19941995 19961997 19981999 20002001 20022003 20042005利潤額yt系列2線性(利潤額yt)?22yab x 11yab x 33yab x n首先需要確定選擇這條直線的標(biāo)準(zhǔn)。這里介首先需要確定選擇這條直線的標(biāo)準(zhǔn)。這里介紹紹最小二乘回歸法最小二乘回歸法(least squares regressionleast sq

23、uares regression)。)。n最小二乘回歸法的基本思想:最小二乘回歸法的基本思想:通過數(shù)學(xué)模型,通過數(shù)學(xué)模型,擬合一條較為理想的直線,這條直線必須滿擬合一條較為理想的直線,這條直線必須滿足兩點(diǎn)要求足兩點(diǎn)要求(1 1)原數(shù)列的觀測值與模型估計)原數(shù)列的觀測值與模型估計值的離差平方和(值的離差平方和(即所有點(diǎn)到該直線的垂直即所有點(diǎn)到該直線的垂直距離的平方和)為最小。(距離的平方和)為最小。(2 2)原數(shù)列的觀測)原數(shù)列的觀測值與模型估計值的離差總和為值與模型估計值的離差總和為0 0。最小二乘法最小二乘法n離差與離差平方離差與離差平方eettteyy離差:11()0nnttttteyy離

24、差和:2211()nnitttteyy離差平方和最小最小擬合程度最好擬合程度最好6y6 y最小二乘原理n簡單講,使歷史數(shù)據(jù)到擬合直線上的離差平方和最小,從而求得模型參數(shù)的方法。n法國數(shù)學(xué)家勒讓德于1806年首次發(fā)表最小二乘理論。事實(shí)上,德國的高斯于1794年已經(jīng)應(yīng)用這一理論推算了谷神星的軌道,但遲至1809年才正式發(fā)表。n最小二乘法也是數(shù)理統(tǒng)計中一種常用的方法,在工業(yè)技術(shù)和其他科學(xué)研究中有廣泛應(yīng)用。n設(shè)簡單線性回歸模型設(shè)簡單線性回歸模型 中,中, b b0 0和和b b1 1是是b b0 0和和b b1 1的估計值。則的估計值。則y y的估計值用的估計值用 表示。表示。n我們要求出這樣的待估參

25、數(shù)我們要求出這樣的待估參數(shù)b b0 0和和b b1 1,使因變量的觀察值與估使因變量的觀察值與估計值之間的離差平方和達(dá)到最小,即使計值之間的離差平方和達(dá)到最小,即使 極小。為此,分別極小。為此,分別求求Q Q對對b b0 0和和b b1 1的偏導(dǎo),就可以求出符合要求的待估參數(shù)的偏導(dǎo),就可以求出符合要求的待估參數(shù)b b0 0和和b b1 1:01 ybb x01yxbbe22201iiiQyyybb xe10122, ()nxyxyyxbbbnxxnn 例例3-2:已知某種商品的:已知某種商品的銷售量銷售量同居民的同居民的可支配可支配收入收入有關(guān),現(xiàn)有如下表的統(tǒng)計數(shù)據(jù),試建立回歸有關(guān),現(xiàn)有如下表

26、的統(tǒng)計數(shù)據(jù),試建立回歸方程,并求出相應(yīng)參數(shù)的最小二乘估計值。方程,并求出相應(yīng)參數(shù)的最小二乘估計值。年份年份實(shí)際可支配實(shí)際可支配收入收入 x(單(單位:位:10元)元)商品的銷售商品的銷售量(單位:量(單位:件)件)年份年份實(shí)際可支配實(shí)際可支配收入收入x(單(單位:位:10元)元)商品的銷商品的銷售量(單售量(單位:件)位:件)1983522670019917418158198453971361992769868319855777658199380193171986613778419948559675198764481081995842854219886707583199686085841989

27、6958002199789096121990713844219989209719第一步:繪制散點(diǎn)圖第一步:繪制散點(diǎn)圖6000650070007500800085009000950010000500 550 600 650 700 750 800 850 900yi(件件)xi(10元)元)950第二步:設(shè)一元線性回歸方程為第二步:設(shè)一元線性回歸方程為12201()iiiiiiiinx yxybnxxyxbbnn 01 ybb x年份年份實(shí)際可支配實(shí)際可支配收入收入 x ( (1010元元) )商品的銷售商品的銷售量(件)量(件)xiyixi219835226700349740027248419

28、845397136384630429052119855777658441866633292919866137784477159237576919876448108522155241473619886707583508061044890019896958002556139048302519907138442601914650836919917418158604507854908119927698683667722759136119938019317746291764160119948559675827212573102519958428542719236470896419968608584738

29、2240739600199789096128554680792100199892097198941480846400SUM1165113370398944771 872686598944771iix y 28726865ix 11651ix 133703iy 120116 98944771 11651 13370316 8726865(11651)133703116511616bbb013605.14,6.52bb所求的回歸方程為:所求的回歸方程為:3605.146.52yx6000650070007500800085009000950010000500 550 600 650 700 750

30、 800 850 900yi(件)xi(10元)元)950三、回歸方程的顯著性檢驗(yàn)三、回歸方程的顯著性檢驗(yàn)n我們把觀測值與其平均值的偏差平方和我們把觀測值與其平均值的偏差平方和 稱為稱為總離差平方和總離差平方和。記為。記為SSTSST(Total Deviation Sum of Total Deviation Sum of SquaresSquares)。)。nSSTSST來源于來源于兩個方面:一是由于兩個方面:一是由于自變量自變量x x的的取值不同造成的取值不同造成的(回歸變差回歸變差);二是除);二是除x x以外的其他因素以外的其他因素( (如觀測和實(shí)踐中如觀測和實(shí)踐中產(chǎn)生的誤差等產(chǎn)生的

31、誤差等) )的影響造成的(的影響造成的(剩余變差剩余變差)。可分解為兩)??煞纸鉃閮刹糠郑翰糠郑簄其中其中 稱作稱作回歸平方和回歸平方和(Regression Sum of Regression Sum of SquaresSquares), ,記作記作SSRSSR; 稱作稱作殘差平方和殘差平方和(Residual Residual Sum of SquaresSum of Squares), ,記作記作SSESSE。2() ,yy222()()()SSTyyyyyy2)(yy2) (yynSST=SSR+SSEn總離差平方和總離差平方和 反映因變量反映因變量的每個觀察值與其均值的總離差;的每

32、個觀察值與其均值的總離差;n回歸平方和回歸平方和 ,反映自變量,反映自變量的變化對因變量的變化對因變量 y 取值變化的影響;取值變化的影響;n殘差平方和殘差平方和 反映除自變量反映除自變量以外的其他因素對取值的影響,也稱為不可以外的其他因素對取值的影響,也稱為不可解釋的平方和或剩余平方和。解釋的平方和或剩余平方和。 2() ,SSTyy2() ,SSEyy2()SSRyy r r2 2 = = 決定系數(shù)決定系數(shù) = =r = r = 相關(guān)系數(shù)相關(guān)系數(shù) = = 確定性系數(shù)確定性系數(shù)SSRSST+-YX解釋的解釋的總的總的均值(均值(Y)回歸線(回歸線(Y)未解釋的未解釋的總的、解釋的和未解釋的偏

33、離之間的關(guān)系總的、解釋的和未解釋的偏離之間的關(guān)系回歸方程的顯著性檢驗(yàn):回歸方程的顯著性檢驗(yàn):n回歸方程的顯著性檢驗(yàn)回歸方程的顯著性檢驗(yàn),就是檢驗(yàn)自變,就是檢驗(yàn)自變量和因變量之間的線性關(guān)系是否顯著。量和因變量之間的線性關(guān)系是否顯著。n有有3 3種方法:種方法:n1.F1.F檢驗(yàn)法(總體顯著性檢驗(yàn))。檢驗(yàn)法(總體顯著性檢驗(yàn))。n2.t2.t檢驗(yàn)法(回歸系數(shù)的顯著性檢驗(yàn))。檢驗(yàn)法(回歸系數(shù)的顯著性檢驗(yàn))。n3.3.相關(guān)系數(shù)檢驗(yàn)法(回歸系數(shù)的顯著性檢相關(guān)系數(shù)檢驗(yàn)法(回歸系數(shù)的顯著性檢驗(yàn))。驗(yàn))。 n具體方法是將回歸離差平方和具體方法是將回歸離差平方和SSRSSR同剩余離同剩余離差平方和差平方和SSES

34、SE加以比較,應(yīng)用檢驗(yàn)來分析二加以比較,應(yīng)用檢驗(yàn)來分析二者之間的差別是否顯著。如果是顯著的,者之間的差別是否顯著。如果是顯著的,則兩個變量之間存在線性關(guān)系;如果不顯則兩個變量之間存在線性關(guān)系;如果不顯著,則兩個變量之間不存在線性關(guān)系。著,則兩個變量之間不存在線性關(guān)系。n檢驗(yàn)步驟如下:檢驗(yàn)步驟如下:1.F1.F檢驗(yàn)法(總體顯著性檢驗(yàn))檢驗(yàn)法(總體顯著性檢驗(yàn))n(1)提出假設(shè))提出假設(shè)nH0:自變量與因變量的線性關(guān)系不顯著;:自變量與因變量的線性關(guān)系不顯著;nH1:兩者線性關(guān)系顯著。:兩者線性關(guān)系顯著。n(2)計算檢驗(yàn)統(tǒng)計量)計算檢驗(yàn)統(tǒng)計量F:n(3)確定顯著性水平)確定顯著性水平 ,并根據(jù)分子自

35、由度,并根據(jù)分子自由度1和分母自由和分母自由度度n-2找出臨界值找出臨界值Fa;n(4)作出決策)作出決策:若若 拒絕拒絕H0 ;若;若 接受接受H0 。/11,2/(2)SSRFFnSSEn,FF,F F 在回歸分析中通常計算在回歸分析中通常計算F F值來檢驗(yàn)?zāi)P涂傮w的值來檢驗(yàn)?zāi)P涂傮w的顯著性,在我們后面將要學(xué)到的多元回歸中,顯著性,在我們后面將要學(xué)到的多元回歸中,F(xiàn) F用來檢驗(yàn)是否至少有一個回歸系數(shù)(因?yàn)橛杏脕頇z驗(yàn)是否至少有一個回歸系數(shù)(因?yàn)橛卸鄠€回歸系數(shù))不為多個回歸系數(shù))不為0 0。而在簡單回歸(一元。而在簡單回歸(一元回歸)中只有一個回歸系數(shù)需要檢驗(yàn),而回歸回歸)中只有一個回歸系數(shù)需

36、要檢驗(yàn),而回歸系數(shù)就是回歸直線的斜率,所以檢驗(yàn)總體顯著系數(shù)就是回歸直線的斜率,所以檢驗(yàn)總體顯著性的性的F F檢驗(yàn)就等價于回歸系數(shù)的檢驗(yàn)。檢驗(yàn)就等價于回歸系數(shù)的檢驗(yàn)。 n對回歸系數(shù)的顯著性檢驗(yàn)就是檢驗(yàn)對回歸系數(shù)的顯著性檢驗(yàn)就是檢驗(yàn)x x與與y y之間是之間是否具有線性關(guān)系,或者說,檢驗(yàn)自變量否具有線性關(guān)系,或者說,檢驗(yàn)自變量x x對因?qū)σ蜃兞孔兞縴 y的影響是否顯著。的影響是否顯著。2.t2.t檢驗(yàn)法(回歸系數(shù)的顯著性檢驗(yàn))檢驗(yàn)法(回歸系數(shù)的顯著性檢驗(yàn))n檢驗(yàn)步驟如下:檢驗(yàn)步驟如下:n(1)提出假設(shè))提出假設(shè) n (沒有線性關(guān)系沒有線性關(guān)系) n (有線性關(guān)系有線性關(guān)系) n(2)計算檢驗(yàn)的)計

37、算檢驗(yàn)的t統(tǒng)計量統(tǒng)計量 自由度為自由度為n-2;n(3)確定顯著性水平)確定顯著性水平 ,并進(jìn)行決策,并進(jìn)行決策 n若若 拒絕拒絕H0 ;n若若 接受接受H0 。01:0Hb11:0Hb/2(2),ttn/2(2),ttn221r ntrn在在“投入與產(chǎn)出投入與產(chǎn)出”的例的例1中,相關(guān)系數(shù)中,相關(guān)系數(shù)r=0.759,顯著性水,顯著性水平平 0.05時,計算檢驗(yàn)的統(tǒng)計量:時,計算檢驗(yàn)的統(tǒng)計量: n查表得查表得 落入拒絕域中,即落入拒絕域中,即拒絕拒絕H0,接受,接受H1。所以自變量。所以自變量x與因變量與因變量y之間相關(guān)關(guān)系明之間相關(guān)關(guān)系明顯,投入量對產(chǎn)出量的影響顯著。顯,投入量對產(chǎn)出量的影響顯

38、著。 2220.759 1023.29711 0.759r ntr/2/22.306, 3.297tt3. 3. 相關(guān)系數(shù)檢驗(yàn)法(回歸系數(shù)的顯著性相關(guān)系數(shù)檢驗(yàn)法(回歸系數(shù)的顯著性檢驗(yàn))檢驗(yàn)) (1 1)計算相關(guān)系數(shù))計算相關(guān)系數(shù)r r。(2 2)根據(jù)回歸模型的自由度()根據(jù)回歸模型的自由度(n-2n-2)和顯著性水平)和顯著性水平a a的值,查表得出臨界值的值,查表得出臨界值 (3 3)判別:如果)判別:如果 ,則表明兩變量之間,則表明兩變量之間線性相關(guān)關(guān)系顯著。反之,如果線性相關(guān)關(guān)系顯著。反之,如果 ,則表明兩變量之間線性相關(guān)關(guān)系不顯著。則表明兩變量之間線性相關(guān)關(guān)系不顯著。(2)nr(2)n

39、rr(2)nrr六、回歸方程在估計和預(yù)測中的應(yīng)用六、回歸方程在估計和預(yù)測中的應(yīng)用 點(diǎn)估計點(diǎn)估計n利用估計的回歸方程,對于自變量利用估計的回歸方程,對于自變量x x(如例(如例1 1的第的第2 2個廠個廠家)的一個給定值家)的一個給定值x x0 0,求出因變量,求出因變量y y的估計值的估計值0 .yn預(yù)測區(qū)間估計預(yù)測區(qū)間估計n利用估計的回歸方程,對于自變量利用估計的回歸方程,對于自變量 x x 的一個給的一個給定值定值x x0 0,求出因變量,求出因變量y y的一個的估計區(qū)間,這一的一個的估計區(qū)間,這一區(qū)間稱為預(yù)測區(qū)間。區(qū)間稱為預(yù)測區(qū)間。ny y0 0在在1- 1- 置信水平下的預(yù)測區(qū)間為:置

40、信水平下的預(yù)測區(qū)間為:22221()(2)1()yxxy tnSxnxnn預(yù)測區(qū)間為:預(yù)測區(qū)間為:n所以他的產(chǎn)出的所以他的產(chǎn)出的95%的預(yù)測區(qū)間為的預(yù)測區(qū)間為24.478和和72.627之間。之間。018.9476+1.1842x =18.9476+1.1842 25=48.5526y 2222221()(2)1()1(2522)48.55262.306 9.9011(220)10560010=48.552624.0746yxxy tnSxnxnn回到前面的例子,投入為回到前面的例子,投入為2525時,平均產(chǎn)出的時,平均產(chǎn)出的95%95%的置信區(qū)間。的置信區(qū)間。n a(2)29.901,n=1

41、0,a=0.05,t=2.306nyS查表得,n當(dāng)實(shí)際觀測值較多時(當(dāng)實(shí)際觀測值較多時(n30n30),),n 近似等于近似等于1 1, 近似于正態(tài)分布,近似于正態(tài)分布, 上式可簡化為上式可簡化為2221()1()xxxnxn2(2)tn2.yyZSn例例3-13-1 設(shè)有設(shè)有1010個廠家的投入和產(chǎn)出如下,根據(jù)這些數(shù)據(jù),我個廠家的投入和產(chǎn)出如下,根據(jù)這些數(shù)據(jù),我們可以認(rèn)為投入和產(chǎn)出之間存在相關(guān)性嗎?們可以認(rèn)為投入和產(chǎn)出之間存在相關(guān)性嗎?(相關(guān)數(shù)據(jù))(相關(guān)數(shù)據(jù))廠家12345678910投入20402030101020202030產(chǎn)出30604060304040503070作業(yè)作業(yè)1 1:某省

42、某省1978198619781986年居民消費(fèi)品購買力和居民貨幣收入統(tǒng)計年居民消費(fèi)品購買力和居民貨幣收入統(tǒng)計如下表:如下表:1 1、建立一元線性回歸模型。建立一元線性回歸模型。2 2、對回歸模型進(jìn)行顯著性對回歸模型進(jìn)行顯著性檢驗(yàn)(檢驗(yàn)( =0.05=0.05)。)。3 3、若居民貨幣收入每年平均增長若居民貨幣收入每年平均增長19%19%,預(yù)測,預(yù)測19871987年居民消費(fèi)品購買力。年居民消費(fèi)品購買力。4 4、對對19871987年居民消費(fèi)品購買力作個別年居民消費(fèi)品購買力作個別值區(qū)間預(yù)測。值區(qū)間預(yù)測。要求用要求用ExcelExcel軟件計算,并給出計算結(jié)果及截圖。軟件計算,并給出計算結(jié)果及截圖

43、。年份年份居民消費(fèi)品居民消費(fèi)品購買力購買力x居民貨幣居民貨幣收入收入x年份年份居民消費(fèi)居民消費(fèi)品購買力品購買力x居民貨幣居民貨幣收入收入x19788.511.6198427.833.6197911.114.1198533.540.5198013.617.1198639.247.8198115.819.6198217.622.1198320.525.6(單位:億元)(單位:億元)n作業(yè)作業(yè)2:(例(例3-1 ) 設(shè)有設(shè)有10個廠家的投入和產(chǎn)出如個廠家的投入和產(chǎn)出如下,試建立回歸方程,當(dāng)投入為下,試建立回歸方程,當(dāng)投入為25時,求出平均時,求出平均產(chǎn)出產(chǎn)出95%的置信區(qū)間。要求用的置信區(qū)間。要求用

44、Excel軟件計算,并軟件計算,并給出計算結(jié)果的主要結(jié)果(截圖)。給出計算結(jié)果的主要結(jié)果(截圖)。廠家12345678910投入20402030101020202030產(chǎn)出30604060304040503070作業(yè)作業(yè)1 1:某省某省1978198619781986年居民消費(fèi)品購買力和居民貨幣收入統(tǒng)計年居民消費(fèi)品購買力和居民貨幣收入統(tǒng)計如下表:如下表:1 1、建立一元線性回歸模型。建立一元線性回歸模型。2 2、對回歸模型進(jìn)行顯著性對回歸模型進(jìn)行顯著性檢驗(yàn)(檢驗(yàn)( =0.05=0.05)。)。3 3、若居民貨幣收入每年平均增長若居民貨幣收入每年平均增長19%19%,預(yù)測,預(yù)測19871987年

45、居民消費(fèi)品購買力。年居民消費(fèi)品購買力。4 4、對對19871987年居民消費(fèi)品購買力作區(qū)間年居民消費(fèi)品購買力作區(qū)間預(yù)測。預(yù)測。年份年份居民消費(fèi)居民消費(fèi)品購買力品購買力x居民貨幣居民貨幣收入收入x年份年份居民消居民消費(fèi)品購費(fèi)品購買力買力x居民貨居民貨幣收入幣收入x19788.511.6198427.833.6197911.114.1198533.540.5198013.617.1198639.247.8198115.819.6198217.622.1198320.525.6(單位:億元)(單位:億元)n設(shè)一元線性回歸模型為:n計算回歸系數(shù)。 yabx22()iiiiiiiinx yxybnxxy

46、xabnn 年份年份居民消費(fèi)品居民消費(fèi)品購買力購買力x居民貨幣居民貨幣收入收入yx yx2y219788.511.698.672.25134.56197911.114.1156.51123.21198.81198013.617.1232.56184.96292.41198115.819.6309.68249.64384.16198217.622.1388.96309.76488.41198320.525.6524.8420.25655.36198427.833.6934.08772.841128.96198533.540.51356.75 1122.251640.25198639.247.81

47、873.76 1536.642284.84合計合計187.62325875.74791.87207.76(單位:億元)(單位:億元)n計算回歸系數(shù)。222()9 5875.7 187.6 2321.189 4791.8(187.6)iiiiiinx yxybnxx 232187.61.181.1999iiyxabnn所求回歸模型為:3.相關(guān)系數(shù)檢驗(yàn)法1.19 1.18yx1112222111122()()9 5875.7 187.6 2329 4791.8 187.69 7207.762320.9997nnniiiiiiinnnniiiiiiiinx yxyRnxxnyy 0.050.9997

48、(92)R線形關(guān)系顯著,檢驗(yàn)通過線形關(guān)系顯著,檢驗(yàn)通過nF 檢驗(yàn)。22()() /(2)iiiyyFyyn年份居民消費(fèi)品購買力x居民貨幣收入y預(yù)測值y(y-y均)2(y- y)219788.511.611.30 209.75 0.09 197911.114.114.39 129.70 0.08 198013.617.117.36 70.79 0.07 198115.819.619.98 33.59 0.15 198217.622.122.12 13.35 0.00 198320.525.625.58 0.04 0.00 198427.833.634.26 71.98 0.44 198533.5

49、40.541.05 233.09 0.30 198639.247.847.83 486.21 0.00 合計187.6232233.86 1248.51 1.13 nF 檢驗(yàn)。22()1248.517738.11() /(2)1.13/7iiiyyFyynn =9; = 0.05;查;查 F 值表得值表得 :F (1,n-2)= F0.05 (1,7)=5.59樣本的統(tǒng)計量樣本的統(tǒng)計量 F : F = 77738.11F F0.05(1,9),表明兩變量之間線性相關(guān)關(guān)系顯著,檢驗(yàn)通過。表明兩變量之間線性相關(guān)關(guān)系顯著,檢驗(yàn)通過。nt 檢驗(yàn)。21() (2),niibtxxt n其中211()2n

50、iiiyyn22111()1.130.1627niiiyyn21.18881.3821894.960.16t n =9; /2 = 0.025;查;查 t 值表得:值表得:t /2 (n-2)= t0.025 (7)=2.365樣本的統(tǒng)計量樣本的統(tǒng)計量 t : t = 218.95;| t | t0.025(7),拒絕假設(shè),拒絕假設(shè)H0:b=0,而接受而接受H1,即認(rèn)為,即認(rèn)為 b 顯著異于顯著異于 0,因變量,因變量 y 對自變量對自變量 x 的一元線性回歸成立。的一元線性回歸成立。n預(yù)測2222002()()11;()2iiyyiyyxxSSSnxxn0y在顯著性水平 下, 的預(yù)測區(qū)間為2

51、00 + (2)ytnS200 (- (2)y tnS,n =9; /2 = 0.025;查;查 t 值表得:值表得:t /2 (n-2)= t0.025 (7)=2.365n預(yù)測01.19 1.18 (39.2 (10.19)56.69y 2()0.160.402iiyyySn222002()11665.821(1)1.87()9881.38yixxSSnxx200(2)56.692.3651.8756.693.23ytnSmmm 當(dāng)當(dāng)居民貨幣收入每年平均增長19%,在顯著性水平=0.05時,1987年居民消費(fèi)品購買力的預(yù)測區(qū)間為53.4659.92億元2()2iiyyySnn30,t當(dāng)實(shí)際

52、觀測值較多時,一般分布近似趨于正態(tài)分布,則預(yù)測區(qū)間可簡單計算為:20 +)yyZ S20 (-yy Z S,2()0.160.402iiyyySn 第三節(jié)第三節(jié) 多元線性回歸預(yù)測法多元線性回歸預(yù)測法n 社會經(jīng)濟(jì)現(xiàn)象的變化往往受到多個因素的影響,因此,社會經(jīng)濟(jì)現(xiàn)象的變化往往受到多個因素的影響,因此,一般要進(jìn)行多元回歸分析,我們把包括兩個或兩個以上自一般要進(jìn)行多元回歸分析,我們把包括兩個或兩個以上自變量的回歸稱為變量的回歸稱為多元回歸多元回歸。 多元回歸與一元回歸類似,可以用最小二乘法估計模多元回歸與一元回歸類似,可以用最小二乘法估計模型參數(shù)。也需對模型及模型參數(shù)進(jìn)行統(tǒng)計檢驗(yàn)。型參數(shù)。也需對模型及

53、模型參數(shù)進(jìn)行統(tǒng)計檢驗(yàn)。 選擇合適的自變量是正確進(jìn)行多元回歸預(yù)測的前提之一,選擇合適的自變量是正確進(jìn)行多元回歸預(yù)測的前提之一,多元回歸模型自變量的選擇可以利用變量之間的相關(guān)矩陣多元回歸模型自變量的選擇可以利用變量之間的相關(guān)矩陣來解決來解決?;乇菊履夸?一、多元線性回歸模型一、多元線性回歸模型 n描述因變量描述因變量 y y 如何依賴于自變量如何依賴于自變量 和誤差項(xiàng)和誤差項(xiàng)e e 的方程稱為多元線性回歸模型。的方程稱為多元線性回歸模型。n涉及多個自變量的多元線性回歸模型可表示為:涉及多個自變量的多元線性回歸模型可表示為:n總體回歸參數(shù)總體回歸參數(shù) 是未知的,要利用樣本數(shù)據(jù)是未知的,要利用樣本數(shù)據(jù)

54、去估計。用樣本統(tǒng)計量去估計。用樣本統(tǒng)計量 代替回歸方程中的代替回歸方程中的未知參數(shù)未知參數(shù), ,即得到估計的回歸方程:即得到估計的回歸方程: 12,mx xx01 122mmyxxxbbbbe01,mbbb01,mb bb01 122mmybb xb xb xn二元線性回歸方程為:二元線性回歸方程為: 其中,其中, 分別是分別是 的偏回歸系數(shù)。的偏回歸系數(shù)。 n同理三元線性回歸方程為同理三元線性回歸方程為 :n由樣本數(shù)據(jù)推算、估計回歸方程中各個回歸系數(shù),由樣本數(shù)據(jù)推算、估計回歸方程中各個回歸系數(shù),是多元回歸分析中的一個重要方面,下面簡要介是多元回歸分析中的一個重要方面,下面簡要介紹回歸系數(shù)的計

55、算方法紹回歸系數(shù)的計算方法。01 122 ybb xb x12,b b12,x x01 12 23 3 y bbxbxbxn二元線性回歸方程中回歸系數(shù)二元線性回歸方程中回歸系數(shù) 可由以下方程組解出:可由以下方程組解出:n用手解這些方程枯燥而費(fèi)時,一般來說,自變量超過用手解這些方程枯燥而費(fèi)時,一般來說,自變量超過3 3個個時,要用矩陣運(yùn)算,可以借助計算機(jī)軟件解出參數(shù)。時,要用矩陣運(yùn)算,可以借助計算機(jī)軟件解出參數(shù)。n下面給出一個三元線性回歸模型的例子。下面給出一個三元線性回歸模型的例子。 012, ,b b b01122221011122220211222ynbbxbxx ybxbxbxx ybx

56、bx xbxn例例3 3-4 -4: 有有2020戶家庭,戶家庭,冬天的取暖費(fèi)用與冬天的取暖費(fèi)用與3 3個因素有關(guān):日間個因素有關(guān):日間戶外的平均溫度,戶外的平均溫度,閣樓絕緣層的厚度,閣樓絕緣層的厚度,以及爐子的使用年以及爐子的使用年數(shù)。有關(guān)信息列出數(shù)。有關(guān)信息列出在右表中:在右表中: n試作出三元回歸方程并討論:哪些自變量試作出三元回歸方程并討論:哪些自變量與因變量正相關(guān)?哪些是負(fù)相關(guān)?如果某與因變量正相關(guān)?哪些是負(fù)相關(guān)?如果某一家庭的平均戶外溫度是一家庭的平均戶外溫度是3030度,閣樓絕緣度,閣樓絕緣層的厚度為層的厚度為5 5英寸,爐子已使用過英寸,爐子已使用過1010年,它年,它的冬天

57、取暖費(fèi)用為多少?的冬天取暖費(fèi)用為多少?(相關(guān)數(shù)據(jù))(相關(guān)數(shù)據(jù))n解:設(shè)三元線性回歸方程為解:設(shè)三元線性回歸方程為 n由軟件可得到這題的線性回歸方程為:由軟件可得到這題的線性回歸方程為: n將將x x1 13030, x x2 25 5, x x3 31010代入方程,得代入方程,得n由這個線性回歸方程可以算出每個家庭的預(yù)測取暖費(fèi)值。由這個線性回歸方程可以算出每個家庭的預(yù)測取暖費(fèi)值。殘差(殘差( )及其平方也列在下表中:)及其平方也列在下表中:01 12233 ybb xb xb x123294.853.078.2112.36yxxx276.60y yy20戶家庭預(yù)測取暖費(fèi)值計算表戶家庭預(yù)測取暖

58、費(fèi)值計算表 二、對多元回歸模型的評估二、對多元回歸模型的評估n如果檢驗(yàn)水平合適而且數(shù)據(jù)足夠多,用多元回如果檢驗(yàn)水平合適而且數(shù)據(jù)足夠多,用多元回歸模型幾乎可以處理所有數(shù)據(jù)組。模型一旦建歸模型幾乎可以處理所有數(shù)據(jù)組。模型一旦建立,一件很重要的事就是檢驗(yàn)?zāi)P团c數(shù)據(jù)是否立,一件很重要的事就是檢驗(yàn)?zāi)P团c數(shù)據(jù)是否很好擬合以及與回歸分析的假設(shè)前提是否相符。很好擬合以及與回歸分析的假設(shè)前提是否相符。n檢驗(yàn)回歸模型是否恰當(dāng)?shù)姆椒ㄓ泻芏?,如:檢檢驗(yàn)回歸模型是否恰當(dāng)?shù)姆椒ㄓ泻芏?,如:檢驗(yàn)?zāi)P驼w的顯著性、檢驗(yàn)回歸系數(shù)的顯著性、驗(yàn)?zāi)P驼w的顯著性、檢驗(yàn)回歸系數(shù)的顯著性、計算殘差、檢驗(yàn)樣本決定系數(shù)等。計算殘差、檢驗(yàn)樣本

59、決定系數(shù)等。 n 1. F檢驗(yàn)法(總體顯著性檢驗(yàn))檢驗(yàn)法(總體顯著性檢驗(yàn)) 對多元回歸方程的整體性檢驗(yàn),就是要看自變量對多元回歸方程的整體性檢驗(yàn),就是要看自變量 是否從整體上對隨機(jī)變量有明顯的影是否從整體上對隨機(jī)變量有明顯的影響。為此,要用到響。為此,要用到F F統(tǒng)計量。統(tǒng)計量。n檢驗(yàn)方法是將回歸離差平方和檢驗(yàn)方法是將回歸離差平方和( (SSR SSR ) )同殘差平方同殘差平方和和( ( SSE SSE ) )加以比較,應(yīng)用加以比較,應(yīng)用 F F 檢驗(yàn)來分析二者之間檢驗(yàn)來分析二者之間的差別是否顯著。如果是顯著的,因變量與自變的差別是否顯著。如果是顯著的,因變量與自變量之間存在線性關(guān)系;如果不

60、顯著,則因變量與量之間存在線性關(guān)系;如果不顯著,則因變量與自變量之間不存在線性關(guān)系。自變量之間不存在線性關(guān)系。 12,mx xxn 多元回歸模型的整體性檢驗(yàn)的步驟如下:多元回歸模型的整體性檢驗(yàn)的步驟如下:n(1 1)提出假設(shè))提出假設(shè)n H H0 0: :n H H1 1: : 至少有一個回歸系數(shù)不等于至少有一個回歸系數(shù)不等于0 0 。n(2 2)計算檢驗(yàn)統(tǒng)計量)計算檢驗(yàn)統(tǒng)計量 F Fn回歸平方和回歸平方和 ;殘差平方和;殘差平方和n(3 3)確定顯著性水平和分子自由度)確定顯著性水平和分子自由度m m、分母自由、分母自由度度n-m-1n-m-1找出臨界值找出臨界值Fa Fa ;n(4 4)作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論