




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第二章簡單線性回歸模型計量經(jīng)濟學本章主要討論: 回歸分析與回歸函數(shù) 簡單線性回歸模型參數(shù)的估計 擬合優(yōu)度的度量 回歸系數(shù)的區(qū)間估計和假設檢驗 回歸模型預測第一節(jié) 回歸分析與回歸函數(shù)一、相關分析與回歸分析(一)經(jīng)濟變量之間的相互關系 相關關系 1、總體相關 變量之間具有本質上的聯(lián)系 2、樣本相關 變量的樣本觀察值之間相關在概率統(tǒng)計中,我們將隨機變量之間的關系總結為: 相互獨立(沒有任何聯(lián)系) 不獨立線性相關非線性相關正相關負相關相互獨立:比如,張三的身體健康水平與李四的學習成績之間,沒有任何聯(lián)系。不獨立(有聯(lián)系):張三的身體健康水平與他自己的學習成績之間,有聯(lián)系。線性相關:比如,收入與消費、投資
2、與GDP、收入水平與汽車銷售量等等。美國的收入與消費的散點圖:非線性相關:非線性相關:非線性相關的模擬數(shù)據(jù):正相關:兩個量變化的方向相同負相關:兩個量變化的方向相反(二)簡單線性相關關系的度量 1、簡單線性相關系數(shù) (簡稱為相關系數(shù)) 總體相關系數(shù):式中,Cov(X,Y),表示X與Y的協(xié)方差,Var(X)、Var(Y)表示X、Y的方差 樣本相關系數(shù):式中,Xi、Yi分別表示X與Y的樣本數(shù)據(jù), 分別表示X、Y的均值。 在Eviews中計算相關系數(shù)的命令為:COR X,Y 2、相關系數(shù)的性質 1)-1r1 2)r的絕對值越近于1,說明線性相關程度越高,越近于0,說明線性相關程度越低。 3)r=1,
3、稱為完全正相關。 4)r=-1,稱為完全負相關。 5)接近于1,比如0.98,稱為高度正相關。 6)接近于-1,比如-0.95,稱為高度負相關。完全正相關:比如,在價格P不變時,銷售收入Y與銷售量X之間。完全負相關:高度正相關:高度負相關: (三)回歸分析 “回歸(Regression)”一詞最早出現(xiàn)在生物學的遺傳現(xiàn)象研究中,用來指子輩身高相對于父輩身高趨向其平均水平的傾向?,F(xiàn)在這一術語廣泛地用來指隨機因果關系中變量之間的統(tǒng)計規(guī)律?;貧w分析方法是計量經(jīng)濟學的基礎。 經(jīng)濟變量之間的因果關系有兩種:確定性的因果關系與隨機的因果關系。前者可以表示為數(shù)學中的函數(shù)關系,后者不能像函數(shù)關系那樣比較精確地描
4、述其變化規(guī)律,但是可以通過分析大量的統(tǒng)計數(shù)據(jù),找尋出它們之間的一定的數(shù)量變化規(guī)律,這種通過大量統(tǒng)計數(shù)據(jù)歸納出的數(shù)量變化規(guī)律稱之為統(tǒng)計相關關系,進而稱為回歸關系。研究回歸關系的方法稱為回歸分析方法,表示回歸關系的數(shù)學式子稱為回歸方程。 比如,在市場經(jīng)濟條件下,當商品的價格變化時,雖然商品的銷售量受其價格變化的影響,但銷售量并不能由價格惟一確定,它還受到人們的消費習慣、收入水平以及可替代品價格等因素 的影響。 像這種銷售量與其價格之間的關系,我們稱之為非確定性的因果關系,這時盡管我們不能像函數(shù)關系那樣比較精確地描述其變化規(guī)律,但是,可以通過分析有關銷售量與其價格的統(tǒng)計數(shù)據(jù), 找尋出它們之 間的一定
5、的 數(shù)量變化 規(guī)律。 二、總體回歸模型 假設 X 為一個經(jīng)濟變量,Y 為另一個經(jīng)濟變量,且變量 X 與 Y 之間存在著非確定性的因果關系,即當 X 變化時會引起 Y 的變化,但這種變化是隨機的。例如,某種飲料的銷售量與氣溫的關系,銷售量受氣溫的影響而變化,但其變化又不能由氣溫惟一確定;再比如,家庭的周消費額與周收入之間的關系等等。 由于變量Y的非確定性是由于它受一些隨機因素的影響,因此可以認為,當給定變量 X 的一個確定值之時,所對應的變量 Y 是一個隨機變量,記作Y|X 。假定條件隨機變量 Y|X 的數(shù)學期望值是存在的,即 E( Y|X ) 存在,由于同一隨機變量的數(shù)學期望值是惟一的,故 E
6、(Y|X ) 能夠由 X 的值惟一地確定,于是 E(Y|X )是變量X 的函數(shù), 令 (2.1) 我們稱(2.1)式為變量 Y 關于變量 X 的總體回歸方程(Population Regression Equation)或稱總體回歸函數(shù)(Population Regression Function),回歸函數(shù)的圖像稱為回歸曲線。這里,(X) 是X 的一元函數(shù),它可以是任何一種形式,其中最簡單的形式就是線性函數(shù),當為線性函數(shù)之時, 令 這時 (2.1) 式變?yōu)?(2.2) 現(xiàn)在的總體回歸方程為線性方程,我們稱 (2.2) 式為變量Y 關于變量 X 的總體線性回歸方程,由于只有一個解釋變量,故稱為
7、總體一元線性回歸方程。此時,回歸曲線變成了直線,我們稱它為總體回歸直線 令 U = Y E(Y|X) (2.3) 即U為變量 Y中不能由變量X的線性關系表示的部分,由于對應 X 的每一個給定值 X=X0 ,所對應的 Y 為一個隨機變量,因此 ,可以將 Y 看成一簇隨機變量(即一系列隨機變量組成的集合),從而U 也為一簇隨機變量。將 (2.2) 、(2.3) 結合可得: 我們稱(2.4)為變量Y 關于變量 X 的總體一元線性回歸模型。式中,X 稱為解釋變量,Y 稱為被解釋變量, 稱為總體回歸參數(shù),U 稱為隨機擾動項,或稱隨機項,或稱擾動項,或稱誤差項。 三、擾動項的本質含義 在上述總體一元線性回
8、歸模型中,將被解釋變量Y與回歸函數(shù)部分 之差定義作擾動項,即將被解釋變量Y分為兩部分,一部分是可以由X的線性函數(shù)解釋的部分,即 ,另一部分是不能由 X 的線性函數(shù)解釋的部分,即擾動項U ,擾動項U具體包含以下四部分內(nèi)容: 1. 被忽略的有關因素 在一元線性回歸模型中,我們討論由于解釋變量 X 的變化而引起被解釋變量 Y 的變化,但事實上,影響經(jīng)濟變量 Y 的不止一個因素 X ,比如說還有其他 m 個因素對 Y 有影響,而當變量 X 是影響變量 Y 的主要一個因素時,且我們又著重考慮 X 對 Y 的影響之時,就忽略了其他有關 的m 個變量,只考慮X 對 Y 的影響,這時,其他m 個被省略的有關變
9、量對 Y 的影響仍然是存在的,其影響即并入擾動項 U 中。 2. 回歸函數(shù)的設定誤差 在實際應用中,為了避免計算的復雜性,或者由于技術處理上的局限性,我們在選取總體回歸函數(shù)時,往往是取其近似形式。這時,所選用的回歸函數(shù)與本質上存在的回歸函數(shù)之間有一定的誤差。再則,如前所述,大多數(shù)情況下,總體回歸函數(shù)的形式是未知的,我們只能根據(jù)樣本觀察點的分布情況來近似地設定總體回歸函數(shù),這種設定自然會產(chǎn)生一定的誤差,上述誤差也包括在擾動項之中。 3. 變量的測量誤差 變量的測量誤差包含兩方面的內(nèi)容,一方面,在觀察或測量變量數(shù)據(jù)的過程中,總要產(chǎn)生某些主觀或客觀上的誤差,使有關變量的觀察值并不精確地等于其實際值;
10、另一方面,有些經(jīng)濟變量是一種綜合性變量,其統(tǒng)計數(shù)據(jù)通過若干個變量的統(tǒng)計數(shù)據(jù)歸并而得,歸并過程中的各種誤差也是一種測量誤差。 例如,統(tǒng)計資料中,同一經(jīng)濟指標,常常由于計算口徑不一致而造成數(shù)據(jù)的不一致,其中大部分是由于指標的分類與歸并方法不同 而造成的。 4. 隨機誤差 經(jīng)濟過程的運行不可能像自然科學那樣在可控實驗室中進行,這就不可避免地會涉及到一些不可控制的因素的影響,如氣候變量等自然因素的影響、消費偏好等人文因素的影響等等。即使沒有以上13項誤差,在相同的條件下運行同一經(jīng)濟過程,所得結果往往也不一樣。這種差異就是隨機誤差,它是由于一些隨機或偶然的因素而造成的。四、樣本回歸模型 在經(jīng)濟現(xiàn)象的研究
11、中,經(jīng)濟變量的總體分布大多數(shù)是未知的,比如,消費支出的精確分布我們無從所知。因此總體線性回歸方程中的參數(shù)具體等于多少也是未知的,總體參數(shù)只是理論上存在的。我們只能根據(jù)樣本觀察值進行統(tǒng)計推斷,以此來估計總體回歸方程和總體回歸參數(shù)。 假設取得X與Y的n個樣本觀察點(X1,Y1),(X2,Y2),.,(Xn ,Yn),設法用這n個點擬合一直線,使之近似地代替總體回歸直線,令 該直線方程為 我們稱(2.8)式為變量 Y 關于變量X 的樣本回歸方程(Sample Regression Equation)或稱樣本回歸函數(shù)(Sample Regression Function ),稱該直線為樣本回歸直線,
12、稱為樣本回歸參數(shù)。 令 (2.9) 稱 為Yi 的擬合值。則 是樣本回歸直線上的點。 設 (2.10) 則 (2.11) 我們稱(2.11)式為變量Y 關于變量 X 的樣本一元線性回歸模型。e i 稱為殘差項(RESIDAL)。 例2.1 家庭消費模型 假定某地區(qū)共有100個家庭,我們來研究家庭月消費支出Y與可支配收入X之間的聯(lián)系,X與Y之間的關系如何?我們收集樣本數(shù)據(jù)(如表2.1),收入水平X的取值分別為1000、1500、2000、2500、3000、3500、4000、4500、5000、5500,同一收入水平的下的家庭個數(shù)不等,比如收入為1000的家庭有4個,而收入為3000的家庭有1
13、4個。 第一步:輸入數(shù)據(jù) 在Eviews中建立一個Cross Section的Workfile: 1、用命令:Create U 1 100 2、用Menu:File/New/Workfile/Undated or irregular 再輸入: Start observation End observation 點擊OK即可。1 100 這時進入Workfile 界面。 第二步:輸入、保存數(shù)據(jù) 1、用命令:Data X Y 2、保存數(shù)據(jù): File/Save File/Save as 注意:1、Eviews 數(shù)據(jù)在舊版本下不能保存在中文路徑,只能存在英文路徑下。 2、保存數(shù)據(jù)時要在工作文件為活動
14、狀態(tài)下,否則會出錯。 第三步:作散點圖 1、用命令:Scat X Y 2、用Menu: Quick/Graph/Scatter 輸入:X Y 家庭消費關于收入的散點圖: 散點圖:加入趨勢線 總體回歸線 第一個樣本的散點圖: 第一個樣本的散點圖:樣本回歸線 第二個樣本的散點圖: 第二個樣本的散點圖: 樣本回歸線第二節(jié) 一元線性回歸模型的參數(shù)估計一、擬合一條直線的準則 前面談到的總體線性回歸方程只是理論上存在的,一般是未知的,我們只能用樣本觀察點來擬合一條直線,即樣本回歸直線,以此來推斷被解釋變量相對于解釋變量的變化特征。然而,給定一組觀察點之后,在坐標平面上可以作出不止一條與這些點有關有直線,選
15、取哪一條直線作為樣本回歸直線為佳呢?首先我們需要給出擬合一條直線的準則。 下面我們逐漸來探討這個問題。設用這 n 個點 (X1,Y1),(X2,Y2),(Xn,Yn) 擬合而得的直線方程為 稱 為 Yi 的擬合值,稱 ei 為 Yi 點的擬合誤差。 圖 2-2 擬合誤差的直觀圖 由圖2-2可以看出,當觀察點(Xi,Yi)落在擬合直線上方時,擬合誤差為正值,當觀察點(Xi,Yi)落在擬合直線之上時,擬合誤差為 0 。當觀察點(Xi,Yi)落在擬合直線下方時,擬合誤差為負值。顯然擬合的優(yōu)劣與擬合誤差有關,我們分三種情況來討論如何確定擬合直線的標準。 1假設以擬合誤差之和為最小作為擬合直線的標準,
16、即要求 為最小。這時,當擬合誤差中有符號相反時,和式中就會正負抵消,即使擬合直線離散布點大多數(shù)都很遠,也可能此和式很小。 2. 為了克服上述準則中由于誤差符號相反所帶來的缺點,我們改造一下上述準則,以誤差絕對值之和為最小作為擬合的準則,即以 為最小。這時,雖然可排除大的正負誤差相抵,但可能會照顧了一些點而忽略了個別點。 圖 2-4 (a) 圖 2-4 (b) 3. 第二種消除正負相抵的方法是以擬合誤差平方和為最小作為擬合準則,即以 為最小。采用這一準則,一方面消除了誤差正負相抵,另一方面避免了像2那樣有個別點是大誤差絕對值的情況。依照這一標準,圖2-4中的(a)優(yōu)于(b)的擬合。 進一步的研究
17、表明,這一標準是一條可取的準則,直觀上看,它從總體上考慮到了所有的散布點,使樣本信息得到了充分利用。因而,我們采用擬合誤差平方和最小作為擬合一條直線的準則。這一準則稱為“最小二乘”或“最小平方”準則。 二、最小二乘法 用最小二乘準則即擬合誤差的平方和為最小來求解樣本回歸參數(shù)的方法稱為普通最小二乘法(Ordinary Least Square)簡稱 OLS 。 這是計量經(jīng)濟學中常用的參數(shù)估計方法。 用最小二乘準則求解樣本回歸參數(shù)可以分為以下幾步: 1、構造擬合誤差平方和 令即Q為擬合誤差的平方和。 2、導出正規(guī)方程 由于Q是回歸參數(shù)的二次連續(xù)可導函數(shù),由極值原理可知:使Q達到最小的 必定滿足方程
18、組: 而 整理得: 稱之為正規(guī)方程。 3、求解正規(guī)方程 用線性代數(shù)中的克萊姆(Cramm)法則求解正規(guī)方程得: 整理得: 其中: 分別表示 Xi 與Yi 的平均值, 分別表示Xi 與Yi 的離差。 將 代入第一個方程即得 的解,于是: 稱該解為模型中參數(shù)的最小二乘估計量(OLS)。 三、一元線性回歸模型的基本假設 現(xiàn)在的問題是用OLS方法估計出來的樣本回歸直線方程是否可靠,是否一定可以用來推斷總體的特性,也就是說是否一定可以用它來代表X與Y的總體回歸關系?當然不一定,這有賴于經(jīng)濟變量的總體特征,因此,為了使所估計出來的樣本回歸直線能夠說明總體的特征,我們需要對變量的總體分布作一些假設: 對于一
19、元線性回歸模型: 我們假設:(在此Yi 應理解為 X i 所對應的隨機變量Y, 即 (Y|X= Xi),不僅僅是某一個樣本觀察值。)解釋變量是非隨機的,且 假設1:零均值 E(u i) = 0 i=1,2,.,n 稱為擾動項具有零均值,也稱零均值假設。 假設2 :同方差 Var(u i) = i=1,2,.,n 即所有的擾動項具有相同的方差,該假設稱為擾動項具有同方差,或稱同方差性,該假設不滿足時稱為異方差性,或異方差模型。 假設3 序列無關或無自相關 Cov(u i,u j) = 0 ij , i , j=1,2, ,n 即擾動項序列不相關。該項假設稱為擾動項序列無關,或稱無自相關假設。否則
20、,模型稱為序列相關或自相關。 假設4 擾動項 u i 與解釋變量X i從不相關 Cov(u i,Xi) = 0 i=1,2, ,n 即擾動項序列u i 與解釋變量X i之間沒有線性關系。假設5 擾動項 ui 服從正態(tài)分布 即 ui N (, ) 此外我們還假設解釋變量X為 非隨機變量的。在這一假設下,第4條假設自然成立。 我們將解釋變量X為非隨機變量的假設以及假設 1、2、3、5合稱為一元線性回歸模型的經(jīng)典假設,或稱基本假設,或古典假設,滿足經(jīng)典假設的一元線性回歸模型稱為經(jīng)典一元線性回歸模型。 關于解釋變量的非隨機性,這一條要求比較高,一般不能滿足,因為經(jīng)濟現(xiàn)象中大多數(shù)變量是隨機的,具體應用中
21、,我們首先對解釋變量進行抽樣,這樣一般是可以達到的,對于抽定的樣本隨機性問題就暫時可以不考慮了,然后研究對解釋變量給定的樣本被解釋變量隨解釋變量變化的規(guī)律等等,由于抽樣的隨機性,這樣做理論上講有一定的局限性,但是一定程度上還是可以反映變量之間的變化規(guī)律。 關于零均值假設,由模型式: 在解釋變量非隨機的前提下,對上式兩邊取數(shù)學期望,得: 即零均值等價于: 也即變量Y與X之間的回歸方程是線性的,即模型是線性模型。假設2的要求是對于不同的X的值Xi,Y的離散程度是一樣的。 線性: 非線性: 方差不同時的圖示: 方差:離散程度測度 有人對歷史上有生死日期的209位皇帝的壽命做了調(diào)查,發(fā)現(xiàn)平均壽命為39
22、歲,其中乾隆皇帝壽命最長88歲。為什么會是這樣呢? 比如有一組三個學生的成績分別是60、65、70分;另一組三個學生的成績分別是30、75、90,這兩組學生的均分都是65分,那么這兩組成績有區(qū)別嗎? 顯然是有的,直觀上看,后一組兩極分化。那么如何體現(xiàn)這一區(qū)別呢?這就是數(shù)據(jù)的離散程度。極差(全距) 最大值-最小值 極差大的離散程度大,極差小的離散程度小。方差(Variance) 變量與其平均數(shù)差(離差)的平方的均值: 以上兩組數(shù)據(jù)的方差分別為:16.67與650,顯然,方差小的離散程度小。 方差大的離散程度大,方差小的離散程度小。標準差(Standard Deviation)方差的平方根,與方差
23、的用法類似。 91哪家供貨商更好? 四、最小二乘估計量的性質 高斯馬爾可夫定理 對于滿足經(jīng)典假設的一元線性回歸模型,在所有的線性、無偏估計量中,OLS估計量具有方差最小的性質。 高斯馬爾可夫定理說明,對于經(jīng)典的一元線性回歸模型,OLS估計量是總體回歸參數(shù)的線性、無偏以及方差最小的估計量(方差最小性也稱有效性)。 前面談到,之所以對模型作以上假設,是為了規(guī)范方法的研究。對于經(jīng)典的一元線性回歸模型,由上可知OLS估計量是由解釋變量及被解釋變量的樣本觀察值計算而得,而被解釋變量具有隨機性,于是OLS估計量 也具有隨機性,且有以下性質: 1線性性 線性性指 為Yi 的線性函數(shù)。 2. 無偏性 無偏性指
24、 為 的無偏估計量,就是說,OLS估計量的數(shù)學期望即均值正好是所要估計的參數(shù)本身。 也即 無偏性是衡量一個估計量的可信度的一個非常重要的指標。 無偏性與有偏性: 無偏有偏 比如: 取數(shù)學期望得: 即 是 的無偏估計量。同理可證得 是 的無偏估計量。 3. 方差最小性(也稱有效性) 方差最小性也稱為有效性,它指在所有的總體參數(shù)的線性、無偏估計量中,普通最小二乘估計量具有方差最小的性質。 無偏性體現(xiàn)的是估計量的均值水平與總體參數(shù)之間的關系,而有效性體現(xiàn)的是估計量相對于其均值的離散程度,隨機變量的方差越大其離散程度就越大,方差越小離散程度就越小。 方差最小性: 方差較小方差較大第三節(jié) 回歸參數(shù)的顯著
25、性檢驗及置信區(qū)間 前面談到,對所估計出的模型要進行統(tǒng)計檢驗,第一個統(tǒng)計檢驗即參數(shù)的顯著性檢驗,也稱 t- 顯著性檢驗,在作t-檢驗之前,我們首先需知道參數(shù)估計量所服從的分布。 在經(jīng)典假設條件下,OLS估計量也服從正態(tài)分布。由上可知, 于是: 但是,由于總體的方差 未知,我們只能用其估計量 來代替之,可以證明, 為 的無偏估計量。令 則 為 的標準差的估計量。 于是 為服從自由度為 n-2 的 t 分布,即 一般地,由于t-分布的極限分布為正態(tài)分布,因此,當樣本容量 n30 即大樣本時,我們作 Z-顯著性檢驗,當樣本容量 n30 時,作t-顯著性檢驗, Z-顯著性檢驗的步驟與 t-顯著性檢驗的步
26、驟完全相同,只是所查的臨界值表不同,前者查得是正態(tài)分布的臨界值表,后者查得是t-分布的臨界值表。 t-顯著性檢驗可以檢驗總體回歸參數(shù)為任意值的顯著性,但計量經(jīng)濟模型中的t-檢驗一般只檢驗為零的顯著性,因為為零的顯著性等價于解釋變量對被解釋變量的線性影響的有效性。t-顯著性檢驗的步驟如下: 對 作顯著性檢驗: (1) 提出原假設 H0 : ; 作對立假設 H1 : ; (2) 在假設 H0 成立的條件下計算 t -統(tǒng)計量: (3) 給定顯著水平 = 0.05 ,查自由度為 v = n-2 的 t - 分布表,得到臨界值 , (4) 比較 與 : 若 ,則接受假設 H0: , 說明回歸參數(shù) 在統(tǒng)計
27、上是不顯著的,即解釋變量 X 對被解釋變量Y 沒有顯著的線性影響,也即X與Y的均值之間不存在線性關系。換言之,線性回歸模型無意義。 若 ,則拒絕假設 H0, 接受假設 H1: ,說明回歸參數(shù) 在統(tǒng)計上是顯著的,即解釋變量 X 對被解釋變量Y 有顯著的線性影響,也即X與Y的均值之間存在線性關系。換言之,線性回歸模型有意義。 下面給出OLS估計量的置信區(qū)間(區(qū)間估計): 由上可知, 服從 t 分布,由臨界值 的定義可以導出 的置信區(qū)間,給定顯著水平,由臨界值的定義可知: 上式等價于: 即 以 95% 的可能性落在下面區(qū)間上: 稱該區(qū)間為 的置信區(qū)間,或稱區(qū)間估計,置信度為95%,同理可得 置信度為
28、 95% 的 的置信區(qū)間為: 很顯然,置信區(qū)間越小越好,置信區(qū)間越小可信度越高,而置信區(qū)間的半徑中變化不大,因此估計量的可信度主要取決于其標準差的估計量,標準差越小,可信度越高,標準差越大,可信度就越低。這與 t - 檢驗的顯著性是等價的,從T 統(tǒng)計量的計算可知,標準差越小,則T 統(tǒng)計量的絕對值越大,即T值通過臨界值的可能性也大,從而 t - 檢驗顯著的可能性也大。此外從標準差的計算公式可知, 標準差的大小主要取決于總體方差的大小以及解釋變量的離差平方和,它與總體方差成正比,與解釋變量的離差平方和成反比,也就是說,當被解釋變量的離散程度較大(即總體方差較大)以及解釋變量的取值過于集中(即解釋變
29、量的離差平方和較小)時,線性回歸模型的可信度會大大降低,不利于作線性回歸分析。 第四節(jié) 擬合優(yōu)度的度量 用在作普通最小二乘估計之時,我們談到,對于給定的樣本觀察值,用樣本回歸直線來擬合這些觀察值,那么擬合的程度如何呢?是不是任何兩個經(jīng)濟變量的一組樣本觀察值的擬合直線都可作為此二變量的線性關系的精確描述呢?問題在于擬合程度的優(yōu)劣表述,我們稱之為擬合優(yōu)度檢驗,為此,定義可決系數(shù)。在定義可決系數(shù)之前,我們先介紹幾個有關的結論。 一、總變差的分解 首先定義幾個符號: 令 稱為樣本總變差; 稱為回歸總變差; 即殘差平方和。 可以證明: TSS = ESS + RSS 于是樣本總變差可以分解為回 歸總變差
30、與殘差平方和之和。 二、可決系數(shù) 對于給定的樣本觀察值,TSS 不變,前面談到,擬合的好即殘差平方和較小,由于此三項均為平方和,都大于0,于是擬合的好就等價于RSS 較接近于TSS ,換言之,回歸總變差越接近于樣本總離差,擬合的就越好。 令 稱 R2為變量Y與變量X的樣本s可決系數(shù),或稱樣本決定系數(shù)、樣本判定系數(shù)等。之所以稱為樣本可決系數(shù),是因為它由 X 與 Y 的樣本觀察值 (X i,Yi) 決定。 前面談到擬合的好壞取決于RSS 較接近于TSS的程度,由R2的定義可知,等價于R2 接近于1的程度,于是我們用R2 接近于1的程度來衡量樣本回歸直線對樣本觀察值的擬合的優(yōu)度,即擬合優(yōu)度檢驗。R2
31、 越接近于1,說明擬合的越好,R2越接近于0,說明擬合的越差。 三、可決系數(shù)與相關系數(shù)的關系 變量Y關于變量X的樣本可決系數(shù)正好等于Y與X的相關系數(shù)的平方。 而于是 又 四、樣本決定系數(shù)的本質意義 樣本可決系數(shù)是由樣本觀察值(Xi,Yi)所決定的,我們進一步要想它由樣本觀察值的哪些方面的性質決定呢?研究表明實質上R2由X與Y的樣本觀察值(Xi,Yi)的線性相關程度來決定,當樣本散布點過于離散時,即樣本總離差 TSS 較大時,不可能作一條直線很好地擬合這些散布點,自然所得回歸直線的殘差平方和就較大,同時R2就相對離1較遠。 圖 2-5 (a) 圖 2-5 (b) 第五節(jié) 一元線性回歸模型的預測 計量經(jīng)濟模型的預測分為條件預測與無條件預測兩類,當給定解釋變量X的樣本區(qū)間之外的值,來計算被解釋變量Y的相應值時,稱為條件預測;當解釋變量X的值也未知,且要預測被解釋變量的相應值時,稱為無條件預測。 本節(jié)介紹的是條件預測,無條件預測要先采用其它方法計算出解釋變量X的值,比較復雜,比如說借助于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年花藝師考試的活動執(zhí)行力試題及答案
- 纖維素纖維復合材料的設計與制造考核試卷
- 殘疾人康復醫(yī)學基礎知識考核試卷
- 糕點店市場營銷策略與實踐考核試卷
- 小型河道攔水堰施工方案
- 筆的制造業(yè)市場趨勢預測與規(guī)劃考核試卷
- 2025年證券從業(yè)資格證考試多種解法試題及答案
- 箱包企業(yè)社會責任實踐與報告考核試卷
- 注冊會計師考試案例分析技巧與策略試題及答案
- 項目計劃的制定與調(diào)整考題及答案
- 2025年上半年池州市園林局招考專業(yè)技術人員易考易錯模擬試題(共500題)試卷后附參考答案
- 質量信譽考核自評報告3篇
- 2025年度毛絨玩具產(chǎn)業(yè)發(fā)展報告
- 2025年初級社會工作者綜合能力理論考試試題(300題)附答案
- 危險作業(yè)安全管理培訓課件
- 2025-2030中國嬰兒車行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 特種設備事故壓力容器應急預案演練記錄
- 畢業(yè)設計(論文)-可調(diào)節(jié)辦公椅分析與設計
- 工業(yè)廢氣治理工(技師)職業(yè)技能鑒定理論試題及答案
- 騰訊游戲引擎技術向工業(yè)數(shù)字孿生的遷移
- 肩關節(jié)鏡相關知識
評論
0/150
提交評論