




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1引子引子: :中國(guó)出境旅游人數(shù)中國(guó)出境旅游人數(shù)20202020年將達(dá)一億人次年將達(dá)一億人次? ?中新社北京中新社北京4 4月月3 3日電日電 : :從中國(guó)出境旅游交易會(huì)上獲悉,中國(guó)從中國(guó)出境旅游交易會(huì)上獲悉,中國(guó)每年出境游人次以每年出境游人次以25%25%的速度持續(xù)增長(zhǎng),預(yù)計(jì)到的速度持續(xù)增長(zhǎng),預(yù)計(jì)到20202020年將達(dá)年將達(dá)一億人次。如今中國(guó)是世界上旅游消費(fèi)第二高的國(guó)家,在出一億人次。如今中國(guó)是世界上旅游消費(fèi)第二高的國(guó)家,在出國(guó)旅游的人群中,中國(guó)人平均每人每天的消費(fèi)達(dá)國(guó)旅游的人群中,中國(guó)人平均每人每天的消費(fèi)達(dá)175175美元。美元。另?yè)?jù)報(bào)道另?yè)?jù)報(bào)道: :到到20202020年,中國(guó)旅游業(yè)總
2、收入將超過(guò)年,中國(guó)旅游業(yè)總收入將超過(guò)30003000億美億美元,相當(dāng)于國(guó)內(nèi)生產(chǎn)總值的元,相當(dāng)于國(guó)內(nèi)生產(chǎn)總值的8%8%至至11%11%。(國(guó)際金融報(bào)2004年11月25日) (參考現(xiàn)狀:第一產(chǎn)業(yè)占(參考現(xiàn)狀:第一產(chǎn)業(yè)占GDP15%,建筑業(yè)占,建筑業(yè)占GDP7%,海南旅游業(yè)占GDP13.62%)什么決定性因素能使中國(guó)出境旅游達(dá)一億人次什么決定性因素能使中國(guó)出境旅游達(dá)一億人次?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?怎樣具體測(cè)定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系怎樣具體測(cè)定旅游業(yè)發(fā)展與這種決定性因素的數(shù)量關(guān)系?2 顯然,對(duì)旅游起決定性影響
3、作用的是中國(guó)居民的收入顯然,對(duì)旅游起決定性影響作用的是中國(guó)居民的收入水平水平. . “出境旅游人次出境旅游人次” (Y Y)與)與“居民平均收入居民平均收入”(X X)有)有什么數(shù)量關(guān)系呢?什么數(shù)量關(guān)系呢? 能否用某種線(xiàn)性或非線(xiàn)性關(guān)系式能否用某種線(xiàn)性或非線(xiàn)性關(guān)系式 Y= f ( X ) Y= f ( X ) 去表現(xiàn)這種去表現(xiàn)這種數(shù)量關(guān)系呢?cái)?shù)量關(guān)系呢? ?怎樣去表現(xiàn)呢怎樣去表現(xiàn)呢? ?需要研究經(jīng)濟(jì)變量之間數(shù)量關(guān)系的方法需要研究經(jīng)濟(jì)變量之間數(shù)量關(guān)系的方法為了不使問(wèn)題復(fù)雜化為了不使問(wèn)題復(fù)雜化, , 先從在某些古典先從在某些古典假定下的模型去討論假定下的模型去討論為什么先討論古典假定下的模型為什么先討
4、論古典假定下的模型? ?比喻:比喻:學(xué)習(xí)經(jīng)濟(jì)學(xué)時(shí)學(xué)習(xí)經(jīng)濟(jì)學(xué)時(shí), ,總先熟悉總先熟悉“完全競(jìng)爭(zhēng)理論完全競(jìng)爭(zhēng)理論”,再,再接觸接觸“壟斷和寡頭等非完全競(jìng)爭(zhēng)理論壟斷和寡頭等非完全競(jìng)爭(zhēng)理論”。但是。但是, ,并不是說(shuō)并不是說(shuō)“完全競(jìng)爭(zhēng)理論完全競(jìng)爭(zhēng)理論”就總是真實(shí)的。就總是真實(shí)的。4研究方式:研究方式:由簡(jiǎn)單到復(fù)雜由簡(jiǎn)單到復(fù)雜 !在簡(jiǎn)單的情況下理論更容易被闡述,!在簡(jiǎn)單的情況下理論更容易被闡述,也最容易被接受,所以從最簡(jiǎn)單的情況入手。也最容易被接受,所以從最簡(jiǎn)單的情況入手。簡(jiǎn)單線(xiàn)性回歸模型簡(jiǎn)單線(xiàn)性回歸模型在計(jì)量經(jīng)濟(jì)模型中,只有兩個(gè)變量的線(xiàn)性回歸模型最簡(jiǎn)單,稱(chēng)為簡(jiǎn)在計(jì)量經(jīng)濟(jì)模型中,只有兩個(gè)變量的線(xiàn)性回歸模
5、型最簡(jiǎn)單,稱(chēng)為簡(jiǎn)單線(xiàn)性回歸模型。簡(jiǎn)單線(xiàn)性回歸原理也最直觀。單線(xiàn)性回歸模型。簡(jiǎn)單線(xiàn)性回歸原理也最直觀。主要討論主要討論: 回歸分析和回歸函數(shù)回歸分析和回歸函數(shù) 最小二乘估計(jì)最小二乘估計(jì) 回歸方程的擬合優(yōu)度回歸方程的擬合優(yōu)度 參數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)參數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn) 回歸模型預(yù)測(cè)回歸模型預(yù)測(cè) 案例分析案例分析6第一節(jié)第一節(jié) 回歸分析與回歸函數(shù)回歸分析與回歸函數(shù)一、相關(guān)分析與回歸分析(對(duì)統(tǒng)計(jì)學(xué)的(對(duì)統(tǒng)計(jì)學(xué)的回顧)回顧) 1 1、經(jīng)濟(jì)變量間的相互關(guān)系、經(jīng)濟(jì)變量間的相互關(guān)系 性質(zhì)上可分為性質(zhì)上可分為 確定性的函數(shù)關(guān)系確定性的函數(shù)關(guān)系 Y=f (X) 可用數(shù)學(xué) 不確定性的統(tǒng)計(jì)關(guān)系不確定性的統(tǒng)計(jì)關(guān)系
6、相關(guān)關(guān)系相關(guān)關(guān)系 可用統(tǒng)計(jì) Y= f(X)+ (為隨機(jī)變量為隨機(jī)變量) 沒(méi)有關(guān)系沒(méi)有關(guān)系 不用分析 2、相關(guān)關(guān)系 相關(guān)關(guān)系的描述相關(guān)關(guān)系的描述 最直觀的描述方式最直觀的描述方式坐標(biāo)圖(散布圖、散點(diǎn)圖)坐標(biāo)圖(散布圖、散點(diǎn)圖) 7函數(shù)關(guān)系函數(shù)關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系沒(méi)有關(guān)系沒(méi)有關(guān)系 相關(guān)關(guān)系的類(lèi)型類(lèi)型 從涉及的變量數(shù)量看從涉及的變量數(shù)量看 簡(jiǎn)單相關(guān)簡(jiǎn)單相關(guān)兩個(gè)變量間兩個(gè)變量間 多重相關(guān)(復(fù)相關(guān))多重相關(guān)(復(fù)相關(guān)) 多個(gè)變量間多個(gè)變量間 從變量相關(guān)關(guān)系的表現(xiàn)形式看從變量相關(guān)關(guān)系的表現(xiàn)形式看 線(xiàn)性相關(guān)線(xiàn)性相關(guān)散布圖接近一條直線(xiàn)散布圖接近一條直線(xiàn) 非線(xiàn)性相關(guān)非線(xiàn)性相關(guān)散布圖接近一條曲線(xiàn)散布圖接近一條曲線(xiàn)
7、從變量相關(guān)關(guān)系變化的方向看從變量相關(guān)關(guān)系變化的方向看 正相關(guān)正相關(guān)變量同方向變化,同增同減變量同方向變化,同增同減 負(fù)相關(guān)負(fù)相關(guān)變量反方向變化,一增一減變量反方向變化,一增一減 不相關(guān)不相關(guān)無(wú)規(guī)律無(wú)規(guī)律89 3、相關(guān)程度的度量相關(guān)系數(shù) X和和Y的的總體線(xiàn)性相關(guān)系數(shù)總體線(xiàn)性相關(guān)系數(shù): 其中:其中: -X 的方差的方差 -Y的方差的方差 -X和和Y的協(xié)方差的協(xié)方差 X和和Y的的樣本線(xiàn)性相關(guān)系數(shù)樣本線(xiàn)性相關(guān)系數(shù): 其中:其中: 和和 分別是變量分別是變量X和和Y的樣本觀測(cè)值,的樣本觀測(cè)值, 和和 分別是變量分別是變量 X 和和Y 樣本值的平均值樣本值的平均值iXiY_X_Y(, )()( )Cov
8、X YVar X Var Y_22()()()()iiXYiiXX YYrXXYY(, )Cov X Y()Var X( )Var Y對(duì)相關(guān)系數(shù)的正確理解和使用對(duì)相關(guān)系數(shù)的正確理解和使用 X X和和Y Y 都是相互都是相互對(duì)稱(chēng)對(duì)稱(chēng)的隨機(jī)變量,的隨機(jī)變量, 線(xiàn)性相關(guān)系數(shù)只反映變量間的線(xiàn)性相關(guān)系數(shù)只反映變量間的線(xiàn)性相關(guān)線(xiàn)性相關(guān)程度,不能說(shuō)明程度,不能說(shuō)明非線(xiàn)性相關(guān)關(guān)系非線(xiàn)性相關(guān)關(guān)系 樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由于樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計(jì)值,由于抽樣抽樣波動(dòng)波動(dòng),樣本相關(guān)系數(shù)是隨抽樣而變動(dòng)的,樣本相關(guān)系數(shù)是隨抽樣而變動(dòng)的隨機(jī)變量隨機(jī)變量,其統(tǒng)計(jì),其統(tǒng)計(jì)顯著性有待檢驗(yàn)(顯著性
9、有待檢驗(yàn)(總體相關(guān)系數(shù)是隨機(jī)變量嗎?)總體相關(guān)系數(shù)是隨機(jī)變量嗎?) 相關(guān)系數(shù)只能反映變量間線(xiàn)性相關(guān)的方向和程度,相關(guān)系數(shù)只能反映變量間線(xiàn)性相關(guān)的方向和程度,不能不能確定變量間的因果關(guān)系確定變量間的因果關(guān)系,也不能說(shuō)明相關(guān)關(guān)系具體接近哪,也不能說(shuō)明相關(guān)關(guān)系具體接近哪條直線(xiàn)。條直線(xiàn)。 只作相關(guān)分析還不能達(dá)到經(jīng)濟(jì)計(jì)量分析的目的。只作相關(guān)分析還不能達(dá)到經(jīng)濟(jì)計(jì)量分析的目的。 計(jì)量經(jīng)濟(jì)學(xué)關(guān)心的問(wèn)題:計(jì)量經(jīng)濟(jì)學(xué)關(guān)心的問(wèn)題:經(jīng)濟(jì)變量間的因果關(guān)系及隱經(jīng)濟(jì)變量間的因果關(guān)系及隱藏在隨機(jī)性后面的統(tǒng)計(jì)規(guī)律性,在就要依靠回歸分析。藏在隨機(jī)性后面的統(tǒng)計(jì)規(guī)律性,在就要依靠回歸分析。10XYYXrr114 4、回歸分析、回歸分
10、析回歸的古典意義古典意義: 高爾頓遺傳學(xué)的回歸概念高爾頓遺傳學(xué)的回歸概念 ( ( 父母身高與子女身高的關(guān)系父母身高與子女身高的關(guān)系) )子女的身高有向人的平均身高子女的身高有向人的平均身高 回歸回歸 的趨勢(shì)的趨勢(shì)回歸的現(xiàn)代意義現(xiàn)代意義:一個(gè)被解釋變量對(duì)若干個(gè)一個(gè)被解釋變量對(duì)若干個(gè)解釋變量依存關(guān)系的研究解釋變量依存關(guān)系的研究12(1)注意明確幾個(gè)概念)注意明確幾個(gè)概念(為深刻理解“回歸”) 被解釋變量被解釋變量Y的的條件分布和條件概率條件分布和條件概率: 當(dāng)解釋變量當(dāng)解釋變量X取某固定值時(shí)(條件),取某固定值時(shí)(條件),Y的值不確定,的值不確定,Y的不同取值形成一定的分布,這是的不同取值形成一定
11、的分布,這是Y的的條件分布條件分布。 X取某取某固定值時(shí),固定值時(shí),Y取不同值的概率稱(chēng)為取不同值的概率稱(chēng)為條件概率條件概率。 被解釋變量被解釋變量Y的的條件期望條件期望: 對(duì)于對(duì)于X 的每一個(gè)取值,的每一個(gè)取值, 對(duì)對(duì)Y所形成的分布確所形成的分布確 定其期望或均值,稱(chēng)定其期望或均值,稱(chēng) 為為Y的的條件期望或條件均條件期望或條件均 值值用用 表示。表示。 注意注意:Y:Y的條件期望是隨的條件期望是隨X X的變動(dòng)而變動(dòng)的的變動(dòng)而變動(dòng)的 iX)(iXYE)(iXYEYX13回歸線(xiàn)回歸線(xiàn):對(duì)于每一個(gè):對(duì)于每一個(gè)X的取值的取值 ,都有,都有Y的條件期望的條件期望 與之對(duì)應(yīng),代表與之對(duì)應(yīng),代表Y的條件期望
12、的點(diǎn)的軌跡形成的條件期望的點(diǎn)的軌跡形成的直線(xiàn)或曲線(xiàn)稱(chēng)為回歸線(xiàn)。的直線(xiàn)或曲線(xiàn)稱(chēng)為回歸線(xiàn)?;貧w函數(shù)回歸函數(shù):被解釋變量:被解釋變量Y的條件期望的條件期望 隨隨解釋變量解釋變量X的變化而有規(guī)律的變化而有規(guī)律的變化,如果把的變化,如果把Y的條件期的條件期望表現(xiàn)為望表現(xiàn)為X的某種函數(shù)的某種函數(shù) ,這個(gè)函數(shù)稱(chēng)為回歸函數(shù)。這個(gè)函數(shù)稱(chēng)為回歸函數(shù)?;貧w函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù)回歸函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù) iXX YiX()iE Y X()iE Y X()iE Y XE()()iiY Xf X14每每 月月 家家 庭庭 可可 支支 配配 收收 入入 X X10001500200025003
13、0003500400045005000550082096211081329163218422037227524642824888102412011365172618742110238825893038932112112641410178619062225242627903150每每960121013101432183510682319248828563201月月125913401520188520662321258729003288家家132414001615194321852365265030213399庭庭1448165020372210239827893064消消148917122078
14、2289248728533142費(fèi)費(fèi)1538177821792313251329343274支支160018412298239825383110出出17021886231624232567 Y1900238724532610201224982487271025892586900115014001650190021502400265029003150E()iY X舉例舉例: 假如已知由假如已知由100100個(gè)家庭構(gòu)成的總體的數(shù)據(jù)個(gè)家庭構(gòu)成的總體的數(shù)據(jù) (單位單位:美元美元)(2)總體回歸函數(shù))總體回歸函數(shù)(PRF)15家庭消費(fèi)支出的條件期望與家庭收入的關(guān)系的圖形家庭消費(fèi)支出的條件期望與家庭收入的
15、關(guān)系的圖形:對(duì)于本例的總體,家庭消費(fèi)支出的條件期望對(duì)于本例的總體,家庭消費(fèi)支出的條件期望與家庭收入與家庭收入 基本是線(xiàn)性關(guān)系基本是線(xiàn)性關(guān)系, , 可以把家庭消費(fèi)可以把家庭消費(fèi)支出的條件均值表示為家庭收入的線(xiàn)性函數(shù):支出的條件均值表示為家庭收入的線(xiàn)性函數(shù):iiXXYE)()(iXYE)(iXYEiXiX16 總體回歸函數(shù)的概念總體回歸函數(shù)的概念 前提:前提:假如已知假如已知所研究的經(jīng)濟(jì)現(xiàn)象的總體的被解所研究的經(jīng)濟(jì)現(xiàn)象的總體的被解釋變量釋變量Y和解釋變量和解釋變量X的每個(gè)觀測(cè)值的每個(gè)觀測(cè)值 (通常這是不可能的?。ㄍǔ_@是不可能的?。?那么,可以計(jì)算出總體被解釋變量那么,可以計(jì)算出總體被解釋變量Y
16、的條件期望的條件期望 ,并將其表現(xiàn)為解釋變量,并將其表現(xiàn)為解釋變量X的某種函數(shù)的某種函數(shù) 這個(gè)函數(shù)稱(chēng)為總體回歸函數(shù)(這個(gè)函數(shù)稱(chēng)為總體回歸函數(shù)(PRF) 總體回歸函數(shù)表現(xiàn)的是該總體活動(dòng)的某種規(guī)律性總體回歸函數(shù)表現(xiàn)的是該總體活動(dòng)的某種規(guī)律性)()(iiXfXYE)(iXYE17 iuiXXY)(iXYEiY條件期望條件期望表現(xiàn)形式表現(xiàn)形式例如例如Y的條件期望的條件期望 是解是解 釋變量釋變量X的線(xiàn)性函數(shù),可表示為:的線(xiàn)性函數(shù),可表示為: 個(gè)別值個(gè)別值表現(xiàn)形式表現(xiàn)形式(隨機(jī)設(shè)定形式)(隨機(jī)設(shè)定形式) 對(duì)于一定的對(duì)于一定的 ,Y的各個(gè)別值的各個(gè)別值 分布分布 在在 的周?chē)?,若令各個(gè)的周?chē)袅罡鱾€(gè) 與
17、條件與條件 期望期望 的偏差為的偏差為 ,顯然,顯然 是個(gè)隨機(jī)變量是個(gè)隨機(jī)變量 則有則有 iYiYiX)(iXYE12()()iiiiE Y Xf XX)(iXYE)(iXYEiuiuiiiiiiXYXYEYu21)(12iiiYXu總體回歸函數(shù)的表現(xiàn)形式總體回歸函數(shù)的表現(xiàn)形式PRF如何理解總體回歸函數(shù)如何理解總體回歸函數(shù)實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)(總體運(yùn)動(dòng)的規(guī)律性)實(shí)際的經(jīng)濟(jì)研究中總體回歸函數(shù)(總體運(yùn)動(dòng)的規(guī)律性)通常是通常是未知未知的,只能根據(jù)經(jīng)濟(jì)理論和實(shí)踐經(jīng)驗(yàn)去的,只能根據(jù)經(jīng)濟(jì)理論和實(shí)踐經(jīng)驗(yàn)去設(shè)定設(shè)定?!坝?jì)量計(jì)量”的根本目的就是要尋求總體回歸函數(shù)。我們所設(shè)的根本目的就是要尋求總體回歸函數(shù)
18、。我們所設(shè)定的計(jì)量模型實(shí)際就是在設(shè)定總體回歸函數(shù)的形式。定的計(jì)量模型實(shí)際就是在設(shè)定總體回歸函數(shù)的形式??傮w回歸函數(shù)中總體回歸函數(shù)中Y Y與與X X的關(guān)系可以是的關(guān)系可以是線(xiàn)性線(xiàn)性的,也可以是的,也可以是非非線(xiàn)性線(xiàn)性的。的。1819注意:注意:在計(jì)量經(jīng)濟(jì)學(xué)中,線(xiàn)性回歸模型主要指在計(jì)量經(jīng)濟(jì)學(xué)中,線(xiàn)性回歸模型主要指就參數(shù)而言就參數(shù)而言是是“線(xiàn)性線(xiàn)性”的的,因?yàn)橹灰獙?duì)參數(shù)而言是線(xiàn)性的因?yàn)橹灰獙?duì)參數(shù)而言是線(xiàn)性的,都可以用都可以用類(lèi)似的方法去估計(jì)其參數(shù),可以歸于線(xiàn)性回歸。類(lèi)似的方法去估計(jì)其參數(shù),可以歸于線(xiàn)性回歸。iiiXXYE21)(iiiXXYE221)(iiiXXYE21)(“線(xiàn)性線(xiàn)性”的判斷的判斷
19、(3 3)隨機(jī)擾動(dòng)項(xiàng))隨機(jī)擾動(dòng)項(xiàng)u概念概念 在總體回歸函數(shù)中,各在總體回歸函數(shù)中,各 個(gè)個(gè) 的值與其條件期望的值與其條件期望 的偏差的偏差 有很有很重要的意義,它代表排除在重要的意義,它代表排除在模型以外的所有因素對(duì)模型以外的所有因素對(duì)Y的的影響。影響。性質(zhì)性質(zhì) 是其期望為是其期望為0有一定分布的隨機(jī)變量有一定分布的隨機(jī)變量重要性:重要性:隨機(jī)擾動(dòng)項(xiàng)的性質(zhì)決定著計(jì)量經(jīng)濟(jì)方法的隨機(jī)擾動(dòng)項(xiàng)的性質(zhì)決定著計(jì)量經(jīng)濟(jì)方法的 選擇選擇20iuiuiY)(iiXYEiuiXXY()iE Y XiY 引入隨機(jī)擾動(dòng)項(xiàng)引入隨機(jī)擾動(dòng)項(xiàng) 的原因的原因是是未知未知影響因素影響因素的代表的代表( (理論的模糊性理論的模糊性
20、) ) 是是無(wú)法取得數(shù)據(jù)無(wú)法取得數(shù)據(jù)的已知影響因素的代表的已知影響因素的代表( (數(shù)據(jù)欠缺數(shù)據(jù)欠缺) ) 是是眾多細(xì)小影響因素眾多細(xì)小影響因素的綜合代表的綜合代表( (非系統(tǒng)性影響非系統(tǒng)性影響) ) 模型可能存在模型可能存在設(shè)定誤差設(shè)定誤差( (變量、函數(shù)形式的設(shè)定)變量、函數(shù)形式的設(shè)定) 模型中變量可能存在模型中變量可能存在觀測(cè)誤差觀測(cè)誤差( (變量數(shù)據(jù)不符合實(shí)際變量數(shù)據(jù)不符合實(shí)際) ) 變量可能有內(nèi)在變量可能有內(nèi)在隨機(jī)性隨機(jī)性( (人類(lèi)行為的內(nèi)在隨機(jī)性人類(lèi)行為的內(nèi)在隨機(jī)性) )21iu(4)樣本回歸函數(shù))樣本回歸函數(shù)(SRF)樣本回歸線(xiàn):樣本回歸線(xiàn): 對(duì)于對(duì)于X的一定值,取得的一定值,取得
21、Y 的樣本觀測(cè)值,可計(jì)算其條件的樣本觀測(cè)值,可計(jì)算其條件 均值,樣本觀測(cè)值條件均值的軌跡,稱(chēng)為樣本回歸線(xiàn)。均值,樣本觀測(cè)值條件均值的軌跡,稱(chēng)為樣本回歸線(xiàn)。樣本回歸函數(shù):樣本回歸函數(shù):如果把被解釋變量如果把被解釋變量Y的樣本條件的樣本條件均值均值 表示為解釋變量表示為解釋變量X的某種的某種函數(shù),這個(gè)函數(shù)稱(chēng)為樣本回歸函函數(shù),這個(gè)函數(shù)稱(chēng)為樣本回歸函數(shù)(數(shù)(SRF)。)。 22XYiYiYiXSRF23 樣本回歸函數(shù)如果為線(xiàn)性函數(shù),可表示為樣本回歸函數(shù)如果為線(xiàn)性函數(shù),可表示為 其中:其中: 是與是與 相對(duì)應(yīng)的相對(duì)應(yīng)的 Y 的樣本條件均值的樣本條件均值 和和 分別是樣本回歸函數(shù)的參數(shù)分別是樣本回歸函數(shù)的
22、參數(shù) 個(gè)別值(實(shí)際值)形式:個(gè)別值(實(shí)際值)形式: 被解釋變量被解釋變量Y的實(shí)際觀測(cè)值的實(shí)際觀測(cè)值 不完全等于樣本條件均值不完全等于樣本條件均值 ,二者之差用二者之差用 表示,表示, 稱(chēng)為稱(chēng)為剩余項(xiàng)剩余項(xiàng)或或殘差項(xiàng)殘差項(xiàng): 則則 或或 12iiYXiY12iYieiiieYY12iiiYXeiXie樣本回歸函數(shù)的函數(shù)形式樣本回歸函數(shù)的函數(shù)形式iY條件均值形式:條件均值形式:樣本回歸函數(shù)樣本回歸函數(shù)的特點(diǎn)的特點(diǎn)樣本回歸線(xiàn)隨抽樣波動(dòng)而變化樣本回歸線(xiàn)隨抽樣波動(dòng)而變化:每次抽樣都能獲得一個(gè)樣本,就可以擬合一條樣本回歸每次抽樣都能獲得一個(gè)樣本,就可以擬合一條樣本回歸線(xiàn),線(xiàn),(SRF不唯一不唯一) Y S
23、RF1 SRF2 樣本回歸函數(shù)的函數(shù)形式樣本回歸函數(shù)的函數(shù)形式應(yīng)與設(shè)定的總體回歸函數(shù)的應(yīng)與設(shè)定的總體回歸函數(shù)的函數(shù)形式一致。函數(shù)形式一致。 X 樣本回歸線(xiàn)只是樣本條件均值的軌跡,還不是總體回歸樣本回歸線(xiàn)只是樣本條件均值的軌跡,還不是總體回歸 線(xiàn),它至多只是未知的總體回歸線(xiàn)的近似表現(xiàn)。線(xiàn),它至多只是未知的總體回歸線(xiàn)的近似表現(xiàn)。24樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系 SRF PRF A X 25iYYiYiY()iiE Y XieiuiX對(duì)樣本回歸的理解對(duì)樣本回歸的理解 如果能夠獲得如果能夠獲得 和和 的數(shù)值,顯然的數(shù)值,顯然: 和和 是對(duì)總體回歸函數(shù)參數(shù)是對(duì)總體回歸
24、函數(shù)參數(shù) 和和 的估計(jì)的估計(jì) 是對(duì)總體條件期望是對(duì)總體條件期望 的估計(jì)的估計(jì) 在概念上類(lèi)似總體回歸函數(shù)中的在概念上類(lèi)似總體回歸函數(shù)中的 ,可,可 視為對(duì)視為對(duì) 的估計(jì)。的估計(jì)。26對(duì)比:對(duì)比: 總體回歸函數(shù)總體回歸函數(shù) 樣本回歸函數(shù)樣本回歸函數(shù)12iYieiuiu12()iiE Y X1212()iiiE Y XX12iiiYXu12iiYX12iiiYXe27 目的: 用樣本回歸函數(shù)用樣本回歸函數(shù)SRF去估計(jì)總體回歸函數(shù)去估計(jì)總體回歸函數(shù)PRF。 由于樣本對(duì)總體總是存在代表性誤差,由于樣本對(duì)總體總是存在代表性誤差,SRF 總會(huì)總會(huì)過(guò)高或過(guò)低估計(jì)過(guò)高或過(guò)低估計(jì)PRF。要解決的問(wèn)題:要解決的問(wèn)題
25、: 尋求一種規(guī)則和方法,使其得到的尋求一種規(guī)則和方法,使其得到的SRF的參數(shù)的參數(shù) 和和 盡可能盡可能“接近接近”總體回歸函數(shù)中的參數(shù)總體回歸函數(shù)中的參數(shù) 和和 的真實(shí)值。的真實(shí)值。這樣的這樣的“規(guī)則和方法規(guī)則和方法”有多種,最常用的是最小二乘法有多種,最常用的是最小二乘法11212回歸分析的目的回歸分析的目的第二節(jié)第二節(jié) 簡(jiǎn)單線(xiàn)性回歸模型的最小二乘估計(jì)簡(jiǎn)單線(xiàn)性回歸模型的最小二乘估計(jì)用樣本去估計(jì)總體回歸函數(shù),除了樣本以外,針對(duì)特定的用樣本去估計(jì)總體回歸函數(shù),除了樣本以外,針對(duì)特定的估計(jì)方法,還需要有一些前提條件估計(jì)方法,還需要有一些前提條件假定條件假定條件 1 1、簡(jiǎn)單線(xiàn)性回歸的基本假定簡(jiǎn)單線(xiàn)
26、性回歸的基本假定 為什么要作基本假定?為什么要作基本假定?(把問(wèn)題簡(jiǎn)化!)(把問(wèn)題簡(jiǎn)化?。?只有具備一定的假定條件,所作出的估計(jì)才具有良好只有具備一定的假定條件,所作出的估計(jì)才具有良好的的統(tǒng)計(jì)性質(zhì)統(tǒng)計(jì)性質(zhì)。 因?yàn)槟P椭杏须S機(jī)擾動(dòng)項(xiàng),估計(jì)的參數(shù)是隨機(jī)變量,因?yàn)槟P椭杏须S機(jī)擾動(dòng)項(xiàng),估計(jì)的參數(shù)是隨機(jī)變量,顯然參數(shù)估計(jì)值的分布與擾動(dòng)項(xiàng)的分布有關(guān),只有對(duì)顯然參數(shù)估計(jì)值的分布與擾動(dòng)項(xiàng)的分布有關(guān),只有對(duì)隨機(jī)擾動(dòng)的分布作出假定,才能比較方便地隨機(jī)擾動(dòng)的分布作出假定,才能比較方便地確定所估確定所估計(jì)參數(shù)的分布性質(zhì)計(jì)參數(shù)的分布性質(zhì),也才可能進(jìn)行,也才可能進(jìn)行假設(shè)檢驗(yàn)和區(qū)間估假設(shè)檢驗(yàn)和區(qū)間估計(jì)。計(jì)。假定分為:假定分
27、為:對(duì)模型和變量的假定對(duì)模型和變量的假定對(duì)隨機(jī)擾動(dòng)項(xiàng)的假定對(duì)隨機(jī)擾動(dòng)項(xiàng)的假定 28(1 1)對(duì)模型和變量的假定)對(duì)模型和變量的假定如如 假定模型設(shè)定是正確的(變量和模型假定模型設(shè)定是正確的(變量和模型無(wú)設(shè)定誤差)無(wú)設(shè)定誤差)假定解釋變量假定解釋變量X與擾動(dòng)項(xiàng)與擾動(dòng)項(xiàng)u是不相關(guān)是不相關(guān)的。的。(從變量從變量X角角度看度看)有時(shí)還假定:有時(shí)還假定:回歸模型對(duì)參數(shù)而言是線(xiàn)性的回歸模型對(duì)參數(shù)而言是線(xiàn)性的觀測(cè)次觀測(cè)次n必須大于待估計(jì)參數(shù)個(gè)數(shù)必須大于待估計(jì)參數(shù)個(gè)數(shù)(解釋變量個(gè)數(shù)解釋變量個(gè)數(shù))2912iiiYXu(2 2)對(duì)隨機(jī)擾動(dòng)項(xiàng))對(duì)隨機(jī)擾動(dòng)項(xiàng)u u的假定的假定 假定假定1 1:零均值假定零均值假定:
28、在給定在給定X的條件下,的條件下, 的條件期望為零的條件期望為零 假定假定2 2:同方差假定同方差假定: 在給定在給定X的條件下,的條件方差為某個(gè)常數(shù)的條件下,的條件方差為某個(gè)常數(shù) 30iu22)()(iiiiiXuEuEXuVariu()0iiE u X231 假定假定3 3:無(wú)自相關(guān)假定無(wú)自相關(guān)假定: 隨機(jī)擾動(dòng)項(xiàng)隨機(jī)擾動(dòng)項(xiàng) 的逐次值互不相關(guān)的逐次值互不相關(guān) 假定假定4 4:隨機(jī)擾動(dòng)隨機(jī)擾動(dòng) 與解釋變量與解釋變量 不相關(guān)不相關(guān) 表明表明 和和 是各自獨(dú)立影響是各自獨(dú)立影響 iuiuiXiu( ,)( )()()0()ijiijjijCov u uE uE uuE uE uuij( ,)( )
29、()0iiiiiiCov u XE uE uXE XiXiY232假定假定5:注意注意: :并不是參數(shù)估計(jì)的每一具體步驟都要用到所有的假定并不是參數(shù)估計(jì)的每一具體步驟都要用到所有的假定, ,但對(duì)全部假定有完整的認(rèn)識(shí)但對(duì)全部假定有完整的認(rèn)識(shí), ,對(duì)學(xué)習(xí)計(jì)量經(jīng)濟(jì)學(xué)是有益對(duì)學(xué)習(xí)計(jì)量經(jīng)濟(jì)學(xué)是有益的。的。iuiu2( ,)iuN o在對(duì)在對(duì) 的基本假定下的基本假定下 Y Y 的分布性質(zhì)的分布性質(zhì)由于由于其中的其中的 和和 是非隨機(jī)的,因此是非隨機(jī)的,因此 的分布性質(zhì)決定了的分布性質(zhì)決定了 的分布性質(zhì)。的分布性質(zhì)。 對(duì)對(duì) 的一些假定可以等價(jià)地表示為對(duì)的一些假定可以等價(jià)地表示為對(duì) 的假定:的假定: 假定假定
30、1:零均值假定:零均值假定 假定假定2:同方差假定:同方差假定 假定假定3:無(wú)自相關(guān)假定:無(wú)自相關(guān)假定 假定假定5:正態(tài)性假定:正態(tài)性假定 33iuiiiuXY21iuiuiYiY212(,)iiYNXiiiXXYE21)(12, iX2()iiVar Y X( ,)0ijCov Y Y 2、普通最小二乘法普通最小二乘法(OLS) (rdinary Least Squaresrdinary Least Squares)(1)OLS的基本思想:的基本思想: 不同的估計(jì)方法可以得到不同的樣本回歸參數(shù)不同的估計(jì)方法可以得到不同的樣本回歸參數(shù) 和和 ,所估計(jì)的,所估計(jì)的 也就不同。也就不同。 理想的估
31、計(jì)方法應(yīng)使理想的估計(jì)方法應(yīng)使 與與 的差即剩余的差即剩余 越越小越好小越好 因因 可正可負(fù),所以可以取可正可負(fù),所以可以取 最小最小即即在觀測(cè)值在觀測(cè)值Y和和X確定時(shí),確定時(shí), 的大小決定于的大小決定于 和和 。12iYiYieie2ie2212minmin()iiieYXiY2ie1234 (2) 正規(guī)方程和估計(jì)式正規(guī)方程和估計(jì)式用克萊姆法則求解得以觀測(cè)值表現(xiàn)的用克萊姆法則求解得以觀測(cè)值表現(xiàn)的OLS估計(jì)式:估計(jì)式: 352122()iiiiiiiXYXX YnXX222()iiiiiinX YXYnXX取偏導(dǎo)數(shù)并令其為取偏導(dǎo)數(shù)并令其為0,得正規(guī)方程,得正規(guī)方程12212iiiiiiYnXX
32、YXX21212122()2()0()2()0iiiiiiieYXeYXX 或或00iiiee X即即36 為表達(dá)得更簡(jiǎn)潔,或者用離差形式為表達(dá)得更簡(jiǎn)潔,或者用離差形式OLS估計(jì)式估計(jì)式: 容易證明容易證明 注意:注意:其中:其中: 本課程中大寫(xiě)的本課程中大寫(xiě)的 和和 均表示觀測(cè)值;均表示觀測(cè)值; 小寫(xiě)的小寫(xiě)的 和和 均表示觀測(cè)值的離差均表示觀測(cè)值的離差而且由而且由樣本回歸函數(shù)可用離差形式寫(xiě)為樣本回歸函數(shù)可用離差形式寫(xiě)為 _12YXXXxiiYYyii用離差表現(xiàn)的用離差表現(xiàn)的OLSOLS估計(jì)式估計(jì)式iiiyxiiXY2112YXixiyiXiY_22_222()()()()iiiiiiiiii
33、iinX YXYXX YYx yxnXXXX (3) OLSOLS回歸線(xiàn)的數(shù)學(xué)性質(zhì)回歸線(xiàn)的數(shù)學(xué)性質(zhì) 可以證明:(見(jiàn)教材P33P34證明) (證明過(guò)程用到OLS的結(jié)論,但與基本假定無(wú)關(guān)) 回歸線(xiàn)通過(guò)樣本均值回歸線(xiàn)通過(guò)樣本均值 估計(jì)值估計(jì)值 的均值等于實(shí)的均值等于實(shí) 際觀測(cè)值際觀測(cè)值 的均值的均值 剩余項(xiàng)剩余項(xiàng) 的均值為零的均值為零 37ie0neeiYXXYiY12YXiY12121()iiXXYYnn(由OLS第一個(gè)正規(guī)方程直接得到)(由OLS正規(guī)方程 兩邊同除n得到)12()0iiYX 被解釋變量估計(jì)值被解釋變量估計(jì)值 與剩余項(xiàng)與剩余項(xiàng) 不相關(guān)不相關(guān) Cov(,)0iiY eiYie 解釋變
34、量解釋變量 與剩余項(xiàng)與剩余項(xiàng) 不相關(guān)不相關(guān) ieiXCov(,)0iiX e由OLS正規(guī)方程:1Cov(,)()()0iiiiii ieX eeXXeX eXn12121Cov( ,)()()()()()0iiiiiii iiiiiiiY eYYeenYYeYeYeeeeeXX00iiiee X(注意注意:紅色的項(xiàng)為紅色的項(xiàng)為0)(4 4)OLSOLS估計(jì)式的統(tǒng)計(jì)性質(zhì)估計(jì)式的統(tǒng)計(jì)性質(zhì)參數(shù)估計(jì)式的優(yōu)劣需要有評(píng)價(jià)的標(biāo)準(zhǔn)參數(shù)估計(jì)式的優(yōu)劣需要有評(píng)價(jià)的標(biāo)準(zhǔn) 參數(shù)無(wú)法通過(guò)觀測(cè)直接確定,只能通過(guò)樣本估計(jì),但因參數(shù)無(wú)法通過(guò)觀測(cè)直接確定,只能通過(guò)樣本估計(jì),但因存在抽樣波動(dòng)存在抽樣波動(dòng),參數(shù)估計(jì)值不一定等于總體參
35、數(shù)的真實(shí)值參數(shù)估計(jì)值不一定等于總體參數(shù)的真實(shí)值。 參數(shù)估計(jì)方法及所確定的估計(jì)式不一定完備,不一定參數(shù)估計(jì)方法及所確定的估計(jì)式不一定完備,不一定能得到總體參數(shù)的真實(shí)值,需要對(duì)估計(jì)方法作評(píng)價(jià)與選擇。能得到總體參數(shù)的真實(shí)值,需要對(duì)估計(jì)方法作評(píng)價(jià)與選擇。比較不同估計(jì)方法的估計(jì)結(jié)果時(shí),需要有一定的評(píng)價(jià)標(biāo)準(zhǔn)比較不同估計(jì)方法的估計(jì)結(jié)果時(shí),需要有一定的評(píng)價(jià)標(biāo)準(zhǔn) 基本要求:基本要求:參數(shù)估計(jì)值應(yīng)盡可能地接近總體參數(shù)的真實(shí)值參數(shù)估計(jì)值應(yīng)盡可能地接近總體參數(shù)的真實(shí)值估計(jì)準(zhǔn)則:估計(jì)準(zhǔn)則:“盡可能地接近盡可能地接近” 原則原則理論計(jì)量經(jīng)濟(jì)學(xué)主要討論參數(shù)估計(jì)式是否符合一定的準(zhǔn)則,理論計(jì)量經(jīng)濟(jì)學(xué)主要討論參數(shù)估計(jì)式是否符合一
36、定的準(zhǔn)則,怎樣才算怎樣才算“盡可能地接近盡可能地接近”總體參數(shù)的真實(shí)值呢?這決定于總體參數(shù)的真實(shí)值呢?這決定于參數(shù)估計(jì)式的統(tǒng)計(jì)性質(zhì):無(wú)偏性、最小方差性、一致性等。參數(shù)估計(jì)式的統(tǒng)計(jì)性質(zhì):無(wú)偏性、最小方差性、一致性等。 3940 無(wú)偏性 前提:前提:重復(fù)抽樣重復(fù)抽樣中中估計(jì)方法固定估計(jì)方法固定、樣本數(shù)不變樣本數(shù)不變、經(jīng)、經(jīng) 重復(fù)抽樣的觀測(cè)值重復(fù)抽樣的觀測(cè)值, ,可得一系列參數(shù)估計(jì)值可得一系列參數(shù)估計(jì)值 , , 的分布稱(chēng)為的分布稱(chēng)為 的抽樣分布,其密度函數(shù)記為的抽樣分布,其密度函數(shù)記為 如果如果 稱(chēng)稱(chēng) 是參數(shù)是參數(shù)的無(wú)偏估計(jì)式,否則的無(wú)偏估計(jì)式,否則 則稱(chēng)則稱(chēng) 是有偏的,其偏倚為是有偏的,其偏倚為
37、(見(jiàn)圖2)( )f( )E( )E( )E41 概 率 密 度 估計(jì)值 偏倚偏倚)(*E)(f)(*f圖242 最小方差最小方差( (有效有效) )性性前提:前提:樣本相同樣本相同、用、用不同的方法不同的方法估計(jì)參數(shù),可以找到若干估計(jì)參數(shù),可以找到若干 個(gè)不同的估計(jì)式個(gè)不同的估計(jì)式 目標(biāo)目標(biāo): 努力尋求其抽樣分布具有最小方差的估計(jì)式努力尋求其抽樣分布具有最小方差的估計(jì)式 最小方差準(zhǔn)則最小方差準(zhǔn)則 (見(jiàn)圖(見(jiàn)圖3 3) 既是無(wú)偏的同時(shí)又具有最小方差的估計(jì)式,稱(chēng)為最佳既是無(wú)偏的同時(shí)又具有最小方差的估計(jì)式,稱(chēng)為最佳 (有效)估計(jì)式。(有效)估計(jì)式。43概率密度圖 3*()f( )f估計(jì)值 漸近性質(zhì)漸
38、近性質(zhì)(大樣本性質(zhì))(大樣本性質(zhì))思想思想:當(dāng)樣本容量較小時(shí),有時(shí)很難找到方差最小的無(wú)偏估計(jì),當(dāng)樣本容量較小時(shí),有時(shí)很難找到方差最小的無(wú)偏估計(jì),需要考慮樣本擴(kuò)大后的性質(zhì)(需要考慮樣本擴(kuò)大后的性質(zhì)(估計(jì)方法不變估計(jì)方法不變,樣本數(shù)逐步增大樣本數(shù)逐步增大)一致性:一致性: 當(dāng)樣本容量當(dāng)樣本容量 n 趨于無(wú)窮大時(shí),如果估計(jì)式趨于無(wú)窮大時(shí),如果估計(jì)式 依概率收斂于總體依概率收斂于總體參數(shù)的真實(shí)值,就稱(chēng)這個(gè)估計(jì)式參數(shù)的真實(shí)值,就稱(chēng)這個(gè)估計(jì)式 是是 的一致估計(jì)式。即的一致估計(jì)式。即 或或 (漸近無(wú)偏估計(jì)式是當(dāng)樣本容量變得足夠大時(shí)其偏倚趨于零的(漸近無(wú)偏估計(jì)式是當(dāng)樣本容量變得足夠大時(shí)其偏倚趨于零的估計(jì)式)估
39、計(jì)式) (見(jiàn)圖4)漸近有效性:漸近有效性:當(dāng)樣本容量當(dāng)樣本容量 n 趨于無(wú)窮大時(shí),在所有的一致估計(jì)趨于無(wú)窮大時(shí),在所有的一致估計(jì)式中,具有最小的漸近方差。式中,具有最小的漸近方差。441)(limPnP)lim(45概率密度估計(jì)值圖 4100()f80( )f40()f20()f 分析OLSOLS估計(jì)式的統(tǒng)計(jì)性質(zhì)估計(jì)式的統(tǒng)計(jì)性質(zhì)先明確幾點(diǎn)先明確幾點(diǎn): :由由OLS估計(jì)式可以看出估計(jì)式可以看出 由可觀測(cè)的樣本值由可觀測(cè)的樣本值 和和 唯一表示。唯一表示。 因存在抽樣波動(dòng),因存在抽樣波動(dòng),OLS估計(jì)估計(jì) 是隨機(jī)變量是隨機(jī)變量 OLS估計(jì)式是估計(jì)式是點(diǎn)估計(jì)式點(diǎn)估計(jì)式 2122()iiiiiiiXYX
40、X YnXX46iYiX222()iiiiiinX YXYnXXkk1、 線(xiàn)性特征線(xiàn)性特征 是是Y的線(xiàn)性函數(shù)的線(xiàn)性函數(shù) 2、 無(wú)偏特性無(wú)偏特性 (證明見(jiàn)教材(證明見(jiàn)教材P37) 3、 最小方差特性最小方差特性 (證明見(jiàn)教材(證明見(jiàn)教材P68附錄附錄21) 在所有的線(xiàn)性無(wú)偏估計(jì)中,在所有的線(xiàn)性無(wú)偏估計(jì)中,OLS估計(jì)估計(jì) 具有最小方差具有最小方差(注意(注意:無(wú)偏性和最小方差性的證明中用到基本假定無(wú)偏性和最小方差性的證明中用到基本假定1假定假定4)結(jié)論:結(jié)論:在在古典假定條件古典假定條件下下,OLSOLS估計(jì)式是最佳線(xiàn)性無(wú)偏估計(jì)式是最佳線(xiàn)性無(wú)偏 估計(jì)式(估計(jì)式(BLUEBLUE:best line
41、ar unbiased estimatorbest linear unbiased estimator)47kkE)(k222()()()iiiiiiiiXX YYx yk yXXxOLSOLS估計(jì)式的統(tǒng)計(jì)性質(zhì)估計(jì)式的統(tǒng)計(jì)性質(zhì)高斯定理高斯定理2iiixkxk 第三節(jié)第三節(jié) 擬合優(yōu)度的度量擬合優(yōu)度的度量概念概念:樣本回歸線(xiàn)是對(duì)樣本數(shù)據(jù)樣本回歸線(xiàn)是對(duì)樣本數(shù)據(jù)的一種擬合,不同估計(jì)方的一種擬合,不同估計(jì)方法可以擬合出不同的回歸法可以擬合出不同的回歸線(xiàn),擬合的回歸線(xiàn)與樣本線(xiàn),擬合的回歸線(xiàn)與樣本觀測(cè)值總是有偏離。觀測(cè)值總是有偏離。 樣本回歸線(xiàn)對(duì)樣本觀測(cè)數(shù)據(jù)擬合的優(yōu)劣程度樣本回歸線(xiàn)對(duì)樣本觀測(cè)數(shù)據(jù)擬合的優(yōu)劣程
42、度 擬合優(yōu)度擬合優(yōu)度如何度量擬合優(yōu)度呢?如何度量擬合優(yōu)度呢?擬合優(yōu)度的度量建立在對(duì)擬合優(yōu)度的度量建立在對(duì)Y的總變差分解的基礎(chǔ)上的總變差分解的基礎(chǔ)上48XY 1、總變差的分解、總變差的分解 分析分析Y的觀測(cè)值、估計(jì)值與平均值的關(guān)系的觀測(cè)值、估計(jì)值與平均值的關(guān)系 將上式兩邊平方加總,可證得將上式兩邊平方加總,可證得(提示有(提示有 ) (TSS) (ESS) (RSS) 或者或者 總變差總變差 (TSS):被解釋變量:被解釋變量Y的觀測(cè)值與其平均值的離差平的觀測(cè)值與其平均值的離差平 方和方和(總平方和)(總平方和)(說(shuō)明說(shuō)明 Y 的變動(dòng)程度)的變動(dòng)程度) 解釋了的變差解釋了的變差 (ESS):被解
43、釋變量:被解釋變量Y的估計(jì)值與其平均值的的估計(jì)值與其平均值的 離差平方和離差平方和(回歸平方和)(回歸平方和) 剩余平方和剩余平方和 (RSS):被解釋變量觀測(cè)值與估計(jì)值之差的平方:被解釋變量觀測(cè)值與估計(jì)值之差的平方 和和(未解釋的平方和)(未解釋的平方和)49()()iiiiYYYYYY222()()()iiiiYYYYYY2iy222iiiyye2ie()0iiYY e2iy Y X 50iYYiX來(lái)自殘差SRF變差分解的圖示變差分解的圖示()iYY 來(lái)自回歸ie()iYY變差iY 2、可決系數(shù)、可決系數(shù) 以以TSS同除總變差等式兩邊:同除總變差等式兩邊: 或或 定義:定義:回歸平方和(解
44、釋了的變差回歸平方和(解釋了的變差ESS) 在總變?cè)诳傋?差(差(TSS) 中所占的比重稱(chēng)為可決系數(shù),用中所占的比重稱(chēng)為可決系數(shù),用 或或 表示表示: 51ESSTSSTSSRSSTSSTSS2iy2r2iy222iyyR2221iiyeR22221iiiyyey或或2R可決系數(shù)的作用可決系數(shù)的作用 可決系數(shù)越大,說(shuō)明在總變差中由模型作出了解可決系數(shù)越大,說(shuō)明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優(yōu)度越好。反釋的部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)越小,說(shuō)明模型對(duì)樣本觀測(cè)值的擬合之可決系數(shù)越小,說(shuō)明模型對(duì)樣本觀測(cè)值的擬合程度越差。程度越差。 可決系數(shù)的特點(diǎn)可決系數(shù)的
45、特點(diǎn): 可決系數(shù)取值范圍:可決系數(shù)取值范圍: 隨抽樣波動(dòng),樣本可決系數(shù)隨抽樣波動(dòng),樣本可決系數(shù) 是隨抽樣而變是隨抽樣而變 動(dòng)的隨機(jī)變量動(dòng)的隨機(jī)變量 可決系數(shù)是非負(fù)的統(tǒng)計(jì)量可決系數(shù)是非負(fù)的統(tǒng)計(jì)量52102 R2R運(yùn)用可決系數(shù)時(shí)應(yīng)注意:運(yùn)用可決系數(shù)時(shí)應(yīng)注意: 可決系數(shù)只是說(shuō)明列入模型的所有解釋變量對(duì)可決系數(shù)只是說(shuō)明列入模型的所有解釋變量對(duì) 被解釋變量的被解釋變量的聯(lián)合聯(lián)合的影響程度,不說(shuō)明模型中每個(gè)的影響程度,不說(shuō)明模型中每個(gè) 解釋變量的影響程度(在多元中)解釋變量的影響程度(在多元中) 如果回歸的主要目的是經(jīng)濟(jì)結(jié)構(gòu)分析,不能只追如果回歸的主要目的是經(jīng)濟(jì)結(jié)構(gòu)分析,不能只追 求高的可決系數(shù),而是要得
46、到總體回歸系數(shù)可信求高的可決系數(shù),而是要得到總體回歸系數(shù)可信 的估計(jì)量。可決系數(shù)高并不一定每個(gè)回歸系數(shù)都的估計(jì)量。可決系數(shù)高并不一定每個(gè)回歸系數(shù)都 可信任??尚湃?。 如果主要目的只是為了預(yù)測(cè)被解釋變量值,不是為如果主要目的只是為了預(yù)測(cè)被解釋變量值,不是為 了正確估計(jì)回歸系數(shù),一般可考慮有較高的可決系數(shù)。了正確估計(jì)回歸系數(shù),一般可考慮有較高的可決系數(shù)。5354第四節(jié)第四節(jié) 回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)回歸系數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)為什么要作區(qū)間估計(jì)?為什么要作區(qū)間估計(jì)? OLS估計(jì)只是通過(guò)樣本得到的點(diǎn)估計(jì),不一定等估計(jì)只是通過(guò)樣本得到的點(diǎn)估計(jì),不一定等于真實(shí)參數(shù),還需要找到真實(shí)參數(shù)的可能范圍,并說(shuō)
47、于真實(shí)參數(shù),還需要找到真實(shí)參數(shù)的可能范圍,并說(shuō)明其可靠性明其可靠性為什么要作假設(shè)檢驗(yàn)?為什么要作假設(shè)檢驗(yàn)?OLS 估計(jì)只是用樣本估計(jì)的結(jié)果,是否可靠?估計(jì)只是用樣本估計(jì)的結(jié)果,是否可靠? 是否抽樣的偶然結(jié)果?還有待統(tǒng)計(jì)檢驗(yàn)。是否抽樣的偶然結(jié)果?還有待統(tǒng)計(jì)檢驗(yàn)。區(qū)間估計(jì)和假設(shè)檢驗(yàn)都是建立在確定參數(shù)估區(qū)間估計(jì)和假設(shè)檢驗(yàn)都是建立在確定參數(shù)估計(jì)值計(jì)值 概率分布性質(zhì)的基礎(chǔ)上。概率分布性質(zhì)的基礎(chǔ)上。k55 1 1、OLSOLS估計(jì)的分布性質(zhì)估計(jì)的分布性質(zhì) 基本思想基本思想 是隨機(jī)變量,必須確定其分布性質(zhì)才可能進(jìn)行區(qū)是隨機(jī)變量,必須確定其分布性質(zhì)才可能進(jìn)行區(qū)間估計(jì)和假設(shè)檢驗(yàn)間估計(jì)和假設(shè)檢驗(yàn) 怎樣確定怎樣確定
48、 的分布性質(zhì)呢的分布性質(zhì)呢? 是服從正態(tài)分布的隨機(jī)變量,決定了是服從正態(tài)分布的隨機(jī)變量,決定了 也是服從正也是服從正態(tài)分布的隨機(jī)變量,態(tài)分布的隨機(jī)變量, 是是 的線(xiàn)性函數(shù),決定了的線(xiàn)性函數(shù),決定了 也是服從正態(tài)分布的隨機(jī)變量也是服從正態(tài)分布的隨機(jī)變量 正態(tài)正態(tài) 正態(tài)正態(tài) 正態(tài)正態(tài) 只要確定只要確定 的期望和方差,即可確定的期望和方差,即可確定 的分布性質(zhì)的分布性質(zhì) kkiuiYiYiuiYkkkkk56 的期望:的期望: (無(wú)偏估計(jì))無(wú)偏估計(jì)) 的方差和標(biāo)準(zhǔn)誤差的方差和標(biāo)準(zhǔn)誤差 (證明見(jiàn)P38) (標(biāo)準(zhǔn)誤差是方差的平方根標(biāo)準(zhǔn)誤差是方差的平方根) 注意:注意:以上各式中以上各式中 未知但是常數(shù),
49、其余均是已知的未知但是常數(shù),其余均是已知的樣本觀測(cè)值,這時(shí)樣本觀測(cè)值,這時(shí) 和和 都不是隨機(jī)變量。都不是隨機(jī)變量。 ()kkE22()iSEx 的期望和方差222()iVarx2212()iiXVarNx212SE()iiXNx2kkk)(kVar)(kSE57 基本思想:基本思想: 是是 的方差,而的方差,而 不能直接觀測(cè),只能從由樣本得不能直接觀測(cè),只能從由樣本得到的到的 去獲得有關(guān)去獲得有關(guān) 的某些信息,去對(duì)的某些信息,去對(duì) 作出估計(jì)。作出估計(jì)。 可以證明(見(jiàn)附錄可以證明(見(jiàn)附錄2.2)其無(wú)偏估計(jì)為其無(wú)偏估計(jì)為 (n-2為自由度為自由度,即可自由變化的樣本觀測(cè)值個(gè)數(shù)即可自由變化的樣本觀測(cè)
50、值個(gè)數(shù))注意區(qū)別:注意區(qū)別: 是未知的確定的常數(shù);是未知的確定的常數(shù); 是由樣本信息估計(jì)的,是個(gè)隨機(jī)變量是由樣本信息估計(jì)的,是個(gè)隨機(jī)變量2222nei對(duì)隨機(jī)擾動(dòng)項(xiàng)方差對(duì)隨機(jī)擾動(dòng)項(xiàng)方差 的估計(jì)的估計(jì)iuiuiuie222222()E58對(duì)對(duì) 作標(biāo)準(zhǔn)化變換作標(biāo)準(zhǔn)化變換為什么要對(duì)為什么要對(duì) 作標(biāo)準(zhǔn)化變換作標(biāo)準(zhǔn)化變換?在在 正態(tài)性假定下,由前面的分析已知正態(tài)性假定下,由前面的分析已知但在對(duì)一般正態(tài)變量但在對(duì)一般正態(tài)變量 作實(shí)際分析時(shí),要具體確作實(shí)際分析時(shí),要具體確定定 的取值及對(duì)應(yīng)的概率是很麻煩的,為了便的取值及對(duì)應(yīng)的概率是很麻煩的,為了便于直接利用于直接利用“標(biāo)準(zhǔn)化正態(tài)分布的臨界值標(biāo)準(zhǔn)化正態(tài)分布的臨
51、界值”,需要對(duì),需要對(duì) 作標(biāo)準(zhǔn)化變換。作標(biāo)準(zhǔn)化變換。標(biāo)準(zhǔn)化的方式:標(biāo)準(zhǔn)化的方式:kkkkk()()kkkkEzSEiu)(,kkkVarN59在在 已知時(shí)已知時(shí)對(duì)對(duì) 作標(biāo)準(zhǔn)化變換,所得作標(biāo)準(zhǔn)化變換,所得Z統(tǒng)計(jì)量為標(biāo)準(zhǔn)統(tǒng)計(jì)量為標(biāo)準(zhǔn)正態(tài)變量。正態(tài)變量。11111212(0,1)()iizNSEXnx2222222(0,1)()izNSEx (1 1) 已知時(shí),對(duì)已知時(shí),對(duì) 作標(biāo)準(zhǔn)化變換作標(biāo)準(zhǔn)化變換k注意注意:這時(shí)這時(shí) 和和 都不是隨機(jī)變量都不是隨機(jī)變量(X、 、 都是非隨機(jī)的)都是非隨機(jī)的))(2SE)(1SE2k2n60條件:條件: 當(dāng)當(dāng) 未知時(shí)未知時(shí),可用,可用 (隨機(jī)變量)代替(隨機(jī)變量)代
52、替 去估計(jì)去估計(jì)參數(shù)的標(biāo)準(zhǔn)誤差參數(shù)的標(biāo)準(zhǔn)誤差。這時(shí)參數(shù)估計(jì)的標(biāo)準(zhǔn)誤差是個(gè)這時(shí)參數(shù)估計(jì)的標(biāo)準(zhǔn)誤差是個(gè)隨機(jī)變量。隨機(jī)變量。 樣本為大樣本時(shí)樣本為大樣本時(shí), ,作標(biāo)準(zhǔn)化變換所得的統(tǒng)計(jì)量作標(biāo)準(zhǔn)化變換所得的統(tǒng)計(jì)量Z Zk k,也可以也可以 視為標(biāo)準(zhǔn)正態(tài)變量視為標(biāo)準(zhǔn)正態(tài)變量(根據(jù)中心極限定理)。(根據(jù)中心極限定理)。 樣本為小樣本時(shí)樣本為小樣本時(shí), 用估計(jì)的參數(shù)標(biāo)準(zhǔn)誤差對(duì)用估計(jì)的參數(shù)標(biāo)準(zhǔn)誤差對(duì) 作標(biāo)準(zhǔn)化變換,所得的統(tǒng)作標(biāo)準(zhǔn)化變換,所得的統(tǒng) 計(jì)量用計(jì)量用t表示,這時(shí)表示,這時(shí)t將不再服從正態(tài)分布,而是服從將不再服從正態(tài)分布,而是服從 t 分布分布(注意這時(shí)分母是隨機(jī)變量) :22 (2)()kkktt nS
53、E(2 2) 未知時(shí),對(duì)未知時(shí),對(duì) 作標(biāo)準(zhǔn)化變換作標(biāo)準(zhǔn)化變換k2k2 2、回歸系數(shù)的區(qū)間估計(jì)基本思想基本思想: 對(duì)參數(shù)作出的點(diǎn)估計(jì)是隨機(jī)變量,雖然是無(wú)偏估對(duì)參數(shù)作出的點(diǎn)估計(jì)是隨機(jī)變量,雖然是無(wú)偏估計(jì),但還不能說(shuō)明這種估計(jì)的可靠性和精確性。計(jì),但還不能說(shuō)明這種估計(jì)的可靠性和精確性。 需要找到包含真實(shí)參數(shù)的一個(gè)范圍,并確定這樣需要找到包含真實(shí)參數(shù)的一個(gè)范圍,并確定這樣的范圍包含參數(shù)真實(shí)值的可靠程度的范圍包含參數(shù)真實(shí)值的可靠程度。方法:方法:如果在確定參數(shù)估計(jì)式概率分布性質(zhì)的基礎(chǔ)上,可如果在確定參數(shù)估計(jì)式概率分布性質(zhì)的基礎(chǔ)上,可 找到兩個(gè)正數(shù)找到兩個(gè)正數(shù)和和 ,能使得,能使得 這樣的區(qū)間包含真實(shí)這樣
54、的區(qū)間包含真實(shí) 的概率為的概率為 ,即,即 這樣的區(qū)間稱(chēng)為所估計(jì)參數(shù)的置信區(qū)間。這樣的區(qū)間稱(chēng)為所估計(jì)參數(shù)的置信區(qū)間。 61),(kkk) 10(11)(kkkP62怎樣正確理解置信區(qū)間怎樣正確理解置信區(qū)間?注意:注意: 是未知但是未知但確定確定的數(shù),的數(shù), 是隨抽樣而是隨抽樣而變化的變化的隨機(jī)區(qū)間隨機(jī)區(qū)間。從重復(fù)抽樣的觀點(diǎn)看,每次抽樣都可構(gòu)。從重復(fù)抽樣的觀點(diǎn)看,每次抽樣都可構(gòu)造一個(gè)區(qū)間,象這樣構(gòu)造的區(qū)間,平均來(lái)說(shuō)有(造一個(gè)區(qū)間,象這樣構(gòu)造的區(qū)間,平均來(lái)說(shuō)有( )比例的次數(shù)包含比例的次數(shù)包含 的真實(shí)值。的真實(shí)值。 kk(,)kk 1k問(wèn)題:?jiǎn)栴}: 是給定的,如何去尋找合適的是給定的,如何去尋找合
55、適的 呢呢? 63樣本容量充分大樣本容量充分大樣本容量較小樣本容量較小總體方差總體方差 已知已知總總體體方方差差 未未知知*222222(0,1)()iZNSExZ將接近將接近標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布服從服從 t 分布分布22k三三種種情情況況1)(kkkP基本思想基本思想:利用利用 標(biāo)準(zhǔn)化后的分布性質(zhì)去尋求標(biāo)準(zhǔn)化后的分布性質(zhì)去尋求 :置信區(qū)間:置信區(qū)間:標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布回歸系數(shù)的區(qū)間估計(jì)回歸系數(shù)的區(qū)間估計(jì) (分三種情況尋找合適的分三種情況尋找合適的 )(1) 當(dāng)總體方差當(dāng)總體方差 已知時(shí)已知時(shí)( Z 服從正態(tài)分布服從正態(tài)分布) 取定取定 (例如(例如 =0.05),查標(biāo)準(zhǔn)正態(tài)分布表得
56、與),查標(biāo)準(zhǔn)正態(tài)分布表得與 對(duì)對(duì)應(yīng)的臨界值應(yīng)的臨界值z(mì) (例如例如z為為1.96),則標(biāo)準(zhǔn)化變量,則標(biāo)準(zhǔn)化變量Z*(統(tǒng)計(jì)量)(統(tǒng)計(jì)量) 因?yàn)橐驗(yàn)?或或 即即64222222()()1PzSEzSE 2221()PzzSE *222222(0,1)()iZNSExzz22()izSEzx0(2)當(dāng)總體方差)當(dāng)總體方差 未知,而樣本容量充分大時(shí)未知,而樣本容量充分大時(shí)方法:方法:可用無(wú)偏估計(jì)可用無(wú)偏估計(jì) 去代替未知的去代替未知的 ,由于樣本容量充分大,標(biāo)準(zhǔn)化變量由于樣本容量充分大,標(biāo)準(zhǔn)化變量Z*(統(tǒng)計(jì)量)將(統(tǒng)計(jì)量)將接近標(biāo)準(zhǔn)正態(tài)分布接近標(biāo)準(zhǔn)正態(tài)分布注意:這里的“ ”,表示“估計(jì)的”, 這時(shí)區(qū)間估
57、計(jì)的方式也可利用標(biāo)準(zhǔn)正態(tài)分布這時(shí)區(qū)間估計(jì)的方式也可利用標(biāo)準(zhǔn)正態(tài)分布只是這時(shí)只是這時(shí)65222*222222(0,1)()izNSEx2()zSE(3)當(dāng)總體方差)當(dāng)總體方差 未知,且樣本容量較小時(shí)未知,且樣本容量較小時(shí)方法:方法:用無(wú)偏估計(jì)用無(wú)偏估計(jì) 去代替未知的去代替未知的 ,由于樣本容量較小,由于樣本容量較小,“標(biāo)準(zhǔn)化變量標(biāo)準(zhǔn)化變量” t (統(tǒng)計(jì)量)不再(統(tǒng)計(jì)量)不再服從正態(tài)分布,而服從服從正態(tài)分布,而服從 t 分布。分布。這時(shí)可用這時(shí)可用 t 分布去建立參數(shù)估計(jì)的置信區(qū)間。選定分布去建立參數(shù)估計(jì)的置信區(qū)間。選定,查查 t 分布表得顯著性水平為分布表得顯著性水平為 ,自由度為,自由度為n-
58、2的臨界值的臨界值 (n-2) ,則有,則有即即 662222t222221()PttSE 2222222()()1PtSEtSE *222 (2)()tt nSE2例例1:研究某市城鎮(zhèn)居民人均鮮蛋需求量研究某市城鎮(zhèn)居民人均鮮蛋需求量Y(公斤公斤)與人均可支配收入與人均可支配收入X(元元,1980年不變價(jià)計(jì)年不變價(jià)計(jì))的關(guān)系的關(guān)系設(shè)定模型設(shè)定模型: : 1995-2005年樣本數(shù)據(jù):估計(jì)參數(shù):估計(jì)參數(shù):年份19951996199719981999200020012002200320042005Y14.414.414.414.717.016.318.018.518.219.317.1X847.3
59、821.0884.2903.7984.11035.31200.91289.81432.91539.01633.616.57,1142.89,11YXntttuXY21224489.940.005858661.8iiix yx1216.570.005 1142.8910.60YX10.600.005ttYX可決系數(shù)計(jì)算舉例可決系數(shù)計(jì)算舉例例例1:由前面的估計(jì)結(jié)果可計(jì)算出由前面的估計(jì)結(jié)果可計(jì)算出 由數(shù)據(jù)由數(shù)據(jù)Y 可計(jì)算出可計(jì)算出:則則222210.561134.03161 0.31030.6897iieryr 210.56ie 22()34.0316iiYYy估計(jì)結(jié)果估計(jì)結(jié)果:估計(jì)估計(jì) :給定給定
60、 查查df=9df=9的的t t分布臨界值分布臨界值參數(shù)區(qū)間估計(jì)參數(shù)區(qū)間估計(jì):692210.561.1736211 2ien05. 0262. 2)9(025. 0t10.600.005ttYX2222222()()1PtSEtSE 05. 01001. 0262. 2005. 0001. 0262. 2005. 02P95. 0)0073. 00027. 0(2P221.1736()0.001858661.8iSEx2703、回歸系數(shù)的假設(shè)檢驗(yàn)?zāi)康模耗康模汉?jiǎn)單線(xiàn)性回歸中,檢驗(yàn)簡(jiǎn)單線(xiàn)性回歸中,檢驗(yàn)X對(duì)對(duì)Y是否有顯著影響是否有顯著影響(1 1)假設(shè)檢驗(yàn)的基本思想)假設(shè)檢驗(yàn)的基本思想 在某種條件下
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 城市公園安全隱患排查工作計(jì)劃
- 上海職捷倉(cāng)儲(chǔ)設(shè)備有限公司介紹企業(yè)發(fā)展分析報(bào)告
- 中國(guó)電動(dòng)測(cè)井絞車(chē)行業(yè)市場(chǎng)前景預(yù)測(cè)及投資價(jià)值評(píng)估分析報(bào)告
- 職業(yè)培訓(xùn)講師年度工作計(jì)劃范文
- 2025年幼兒園社會(huì)實(shí)踐活動(dòng)計(jì)劃范文
- 北京百?gòu)N恒安廚房設(shè)備有限公司企業(yè)信用報(bào)告
- 胰腺癌晚期體征護(hù)理
- 疝氣的治療及護(hù)理常規(guī)
- 動(dòng)畫(huà)制作團(tuán)隊(duì)成員及其職責(zé)介紹
- 建筑工地保安巡邏職責(zé)
- 廣西壯族自治區(qū)2025屆高三下學(xué)期一模英語(yǔ)試題(解析版)
- 育兒嫂簽合同協(xié)議
- 【7語(yǔ)期中】合肥市包河區(qū)2024-2025學(xué)年七年級(jí)下學(xué)期4月期中語(yǔ)文試題
- (三診)成都市2022級(jí)高中高三畢業(yè)班第三次診斷性檢物理試卷(含答案)
- 香港借貸合同協(xié)議
- 酒店消防安全知識(shí)培訓(xùn)
- 書(shū)法中考試題及答案
- 經(jīng)營(yíng)崗位筆試題目及答案
- 農(nóng)行反洗錢(qián)與制裁合規(guī)知識(shí)競(jìng)賽考試題庫(kù)大全-上下
- DGTJ08-202-2020鉆孔灌注樁施工規(guī)程 上海市
- 充電樁基本知識(shí)課件
評(píng)論
0/150
提交評(píng)論