多重共線性的發(fā)現(xiàn)和檢驗(yàn)課件_第1頁
多重共線性的發(fā)現(xiàn)和檢驗(yàn)課件_第2頁
多重共線性的發(fā)現(xiàn)和檢驗(yàn)課件_第3頁
多重共線性的發(fā)現(xiàn)和檢驗(yàn)課件_第4頁
多重共線性的發(fā)現(xiàn)和檢驗(yàn)課件_第5頁
已閱讀5頁,還剩75頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第八章多重共線性1第八章多重共線性1第一節(jié)多重共線性及其影響第二節(jié)多重共線性的發(fā)現(xiàn)和檢驗(yàn)第三節(jié)多重共線性的克服和處理本章結(jié)構(gòu)2第一節(jié)多重共線性及其影響本章結(jié)構(gòu)2第一節(jié)多重共線形及其影響一、多重共線形及其分類二、嚴(yán)格多重共線形及其危害三、近似多重共線形的原因及其影響3第一節(jié)多重共線形及其影響一、多重共線形及其分類3一、多重共線性及其分類多元線性回歸模型要求解釋變量之間不存在線性關(guān)系,包括嚴(yán)格的線性關(guān)系和高度的近似線性關(guān)系。但事實(shí)上由于模型設(shè)定和數(shù)據(jù)等各方面的問題,模型的解釋變量之間很可能存在某種程度的線性關(guān)系。這時(shí)候稱多元線性回歸模型存在多重共線性問題。4一、多重共線性及其分類多元線性回歸模型要求解釋變量之間不存在多重共線性可以分為兩類。如果多元線性回歸模型中,存在兩個(gè)或多個(gè)解釋變量之間存在嚴(yán)格的線性關(guān)系,則稱為“完全多重共線性”,也稱為“嚴(yán)格的多重共線性”。而解釋變量之間存在近似的而不是嚴(yán)格的線性關(guān)系,這種情況被稱為“近似多重共線性”。5多重共線性可以分為兩類。5二、嚴(yán)格多重共線形及其危害完全多重共線性不可能由于數(shù)據(jù)問題引起,通常是由于模型設(shè)定問題,把有嚴(yán)格聯(lián)系的變量引進(jìn)同一個(gè)模型,或者虛擬變量設(shè)置不當(dāng)引起的。設(shè)兩個(gè)解釋變量的線性回歸模型為:回歸方程為:6二、嚴(yán)格多重共線形及其危害完全多重共線性不可能由于數(shù)據(jù)問題引求參數(shù)最小二乘估計(jì)量的正規(guī)方程組為:其中、和分別是、和的離差。設(shè)和兩個(gè)變量之間有嚴(yán)格的線性關(guān)系,這個(gè)模型當(dāng)然就存在完全的多重共線性。

7求參數(shù)最小二乘估計(jì)量的正規(guī)方程組為:7此時(shí)也成立。把該關(guān)系式代入上述正規(guī)方程組中的第二式可得:得到:很顯然,這個(gè)方程與上述正規(guī)方程組的第一個(gè)方程是完全相同的。8此時(shí)也成立。把該關(guān)系式代入上述正規(guī)方程這意味著我們得到了包含兩個(gè)未知參數(shù)估計(jì)量的兩個(gè)相同的方程,這時(shí)該方程組有無窮組解而不是有唯一一組解。這實(shí)際上意味著被解釋變量究竟受哪些變量的影響變得很不清楚,變量關(guān)系是無法識(shí)別的。有完全多重共線性的多元線性回歸模型都無法順利進(jìn)行參數(shù)估計(jì),會(huì)使多元線性回歸模型參數(shù)估計(jì)失敗,回歸分析無法進(jìn)行。9這意味著我們得到了包含兩個(gè)未知參數(shù)估計(jì)量的兩個(gè)相同的方程,這完全多重共線性雖然破壞性很大,卻不是最需要擔(dān)心的問題。因?yàn)橥耆嘀毓簿€性是由于模型設(shè)定問題,把有嚴(yán)格聯(lián)系的變量引進(jìn)同一個(gè)模型,或者虛擬變量設(shè)置不當(dāng)引起的,因此只要在建模時(shí)適當(dāng)注意就可以避免。即使由于模型設(shè)定的疏忽使得模型存在完全多重共線性問題,也比較容易發(fā)現(xiàn)。因?yàn)閰?shù)估計(jì)失效馬上會(huì)提示我們這方面的問題。10完全多重共線性雖然破壞性很大,卻不是最需要擔(dān)心的問題。10完全多重共線性問題的處理也比較簡(jiǎn)單,只需要針對(duì)性地修改模型,放棄、調(diào)整相互之間形成線性關(guān)系,導(dǎo)致完全多重共線性的部分解釋變量。注意一般不需要也不應(yīng)該放棄存在線性關(guān)系的全部變量,否則容易使模型失去意義。11完全多重共線性問題的處理也比較簡(jiǎn)單,只需要針對(duì)性地修改模型,三、近似多重共線形的原因及其影響近似多重共線性既與變量選擇有關(guān),也與數(shù)據(jù)有關(guān)。雖然解釋變量的選擇不當(dāng),把內(nèi)在相關(guān)性較強(qiáng)的變量引進(jìn)同一個(gè)模型,是導(dǎo)致近似多重共線性的重要原因,但近似多重共線性更經(jīng)常的原因是經(jīng)濟(jì)數(shù)據(jù)的共同趨勢(shì)。12三、近似多重共線形的原因及其影響近似多重共線性既與變量選擇有近似多重共線性不會(huì)導(dǎo)致參數(shù)估計(jì)失效,最小二乘參數(shù)估計(jì)能夠得到唯一解。在模型存在近似多重共線性的情況下,參數(shù)的最小二乘估計(jì)不僅仍然是唯一存在的,而且仍然是最小方差線性無偏估計(jì)。但問題是當(dāng)存在比較嚴(yán)重的近似多重共線性問題時(shí),參數(shù)估計(jì)方差的絕對(duì)水平可能并不小,而且會(huì)隨著多重共線性程度的提高急劇上升。13近似多重共線性不會(huì)導(dǎo)致參數(shù)估計(jì)失效,最小二乘參數(shù)估計(jì)能夠得到如果用記變量的離差平方和,記變量對(duì)其余個(gè)解釋變量的回歸平方和,表示原模型第k個(gè)解釋變量對(duì)其余個(gè)解釋變量回歸的決定系數(shù),那么的方差可以寫成:14如果用記變量的離差平方和,記變量如果第k個(gè)解釋變量與其余個(gè)解釋變量完全沒有相關(guān)性,那么,。

當(dāng)?shù)趉個(gè)解釋變量與其他解釋變量之間有相關(guān)性時(shí),。當(dāng)?shù)趉個(gè)解釋變量與其他解釋變量之間有很強(qiáng)的相關(guān)性,也就是模型存在很強(qiáng)的近似多重共線性時(shí),接近1,此時(shí)的方差會(huì)變得非常大。

15如果第k個(gè)解釋變量與其余個(gè)解釋變量完全沒有相關(guān)參數(shù)估計(jì)量方差的增大,必然導(dǎo)致參數(shù)估計(jì)的不穩(wěn)定性提高,容易出現(xiàn)參數(shù)符號(hào)和數(shù)值大小的異常情況,從而使最小二乘估計(jì)的有效性受到很大影響。多重共線性正是通過這樣的機(jī)制,對(duì)多元線性回歸模型的最小二乘估計(jì)產(chǎn)生不利影響,其后果常表現(xiàn)為參數(shù)估計(jì)不穩(wěn)定,數(shù)據(jù)的很小變化會(huì)引起參數(shù)估計(jì)值的較大變化,而且參數(shù)估計(jì)的異常值增多,包括顯著性水平不符合實(shí)際,或反映解釋變量作用方向的符號(hào)相反等。16參數(shù)估計(jì)量方差的增大,必然導(dǎo)致參數(shù)估計(jì)的不穩(wěn)定性提高,容易出近似多重共線性表現(xiàn)形式和原因的多樣性,數(shù)據(jù)問題導(dǎo)致多重共線性的隱蔽性,使得近似多重共線性的發(fā)現(xiàn)、判斷和處理也比較困難。正是因?yàn)檫@些原因,近似多重共線性是我們重點(diǎn)關(guān)心的問題,在多數(shù)情況下多重共線性指的就是近似多重共線性。17近似多重共線性表現(xiàn)形式和原因的多樣性,數(shù)據(jù)問題導(dǎo)致多重共線性第二節(jié)多重共線性的發(fā)現(xiàn)和檢驗(yàn)多重共線性的根源是解釋變量之間的相關(guān)性,因此分析解釋變量之間的相關(guān)性,進(jìn)行單相關(guān)或多元相關(guān)性的分析檢驗(yàn),是發(fā)現(xiàn)和判斷多重共線性問題的基本方法。當(dāng)然,解釋變量之間總是有不同程度相關(guān)性的,因此要認(rèn)定模型確實(shí)存在較嚴(yán)重、必須處理的共線性問題,必須結(jié)合參數(shù)估計(jì)的符號(hào)、大小和顯著性等是否異常,或者參數(shù)估計(jì)是否表現(xiàn)出很大不穩(wěn)定性(可通過改變少量數(shù)據(jù)檢驗(yàn))等進(jìn)行判斷。18第二節(jié)多重共線性的發(fā)現(xiàn)和檢驗(yàn)多重共線性的根源是解釋變量之間因?yàn)槎嘀毓簿€性是通過對(duì)參數(shù)估計(jì)方差的放大作用對(duì)多元線性回歸產(chǎn)生不利影響的,而解釋變量的共線性程度與參數(shù)估計(jì)量方差的大小有一致性,因此可以根據(jù)參數(shù)估計(jì)方差被“放大”的程度,判斷模型是否存在多重共線性問題,以及是由哪些變量引起的共線性問題。以參數(shù)估計(jì)為例。的方差為:

19因?yàn)槎嘀毓簿€性是通過對(duì)參數(shù)估計(jì)方差的放大作用對(duì)多元線性回歸產(chǎn)而中的因子,正是第k個(gè)解釋變量與其他解釋變量之間的相關(guān)性導(dǎo)致方差擴(kuò)大的倍數(shù)。我們把這個(gè)因子稱為“方差擴(kuò)大因子”,記為:

這個(gè)方差擴(kuò)大因子正是反映各個(gè)解釋變量與其他變量之間的相關(guān)性,對(duì)參數(shù)估計(jì)方差和模型有效性影響程度的關(guān)鍵指標(biāo),可以用來檢驗(yàn)多重共線性的存在以及根源。20而中的因子,正這種檢驗(yàn)方法稱為“方差擴(kuò)大因子檢驗(yàn)”,是檢驗(yàn)多重共線性的常用方法。通常以方差擴(kuò)大因子是否大于10,即是否大于0.9,或第k個(gè)解釋變量是否90%以上由其他解釋變量反映,作為判斷k個(gè)解釋變量是否存在必須加以處理的多重共線性的標(biāo)準(zhǔn)。事實(shí)上,當(dāng)解釋變量之間存在嚴(yán)重的共線性問題時(shí),相關(guān)變量的方差擴(kuò)大因子常常會(huì)達(dá)到幾十、上百甚至更大。例8-1。詳見Eviews演示。21這種檢驗(yàn)方法稱為“方差擴(kuò)大因子檢驗(yàn)”,是檢驗(yàn)多重共線性的常用第三節(jié)多重共線性的克服和處理一、增加樣本容量二、差分模型三、模型修正四、分布估計(jì)參數(shù)22第三節(jié)多重共線性的克服和處理一、增加樣本容量22一、增加樣本容量由于近似多重共線性意味著對(duì)任意i都必須成立,因此若樣本容量較小,近似多重共線性的可能性就較大,若樣本容量大,多重共線性的可能性就越小,因此增加樣本容量常能降低解釋變量之間的多重共線性。增加樣本容量是理論上降低多重共線性最簡(jiǎn)便的方法之一。23一、增加樣本容量由于近似多重共線性意味著增加樣本容量方法的缺陷首先是增加樣本容量并不必然降低多重共線性。事實(shí)上如果所增加的數(shù)據(jù)與原來的數(shù)據(jù)有基本相同的性質(zhì),即也有類似的共線性,那么就完全起不到作用。其次在許多實(shí)際的計(jì)量經(jīng)濟(jì)分析中,數(shù)據(jù)數(shù)量會(huì)受到很大限制,增加樣本容量事實(shí)上無法實(shí)現(xiàn)。因此增加樣本容量的方法在解決多重共線性方面的作用是很有限的。24增加樣本容量方法的缺陷首先是增加樣本容量并不必然降低多重共線二、差分模型因?yàn)槎嘀毓簿€性往往是經(jīng)濟(jì)變量的共同變化趨勢(shì)引起的,差分變換常常能使數(shù)據(jù)中趨勢(shì)性部分的比重降低,波動(dòng)和變化部分的比重加強(qiáng),從而降低多重共線性問題。例如線性回歸模型為:且已知和之間存在多重共線性問題。25二、差分模型因?yàn)槎嘀毓簿€性往往是經(jīng)濟(jì)變量的共同變化趨勢(shì)引起的如果我們對(duì)數(shù)據(jù)作如下的一階差分變換:那么和之間的共線性通常會(huì)比和之間的共線性程度低。26如果我們對(duì)數(shù)據(jù)作如下的一階差分變換:26因此若改用差分模型:進(jìn)行回歸,受多重共線性的影響通常會(huì)比較小。采用增長(zhǎng)率模型也能起到同樣的作用。需要注意的一個(gè)問題是,用差分模型解決多重共線性問題可能會(huì)導(dǎo)致誤差項(xiàng)出現(xiàn)序列相關(guān)。27因此若改用差分模型:27因?yàn)椴罘帜P偷恼`差項(xiàng)為,,所以相鄰兩個(gè)誤差項(xiàng)之間會(huì)有一定的相關(guān)性。當(dāng)然,如果原模型既有多重共線性問題,又有較強(qiáng)的一階正自相關(guān)性,那么差分方法也可能會(huì)同時(shí)解決這兩種問題。運(yùn)用差分模型往往還會(huì)使參數(shù)估計(jì)的方差擴(kuò)大,樣本信息也會(huì)有一些損失。28因?yàn)椴罘帜P偷恼`差項(xiàng)為,2三、模型修正由于近似多重共線性既是數(shù)據(jù)的問題,也是變量選擇和模型設(shè)定問題,因此修改模型設(shè)定,也是克服多重共線性問題的基本方法。修改模型的方法也有多種。29三、模型修正由于近似多重共線性既是數(shù)據(jù)的問題,也是變量選擇和1、刪減解釋變量引起多重共線性的直接原因之一,是在模型中引進(jìn)過多相似有內(nèi)在聯(lián)系的解釋變量,因此在根據(jù)方差擴(kuò)大因子等判斷導(dǎo)致共線性的變量中,如果刪減掉一些與其他解釋變量意義相近的變量,??善鸬接行Ы档投嘀毓簿€性的作用。例如資產(chǎn)和流動(dòng)資產(chǎn)兩個(gè)指標(biāo)之間,就常有較強(qiáng)的相關(guān)性,而且它們的意義也近似,因此同時(shí)引進(jìn)這兩個(gè)變量的線性回歸模型常會(huì)因它們而有共線性問題,放棄其中一個(gè)指標(biāo)往往能使共線性大大降低。301、刪減解釋變量引起多重共線性的直接原因之一,是在模型中引進(jìn)2、整合解釋變量以某種方式將經(jīng)濟(jì)意義相近、相關(guān)性較強(qiáng)的解釋變量整合成一個(gè)新變量,也是降低共線性的有效方法。當(dāng)然整合解釋變量要注意經(jīng)濟(jì)理論和實(shí)證的根據(jù),如加權(quán)的權(quán)重要符合經(jīng)濟(jì)理論、經(jīng)驗(yàn)結(jié)論,或者原模型回歸分析的試算結(jié)果等。312、整合解釋變量以某種方式將經(jīng)濟(jì)意義相近、相關(guān)性較強(qiáng)的解釋變3、先驗(yàn)信息參數(shù)約束如果有關(guān)于模型或者其中參數(shù)的某些“先驗(yàn)信息”,也可以利用來克服模型的多重共線性問題。例如已知生產(chǎn)函數(shù)為,經(jīng)過對(duì)數(shù)變換建立了線性回歸模型:因?yàn)閯趧?dòng)力和資本的增長(zhǎng)往往有同步性,因此上述模型往往有多重共線性問題。323、先驗(yàn)信息參數(shù)約束如果有關(guān)于模型或者其中參數(shù)的某些“先驗(yàn)信不過,有時(shí)候根據(jù)對(duì)經(jīng)濟(jì)的實(shí)證研究,能夠預(yù)先知道所研究的經(jīng)濟(jì)有規(guī)模報(bào)酬不變的性質(zhì),也就是上述模型中的參數(shù)和滿足。這種先驗(yàn)信息就可以用來克服多重共線性問題。把代入模型,有:33不過,有時(shí)候根據(jù)對(duì)經(jīng)濟(jì)的實(shí)證研究,能夠預(yù)先知道所研究的經(jīng)濟(jì)有整理可得:最后這個(gè)函數(shù)相當(dāng)于兩變量線性回歸模型,當(dāng)然不會(huì)有多重共線性問題。34整理可得:34四、分布估計(jì)參數(shù)利用先驗(yàn)信息修正模型克服多重共線性的方法很有啟發(fā)性。如果先用某種方法估計(jì)出模型中的部分參數(shù),就可以把它們作為先驗(yàn)信息簡(jiǎn)化模型,從而克服原模型的多重共線性問題。分步估計(jì)參數(shù)方法的典型應(yīng)用,是在時(shí)間序列數(shù)據(jù)模型中結(jié)合截面數(shù)據(jù)分析。35四、分布估計(jì)參數(shù)利用先驗(yàn)信息修正模型克服多重共線性的方法很有例如通常會(huì)考慮用模型:作為研究需求規(guī)律的模型。其中Q為消費(fèi)需求,可以是針對(duì)特定商品的,也可以指總的消費(fèi)需求,Y為可支配收入或收入,P為價(jià)格或價(jià)格指數(shù)。由于價(jià)格只有時(shí)間序列數(shù)據(jù),因此這種模型通常是分析時(shí)間序列數(shù)據(jù)規(guī)律的。但問題是Y和P兩個(gè)變量之間常常有共同的時(shí)間趨勢(shì),因此很容易存在共線性問題,從而影響回歸分析的可靠性。36例如通常會(huì)考慮用模型:36可以先利用截面數(shù)據(jù)得到模型中參數(shù)的估計(jì)值。例如通過調(diào)查得到不同收入組別居民在同一時(shí)點(diǎn)的平均需求,形成Q和Y的截面數(shù)據(jù)樣本,利用這些數(shù)據(jù)對(duì)兩變量模型進(jìn)行回歸分析,得到參數(shù)估計(jì)值。37可以先利用截面數(shù)據(jù)得到模型中參數(shù)的估計(jì)值。37雖然這個(gè)模型與前一個(gè)時(shí)間序列數(shù)據(jù)回歸模型不同,但這個(gè)模型的參數(shù)反映的在不同居民之間隨收入上升需求相應(yīng)上升的彈性,與前一個(gè)模型的參數(shù)反映的隨著人們收入增長(zhǎng)需求相應(yīng)增長(zhǎng)的彈性,是有一致性的。因此可以把的估計(jì)b作為前一個(gè)模型中的估計(jì)。38雖然這個(gè)模型與前一個(gè)時(shí)間序列數(shù)據(jù)回歸模型不同,但這個(gè)模型的參這樣前一個(gè)模型變?yōu)椋涸僬磉@個(gè)方程,可得這是一個(gè)兩變量線性回歸模型,當(dāng)然不會(huì)有多重共線性問題。39這樣前一個(gè)模型變?yōu)椋?9通過這個(gè)模型估計(jì)出和的估計(jì)值和,再結(jié)合用截面數(shù)據(jù)模型估的就得到了原模型克服了多重共線性困難的回歸直線:例8-2。詳見Eviews演示。40通過這個(gè)模型估計(jì)出和的估計(jì)值和,再第八章多重共線性41第八章多重共線性1第一節(jié)多重共線性及其影響第二節(jié)多重共線性的發(fā)現(xiàn)和檢驗(yàn)第三節(jié)多重共線性的克服和處理本章結(jié)構(gòu)42第一節(jié)多重共線性及其影響本章結(jié)構(gòu)2第一節(jié)多重共線形及其影響一、多重共線形及其分類二、嚴(yán)格多重共線形及其危害三、近似多重共線形的原因及其影響43第一節(jié)多重共線形及其影響一、多重共線形及其分類3一、多重共線性及其分類多元線性回歸模型要求解釋變量之間不存在線性關(guān)系,包括嚴(yán)格的線性關(guān)系和高度的近似線性關(guān)系。但事實(shí)上由于模型設(shè)定和數(shù)據(jù)等各方面的問題,模型的解釋變量之間很可能存在某種程度的線性關(guān)系。這時(shí)候稱多元線性回歸模型存在多重共線性問題。44一、多重共線性及其分類多元線性回歸模型要求解釋變量之間不存在多重共線性可以分為兩類。如果多元線性回歸模型中,存在兩個(gè)或多個(gè)解釋變量之間存在嚴(yán)格的線性關(guān)系,則稱為“完全多重共線性”,也稱為“嚴(yán)格的多重共線性”。而解釋變量之間存在近似的而不是嚴(yán)格的線性關(guān)系,這種情況被稱為“近似多重共線性”。45多重共線性可以分為兩類。5二、嚴(yán)格多重共線形及其危害完全多重共線性不可能由于數(shù)據(jù)問題引起,通常是由于模型設(shè)定問題,把有嚴(yán)格聯(lián)系的變量引進(jìn)同一個(gè)模型,或者虛擬變量設(shè)置不當(dāng)引起的。設(shè)兩個(gè)解釋變量的線性回歸模型為:回歸方程為:46二、嚴(yán)格多重共線形及其危害完全多重共線性不可能由于數(shù)據(jù)問題引求參數(shù)最小二乘估計(jì)量的正規(guī)方程組為:其中、和分別是、和的離差。設(shè)和兩個(gè)變量之間有嚴(yán)格的線性關(guān)系,這個(gè)模型當(dāng)然就存在完全的多重共線性。

47求參數(shù)最小二乘估計(jì)量的正規(guī)方程組為:7此時(shí)也成立。把該關(guān)系式代入上述正規(guī)方程組中的第二式可得:得到:很顯然,這個(gè)方程與上述正規(guī)方程組的第一個(gè)方程是完全相同的。48此時(shí)也成立。把該關(guān)系式代入上述正規(guī)方程這意味著我們得到了包含兩個(gè)未知參數(shù)估計(jì)量的兩個(gè)相同的方程,這時(shí)該方程組有無窮組解而不是有唯一一組解。這實(shí)際上意味著被解釋變量究竟受哪些變量的影響變得很不清楚,變量關(guān)系是無法識(shí)別的。有完全多重共線性的多元線性回歸模型都無法順利進(jìn)行參數(shù)估計(jì),會(huì)使多元線性回歸模型參數(shù)估計(jì)失敗,回歸分析無法進(jìn)行。49這意味著我們得到了包含兩個(gè)未知參數(shù)估計(jì)量的兩個(gè)相同的方程,這完全多重共線性雖然破壞性很大,卻不是最需要擔(dān)心的問題。因?yàn)橥耆嘀毓簿€性是由于模型設(shè)定問題,把有嚴(yán)格聯(lián)系的變量引進(jìn)同一個(gè)模型,或者虛擬變量設(shè)置不當(dāng)引起的,因此只要在建模時(shí)適當(dāng)注意就可以避免。即使由于模型設(shè)定的疏忽使得模型存在完全多重共線性問題,也比較容易發(fā)現(xiàn)。因?yàn)閰?shù)估計(jì)失效馬上會(huì)提示我們這方面的問題。50完全多重共線性雖然破壞性很大,卻不是最需要擔(dān)心的問題。10完全多重共線性問題的處理也比較簡(jiǎn)單,只需要針對(duì)性地修改模型,放棄、調(diào)整相互之間形成線性關(guān)系,導(dǎo)致完全多重共線性的部分解釋變量。注意一般不需要也不應(yīng)該放棄存在線性關(guān)系的全部變量,否則容易使模型失去意義。51完全多重共線性問題的處理也比較簡(jiǎn)單,只需要針對(duì)性地修改模型,三、近似多重共線形的原因及其影響近似多重共線性既與變量選擇有關(guān),也與數(shù)據(jù)有關(guān)。雖然解釋變量的選擇不當(dāng),把內(nèi)在相關(guān)性較強(qiáng)的變量引進(jìn)同一個(gè)模型,是導(dǎo)致近似多重共線性的重要原因,但近似多重共線性更經(jīng)常的原因是經(jīng)濟(jì)數(shù)據(jù)的共同趨勢(shì)。52三、近似多重共線形的原因及其影響近似多重共線性既與變量選擇有近似多重共線性不會(huì)導(dǎo)致參數(shù)估計(jì)失效,最小二乘參數(shù)估計(jì)能夠得到唯一解。在模型存在近似多重共線性的情況下,參數(shù)的最小二乘估計(jì)不僅仍然是唯一存在的,而且仍然是最小方差線性無偏估計(jì)。但問題是當(dāng)存在比較嚴(yán)重的近似多重共線性問題時(shí),參數(shù)估計(jì)方差的絕對(duì)水平可能并不小,而且會(huì)隨著多重共線性程度的提高急劇上升。53近似多重共線性不會(huì)導(dǎo)致參數(shù)估計(jì)失效,最小二乘參數(shù)估計(jì)能夠得到如果用記變量的離差平方和,記變量對(duì)其余個(gè)解釋變量的回歸平方和,表示原模型第k個(gè)解釋變量對(duì)其余個(gè)解釋變量回歸的決定系數(shù),那么的方差可以寫成:54如果用記變量的離差平方和,記變量如果第k個(gè)解釋變量與其余個(gè)解釋變量完全沒有相關(guān)性,那么,。

當(dāng)?shù)趉個(gè)解釋變量與其他解釋變量之間有相關(guān)性時(shí),。當(dāng)?shù)趉個(gè)解釋變量與其他解釋變量之間有很強(qiáng)的相關(guān)性,也就是模型存在很強(qiáng)的近似多重共線性時(shí),接近1,此時(shí)的方差會(huì)變得非常大。

55如果第k個(gè)解釋變量與其余個(gè)解釋變量完全沒有相關(guān)參數(shù)估計(jì)量方差的增大,必然導(dǎo)致參數(shù)估計(jì)的不穩(wěn)定性提高,容易出現(xiàn)參數(shù)符號(hào)和數(shù)值大小的異常情況,從而使最小二乘估計(jì)的有效性受到很大影響。多重共線性正是通過這樣的機(jī)制,對(duì)多元線性回歸模型的最小二乘估計(jì)產(chǎn)生不利影響,其后果常表現(xiàn)為參數(shù)估計(jì)不穩(wěn)定,數(shù)據(jù)的很小變化會(huì)引起參數(shù)估計(jì)值的較大變化,而且參數(shù)估計(jì)的異常值增多,包括顯著性水平不符合實(shí)際,或反映解釋變量作用方向的符號(hào)相反等。56參數(shù)估計(jì)量方差的增大,必然導(dǎo)致參數(shù)估計(jì)的不穩(wěn)定性提高,容易出近似多重共線性表現(xiàn)形式和原因的多樣性,數(shù)據(jù)問題導(dǎo)致多重共線性的隱蔽性,使得近似多重共線性的發(fā)現(xiàn)、判斷和處理也比較困難。正是因?yàn)檫@些原因,近似多重共線性是我們重點(diǎn)關(guān)心的問題,在多數(shù)情況下多重共線性指的就是近似多重共線性。57近似多重共線性表現(xiàn)形式和原因的多樣性,數(shù)據(jù)問題導(dǎo)致多重共線性第二節(jié)多重共線性的發(fā)現(xiàn)和檢驗(yàn)多重共線性的根源是解釋變量之間的相關(guān)性,因此分析解釋變量之間的相關(guān)性,進(jìn)行單相關(guān)或多元相關(guān)性的分析檢驗(yàn),是發(fā)現(xiàn)和判斷多重共線性問題的基本方法。當(dāng)然,解釋變量之間總是有不同程度相關(guān)性的,因此要認(rèn)定模型確實(shí)存在較嚴(yán)重、必須處理的共線性問題,必須結(jié)合參數(shù)估計(jì)的符號(hào)、大小和顯著性等是否異常,或者參數(shù)估計(jì)是否表現(xiàn)出很大不穩(wěn)定性(可通過改變少量數(shù)據(jù)檢驗(yàn))等進(jìn)行判斷。58第二節(jié)多重共線性的發(fā)現(xiàn)和檢驗(yàn)多重共線性的根源是解釋變量之間因?yàn)槎嘀毓簿€性是通過對(duì)參數(shù)估計(jì)方差的放大作用對(duì)多元線性回歸產(chǎn)生不利影響的,而解釋變量的共線性程度與參數(shù)估計(jì)量方差的大小有一致性,因此可以根據(jù)參數(shù)估計(jì)方差被“放大”的程度,判斷模型是否存在多重共線性問題,以及是由哪些變量引起的共線性問題。以參數(shù)估計(jì)為例。的方差為:

59因?yàn)槎嘀毓簿€性是通過對(duì)參數(shù)估計(jì)方差的放大作用對(duì)多元線性回歸產(chǎn)而中的因子,正是第k個(gè)解釋變量與其他解釋變量之間的相關(guān)性導(dǎo)致方差擴(kuò)大的倍數(shù)。我們把這個(gè)因子稱為“方差擴(kuò)大因子”,記為:

這個(gè)方差擴(kuò)大因子正是反映各個(gè)解釋變量與其他變量之間的相關(guān)性,對(duì)參數(shù)估計(jì)方差和模型有效性影響程度的關(guān)鍵指標(biāo),可以用來檢驗(yàn)多重共線性的存在以及根源。60而中的因子,正這種檢驗(yàn)方法稱為“方差擴(kuò)大因子檢驗(yàn)”,是檢驗(yàn)多重共線性的常用方法。通常以方差擴(kuò)大因子是否大于10,即是否大于0.9,或第k個(gè)解釋變量是否90%以上由其他解釋變量反映,作為判斷k個(gè)解釋變量是否存在必須加以處理的多重共線性的標(biāo)準(zhǔn)。事實(shí)上,當(dāng)解釋變量之間存在嚴(yán)重的共線性問題時(shí),相關(guān)變量的方差擴(kuò)大因子常常會(huì)達(dá)到幾十、上百甚至更大。例8-1。詳見Eviews演示。61這種檢驗(yàn)方法稱為“方差擴(kuò)大因子檢驗(yàn)”,是檢驗(yàn)多重共線性的常用第三節(jié)多重共線性的克服和處理一、增加樣本容量二、差分模型三、模型修正四、分布估計(jì)參數(shù)62第三節(jié)多重共線性的克服和處理一、增加樣本容量22一、增加樣本容量由于近似多重共線性意味著對(duì)任意i都必須成立,因此若樣本容量較小,近似多重共線性的可能性就較大,若樣本容量大,多重共線性的可能性就越小,因此增加樣本容量常能降低解釋變量之間的多重共線性。增加樣本容量是理論上降低多重共線性最簡(jiǎn)便的方法之一。63一、增加樣本容量由于近似多重共線性意味著增加樣本容量方法的缺陷首先是增加樣本容量并不必然降低多重共線性。事實(shí)上如果所增加的數(shù)據(jù)與原來的數(shù)據(jù)有基本相同的性質(zhì),即也有類似的共線性,那么就完全起不到作用。其次在許多實(shí)際的計(jì)量經(jīng)濟(jì)分析中,數(shù)據(jù)數(shù)量會(huì)受到很大限制,增加樣本容量事實(shí)上無法實(shí)現(xiàn)。因此增加樣本容量的方法在解決多重共線性方面的作用是很有限的。64增加樣本容量方法的缺陷首先是增加樣本容量并不必然降低多重共線二、差分模型因?yàn)槎嘀毓簿€性往往是經(jīng)濟(jì)變量的共同變化趨勢(shì)引起的,差分變換常常能使數(shù)據(jù)中趨勢(shì)性部分的比重降低,波動(dòng)和變化部分的比重加強(qiáng),從而降低多重共線性問題。例如線性回歸模型為:且已知和之間存在多重共線性問題。65二、差分模型因?yàn)槎嘀毓簿€性往往是經(jīng)濟(jì)變量的共同變化趨勢(shì)引起的如果我們對(duì)數(shù)據(jù)作如下的一階差分變換:那么和之間的共線性通常會(huì)比和之間的共線性程度低。66如果我們對(duì)數(shù)據(jù)作如下的一階差分變換:26因此若改用差分模型:進(jìn)行回歸,受多重共線性的影響通常會(huì)比較小。采用增長(zhǎng)率模型也能起到同樣的作用。需要注意的一個(gè)問題是,用差分模型解決多重共線性問題可能會(huì)導(dǎo)致誤差項(xiàng)出現(xiàn)序列相關(guān)。67因此若改用差分模型:27因?yàn)椴罘帜P偷恼`差項(xiàng)為,,所以相鄰兩個(gè)誤差項(xiàng)之間會(huì)有一定的相關(guān)性。當(dāng)然,如果原模型既有多重共線性問題,又有較強(qiáng)的一階正自相關(guān)性,那么差分方法也可能會(huì)同時(shí)解決這兩種問題。運(yùn)用差分模型往往還會(huì)使參數(shù)估計(jì)的方差擴(kuò)大,樣本信息也會(huì)有一些損失。68因?yàn)椴罘帜P偷恼`差項(xiàng)為,2三、模型修正由于近似多重共線性既是數(shù)據(jù)的問題,也是變量選擇和模型設(shè)定問題,因此修改模型設(shè)定,也是克服多重共線性問題的基本方法。修改模型的方法也有多種。69三、模型修正由于近似多重共線性既是數(shù)據(jù)的問題,也是變量選擇和1、刪減解釋變量引起多重共線性的直接原因之一,是在模型中引進(jìn)過多相似有內(nèi)在聯(lián)系的解釋變量,因此在根據(jù)方差擴(kuò)大因子等判斷導(dǎo)致共線性的變量中,如果刪減掉一些與其他解釋變量意義相近的變量,常可起到有效降低多重共線性的作用。例如資產(chǎn)和流動(dòng)資產(chǎn)兩個(gè)指標(biāo)之間,就常有較強(qiáng)的相關(guān)性,而且它們的意義也近似,因此同時(shí)引進(jìn)這兩個(gè)變量的線性回歸模型常會(huì)因它們而有共線性問題,放棄其中一個(gè)指標(biāo)往往能使共線性大大降低。701、刪減解釋變量引起多重共線性的直接原因之一,是在模型中引進(jìn)2、整合解釋變量以某種方式將經(jīng)濟(jì)意義相近、相關(guān)性較強(qiáng)的解釋變量整合成一個(gè)新變量,也是降低共線性的有效方法。當(dāng)然整合解釋變量要注意經(jīng)濟(jì)理論和實(shí)證的根據(jù),如加權(quán)的權(quán)重要符合經(jīng)濟(jì)理論、經(jīng)驗(yàn)結(jié)論,或者原模型回歸分析的試算結(jié)果等。712、整合解釋變量以某種方式將經(jīng)濟(jì)意義相近、相關(guān)性較強(qiáng)的解釋變3、先驗(yàn)信息參數(shù)約束如果有關(guān)于模型或

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論