多元線性回歸模型檢驗(yàn)_第1頁(yè)
多元線性回歸模型檢驗(yàn)_第2頁(yè)
多元線性回歸模型檢驗(yàn)_第3頁(yè)
多元線性回歸模型檢驗(yàn)_第4頁(yè)
多元線性回歸模型檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章多元線性回歸模型檢驗(yàn)擬合優(yōu)度檢驗(yàn)方程的顯著性檢驗(yàn)(總參數(shù)的F檢驗(yàn))變量的顯著性檢驗(yàn)(單參數(shù)的t檢驗(yàn))構(gòu)造置信區(qū)間3.2擬合優(yōu)度檢驗(yàn)可決系數(shù)與調(diào)整的可決系數(shù)1.總離差平方和的分解觀測(cè)值對(duì)均值的分散程度、偏離程度擬合值對(duì)均值的分散程度、偏離程度觀測(cè)值對(duì)擬合值的分散程度、偏離程度由于=0所以有:

有意思的是:條件:模型必須有截距項(xiàng)2.可決系數(shù)該統(tǒng)計(jì)量越接近于1,模型的擬合優(yōu)度越高。

問(wèn)題:

在應(yīng)用過(guò)程中發(fā)現(xiàn),如果在模型中增加一個(gè)解釋變量,R2往往增大(?)這就給人一個(gè)錯(cuò)覺(jué):要使得模型擬合得好,只要增加解釋變量即可。

但是,現(xiàn)實(shí)情況往往是,由增加解釋變量個(gè)數(shù)引起的R2的增大與擬合好壞無(wú)關(guān),R2需調(diào)整。3.調(diào)整的可決系數(shù)

在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個(gè)數(shù)對(duì)擬合優(yōu)度的影響:其中:n-k為殘差平方和的自由度,n-1為總體平方和的自由度。一、方程的顯著性檢驗(yàn)(F檢驗(yàn))

方程的顯著性檢驗(yàn),旨在對(duì)模型中被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。

1、檢驗(yàn)假設(shè)

即檢驗(yàn)?zāi)P蚘=1+2X2++kXk+中的參數(shù)i是否顯著不為0。

可提出如下原假設(shè)與備擇假設(shè):

H0:2=3==k=0H1:i不全為03.3統(tǒng)計(jì)推斷

F檢驗(yàn)的思想來(lái)自于總離差平方和的分解式:

TSS=ESS+RSS

如果這個(gè)比值較大,則X的聯(lián)合體對(duì)Y的解釋程度高,可認(rèn)為總體存在線性關(guān)系,反之總體上可能不存在線性關(guān)系。

因此,可通過(guò)該比值的大小對(duì)總體線性關(guān)系進(jìn)行推斷。

根據(jù)數(shù)理統(tǒng)計(jì)學(xué)中的知識(shí),在原假設(shè)H0成立的條件下,統(tǒng)計(jì)量

服從自由度為(k-1,n-k)的F分布

給定顯著性水平,可得到臨界值F(k-1,n-k),由樣本求出統(tǒng)計(jì)量F的數(shù)值,通過(guò)F

F(k-1,n-k)或FF(k-1,n-k)來(lái)拒絕或不能拒絕原假設(shè)H0,以判定原方程總體上的線性關(guān)系是否顯著成立。2.檢驗(yàn)統(tǒng)計(jì)量~

p值檢驗(yàn)法為了方便起見(jiàn),將F統(tǒng)計(jì)量的值記為F0計(jì)算p=P{F>F0}稱為p值(p-value)如果p>,則p/2>/2,F(xiàn)0落入不能拒絕域,不能拒絕H0,如果p<,落入拒絕域,應(yīng)拒絕H0。準(zhǔn)則:當(dāng)P值小于顯著性水平時(shí),方程在給定顯著性水平下是顯著的當(dāng)P值大于顯著性水平時(shí),方程在給定顯著性水平下是不顯著的。F0F不能拒絕域拒絕域3.關(guān)于于擬合優(yōu)優(yōu)度檢驗(yàn)驗(yàn)與方程程顯著性性檢驗(yàn)的的關(guān)系由與可推出或二、變量量的顯著著性檢驗(yàn)驗(yàn)(t檢檢驗(yàn))

方程的總體線性關(guān)系顯著每個(gè)解釋變量對(duì)被解釋變量的影響都是顯著的

因此,必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn),以決定是否作為解釋變量被保留在模型中。這一檢驗(yàn)是由對(duì)變量的t檢驗(yàn)完成的。1.

檢驗(yàn)假設(shè)H0:i=0

(i=1,2…k)

H1:i0

2.檢驗(yàn)統(tǒng)計(jì)計(jì)量(1)t變量其中~(2)t檢驗(yàn)驗(yàn)統(tǒng)計(jì)量量

給定顯著性水平,可得到臨界值t/2(n-k),由樣本求出統(tǒng)計(jì)量t的數(shù)值,通過(guò)|t|

t/2(n-k)或|t|t/2(n-k)來(lái)拒絕或不能拒絕原假設(shè)H0,從而判定對(duì)應(yīng)的解釋變量是否應(yīng)包括在模型中。

3.判斷**關(guān)于P值:以t統(tǒng)計(jì)量的觀測(cè)值作為臨界值,并計(jì)算該檢驗(yàn)的響應(yīng)顯著水平,這就是P值。若H0為真,則~P值檢驗(yàn)法法(p-valuetest)p值的概念念:為了方便便,將t統(tǒng)統(tǒng)計(jì)量的的值記為為計(jì)算p=P{||t|>t0}稱為p值(p-value))通常的計(jì)計(jì)量經(jīng)濟(jì)濟(jì)學(xué)軟件件都可自自動(dòng)計(jì)算算出p值如果p<,則p/2</2,,t0落入拒絕絕域,應(yīng)應(yīng)拒絕H00-t/2t/2/2/2不能拒絕H0拒絕H0拒絕H0t0p/2p/2當(dāng)P值小于等等于給定定顯著性性水平時(shí)時(shí),所研研究的解解釋變量量對(duì)被解解釋變量量的影響響在該顯顯著性水水平下是是顯著的的;當(dāng)P值大于給給定顯著著性水平平時(shí),所所研究的的解釋變變量對(duì)被被解釋變變量的影影響在該該顯著性性水平下下是顯著著的。4.兩兩類錯(cuò)誤誤H0真H0偽不拒H0對(duì)取偽Ⅱ拒H0拒真Ⅰ對(duì)Ⅰ:拒真真。把不不應(yīng)該引引入的變變量引入入模型,,導(dǎo)致多多列無(wú)關(guān)關(guān)變量,,造成雖雖然參數(shù)數(shù)估計(jì)值值是無(wú)偏偏,但標(biāo)標(biāo)準(zhǔn)差會(huì)會(huì)大。若不想犯犯第一類類錯(cuò)誤,,則顯著著水平需需要定得得小點(diǎn)。。Ⅱ:取偽偽。把不不該引入入的變量量引入模模型遺遺漏變量量造成參數(shù)數(shù)估計(jì)量量有偏。。三、參數(shù)數(shù)的置信信區(qū)間問(wèn)題的提出(1)區(qū)間誤差注意:不是先有區(qū)間,讓掉進(jìn)去,而是先有,再找個(gè)區(qū)間把它罩住。(2)置信置信度=把握程度比如,置信度=95%的意思是在100個(gè)區(qū)間里,有95個(gè)區(qū)間包括。2.的的置置信區(qū)間間對(duì)稱區(qū)間,中心是bk,半徑是如何才能能縮小置置信區(qū)間間?增大樣本容量n,因?yàn)樵谕瑯拥臉颖救萘肯?,n越大,t分布表中的臨界值越小,同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減??;提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型優(yōu)度越高,殘差平方和應(yīng)越小。提高樣本觀測(cè)值的分散度,一般情況下,樣本觀測(cè)值越分散,的分母的的值越大,致使區(qū)間縮小。F值R2P值調(diào)整的R2T值p值置信區(qū)間間系數(shù)回歸平方方和殘差平方方和總平方和和標(biāo)準(zhǔn)差Stata操操作命令行格格式:最最常用的的方法use““d:\data\auto.dta””,clear/*打開(kāi)開(kāi)數(shù)據(jù)庫(kù)庫(kù)*/regressyx1x2x3菜單格式式:Stata8以以后開(kāi)始始有菜單單選擇菜單單進(jìn)行操操作后,,在命令令欄里可可以看到到命令行行格式是是如何寫寫的。Stata操操作Stata的的主要功能數(shù)據(jù)管理:datamanagement統(tǒng)計(jì)功能:statistics作圖功能:graphics矩陣運(yùn)算:matrix程序設(shè)計(jì):programming數(shù)據(jù)管理作圖功能統(tǒng)計(jì)功能數(shù)據(jù)管理數(shù)據(jù)讀取編輯數(shù)據(jù)產(chǎn)生或改變變變量:gen,egen,保存數(shù)據(jù)庫(kù)數(shù)據(jù)集的重新新組織:reshape合并和添加數(shù)數(shù)據(jù):merge,appendLogusinge:\panelLogcloseTabulatet,gen(tdummy)xi:regcyi.t常見(jiàn)數(shù)據(jù)格式式Stata格格式:dta文本格式:txtExcel格格式:xls其它格式:sas、spss、gauss等讀取數(shù)據(jù)用use命令令調(diào)入數(shù)據(jù)::dta格式式數(shù)據(jù)use“d:\stata\data\auto.dta”,clearExcel格格式數(shù)據(jù)的讀取直接拷貝,粘粘貼到stata中使用Stattransfer把把其它格式的的數(shù)據(jù)轉(zhuǎn)成stata格格式的數(shù)據(jù)讀入ASCII格式數(shù)據(jù)據(jù)文件:比較較麻煩產(chǎn)生或改變變變量genreplaceegen(對(duì)gen的的擴(kuò)展,與一一些函數(shù)結(jié)合合使用,如mean,count,min,max等)產(chǎn)生虛擬變量量tabulatevid,gen(vdumy)Xi:regyx1x2i.vid變量的命名::性別:gender1=female,0=male不不好female1=female,0=male產(chǎn)生變量bysorthhid:genorder=_nbysorthhid:gennumber=_N_n:是產(chǎn)生生排序的數(shù)列列_N:產(chǎn)生總總數(shù)給數(shù)據(jù)或變量量加注釋Labeldata“Investment:cfliu2006”labelvariablev1"county“l(fā)abeldefine與labelvalues是一起起使用的。而而labelvariable是單獨(dú)使使用的。另外,比如有有個(gè)變量gender的值為為0和1,1表示male0表示female。。你如果用tablegenderx1,會(huì)發(fā)現(xiàn)是按按照01來(lái)顯示分類類的。你如果用了.labeldefinegendervalue0female1male.labelvaluesgendergendervalue在執(zhí)行tablegenderx1,則則是按照f(shuō)emale和和male來(lái)分類的的。但gender還是是原來(lái)的變量量類型,如原原來(lái)是數(shù)值型型,現(xiàn)在還是是。雖然listsex顯顯示為femalemale,但仍然可以以按照0或或1來(lái)操作.數(shù)據(jù)集的重新新組織reshapecollapsecollapse(mean)c,by(t)Thelong-longformThewide-yearlong-sexformThewide-wideformThelong-yearwide-sexformReshape命令詳細(xì)細(xì)解釋:包括括矩陣轉(zhuǎn)置等等Reshape命令*Fromlong-longformtolong-wideformreshapewide@inc,i(hidyear)j(sex)string*Fromlong-wideformtolong-longformreshapelong@inc,i(hidyear)j(sex)string*Fromlong-longformtowide-longformreshapewideinc,i(hidsex)j(year)*Fromwide-longformtolong-longformreshapelonginc,i(hidsex)j(year)*Fromlong-wideformtowide-wideformreshapewidemincfinc,i(hid)j(year)*Fromwide-wideformtolong-wideformreshapelongmincfinc,i(hid)j(year)*Fromwide-longformtowide-wideformreshapewide@inc90@inc91,i(hid)j(sex)string*Fromwide-wideformtowide-longformreshapelong@inc90@inc92,i(hid)j(sex)string@:如果變變量為字符型型,如sex的值為f和和m,要把inc變量生生成finc和minc,則需要用用@。outregusingtable1,coefastrpbdec(2)3asterreplaceoutregusingtable1,sebdec(2)3asterreplaceCollapse命令令產(chǎn)生新的數(shù)據(jù)據(jù)集collapse(統(tǒng)統(tǒng)計(jì)量)變變量,by(變量)collapse(mean)price,by(foreign)collapse(mean)mprice=price(sum)sprice=price,by(foreign)tableforeign,c(meanpricesumprice)replace統(tǒng)計(jì)功功能描述統(tǒng)統(tǒng)計(jì)交叉表表格估計(jì)描述統(tǒng)統(tǒng)計(jì)Sumx(如不不指定定x,,會(huì)把把庫(kù)里里所有有變量量都統(tǒng)統(tǒng)計(jì)出出來(lái)))Histogramx,normal作圖twoway(histogramc,title(“消消費(fèi)分分析””)xlabel(1000(500)6000)bfcolor(gs5))scattercytwoway(scattercy)(qfitcy)twoway(scattercy)(lfitcy)表格Table可可以以作四四維表表格tableforeign,c(npricemeanpricesdpricemaxpriceminprice)rowtableyearregiongender,c(meanpricesdpricemaxpriceminprice)by(agegroup)rowTabulatetabulatevid,gen(vidumy)tabulatevidgendertableyearif(vcode~=vcode[_n+1]|vcode~=vcode[_n-1])&vcow~=0,c(nvcode)do文文件件的編編寫編寫do文文件的的作用用記錄你你的操操作過(guò)過(guò)程減少命命令的的輸入入do文文件件的編編寫Stata中中的dofile編輯輯器其它的的軟件件:Textpad作圖twoway(histogramc,title(“消消費(fèi)分分析””)xlabel(1000(500)6000)bfcolor(gs5))scattercytwoway(scattercy)(qfitcy)twoway(scattercy)(lfitcy)其它一一些常常用命命令cleardropkeepsumdeslistIf條條件bysort變變量量outregreturnlistereturnlistOutreg生生成成像雜雜志那那樣的的表格格Outregusing文文件件名,coefastrpbdec(2)3asterreplaceOutregusing文文件件名,coefastrse3asterappendbdec(2):留留兩位位數(shù)Coefastr::給系系數(shù)加加星號(hào)號(hào)P:系系數(shù)下下面標(biāo)標(biāo)P值值Se::系系數(shù)數(shù)下面面標(biāo)標(biāo)標(biāo)準(zhǔn)誤誤差3aster::加加3個(gè)個(gè)星號(hào)號(hào),1%,,5%%,10%%。ereturnused:\stata\data\auto.dta,clearregmpgpriceforeignereturnlist產(chǎn)生滯滯后變變量genxlag==x[_n-1]bysortcode:genxlag=x[_n-1]滯后1期期:滯后2期期:genxlag2=x[_n-2]bysortcode:genxlag2==x[_n-2]發(fā)現(xiàn)重重復(fù)的的ID號(hào)和和變量量sortidlistifid==id[_n+1]bysortidscorex1x2y1y2:genn=_NListifn>1Duplicatesreport(variablename)Duplicateslist(variablename)Countifid==id[_n+1]檢查缺缺失值值nmissing變變量ifnpresent變變量ifnpresentx1x2ify==.調(diào)用數(shù)數(shù)據(jù)庫(kù)庫(kù)程序序講解解(E:\panel))9、靜夜四無(wú)鄰鄰,荒居舊業(yè)業(yè)貧。。12月-2212月-22Thursday,December29,202210、雨雨中中黃黃葉葉樹(shù)樹(shù),,燈燈下下白白頭頭人人。。。。12:15:0512:15:0512:1512/29/202212:15:05PM11、以我獨(dú)沈沈久,愧君君相見(jiàn)頻。。。12月-2212:15:0512:15Dec-2229-Dec-2212、故人江海別別,幾度隔山山川。。12:15:0512:15:0512:15Thursday,December29,202213、乍見(jiàn)翻翻疑夢(mèng),,相悲各各問(wèn)年。。。12月-2212月-2212:15:0512:15:05December29,202214、他他鄉(xiāng)鄉(xiāng)生生白白發(fā)發(fā),,舊舊國(guó)國(guó)見(jiàn)見(jiàn)青青山山。。。。29十十二二月月202212:15:05下下午午12:15:0512月月-2215、比不了得得就不比,,得不到的的就不要。。。。十二月2212:15下午12月-2212:15December29,202216、行行動(dòng)動(dòng)出出成成果果,,工工作作出出財(cái)財(cái)富富。。。。2022/12/2912:15:0512:15:0529December202217、做前前,能能夠環(huán)環(huán)視四四周;;做時(shí)時(shí),你你只能能或者者最好好沿著著以腳腳為起起點(diǎn)的的射線線向前前。。。12:15:05下下午午12:15下下午12:15:0512月月-229、沒(méi)有有失敗敗,只只有暫暫時(shí)停停止成成功!!。12月月-2212月月-22Thursday,December29,202210、很多事情情努力了未未必有結(jié)果果,但是不不努力卻什什么改變也也沒(méi)有。。。12:15:0512:15:0512:1512/29/202212:15:05PM11、成功就是是日復(fù)一日日那一點(diǎn)點(diǎn)點(diǎn)小小努力力的積累。。。12月-2212:15:0512:15Dec-2229-Dec-2212、世間成成事,不不求其絕絕對(duì)圓滿滿,留一一份不足足,可得得無(wú)限完完美。。。12:15:0512:15:0512:15Thursday,December29,202213、不知香積積寺,數(shù)里里入云峰。。。12月-2212月-2212:15:0512:15:05December29,202214、意志堅(jiān)強(qiáng)的的人能把世界界放在手中像像泥塊一樣任任意揉捏。29十二月月202212:15:05下午午12:15:0512月-2215、楚楚塞塞三三湘湘接接,,荊荊門門九九派派通通。。。。。十二二月月2212:15下下午午12月月-2212:15December29,202216、少少年年十十五五二二十十時(shí)時(shí),,步步行行奪奪得得胡胡馬馬騎騎。。。。2022/12/2912:15:0512:15:0529December202217、空山山新雨雨后,,天氣氣晚來(lái)來(lái)秋。。。12:15:05下下午午12:15下下午12:15:0512月月-229、楊柳散散和風(fēng),,青山澹澹吾慮。。。12月-2212月-22Thursday,December29,20221

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論