第五講 統(tǒng)計(jì)檢驗(yàn)及預(yù)測_第1頁
第五講 統(tǒng)計(jì)檢驗(yàn)及預(yù)測_第2頁
第五講 統(tǒng)計(jì)檢驗(yàn)及預(yù)測_第3頁
第五講 統(tǒng)計(jì)檢驗(yàn)及預(yù)測_第4頁
第五講 統(tǒng)計(jì)檢驗(yàn)及預(yù)測_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

回顧5、參數(shù)估計(jì)的最大似然法和矩法4、參數(shù)估計(jì)量的概率分布及隨機(jī)干擾項(xiàng)方差的估計(jì)思考:在5%的顯著性水平下,若通過樣本得到了置信區(qū)間一個,如何解釋?答:給定置信系數(shù)95%,從長遠(yuǎn)看,在類似于的固定區(qū)間含有真實(shí)值的概率不是1就是0。區(qū)間中,將有95個包含著真實(shí)的每100個的值;但這個特殊2.4一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)

2.5一元線性回歸分析的應(yīng)用:預(yù)測問題一、參數(shù)的區(qū)間估計(jì)二、擬合優(yōu)度檢驗(yàn)

三、變量的顯著性檢驗(yàn)

一、擬合優(yōu)度檢驗(yàn)二、變量的顯著性檢驗(yàn)三、條件均值與個別值的預(yù)測

一、擬合優(yōu)度檢驗(yàn)

擬合優(yōu)度檢驗(yàn):對樣本回歸直線與樣本觀測值之間擬合程度的檢驗(yàn)。

回答樣本回歸直線對樣本觀測點(diǎn)擬合的多么好的度量

度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R21、總離差平方和的分解

已知由一組樣本觀測值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線

Y的第i個觀測值可表述為如果Yi=?i即實(shí)際觀測值落在樣本回歸“線”上,則擬合最好??烧J(rèn)為,“離差”全部來自回歸線,而與“殘差”無關(guān)。

對于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和(兩邊取平方后求和),可以證明(P34頁結(jié)論):記總離差平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares

)TSS=ESS+RSS

Y的觀測值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機(jī)勢力(RSS)。在給定樣本中,TSS不變,如果實(shí)際觀測點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此

擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS2、可決系數(shù)R2統(tǒng)計(jì)量

稱R2為(樣本)可決系數(shù)/判定系數(shù)(coefficientofdetermination)。

可決系數(shù)的取值范圍:[0,1]。R2越接近1,說明實(shí)際觀測點(diǎn)離樣本線越近,擬合優(yōu)度越高。在例2.1.1的收入-消費(fèi)支出例中,

注:可決系數(shù)是一個非負(fù)的統(tǒng)計(jì)量。它也是隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在第3章中進(jìn)行。

擬合優(yōu)度0.9935說明X的變化可以解釋Y的99.35%的變化。關(guān)于可決系數(shù)的說明可決系數(shù)只是說明列入模型的所有解釋變量對被解釋變量的聯(lián)合的影響程度,不說明模型中各解釋變量的單獨(dú)的影響程度(在多元中)回歸分析的主要目的如果是經(jīng)濟(jì)結(jié)構(gòu)分析,不能只追求高的可決系數(shù),而是要得到總體回歸系數(shù)可信的估計(jì)量??蓻Q系數(shù)高并不一定每個系數(shù)都可信任。如果建模的目的只是為了預(yù)測被解釋變量的值,不是為了正確估計(jì)回歸系數(shù),一般可考慮有較高的可決系數(shù)。

二、變量的顯著性檢驗(yàn)

從擬合優(yōu)度中看出,擬合優(yōu)度越高,就說明樣本回歸線對觀測值的擬合就越好,但這只是推測,解釋變量對被解釋變量是否有顯著的線性影響需要我們?nèi)パ芯?,這就是變量的顯著性檢驗(yàn)。

回歸分析中,主要是針對變量前的參數(shù)真值是否為零來檢驗(yàn)。

1、假設(shè)檢驗(yàn)

先根據(jù)實(shí)際問題的要求提出一個論斷,稱為原假設(shè),然后根據(jù)樣本信息,看能得到什么結(jié)果,如果導(dǎo)致一個不合理的結(jié)果,拒絕原假設(shè)。判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的。注意這里的“接受和拒絕”

2、變量的顯著性檢驗(yàn)

如果變量X是顯著的,那么參數(shù)應(yīng)該顯著的不為0

檢驗(yàn)步驟:

(1)對總體參數(shù)提出假設(shè)H0:1=0,H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值(3)給定顯著性水平,查t分布表,得臨界值t/2(n-2)(4)比較,判斷若給定顯著性水平,則雙側(cè)檢驗(yàn)的臨界值為0t若|t|>t/2(n-2),則拒絕H0,接受H1;(小概率事件發(fā)生)若|t|

t/2(n-2),則接受H0;

對于一元線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn):

在上述收入-消費(fèi)支出例中,首先計(jì)算2的估計(jì)值

t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為:

給定顯著性水平=0.05,查t分布表得臨界值

t0.05/2(8)=2.306|t1|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費(fèi)支出的主要解釋變量;

|t0|>2.306,表明在95%的置信度下,拒絕截距項(xiàng)為零的假設(shè)。

92.34019.0670.0?1?11===bbSt20.345.4440.142?0?00-=-==bbSt一個“大”的是與虛擬假設(shè)相抵觸的跡象。觀察t分布表,當(dāng)自由度為20或更大時,計(jì)算的t值如果是2.5或3或更大,則我們就不需要再查閱t分布表以評定所估的參數(shù)的顯著性,它必定是要拒絕原假設(shè),即該變量通過了顯著性檢驗(yàn)。當(dāng)自由度小于20時,我們要查閱t分布表。注意1:注意2:顯著性水平—犯第一類錯誤的概率——拒絕了真值的假設(shè)的概率經(jīng)典假設(shè)檢驗(yàn)方法的痛處—選擇的武斷用精確的顯著性水平P值判斷參數(shù)的顯著性P值是根據(jù)既定的樣本數(shù)據(jù)所計(jì)算的統(tǒng)計(jì)量與相應(yīng)自由度下查到的臨界值比較,得到的臨界值和計(jì)算的統(tǒng)計(jì)量一樣大或者更大的概率——拒絕原假設(shè)的最小顯著性水平規(guī)則:時,值越小,越能拒絕原假設(shè)。如果數(shù)據(jù)不支持原假設(shè),則在原假設(shè)下得到的值將會很“大”,得到這樣一個的值的p值就很“小”。固定在一定的水平上將再回到區(qū)間估計(jì)給定顯著性水平整理可以得到的置信度下的置信區(qū)間是通過變量的顯著性檢驗(yàn),我們知道

由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。

要縮小置信區(qū)間,需

(1)增大樣本容量n,因?yàn)樵谕瑯拥闹眯潘较拢琻越大,t分布表中的臨界值越小

(2)提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小?;貧w分析結(jié)果的報(bào)告經(jīng)過模型的估計(jì)、檢驗(yàn),得到一系列重要的數(shù)據(jù),為了簡明、清晰、規(guī)范的表述這些數(shù)據(jù),計(jì)量經(jīng)濟(jì)學(xué)通常采用以下規(guī)范化的方式:標(biāo)準(zhǔn)誤差SE估計(jì)的t統(tǒng)計(jì)量可決系數(shù)和自由度F統(tǒng)計(jì)量DW統(tǒng)計(jì)量估計(jì)的樣本回歸函數(shù)計(jì)量經(jīng)濟(jì)預(yù)測是一種條件預(yù)測:模型設(shè)定的關(guān)系式不變所估計(jì)的參數(shù)不變解釋變量在預(yù)測期的取值已作出預(yù)測對被解釋變量的預(yù)測分為:平均值和個別值預(yù)測對被解釋變量的預(yù)測又分為點(diǎn)預(yù)測和區(qū)間預(yù)測預(yù)測的類型2.5一元線性回歸分析的應(yīng)用:預(yù)測問題預(yù)測值、平均值、個別值的關(guān)系PRFSRF點(diǎn)預(yù)測值真實(shí)平均值個別值是真實(shí)平均值預(yù)測值的點(diǎn)估計(jì),也是個別值預(yù)測值的點(diǎn)估計(jì)??傮w條件均值的區(qū)間估計(jì)必須找出與和都有關(guān)的統(tǒng)計(jì)量由于存在抽樣波動,預(yù)測的值不一定等于真實(shí)總體條件均值?;舅枷耄壕唧w做法:從的分布分析)))(1(,(~?2202F10F?-++ixXXnXNYsbb于是,在1-的置信度下,總體均值的置信區(qū)間為

個別預(yù)測值的置信區(qū)間基本思想:是真實(shí)平均值的點(diǎn)估計(jì),也是個別值的點(diǎn)估計(jì)。由于存在隨機(jī)擾動項(xiàng)的影響,Y的條件均值并不等于Y的個別值。為了對Y的個別值做區(qū)間預(yù)測,需要尋找與預(yù)測值和個別值有關(guān)的統(tǒng)計(jì)量,并要明確其概率分布。于是

具體做法:已知?dú)埐铐?xiàng)是與預(yù)測值和個別值都有關(guān)的變量,并且已知服從正態(tài)分布式中:從而在1-的置信度下,個別值Y0的置信區(qū)間為

被解釋變量點(diǎn)估計(jì)與區(qū)間估計(jì)的特點(diǎn)Y的總體條件均值的預(yù)測值與真實(shí)的總體條件均值有誤差,主要是受抽樣波動影響。

Y個別值的預(yù)測值與真實(shí)個別值的差異,不僅受抽樣波動影響,而且還受隨機(jī)擾動項(xiàng)的影響。總體條件均值和個別值的預(yù)測區(qū)間都不是常數(shù),是隨XF的變化而變化。預(yù)測區(qū)間上下限與樣本容量有關(guān),樣本容量n越大,預(yù)測精度越高,反之預(yù)測精度越低;當(dāng)樣本容量n趨近于無窮時,個別值的預(yù)測誤差只決定于隨機(jī)擾動項(xiàng)的方差。若對于前面的例子,我們得到了總體均值的95%的置信區(qū)間為

給定在重復(fù)抽樣中,每100個類似于(533.05,814.62)的區(qū)間將有95個包含著真實(shí)的均值。如何解釋?如果我們對每一個X值求類似于(533.05,814.62)的95%的置信區(qū)間,把這些區(qū)間的端點(diǎn)連接起來,我們就得到如圖所展示的一個關(guān)于總體回歸函數(shù)的置信帶。如果我們對每一個X值求類似于(372.03,975.6

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論