一元線性回歸統(tǒng)計檢驗_第1頁
一元線性回歸統(tǒng)計檢驗_第2頁
一元線性回歸統(tǒng)計檢驗_第3頁
一元線性回歸統(tǒng)計檢驗_第4頁
一元線性回歸統(tǒng)計檢驗_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2.3 一元線性回歸模型的統(tǒng)計檢驗 一、擬合優(yōu)度檢驗一、擬合優(yōu)度檢驗 二、變量的顯著性檢驗二、變量的顯著性檢驗 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 回歸分析是要通過樣本所估計的參數(shù)來代替總體的真實參數(shù),或者說是用樣本回歸線代替總體回歸線。 盡管從統(tǒng)計性質(zhì)統(tǒng)計性質(zhì)上已知,如果有足夠多的重復(fù) 抽樣,參數(shù)的估計值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計值不一定就等于該真值。 那么,在一次抽樣中,參數(shù)的估計值與真值的差異有多大,是否顯著,這就需要進一步進行統(tǒng)計檢驗統(tǒng)計檢驗。 主要包括擬合優(yōu)度檢驗擬合優(yōu)度檢驗、變量的顯著性檢驗顯著性檢驗及參數(shù)的區(qū)間估計區(qū)間估計。 一、擬合優(yōu)度檢驗 對

2、樣本回歸直線與樣本觀測值之間擬合程度的檢驗。 :判定系數(shù)判定系數(shù)(可決系數(shù))R2 2 問題:問題:采用普通最小二乘估計方法,已經(jīng)保證了模型最好地擬合了樣本觀測值,為什么還要檢驗擬合程度? 1 1、總離差平方和的分解、總離差平方和的分解 已知由一組樣本觀測值(Xi,Yi),i=1,2,n得到如下樣本回歸直線 iiXY10iiiiiiiyeYYYYYYy)()( 如果Yi=i 即實際觀測值落在樣本回歸“線”上,則擬合最好擬合最好??烧J為,“離差”全部來自回歸線,而與“殘差”無關(guān)。 對于所有樣本點,則需考慮這些點與樣本均值離差的平方和,可以證明:記22)(YYyTSSii總體平方和總體平方和(Tot

3、al Sum of Squares)22)(YYyESSii回歸平方和回歸平方和(Explained Sum of Squares)22)(iiiYYeRSS殘差平方和殘差平方和(Residual Sum of Squares )TSS=ESS+RSS Y的觀測值圍繞其均值的總離差總離差(total variation)可分解為兩部分:一部分來自回歸線一部分來自回歸線(ESS),另一部,另一部分則來自隨機勢力分則來自隨機勢力(RSS)。在給定樣本中,TSS不變, 如果實際觀測點離樣本回歸線越近,則ESS在TSS中占的比重越大,因此 擬合優(yōu)度擬合優(yōu)度:回歸平方和:回歸平方和ESS/YESS/Y的

4、總離差的總離差TSSTSSTSSRSSTSSESSR1記22、可決系數(shù)、可決系數(shù)R2 2統(tǒng)計量統(tǒng)計量 稱 R2 為(樣本)(樣本)可決系數(shù)可決系數(shù)/判定系數(shù)判定系數(shù)(coefficient of determination)。 可決系數(shù)可決系數(shù)的取值范圍取值范圍:0,1 R2 2越接近越接近1 1,說明實際觀測點離樣本線越近,擬,說明實際觀測點離樣本線越近,擬合優(yōu)度越高合優(yōu)度越高。在實際計算可決系數(shù)時,在1已經(jīng)估計出后: 22212iiyxR 在例2.1.1的收入收入-消費支出消費支出例中, 9766. 045900207425000)777. 0(222212iiyxR 注:可決系數(shù)注:可決

5、系數(shù)是一個非負的統(tǒng)計量。它也是是一個非負的統(tǒng)計量。它也是隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)隨著抽樣的不同而不同。為此,對可決系數(shù)的統(tǒng)計可靠性也應(yīng)進行檢驗,這將在第計可靠性也應(yīng)進行檢驗,這將在第3章中進行。章中進行。 二、變量的顯著性檢驗 回歸分析回歸分析是要判斷解釋變量解釋變量X是否是被解釋變被解釋變量量Y的一個顯著性的影響因素。 在一元線性模型一元線性模型中,就是要判斷X是否對Y具有顯著的線性性影響。這就需要進行變量的顯著變量的顯著性檢驗。性檢驗。 變量的顯著性檢驗所應(yīng)用的方法是數(shù)理統(tǒng)計變量的顯著性檢驗所應(yīng)用的方法是數(shù)理統(tǒng)計學(xué)中的學(xué)中的假設(shè)檢驗假設(shè)檢驗。 計量經(jīng)計學(xué)中計量經(jīng)計學(xué)中,主

6、要是針對變量的參數(shù)真值,主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的。是否為零來進行顯著性檢驗的。 1、假設(shè)檢驗、假設(shè)檢驗 所謂假設(shè)檢驗,就是事先對總體參數(shù)或總體分就是事先對總體參數(shù)或總體分布形式作出一個假設(shè),然后利用樣本信息來判斷布形式作出一個假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)有顯著差異,從而決定是否接受或否定原假設(shè)。 假設(shè)檢驗采用的邏輯推理方法是反證法。 先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。 判斷結(jié)果合理與否,

7、是基于“小概率事件不易發(fā)生”這一原理的 2、變量的顯著性檢驗、變量的顯著性檢驗 ),(2211ixN)2(1112211ntSxti 檢驗步驟:檢驗步驟: (1)對總體參數(shù)提出假設(shè) H0: 1=0, H1:10(2)以原假設(shè)H0構(gòu)造t統(tǒng)計量,并由樣本計算其值11St (3)給定顯著性水平,查t分布表,得臨界值t /2(n-2)(4) 比較,判斷 若 |t| t /2(n-2),則拒絕H0 ,接受H1 ; 若 |t| t /2(n-2),則拒絕H1 ,接受H0 ; 對于一元線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計量進行顯著性檢驗: )2(0022200ntSxnXtii在上述收入-消費支出例中,首先

8、計算2的估計值 134022107425000777. 04590020222221222nxyneiii0425. 00018. 07425000/13402221ixS41.98742500010/53650000134022220iixnXSt統(tǒng)計量的計算結(jié)果分別為: 29.180425. 0777. 0111St048. 141.9817.103000St 給定顯著性水平=0.05,查t分布表得臨界值 t 0.05/2(8)=2.306 |t1|2.306,說明家庭可支配收入在家庭可支配收入在95%95%的置信的置信度下顯著,即是消費支出的主要解釋變量;度下顯著,即是消費支出的主要解釋

9、變量; |t2|2.306,表明在95%的置信度下,無法拒絕截距項為零的假設(shè)。 假設(shè)檢驗假設(shè)檢驗可以通過一次抽樣的結(jié)果檢驗總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。 要判斷樣本參數(shù)的估計值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個以樣本參數(shù)的估計值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實的參數(shù)值。這種方法就是參數(shù)檢驗的置信區(qū)間估計置信區(qū)間估計。 三、參數(shù)的置信區(qū)間三、參數(shù)的置信區(qū)間 1)(P 如 果 存 在 這 樣 一 個 區(qū) 間 , 稱 之 為 置 信 區(qū) 間置 信 區(qū) 間(conf

10、idence interval); 1-稱為置信系數(shù)置信系數(shù)(置信度置信度)(confidence coefficient), 稱為顯著性水平顯著性水平(level of significance);置信區(qū)間的端點稱為置信限置信限(confidence limit)或臨界值臨界值(critical values)。一元線性模型中一元線性模型中, i (i=1,2)的置信區(qū)間的置信區(qū)間: :在變量的顯著性檢驗中已經(jīng)知道: )2(ntstiii 意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2, t/2)的概率是(1- )。表示為: Pttt()221即Ptstiii()221Ptstsiiiii()221于是得到:(1-)的置信度下, i的置信區(qū)間是 (,)iitstsii22 在上述收入收入- -消費支出消費支出例中,如果給定 =0.01,查表得: 355. 3)8()2(005. 02tnt由于042. 01S41.980S于是,1、0的置信區(qū)間分別為: (0.6345,0.9195) (-433.32,226.98) 由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的“接近”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論