統(tǒng)計學:第八章相關(guān)與回歸分析_第1頁
統(tǒng)計學:第八章相關(guān)與回歸分析_第2頁
統(tǒng)計學:第八章相關(guān)與回歸分析_第3頁
統(tǒng)計學:第八章相關(guān)與回歸分析_第4頁
統(tǒng)計學:第八章相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2022-6-3河北工程大學經(jīng)濟管理學院1統(tǒng)計學統(tǒng)計學2022-6-3河北工程大學經(jīng)濟管理學院2 第八章第八章 相關(guān)與回歸分析相關(guān)與回歸分析 本章內(nèi)容:理解相關(guān)關(guān)系概念、分類,相關(guān)分析與回歸分析的區(qū)別聯(lián)系;掌握一元線性回歸分析,學掌握一元線性回歸分析,學會用最小二乘法估計回歸參數(shù),會用最小二乘法估計回歸參數(shù),學會計算估計標準誤差、可決系學會計算估計標準誤差、可決系數(shù);掌握單相關(guān)關(guān)系分析,學會數(shù);掌握單相關(guān)關(guān)系分析,學會相關(guān)系數(shù)的計算。相關(guān)系數(shù)的計算。2022-6-3河北工程大學經(jīng)濟管理學院3 第八章第八章 相關(guān)與回歸分析相關(guān)與回歸分析 本章分三節(jié): 第一節(jié) 相關(guān)與回歸分析的基本概念 第二節(jié) 一

2、元線性回歸分析 第三節(jié) 相關(guān)分析 2022-6-3河北工程大學經(jīng)濟管理學院4第一節(jié)第一節(jié) 相關(guān)與回歸分析的相關(guān)與回歸分析的基本概念基本概念 本節(jié)需要把握四個問題: 一、函數(shù)關(guān)系與相關(guān)關(guān)系; 二、相關(guān)關(guān)系的種類; 三、相關(guān)分析與回歸分析; 四、相關(guān)表和相關(guān)圖。2022-6-3河北工程大學經(jīng)濟管理學院5一、函數(shù)關(guān)系與相關(guān)關(guān)系一、函數(shù)關(guān)系與相關(guān)關(guān)系 客觀現(xiàn)象總是普遍聯(lián)系和相互依存的,客觀現(xiàn)象間的數(shù)量聯(lián)系存在兩種不同類型:函數(shù)關(guān)系和相關(guān)關(guān)系。 把握三個問題: 1、函數(shù)關(guān)系; 2、相關(guān)關(guān)系; 3、二者關(guān)系。2022-6-3河北工程大學經(jīng)濟管理學院6 1、函數(shù)關(guān)系函數(shù)關(guān)系是指變量之間存在著嚴格確定的依存關(guān)

3、系,在這種關(guān)系中,當一個或幾個變量取一定量的值時,另一變量有確定值與之相對應,并且這種關(guān)系可以用一個數(shù)學表達式反映出來。例如:某種產(chǎn)品的總成本S與該產(chǎn)品的產(chǎn)量Q以及該產(chǎn)品的單位成本P之間的關(guān)系可用S=PQ表達,這就是一種函數(shù)關(guān)系。通常把作為影響因素的變量稱為自變量,把發(fā)生相應變化的變量稱為因變量。在本例中,S是因變量,P與Q則是自變量。 2022-6-3河北工程大學經(jīng)濟管理學院7 2、相關(guān)關(guān)系 相關(guān)關(guān)系是指變量之間存在一定的相依關(guān)系,但又不是確定的和嚴格依存的。這類關(guān)系中,當一個或幾個相互聯(lián)系的變量取一定數(shù)值時,與之相對應的變量就會有若干個數(shù)值與之相對應,從而表現(xiàn)出一定的波動性。例如商品流轉(zhuǎn)規(guī)

4、模與流通費用的關(guān)系,家庭收入與消費支出的關(guān)系,工業(yè)勞動生產(chǎn)率與產(chǎn)品成本的關(guān)系等都屬于相關(guān)關(guān)系。在統(tǒng)計中所研究的就是這種相關(guān)關(guān)系。 2022-6-3河北工程大學經(jīng)濟管理學院8 上述函數(shù)關(guān)系和相關(guān)關(guān)系之間并不存在嚴格的界限,一定條件下可以轉(zhuǎn)化。由于有測量誤差等原因,函數(shù)關(guān)系在實際中往往通過相關(guān)關(guān)系表現(xiàn)出來;反之當對現(xiàn)象之間的內(nèi)在聯(lián)系和規(guī)律性了解得更清楚深刻的時候,相關(guān)關(guān)系也可能轉(zhuǎn)化為函數(shù)關(guān)系。因此,相關(guān)關(guān)系通??梢杂靡欢ǖ暮瘮?shù)關(guān)系表達式去近似地描述。 3、二者關(guān)系2022-6-3河北工程大學經(jīng)濟管理學院9二、相關(guān)關(guān)系的種類把握以下問題:1、按相關(guān)程度劃分;2、按相關(guān)方向劃分;3、按相關(guān)形式劃分;4

5、、按變量多少劃分;5、按相關(guān)性質(zhì)劃分。2022-6-3河北工程大學經(jīng)濟管理學院10 1、按相關(guān)程度劃分可分為完全相關(guān)、不完全相關(guān)和不相關(guān)(1)完全相關(guān):當一種現(xiàn)象的數(shù)量變化完全由另一個現(xiàn)象的數(shù)量變化所確定時,稱這兩種現(xiàn)象之間的關(guān)系為完全相關(guān),例如圓的周長L決定于它的半徑R,即L=2R。在這種情況下,相關(guān)關(guān)系即為函數(shù)關(guān)系,也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一種特例。2022-6-3河北工程大學經(jīng)濟管理學院111、按相關(guān)程度劃分(2)不相關(guān):當兩個現(xiàn)象彼此互不影響,其數(shù)量變化各自獨立時,稱這兩個現(xiàn)象之間的關(guān)系為不相關(guān)或零相關(guān)。例如:學生的學習成績與其身高一般認為是不相關(guān)的。(3)不完全相關(guān):若兩個現(xiàn)象之

6、間的關(guān)系介于完全相關(guān)和不相關(guān)之間,就稱為不完全相關(guān),一般的相關(guān)現(xiàn)象都是指這種不完全相關(guān),這是相關(guān)分析的研究對象。2022-6-3河北工程大學經(jīng)濟管理學院12可分為正相關(guān)和負相關(guān):(1)兩個相關(guān)現(xiàn)象間,當一個變量的數(shù)值增加(或減少)時,另一個變量的數(shù)值也隨之增加(或減少),這種相關(guān)稱為正相關(guān)。例如家庭消費支出隨著收入的增加而增加等。(2)當一個變量的數(shù)值增加(或減少)時,而另一個變量的數(shù)值相反地呈減少(或增加)趨勢變化,稱為負相關(guān)。例如勞動生產(chǎn)率愈高,單位產(chǎn)品成本愈低。 2、按相關(guān)方向劃分2022-6-3河北工程大學經(jīng)濟管理學院13 3、按相關(guān)形式劃分 可以分為線性相關(guān)和非線性相關(guān): (1)當一

7、個變量發(fā)生變動,另一個變量隨之發(fā)生大致均等的變動(增加或減少),從圖形上看,其觀測點的分布近似地表現(xiàn)為直線形式,就是線性相關(guān)。 (2)而當一個變量發(fā)生變動,另一個變量也隨之發(fā)生變動(增加或減少),但是這種變動不是均等的,從圖形上看,其觀察點的分布表現(xiàn)為各種不同的曲線形式,這種相關(guān)關(guān)系稱為非線性相關(guān)。2022-6-3河北工程大學經(jīng)濟管理學院14 4、按變量多少劃分分為單相關(guān)、復相關(guān)和偏相關(guān):(1)單相關(guān)又稱一元相關(guān),是指兩個變量之間的相關(guān)關(guān)系,即僅限于一個變量與另一個變量之間的依存關(guān)系。(2)復相關(guān)又稱多元相關(guān),是指三個或三個以上變量之間的相關(guān)關(guān)系。例如家庭的消費支出與家庭收入水平及市場價格水平

8、之間的關(guān)系便是一種復相關(guān)。2022-6-3河北工程大學經(jīng)濟管理學院154、按變量多少劃分(3)在某一變量與多個變量相關(guān)時,當假定其他變量不變,其中兩個變量的相關(guān)關(guān)系稱為偏相關(guān)。例如在假定家庭收入水平不變的條件下,市場價格水平與家庭的消費支出的關(guān)系就是一種偏相關(guān)。2022-6-3河北工程大學經(jīng)濟管理學院165、按相關(guān)性質(zhì)劃分分為“真實相關(guān)”和“虛假相關(guān)”:(1)當兩種現(xiàn)象間的相關(guān)確實具有內(nèi)在的聯(lián)系時,稱之為“真實相關(guān)”。例如消費與收入的相關(guān)關(guān)系等。(2)當兩種現(xiàn)象間的相關(guān)只是表面存在,實質(zhì)沒有內(nèi)在聯(lián)系時,稱之為“虛假相關(guān)”。判斷依據(jù)是實質(zhì)性科學提供的知識。2022-6-3河北工程大學經(jīng)濟管理學院

9、17三、相關(guān)分析與回歸分析三、相關(guān)分析與回歸分析把握以下問題:1、相關(guān)分析與回歸分析的概念;2、二者的聯(lián)系;3、二者的區(qū)別;4、應用中注意局限性。2022-6-3河北工程大學經(jīng)濟管理學院18 1、相關(guān)分析與回歸分析的概念 二者是研究現(xiàn)象尖相關(guān)關(guān)系的基本方法。 (1)相關(guān)分析(狹義)指用一個指標表明現(xiàn)象間相互依存關(guān)系的密切程度。 (2)回歸分析:根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個合適的數(shù)學模型來近似表達變量間的平均變化關(guān)系。2022-6-3河北工程大學經(jīng)濟管理學院19 2、二者的聯(lián)系 二者有著密切的聯(lián)系,它們具有共同的研究對象,在具體運用時需要互相補充。具體: (1)相關(guān)分析需要依靠回歸分析表明現(xiàn)

10、象數(shù)量相關(guān)的具體形式; (2)回歸分析需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的相關(guān)程度,只有變量之間存在著高度相關(guān)時,進行回歸分析尋求其相關(guān)的具體形式才有意義。因此,在一些統(tǒng)計學的相關(guān)書籍中,回歸分析和相關(guān)分析也合并稱為相關(guān)關(guān)系分析或廣義的相關(guān)分析。2022-6-3河北工程大學經(jīng)濟管理學院203、二者的區(qū)別在研究目的和具體的研究方法上是有明顯區(qū)別的,兩者的主要區(qū)別在于: (1)相關(guān)分析研究變量間相關(guān)方向、程度,不能指出變量間相互關(guān)系的具體形式,也無法從一個變量的變化推測另一個變量的變化情況;而回歸分析能確切地指出變量之間相互關(guān)系的具體形式,它可根據(jù)回歸模型從已知量估計和預測未知量。 2022-6-

11、3河北工程大學經(jīng)濟管理學院21 3、二者的區(qū)別 (2)在相關(guān)分析中,不必確定自變量和因變量;而在回歸分析中,必須事先確定哪個為自變量,哪個為因變量,而且只能從自變量去推測因變量,而不能從因變量去推斷自變量。 (3)相關(guān)分析所涉及的變量一般都是隨機變量;而回歸分析中因變量是隨機的,自變量則作為研究時給定的非隨機變量。 2022-6-3河北工程大學經(jīng)濟管理學院22 4、應用中注意局限性 相關(guān)和回歸分析是對現(xiàn)象間相關(guān)關(guān)系進行分析的有效的科學方法,但是它們有一定的局限性。在確定應用相關(guān)和回歸分析之前,必須進行定性分析,運用足夠的理論知識、專業(yè)知識和必要的經(jīng)驗來判斷現(xiàn)象之間是否具有真正的相關(guān),是具有實質(zhì)

12、性的內(nèi)在聯(lián)系還是表面上的聯(lián)系,還是一種偶然的巧合。 因此在應用相關(guān)和回歸分析對客面現(xiàn)象進行研究時,一定要注意把定性分析和定量分析結(jié)合起來,在定性分析基礎(chǔ)上開展相關(guān)和回歸的定量分析。 2022-6-3河北工程大學經(jīng)濟管理學院23四、相關(guān)表和相關(guān)圖相關(guān)分析中,通過繪制相關(guān)圖和相關(guān)表,可以對現(xiàn)象之間存在的相關(guān)關(guān)系的方向、形式和密切程度作直觀的、大致的判斷。把握以下問題:1、相關(guān)表;2、相關(guān)圖。2022-6-3河北工程大學經(jīng)濟管理學院241、相關(guān)表 (1)相關(guān)表是一種反映變量見相關(guān)關(guān)系的統(tǒng)計表。 研究現(xiàn)象之間的依存關(guān)系,首先要通過實際調(diào)查取得一系列成對的數(shù)據(jù),作為相關(guān)分析的原始資料。將某一變量按其數(shù)值

13、的大小順序排列,然后再將與其相關(guān)的另一變量的對應值平行排列,便可得到簡單的相關(guān)表。 2022-6-3河北工程大學經(jīng)濟管理學院25 1、相關(guān)表 (2)例如假設(shè)對10戶居民家庭的月可支配收入和消費指出進行調(diào)查,得到原始資料如表 表8-1 居民收入和消費的原始資料 單位:百元 根據(jù)原始資料,將消費支出從小到大排序,得到表居民家庭編號 1 2 3 4 5 6 7 8 9 10 消費支出 20 15 40 30 42 60 65 70 53 78可支配收入 25 18 60 45 62 88 92 99 75 982022-6-3河北工程大學經(jīng)濟管理學院26 1、相關(guān)表 (2)表8-2 居民消費和收入的

14、相關(guān)表 單位:百元 從表中看出,隨著可支配收入的提高,居民的消費支出也有相應提高的趨勢,二者存在明顯的正相關(guān)關(guān)系。消費支出 15 20 30 40 42 53 60 65 70 78可支配收入 18 25 45 60 62 75 88 92 99 982022-6-3河北工程大學經(jīng)濟管理學院272、相關(guān)圖相關(guān)圖又稱散點圖或散布圖,是以直角坐標系的橫軸代表變量X,縱軸代表變量Y,將兩變量相對應的成對的數(shù)據(jù)用坐標點的形式描繪出來,用于反映兩變量之間相關(guān)關(guān)系的圖形。由表8-2的資料繪制的相關(guān)圖如圖8-1所示。2022-6-3河北工程大學經(jīng)濟管理學院28圖8-1圖8 -1 居 民消費和收入的相關(guān)圖01

15、02030405060708090020406080100120可支配收入消費支出z從圖看出,居民的消費支出與可支配收入之間呈現(xiàn)正線性相關(guān)關(guān)系2022-6-3河北工程大學經(jīng)濟管理學院29 第二節(jié) 一元線性回歸分析 把握以下問題: 一、標準的一元線性回歸模型; 二、一元線性回歸模型的估計; 三、一元線性回歸模型擬合程度評價。2022-6-3河北工程大學經(jīng)濟管理學院30一、標準的一元線性回歸模型 把握以下問題: 1、總體回歸函數(shù); 2、樣本回歸函數(shù); 3、樣本回歸函數(shù)與總體回歸函數(shù)的區(qū)別; 4、誤差項的標準假定。2022-6-3河北工程大學經(jīng)濟管理學院31 1、總體回歸函數(shù) (1)一元線性回歸模型

16、指只有一個因變量和一個自變量的線性回歸模型,又稱簡單線性回歸模型。 假定因變量Y主要受自變量X的影響,二者間存在近似的線性函數(shù)關(guān)系有 該式被稱為總體回歸函數(shù),式中 是未知的參數(shù),又叫回歸系數(shù)。Yt和Xt分別是Y和X的第t次觀測值。 是隨機誤差項,又叫隨機干擾項,它是一個特殊的隨機變量,反映未列入方程式的其他各種因素對Y的影響。) 1 . 8(21tttXY21,t2022-6-3河北工程大學經(jīng)濟管理學院32 1、總體回歸函數(shù) (2)舉例說明:消費函數(shù) 式中Yt表示消費支出, Xt表示可支配收入。 為基礎(chǔ)消費水平的支出,不受可支配收入的影響, 為邊際消費傾向,表明可支配收入每增加一個單位,消費支

17、出增加的數(shù)量。此處,可支配收入是決定消費支出的主要因素,圖中可表示為一條直線,但現(xiàn)實中確定型的消費函數(shù)很難成立,原因是除收入外還有各種因素影響消費支出。ttXY21212022-6-3河北工程大學經(jīng)濟管理學院33 1、總體回歸函數(shù) (3)實際中,只能平均看來消費支出與可支配收入的關(guān)系能用直線反映,用數(shù)學形式表示為: 上式表明:在X的值給定下, Y的期望值是嚴密的線性函數(shù),這條直線被稱為回歸直線。 Y的實際值不一定在該直線上,只是散布在直線的周圍。我們把實際觀測點與總體回歸線垂直方向的間隔稱為隨機誤差項,即) 3 . 8()(21ttXYEttttttttXYEYYEY21)()4 . 8)(則

18、2022-6-3河北工程大學經(jīng)濟管理學院342、樣本回歸函數(shù) (1)總體回歸函數(shù)事實是未知的,用樣本信息進行估計。 根據(jù)樣本數(shù)據(jù)擬合的直線稱為樣本回歸直線,如果是擬合的是曲線,則稱為樣本回歸曲線。其函數(shù)形式與總體回歸線的形式相同,表示為: 式中 是樣本回歸線上與Xt相對應的Y值,可視為E(Yt)的估計; 是樣本回歸函數(shù)的截距系數(shù), 是樣本回歸函數(shù)的斜率系數(shù),它們是對總體回歸系數(shù) 的估計。121,tY2)5 .8(21ttXY2022-6-3河北工程大學經(jīng)濟管理學院35 2、樣本回歸函數(shù)(2)實際觀測的Yt不完全等于 ,如果et表示二者之差( et = Yt - ),則有:上式稱為樣本回歸函數(shù)。

19、式中et稱為殘差,et與 相互對應;n為樣本的容量。tYtY)6 .8.(,2, 1,21nteXYtttt2022-6-3河北工程大學經(jīng)濟管理學院36 3、樣本回歸函數(shù)與總體回歸函數(shù)的區(qū)別 (1)總體回歸函數(shù)未知,它只有一條。樣本回歸線是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一組樣本,可以擬合一條樣本回歸線; (2)總體回歸函數(shù)中的 是未知的參數(shù),表現(xiàn)為常數(shù),樣本回歸函數(shù)中的 和 是隨機變量,其具體數(shù)值隨抽取的樣本觀測值不同而變動; (3)總體回歸函數(shù)中的 是Yt與未知的總體回歸線間的縱向距離,它不可直接觀測,而樣本回歸函數(shù)中et是Yt與樣本回歸線間的縱向距離,可以計算et具體數(shù)值。21,12t2022

20、-6-3河北工程大學經(jīng)濟管理學院37 4、誤差項的標準假定隨機誤差項 是無法直接觀測的。為了進行回歸分析,對其概率分布提出假定:(1)誤差項的期望值為0,即(2)誤差項的方差為常數(shù),即(3)誤差項之間不存在序列相關(guān)關(guān)系,其協(xié)方差為0,即當ts時有:(4)自變量是給定的變量,與隨機誤差項線性無關(guān)。t0)(tE22)()(ttEVar0)()(ststECov2022-6-3河北工程大學經(jīng)濟管理學院38 4、誤差項的標準假定 (5)隨機誤差項服從正態(tài)分布。 以上假定是德國數(shù)學家高斯最早提出,又稱高斯假定。 滿足以上標準假定的一元線性回歸模型,稱為標準的一元線性回歸模型。2022-6-3河北工程大學

21、經(jīng)濟管理學院39二、一元線性回歸模型的估計 把握以下問題: 1、回歸系數(shù)的估計; 2、總體方差的估計; 3、最小二乘估計量的性質(zhì)。2022-6-3河北工程大學經(jīng)濟管理學院40 1、回歸系數(shù)的估計 (1)根據(jù)樣本資料確定樣本回歸方程時,一般希望Y的估計值盡可能接近其真實值,即et的總量越小越好,但有正負,代數(shù)和為0( et =0),通常用 et2作為衡量總偏差的尺度。所謂最小二乘法根據(jù)這一思路,使殘差平方和最小來估計回歸系數(shù)。 (2)設(shè) 為使Q最小,對 求偏導數(shù),令其為0,得:22122)()(tttttXYYYeQ122022-6-3河北工程大學經(jīng)濟管理學院411、回歸系數(shù)的估計(2)整理后有

22、:稱為標準方程組,n為樣本容量,解方程組得:00)(200)(2212211tttttttteXXYXQeXYQ即即22121ttttttXXYXXnY_2_2122222/)(11)(XYnXnYXnXYXnYXXXnYXYXntttttttttttttt2022-6-3河北工程大學經(jīng)濟管理學院421、回歸系數(shù)的估計 (3)可以證明: 證明: 設(shè) 得到:222_)(1)(tttXnXXX222222_22_22_22_)(1)()()(2)(2)(tttttttttXnXnXnXXnXXnXnXXXnXXXXXttttttxytttyytttxxYXnYXYYXXLYnYYYLXnXXXL1

23、)()(1)()(1)(_222_222_xxxyLL22022-6-3河北工程大學經(jīng)濟管理學院43例8-1 根據(jù)15個居民家庭的人均月食品支出與人均月收入水平的數(shù)據(jù),估計食品支出的恩格爾函數(shù)。 解:最簡單的恩格爾函數(shù)假定在商品價格不變的條件下,實際的食品支出Y與實際的收入水平X間的關(guān)系可以用一元線性回歸模型反映。根據(jù)Y和X的數(shù)據(jù)計算有關(guān)統(tǒng)計量,列在表8-3中(表略),將有關(guān)合計數(shù)代入公式得:9878.91515161802.0154231802.0151616365415423151644632151222022-6-3河北工程大學經(jīng)濟管理學院44例8-1 解:該例中 得到 同樣 樣本回歸方

24、程為:ttXY1802.099.980.1880423151615144632140.38242315112311)(193.10436151615163654)(1222222ttttxyttyyttxxYXnYXLYnYLXnXL1802.093.1043680.18802xxxyLL9878.912022-6-3河北工程大學經(jīng)濟管理學院45例8-1 解:上式中:0.1802表示收入每增加1元,食品支出會增加0.1802元;9.9878表示即使在收入為0的情況下,食品支出也需要9.99元。根據(jù)該式計算的食品支出在總收入中平均所占比重為: 上式中 即所謂恩格爾系數(shù),本例中,恩格爾系數(shù)隨著Xt

25、的增加而遞減,與恩格爾定律一致。1802.0/99.9/tttXXYttXY /2022-6-3河北工程大學經(jīng)濟管理學院46 2、總體方差的估計 (1)在一元線性回歸模型中還包括另一個參數(shù),即總體隨機誤差項的方差( ),它可以反映模型誤差的大小,本身不能直接測得,用最小二乘殘差et代替隨機誤差項 來估計 。 的無偏估計S2由下式給出: S2= et2/n-2,式中分子是殘差平方和,分母是自由度,n是樣本觀測值的個數(shù),2是一元線性回歸方程中回歸系數(shù)的個數(shù)。模型中殘差滿足兩個約束條件: 因而失去兩個自由度,所以自由度為n-22)(tVart220,0ttteXe2022-6-3河北工程大學經(jīng)濟管理

26、學院47 2、總體方差的估計 (2) S2的正平方根又叫做回歸估計的標準誤差。S越小表明實際觀測點與所擬合的樣本回歸線的離差程度越小,即回歸線具有較強的代表性;反之,S越大表明實際觀測點與所擬合的樣本線的離差程度越大,即回歸線的代表性較差。 (3)一般計算S2時,殘差平方和用下式計算:tttttYXYYe21222022-6-3河北工程大學經(jīng)濟管理學院48例8-2 根據(jù)例8-1中的有關(guān)數(shù)據(jù)計算食品支出恩格爾函數(shù)的總體方差S2和回歸估計標準誤差S。 解:已知 將有關(guān)數(shù)據(jù)代入公式得: 又得到: S2= 43.47/(15-2)=3.3438 有S =1.828644632,423,123112tt

27、ttYXYY27.43446321802. 04239878. 9123112te2022-6-3河北工程大學經(jīng)濟管理學院49 3、最小二乘估計量的性質(zhì) (1) 用最小二乘法求得的 值是樣本觀測值的函數(shù),通常稱之為最小二乘估計量,它們的形式不變,但因樣本不同而不同,是一種隨機變量??梢宰C明在標準假定滿足下,回歸系數(shù)的最小二乘估計量的期望值等于其真值,即 其方差為:1222)(E11)(E2_222_21)()()(1()(XXVarXXXnVartt2022-6-3河北工程大學經(jīng)濟管理學院50 3、最小二乘估計量的性質(zhì)(2)最小二乘估計量是總體回歸系數(shù)的線性無偏估計量,還可以證明,其方差最小,

28、同時隨著樣本容量的增大,其方差不斷縮小,也就是說,回歸系數(shù)的最小二乘估計量是最優(yōu)線性無偏估計量和一致估計量。 這由數(shù)學家高斯和馬爾可夫提出并證明,被稱為高斯-馬爾可夫定理,表明在標準假定下,最小二乘估計量是一種最佳的估計方式。2022-6-3河北工程大學經(jīng)濟管理學院51三、一元線性回歸模型擬合程度評價 把握以下問題: 1、回歸模型檢驗的種類; 2、擬合程度的概念; 3、總離差平方和的分解; 4、可決系數(shù)及其性質(zhì)。2022-6-3河北工程大學經(jīng)濟管理學院52 1、回歸模型檢驗的種類 包括理論意義檢驗、一級檢驗和二級檢驗。 (1)理論意義檢驗涉及參數(shù)估計值符號和取值區(qū)間,檢驗是否與實質(zhì)性科學的理論

29、及人們的實踐經(jīng)驗相符。 (2)一級檢驗又稱統(tǒng)計學檢驗,利用統(tǒng)計學中的抽樣理論來檢驗樣本回歸方程的可靠性,具體又分為擬合程度評價和顯著性檢驗。 (3)二級檢驗又稱經(jīng)濟計量學檢驗,是對標準線性回歸模型的假定條件能否得到滿足進行檢驗,包括序列相關(guān)檢驗、異方差檢驗。2022-6-3河北工程大學經(jīng)濟管理學院53 2、擬合程度的概念 擬合程度是指樣本觀測值聚集在樣本回歸線周圍的緊密程度。 判斷回歸模型擬合程度優(yōu)劣最常用的數(shù)量指標是 可決系數(shù)(又稱決定系數(shù))。該指標建立在對總離差平方和分解的基礎(chǔ)上。2022-6-3河北工程大學經(jīng)濟管理學院543、總離差平方和的分解 (1)因變量的實際觀測值與其樣本平均數(shù)之間

30、的離差稱作總離差,即: 可以分解為兩部分:一是因變量的理論回歸值與其樣本均值的離差 ,表示能用回歸直線解釋的部分,稱為可解釋離差;二是實際觀測值與理論回歸值的離差 它是不能由回歸直線解釋的殘差et。對任一實際觀測值總有:_YYt_YYtttYYtttttteYYYYYYYY)()()()(_2022-6-3河北工程大學經(jīng)濟管理學院55 3、總離差平方和的分解 (2)用圖表示: XY0_YYtttYY_YYt_YttXY21tY2022-6-3河北工程大學經(jīng)濟管理學院563、總離差平方和的分解 (3)將總離差式子左右平方求和,得 證明: 從而有)(2)()()()()(_22_2_2_ttttt

31、tttttYYYYYYYYYYYYYY0)(2_tttYYYY0)()()()()()(22_2_22_2_221_2121_xxxxxyxyttttttttttttLLLLXXYYXXXXYYXXXYXXYYYY22_2_)()()(ttttYYYYYY2022-6-3河北工程大學經(jīng)濟管理學院57 3、總離差平方和的分解 (4)由上得:SST=SSR+SSE 式中SST是總的離差平方和;SSR是回歸直線可以解釋的離差平方和,稱為回歸平方和;SSE是回歸直線無法解釋的離差平方和,稱為剩余殘差平方和,又稱殘差平方和。 又有 則 估計標準誤差SSTYYLtyy2_)(SSEYYettt22)(xy

32、xxxxxytttLLLLXXXXYYSSR222_222_21212_)()()(xyyytLLeSSE222222nLLneSxyyyt2022-6-3河北工程大學經(jīng)濟管理學院584、可決系數(shù)及其性質(zhì) (1)由 SST=SSR+SSE得 1= SSR/ SST+ SSE /SST,可見各樣本觀測點與樣本回歸線靠得越近, SSR在SST所占比例越大,將其定義為可決系數(shù),即 r2= SSR/ SST=1- SSE /SST= 它是對回歸模型擬合程度的綜合度量,可決系數(shù)越大,模型擬合越高。可決系數(shù)越小,則模型對樣本的擬合程度越差。yyxyLL22022-6-3河北工程大學經(jīng)濟管理學院594、可決

33、系數(shù)及其性質(zhì) (2)性質(zhì):A、具有非負性; B、取值范圍0 r2 1,當所有觀測值在回歸線上時, SSE=0, r2 =1,說明總離差完全可以由樣本直線解釋,當觀測值不全在樣本線上時, SSE0, r21 ,當回歸直線沒有解釋任何離差,總離差平方和等于殘差平方和,則r2=0; C、它是樣本觀測值的函數(shù),也是統(tǒng)計量。2022-6-3河北工程大學經(jīng)濟管理學院60例8-3 利用例8-2中計算的殘差平方和,計算例8-1擬合的樣本回歸系數(shù)的可決系數(shù)。 解:r2= SSR/ SST=1- SSE /SST=0.8863 還可以利用公式r2 = =0.18021880.80/382.40=0.8863 此外

34、例8-2中的估計標準誤差yyxyLL28288. 1134798.4321580.18801802. 040.3822222nLLneSxyyyt2022-6-3河北工程大學經(jīng)濟管理學院61 第三節(jié) 相關(guān)分析 把握以下問題: 一、相關(guān)系數(shù)概念; 二、相關(guān)系數(shù)與可決系數(shù); 三、例8-102022-6-3河北工程大學經(jīng)濟管理學院62一、相關(guān)系數(shù)概念 把握以下問題: 1、相關(guān)系數(shù)的定義; 2、總體相關(guān)系數(shù)的定義式; 3、樣本相關(guān)系數(shù)的定義公式。2022-6-3河北工程大學經(jīng)濟管理學院631、相關(guān)系數(shù)的定義 單相關(guān)分析是對兩個變量間的相關(guān)程度進行分析。單相關(guān)分析所用的指標稱為單相關(guān)系數(shù)簡稱相關(guān)系數(shù)。 通常用 表示總體的相關(guān)系數(shù),以r表示樣本的相關(guān)系數(shù)。2022-6-3河北工程大學經(jīng)濟管理學院642、總體相關(guān)系數(shù)的定義式 式中,Cov(X,Y)是變量X和Y的協(xié)方差;Var(X)、Var(Y)分別為變量X和Y的方差。 總體相關(guān)系數(shù)是反映兩變量之間線性相關(guān)程度的一種特征值,表現(xiàn)為一個常數(shù)。)81. 8()()(),(YVarXVarYXCov2022-6-3河北工程大學經(jīng)濟管理學院65 3、樣本相關(guān)系數(shù)的定義公式 (1) 樣本相關(guān)系數(shù)是根據(jù)樣本觀測值計算的,抽取的樣本不同,其具體數(shù)值有差異,它是總體相關(guān)系數(shù)的一致估計量。)82. 8 ()()()(2_2_yyxxxyttttLLLYYXX

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論