第8章相關(guān)與回歸分析_第1頁
第8章相關(guān)與回歸分析_第2頁
第8章相關(guān)與回歸分析_第3頁
第8章相關(guān)與回歸分析_第4頁
第8章相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

《統(tǒng)計學》課件作者:云南財經(jīng)大學統(tǒng)計與數(shù)學學院楊文雪PowerPoint統(tǒng)計學第8章相關(guān)與回歸分析8.1相關(guān)分析8.2一元線性回歸分析8.1相關(guān)分析8.1.1相關(guān)關(guān)系的概念8.1.2相關(guān)關(guān)系的類型8.1.3相關(guān)關(guān)系分析的基本內(nèi)容一、函數(shù)關(guān)系和相關(guān)關(guān)系二、真實相關(guān)和虛假相關(guān)三、相關(guān)關(guān)系和因果關(guān)系8.1.1相關(guān)關(guān)系的概念一、相關(guān)關(guān)系和函數(shù)關(guān)系許多客觀現(xiàn)象之間都存在一定的相互依存關(guān)系。按其數(shù)量上是否對應(yīng)確定可以分為兩種不同的類型:確定性關(guān)系——函數(shù)關(guān)系非確定性關(guān)系——相關(guān)關(guān)系下面分別介紹這兩種依存關(guān)系。(一)函數(shù)關(guān)系它是指客觀現(xiàn)象之間存在完全確定的數(shù)量對應(yīng)關(guān)系。一一對應(yīng)關(guān)系??梢杂靡粋€確定的公式(函數(shù)式)

表示,表明當給定一個值時,的值可以精確確定。通常將變動原因的變量X稱為自變量(解釋變量);將變動結(jié)果的變量Y稱為因變量(被解釋變量)。xy設(shè)有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x,當變量x取某個數(shù)值時,y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量。各觀測點落在一條線上函數(shù)關(guān)系(幾個例子)某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y=px

(p

為單價)圓的面積(S)與半徑(R)之間的關(guān)系可表示為S=R2

企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)、單位產(chǎn)量消耗(x2)、原材料價格(x3)之間的關(guān)系可表示為y=x1x2x3

歐姆定理只要測出電路中的電壓V和電阻R,就可精確計算出電流I。(二)相關(guān)關(guān)系XY是指客觀現(xiàn)象之間存在非完全確定的數(shù)量對應(yīng)關(guān)系。亦即:當一個或幾個變量取一定值時,并不能完全精確地確定另一個與之對應(yīng)的變量的數(shù)值。即使自變量取同一個數(shù)值,因變量的數(shù)值也未必相同。現(xiàn)象(變量)之間的這種依存關(guān)系,稱之為相關(guān)關(guān)系。相關(guān)關(guān)系的統(tǒng)計模型:變量間關(guān)系不能用函數(shù)關(guān)系精確表達;一個變量的取值不能由另一個變量唯一確定;當變量x取某個值時,變量y的取值可能有幾個;各觀測點分布在直線周圍式中:

是自變量x的一個函數(shù)表達式,代表因變量y的基本的、主要的決定性部分,反映了自變量x對因變量y的決定性影響。稱之為隨機干擾誤差,代表了因變量y的次要的非確定性部分,反映除自變量x之外的由隨機的、偶然的、形形色色、大大小小的不確定因素的綜合影響。相關(guān)關(guān)系舉例例1:人的身高X與體重Y之間的關(guān)系。例4:父親的身高X與兒子的身高Y之間的關(guān)系。例2:某種商品的銷售量y與其價格x1、知名度x2的之間的關(guān)系例3:儲蓄額y與居民收入x之間的關(guān)系。想一想,您能舉出哪些例子?收入水平(y)與受教育程度(x)之間的關(guān)系商品銷售額(y)與廣告費支出(x)之間的關(guān)系(三)函數(shù)關(guān)系和相關(guān)關(guān)系在一定條件下可以相互轉(zhuǎn)換當具有函數(shù)關(guān)系的變量,存在觀測誤差時,其函數(shù)關(guān)系往往以相關(guān)關(guān)系的形式表現(xiàn)出來。即:y=f(x1,x2,…,xk)+e。這里的e,即為觀測誤差。當具有相關(guān)關(guān)系的變量之間的聯(lián)系,我們對它有了深刻的規(guī)律性認識,且能夠把所有影響因變量變化的因素都納入方程式,則此時的相關(guān)關(guān)系也可能轉(zhuǎn)化為函數(shù)關(guān)系。相關(guān)關(guān)系具有某種規(guī)律性,它可以用一定的函數(shù)形式去近似描述??陀^現(xiàn)象的函數(shù)關(guān)系,可用數(shù)學分析的方法去研究;客觀現(xiàn)象的相關(guān)關(guān)系,則必須借助統(tǒng)計學中的相關(guān)與回歸分析去進行研究。二、真實相關(guān)與虛假相關(guān)真實相關(guān)是指現(xiàn)象之間因符合有關(guān)實質(zhì)性科學理論和邏輯常識確實存在的某種客觀的內(nèi)在聯(lián)系,不是主觀臆造的或者是數(shù)據(jù)上的巧合。如:需求與價格和收入之間的相關(guān),施肥量與水稻畝產(chǎn)量之間的相關(guān),等等,就屬于真實相關(guān)。虛假相關(guān)是指現(xiàn)象之間的相關(guān)只是表面存在或者只是數(shù)據(jù)上的巧合,實際上并不存在內(nèi)在的聯(lián)系,也不符合有關(guān)實質(zhì)性科學理論和邏輯常識。如:一國GDP的大小與該國精神病患者人數(shù)之間的相關(guān),可能純屬巧合,就數(shù)據(jù)而言可能是相關(guān)的,但僅僅是數(shù)據(jù)表面的相關(guān),由于其違背邏輯常識和不符合有關(guān)實質(zhì)性科學理論,故為“虛假相關(guān)”(偽相關(guān))函數(shù)關(guān)系(確定性關(guān)系)相關(guān)關(guān)系(非確定性關(guān)系)有精確的數(shù)學表達式因果關(guān)系(回歸分析)平行關(guān)系(相關(guān)分析)一元回歸分析多元回歸分析線性回歸分析非線性回歸分析多元線性回歸分析多元非線性回歸分析簡單相關(guān)分析(單相關(guān)分析)線性相關(guān)分析多元相關(guān)分析復(fù)相關(guān)分析偏相關(guān)分析三、相關(guān)關(guān)系與因果關(guān)系因果關(guān)系是一種相關(guān)關(guān)系,但相關(guān)關(guān)系不一定都是因果關(guān)系因果關(guān)系,又稱為“回歸關(guān)系”,是指具有相關(guān)關(guān)系的變量之間具有主從關(guān)系,一個或一組變量的變化引起另一個變量的變化。(一個或多個變量是因,另一個變量是果)。如:父母身高與子女身高之間的關(guān)系,就是一種因果關(guān)系。具有相關(guān)關(guān)系的變量之間,如果不具有主從關(guān)系,而是具有平行關(guān)系,那么就不能認為是因果關(guān)系。如:人的身高和體重之間的關(guān)系,只能是一種相關(guān)關(guān)系,不是因果關(guān)系。8.1.2相關(guān)關(guān)系的類型一、按相關(guān)程度劃分二、按相關(guān)方向劃分三、按相關(guān)形式劃分四、按變量多少劃分一、按相關(guān)程度劃分(一)完全相關(guān):是指一個變量的值完全由另一個或另一組變量的值所決定的相關(guān)關(guān)系。在此場合,完全相關(guān)關(guān)系實際上就是變量之間的一種確定的函數(shù)關(guān)系。因此,可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一個特例。(二)不相關(guān):是指變量之間彼此獨立、互不影響,即變量之間沒有相關(guān)關(guān)系,表明一個變量的值不受另一個或另一組變量的值的影響。如:股票的價格與氣溫的高地無關(guān);一個國家的GDP與該國的精神病患者的人數(shù)無關(guān)。(三)不完全相關(guān):是指一個變量的值不但與另一個或另一組變量的值有關(guān),而且受隨機因素的影響。它是介于完全相關(guān)和不相關(guān)之間的一種相關(guān)關(guān)系。一般的相關(guān)關(guān)系,都是指這種不完全相關(guān)關(guān)系。完全相關(guān)不完全相關(guān)不相關(guān)二、按相關(guān)方向劃分正相關(guān)負相關(guān)是指當一個變量的值由小到大變化時,另一個變量的值也隨之由小到大變化的一種相關(guān)關(guān)系。包括:線性正相關(guān)和非線性正相關(guān)兩種形式。(同方向變化)是指當一個變量的值由小到大變化時,另一個變量的值則相反地由大到小變化的一種相關(guān)關(guān)系。它也包括線性負相關(guān)和曲線負相關(guān)兩種形式。(反方向變化)xy線性正相關(guān)xy線性負相關(guān)yyx非線性負相關(guān)x非線性正相關(guān)勞動生產(chǎn)率與工資需求量和價格單位成本與產(chǎn)量供給量和價格三、按相關(guān)形式劃分線性相關(guān)非線性相關(guān)又稱之為直線相關(guān),是指相關(guān)的兩個變量以大體相同的幅度變動,二者對應(yīng)值在坐標圖上的散布點大致呈直線形式的相關(guān)關(guān)系。XYY又稱之為曲線相關(guān),它是指相關(guān)的變量之間以不均等的幅度變動,它們的對應(yīng)值在坐標圖上的散布點趨向于某種曲線形式的相關(guān)關(guān)系。XYXYX四、按變量多少劃分單相關(guān)復(fù)相關(guān)偏相關(guān)又稱之為一元相關(guān)或簡單相關(guān),它是指兩個變量之間的相關(guān)關(guān)系。如:吸煙與得肺癌之間的相關(guān)關(guān)系、工資與勞動生產(chǎn)率的相關(guān)關(guān)系等。又稱之為多元相關(guān),它是指一個變量與兩個及兩個以上其他變量之間的相關(guān)關(guān)系。如:水稻畝產(chǎn)量與施肥量、澆水量、籽種的品種之間的相關(guān)關(guān)系。是指在復(fù)相關(guān)(多元相關(guān))的條件下,當假定其他變量不變時,其中兩個變量之間的相關(guān)關(guān)系。如:假定施肥量、澆水量等其他因素不變的情況下,單獨考察水稻畝產(chǎn)量與籽種的品種之間的關(guān)系,就屬于偏相關(guān)關(guān)系。(復(fù)相關(guān)下的單相關(guān))8.1.3相關(guān)關(guān)系分析的基本內(nèi)容①定性分析②編制相關(guān)表和繪制散點圖③計算相關(guān)系數(shù)yesyes相關(guān)分析yesno是否存在顯著相關(guān)?nono④選擇適當?shù)幕貧w模型進行擬合yes⑤對回歸模型進行檢驗⑥利用回歸模型進行預(yù)測和控制no結(jié)束回歸分析有無相關(guān)關(guān)系、相關(guān)的方向和密切程度(一)相關(guān)圖相關(guān)圖,又稱為散點圖或散布圖,是用來直觀地顯示兩個變量之間相關(guān)關(guān)系的統(tǒng)計圖,是進行相關(guān)分析和回歸分析的重要工具。繪制相關(guān)圖的方法:將兩個變量成對的觀測數(shù)據(jù)在坐標圖上標示出來,變量x的值為橫坐標,另一個變量y的值為縱坐標,一對觀測值對應(yīng)一個點,n對樣本觀測數(shù)據(jù)就有n個點,這些觀測點形成的圖形,就是散點圖。若兩個變量,一個是原因另一個是結(jié)果,則通常將原因放在橫軸上,結(jié)果放在縱軸上。

附:相關(guān)表是指反映變量之間相關(guān)關(guān)系的統(tǒng)計表。使用年限機床數(shù)(臺)平均維修費用(元/年)224703152042690527006378781840911080合計12__不相關(guān)線性負相關(guān)線性正相關(guān)非線性相關(guān)完全線性負相關(guān)完全線性正相關(guān)附:散點圖(相關(guān)圖)xyxyxyxyxyxy(二)相關(guān)系數(shù)1、一元相關(guān)系數(shù)及其計算2、相關(guān)系數(shù)的性質(zhì)3、應(yīng)用相關(guān)系數(shù)進行分析應(yīng)注意的問題1、一元相關(guān)系數(shù)及其計算一元相關(guān)系數(shù),又稱簡單相關(guān)系數(shù)或單相關(guān)系數(shù),是用來衡量和反映兩個變量之間線形相關(guān)的方向和程度的統(tǒng)計指標。相關(guān)圖或相關(guān)表雖可以大概判斷變量之間相關(guān)的方向和形式,也可以大致看出相關(guān)的密切程度,但這僅僅是通過肉眼直觀觀察的結(jié)果,無法準確測度變量之間的相關(guān)關(guān)系。因而必須通過計算相關(guān)系數(shù)指標進行精確測度。相關(guān)系數(shù)單相關(guān)系數(shù)又稱簡單線性相關(guān)系數(shù),是在線性相關(guān)條件下,用來衡量兩個變量之間相關(guān)的方向和程度的統(tǒng)計指標。復(fù)相關(guān)系數(shù)是用來衡量一個變量與多個變量之間線性相關(guān)程度的指標。偏相關(guān)系數(shù)是在對其他變量的影響進行控制的條件下,衡量多個變量中某兩個變量之間線性相關(guān)程度的指標。資料來源不同總體相關(guān)系數(shù)樣本相關(guān)系數(shù)由于兩個變量的線性相關(guān)關(guān)系分析是最簡單的、簡單線性相關(guān)系數(shù)是最常用的,因此通常將簡單線性相關(guān)系數(shù)直接稱為相關(guān)系數(shù)(下面無特殊交待,相關(guān)系數(shù)一般就是指簡單線性相關(guān)系數(shù))相關(guān)系數(shù)用r表示,其計算公式為請記住公式啊!2、相關(guān)系數(shù)的性質(zhì)性質(zhì)相關(guān)系數(shù)的取值范圍是:-1≤r≤1當r=0時,表明X和Y不存在線性相關(guān)關(guān)系。當0<|r|<1時,表明X和Y存在一定的線性相關(guān)關(guān)系。若r>0,則表明X和Y為線性正相關(guān);若r<0,則表明X和Y為線性負相關(guān)。當|r|=1時,表明X和Y為完全線性相關(guān)(函數(shù)關(guān)系)。若r=1,則表明X和Y為完全線性正相關(guān);若r=-1,則表明X和Y為完全線性負相關(guān)。在相關(guān)分析中,兩個變量的地位是平等的,兩者互換位置后相關(guān)系數(shù)的數(shù)值不變。即:相關(guān)系數(shù)(取值及其意義)-1.0+1.00-0.5+0.5完全負相關(guān)無線性相關(guān)完全正相關(guān)負相關(guān)程度增加r正相關(guān)程度增加通常的判斷標準|r|<0.3,可以認為X和Y為微弱相關(guān)。0.3≤|r|<0.5,可以認為X和Y為低度相關(guān)。0.5≤|r|<0.8,可以認為X和Y為顯著相關(guān)。0.8≤|r|<1,可以認為X和Y為高度相關(guān)3、應(yīng)用相關(guān)系數(shù)進行分析應(yīng)注意的問題(1)相關(guān)系數(shù)只適合衡量兩個定量變量之間的相關(guān)性,不適合定性變量。例如:性別與愛好之間的相關(guān);職業(yè)與收入之間的相關(guān),不能用相關(guān)系數(shù)來度量,只能用方差分析來考察。(2)相關(guān)系數(shù)只能反映變量之間是否存在線性相關(guān)以及線性相關(guān)的方向和程度,不能說明變量之間存在其他形式的相關(guān)關(guān)系。相關(guān)系數(shù)r=0,僅僅表明變量之間不存在線性相關(guān)關(guān)系,并不能說明變量之間不存在非線性相關(guān)關(guān)系。(3)相關(guān)系數(shù)反映變量之間的線性相關(guān)方向和程度,但不能確定變量之間的因果關(guān)系。要變量之間是否存在因果關(guān)系以及“誰是因、誰是果”,往往需要進行理論或常識分析,有時甚至需要比較實驗。例:隨機抽取某班10同學的身高和體重資料如下表,要求計算相關(guān)系數(shù)。學生身高x體重yx2y2xyABCDEFGHIJ15816016216416616817017217417647504855626052617065249642560026244268962755628224289002958430276309762209250023043025384436002721372149004225742680007776902010292100808840104921218011440Σ16705702792203303295546解:10名同學身高和體重的相關(guān)系數(shù)為:計算結(jié)果表明:這10名同學的身高和體重之間呈高度的線性正相關(guān)關(guān)系。

列1列2列11列20.8417718.2一元線性回歸分析8.2.1回歸及回歸分析的概念8.2.2相關(guān)分析與回歸分析的關(guān)系8.2.3一元線性回歸方程的估計8.2.4一元線性回歸方程的擬合效果8.2.5利用一元線性回歸方程進行預(yù)測8.2.1回歸及回歸分析的概念一、回歸的含義二、回歸分析的概念一、回歸的含義回歸一詞,可溯源于19世紀后半期的英國遺傳學家高爾頓(FrancisGalton)對遺傳問題所進行的研究。在1877-1889年期間,高爾頓提出了一個經(jīng)典的數(shù)學公式,用此公式可較好地度量子女的身高與父母身高的之間的關(guān)系,通過對遺傳現(xiàn)象的大量觀察和公式測算,假如:父母的身高是在人類平均身高的水平上下波動英寸,則其子女的身高將在人類平均身高上下波動英寸。人類平均身高子女身高Y父母的身高X子女身高上下波動子女身高上下波動高爾頓由此發(fā)現(xiàn)了一個規(guī)律:如果父母的身高與父輩的平均身高差別很大的話,那么子女的身高將有回歸于人類總平均身高的趨勢。也就是說,如果父母特高或特矮,那么兒子身高將是較高或較矮,有回歸于人類平均身高附近的趨勢。這就是著名的回歸法則。盡管這個數(shù)值當時并未被學術(shù)界作最后的定論,但是回歸(regression)這一名詞最初用于研究血緣關(guān)系,現(xiàn)代意義上的回歸與回歸的古典意義已經(jīng)有很大的不同,而今它已經(jīng)成為統(tǒng)計上研究現(xiàn)象之間相互關(guān)系的通用語。二、回歸分析的概念回歸分析是在相關(guān)分析的基礎(chǔ)上,根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個合適的數(shù)學模型(方程)來近似地描述和反映變量之間的平均變化關(guān)系的一種統(tǒng)計分析方法?;貧w分析中的數(shù)學模型或方程,稱為回歸模型或回歸方程。8.2.2相關(guān)分析與回歸分析的關(guān)系1.二者均研究變量之間的相關(guān)關(guān)系,且在具體應(yīng)用時常常相互補充。相關(guān)分析需要依靠回歸分析來描述變量之間數(shù)量相關(guān)的具體形式。回歸分析則需要依靠相關(guān)分析來描述變量數(shù)量變化的相關(guān)程度。2.只有當變量之間存在高度相關(guān)(至少是顯著相關(guān)),進行回歸分析,尋求其相關(guān)的具體形式才有實際意義。3.相關(guān)分析是回歸分析的基礎(chǔ)和前提,而回歸分析則是相關(guān)分析的繼續(xù)和深化。因此,在一些統(tǒng)計學書籍中,將相關(guān)分析和回歸分析合起來稱為相關(guān)關(guān)系分析或廣義相關(guān)分析。(一)聯(lián)系無相關(guān),也就無回歸。相關(guān)的程度越高,回歸的效果也就越好。(二)區(qū)別1.相關(guān)分析研究變量之間相關(guān)的方向和程度,無法指出變量之間相關(guān)關(guān)系的具體形式,而回歸分析則研究變量之間相關(guān)關(guān)系的具體形式(數(shù)學模型)。2.相關(guān)分析不必區(qū)分變量之間誰是自變量和誰是因變量,而回歸分析則必須嚴格區(qū)分這種因果關(guān)系。3.相關(guān)分析不能用已知的變量變化來推測另一個變量的變化,而回歸分析則可以。4.相關(guān)分析中涉及的變量可以都是隨機變量,而回歸分析中的因變量是隨機變量,自變量則可以是隨機變量,也可以是研究時給定的非隨機變量(確定性變量)。8.2.3一元線性回歸方程的估計在兩個變量之間存在線性相關(guān)關(guān)系的情況下,為了明確二者相關(guān)關(guān)系的具體數(shù)量規(guī)律,需要進一步進行回歸分析。只描述兩個變量之間線性相關(guān)關(guān)系的回歸,稱之為簡單回歸分析或一元回歸分析(Linearregression)。簡單線性回歸,雖然簡單,但通過它的建立過程,我們可以了解回歸分析方法的基本統(tǒng)計思想以及在經(jīng)濟問題研究中的應(yīng)用原理。簡單回歸分析,將變量X和Y區(qū)分為自變量和因變量。一、一元線性回歸方程的表現(xiàn)形式因變量y和自變量x之間的線性相關(guān)關(guān)系(直線相關(guān)關(guān)系),可以用下面的直線方程表示:式中:E(y/x)表示當自變量x給定一個值時,因變量y的所有可能取值的平均數(shù)。由于因變量y本身是一個不確定的隨機變量,x給定一個值時,y會有許多個取值與x對應(yīng)。為了便于描述兩個變量之間的數(shù)量變化關(guān)系,就需要選定一個足以代表因變量y的數(shù)值,使之與自變量X的值相對應(yīng)。很自然,便可用因變量y的所有可能取值的平均水平E(y/x)來作為因變量Y的代表值(估計值)回歸系數(shù)a,為回歸直線的截距,表示自變量x=0時因變量y的平均水平=a?;貧w系數(shù)b,為回歸直線的斜率,表示自變量x每變動一個單位時因變量y平均變動b個單位。二、一元線性回歸方程的最小二乘估計估計回歸系數(shù)a和b的方法有多種,其中最簡便、也是最常用的方法是普通最小二乘法。所謂普通最小二乘法(ordinaryleastsquares,OLS)(或稱最小平方法),是要求建立的回歸直線滿足因變量的全部實際觀測值與對應(yīng)的回歸估計值的離差平方和為最小條件的一種估計方法。即:簡記為:其直觀意義是:總整體上看回歸直線最接近各個實際觀察點,即因變量的實際觀測值與對應(yīng)的回歸估計值的離差整體來說為最?。ㄕ`差整體最?。kx差(誤差)有正有負,正負離差會相互抵消。因此用離差平方和來衡量全部數(shù)據(jù)的總離差(總誤差)的大小。(xi,yi)xy(xn,yn)(x1,y1)(x2,y2)ei=yi-yi^(續(xù)前)顯然,離差平方和的大小,依賴于的取值。根據(jù)微積分中的極值定理,要想使殘差平方和達到最小,待定回歸系數(shù)應(yīng)滿足:(續(xù)前)從而得到方程組:式中:n為樣本容量。這個方程組稱之為最小二乘的正規(guī)方程。解此方程組得出最小二乘估計公式。(續(xù)前)根據(jù)這兩個計算公式求出回歸系數(shù)后,即可得到回歸方程:例:仍以前面10名同學身高和體重的有關(guān)資料,擬合樣本線性回歸方程。8.2.4一元線性回歸方程的擬合效果一、擬合優(yōu)度的度量二、回歸估計標準誤差一、擬合優(yōu)度的度量(一)擬合優(yōu)度的含義(二)評價擬合優(yōu)度大小常用的指標——判定系數(shù)(三)判定系數(shù)的計算公式(四)判定系數(shù)的特點(五)判定系數(shù)與相關(guān)系數(shù)的關(guān)系(一)擬合優(yōu)度的含義(二)判斷擬合優(yōu)度大小常用的統(tǒng)計指標——判定系數(shù)(三)判定系數(shù)的計算公式判定系數(shù)(或可決系數(shù))r2表示全部偏差中有百分之幾的偏差可由x與y的回歸關(guān)系來解釋。如果全部偏差都是由回歸關(guān)系來解釋,則說明該直線擬合得最好。故而可用其來評價方程的擬合程度。(四)判定系數(shù)(r2)的特點(五)判定系數(shù)(r2)與相關(guān)系數(shù)(r)的關(guān)系二者的聯(lián)系二者的聯(lián)系(續(xù)前)二者的區(qū)別證明:故例:仍以前面10名同學的身高和體重資料為例計算判定系數(shù)(r2)二、回歸估計標準誤差從上面分析可知:回歸方程擬合效果越好,實際觀測值與回歸估計值之間的誤差(殘差)就越小。但是,度量回歸估計誤差,顯然不能只看個別觀測點,而需要考察全部實際觀測數(shù)據(jù)(樣本數(shù)據(jù)),這就需要計算回歸估計標準誤差。利用回歸方程得到的因變量的估計值

,總是與實際觀測值有或大或小、或正或負的誤差,為了從全部觀測數(shù)據(jù)(樣本數(shù)據(jù))來說明誤差大小的一般水平,可以對全部觀測數(shù)據(jù)的殘差平方進行平均,得到回歸估計的方差(均方誤差),用或表示。公式為:n-2:為自由度,n個觀測數(shù)據(jù)中由于x和y兩個因素的影響,有兩個數(shù)據(jù)失去自由取值的機會,即失去了2個自由度,可以自由取值的數(shù)據(jù)只有n-2個回歸估計方差MSE的平方根,就是回歸估計的標準差,也可稱為回歸估計的標準誤差或估計標準誤,其計算公式為:一般地:Se越小,實際觀測點與所擬合的樣本回歸方程的離差程度越小,樣本回歸方程具有較強的代表性。Se越大,實際觀測點與所擬合的樣本回歸方程的離差程度越大,樣本回歸方程具有較差的代表性。例:仍以前面的10名同學的身高和體重資料為例,計算回歸估計的標準誤差

0——95546330322792205701670Σ-0.2910.552-3.6061.2366.0791.921-8.236-1.3945.448-1.70947.29149.44851.60653.76455.92158.07960.23662.39464.55266.709742680007776902010292100808840104921218011440220925002304302538443600272137214900422524964256002624426896275562822428900295843027

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論