第八章 相關(guān)與回歸分析71.17白_第1頁
第八章 相關(guān)與回歸分析71.17白_第2頁
第八章 相關(guān)與回歸分析71.17白_第3頁
第八章 相關(guān)與回歸分析71.17白_第4頁
第八章 相關(guān)與回歸分析71.17白_第5頁
已閱讀5頁,還剩101頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第八章

相關(guān)與回歸分析學(xué)習(xí)目標(biāo)

通過本章的學(xué)習(xí),熟悉相關(guān)分析和回歸分析的內(nèi)容和方法,掌握相關(guān)關(guān)系的判斷、相關(guān)系數(shù)的含義和計算,掌握一元線性回歸分析的參數(shù)估計、估計標(biāo)準(zhǔn)誤差,了解多元線性回歸分析的一般程序,能夠運用相關(guān)分析和回歸分析對數(shù)據(jù)進(jìn)行分析處理。

根據(jù)表格所給數(shù)據(jù)思考以下問題:銷售人員序號工齡/年每年銷售額/萬元12345678910111213164468101013115157342026405056708270

銷售人員的工齡對其年銷售額有影響嗎?是工齡越長銷售額就一定越高嗎?它們之間是什么關(guān)系?

第一節(jié)相關(guān)分析的概述一、相關(guān)關(guān)系的概念1.函數(shù)關(guān)系

函數(shù)關(guān)系是指事物或現(xiàn)象之間存在著嚴(yán)格的依存關(guān)系,其主要特征是它的確定性,即對一個變量的每一個值,另一個變量都具有惟一確定的值與之相對應(yīng)。變量之間的函數(shù)關(guān)系通??梢杂煤瘮?shù)式確切地表示出來。例如,圓的周長C對于半徑r的依存關(guān)系就是函數(shù)關(guān)系:C=2πr。

一、相關(guān)關(guān)系的概念2.相關(guān)關(guān)系如果我們所研究的事物或現(xiàn)象之間,存在著一定的數(shù)量關(guān)系,即當(dāng)一個或幾個相互聯(lián)系的變量取一定數(shù)值時,與之相對應(yīng)的另一變量的值雖然不確定,但按某種規(guī)律在一定的范圍內(nèi)變化。我們把變量之間的這種不穩(wěn)定、不精確的變化關(guān)系稱為相關(guān)關(guān)系。一、相關(guān)關(guān)系的概念相關(guān)關(guān)系反映出變量之間雖然相互影響,其特點表現(xiàn)為:第一,變量之間確實存在數(shù)量上的相互依存關(guān)系,即一個變量發(fā)展數(shù)量上的變化時,另一個變量也會相應(yīng)地發(fā)生數(shù)量上的變化。如人的身高和體重,一般而言,身高者體重也重。第二,變量之間依存關(guān)系的具體數(shù)值是不確定的,如具有同一身高的人,體重卻有差異。之所以會發(fā)生這種情況,是因為影響變量發(fā)生變化的因素不止一個,還有許多其他因素。如人的體重除了與身高有關(guān)以外,還與胖瘦有關(guān)。

二、相關(guān)關(guān)系的種類從不同的分類角度進(jìn)行分析,相關(guān)關(guān)系可以有多種分類。1.根據(jù)相關(guān)程度的不同,相關(guān)關(guān)系可分為完全相關(guān)、不完全相關(guān)和無相關(guān)。二、相關(guān)關(guān)系的種類

當(dāng)一種現(xiàn)象的數(shù)量變化完全由另一種現(xiàn)象的數(shù)量變化所確定,這兩種現(xiàn)象間的關(guān)系為完全相關(guān)。例如,在價格保持不變的情況下,某種商品的銷售總額與其銷售量之間的關(guān)系總是成正比。在這種情況下,相關(guān)關(guān)系就是變成了函數(shù)關(guān)系。因此我們也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一個特例。

二、相關(guān)關(guān)系的種類如果兩個現(xiàn)象之間互不影響,其數(shù)量變化各自獨立,我們稱其為不相關(guān)現(xiàn)象。例如,一般認(rèn)為學(xué)習(xí)成績的高低與天氣變化是不相關(guān)的。

二、相關(guān)關(guān)系的種類

如果兩種現(xiàn)象之間的關(guān)系介于不相關(guān)和完全相關(guān)之間,則稱其為不完全相關(guān)。通常我們看到的相關(guān)現(xiàn)象都屬于這種不完全相關(guān)。

二、相關(guān)關(guān)系的種類2.根據(jù)變量值變動方向的趨勢,相關(guān)關(guān)系可分為正相關(guān)和負(fù)相關(guān)。

正相關(guān)是指一個變量數(shù)值增加或減少時,另一個變量的數(shù)值也隨之增加或減少,兩個變量變化方向相同。例如,技能水平隨著練習(xí)次數(shù)的增加而提高。二、相關(guān)關(guān)系的種類

負(fù)相關(guān)是指兩個變量變化方向相反,即隨著一個變量數(shù)值的增加,另一個變量的數(shù)值反而減少;或隨著一個變量數(shù)值的減少,另一個變量數(shù)值反而增加。例如,練習(xí)次數(shù)與遺忘量之間的相關(guān)關(guān)系。二、相關(guān)關(guān)系的種類3.從相關(guān)關(guān)系的不同形式來看,相關(guān)關(guān)系可分為線性相關(guān)與非線性相關(guān)。

線性相關(guān)也稱為直線相關(guān),它是指相關(guān)的變量中,如果自變量變動時,因變量大致地圍繞一條直線發(fā)生變動。

非線性相關(guān)也稱為曲線相關(guān),它是指相關(guān)的變量中,如果自變量變動時,因變量大致地圍繞一條曲線發(fā)生變動。

二、相關(guān)關(guān)系的種類4.根據(jù)研究變量的多少,可分為單相關(guān)、復(fù)相關(guān)。所研究的只是兩個變量之間的相關(guān)關(guān)系,可稱為單相關(guān)。例如,我們研究的是學(xué)生數(shù)學(xué)成績與物理成績之間的關(guān)系,這種相關(guān)關(guān)系就是單相關(guān)。

二、相關(guān)關(guān)系的種類

如果所研究的是一個變量與兩個或兩個以上的其它變量的相關(guān)關(guān)系,稱為復(fù)相關(guān)。例如,研究人的營養(yǎng)與人的身高、體重之間的關(guān)系,學(xué)生的學(xué)習(xí)成績與其學(xué)習(xí)動機(jī)、方法、習(xí)慣等方面的關(guān)系,都屬于復(fù)相關(guān)。

三、相關(guān)分析的作用

相關(guān)分析在教育研究中的作用是多方面的,具體概括如下:

1.判斷變量之間有無聯(lián)系

2.確定選擇相關(guān)關(guān)系的表現(xiàn)形式及相關(guān)分析方法3.把握相關(guān)關(guān)系的方向與密切程度

三、相關(guān)分析的作用4.相關(guān)分析不但可以描述變量之間的關(guān)系狀況,而且用來進(jìn)行預(yù)測。另外,相關(guān)分析還可以用來評價測量量具的信度、效度以及項目的區(qū)分度等。第二節(jié)相關(guān)關(guān)系的測定方法

一、相關(guān)表

相關(guān)表是一種統(tǒng)計表。它是直接根據(jù)現(xiàn)象之間的原始資料,將一變量的若干變量值表按從小到大的順序排列,并將另一變量的值與之對應(yīng)排列形成的統(tǒng)計表。表8-1為某公司A產(chǎn)品廣告費與銷售收入相關(guān)表。

表8-1某公司A產(chǎn)品廣告費與銷售收入相關(guān)表年份2001200220032004200520062007200820092010年廣告費2234566677年銷售收入50515253535455565657

從表8-1中可以直觀地看出,銷售收入隨著廣告費得增加而增長,二者之間存在著一定的正相關(guān)關(guān)系。

二、相關(guān)圖

相關(guān)圖也稱相關(guān)散點圖或散點圖,是將具有相關(guān)關(guān)系的兩個變量值描繪在坐標(biāo)圖上,以橫軸表示自變量x,縱軸表示因變量y,按兩變量的對應(yīng)值標(biāo)出坐標(biāo)點的分布狀況的統(tǒng)計圖。通過點的分布狀況,可以直觀地大致判斷出兩個現(xiàn)象之間存在的關(guān)系性質(zhì)和密切程度。根據(jù)表8-1繪制相關(guān)圖,如圖8-1所示。二、相關(guān)圖圖8-1A產(chǎn)品廣告費與銷售收入相關(guān)圖三、相關(guān)系數(shù)

(一)相關(guān)系數(shù)的概念和計算公式

相關(guān)系數(shù)是反映變量之間相關(guān)關(guān)系密切程度的統(tǒng)計分析指標(biāo)?,F(xiàn)象間的相關(guān)關(guān)系有直線相關(guān)和曲線相關(guān),現(xiàn)象之間的特征不同,其統(tǒng)計指標(biāo)的名稱也有所不同:反映兩變量間線性相關(guān)關(guān)系密切程度的統(tǒng)計分析指標(biāo)稱為相關(guān)系數(shù);反映兩變量間曲線相關(guān)關(guān)系密切程度的統(tǒng)計分析指標(biāo)稱為非線性相關(guān)系數(shù)、曲線指數(shù);反映多元線性相關(guān)關(guān)系的統(tǒng)計指標(biāo)稱為復(fù)相關(guān)系數(shù)。

三、相關(guān)系數(shù)

線性的單相關(guān)系數(shù),是指在直線相關(guān)條件下,用以反映兩變量向線性相關(guān)關(guān)系密切程度的統(tǒng)計分析指標(biāo)。相關(guān)系數(shù)具有如下特點:相關(guān)系數(shù)有正負(fù)號,反映正相關(guān)或負(fù)相關(guān);兩變量為對等關(guān)系,可以不區(qū)分自變量和因變量,其相關(guān)系數(shù)只有一個值。三、相關(guān)系數(shù)

相關(guān)系數(shù)的計算方法有若干種,常用的基本方法是由英國統(tǒng)計學(xué)家皮爾遜(KarlPearson)提出的積差法。三、相關(guān)系數(shù)積差法對相關(guān)系數(shù)定義為:兩變量的協(xié)方差與兩變量各自標(biāo)準(zhǔn)差乘積之比。相關(guān)系數(shù)通常用r表示,其計算公式為:

三、相關(guān)系數(shù)上式中:

,是變量x和y之間的協(xié)方差;,是變量x的標(biāo)準(zhǔn)差;,是變量y的標(biāo)準(zhǔn)差。三、相關(guān)系數(shù)(二)相關(guān)系數(shù)的特點1.r的取值介于-1與1之間,r的取值范圍是[-1,1]。2.在大多數(shù)情況下,0<|r|<1,即X與Y的樣本觀測值之間存在著一定的線性關(guān)系,當(dāng)r>0時,X與Y為正相關(guān),當(dāng)r<0時,X與Y為負(fù)相關(guān)。

三、相關(guān)系數(shù)|r|的數(shù)值愈接近于1,表示x與y直線相關(guān)程度愈高;反之,|r|的數(shù)值愈接近于0,表示x與y直線相關(guān)程度愈低。通常判斷的標(biāo)準(zhǔn)是:|r|<0.3稱為微弱相關(guān),0.3≤|r|<0.5稱為低度相關(guān),0.5≤|r|<0.8稱為顯著相關(guān),0.8≤|r|<1稱為高度相關(guān)或強(qiáng)相關(guān)。

三、相關(guān)系數(shù)3.如果|r|=1,則表明X與Y完全線性相關(guān),當(dāng)r=1時,稱為完全正相關(guān),而r=-1時,稱為完全負(fù)相關(guān)。4.r是對變量之間線性相關(guān)關(guān)系的度量。r=0只是表明兩個變量之間不存在線性關(guān)系,它并不意味著X與Y之間不存在其他類型的關(guān)系。四、Excel在相關(guān)分析中的運用1.相關(guān)圖的繪制利用Excel中的圖表繪制功能繪制散點圖,以圖8-1為例,具體操作步驟如下:第一步,單擊Excel圖表向?qū)Вɑ騿螕舨迦?,選擇“圖表”選項),在“圖表類型”中選擇“XY散點圖”,如圖8-2所示。圖8-2XY散點圖對話框

四、Excel在相關(guān)分析中的運用第二步,在“子圖表類型”中選擇第一種散點圖,并單擊“下一步”按鈕,按照圖表向?qū)нM(jìn)行操作,單擊“完成”按鈕,并對圖形進(jìn)行修飾編輯,最后得到如圖8-1所示A產(chǎn)品廣告費與銷售收入散點圖。

四、Excel在相關(guān)分析中的運用2.相關(guān)系數(shù)的計算Excel中提供“CORREL”函數(shù)計算相關(guān)系數(shù)。此外,也可以利用Excel的數(shù)據(jù)分析工具。

四、Excel在相關(guān)分析中的運用(1)“CORREL”函數(shù)以表8-1中的數(shù)據(jù)為例,介紹用“CORREL”函數(shù)計算相關(guān)系數(shù)的操作步驟如下:第一步,建立Excel數(shù)據(jù)庫。第二步,打開“CORREL”對話框。單擊“插入”選擇“函數(shù)”對話框,在類別中選擇“統(tǒng)計”,選擇“CORREL”函數(shù),打開“CORREL”對話框。

四、Excel在相關(guān)分析中的運用第三步,對話框設(shè)置。在“Array1”和“Array2”中分別輸入廣告費和銷售收入數(shù)據(jù),如圖8-3所示。單擊“確定”按鈕,得到廣告費和銷售收入的相關(guān)系數(shù)為0.955,可以判斷廣告費和銷售收入之間是高度正相關(guān)。

圖8-3“函數(shù)參數(shù)”對話框設(shè)置

四、Excel在相關(guān)分析中的運用(2)“相關(guān)系數(shù)”數(shù)據(jù)分析工具第一步,數(shù)據(jù)庫建立。

“相關(guān)系數(shù)”數(shù)據(jù)分析工具的數(shù)據(jù)需要按列計算,所以,將廣告費與銷售收入按列排列輸入Excel表格。第二步,打開“相關(guān)系數(shù)”對話框。打開“工具”,單擊“數(shù)據(jù)分析”,選擇“相關(guān)系數(shù)”,打開“相關(guān)系數(shù)”對話框,如圖8-4所示。圖8-4“相關(guān)系數(shù)”對話框

四、Excel在相關(guān)分析中的運用設(shè)置對話框,輸入數(shù)據(jù)區(qū)域,在“輸出選項”中任選一空單元格,單擊“確定”按鈕,得到相關(guān)系數(shù),如圖8-5所示,可知廣告費和銷售收入的相關(guān)系數(shù)為0.955,與“CORREL”工具計算結(jié)果一致。圖8-5“相關(guān)系數(shù)”數(shù)據(jù)分析工具計算結(jié)果第三節(jié)一元線性回歸分析

一、一元線性回歸分析綜述(一)回歸分析的概念與特點(二)回歸分析的分類(三)回歸分析的內(nèi)容(四)相關(guān)分析與回歸分析比較

(一)回歸分析的概念與特點1.回歸分析的概念

回歸分析是指對具有相關(guān)關(guān)系的變量,依據(jù)其關(guān)系形態(tài)、選擇一個合適的數(shù)學(xué)模型,用來近似的表示變量之間數(shù)量平均變化關(guān)系的一種統(tǒng)計方法。它可將相關(guān)現(xiàn)象間不確定的、不規(guī)則的數(shù)量關(guān)系一般化、規(guī)則化。采用的方法是擬合直線或曲線,用這種直線或曲線來代表現(xiàn)象之間的一般數(shù)量關(guān)系。

(一)回歸分析的概念與特點2.回歸分析的特點(1)回歸分析的兩個變量是非對等關(guān)系。(2)回歸分析中,因變量是隨機(jī)變量,自變量是可控變量。(二)回歸分析的分類按統(tǒng)計研究對象和目的的不同,回歸分析有不同的分類。1.一元回歸與多元回歸根據(jù)自變量的個數(shù)不同,可分為一元分析和多元回歸分析。當(dāng)只有一個自變量時,稱為一元回歸分析(也稱簡單回歸分析);當(dāng)自變量有兩個或多個時,稱為多元回歸分析。(二)回歸分析的分類2.線性回歸分析和非線性回歸分析根據(jù)變量間相互關(guān)系的形態(tài)不同,可分線性回歸分析和非線性回歸分析。根據(jù)回歸分析的方法,得出的數(shù)學(xué)表達(dá)式稱為回歸方程(回歸模型)。它有多種形式,可以是直線方程,也可以是曲線方程。若擬合的是直線方程則為線性回歸分析;擬合曲線方程,則為非線性回歸分析。

(二)回歸分析的分類

用回歸方程來表明兩個變量之間線性相互關(guān)系的方程式,稱為一元線性回歸方程(模型),這種分析方法稱為一元線性回歸分析,也稱簡單線性回歸分析。(三)回歸分析的內(nèi)容

回歸分析是指將具有相關(guān)關(guān)系現(xiàn)象的變量轉(zhuǎn)變?yōu)楹瘮?shù)關(guān)系,即通過建立變量間的熟悉模型來研究變量間相關(guān)關(guān)系的一種統(tǒng)計分析方法。具體內(nèi)容包括兩個方面:

(三)回歸分析的內(nèi)容1.確定現(xiàn)象之間相關(guān)關(guān)系的數(shù)學(xué)模型回歸方程式。2.測定數(shù)學(xué)模型的擬合精度。統(tǒng)計學(xué)上一般通過計算估計標(biāo)準(zhǔn)誤差測定所建模型的精確度。(四)相關(guān)分析與回歸分析比較二者的區(qū)別主要體現(xiàn)在以下三個方面:1.在相關(guān)分析中涉及的變量不存在自變量和因變量的劃分問題,變量之間的關(guān)系是對等的;而在回歸分析中,則必須根據(jù)研究對象的性質(zhì)和研究分析的目的,對變量進(jìn)行自變量和因變量的劃分。因此,在回歸分析中,變量之間的關(guān)系是不對等的。

(四)相關(guān)分析與回歸分析比較2.在相關(guān)分析中所有的變量都必須是隨機(jī)變量;而在回歸分析中,自變量是給定的,因變量才是隨機(jī)的,即將自變量的給定值代入回歸方程后,所得到的因變量的估計值不是惟一確定的,而會表現(xiàn)出一定的隨機(jī)波動性。(四)相關(guān)分析與回歸分析比較3.相關(guān)分析主要是通過一個指標(biāo)即相關(guān)系數(shù)來反映變量之間相關(guān)程度的大小,由于變量之間是對等的,因此相關(guān)系數(shù)是惟一確定的。而在回歸分析中,對于互為因果的兩個變量(如人的身高與體重,商品的價格與需求量),則有可能存在多個回歸方程。

(四)相關(guān)分析與回歸分析比較

需要指出的是,變量之間是否存在“真實相關(guān)”,是由變量之間的內(nèi)在聯(lián)系所決定的。相關(guān)分析和回歸分析只是定量分析的手段,通過相關(guān)分析和回歸分析,雖然可以從數(shù)量上反映變量之間的聯(lián)系形式及其密切程度,但是無法準(zhǔn)確判斷變量之間內(nèi)在聯(lián)系的存在與否,也無法判斷變量之間的因果關(guān)系。因此,在具體應(yīng)用過程中,一定要始終注意把定性分析和定量分析結(jié)合起來,在準(zhǔn)確的定性分析的基礎(chǔ)上展開定量分析。二、一元線性回歸方程的建立與應(yīng)用

(一)一元線性回歸模型(二)一元線性回歸模型的預(yù)測應(yīng)用(一)一元線性回歸模型

在相關(guān)圖中,如果自變量與因變量對應(yīng)的散布點近似為直線,或計算出的相關(guān)系數(shù)具有顯著的直線相關(guān)關(guān)系時,都可擬合一條回歸直線。一元線性回歸分析有下列特點:

(一)一元線性回歸模型1.兩個變量之間不是對等關(guān)系,進(jìn)行回歸分析時,應(yīng)先根據(jù)研究目的,確定自變量和因變量。2.回歸方程的作用在于給出自變量的值估計推算因變量的值,回歸方程表明變量間的變動關(guān)系。(一)一元線性回歸模型3.回歸方程中自變量的系數(shù)稱為回歸系數(shù),回歸系數(shù)有正負(fù)號,正號表明回歸方程配合的是一條上升的直線,負(fù)號表明回歸方程配合的是一條下降的直線。4.回歸方程要求自變量是給定的數(shù)值,因變量是隨機(jī)變量。

假設(shè)有兩個現(xiàn)象分別表現(xiàn)為自變量x和因變量y,配合一元線性回歸方程:

式中y——因變量y的理論估計值,是被解釋變量;

x——自變量x的實際值,是解釋變量;

a、b——待定參數(shù)。其幾何意義是a是直線方程的截距,b是斜率。其經(jīng)濟(jì)意義是a是當(dāng)x為零時y的估計值,b是當(dāng)x每變動一個單位時,y平均變動的數(shù)量,b也叫回歸系數(shù)。當(dāng)b的符號為正時,表示兩個變量正相關(guān),當(dāng)b的符號為負(fù)時,表示兩個變量負(fù)相關(guān)。

(一)一元線性回歸模型

數(shù)學(xué)上已證明符合“離差平方和最小”的直線是最合適的。在這條直線上,據(jù)以推算的理論值,與實際值離差的平方和,比其他任何直線推算的數(shù)值都要小。這種決定直線方程的方法,稱為最小二乘法。

(一)一元線性回歸模型用表示對的離差平方和,則:(一)一元線性回歸模型將直線方程代入上式,得:(一)一元線性回歸模型為使具有最大值,必須使其對a、b的偏導(dǎo)數(shù)等于0,令:

(一)一元線性回歸模型整理得估計參數(shù)a、b的標(biāo)準(zhǔn)方程組:

(一)一元線性回歸模型由方程可得a、b的解:

(一)一元線性回歸模型再將求出的a、b代入線性方程,就得到直線回歸分析模型:

(二)一元線性回歸模型的預(yù)測應(yīng)用【例8-1】表8-2為我國20年以來國內(nèi)生產(chǎn)總值(億元)與居民人均消費水平(元)的相關(guān)資料,若2007年國內(nèi)生產(chǎn)總值為24.66萬億元,試用一元線性回歸預(yù)測2007年居民人均最終消費額。表8-2國內(nèi)生產(chǎn)總值與居民最終消費資料年份國內(nèi)生產(chǎn)總值/億元人均最終消費/億元1987198819891990199119921993199419951996199719981999200020012002200320042005200612058.615042.816992.318667.821781.526923.535333.948197.960793.771176.678973.084402.389677.199214.6109655.2120332.7135822.8159878.3183867.9210871.0565714788833932111613931833235527893002315933463632386941064411492554636111(二)一元線性回歸模型的預(yù)測應(yīng)用解:(1)首先列示計算表(見表8-3一元線性回歸模型參數(shù)計算表)年份國內(nèi)生產(chǎn)總值x/億元人均最終消費y/億元xy1987198819891990199119921993199419951996199719981999200020012002200320042005200612058.615042.816992.318667.821781.526923.535333.948197.960793.771176.678973.084402.389677.199214.6109655.2120332.7135822.8159878.3183867.9210871.05657147888339321116139318332355278930023159334636323869410644114925546361116813109.0010740559.2013389932.4015550277.4020300358.0030046626.0049220122.7088346750.70143169163.50198511537.40237076946.00266626865.70300059576.60360347427.20424255968.80494086066.20599114370.80787400627.501004470337.701288632681.00

145409833.96226285831.84288738259.29348486756.84474433742.25724874852.251248484489.212323037564.413695873959.695066108387.566236734729.007123748245.298041982264.419843536853.1612024262887.0414479958689.2918447832999.8425561070810.8933807404650.4144466578641.00合計1599663.4

55342.0

6338159303.80

194574844447.63

(二)一元線性回歸模型的預(yù)測應(yīng)用(2)計算a、b的參數(shù):

=(二)一元線性回歸模型的預(yù)測應(yīng)用=(二)一元線性回歸模型的預(yù)測應(yīng)用預(yù)測模型為:

=471.58+0.0287三、一元線性回歸估計標(biāo)準(zhǔn)誤差

建立的回歸模型是對客觀情況的一般描述,而作為變化根據(jù)的自變量,很難完全解釋因變量的變動。因此,在運用已建立的回歸模型進(jìn)行預(yù)測時,還需要測算估計標(biāo)準(zhǔn)誤差。

(一)離差總平方和的分解

在直線回歸中,因變量的估計值的大小與實際觀察值是不等的,實際觀察值y的大小圍繞其平均值上下波動,y的這種波動現(xiàn)象稱為變差。變差產(chǎn)生的原因有兩個方面:一方面受自變量x的影響,x取值不同會引起y值的不同;另一方面受其他因素的(包括未知的因素和偶然的因素)影響。

(一)離差總平方和的分解

對每個觀察值來說,變差的大小可通過離差(-)來表示,我們要觀察的不是某一個變量值與估計值的誤差,而是整體的差別情況,則全部n個觀察值的總變差可由這些離差的平方和表示。(二)一元線性回歸模型的預(yù)測應(yīng)用(3)預(yù)測:若2007年國內(nèi)生產(chǎn)總值為24.66萬億元,則

(元)(一)離差總平方和的分解假定給出變量和的樣本觀測值(,),并通過最小二乘法得出樣本回歸直線。的某個觀測值與樣本均值的總離差(-)(一)離差總平方和的分解由此推導(dǎo)出下式:

(一)離差總平方和的分解

是實際觀察值與樣本均值之差的平方和,反映樣本資料中因變量的總變差,稱為總離差平方和。是樣本回歸線上的估計值與樣本均值之差的平方和,反映因變量變異中由回歸直線解釋的部分,稱為回歸平方和或解釋平方和。

(一)離差總平方和的分解

是實際觀察值與估計值之差的平方和,反映因變量變異中不能由回歸直線解釋的部分,稱為殘差平方和。上述總變差的分解在相關(guān)與回歸分析中很重要,通過這種分解可以把各項影響因素的具體影響進(jìn)行估算。

(二)估計標(biāo)準(zhǔn)誤差1.估計標(biāo)準(zhǔn)誤差的概念

上述總離差中,回歸平方和反映的是樣本回歸線上的估計值與樣本均值之差的平方和,殘差平方和是實際觀測值與估計值之差的平方和。當(dāng)利用線性回歸方程和給定的自變量預(yù)測值時,得到的與實際值的誤差稱為估計標(biāo)準(zhǔn)誤差,也稱回歸估計標(biāo)準(zhǔn)誤差。

(二)估計標(biāo)準(zhǔn)誤差它是衡量回歸估計精確度高低或回歸方程代表性大小的統(tǒng)計分析指標(biāo)。估計標(biāo)準(zhǔn)誤差說明理論值(回歸線)的代表性,若估計標(biāo)準(zhǔn)誤差小,表明回歸方程準(zhǔn)確性高,代表性大;反之,估計不夠準(zhǔn)確,代表性小。(二)估計標(biāo)準(zhǔn)誤差2.估計標(biāo)準(zhǔn)誤差的計算方法(1)定義公式估計標(biāo)準(zhǔn)誤差,是指因變量實際值與估計值離差的平均數(shù)。統(tǒng)計上定義殘差平方和除以自由度得到的商的平方根為估計標(biāo)準(zhǔn)誤差,公式為:

(二)估計標(biāo)準(zhǔn)誤差式中——估計標(biāo)準(zhǔn)誤差;

——自由度,因在一元線性回歸方程中,計算兩個參數(shù)a和b,受到兩個方程的約束,失去了兩個自由度。

(二)估計標(biāo)準(zhǔn)誤差(2)簡化公式估計標(biāo)準(zhǔn)誤差公式的含義比較明確,其計算過程表明了估計標(biāo)準(zhǔn)誤差是用平均誤差來表示的,但計算過程比較繁瑣。如果已經(jīng)計算出回歸直線的參數(shù)、之值,可直接利用已有的數(shù)據(jù)計算。其簡化公式如下:

(二)估計標(biāo)準(zhǔn)誤差現(xiàn)采用表8-3的有關(guān)資料為例,說明回歸估計誤差的計算方法。根據(jù)表8-4,按照定義公式計算標(biāo)準(zhǔn)誤差,得

(元)(二)估計標(biāo)準(zhǔn)誤差再按照簡化公式已知:,,結(jié)合表8-4,得

=234.23(元)

表8-4標(biāo)準(zhǔn)誤差計算表

年份

1987198819891990199119921993199419951996199719981999200020012002200320042005200612058.615042.816992.318667.821781.526923.535333.948197.960793.771176.678973.084402.389677.199214.6109655.2120332.7135822.8159878.3183867.9210871.05657147888339321116139318332355278930023159334636323869410644114925546361118189039591007109712441486185522162514273828943045331936193925437050605749652464009357212924130276272251638486494841932175625696967022590601979696250032761168118225817961705696813109.0010740559.2013389932.4015550277.4020300358.0030046626.0049220122.7088346750.70143169163.50198511537.40237076946.00266626865.70300059576.60360347427.20424255968.80494086066.20599114370.80787400627.501004470337.701288632681.0031922550979662094469388986862412454561940449335988955460257778521901200499792811119571613191424149691611685923619456921242556252984436937344321合計

1599663.4

55342.0

55341.9

1002958

6338159303.8

208990876

(二)估計標(biāo)準(zhǔn)誤差

本例的計算中兩種方法稍有差距,屬于計算誤差。計算表明20年以來,人均最終消費的估計值與實際值的平均誤差為236.05萬元(或234.23萬元)。由此可知,只有將回歸估計值與估計標(biāo)準(zhǔn)誤差結(jié)合起來使用才更有意義。(二)估計標(biāo)準(zhǔn)誤差3.估計標(biāo)準(zhǔn)誤差與相關(guān)系數(shù)

相關(guān)系數(shù)是說明現(xiàn)象間相關(guān)關(guān)系密切程度的統(tǒng)計分析指標(biāo),而估計標(biāo)準(zhǔn)誤差是說明回歸估計誤差的大小及回歸方程的代表性高低的統(tǒng)計分析指標(biāo)。這兩個指標(biāo)之間存在著密切的聯(lián)系,表現(xiàn)在數(shù)量上,兩者存在相互的推算關(guān)系。

(二)估計標(biāo)準(zhǔn)誤差兩者的換算公式為:

(二)估計標(biāo)準(zhǔn)誤差

公式中與的相互換算公式的意義在于:從互相聯(lián)系的兩個公式中可以看出與的變化時相反的。當(dāng)越大時,就越小,這時變量間的相關(guān)密切程度較高,回歸直線的代表性就較大;當(dāng)越小時,就越大,這時變量間相關(guān)關(guān)系的密切程度就較低,回歸直線的代表性就較小。

(二)估計標(biāo)準(zhǔn)誤差

在實際的相關(guān)分析中,一般不常用這種方法計算相關(guān)系數(shù),因為這種計算方法存在兩個不足:其一是需要先求出回歸直線方程,計算出估計標(biāo)準(zhǔn)誤差,才能求得相關(guān)系數(shù)。從一般的認(rèn)識程序來看,只有相關(guān)關(guān)系較密切的前提下,配合回歸分析方程才有意義;如果相關(guān)關(guān)系不夠密切,回歸分析就沒有進(jìn)行的必要,因而要求先計算相關(guān)系數(shù)來判斷相關(guān)關(guān)系的密切程度。其二是以這種方法計算出的r,難以判斷是正相關(guān)還是負(fù)相關(guān)。

四、Excel在回歸分析中的運用Excel

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論