相關(guān)與回歸分析_第1頁
相關(guān)與回歸分析_第2頁
相關(guān)與回歸分析_第3頁
相關(guān)與回歸分析_第4頁
相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩92頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

相關(guān)與回歸分析第一頁,共九十七頁,編輯于2023年,星期三1第一節(jié)相關(guān)與回歸分析的基本概念一、函數(shù)關(guān)系與相關(guān)關(guān)系1.函數(shù)關(guān)系當(dāng)一個(gè)或幾個(gè)變量取一定的值時(shí),另一個(gè)變量有確定值與之相對(duì)應(yīng),我們稱這種關(guān)系為確定性的函數(shù)關(guān)系。第二頁,共九十七頁,編輯于2023年,星期三2(函數(shù)關(guān)系)(1)是一一對(duì)應(yīng)的確定關(guān)系(2)設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x

,當(dāng)變量x取某個(gè)數(shù)值時(shí),

y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量(3)各觀測點(diǎn)落在一條線上

xy第三頁,共九十七頁,編輯于2023年,星期三3變量間的關(guān)系

(函數(shù)關(guān)系)函數(shù)關(guān)系的例子某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y=p

x(p為單價(jià))圓的面積(S)與半徑之間的關(guān)系可表示為S=r2

企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)

、單位產(chǎn)量消耗(x2)

、原材料價(jià)格(x3)之間的關(guān)系可表示為y=x1x2x3

第四頁,共九十七頁,編輯于2023年,星期三42.相關(guān)關(guān)系:當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)的另一變量的值雖然不確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。

現(xiàn)象之間客觀存在的不嚴(yán)格、不確定的數(shù)量依存關(guān)系。第五頁,共九十七頁,編輯于2023年,星期三5變量間的關(guān)系

(相關(guān)關(guān)系)(1)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá);(2)一個(gè)變量的取值不能由另一個(gè)變量唯一確定;(3)當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè);(4)各觀測點(diǎn)分布在直線周圍。xy第六頁,共九十七頁,編輯于2023年,星期三6(相關(guān)關(guān)系)相關(guān)關(guān)系的例子商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品的消費(fèi)量(y)與物價(jià)(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系第七頁,共九十七頁,編輯于2023年,星期三7二、相關(guān)關(guān)系的種類1.按相關(guān)關(guān)系的程度劃分可分為完全相關(guān),不完全相關(guān)和不相關(guān)。2.按相關(guān)形式劃分可以分為線性相關(guān)和非線性相關(guān)。第八頁,共九十七頁,編輯于2023年,星期三8(1)正相關(guān):兩個(gè)相關(guān)現(xiàn)象間,當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),另一個(gè)變量的數(shù)值也隨之增加(或減少),即同方向變化。例如收入與消費(fèi)的關(guān)系。(2)負(fù)相關(guān):當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),而另一個(gè)變量的數(shù)值相反地呈減少(或增加)趨勢變化,即反方向變化。例如物價(jià)與消費(fèi)的關(guān)系。3.按相關(guān)的方向劃分可分為正相關(guān)和負(fù)相關(guān)第九頁,共九十七頁,編輯于2023年,星期三94.按相關(guān)關(guān)系涉及的變量多少劃分分為單相關(guān)、復(fù)相關(guān)和偏相關(guān)。兩個(gè)變量之間的相關(guān),稱為單相關(guān)。當(dāng)所研究的是一個(gè)變量對(duì)兩個(gè)或兩個(gè)以上其他變量的相關(guān)關(guān)系時(shí),稱為復(fù)相關(guān)。例如,某種商品的需求與其價(jià)格水平以及收入水平之間的相關(guān)關(guān)系便是一種復(fù)相關(guān)。在某一現(xiàn)象與多種現(xiàn)象相關(guān)的場合,假定其他變量不變,專門考察其中兩個(gè)變量的相關(guān)關(guān)系稱為偏相關(guān)。例如,在假定人們的收入水平不變的條件下,某種商品的需求與其價(jià)格水平的關(guān)系就是一種偏相關(guān)。第十頁,共九十七頁,編輯于2023年,星期三10三、相關(guān)分析與回歸分析(一)概念:1.相關(guān)分析就是用一個(gè)指標(biāo)來表明現(xiàn)象間相互依存關(guān)系的密切程度。廣義的相關(guān)分析包括相關(guān)關(guān)系的分析(狹義的相關(guān)分析)和回歸分析。2.回歸分析是指對(duì)具有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其相關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)學(xué)模型(稱為回歸方程式),用來近似地表達(dá)變量間的平均變化關(guān)系的一種統(tǒng)計(jì)分析方法。第十一頁,共九十七頁,編輯于2023年,星期三11(二)相關(guān)分析與回歸分析的區(qū)別

1.在相關(guān)分析中,不必確定自變量和因變量;而在回歸分析中,必須事先確定哪個(gè)為自變量,哪個(gè)為因變量,而且只能從自變量去推測因變量,而不能從因變量去推斷自變量。2.相關(guān)分析不能指出變量間相互關(guān)系的具體形式;而回歸分析能確切的指出變量之間相互關(guān)系的具體形式,它可根據(jù)回歸模型從已知量估計(jì)和預(yù)測未知量。3.相關(guān)分析所涉及的變量一般都是隨機(jī)變量,而回歸分析中因變量是隨機(jī)的,自變量則作為研究時(shí)給定的非隨機(jī)變量。第十二頁,共九十七頁,編輯于2023年,星期三12(三)相關(guān)分析與回歸分析的聯(lián)系相關(guān)分析和回歸分析有著密切的聯(lián)系,它們不僅具有共同的研究對(duì)象,而且在具體應(yīng)用時(shí),常常必須互相補(bǔ)充。相關(guān)分析需要依靠回歸分析來表明現(xiàn)象數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在著高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。簡單說:1、相關(guān)分析是回歸分析的基礎(chǔ)和前提;2、回歸分析是相關(guān)分析的深入和繼續(xù)。第十三頁,共九十七頁,編輯于2023年,星期三13定性分析是依據(jù)研究者的理論知識(shí)和實(shí)踐經(jīng)驗(yàn),對(duì)客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷。定量分析在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、計(jì)算相關(guān)系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度。四、相關(guān)關(guān)系的判斷第十四頁,共九十七頁,編輯于2023年,星期三14

(一)相關(guān)表:將自變量x的數(shù)值按照從小到大的順序,并配合因變量y的數(shù)值一一對(duì)應(yīng)而平行排列的表。例:為了研究分析某種勞務(wù)產(chǎn)品完成量與其單位產(chǎn)品成本之間的關(guān)系,調(diào)查30個(gè)同類服務(wù)公司得到的原始數(shù)據(jù)如表。 整理后有第十五頁,共九十七頁,編輯于2023年,星期三15(二)相關(guān)圖:又稱散點(diǎn)圖。將x置于橫軸上,y置于縱軸上,將(x,y)繪于坐標(biāo)圖上。用來反映兩變量之間相關(guān)關(guān)系的圖形。第十六頁,共九十七頁,編輯于2023年,星期三16第二節(jié)簡單線性相關(guān)與回歸分析一、相關(guān)系數(shù)及其檢驗(yàn)(一)相關(guān)系數(shù)的定義

1.簡單相關(guān)系數(shù):在線性條件下說明兩個(gè)變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo),簡稱相關(guān)系數(shù)。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r第十七頁,共九十七頁,編輯于2023年,星期三17第十八頁,共九十七頁,編輯于2023年,星期三18第十九頁,共九十七頁,編輯于2023年,星期三19樣本相關(guān)系數(shù)的定義公式實(shí)質(zhì)第二十頁,共九十七頁,編輯于2023年,星期三20(二)相關(guān)系數(shù)的特點(diǎn)1.r的取值介于-1與1之間,

r

的取值范圍是[-1,1]2.在大多數(shù)情況下,0<|r|<1,即X與Y的樣本觀測值之間存在著一定的線性關(guān)系,當(dāng)r>0時(shí),X與Y為正相關(guān),當(dāng)r<0時(shí),X與Y為負(fù)相關(guān)。

|r|的數(shù)值愈接近于1,表示x與y直線相關(guān)程度愈高;反之,|r|的數(shù)值愈接近于0,表示x與y直線相關(guān)程度愈低。通常判斷的標(biāo)準(zhǔn)是:|r|<0.3稱為微弱相關(guān),0.3≤|r|<0.5稱為低度相關(guān),0.5≤|r|<0.8稱為顯著相關(guān),0.8≤|r|<1稱為高度相關(guān)或強(qiáng)相關(guān)。第二十一頁,共九十七頁,編輯于2023年,星期三213.如果|r|=1,則表明X與Y完全線性相關(guān),當(dāng)r=1時(shí),稱為完全正相關(guān),而r=-1時(shí),稱為完全負(fù)相關(guān)。4.r是對(duì)變量之間線性相關(guān)關(guān)系的度量。

r=0只是表明兩個(gè)變量之間不存在線性關(guān)系,它并不意味著X與Y之間不存在其他類型的關(guān)系。第二十二頁,共九十七頁,編輯于2023年,星期三22相關(guān)關(guān)系的測度

(相關(guān)系數(shù)取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加第二十三頁,共九十七頁,編輯于2023年,星期三23計(jì)算相關(guān)系數(shù)的“積差法”(三)相關(guān)系數(shù)的計(jì)算第二十四頁,共九十七頁,編輯于2023年,星期三24例:下表是有關(guān)15個(gè)地區(qū)某種食物需求量和地區(qū)人口增加量的資料。第二十五頁,共九十七頁,編輯于2023年,星期三25第二十六頁,共九十七頁,編輯于2023年,星期三26計(jì)算公式還可以有:第二十七頁,共九十七頁,編輯于2023年,星期三27(四)相關(guān)系數(shù)的顯著性檢驗(yàn)1、檢驗(yàn)兩個(gè)變量之間是否存在線性相關(guān)關(guān)系2、采用t檢驗(yàn)3、檢驗(yàn)的步驟為提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量:確定顯著性水平,并作出決策若t>t,拒絕H0

若t<t,接受H0第二十八頁,共九十七頁,編輯于2023年,星期三28相關(guān)系數(shù)的顯著性檢驗(yàn)(實(shí)例)

對(duì)前例計(jì)算的相關(guān)系數(shù)進(jìn)行顯著性檢(0.05)提出假設(shè):H0:;H1:0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量根據(jù)顯著性水平=0.05,查t分布表得

t(n-2)=2.160由于t=48.385>t(15-2)=2.160,拒絕H0,該種食物需求量和地區(qū)人口增加量之間的相關(guān)關(guān)系顯著。第二十九頁,共九十七頁,編輯于2023年,星期三29什么是回歸分析?

(內(nèi)容)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確程度二、簡單線性回歸分析第三十頁,共九十七頁,編輯于2023年,星期三30回歸模型與回歸方程第三十一頁,共九十七頁,編輯于2023年,星期三31回歸模型回答“變量之間是什么樣的關(guān)系?”方程中運(yùn)用1個(gè)數(shù)字的因變量(響應(yīng)變量)被預(yù)測的變量1個(gè)或多個(gè)數(shù)字的或分類的自變量(解釋變量)用于預(yù)測的變量3. 主要用于預(yù)測和估計(jì)第三十二頁,共九十七頁,編輯于2023年,星期三32回歸模型的類型一個(gè)自變量兩個(gè)及兩個(gè)以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸第三十三頁,共九十七頁,編輯于2023年,星期三33一元線性回歸模型

(概念要點(diǎn))當(dāng)只涉及一個(gè)自變量時(shí)稱為一元回歸,若因變量y與自變量x之間為線性關(guān)系時(shí)稱為一元線性回歸。對(duì)于具有線性關(guān)系的兩個(gè)變量,可以用一條線性方程來表示它們之間的關(guān)系。描述因變量y如何依賴于自變量x和誤差項(xiàng)

的方程稱為回歸模型。第三十四頁,共九十七頁,編輯于2023年,星期三34標(biāo)準(zhǔn)的一元線性回歸模型

(一)總體回歸函數(shù)Yt=β0+β1Xt+ut(7.5)

ut是隨機(jī)誤差項(xiàng),又稱隨機(jī)干擾項(xiàng),它是一個(gè)特殊的隨機(jī)變量,反映未列入方程式的其他各種因素對(duì)Y的影響。

(二)樣本回歸函數(shù):

(t=1,2,...n)

et稱為殘差,在概念上,et與總體誤差項(xiàng)ut相互對(duì)應(yīng);n是樣本的容量。第三十五頁,共九十七頁,編輯于2023年,星期三35一元線性回歸模型

(概念要點(diǎn))對(duì)于只涉及一個(gè)自變量的簡單線性回歸模型可表示為

yt

=b0+b1x+et模型中,y是x的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化誤差項(xiàng)t

是隨機(jī)變量反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對(duì)y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)第三十六頁,共九十七頁,編輯于2023年,星期三36樣本回歸函數(shù)與總體回歸函數(shù)區(qū)別1、總體回歸線是未知的,只有一條。樣本回歸線是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一組樣本,便可以擬合一條樣本回歸線。2、總體回歸函數(shù)中的β1和β2是未知的參數(shù),表現(xiàn)為常數(shù)。而樣本回歸函數(shù)中的是隨機(jī)變量,其具體數(shù)值隨所抽取的樣本觀測值不同而變動(dòng)。3、總體回歸函數(shù)中的ut是Yt與未知的總體回歸線之間的縱向距離,它是不可直接觀測的。而樣本回歸函數(shù)中的et是Yt與樣本回歸線之間的縱向距離,當(dāng)根據(jù)樣本觀測值擬合出樣本回歸線之后,可以計(jì)算出et的具體數(shù)值。第三十七頁,共九十七頁,編輯于2023年,星期三37(三)誤差項(xiàng)的基本標(biāo)準(zhǔn)假定誤差項(xiàng)ut是一個(gè)期望值為0的隨機(jī)變量,即E(ut)=0。對(duì)于一個(gè)給定的x值,y的期望值為E(yt

)=0+

1xt對(duì)于所有的x值,ut的方差σ2都相同誤差項(xiàng)ut是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即u~N(0,σ2)獨(dú)立性意味著對(duì)于一個(gè)特定的x值,它所對(duì)應(yīng)的u與其他x值所對(duì)應(yīng)的u不相關(guān)對(duì)于一個(gè)特定的x值,它所對(duì)應(yīng)的yt值與其他xt所對(duì)應(yīng)的y值也不相關(guān)第三十八頁,共九十七頁,編輯于2023年,星期三38總體回歸線與隨機(jī)誤差項(xiàng)P168

E(Yt)=β1+β2XtXYtY。。。。。ut

第三十九頁,共九十七頁,編輯于2023年,星期三39(四)回歸方程(概念要點(diǎn))描述y的平均值或期望值如何依賴于x的方程稱為回歸方程。簡單線性回歸方程的形式如下

E(y)=0+1x方程的圖示是一條直線,因此也稱為直線回歸方程0是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值第四十頁,共九十七頁,編輯于2023年,星期三40估計(jì)(經(jīng)驗(yàn))的回歸方程簡單線性回歸中估計(jì)的回歸方程為其中:是估計(jì)的回歸直線在y軸上的截距,是直線的斜率,它表示對(duì)于一個(gè)給定的x的值,是y的估計(jì)值,也表示x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值。

用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程??傮w回歸參數(shù)和

是未知的,必需利用樣本數(shù)據(jù)去估計(jì)第四十一頁,共九十七頁,編輯于2023年,星期三41三、參數(shù)0和1的最小二乘估計(jì)第四十二頁,共九十七頁,編輯于2023年,星期三42(一)最小二乘法

(概念要點(diǎn))使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小。第四十三頁,共九十七頁,編輯于2023年,星期三43最小二乘法(圖示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^第四十四頁,共九十七頁,編輯于2023年,星期三443、回歸系數(shù)的估計(jì)的最小二乘法公式

設(shè)將Q對(duì)求偏導(dǎo)數(shù),并令其等于零,可得:

加以整理后有:

第四十五頁,共九十七頁,編輯于2023年,星期三45最小二乘法

和的計(jì)算公式)解方程組可得求解和的標(biāo)準(zhǔn)方程如下:第四十六頁,共九十七頁,編輯于2023年,星期三46例:現(xiàn)以前例的資料配合回歸直線,計(jì)算如下:第四十七頁,共九十七頁,編輯于2023年,星期三47第四十八頁,共九十七頁,編輯于2023年,星期三48上式中b表示人口增加量每增加(或減少)1千人,該種食品的年需求量平均來說增加(或減少)0.5301十噸即5.301噸。第四十九頁,共九十七頁,編輯于2023年,星期三49估計(jì)方程的求法

(Excel的輸出結(jié)果)第五十頁,共九十七頁,編輯于2023年,星期三50(二)估計(jì)標(biāo)準(zhǔn)誤差Sy實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根。反映實(shí)際觀察值在回歸直線周圍的分散狀況。從另一個(gè)角度說明了回歸直線的擬合程度。計(jì)算公式為由樣本資料計(jì)算由總體資料計(jì)算或在大樣本情況下第五十一頁,共九十七頁,編輯于2023年,星期三51計(jì)算例子第五十二頁,共九十七頁,編輯于2023年,星期三52可得簡化式:(P172)上式的推導(dǎo)證明(P172)第五十三頁,共九十七頁,編輯于2023年,星期三53了解(三)最小二乘估計(jì)量的性質(zhì)(四)回歸系數(shù)的區(qū)間估計(jì)第五十四頁,共九十七頁,編輯于2023年,星期三54四、一元線性回歸模型的檢驗(yàn)第五十五頁,共九十七頁,編輯于2023年,星期三55(一)回歸模型檢驗(yàn)的種類回歸模型的檢驗(yàn)包括理論意義檢驗(yàn)、一級(jí)檢驗(yàn)和二級(jí)檢驗(yàn)。(二)擬合程度的評(píng)價(jià)所謂擬合程度,是指樣本觀測值聚集在樣本回歸線周圍的緊密程度。判斷回歸模型擬合程度優(yōu)劣最常用的數(shù)量尺度是樣本決定系數(shù)(又稱決定系數(shù))。它是建立在對(duì)總離差平方和進(jìn)行分解的基礎(chǔ)之上的。第五十六頁,共九十七頁,編輯于2023年,星期三56總離差平方和的分解因變量y的取值是不同的,y取值的這種波動(dòng)稱為變差。變差來源于兩個(gè)方面:由于自變量x的取值不同造成的;除x以外的其他因素(如x對(duì)y的非線性影響、測量誤差等)的影響。對(duì)一個(gè)具體的觀測值來說,變差的大小可以通過該實(shí)際觀測值與其均值之差來表示。第五十七頁,共九十七頁,編輯于2023年,星期三57離差平方和的分解

(圖示)xyy{}}離差分解圖第五十八頁,共九十七頁,編輯于2023年,星期三58離差平方和的分解

(三個(gè)平方和的關(guān)系)2.兩端平方后求和有從圖上看有SST=SSR+SSE總變差平方和(SST){回歸平方和(SSR){殘差平方和(SSE){第五十九頁,共九十七頁,編輯于2023年,星期三59離差平方和的分解

(三個(gè)平方和的意義)總平方和(SST)反映因變量的n個(gè)觀察值與其均值的總離差回歸平方和(SSR)反映自變量x的變化對(duì)因變量y取值變化的影響,或者說,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和。殘差平方和(SSE)反映除x以外的其他因素對(duì)y取值的影響,也稱為不可解釋的平方和或剩余平方和。第六十頁,共九十七頁,編輯于2023年,星期三60樣本決定系數(shù)

(判定系數(shù)r2

)回歸平方和占總離差平方和的比例:反映回歸直線的擬合程度取值范圍在[0,1]之間

r21,說明回歸方程擬合的越好;r20,說明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即r2=(r)2第六十一頁,共九十七頁,編輯于2023年,星期三61(三)回歸方程的顯著性檢驗(yàn)

(線性關(guān)系的檢驗(yàn)

)檢驗(yàn)自變量和因變量之間的線性關(guān)系是否顯著具體方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著如果是顯著的,兩個(gè)變量之間存在線性關(guān)系如果不顯著,兩個(gè)變量之間不存在線性關(guān)系第六十二頁,共九十七頁,編輯于2023年,星期三62回歸方程的顯著性檢驗(yàn)

(檢驗(yàn)的步驟)提出假設(shè)H0:線性關(guān)系不顯著2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F作出決策:若FF,拒絕H0;若F<F,接受H0第六十三頁,共九十七頁,編輯于2023年,星期三63回歸方程的顯著性檢驗(yàn)

(方差分析表)(續(xù)前例)Excel輸出的方差分析表平方和均方1296.526第六十四頁,共九十七頁,編輯于2023年,星期三64回歸系數(shù)的顯著性檢驗(yàn)

(要點(diǎn))在一元線性回歸中,等價(jià)于回歸方程的顯著性檢驗(yàn)檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說,檢驗(yàn)自變量x對(duì)因變量y的影響是否顯著理論基礎(chǔ)是回歸系數(shù)

的抽樣分布第六十五頁,共九十七頁,編輯于2023年,星期三65是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于無未知,需用其估計(jì)量Sy來代替得到的估計(jì)的標(biāo)準(zhǔn)差回歸系數(shù)的顯著性檢驗(yàn)

(樣本統(tǒng)計(jì)量的分布)第六十六頁,共九十七頁,編輯于2023年,星期三66回歸系數(shù)的顯著性檢驗(yàn)

(樣本統(tǒng)計(jì)量的分布)的抽樣分布第六十七頁,共九十七頁,編輯于2023年,星期三67回歸系數(shù)的顯著性檢驗(yàn)

(步驟)提出假設(shè)H0:b1=0(沒有線性關(guān)系)H1:b1

0(有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量確定顯著性水平,并進(jìn)行決策t>t,拒絕H0;t<t,接受H0第六十八頁,共九十七頁,編輯于2023年,星期三68回歸系數(shù)的顯著性檢驗(yàn)

(實(shí)例)提出假設(shè)H0:b1=0人均收入與人均消費(fèi)之間無線性關(guān)系H1:b1

0人均收入與人均消費(fèi)之間有線性關(guān)系計(jì)算檢驗(yàn)的統(tǒng)計(jì)量

t=65.0758>t=2.201,拒絕H0,表明人均收入與人均消費(fèi)之間有線性關(guān)系對(duì)前例的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(=0.05)第六十九頁,共九十七頁,編輯于2023年,星期三69回歸系數(shù)的顯著性檢驗(yàn)

(Excel輸出的結(jié)果)第七十頁,共九十七頁,編輯于2023年,星期三70預(yù)測及應(yīng)用第七十一頁,共九十七頁,編輯于2023年,星期三71利用回歸方程進(jìn)行估計(jì)和預(yù)測根據(jù)自變量x

的取值估計(jì)或預(yù)測因變量y的取值估計(jì)或預(yù)測的類型點(diǎn)估計(jì)y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)區(qū)間估計(jì)y的平均值的置信區(qū)間估計(jì)y的個(gè)別值的預(yù)測區(qū)間估計(jì)第七十二頁,共九十七頁,編輯于2023年,星期三72利用回歸方程進(jìn)行估計(jì)和預(yù)測

(點(diǎn)估計(jì))2.點(diǎn)估計(jì)值3.在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和個(gè)別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估計(jì)中則不同對(duì)于自變量x的一個(gè)給定值x0

,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)值第七十三頁,共九十七頁,編輯于2023年,星期三73利用回歸方程進(jìn)行估計(jì)和預(yù)測

(點(diǎn)估計(jì))

y的平均值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0

,求出因變量y

的平均值的一個(gè)估計(jì)值E(y0),就是平均值的點(diǎn)估計(jì)。第七十四頁,共九十七頁,編輯于2023年,星期三74根據(jù)回歸方程,可以給出自變量的某一數(shù)值來估計(jì)或預(yù)測因變量平均可能值。例如,前例中當(dāng)人口增長量為400千人時(shí),該食品的年需求量為第七十五頁,共九十七頁,編輯于2023年,星期三75利用回歸方程進(jìn)行估計(jì)和預(yù)測

(區(qū)間估計(jì))點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對(duì)于自變量x的一個(gè)給定值x0,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)區(qū)間區(qū)間估計(jì)有兩種類型置信區(qū)間估計(jì)預(yù)測區(qū)間估計(jì)第七十六頁,共九十七頁,編輯于2023年,星期三76利用回歸方程進(jìn)行估計(jì)和預(yù)測

(置信區(qū)間估計(jì))

y的平均值的置信區(qū)間估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量x的一個(gè)給定值x0

,求出因變量y

的平均值E(y0)的估計(jì)區(qū)間,這一估計(jì)區(qū)間稱為置信區(qū)間

E(y0)

在1-置信水平下的置信區(qū)間為式中:Sy為估計(jì)標(biāo)準(zhǔn)誤差第七十七頁,共九十七頁,編輯于2023年,星期三77影響區(qū)間寬度的因素1. 置信水平(1-)區(qū)間寬度隨置信水平的增大而增大2. 數(shù)據(jù)的離散程度(s)區(qū)間寬度隨離散程度的增大而增大3. 樣本容量區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測的xp與x的差異程度區(qū)間寬度隨xp與x的差異程度的增大而增大第七十八頁,共九十七頁,編輯于2023年,星期三78置信區(qū)間、預(yù)測區(qū)間、回歸方程xpyxx預(yù)測上限置信上限預(yù)測下限置信下限第七十九頁,共九十七頁,編輯于2023年,星期三79第三節(jié)多元線性相關(guān)與回歸分析一、多元線性回歸模型一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量之間的回歸描述因變量y如何依賴于自變量x1

,x2

,…,xp

和誤差項(xiàng)

的方程稱為多元線性回歸模型涉及p

個(gè)自變量的多元線性回歸模型可表示為

b0

,b1,b2

,,bp是參數(shù)

是被稱為誤差項(xiàng)的隨機(jī)變量

y是x1,,x2

,,xp

的線性函數(shù)加上誤差項(xiàng)

說明了包含在y里面但不能被p個(gè)自變量的線性關(guān)系所解釋的變異性第八十頁,共九十七頁,編輯于2023年,星期三80多元線性回歸模型

對(duì)于n組實(shí)際觀察數(shù)據(jù)(yi;xi1,,xi2

,,xip),(i=1,2,…,n),多元線性回歸模型可表示為y1

=b0+b1x11+b2x12

++

bpx1p

+e1y2=b0+b1x21

+b2x22

++

bpx2p

+e2

yn=b0+b1xn1

+b2xn2

++

bpxnp

+en{……第八十一頁,共九十七頁,編輯于2023年,星期三81二、參數(shù)的最小二乘法根據(jù)最小二乘法的要求,可得求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得

。即第八十二頁,共九十七頁,編輯于2023年,星期三82三、回歸方程的顯著性檢驗(yàn)

(線性關(guān)系的檢驗(yàn)

)檢驗(yàn)因變量與所有的自變量和之間的是否存在一個(gè)顯著的線性關(guān)系,也被稱為總體的顯著性檢驗(yàn)檢驗(yàn)方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著如果是顯著的,因變量與自變量之間存在線性關(guān)系如果不顯著,因變量與自變量之間不存在線性關(guān)系第八十三頁,共九十七頁,編輯于2023年,星期三83回歸方程的顯著性檢驗(yàn)

(步驟)提出假設(shè)H0:12p=0線性關(guān)系不顯著H1:1,2,,p至少有一個(gè)不等于02.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F3.確定顯著性水平和分子自由度p、分母自由度n-p-1找出臨界值F4.作出決策:若FF,拒絕H0;若F<F,接受H0第八十四頁,共九十七頁,編輯于2023年,星期三84回歸系數(shù)的顯著性檢驗(yàn)

(要點(diǎn))如果F檢驗(yàn)已經(jīng)表明了回歸模型總體上是顯著的,那么回歸系數(shù)的檢驗(yàn)就是用來確定每一個(gè)單個(gè)的自變量xi

對(duì)因變量y的影響是否顯著對(duì)每一個(gè)自變量都要單獨(dú)進(jìn)行檢驗(yàn)應(yīng)用t

檢驗(yàn)在多元線性回歸中,回歸方程的顯著性檢驗(yàn)不再等價(jià)于回歸系數(shù)的顯著性檢驗(yàn)。第八十五頁,共九十七頁,編輯于2023年,星期三85回歸系數(shù)的顯著性檢驗(yàn)(步驟)提出假設(shè)H0:bi=0(自變量xi與

因變量y沒有線性關(guān)系)H1:bi

0(自變量xi與

因變量y有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量t確定顯著性水平,并進(jìn)行決策tt,拒絕H0;t<t,接受H0第八十六頁,共九十七頁,編輯于2023年,星期三86第四節(jié)非線性相關(guān)與回歸分析一、非線性函數(shù)形式的確定在對(duì)實(shí)際的客觀現(xiàn)象進(jìn)行定量分析時(shí),選擇回歸方程的具體形式應(yīng)遵循以下原則:首先,方程形式應(yīng)與有關(guān)實(shí)質(zhì)性科學(xué)的基本理論相一致。例如,采用冪函數(shù)的形式,能夠較好地表現(xiàn)生產(chǎn)函數(shù);采用多項(xiàng)式方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論