第九章相關(guān)與回歸分析_第1頁(yè)
第九章相關(guān)與回歸分析_第2頁(yè)
第九章相關(guān)與回歸分析_第3頁(yè)
第九章相關(guān)與回歸分析_第4頁(yè)
第九章相關(guān)與回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩57頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1第九章相關(guān)與回歸分析經(jīng)濟(jì)管理類核心課程《統(tǒng)計(jì)學(xué)》19.1

相關(guān)分析9.3

多元線性回歸分析9.2

一元線性回歸分析主要內(nèi)容2全球吃死的人比餓死的人多

據(jù)世界衛(wèi)生組織統(tǒng)計(jì),全球肥胖癥患者達(dá)3億人,其中兒童占2200萬(wàn)人,11億人體重過(guò)重。肥胖癥和體重超常早已不是發(fā)達(dá)國(guó)家的“專利”,已遍及五大洲。目前,全球因“吃”致病乃至死亡的人數(shù)已高于因饑餓死亡的人數(shù)。

(引自《光明日?qǐng)?bào)》劉軍/文)

問(wèn)題:肥胖癥和體重超常與死亡人數(shù)有顯著的數(shù)量關(guān)系嗎?

解決:用相關(guān)分析與回歸分析的方法來(lái)驗(yàn)證。3

美國(guó)印第安納州的地區(qū)教會(huì)想要籌款興建新教堂,提出教堂能潔凈人們的心靈,減少犯罪,降低監(jiān)獄服刑人數(shù)的口號(hào)。為了增進(jìn)民眾參與的熱誠(chéng)和信心,教會(huì)的神父收集了近15年的教堂數(shù)與在監(jiān)獄服刑的人數(shù)進(jìn)行統(tǒng)計(jì)分析。

結(jié)果卻令教會(huì)大吃一驚!教堂數(shù)與監(jiān)獄服刑人數(shù)同步增長(zhǎng)4相關(guān)分析結(jié)論

最近15年教堂數(shù)與監(jiān)獄服刑人數(shù)呈顯著的正相關(guān)。那么是否可以由此得出,教堂建得越多,就可能帶來(lái)更多的犯罪呢?經(jīng)過(guò)統(tǒng)計(jì)學(xué)家和教會(huì)神父深入討論,并進(jìn)一步收集近15年的當(dāng)?shù)厝丝谧儎?dòng)資料和犯罪率等資料作進(jìn)一步分析,發(fā)現(xiàn)監(jiān)獄服刑人數(shù)的增加和教堂數(shù)的增加都與人口的增加有關(guān)。

結(jié)論:教堂數(shù)的增加并非監(jiān)獄服刑人數(shù)增加的原因。至此,教會(huì)人士總算松了一口氣。數(shù)據(jù)來(lái)源:《現(xiàn)代統(tǒng)計(jì)學(xué)及其應(yīng)用》,吳柏林、曹立人著,浙江教育出版社2007年版。5相關(guān)分析的意義第一節(jié)相關(guān)分析社會(huì)經(jīng)濟(jì)現(xiàn)象中,一些現(xiàn)象與另一些現(xiàn)象之間往往存在著依存關(guān)系,當(dāng)我們用變量來(lái)反映這些現(xiàn)象的的特征時(shí),便表現(xiàn)為變量之間的依存關(guān)系。

在分析變量的依存關(guān)系時(shí),我們把變量分為兩種:自變量因變量引起其他變量發(fā)生變化的量受自變量的影響發(fā)生對(duì)應(yīng)變化的量6現(xiàn)象之間的相互關(guān)系,可以概括為兩種不同的類型:(一)函數(shù)關(guān)系

家庭收入決定消費(fèi)支出,收入的變化必然引起消費(fèi)支出的變化,這兩個(gè)變量中收入是,而消費(fèi)支出則是。舉例

自變量

因變量(二)相關(guān)關(guān)系7函數(shù)關(guān)系指變量之間存在著確定性依存關(guān)系。即當(dāng)一個(gè)或一組變量每取一個(gè)值時(shí),相應(yīng)的另一個(gè)變量必然有一個(gè)確定值與之對(duì)應(yīng)。函數(shù)關(guān)系可以用一個(gè)確定的公式,即函數(shù)式

來(lái)表示。

或:Y=F(X)1.函數(shù)關(guān)系8相關(guān)關(guān)系指變量之間存在著非確定性依存關(guān)系。即當(dāng)一個(gè)或一組變量每取一個(gè)值時(shí),相應(yīng)的另一個(gè)變量可能有多個(gè)不同值與之對(duì)應(yīng)。

如:根據(jù)消費(fèi)理論,商品需求量Q與商品價(jià)格P、居民收入I之間具有相關(guān)關(guān)系:

或:Y=F(X)+ε或用統(tǒng)計(jì)模型表示:2.相關(guān)關(guān)系9現(xiàn)實(shí)生活中存在大量相關(guān)關(guān)系人的身高與年齡;產(chǎn)品的成本與生產(chǎn)數(shù)量;商品的銷售額與廣告費(fèi);家庭的支出與收入。等等10單相關(guān)

是兩個(gè)變量之間存在的相關(guān)關(guān)系,即一個(gè)因變量與一個(gè)自變量之間的依存關(guān)系。因此也稱為一元相關(guān)。復(fù)相關(guān)

也稱多元相關(guān),是指三個(gè)或三個(gè)以上變量之間存在的相關(guān)關(guān)系,通常涉及一個(gè)因變量與兩個(gè)或更多個(gè)自變量,也稱多元相關(guān)。1、按相關(guān)關(guān)系涉及變量的多少可分為:相關(guān)關(guān)系的種類11直線相關(guān)當(dāng)自變量X值每變動(dòng)一個(gè)單位,因變量Y值則隨著發(fā)生大致均等的變動(dòng),這就是直線相關(guān)。亦稱為簡(jiǎn)單相關(guān)或一元線性相關(guān)。曲線相關(guān)當(dāng)自變量X值每變動(dòng)一個(gè)單位,因變量Y值則隨之發(fā)生不均等的變化,這就曲線相關(guān)。或一元非線性相關(guān)。2、按相關(guān)關(guān)系形式可分為12正相關(guān)當(dāng)自變量X值增加(或減少)時(shí),因變量Y值也隨之增加(或減少),這樣的相關(guān)關(guān)系就是正相關(guān),也叫同向相關(guān)。負(fù)相關(guān)當(dāng)自變量X的值增加(或減少)時(shí),因變量Y的值隨之而減少(或增加),這樣的相關(guān)關(guān)系就是負(fù)相關(guān),也叫異向相關(guān)。3、按相關(guān)的方向可分為134、按相關(guān)關(guān)系的密切程度分為完全相關(guān)因變量完全隨自變量變動(dòng)而變動(dòng),存在著嚴(yán)格的依存關(guān)系。即變量間的關(guān)系為函數(shù)關(guān)系。不完全相關(guān)變量之間存在著不嚴(yán)格的依存關(guān)系,即因變量的變動(dòng)除了受自變量變動(dòng)的影響外,還受其他因素的影響。它是相關(guān)關(guān)系的主要表現(xiàn)形式。完全不相關(guān)自變量與因變量彼此獨(dú)立,互不影響,其數(shù)量變化毫無(wú)聯(lián)系。。14(1)確定現(xiàn)象之間有無(wú)相關(guān)關(guān)系,以及相關(guān)關(guān)系的表現(xiàn)形態(tài)。(2)確定相關(guān)關(guān)系的密切程度。(3)確定相關(guān)關(guān)系的數(shù)字模型,并進(jìn)行參數(shù)估計(jì)和擬合優(yōu)度檢驗(yàn)。(4)回歸預(yù)測(cè),并分析估計(jì)標(biāo)準(zhǔn)誤差。

相關(guān)關(guān)系的主要內(nèi)容15相關(guān)關(guān)系的測(cè)定定性分析是依據(jù)研究者的理論知識(shí)和實(shí)踐經(jīng)驗(yàn),對(duì)客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷定量分析在定性分析的基礎(chǔ)上,通過(guò)編制相關(guān)表、繪制相關(guān)圖、計(jì)算相關(guān)系數(shù)與判定系數(shù)等方法,來(lái)判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度16產(chǎn)量與生產(chǎn)費(fèi)用情況表相關(guān)分析表17正相關(guān)負(fù)相關(guān)曲線相關(guān)不相關(guān)xyxyxyxy

用直角坐標(biāo)系的x軸代表自變量,y軸代表因變量,將兩個(gè)變量間相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)的形式描繪出來(lái),用以表明相關(guān)點(diǎn)分布狀況的圖形。相關(guān)圖的種類18產(chǎn)品產(chǎn)量與生產(chǎn)費(fèi)用相關(guān)圖19在直線相關(guān)的條件下,用以反映兩變量間線性相關(guān)密切程度的統(tǒng)計(jì)指標(biāo),用r表示相關(guān)系數(shù)其基本算法是英國(guó)統(tǒng)計(jì)學(xué)家皮爾遜所創(chuàng)的乘積動(dòng)差法(發(fā)現(xiàn):x、y是對(duì)等關(guān)系)。20相關(guān)系數(shù)的取值范圍0<|r|<1表示存在不同程度線性相關(guān):

|r|

<

0.5為低度線性相關(guān);

0.5≤|r|<0.8為中度性線性相關(guān);

0.8≤|r|為高度顯著性線性相關(guān)。r>0為正相關(guān),r<0為負(fù)相關(guān);|r|=0表示不存在線性關(guān)系;|r|=1表示完全線性相關(guān);21相關(guān)系數(shù)取值及其意義-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無(wú)線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加22回歸:退回regression1877年弗朗西斯?高爾頓爵士遺傳學(xué)研究回歸線。平均身高第二節(jié)一元線性回歸模型231889年F.Gallton和他的朋友K.Pearson收集了上千個(gè)家庭的身高、臂長(zhǎng)和腿長(zhǎng)的記錄企圖尋找出兒子們身高與父親們身高之間關(guān)系的具體表現(xiàn)形式下圖是根據(jù)1078個(gè)家庭的調(diào)查所作的散點(diǎn)圖回歸分析法產(chǎn)生的歷史24160165170175180185140150160170180190200YX兒子們身高向著平均身高“回歸”25回歸形式回歸分析通過(guò)一個(gè)變量x或一些變量(x1,x2,x3…)的變化解釋另一變量y的變化.即根據(jù)相關(guān)關(guān)系的數(shù)量表達(dá)式(回歸方程式)與給定的自變量x,揭示因變量y在數(shù)量上的平均變化和求得因變量的預(yù)測(cè)值的統(tǒng)計(jì)分析方法回歸方程回歸模型反映自變量和因變量之間數(shù)學(xué)聯(lián)系的表達(dá)式。某一類回歸方程的總稱。26回歸分析的內(nèi)容和步驟1、根據(jù)理論和對(duì)問(wèn)題的分析判斷,區(qū)分自變量和因變量;2、設(shè)法找出適合的數(shù)學(xué)方程式(即:回歸模型)描述變量間的關(guān)系;3、對(duì)回歸模型進(jìn)行統(tǒng)計(jì)檢驗(yàn);

4、統(tǒng)計(jì)檢驗(yàn)通過(guò)后,利用回歸模型,根據(jù)自變量去估計(jì),預(yù)測(cè)因變量。27回歸分析的分類根據(jù)變量的多少分為:簡(jiǎn)單回歸多元回歸只有一個(gè)自變量和一個(gè)因變量的回歸自變量數(shù)目在兩個(gè)或兩個(gè)以上根據(jù)建立的回歸模型形式分為:線性回歸非線性回歸從所擬合的回歸模型來(lái)看,一變量表現(xiàn)為其它變量的線性組合。從所擬合的回歸模型來(lái)看,一變量表現(xiàn)為其它變量的非線性組合。28回歸分析與相關(guān)分析理論和方法具有一致性;無(wú)相關(guān)就無(wú)回歸,相關(guān)程度越高,回歸越好;

相關(guān)系數(shù)和回歸系數(shù)方向一致,可以互相推算。聯(lián)系:區(qū)別:相關(guān)分析中x與y對(duì)等,回歸分析中x與y要確定自變量和因變量;相關(guān)分析中x、y均為隨機(jī)變量,回歸分析中只有y為隨機(jī)變量;相關(guān)分析測(cè)定相關(guān)程度和方向,回歸分析用回歸模型進(jìn)行預(yù)測(cè)和控制。29一元線性回歸模型其中:yi表示因變量y在樣本中某一個(gè)具體的觀察值;xi表示在研究樣本中自變量x的具體觀察數(shù)值;a與b是參數(shù),b稱為回歸系數(shù);εi是一個(gè)隨機(jī)變量,其平均數(shù)為0,方差為σ2。30一元線性回歸模型圖解31樣本一元線性回歸方程:以樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)斜率(回歸系數(shù))截距(估計(jì)的回歸方程)總體一元線性回歸模型32殘差(Residual)散點(diǎn)圖33最小平方法基本數(shù)學(xué)要求34標(biāo)準(zhǔn)方程3536回歸模型的檢驗(yàn)1、擬合優(yōu)度檢驗(yàn)確定回歸直線后,需要評(píng)價(jià)這一直線方程是否有效地反映了這兩變量之間的關(guān)系。評(píng)價(jià)回歸方程配合好壞的一個(gè)主要指標(biāo)是可決系數(shù)(或稱判定系數(shù))是相關(guān)系數(shù)的平方,用表示;用來(lái)衡量回歸方程對(duì)y的解釋程度??蓻Q系數(shù)取值范圍:越接近于1,表明x與y之間的相關(guān)性越強(qiáng);越接近于0,表明兩個(gè)變量之間幾乎沒(méi)有直線相關(guān)關(guān)系??蓻Q系數(shù)37誤差平方和回歸平方和總離差平方和平方和關(guān)系(教材P237)38總偏差=回歸偏差+剩余偏差

r2表示全部偏差中有百分之幾的偏差可由x與y的回歸關(guān)系來(lái)解釋。r的符號(hào)同b數(shù)量關(guān)系及意義3940判定系數(shù)與相關(guān)系數(shù)的區(qū)別判定系數(shù)無(wú)方向性,相關(guān)系數(shù)則有方向,其方向與樣本回歸系數(shù)b相同;判定系數(shù)說(shuō)明變量值的總離差平方和中可以用回歸線來(lái)解釋的比例,相關(guān)系數(shù)只說(shuō)明兩變量間關(guān)聯(lián)程度及方向;相關(guān)系數(shù)有夸大變量間相關(guān)程度的傾向,因而判定系數(shù)是更好的度量值。412、顯著性檢驗(yàn)(例9-3)42被害棉花紅鈴蟲(chóng)喜高溫高濕,適宜各蟲(chóng)態(tài)發(fā)育的溫度為25℃—32℃,相對(duì)濕度為80%一100%,低于20℃和高于35℃卵不能孵化,相對(duì)濕度60%以下成蟲(chóng)不產(chǎn)卵。冬季月平均氣溫低于一4.8℃時(shí),紅鈴蟲(chóng)就不能越冬而被凍死。

1953年,18省發(fā)生紅鈴蟲(chóng)大災(zāi)害,受災(zāi)面積300萬(wàn)公頃,損失皮棉約二十萬(wàn)噸。

案例分析43溫度xoC21232527293235產(chǎn)卵數(shù)y/個(gè)711212466115325收集一只紅鈴蟲(chóng)的產(chǎn)卵數(shù)y和溫度xoC之間的7組觀測(cè)數(shù)據(jù)列于下表:(1)試建立產(chǎn)卵數(shù)y與溫度x之間的回歸方程;并預(yù)測(cè)溫度為28oC時(shí)產(chǎn)卵數(shù)目。(2)你所建立的模型中溫度在多大程度上解釋了產(chǎn)卵數(shù)的變化?問(wèn)題呈現(xiàn):44畫(huà)散點(diǎn)圖假設(shè)線性回歸方程為:選模型分析和預(yù)測(cè)當(dāng)x=28時(shí),y=19.87×28-463.73≈93選變量解:選取氣溫為解釋變量x,產(chǎn)卵數(shù)為預(yù)報(bào)變量y。050100150200250300350036912151821242730333639當(dāng)x=28時(shí),y=19.87×28-463.73≈93估計(jì)參數(shù)由Excel得:線性回歸方程為探析1—擬合直線45殘差編號(hào)12345671020304050607080-10-20-30-40-50-6090100題解153.4617.72-12.02-48.76-46.5-57.1193.28

R2≈0.7464所以,一次函數(shù)模型中溫度解釋了74.64%的產(chǎn)卵數(shù)變化。46

y=bx2+a變換y=bx+a非線性關(guān)系線性關(guān)系問(wèn)題2產(chǎn)卵數(shù)氣溫問(wèn)題1如何求a、b?

t=x2探析2—拋物線擬合47溫度xoC21232527293235產(chǎn)卵數(shù)y/個(gè)711212466115325作散點(diǎn)圖,并由Excel計(jì)算得:y=0.367x2-202.54tt當(dāng)x=28時(shí),y=0.367×282-202.54≈85題解248編號(hào)12345671020304050607080-10-20-30-40-50-60拋物線模型47.69619.400-5.832-41.000-40.104-58.26577.968R2=0.802,拋物線模型中溫度解釋了80.2%的產(chǎn)卵數(shù)變化。49問(wèn)題2變換y=bx+a非線性關(guān)系線性關(guān)系問(wèn)題1如何選取指數(shù)函數(shù)的底?產(chǎn)卵數(shù)氣溫對(duì)數(shù)探析3—指數(shù)函數(shù)模型50xz當(dāng)x=28oC時(shí),y≈44溫度xoC21232527293235產(chǎn)卵數(shù)y/個(gè)711212466115325題解351殘差編號(hào)12345671020304050607080-10-20-30-40-50-6090指數(shù)函數(shù)模型-0.19441.7248-9.18948.8521-14.121933.2573指數(shù)回歸模型中溫度解釋了98.5%的產(chǎn)卵數(shù)的變化0

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論