第9章相關(guān)和回歸_第1頁
第9章相關(guān)和回歸_第2頁
第9章相關(guān)和回歸_第3頁
第9章相關(guān)和回歸_第4頁
第9章相關(guān)和回歸_第5頁
已閱讀5頁,還剩65頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第9章相關(guān)和回歸9.1簡單線性相關(guān)分析一、變量之間的關(guān)系確定性關(guān)系、非確定性關(guān)系1.確定性關(guān)系(函數(shù)關(guān)系):變量之間依一定的函數(shù)形成的一一對應(yīng)關(guān)系,若兩個變量分別記做Y與X,則當(dāng)Y與X之間存在函數(shù)關(guān)系時,X值一旦被指定,Y值就是唯一確定的。2.非確定性關(guān)系(相關(guān)關(guān)系):兩個變量之間存在某種關(guān)系,但變量Y并不是由變量X唯一確定的,它們之間沒有嚴(yán)格的一一對應(yīng)關(guān)系。兩個變量之間若存在線性關(guān)系稱為線性相關(guān),存在非線性關(guān)系稱為曲線相關(guān),通常通過適當(dāng)?shù)淖兞孔儞Q,曲線相關(guān)可轉(zhuǎn)換為線性相關(guān)。3、相關(guān)的種類(1)按相關(guān)的程度分為完全相關(guān)、不完全相關(guān)和不相關(guān)。兩種依存關(guān)系的標(biāo)志,其中一個標(biāo)志的數(shù)量變化由另一個標(biāo)志的數(shù)量變化所確定,則稱完全相關(guān),也稱函數(shù)關(guān)系。兩個標(biāo)志彼此互不影響,其數(shù)量變化各自獨立,稱為不相關(guān)。兩個現(xiàn)象之間的關(guān)系,介乎完全相關(guān)與不相關(guān)之間稱不完全相關(guān)。(2)按相關(guān)的方向分為正相關(guān)和負(fù)相關(guān)

正相關(guān)指相關(guān)關(guān)系表現(xiàn)為因素標(biāo)志和結(jié)果標(biāo)志的數(shù)量變動方向一致。負(fù)相關(guān)指相關(guān)關(guān)系表現(xiàn)為因素標(biāo)志和結(jié)果標(biāo)志的數(shù)量變動方向是相反的。(3)按相關(guān)的形式分為線性相關(guān)和非線性相關(guān)一種現(xiàn)象的一個數(shù)值和另一現(xiàn)象相應(yīng)的數(shù)值在指教坐標(biāo)系中確定為一個點,稱為線性相關(guān)。(4)按影響因素的多少分為單相關(guān)和復(fù)相關(guān)。如果研究的是一個結(jié)果標(biāo)志同某一因素標(biāo)志相關(guān),就稱單相關(guān)。如果分析若干因素標(biāo)志對結(jié)果標(biāo)志的影響,稱為復(fù)相關(guān)或多元相關(guān)。二、總體相關(guān)系數(shù)三、樣本相關(guān)系數(shù)xy正相關(guān)xy負(fù)相關(guān)xy曲線相關(guān)xy不相關(guān)使用年限x維修費用(元)yxy2540429160010803520927040015604640164096002560474016547600296056002536000030005800256400004000670036490000420067603657760045606900368100005400884064705600672091080811164009720合計58812034845760計算結(jié)果表明,機床使用年限與維修費用之間為高度正相關(guān)。四、相關(guān)系數(shù)的顯著性檢驗五、相關(guān)分析中應(yīng)注意的問題相關(guān)系數(shù)不解釋兩個變量間的因果關(guān)系,它只是表明了兩個變量間互相影響的程度和方向。有時兩變量之間不存在相關(guān)關(guān)系,但卻可能出現(xiàn)較高的相關(guān)系數(shù),要警惕虛假相關(guān)導(dǎo)致的錯誤結(jié)論。第二節(jié)

一元線性回歸分析回歸分析是通過一個或一些變量的變化來解釋另一變量的變化。其內(nèi)容和步驟:1.根據(jù)理論和對問題的分析判斷,區(qū)分自變量和因變量。2.設(shè)法找出合適的回歸模型來描述變量間的關(guān)系。3.對回歸模型進行統(tǒng)計檢驗。4.利用回歸模型,根據(jù)解釋變量去估計、預(yù)測因變量。一、一元線性回歸的數(shù)學(xué)模型隨機干擾項的主要內(nèi)容有:1.未具體列入模型但又共同影響變量的種種因素2.變量的觀測誤差3.隨機誤差4.模型的設(shè)定誤差二、線性回歸模型的含義1.就變量而言,線性是指Y的條件期望是X的線性函數(shù)。如:2.就參數(shù)而言,線性是指Y的條件期望是參數(shù)βi的線性函數(shù)。如:三、樣本回歸模型事實上,總體Y是未知的,我們所能取得的只能是與給定X值相對應(yīng)的Y的樣本觀測值,我們通過樣本提供的信息來認(rèn)識總體,找出總體回歸模型的估計式??芍涫杖肱c消費支出的簡單隨機樣本x1x2x3x4x5x6x7x8x9x1080100120140160180200220240260樣本170659095110115120140155120樣本255889080118120145135145175對散點分別擬合直線,是總體回歸線的估計線四、回歸直線的擬合1.簡單線性回歸模型的統(tǒng)計假定滿足以上4條假設(shè)的線性回歸模型稱為古典或普通線性回歸模型,其參數(shù)估計所采用的最小平方法稱作普通最小平方法2.簡單線性回歸模型的參數(shù)估計-----最小平方法3.最小平方估計線和估計量的性質(zhì)五.回歸模型的檢驗

1.擬合優(yōu)度如果SSR占的比例越大,則回歸線對觀察點擬合得越好。稱作判定系數(shù),可用于判斷回歸方程的擬合優(yōu)度。判定系數(shù)與樣本相關(guān)系數(shù)判定系數(shù)的平方根就是相關(guān)系數(shù)。2.回歸系數(shù)的顯著性檢驗3.回歸系數(shù)的顯著性檢驗步驟X與Y之間是否存在線性關(guān)系,可以利用方差分析的方法進行F檢驗。六、回歸分析的預(yù)測和推斷

1.總體均值的預(yù)測和推斷例9.9隨機抽查了生產(chǎn)同種產(chǎn)品的10個企業(yè),得到它們的產(chǎn)量和生產(chǎn)費用的數(shù)據(jù):企業(yè)編號12345678910產(chǎn)量40424855657988100120140生產(chǎn)費用1501401601701501621851651901851.建立生產(chǎn)費用對產(chǎn)量的回歸方程2.預(yù)測當(dāng)產(chǎn)量為80千克時,該類企業(yè)平均的生產(chǎn)費用的置信區(qū)間3.預(yù)測其產(chǎn)量為80千克的某企業(yè)的生產(chǎn)費用的置信水平為95%的置信區(qū)間解:1.作X與Y的散點圖2.估計回歸方程3.檢驗(a.擬合優(yōu)度檢驗b.回歸系數(shù)檢驗c.回歸方程檢驗)4.總體均值的置信區(qū)間預(yù)測5.總體個別值的置信區(qū)間預(yù)測作散點圖從圖中看出生產(chǎn)費用與產(chǎn)量之間的關(guān)系近似為線性解:1.作X與Y的散點圖2.估計回歸方程3.檢驗(a.擬合優(yōu)度檢驗b.回歸系數(shù)檢驗c.回歸方程檢驗)4.總體均值的置信區(qū)間預(yù)測5.總體個別值的置信區(qū)間預(yù)測解:1.作X與Y的散點圖2.估計回歸方程3.檢驗(a.擬合優(yōu)度檢驗b.回歸系數(shù)檢驗c.回歸方程檢驗)4.總體均值的置信區(qū)間預(yù)測5.總體個別值的置信區(qū)間預(yù)測擬合優(yōu)度檢驗檢驗結(jié)果說明生產(chǎn)費用的變動有65.2%可以由產(chǎn)量的變動解釋解:1.作X與Y的散點圖2.估計回歸方程3.檢驗(a.擬合優(yōu)度檢驗b.回歸系數(shù)檢驗c.回歸方程檢驗)4.總體均值的置信區(qū)間預(yù)測5.總體個別值的置信區(qū)間預(yù)測回歸系數(shù)檢驗拒絕原假設(shè),說明X與Y存在線性關(guān)系解:1.作X與Y的散點圖2.估計回歸方程3.檢驗(a.擬合優(yōu)度檢驗b.回歸系數(shù)檢驗c.回歸方程檢驗)4.總體均值的置信區(qū)間預(yù)測5.總體個別值的置信區(qū)間預(yù)測回歸方程檢驗即回歸方程是高度顯著的,X與Y之間確實存在線性關(guān)系解:1.作X與Y的散點圖2.估計回歸方程3.檢驗(a.擬合優(yōu)度檢驗b.回歸系數(shù)檢驗c.回歸方程檢驗)4.總體均值的置信區(qū)間預(yù)測5.總體個別值的置信區(qū)間預(yù)測總體均值的置信區(qū)間預(yù)測即置信區(qū)間為(158.844,174.321)說明了當(dāng)企業(yè)的產(chǎn)量為80千克時,生產(chǎn)費用平均為158844元到174321元之間,其可信度為95%解:1.作X與Y的散點圖2.估計回歸方程3.檢驗(a.擬合優(yōu)度檢驗b.回歸系數(shù)檢驗c.回歸方程檢驗)4.總體均值的置信區(qū)間預(yù)測5.總體個別值的置信區(qū)間預(yù)測總體個別值的置信區(qū)間預(yù)測置信區(qū)間為(140.637,191.643)。對于產(chǎn)量為80千克的某個企業(yè)而言,其生產(chǎn)費用在140637元到191643元之間,可能性為95%七、相關(guān)分析與回歸分析的關(guān)系(一)區(qū)別1、相關(guān)分析的任務(wù)是確定兩個變量之間相關(guān)的方向和密切程度。回歸分析的任務(wù)是尋找因變量對自變量依賴關(guān)系的數(shù)學(xué)表達式。2、相關(guān)分析不必確定兩變量中哪個是自變量,哪個是因變量,而回歸分析中必須區(qū)分因變量與自變量。3、相關(guān)分析中兩變量是對等的改變兩者的地位,并不影響相關(guān)系數(shù)的數(shù)值,只有一個相關(guān)系數(shù)。而在回歸分析中,互為因果關(guān)系的兩個變量可以編制兩個獨立的回歸方程。4、相關(guān)分析中兩變量可以都是隨機的,而回歸分析中因變量是隨機的,自變量不是隨機的。(二)聯(lián)系1、相關(guān)分析是回歸分析的基礎(chǔ)和前提。只有在相關(guān)分析確定了變量之間存在一定相關(guān)關(guān)系的基礎(chǔ)上建立的回歸方程才有意義。2、回歸分析是相關(guān)分析的繼續(xù)和深化。只有建立了回歸方程才能表明變量之間的依賴關(guān)系,并進一步進行預(yù)測。多元線性回歸模型1·多元線性回歸模型的性質(zhì)與模型的確定二元線性回歸模型:總體多元線性回歸模型的一般形式Y(jié)的數(shù)學(xué)期望E(Y)隨機誤差表明自變量共同變動引起的Y的平均變動。也稱總體的二元線性回歸方差。常數(shù)項,和Y構(gòu)成的平面與Y軸的截距偏回歸系數(shù),表示在固定時每變化一個單位引起的Y的平均變動;案例偏回歸系數(shù),表示在固定時每變化一個單位引起的Y的平均變動;隨機誤差,其理論假定與一元線性回歸模型中的一樣。在多元回歸模型中,還要求各自變量之間不存在顯著相關(guān),或高度相關(guān)也即不得存在多重共線性。樣本多元線性回歸模型的一般形式二元線性回歸模型為:其數(shù)學(xué)期望也稱樣本(或估計的)二元線性回歸方程。二元線性回歸方程的確定根據(jù)實際資料,用最小平方法,即使,分別對a、b1、b2求編導(dǎo)并令其為零,求得三個標(biāo)準(zhǔn)方程:解此聯(lián)立方程便可得到a、b1、b2。2·多元線性回歸模型的判定系數(shù)和估計標(biāo)準(zhǔn)誤判定系數(shù)

0<r2<1修正的判定余數(shù):

r2和Sy(x1、x2)都是對回歸模型擬合優(yōu)度的評價指標(biāo)。Sy(x1、x2)也是用自變量對因變量進行區(qū)間估計的抽樣誤差。估計標(biāo)準(zhǔn)誤(Sy(x1、x2))3·多元回歸模型的顯著性檢驗對偏回歸系數(shù)的t檢驗

H0:β1=0,H1:β1≠0; H0:β2=0, H1:β2≠0。檢驗統(tǒng)計量:按顯著性水平α和自由度(n-3)查t表可得到臨界值t0模型整體的F檢驗檢驗統(tǒng)計量:(k—自變量個數(shù))或按給定的α和自由度(2)和(n-3)查F表可得到臨界值Fα4·多元回歸中的相關(guān)分析復(fù)相關(guān):指一個因變量同多個自變量的相關(guān)關(guān)系。復(fù)相關(guān)系數(shù)恒取正值。偏相關(guān)(凈相關(guān))指各個自變量在其他自變量固定不變時,單個變量同因變量的相關(guān)關(guān)系。計算偏相關(guān)系數(shù)需借助相關(guān)系數(shù)矩陣表的資料。二元回歸中的相關(guān)系數(shù)矩陣表yyx1x1x2x2ry1ry2r121.001.001.00

x1與y的偏相關(guān)系數(shù):

x2與y的偏相關(guān)系數(shù):案例5·應(yīng)用多元回歸方程進行區(qū)間估計Y的平均值的區(qū)間估計Y的特點值的區(qū)間估計式中,是即區(qū)間估計的抽樣誤差。的抽樣分布的標(biāo)準(zhǔn)差,式中,是的抽樣分布的標(biāo)準(zhǔn)差,即區(qū)間估計的抽樣誤差。非線性回歸模型當(dāng)自變量與因變量存在某種曲線相關(guān)關(guān)系時,可擬合曲線回歸模型。例如:雙曲線

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論