




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第八章直線回歸與相關(guān)分析
前述各章討論的問題,都只涉及一個變量或性狀,而在實(shí)際研究中常常要研究兩個或兩個以上變量的關(guān)系。變量間的關(guān)系分為兩類:
—完全確定性關(guān)系;(沒有隨機(jī)誤差)
—不存在完全確定性關(guān)系,不能由一個或幾個變量的值精確地求出另一個變量的值;(相關(guān)關(guān)系)
相關(guān)變量間的關(guān)系一般又分為兩種:
—因果關(guān)系(一個變量的變化受一個或幾個變量的影響,有自變量/依變量之分);
研究方法:采用回歸分析
研究目的(任務(wù)):揭示變量間的聯(lián)系形式,建立回歸方程,并由自變量(原因)來預(yù)測、控制依變量(結(jié)果)
—平行關(guān)系(兩個以上變量之間共同受到另外因素的影響,無自變量與依變量之分)研究方法:采用相關(guān)分析
研究目的(任務(wù)):研究兩個變量之間相關(guān)的程度和性質(zhì)或一個變量與多個變量之間相關(guān)的程度(計(jì)算相關(guān)系數(shù))
直線回歸分析
一元回歸分析曲線回歸分析多元線性回歸分析多元回歸分析
(復(fù)回歸分析)多元非線性回歸分析
回歸分析
簡單相關(guān)分析——直線相關(guān)分析
復(fù)相關(guān)分析多元相關(guān)分析偏相關(guān)分析相關(guān)分析第一節(jié)直線回歸分析一、直線回歸方程的建立研究兩個變量之間的關(guān)系時,一般先把n對觀察值(x1,y1),(x2,y2),…,(xi,yi),…,(xn,yn)先以x為橫坐標(biāo),y為縱坐標(biāo)在直角坐標(biāo)紙上描出n
個點(diǎn),所描出的圖形叫散點(diǎn)圖。ed在直線回歸分析中主要是研究圖中(b)與(e)的情況。
設(shè)變量x與y間存在直線關(guān)系,根據(jù)n對觀察值所描出的散點(diǎn)圖如下圖所示。直線回歸散點(diǎn)圖回歸直線是所有直線中最接近散點(diǎn)圖中全部散點(diǎn)的直線。設(shè)樣本直線回歸方程為:總體直線回歸方程為:
其中:a稱為回歸截距;
b稱為回歸系數(shù)y=α+βx
回歸值與yi觀察值間的偏差為:全部偏差平方和為:
利用最小二乘法,即使偏差平方和最小的方法求a與b的值。根據(jù)微積分學(xué)中求極值的原理,將Q對a與b求偏導(dǎo)數(shù)并令其等于0:
可以證明
—稱之為x與y的離均差乘積和,簡稱為乘積和,記為
SPxy。
回歸方程的性質(zhì)
回歸直線必然通過點(diǎn)。
線性回歸方程建立的方法(結(jié)合例8.1):
用各組觀察值(xi,yi)描點(diǎn)作散點(diǎn)圖,確定變量x和y間是否存在直線關(guān)系;
計(jì)算回歸截距a和回歸系數(shù)b;
建立樣本直線回歸方程,并進(jìn)行偏離度估計(jì)和顯著性檢驗(yàn);
在散點(diǎn)圖中,畫出樣本直線回歸方程。直線回歸方程的偏離度估計(jì)
根據(jù)使偏差平方和最小建立了直線回歸方程。偏差平方和Q的大小表示了實(shí)測點(diǎn)與回歸直線偏差的程度,因而偏差平方和又稱為離回歸平方和或剩余平方和。
Q的自由度df=n-2;離回歸標(biāo)準(zhǔn)誤
大小表示了回歸直線與實(shí)測點(diǎn)的吻合程度,即回歸估測值與實(shí)際觀察值y差異的程度。
可以證明:二、直線回歸的顯著性檢驗(yàn)
能否利用所建立的直線回歸方程來進(jìn)行預(yù)測和控制,這取決于這個直線回歸方程所反應(yīng)的兩個變量間的直線關(guān)系是否真實(shí)。因而還須對y與x間的直線關(guān)系進(jìn)行檢驗(yàn)。檢驗(yàn)的方法有回歸關(guān)系的F測驗(yàn)和回歸系數(shù)的t測驗(yàn)二種。(一)t檢驗(yàn)對直線回歸系數(shù)b的假設(shè)檢驗(yàn)為:HO:β=0;HA:β≠0(β為總體回歸系數(shù))。在HO成立的條件下,回歸系數(shù)b服從t分布:將計(jì)算出的與根據(jù)自由度df=n-2查表所得的臨界t值比較,作出結(jié)論。
y變量的平方和與自由度為(二)F
檢驗(yàn)
可以證明因此
由于回歸和離回歸的均方比遵循df1=1,df2=n-2的F分布,所以y的總平方和(SSy),dfy=n-1離回歸平方和(SSr),dfr=n-2回歸平方和(SSR),dfR=1將計(jì)算出的F值與根據(jù)自由度df1=1,df2=n-2查表所得的臨界F值比較,作出結(jié)論?;貧w關(guān)系方差分析表變異來源dfSSMSF回歸dfRSSRMSRMSR/MSr離回歸dfrSSrMSr總變異dfySSy
F檢驗(yàn)的結(jié)果與t檢驗(yàn)的結(jié)果一致。
統(tǒng)計(jì)學(xué)已證明,在直線回歸分析中這二種檢驗(yàn)法是等價的,可任選一種進(jìn)行檢驗(yàn)。因?yàn)樵谥本€回歸的測驗(yàn)中,在同一概率值下,df1=1,df2=n-2的一尾F值正好等于df2=n-2的兩尾t值的平方。
線性回歸方程的應(yīng)用應(yīng)用——線性回歸方程建立并經(jīng)顯著性測驗(yàn)證明其真實(shí)存在后,可用回歸方程對依變量進(jìn)行預(yù)測或控制(但自變量必須在已知的觀察值范圍內(nèi))。特別要指出的是:利用直線回歸方程進(jìn)行預(yù)測或控制時,一般只適用于原來研究的范圍,不能隨意把范圍擴(kuò)大。第二節(jié)直線相關(guān)分析
進(jìn)行直線相關(guān)分析的基本任務(wù)在于計(jì)算出表示x,y兩個變量間線性相關(guān)的程度和性質(zhì)的統(tǒng)計(jì)量——相關(guān)系數(shù),并進(jìn)行顯著性檢驗(yàn)。
一、決定系數(shù)和相關(guān)系數(shù)前面已證明了等式:
從等式不難看到:y與x直線回歸效果的好壞取決于回歸平方和在y的總平方和中所占比例的大小。
把比值叫做x對y的決定系數(shù)記為r2,即
決定系數(shù)r2的大小表示了回歸方程的可靠程度,顯然有0≤r2≤1。
所以決定系數(shù)r2等于y對x的回歸系數(shù)byx與x對y的回歸系數(shù)bxy的乘積,即r2=byx
bxy
若求r2的平方根,統(tǒng)計(jì)學(xué)把這樣計(jì)算所得的統(tǒng)計(jì)量稱為x與y的相關(guān)系數(shù),記為r,即
顯然相關(guān)系數(shù)-1≤r≤1二、相關(guān)系數(shù)和決定系數(shù)的計(jì)算充分應(yīng)用計(jì)算器的統(tǒng)計(jì)功能鍵,計(jì)算:
將上述數(shù)值代入公式。三、相關(guān)系數(shù)的顯著性測驗(yàn)
樣本相關(guān)系數(shù)r是否來自ρ≠0的總體,還須對樣本相關(guān)系數(shù)r進(jìn)行顯著性檢驗(yàn)。
HO:ρ=0
,HA:ρ≠0(ρ為總體相關(guān)系數(shù))
可采用t測驗(yàn)法與F測驗(yàn)法對相關(guān)系數(shù)r進(jìn)行測驗(yàn)。這里只介紹常用的t檢驗(yàn)法。t測驗(yàn)的計(jì)算公式為:
F檢驗(yàn)的計(jì)算公式為:Sr—相關(guān)系數(shù)標(biāo)準(zhǔn)誤
此外,還可以直接采用查表法對相關(guān)系數(shù)r進(jìn)行顯著性檢驗(yàn)。先根據(jù)自由度n-2查臨界r值(附表8),得r0.05、r0.01。
若|r|<r0.05
,P>0.05,則相關(guān)系數(shù)r不顯著;
若r0.05≤|r|<r0.01,0.01<P<0.05,則相關(guān)系數(shù)r顯著,標(biāo)記“*”;
若|r|≥r0.01,P≤0.01,則相關(guān)系數(shù)r極顯著,標(biāo)記“**”。四、相關(guān)與回歸的關(guān)系
r2=byx
bxy
r和b都是用一定的數(shù)值來表明兩個變量之間的關(guān)系,二者變異的性質(zhì)和方向完全一致;
r只能根據(jù)數(shù)值的大小的絕對值來判斷兩個變量間的相關(guān)程度;b則能根據(jù)自變量的變化去推算依變量的變化規(guī)律。
相關(guān)系數(shù)和回歸系數(shù)(方程)的顯著性測驗(yàn)是等價的。即相關(guān)系數(shù)顯著,回歸系數(shù)亦顯著;相關(guān)系數(shù)不顯著,回歸系數(shù)也必然不顯著。注意:在實(shí)際進(jìn)行直線回歸分析時,可用相關(guān)系數(shù)顯著性測驗(yàn)代替直線回歸關(guān)系顯著性測驗(yàn)。計(jì)算相關(guān)系數(shù)r對r檢驗(yàn)(查表法)r不顯著,則不建立直線回歸方程若r顯著,計(jì)算回歸系數(shù)b、回歸截距a,建立直線回歸方程五、應(yīng)用直線回歸與相關(guān)的注意事項(xiàng)
回歸分析和相關(guān)分析畢竟是處理變量間關(guān)系的數(shù)學(xué)方法,在應(yīng)用時要考慮到客觀實(shí)際情況。
要考慮到回歸系數(shù)、相關(guān)系數(shù)等這些統(tǒng)計(jì)數(shù)的適用范圍。
必須嚴(yán)格控制被研究的兩個變量以外的各個變量的變動范圍,使之盡可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蘇州市重點(diǎn)中學(xué)2024-2025學(xué)年高三第一次聯(lián)考?xì)v史試題理試題含解析
- 唐山工業(yè)職業(yè)技術(shù)學(xué)院《環(huán)境生態(tài)學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 贛南師范大學(xué)科技學(xué)院《陳設(shè)藝術(shù)品設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 寧夏銀川市金鳳區(qū)六盤山高級中學(xué)2025屆高三第二次(4月)月考數(shù)學(xué)試題試卷含解析
- 遼寧石化職業(yè)技術(shù)學(xué)院《工廠化育苗原理與技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 棗莊職業(yè)學(xué)院《人力資源專業(yè)英語》2023-2024學(xué)年第二學(xué)期期末試卷
- 宿遷職業(yè)技術(shù)學(xué)院《病理學(xué)(含病理生理學(xué))》2023-2024學(xué)年第二學(xué)期期末試卷
- 河南省安陽市滑縣2025屆下學(xué)期高三四月考?xì)v史試題試卷含解析
- 西安交通工程學(xué)院《乒乓球Ⅳ》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西電力職業(yè)技術(shù)學(xué)院《系統(tǒng)架構(gòu)》2023-2024學(xué)年第二學(xué)期期末試卷
- 光伏補(bǔ)貼申請流程
- 小數(shù)與單位換算(說課稿)-2023-2024學(xué)年四年級下冊數(shù)學(xué)人教版
- 《張愛玲傾城之戀》課件
- 實(shí)驗(yàn)診斷學(xué)練習(xí)題庫(附參考答案)
- 無錫網(wǎng)格員考試題庫
- 第9課 改變世界的工業(yè)革命
- 《供應(yīng)商選擇與評估》課件
- 新版申請銀行減免利息的申請書
- QC課題提高金剛砂地面施工一次合格率
- 保潔服務(wù)質(zhì)量保障及措施
- 《電子銀行安全評估過程實(shí)施指南》征求意見稿
評論
0/150
提交評論