第9章 雙變量相關(guān)與回歸課件_第1頁(yè)
第9章 雙變量相關(guān)與回歸課件_第2頁(yè)
第9章 雙變量相關(guān)與回歸課件_第3頁(yè)
第9章 雙變量相關(guān)與回歸課件_第4頁(yè)
第9章 雙變量相關(guān)與回歸課件_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第九章雙變量相關(guān)與回歸

Bivariate

CorrelationandRegression醫(yī)學(xué)統(tǒng)計(jì)學(xué)薩建DepartmentofHealthStatistics,PublicHealthSchool,ShanXiMedicalUniversityOffice:Email:2024/11/11第9章雙變量相關(guān)與回歸醫(yī)學(xué)統(tǒng)計(jì)學(xué)

醫(yī)學(xué)上,許多現(xiàn)象之間也都有相互聯(lián)系,例如:身高與體重、體溫與脈搏、產(chǎn)前檢查與嬰兒體重、乙肝病毒與乙肝等。在這些有關(guān)系的現(xiàn)象中,它們之間聯(lián)系的程度和性質(zhì)也各不相同。這里,體溫和脈搏的關(guān)系就比產(chǎn)前檢查與嬰兒體重之間的關(guān)系密切得多,而體重和身高的關(guān)系則介與二者之間。另外,可以說(shuō)乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之間是因果關(guān)系;但是,有的現(xiàn)象之間因果不清,只是伴隨關(guān)系,例如丈夫的身高和妻子的身高之間,就不能說(shuō)有因果關(guān)系。相關(guān)與回歸就是用于研究和解釋兩個(gè)變量之間相互關(guān)系的。2024/11/12第9章雙變量相關(guān)與回歸一、簡(jiǎn)單線性回歸回歸分析是研究一個(gè)變量(Y)和另外一個(gè)或一些變量(X)間線性依存關(guān)系的統(tǒng)計(jì)分析方法。如在青少年生長(zhǎng)發(fā)育研究中體重隨著身高的增長(zhǎng)而增長(zhǎng),按專業(yè)知識(shí),描述兩個(gè)變量的數(shù)量變化關(guān)系,宜將體重作為應(yīng)變量(dependentvariable),身高作為自變量(independentvariable)。依存關(guān)系簡(jiǎn)單線性回歸(simplelinearregression)一個(gè)X多重線性回歸(multiplelinearregression)多個(gè)X醫(yī)學(xué)統(tǒng)計(jì)學(xué)2024/11/13第9章雙變量相關(guān)與回歸采用線性回歸分析可以解決以下幾方面的問題:1、探討體重是否隨身高的增長(zhǎng)而增加?2、體重與身高的關(guān)系呈直線還是曲線關(guān)系?3、如何采用回歸方程定量地描述兩者間的關(guān)系?4、該地15歲男童身高每增加1厘米,體重平均增加多少公斤?5、所建回歸方程是否成立?即兩變量間線性依存關(guān)系是否存在?6、如何由身高預(yù)測(cè)該地15歲男童的體重?醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、簡(jiǎn)單線性回歸2024/11/14第9章雙變量相關(guān)與回歸散點(diǎn)圖在做回歸或者相關(guān)分析以前,對(duì)數(shù)據(jù)必須要做散點(diǎn)圖!為了確定相關(guān)變量之間的關(guān)系,首先應(yīng)該收集一些數(shù)據(jù),這些數(shù)據(jù)應(yīng)該是成對(duì)的。例如,每人的身高和體重。然后在直角坐標(biāo)系上描述這些點(diǎn),這一組點(diǎn)集稱為散點(diǎn)圖。醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、簡(jiǎn)單線性回歸2024/11/15第9章雙變量相關(guān)與回歸醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、簡(jiǎn)單線性回歸由圖9-1可見,體重隨身高的增加而遞增,并呈直線增長(zhǎng)趨勢(shì)。但身高相同者未必有相同的體重,說(shuō)明體重除了受身高的影響之外,還可能受到一些未知的,諸如營(yíng)養(yǎng)、生活方式、遺傳等因素的影響。因此,回歸分析所描述的兩個(gè)變量間的關(guān)系,不全是一一對(duì)應(yīng)的函數(shù)關(guān)系(確定性關(guān)系),而是一種非確定性關(guān)系。

2024/11/16第9章雙變量相關(guān)與回歸

實(shí)際應(yīng)用中采用簡(jiǎn)單線性回歸模型來(lái)定量描述應(yīng)變量與自變量之間的數(shù)量關(guān)系??傮w線性回歸方程記作

β為總體回歸系數(shù)(regressioncoefficient),即直線的斜率,其統(tǒng)計(jì)學(xué)意義是X每增加(或減少)一個(gè)單位,Y平均改變?chǔ)聜€(gè)單位(即Y的均數(shù)改變?chǔ)聜€(gè)單位)。表示Y隨X改變的平均變化量,β>0,表明Y隨X的增加而增加;β<0,表明Y隨X的增加而減少;β=0,表明Y與X無(wú)線性回歸關(guān)系。

α為回歸直線在軸上的截距(intercept),其統(tǒng)計(jì)學(xué)意義為X取值為0時(shí),方程所估計(jì)值Y的平均水平。截距的解釋一定要符合專業(yè)實(shí)際。醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、簡(jiǎn)單線性回歸2024/11/17第9章雙變量相關(guān)與回歸設(shè)a和b是α和β的估計(jì)值,則可擬合得到樣本線性回歸方程表示x取某定值時(shí)相應(yīng)總體均數(shù)Y的點(diǎn)估計(jì)值,b稱為樣本回歸系數(shù),也是有單位,有符號(hào)的。其回歸方程滿足三個(gè)基本性質(zhì):①為最??;②;③回歸直線必然通過(guò)中心點(diǎn)。其中()稱為殘差(residual)。

醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、簡(jiǎn)單線性回歸2024/11/18第9章雙變量相關(guān)與回歸回歸方程的估計(jì):最小二乘法(保證回歸方程滿足三個(gè)基本性質(zhì))保證各實(shí)測(cè)點(diǎn)至直線的縱向距離()的平方和,即殘差平方和最小。考查回歸直線是否正確的方法:

1、回歸直線必然通過(guò)中心點(diǎn)2,將回歸直線左端延長(zhǎng)與Y軸相交,交點(diǎn)縱坐標(biāo)為截距3,要注意,直線只能在實(shí)測(cè)范圍內(nèi)應(yīng)用,不能隨意延長(zhǎng)!醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、簡(jiǎn)單線性回歸2024/11/19第9章雙變量相關(guān)與回歸回歸分析的統(tǒng)計(jì)推斷

Y變異的分解醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、簡(jiǎn)單線性回歸P(X,Y)XY2024/11/110第9章雙變量相關(guān)與回歸總體回歸系數(shù)的假設(shè)檢驗(yàn)——t檢驗(yàn)

注意:在簡(jiǎn)單線性回歸模型中,由于只有一個(gè)自變量,回歸模型的方差分析等價(jià)于對(duì)回歸系數(shù)的檢驗(yàn),且t=。另外,對(duì)回歸系數(shù)的假設(shè)檢驗(yàn)還有一種方法,即對(duì)相關(guān)系數(shù)作假設(shè)檢驗(yàn),在第二節(jié)講到!醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、簡(jiǎn)單線性回歸2024/11/111第9章雙變量相關(guān)與回歸擬合優(yōu)度檢驗(yàn)與決定系數(shù)回歸系數(shù)大小和兩個(gè)變量的單位及大小有關(guān),回歸系數(shù)越大,說(shuō)明Y隨X的變化越快,但并不表明影響越大。為描述這種影響的大小以及回歸方程擬合效果的好壞,引入決定系數(shù)(coefficientofdetermination)的概念。決定系數(shù)是簡(jiǎn)單線性回歸與多重線性回歸分析中一個(gè)重要的統(tǒng)計(jì)量,通常用R2表示。因SS回歸≤SS總,所以取值在0到1之間。它的大小反映了自變量對(duì)回歸的貢獻(xiàn),說(shuō)明在的總變異中用、回歸關(guān)系所能解釋的比重。決定系數(shù)越趨近于1,回歸方程的擬合效果越好,因此,常把它作為評(píng)價(jià)回歸方程效果,反映擬合優(yōu)度的指標(biāo)。醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、簡(jiǎn)單線性回歸2024/11/112第9章雙變量相關(guān)與回歸回歸分析的前提條件(LINE)

線性(linear)獨(dú)立性(independence)正態(tài)性(normality)等方差(equalvariance)

簡(jiǎn)單線性回歸分析應(yīng)用(預(yù)測(cè)與控制)利用回歸方程進(jìn)行預(yù)測(cè)預(yù)報(bào)X

Y

注意:均數(shù)的可信區(qū)間與個(gè)體值容許區(qū)間的意義不同。利用回歸方程進(jìn)行統(tǒng)計(jì)控制YX不論預(yù)測(cè)或控制,都不能超出給出數(shù)據(jù)的范圍!醫(yī)學(xué)統(tǒng)計(jì)學(xué)一、簡(jiǎn)單線性回歸2024/11/113第9章雙變量相關(guān)與回歸簡(jiǎn)單線性回歸分析可以告訴我們應(yīng)變量Y隨自變量X變化而變化的情況,研究的是變量之間的依存關(guān)系;但并未告訴我們二者間關(guān)系的密切程度。若要了解兩隨機(jī)變量間線性關(guān)系的程度與方向,就需進(jìn)行簡(jiǎn)單相關(guān)分析,也稱直線相關(guān)分析。相關(guān)分析中,變量無(wú)自變量和應(yīng)變量之分,它只研究任兩個(gè)變量之間相關(guān)關(guān)系的程度和性質(zhì),變量間的地位是平等的,這是回歸分析與相關(guān)分析區(qū)別的關(guān)鍵,但二者又有著密切的聯(lián)系。醫(yī)學(xué)統(tǒng)計(jì)學(xué)二、簡(jiǎn)單線性相關(guān)2024/11/114第9章雙變量相關(guān)與回歸★正相關(guān)★負(fù)相關(guān)★零相關(guān)★完全正相關(guān)★完全負(fù)相關(guān)醫(yī)學(xué)統(tǒng)計(jì)學(xué)二、簡(jiǎn)單線性相關(guān)2024/11/115第9章雙變量相關(guān)與回歸若兩變量X與Y呈雙變量正態(tài)分布,散點(diǎn)圖呈線性趨勢(shì),且各觀察值之間相互獨(dú)立,則兩變量之間的相關(guān)關(guān)系可采用Pearson積差相關(guān)系數(shù)表示,簡(jiǎn)稱簡(jiǎn)相關(guān)系數(shù)。樣本相關(guān)系數(shù)用r表示,總體相關(guān)系數(shù)用ρ表示。其取值范圍?1≤r≤1,一般地,r接近1表示兩變量間正向線性關(guān)聯(lián)程度較高;r接近-1表示兩變量間負(fù)向線性關(guān)聯(lián)程度較高;r接近0表示兩變量間線性關(guān)聯(lián)極弱,或無(wú)線性關(guān)聯(lián)存在。醫(yī)學(xué)統(tǒng)計(jì)學(xué)二、簡(jiǎn)單線性相關(guān)2024/11/116第9章雙變量相關(guān)與回歸相關(guān)系數(shù)的統(tǒng)計(jì)推斷1.t檢驗(yàn)對(duì)同一份資料,對(duì)總體相關(guān)系數(shù)做假設(shè)檢驗(yàn)的t值與前面對(duì)總體回歸系數(shù)作假設(shè)檢驗(yàn)的t值相等,由于Sb較難計(jì)算而Sr計(jì)算簡(jiǎn)單,故對(duì)同一資料可通過(guò)計(jì)算tr來(lái)代替tb計(jì)算,這也就是前面所說(shuō)的回歸系數(shù)假設(shè)檢驗(yàn)的第三種方法。tb=tr2.查表法醫(yī)學(xué)統(tǒng)計(jì)學(xué)二、簡(jiǎn)單線性相關(guān)2024/11/117第9章雙變量相關(guān)與回歸當(dāng)資料服從雙變量正態(tài)分布時(shí),采用第二節(jié)介紹的相關(guān)分析。若資料不服從雙變量正態(tài)分布,或數(shù)據(jù)為等級(jí)資料,或者分布型未知時(shí),宜采用本節(jié)介紹的等級(jí)相關(guān)分析,也稱秩相關(guān)分析,采用Spearman秩相關(guān)系數(shù)來(lái)表示兩變量間相關(guān)關(guān)系的密切程度和相關(guān)方向。樣本Spearman相關(guān)系數(shù)用rs表示總體Spearman相關(guān)系數(shù)用ρs表示醫(yī)學(xué)統(tǒng)計(jì)學(xué)三、秩相關(guān)2024/11/118第9章雙變量相關(guān)與回歸與Pearson相關(guān)相比,Spearman秩相關(guān)只是多了一步:對(duì)原始數(shù)據(jù)排秩次。然后利用秩次進(jìn)行Pearson相關(guān)分析。具體的相關(guān)系數(shù)計(jì)算與統(tǒng)計(jì)推斷完全一致。醫(yī)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論