第13章 直線回歸分析課件_第1頁
第13章 直線回歸分析課件_第2頁
第13章 直線回歸分析課件_第3頁
第13章 直線回歸分析課件_第4頁
第13章 直線回歸分析課件_第5頁
已閱讀5頁,還剩75頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

直線回歸分析Linearregressionanalysis第十三章公共衛(wèi)生學院統(tǒng)計與流行病學教研室第13章直線回歸分析前面討論的線性相關(guān)用于描述兩個隨機變量X與Y之間線性聯(lián)系的程度,結(jié)論所反映的是它們相互之間的關(guān)系,兩變量并無主次之分第13章直線回歸分析隨著所探索問題的深入,研究者通常更感興趣于其中的一個變量如何定量地影響另一變量的取值:例如醫(yī)學研究中常需要從某項指標估算另一項指標,如果這指標分別是測量變量X和Y,我們希望由X推算Y的值。我們稱X為自變量,Y則稱為依賴于X的因變量。如果Y與X的關(guān)系呈線性時,我們可以用線性回歸(linearregression)描述兩者的關(guān)系。第13章直線回歸分析“回歸”名稱的由來

英國遺傳統(tǒng)計學家F·Galton(1822-1911年)和他的學生、現(xiàn)代統(tǒng)計學的奠基者之一K.Pearson(1856-1936年)在研究父母身高與其子女身高的遺傳問題時,觀察了1078對夫婦,以每對夫婦中父親的身高作為解釋變量X,而取他們的一個成年兒子的身高作為被解釋變量Y(應變量),將結(jié)果在平面直角坐標系上繪成散點圖,發(fā)現(xiàn)趨勢近乎一條直線。

計算出的回歸直線方程:

第13章直線回歸分析

Galton數(shù)據(jù)散點圖(英寸)第13章直線回歸分析Galton注意到:當父親身高很高時,他的兒子的身高一般不會比父親身高更高同樣如果父親很矮,他的兒子也一般不會比父親矮,而會向一般人的均值靠攏。第13章直線回歸分析第13章直線回歸分析無論身材高還是矮的父親所生兒子的身高有向人群的平均身高“回歸”的趨勢,這就是“回歸”的生物學內(nèi)涵人們借用“回歸”一詞來描述通過自變量(indepen-dentvariable)的數(shù)值來預測反應變量(responsevariable)的平均水平第13章直線回歸分析擴展一元線性回歸多元線性回歸Logistic回歸Cox回歸第13章直線回歸分析§1直線回歸

第13章直線回歸分析直線回歸的概念

又稱簡單回歸,用于研究一個變量隨另一個變量變化而變化的數(shù)量依存關(guān)系(回歸關(guān)系),從而預測或控制未知變量的一種統(tǒng)計分析方法,通過擬合線性方程來描述兩變量間的回歸關(guān)系應用條件

要求因(應)變量Y呈正態(tài)分布自變量X是可以精確測量和控制的變量

第13章直線回歸分析直線回歸分析的一般步驟繪制散點圖求回歸系數(shù)及截距對回歸方程及回歸系數(shù)進行假設檢驗若有統(tǒng)計學意義,寫出回歸方程,畫出回歸直線第13章直線回歸分析

直線回歸方程一般表達式:a:截距(intercept),直線與Y軸交點的縱坐標(X=0)。b:斜率(slope),回歸系數(shù)(regressioncoefficient)。

或為

Y|X的估計值,讀作‘Yhat’第13章直線回歸分析Y的總體均數(shù)自變量Slope總體斜率Intercept總體截距第13章直線回歸分析標準差相等

EQUALSTANDARDDEVIATION

對于任何X值,隨機變量Y的標準差

Y|X相等獨立INDEPENDENCE

每一觀察值之間彼此獨立線性LINEARITY

反應變量均數(shù)與X間呈直線關(guān)系

Y|X=α+X直線回歸模型的四個假定(LINE)正態(tài)

NORMALITY

對于任何給定的X,Y服從正態(tài)分布,均數(shù)為

Y|X,標準差為

Y|X第13章直線回歸分析xy線性

正態(tài)

獨立

標準差相等第13章直線回歸分析回歸系數(shù)b:斜率(slope),回歸系數(shù)(regressioncoefficient)

意義:X每改變一個單位,Y平均改變b個單位

b>0,Y隨X的增大而增大(減少

而減少)——斜上

b<0,Y隨X的增大而減?。p少

而增加)——斜下

b=0,Y與X無直線關(guān)系——水平

|b|越大,表示Y隨X變化越快,直線越陡峭。第13章直線回歸分析

xyaa第13章直線回歸分析回歸系數(shù)b和截距a的計算

b是根據(jù)最小二乘法原理(各實測點至直線的縱向距離的平方和最?。┣蟮玫钠渲?,為X和Y的離均差積和為X的離均差平方和

第13章直線回歸分析最小二乘(Leastsquares)法圖解Yi估計值i

殘差i=

Yi–估計值i尋找使S(殘差i)2最小的直線使各實際散點(Y)到直線的縱向距離的平方和最小。最小第13章直線回歸分析參數(shù)計算第13章直線回歸分析第13章直線回歸分析第13章直線回歸分析對【例13-1】資料進行回歸分析第13章直線回歸分析第13章直線回歸分析第13章直線回歸分析回歸參數(shù)a、b的解釋斜率(b)當X每增加1個單位時,Y改變b個單位本例b=0.2041,表明在所研究的體重范圍內(nèi),體重每增加1kg,心臟橫徑增加0.2041cmY的截距(a)當X=0時Y的平均值本例a=4.2121,表示體重為0時,心臟橫徑的期望值為4.2121cm(注意有時這種解釋無實際意義)第13章直線回歸分析回歸系數(shù)的假設檢驗b≠0原因:①由于抽樣誤差引起,總體回歸系數(shù)β=0②的確存在回歸關(guān)系,總體回歸系數(shù)β≠0假設檢驗:方差分析t檢驗第13章直線回歸分析方差分析因變量y的取值大小不同,y取值的這種波動稱為變異。變異來源于兩個方面:由于自變量x的取值不同造成的除x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響第13章直線回歸分析對一個具體的觀測值來說,變異的大小可以通過該實際觀測值與其均值之差來表示x和y的線性關(guān)系引起的變異y的變異誤差引起的變異第13章直線回歸分析第13章直線回歸分析三個平方和的意義y的總離均差平方和(totalsumofsquares)

表示未考慮x與y的回歸關(guān)系時,一組y值之間的總變異。第13章直線回歸分析回歸平方和(regressionsumofsquares)指當自變量x引入回歸方程后,由于x值的不同而引起的之間的不同它反映在y的總變異中,可以用x與y的線性關(guān)系解釋的那部分變異。SS回越大,回歸效果越好。第13章直線回歸分析

亦稱剩余平方和(residualsumofsquares)

表示考慮回歸之后y的隨機誤差,是x對y的線性影響之外的一切因素對y的變異,即總變異中無法用x解釋的部分。

SS殘即SS剩越小,回歸效果越好。第13章直線回歸分析

ν總=ν回+ν殘相應的自由度分別為:ν總=n-1ν回=1(自變量的個數(shù))ν殘=n-2

統(tǒng)計量的構(gòu)造:第13章直線回歸分析

SS總、SS回和SS殘的計算:第13章直線回歸分析對例13-1所求回歸方程用方差分析進行檢驗【檢驗步驟】1.建立檢驗假設,確定檢驗水準H0:總體回歸系數(shù)

=0H1:總體回歸系數(shù)

0

=0.05第13章直線回歸分析2.計算檢驗統(tǒng)計量

第13章直線回歸分析表13-2例13-1資料的方差分析表變異來源SS

MSFP回歸3.344413.344443.39<0.01剩余0.8479110.0771

總4.192312第13章直線回歸分析3.確定P值,作出統(tǒng)計推斷

查F界值表,得P<0.01,按水準,拒絕H0,接受H1,認為8歲健康男童心臟橫徑與體重之間存在直線關(guān)系第13章直線回歸分析

其中,Sb為回歸系數(shù)b的標準誤

SY.X

為剩余標準差★兩種檢驗方法之間的關(guān)系:

t

檢驗表示應變量y在扣除自變量x的線性影響后的離散程度,反映實際觀察值在回歸直線周圍的分散狀況第13章直線回歸分析1.建立檢驗假設,確定檢驗水準2.計算檢驗統(tǒng)計量3.確定P值,作出統(tǒng)計推斷斜率b的t檢驗

=0.05水準拒絕H0接受H1回歸系數(shù)b有統(tǒng)計學意義第13章直線回歸分析圖示在自變量x的實測范圍內(nèi)任取相距較遠易讀的兩個值,求出相應估計值,用直線連接通過縱軸交點為(0,a)第13章直線回歸分析第13章直線回歸分析直線回歸分析的區(qū)間估計總體回歸系數(shù)β

的區(qū)間估計應變量條件均數(shù)的區(qū)間估計個體y值的容許區(qū)間估計第13章直線回歸分析

總體回歸系數(shù)β的區(qū)間估計:Sb

為回歸系數(shù)b的標準誤SY.X

為剩余標準差第13章直線回歸分析對例13-1資料,總體回歸系數(shù)β的95%可信區(qū)間:

第13章直線回歸分析

因變量條件均數(shù)的區(qū)間估計:總體中當x=x0時,y的條件均數(shù)的點估計值為:

為x=x0時的條件均數(shù)的點估計值,它遵從總體均數(shù)為和標準差為的正態(tài)分布第13章直線回歸分析

xy第13章直線回歸分析.第13章直線回歸分析

個體Y值的容許區(qū)間:是指總體中x為某定值x0時,個體y值的波動范圍

第13章直線回歸分析

xy

第13章直線回歸分析第13章直線回歸分析總體均數(shù)的可信區(qū)間與個體值的允許區(qū)間若a=0.05,1-a=95%前者表示在固定的x0處,反復抽樣100次,可計算出100個總體均數(shù)的可信區(qū)間,其中有95個區(qū)間包含了客觀存在而未知的總體均數(shù),如果只做一次計算,則得到一個可信區(qū)間,而該區(qū)間包含總體均數(shù)的可能性為95%。后者表示x0一定時,預測值的取值范圍,即如果要預測100個個體值,將有95個個體預測值分布在此范圍內(nèi)。第13章直線回歸分析95%的置信區(qū)間與個體Y

的預測區(qū)間有關(guān)數(shù)據(jù)編號XYY_hat均數(shù)下限均數(shù)上限個值下限個值上限1133.543.4713.16023.78242.89774.04492113.013.1932.98923.39662.66973.7161393.092.9152.74013.08892.40203.4270462.482.4972.18582.80801.92333.0705582.562.7752.57162.97902.25213.29856103.363.0542.87933.22812.54123.56627123.183.3323.07993.58432.78823.8760872.652.6362.38392.88832.09223.1800第13章直線回歸分析第13章直線回歸分析描述兩變量的數(shù)量依存關(guān)系利用回歸方程進行預測預報

X—預報因子(體重)

Y—預報量(心臟橫徑)

個體Y值的容許區(qū)間計算:

四、直線回歸分析的應用第13章直線回歸分析

用容易測量的指標估計不易測量的指標體重、身高、肺活量(x)估計體表面積、心室血輸出量、體循環(huán)總血量等指標(y)得到精確度更高的醫(yī)學參考值范圍7歲以下兒童身高的正常值范圍()利用回歸方程進行統(tǒng)計控制給定Y值范圍,求X值范圍第13章直線回歸分析第13章直線回歸分析第13章直線回歸分析

作回歸分析要有實際意義根據(jù)專業(yè)知識選擇分析對象應繪制散點圖觀察有否直線趨勢注意觀察異常點五、直線回歸分析的應用注意事項第13章直線回歸分析

考慮建立線性回歸模型的基本假定(LINE)滿足線性、獨立、正態(tài)和方差齊性條件直線回歸方程的適用范圍以自變量的取值范圍為限,不可隨意外延

兩變量間有線性關(guān)系存在,不一定確有因果關(guān)系可能具僅有伴隨關(guān)系,兩變量的變化可能同受另一個因素的影響第13章直線回歸分析區(qū)別資料要求不同:回歸要求因變量y

服從正態(tài)分布;x

是可以精確測量和嚴格控制的變量。直線相關(guān)要求x

和y均呈正態(tài)分布

直線回歸與相關(guān)區(qū)別與聯(lián)系

第13章直線回歸分析變量地位不同:回歸的變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預測因變量的變化相關(guān)中變量x變量y處于平等的地位,彼此相關(guān)關(guān)系用途不同:說明兩變量間依存變化的數(shù)量關(guān)系用回歸說明變量間的相關(guān)關(guān)系用相關(guān)

第13章直線回歸分析度量衡單位不同回歸系數(shù)有度量衡單位,隨變量值的單位的變化而變化相關(guān)系數(shù)沒有單位,不隨變量值單位的變化而變化r與b的絕對值反映的意義不同r的絕對值越大,散點圖中的點越趨向于一條直線表明兩變量的關(guān)系越密切,相關(guān)程度越高b的絕對值越大,回歸直線越陡,說明當X變化一個單位時,Y的平均變化就越大。反之也是一樣

第13章直線回歸分析聯(lián)系r與b的方向一致r與b的假設檢驗等價tr=tb

數(shù)量關(guān)系用回歸解釋相關(guān)r

2

稱為決定系數(shù),計算式如下:第13章直線回歸分析補充內(nèi)容

曲線擬合第13章直線回歸分析

醫(yī)學研究中,X與Y兩變量的數(shù)量關(guān)系并非總是線性的,如毒物劑量動物死亡率年齡身高時間血藥物濃度可用曲線直線化估計(Curveestimation)方法進行統(tǒng)計學分析。第13章直線回歸分析

繪制散點圖,根據(jù)圖形和專業(yè)知識選取曲線類型(可同時選取幾類)按曲線

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論