中國醫(yī)科大學(xué)研究生醫(yī)學(xué)統(tǒng)計學(xué) 第七講 雙變量回歸與相關(guān)2_第1頁
中國醫(yī)科大學(xué)研究生醫(yī)學(xué)統(tǒng)計學(xué) 第七講 雙變量回歸與相關(guān)2_第2頁
中國醫(yī)科大學(xué)研究生醫(yī)學(xué)統(tǒng)計學(xué) 第七講 雙變量回歸與相關(guān)2_第3頁
中國醫(yī)科大學(xué)研究生醫(yī)學(xué)統(tǒng)計學(xué) 第七講 雙變量回歸與相關(guān)2_第4頁
中國醫(yī)科大學(xué)研究生醫(yī)學(xué)統(tǒng)計學(xué) 第七講 雙變量回歸與相關(guān)2_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第七講第七講 雙變量回歸與相關(guān)雙變量回歸與相關(guān)變量間的關(guān)系一般來說,可分為兩種:1.確定性關(guān)系:即“函數(shù)關(guān)系”,如 或2.非確定性關(guān)系:如(1)污染程度與污染源距離 (2)舒張壓與年齡 (3)人的身高與體重 (4)藥物劑量與動物死亡率回歸與相關(guān)就是研究此類問題的統(tǒng)計方法rc22rs第一節(jié) 直線回歸 一、“回歸”的由來 F .Galton K.Pearson 每對夫婦的平均身高(英寸) 成年兒子的身高(英寸)xy516.073.33 xy67)64(64 XYYE 71)72(72 XYYE 68 X69 Y二、線性回歸基本概念 當(dāng)一個變量X 改變時,另一個變量Y 也 相應(yīng)地改變,此時稱X為自變

2、量(independent variable), Y 為應(yīng)變量(dependent variable)。自變量X:可隨機(jī)變動亦可人為取值。因(應(yīng))變量Y:被視為依賴于X 而變化的 反應(yīng)變量。在X 的數(shù)值確定時按某種規(guī)律隨機(jī)變動。 可見,各散點通常并不會恰好在一條直線上,但反映出兩變量的線性趨勢。我們可以假定,相對于X 各個取值, 相應(yīng)的Y的總體均數(shù)位于一條直線上,與X之間數(shù)量上的線性依存關(guān)系就稱為線性回歸。這樣我們就可以用某個恰當(dāng)?shù)木€性回歸方程(linear regression equation)來描述Y的總體均數(shù)依賴于X的數(shù)值變化: Xxy|Xxy|XYbXaY 以 表示 的一個樣本估計值

3、,即X確定時Y的樣本均數(shù),樣本回歸方程的一般表達(dá)式可寫為: Yxy|bXaY三、直線回歸方程的建立1.一般表達(dá)式: 自變量 當(dāng) 取某一定值時,因變量 的 平均估計值。bxayxy xy截距,即當(dāng)0 x時, 的y平均估計值。a 斜率(回歸系數(shù)):當(dāng) 每改變一個單位時, 的平均改變量。xyb 11bxay22bxay21yyy )(21xxbxb因此xybkgcmxyb1552.求 和 (依據(jù)最小二乘法(method of least square)原理 ),即 最小。XXXYllXXYYXXb2)()(xbyaab 2)(yybxayxx yxbay因時yxba故當(dāng)回歸擬合線一定通過回歸擬合線一

4、定通過),(yx嗎?xbya nXXXXlXX222)()( nYXXYYYXXlXY)( )()(2) 1(xSn 四、直線回歸方程圖示: 在自變量X的實測全距范圍內(nèi)任取相距較遠(yuǎn)且易讀的兩個X值,代入回歸方程式,求出兩個 ,兩點連一直線即可。 y 五、線性回歸的統(tǒng)計推斷 1.方差分析 SS總 = SS回歸 + SS剩余 SS總SS回歸=222)()()(iiiiyyyyyy2yyi21ySn 2)(yyi22) 1(xSnb22)()(yyyyyySSiiii總22)()(yyyyiii回殘SSSS22)()(xbabxayySSi(回2)(xbbx22)(xxb22) 1(xSnbSS回歸

5、表示在Y總的變異中,可以用X與Y的線性關(guān)系引起Y變異來解釋的部分。 SS剩余= = SS總 - SS回歸 SS殘表示除X 對Y 的線性影響之外的一切其它隨機(jī)因素對Y的影響。這三個平方和的自由度依次分別為: 總=n1, 回歸=1, 殘=n2。2)(iiyySS殘具體分析步驟: 建立假設(shè)檢驗計算檢驗統(tǒng)計量查附表3(P710)F 界值表并作結(jié)論: 05. 00:0:10HH殘殘回歸回歸殘回歸/SSSSMSMSF,則P ,不拒絕H0 FF FF 若2. t 檢驗 bsbt0=n2 3.回歸方程無統(tǒng)計學(xué)意義原因:(1)影響Y 取值的,除X 外,還有其它不可忽略因素。(2)Y 與 X 關(guān)系不是線性的,而存

6、在其它關(guān)系。(3)Y與X 不存在關(guān)系。六、線性回歸方程應(yīng)用:1描述X和Y之間依存變化的數(shù)量關(guān)系2利用回歸方程進(jìn)行預(yù)測預(yù)報 3用容易測量的指標(biāo)估計不易測量的指標(biāo)4. 利用回歸方程獲得精度更高的醫(yī)學(xué)參考 值范圍5. 利用回歸方程進(jìn)行統(tǒng)計控制 七、線性回歸分析中應(yīng)注意的問題1.1.作回歸分析一定要有實際意義作回歸分析一定要有實際意義2.2.回歸分析之前首先應(yīng)繪制散點圖回歸分析之前首先應(yīng)繪制散點圖3.考慮建立線性回歸模型的基本假定考慮建立線性回歸模型的基本假定(LINE)。 L-線性;線性;I-獨立性;獨立性;N-正態(tài)性;正態(tài)性;E-方差齊性方差齊性4.不可外推。不可外推。 第二節(jié) 直線相關(guān)一、直線相

7、關(guān)的基本概念 若一個變量X由小到大(或由大到?。?,則另一變量Y亦相應(yīng)地由小到大(或由大到?。瑑蓚€變量的散點圖呈直線趨勢,我們稱這種現(xiàn)象為共變,亦就是這兩個變量之間有“相關(guān)關(guān)系”。 散點呈直線趨勢說明兩變量之間存在線性相關(guān)關(guān)系。 散點圖中的點的分布,即線性相關(guān)的性質(zhì)和相關(guān)之間的密切程度,可分為以下幾種情況:1.正相關(guān):各點的分布呈現(xiàn)橢圓形,Y隨X的增加(減少)而增加(減少),X隨Y的增加(減少)而增加(減少)2.負(fù)相關(guān):各點的分布也呈現(xiàn)橢圓形,Y隨X的增加而減少,X隨Y的增加而減少3. 零相關(guān): 無論X增加還是減少,Y不受其影響,反之,X也不受Y的影響。4.非線性相關(guān): 圖中各點分布可能表示X

8、與Y存在某種曲線相關(guān),但與線性相關(guān)已完全不同,稱為非線性相關(guān)。 二、相關(guān)系數(shù)的意義與計算1.相關(guān)系數(shù)的意義 : 相關(guān)系數(shù)(coefficient of correlation)就是說明具有直線關(guān)系的兩個變量間相關(guān)密切程度和相關(guān)方向的統(tǒng)計指標(biāo)。2. 相關(guān)系數(shù)的計算其中YYXXXYiiXYlllYYXXYYXXrr.)()()(22nYXXYYYXXlXY)( )()(nXXXXlXX222)()(2)1(xSn 3.相關(guān)系數(shù)的性質(zhì) 相關(guān)系數(shù)r沒有測量單位,其數(shù)值為-1r+1。 r值為正,表示正相關(guān); r值為負(fù),表示負(fù)相關(guān); r值為0,則稱零相關(guān)即無直線關(guān)系。當(dāng)r值的絕對值為1時,稱完全相關(guān)。22

9、22) 1()()(yYYSnnYYYYl4.注意: 生物界影響因素眾多,r值為l的機(jī)會極少,因而很少有完全相關(guān),經(jīng)常見到的是r值介于-1與+l之間,即不完全相關(guān)。在例數(shù)相等的情況下,計算出的相關(guān)系數(shù)的絕對值愈接近1,相關(guān)愈密切;相關(guān)系數(shù)愈接近0時,相關(guān)愈不密切。 兩變量間的直線關(guān)系不一定是因果兩變量間的直線關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系。關(guān)系,也可能是伴隨關(guān)系。三、相關(guān)系數(shù)的假設(shè)檢驗 建立檢驗假設(shè): 1.查表法: 一種是按自由度 直接查附表13()的 r 界值表 。2 n05. 00:0:10HH)(2/rr P)(2/rr P 2. t-test 自由度 2102 nrrtr2 n

10、 四、決定系數(shù)的意義 r的平方稱為決定系數(shù)(coefficient of determination) 總回歸SSSSllllllrYYXXXYYYXXXY/222r2反映出回歸平方和在總平方和中所占的比重。r2越接近1,回歸效果越好;應(yīng)用決定系數(shù),也可以從回歸的角度對相關(guān)程度做進(jìn)一步的了解,例如,r=0.5,r2=0.25,說明一個變量的變異僅有25% 由另一變量所引起,避免了對相關(guān)系數(shù)表示的相關(guān)程度的夸張解釋。五、相關(guān)分析應(yīng)用中應(yīng)注意的問題1.相關(guān)分析要求兩個變量是服從雙變量正態(tài)分布的資料。2.進(jìn)行相關(guān)分析前應(yīng)先繪制散點圖,散點圖呈現(xiàn)出直線趨勢時,再作分析。3.滿足應(yīng)用條件的同一份雙變量資

11、料,回歸系數(shù)與相關(guān)系數(shù)的正負(fù)號一致,假設(shè)檢驗等價。4.相關(guān)分析時,小樣本資料經(jīng)t-test 只能推斷兩變量間有無直線關(guān)系,而不能推斷其相關(guān)的密切程度。要推斷其相關(guān)的密切程度樣本含量必須足夠大。直線回歸與相關(guān)應(yīng)用的注意事項直線回歸與相關(guān)應(yīng)用的注意事項1.根據(jù)分析目的選擇變量及統(tǒng)計方法根據(jù)分析目的選擇變量及統(tǒng)計方法2.進(jìn)行相關(guān)、回歸分析前應(yīng)繪制散點圖進(jìn)行相關(guān)、回歸分析前應(yīng)繪制散點圖3.用殘差圖考察數(shù)據(jù)是否符合模型假設(shè)用殘差圖考察數(shù)據(jù)是否符合模型假設(shè)條件條件4.結(jié)果的解釋及正確應(yīng)用結(jié)果的解釋及正確應(yīng)用線性相關(guān)和回歸的區(qū)別與聯(lián)系 一、區(qū)別(一)資料要求上:1回歸:(1)因變量Y(隨機(jī)變量)必須服從正態(tài)

12、 分布,自變量X可精確測量和嚴(yán)格控制的 變量。 型回歸: xbayxyxy, (2)相關(guān):X和Y服從雙變量正態(tài)分布 型回歸: (Y對X的回歸方程或由X推Y) (X對Y的回歸方程或由Y推X) xbayxyxy, ybaXyxyx, (二)在應(yīng)用上:1回歸:反映兩個變量間依存變化的數(shù)量關(guān)系,是單向的。2. 相關(guān):表示兩個變量之間的相互關(guān)系,是雙向的。 (三)在意義上:b表示X每增大(或減?。┮粋€單位,Y平均增大(或減?。゜個單位。r 說明具有直線關(guān)系的兩個變量間相關(guān)密切程度和相關(guān)方向的統(tǒng)計指標(biāo)。 (四)計算上:(五)取值范圍:(六)單位:b 有單位,r 沒有單位。11rbYYXXXYlllr.XX

13、XYllb 二、聯(lián)系(一)對同一資料 r 與 b 正負(fù)號是相同的:r為正,說明X 與Y相關(guān)關(guān)系的方向是一致的;b為正,說明X與Y之間由回歸方程所確定的變量關(guān)系是遞增的,即X增大(或減?。┮粋€單位,Y也平均增大(或減小)b個單位。 (二)r 和b 假設(shè)檢驗等價的(即對同一樣本二者的 t 值相等),實際應(yīng)用時常用其代替對 b 的假設(shè)檢驗。rbtt Fttrb(三)相關(guān)回歸可以互相解釋: r的平方稱為決定系數(shù)(coefficient of determination)總回歸SSSSllllllrYYXXXYYYXXXY/222第三節(jié) 秩相關(guān) 一、適用范圍:1.觀測值是等級資料雙變量資料 2.不服從雙變量正態(tài)分布的資料3.觀測值是百分?jǐn)?shù)的雙變量資料 4.分布不明確的雙變量資料 二、Spearman等級相關(guān)系數(shù)1.意義:說明具有線性關(guān)系的兩變量間相關(guān)方向和密切程度的統(tǒng)計指標(biāo)。2.取值: 的數(shù)值亦在 -1與 +1之間,表示正相關(guān),表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論