版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)Tel:E-Mail:醫(yī)學(xué)統(tǒng)計(jì)學(xué) 馬斌榮主編 人民衛(wèi)生出版社 2006年第四版中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)1在上一節(jié)中我們通過直線相關(guān)分析知道了待產(chǎn)婦尿中雌三醇含量和新生兒體重之間成正相關(guān)關(guān)系。那么,如果我們知道了一位待產(chǎn)婦的尿雌三醇含量,能推斷出這個新生兒的體重嗎?或者這個新生兒的體重可能在什么范圍內(nèi)呢?對此相關(guān)分析不能給我們答案,這些問題需要使用直線回歸的方法來解決。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)2第二節(jié) 線性回歸當(dāng)我們知道了兩個變量之間有直線相關(guān)關(guān)系,并且一個變量的變化會引起另一個變量的變化,這時,如果它們之間存在準(zhǔn)確、嚴(yán)格的關(guān)系,那么它們的變化可用函數(shù)方程來表示。在實(shí)際生活當(dāng)中,由于其它因
2、素的干擾,許多雙變量之間的關(guān)系并不是嚴(yán)格的函數(shù)關(guān)系,不能用函數(shù)方程來反映。但是,我們需要利用數(shù)學(xué)函數(shù)的理論去研究兩變量之間的數(shù)量依存關(guān)系,為了區(qū)別于數(shù)學(xué)上確定的函數(shù)方程,我們稱這種關(guān)系式為直線回歸方程,這種關(guān)系為直線回歸。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)3直線回歸的統(tǒng)計(jì)模型1.yi是xi的線性函數(shù)部分加上誤差項(xiàng)i;2.:截距(intercept),是x0時y的本底水平;3.回歸部分x :y的變化中隨x變化而變化的部分;稱為回歸系數(shù)(regression coefficient):自變量x每改變一個度量單位,應(yīng)變量y改變量的平均估計(jì)值;4.隨機(jī)誤差i :又稱殘差(residual);是不能由變量x所解釋的變異
3、部分;反映了除變量x之外的隨機(jī)因素對y的影響。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)4建立直線回歸方程利用樣本數(shù)據(jù)計(jì)算參數(shù)和的估計(jì)值a和b,建立模型的估計(jì)方程,即尋找一條與所有散點(diǎn)都最為接近(實(shí)測點(diǎn)到直線的縱向距離)的直線,使得總的預(yù)測誤差最小。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)5尋找總的預(yù)測誤差最小的直線X觀測值預(yù)測值預(yù)測誤差(殘差)Y中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)6最小二乘法(least square method)怎樣的 最好的代表了所有的y,需要有個標(biāo)準(zhǔn)。經(jīng)典的標(biāo)準(zhǔn)是最小二乘(least squares)原則:每個觀察點(diǎn)距離回歸線的縱向距離的平方和最小,即殘差平方和最小:因?yàn)橹本€一定經(jīng)過“樣本均數(shù)”點(diǎn)中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)7計(jì)算例1資料
4、的估計(jì)值a和b中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)8將估計(jì)值a和b代入方程回歸參數(shù)a、b的解釋1.斜率(b):當(dāng)x每增加1個單位時,y平均改變b個單位;本例b0.0608,表明待產(chǎn)婦尿中雌三醇含量每增加1mg/24h,新生兒體重平均增加0.0608kg。2.截距(a):當(dāng)x0時y本底水平的平均估計(jì)值;本例a2.1523,表示待產(chǎn)婦尿中雌三醇含量為0時,新生兒體重的本底值為2.1523kg(注意這種解釋有時候并無實(shí)際意義,如x是否可取0)。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)9問題:直線回歸方程的建立是否一定能說明雌三醇含量與新生兒體重之間存在回歸關(guān)系?與直線相關(guān)一樣,直線回歸方程也是從樣本資料計(jì)算而得的,同樣也存在著抽樣誤差問題
5、。所以,需要對樣本的回歸系數(shù)b進(jìn)行假設(shè)檢驗(yàn),以判斷b是否從回歸系數(shù)為零的總體中抽得(即檢驗(yàn)總體回歸系數(shù)是否為0)。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)10(一)回歸系數(shù)的假設(shè)檢驗(yàn)(t檢驗(yàn)):1.建立檢驗(yàn)假設(shè):H0:0H1:00.052.計(jì)算統(tǒng)計(jì)量t:回歸方程的假設(shè)檢驗(yàn)中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)11Sb :回歸系數(shù)的標(biāo)準(zhǔn)誤;Sy.x :殘差標(biāo)準(zhǔn)差(又稱剩余標(biāo)準(zhǔn)差),即去除x對y的影響后y的變異。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)12例1資料回歸系數(shù)的t檢驗(yàn)查t界值表t0.05(29)2.045t,在0.05水準(zhǔn)拒絕H0,認(rèn)為總體回歸系數(shù)不為零,雌三醇含量與新生兒出生體重之間存在線性回歸關(guān)系。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)13(二)回歸模型的假設(shè)檢驗(yàn)
6、(方差分析,ANOVA):1.建立檢驗(yàn)假設(shè):H0:回歸模型不成立H1:回歸模型成立0.052.計(jì)算統(tǒng)計(jì)量F:方差分析的基本思想:將應(yīng)變量y的總變異分解成兩個部分,一個是處理因素(自變量x)帶來的回歸變異,另一個是隨機(jī)誤差帶來的殘差變異?;貧w變異:又稱回歸均方(方差),即y的變異中因?yàn)閤對y的線性回歸關(guān)系而帶來的變異;殘差變異:又稱殘差均方(方差),是除了自變量x之外的其他隨機(jī)因素對y帶來的變異;中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)14F檢驗(yàn)就是將兩部分的變異進(jìn)行比較:如果F值接近1,說明回歸變異和殘差變異沒有多大差別,兩者都是隨機(jī)誤差,處理因素(自變量x)對應(yīng)變量y沒有線性回歸關(guān)系,回歸模型不成立;如果F值遠(yuǎn)大
7、于1,說明回歸變異遠(yuǎn)大于殘差變異,處理因素(自變量x)帶來的變異不能簡單的解釋為隨機(jī)誤差,即處理因素(自變量x)對應(yīng)變量y存在回歸關(guān)系,回歸模型成立。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)15中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)16從上圖可以看出:上式兩端平方,數(shù)學(xué)上可以證明:y的總離均差平方和等于回歸離均差平方和加上殘差離均差平方和,y的自由度等于回歸自由度加上殘差自由度。即:SS總SS回SS殘,v總v回v殘中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)17例1資料的方差分析表變異 來源 離均差平方和(SS)自由度(v)均方 (MS) F值回歸2.5057412.5057417.16殘差4.23426290.14601總變異6.7400030查F界值表F0
8、.05(1,29)4.18F,在0.05水準(zhǔn)拒絕H0,認(rèn)為處理因素(自變量x)對應(yīng)變量y存在回歸關(guān)系,回歸模型成立。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)18相關(guān)系數(shù)與回歸系數(shù)假設(shè)檢驗(yàn)的關(guān)系從上述計(jì)算結(jié)果可以看到:相關(guān)系數(shù)和回歸系數(shù)的t檢驗(yàn)結(jié)果完全等價,并且與各自的方差分析結(jié)果完全等價(分子的自由度為1,即兩變量分析)中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)19直線回歸分析的應(yīng)用 1.建立統(tǒng)計(jì)模型解釋應(yīng)變量對自變量的數(shù)量依存關(guān)系2.自變量預(yù)測應(yīng)變量:利用已知、容易測量或可以測量的變量去預(yù)測未知、不易測量或不可測量的變量由父親的身高預(yù)測兒子成人后的身高;3.應(yīng)變量控制自變量:利用應(yīng)變量反向控制自變量已知鉛作業(yè)的時間(x)與血鉛濃度(y)
9、的回歸關(guān)系,當(dāng)制定人體血鉛正常值上限標(biāo)準(zhǔn)后,控制工人鉛作業(yè)的時間;已知汽車流量(x)與空氣氮氧化物污染濃度(y)的回歸關(guān)系,當(dāng)制定空氣氮氧化物的限制標(biāo)準(zhǔn)后,控制汽車流量。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)201.的置信區(qū)間: 意義:估計(jì)總體回歸系數(shù)取值范圍的大小例1資料:回歸系數(shù)為0.0608,計(jì)算置信區(qū)間是(0.0308, 0.0908)區(qū)間范圍不包括0,即總體回歸系數(shù)不為0,說明尿雌三醇含量對新生兒的體重存在回歸關(guān)系。利用回歸方程進(jìn)行估計(jì)和預(yù)測 中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)212.總體 的置信區(qū)間:意義:當(dāng)自變量x取值為某一定值xi時,回歸方程對應(yīng)的估計(jì)值yi的總體條件均數(shù)的取值范圍。例1資料:如果某位待產(chǎn)婦尿中雌
10、三醇含量為16mg/24h,估計(jì)其新生兒體重的均數(shù)是3.1251kg,總體均數(shù)的95置信區(qū)間是2.983.27kg。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)22總體 的95%置信區(qū)間中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)233.個體y值的預(yù)測區(qū)間:意義:當(dāng)自變量x取值為某一定值xi時,預(yù)測應(yīng)變量估計(jì)值yi取值的參考值范圍。例1資料:如果某位待產(chǎn)婦尿中雌三醇含量為16mg/24h,估計(jì)其新生兒體重的均數(shù)是3.1251kg,95%參考值范圍是2.333.92kg。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)24個體y值的95%預(yù)測區(qū)間中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)2595置信區(qū)間和參考值范圍中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)26線性回歸的類型與條件 (一)線性回歸的類型:型回歸:y是來自正態(tài)
11、分布總體的隨機(jī)變量,x是精確測量或可控制的變量。(溶液濃度與光密度)型回歸:y是來自正態(tài)分布總體的隨機(jī)變量,x也是來自正態(tài)分布總體的隨機(jī)變量。(父高與子高)(二)線性回歸的條件:1.線性(linearity):y與x之間存在直線關(guān)系;2.獨(dú)立性(independence):各觀察值間彼此獨(dú)立;3.正態(tài)性(normality):對于任何給定的自變量x,應(yīng)變量y都有一個服從正態(tài)分布的取值范圍對應(yīng);4.等方差(equal variance):對于任何給定的自變量x,應(yīng)變量y每一個取值范圍的方差相等。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)27給定x,y是正態(tài)分布、方差相等示意圖中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)28給定x,y是正態(tài)分布、
12、方差不等示意圖中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)29相關(guān)與回歸的區(qū)別(一)資料要求不同:1.相關(guān)分析:對稱地對待兩個變量,對自變量和應(yīng)變量不加以區(qū)別。要求:x與y均為隨機(jī)變量(有概率分布),且x和y都來自正態(tài)分布總體(雙變量正態(tài)分布)。2.回歸分析:應(yīng)變量和自變量的處理不對稱。自變量x:被看做是(在重復(fù)抽樣中)可精確測量或嚴(yán)格控制的變量。應(yīng)變量y:是隨機(jī)變量,并且對于任何一個選定的x,應(yīng)變量y都有一個正態(tài)分布的總體與之對應(yīng),且這些總體的方差都相等。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)30(二)應(yīng)用方向不同:1.相關(guān)分析:研究兩個變量之間的相互關(guān)系,即在兩個變量中,任何一個的變化都會引起另一個的變化,是一種雙向變化的關(guān)系。通過相
13、關(guān)分析可以知道兩個變量是否有關(guān)系,關(guān)系是否密切,性質(zhì)是屬于正相關(guān)還是負(fù)相關(guān)。2.回歸分析:研究兩個變量在數(shù)量比例上的依存關(guān)系,一個變量的改變會引起另一個變量的變化,是一種單向的關(guān)系?;貧w是對兩個變量做定量描述,研究變量間的數(shù)量依存關(guān)系,已知一個變量值可以預(yù)測或控制另一個變量值,并且得到定量的結(jié)果。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)31(三)參數(shù)性質(zhì)不同:1.相關(guān)系數(shù)r:說明具有直線關(guān)系的兩個變量間相關(guān)方向和密切程度的統(tǒng)計(jì)指標(biāo)。沒有單位,取值范圍【-1,1】;絕對值意義:絕對值越大,散點(diǎn)越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。2.回歸系數(shù)b:表示x每增大(或減小)一個單位,y平均增大(或減小)b
14、個單位。有單位(y的單位/x的單位),取值范圍無限;絕對值意義:絕對值越大,回歸直線越陡,說明當(dāng)x變化一個單位時,y的平均變化就越大。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)32相關(guān)與回歸的聯(lián)系(一)相關(guān)系數(shù)和回歸系數(shù)的聯(lián)系:對于同一組樣本資料,如果知道變量x和y的標(biāo)準(zhǔn)差sx、sy,相關(guān)系數(shù)和回歸系數(shù)可以互相推算。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)33(二)方向一致且假設(shè)檢驗(yàn)等價1.對于同一組樣本資料,r與b符號一致。r為正時,b也為正,表示兩變量是正相關(guān),是同向變化(x變大y也變大)。r為負(fù)時,b也為負(fù),表示兩變量是負(fù)相關(guān),是反向變化(x變大y會變小)。2.對于同一組樣本資料,r與b的假設(shè)檢驗(yàn)結(jié)果等價,可用r的顯著檢驗(yàn)代替b的顯
15、著性檢驗(yàn)。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)34(三)相關(guān)回歸可以互相解釋確定系數(shù)(coefficient of determination):相關(guān)系數(shù)的平方,反映x對y的回歸貢獻(xiàn)的程度大小。計(jì)算公式:在應(yīng)變量y的總離均差平方和中自變量x的回歸離均差平方和所占的比例,即自變量x的回歸貢獻(xiàn)對應(yīng)變量y的總變異能解釋的百分比。取值范圍:【0,1】,越接近1,說明實(shí)際觀測點(diǎn)離回歸直線越近,回歸模型的擬合度越高。 例1:r=0.6097,R2=0.3717,即待產(chǎn)婦尿中雌三醇含量大約可解釋新生兒體重變異性的37.17%。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)35相關(guān)回歸分析的注意事項(xiàng)1.實(shí)際意義:進(jìn)行相關(guān)回歸分析要有實(shí)際意義,不可把毫無關(guān)
16、系的兩個事物或現(xiàn)象用來作相關(guān)回歸分析。例如:有人說,孩子長,公園里的小樹也在長。但是求孩子身高和小樹高度之間的相關(guān)關(guān)系就毫無意義,用孩子的身高推測小樹的高度則更加荒謬。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)362.繪制散點(diǎn)圖:對于性質(zhì)不明確的兩組變量數(shù)據(jù),首先應(yīng)繪制散點(diǎn)圖,在圖上看它們是否呈現(xiàn)出直線趨勢,然后再進(jìn)行相關(guān)分析判斷變量有無關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負(fù)相關(guān)。對于確有相關(guān)關(guān)系的變量再進(jìn)行回歸分析,求出回歸方程。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)373.正確判斷關(guān)系的性質(zhì):兩變量間的直線關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系。例如:有人發(fā)現(xiàn),對于在校兒童,鞋的大小與閱讀技能有很強(qiáng)的相關(guān)關(guān)系。然而,學(xué)會新詞并不能使腳變大,原因涉及到第三個因素-年齡。當(dāng)兒童年齡長大腳也在長大,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 41869.3-2024光學(xué)和光子學(xué)微透鏡陣列第3部分:光學(xué)特性測試方法
- 供熱供氣工程履約擔(dān)保格式
- 2025版?zhèn)湄浶袠I(yè)質(zhì)量認(rèn)證合同范本3篇
- 展覽館弱電系統(tǒng)改造合同模板
- 醫(yī)療服務(wù)票據(jù)管理策略與流程
- 2025年度綠色辦公用品采購及回收利用合同3篇
- 紡織服裝電力供應(yīng)協(xié)議準(zhǔn)則
- 城市濱水區(qū)改造房屋拆除工程協(xié)議
- 2025版電梯設(shè)備安裝與維護(hù)合同范本3篇
- 船只租賃合同:水上建筑維修
- 金色年終匯報(bào)PPT模板
- 《鼻負(fù)壓置換術(shù)在兒童呼吸道感染中的應(yīng)用及護(hù)理對策研究【論文】3600字》
- 沭陽縣國土空間總體規(guī)劃(2021-2035)草案公示1
- C++初學(xué)者入門全篇
- 發(fā)動機(jī)機(jī)械系統(tǒng)2.0升ltg-9.66維修指南車下
- 哈爾濱市商品房買賣合同書(最終定稿)
- 警犬行為理論考試題庫(含答案)
- 財(cái)政與金融基礎(chǔ)知識全套教學(xué)課件(中職)
- oppo其它-lpdt工作手冊
- 中醫(yī)診所規(guī)章制度(完整版)
- 職工董事選舉辦法
評論
0/150
提交評論