




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第九章雙變量相關與回歸
Bivariate
CorrelationandRegression醫(yī)學統計學薩建DepartmentofHealthStatistics,PublicHealthSchool,ShanXiMedicalUniversityOffice:Email:2024/11/11第9章雙變量相關與回歸醫(yī)學統計學
醫(yī)學上,許多現象之間也都有相互聯系,例如:身高與體重、體溫與脈搏、產前檢查與嬰兒體重、乙肝病毒與乙肝等。在這些有關系的現象中,它們之間聯系的程度和性質也各不相同。這里,體溫和脈搏的關系就比產前檢查與嬰兒體重之間的關系密切得多,而體重和身高的關系則介與二者之間。另外,可以說乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之間是因果關系;但是,有的現象之間因果不清,只是伴隨關系,例如丈夫的身高和妻子的身高之間,就不能說有因果關系。相關與回歸就是用于研究和解釋兩個變量之間相互關系的。2024/11/12第9章雙變量相關與回歸一、簡單線性回歸回歸分析是研究一個變量(Y)和另外一個或一些變量(X)間線性依存關系的統計分析方法。如在青少年生長發(fā)育研究中體重隨著身高的增長而增長,按專業(yè)知識,描述兩個變量的數量變化關系,宜將體重作為應變量(dependentvariable),身高作為自變量(independentvariable)。依存關系簡單線性回歸(simplelinearregression)一個X多重線性回歸(multiplelinearregression)多個X醫(yī)學統計學2024/11/13第9章雙變量相關與回歸采用線性回歸分析可以解決以下幾方面的問題:1、探討體重是否隨身高的增長而增加?2、體重與身高的關系呈直線還是曲線關系?3、如何采用回歸方程定量地描述兩者間的關系?4、該地15歲男童身高每增加1厘米,體重平均增加多少公斤?5、所建回歸方程是否成立?即兩變量間線性依存關系是否存在?6、如何由身高預測該地15歲男童的體重?醫(yī)學統計學一、簡單線性回歸2024/11/14第9章雙變量相關與回歸散點圖在做回歸或者相關分析以前,對數據必須要做散點圖!為了確定相關變量之間的關系,首先應該收集一些數據,這些數據應該是成對的。例如,每人的身高和體重。然后在直角坐標系上描述這些點,這一組點集稱為散點圖。醫(yī)學統計學一、簡單線性回歸2024/11/15第9章雙變量相關與回歸醫(yī)學統計學一、簡單線性回歸由圖9-1可見,體重隨身高的增加而遞增,并呈直線增長趨勢。但身高相同者未必有相同的體重,說明體重除了受身高的影響之外,還可能受到一些未知的,諸如營養(yǎng)、生活方式、遺傳等因素的影響。因此,回歸分析所描述的兩個變量間的關系,不全是一一對應的函數關系(確定性關系),而是一種非確定性關系。
2024/11/16第9章雙變量相關與回歸
實際應用中采用簡單線性回歸模型來定量描述應變量與自變量之間的數量關系??傮w線性回歸方程記作
β為總體回歸系數(regressioncoefficient),即直線的斜率,其統計學意義是X每增加(或減少)一個單位,Y平均改變β個單位(即Y的均數改變β個單位)。表示Y隨X改變的平均變化量,β>0,表明Y隨X的增加而增加;β<0,表明Y隨X的增加而減少;β=0,表明Y與X無線性回歸關系。
α為回歸直線在軸上的截距(intercept),其統計學意義為X取值為0時,方程所估計值Y的平均水平。截距的解釋一定要符合專業(yè)實際。醫(yī)學統計學一、簡單線性回歸2024/11/17第9章雙變量相關與回歸設a和b是α和β的估計值,則可擬合得到樣本線性回歸方程表示x取某定值時相應總體均數Y的點估計值,b稱為樣本回歸系數,也是有單位,有符號的。其回歸方程滿足三個基本性質:①為最??;②;③回歸直線必然通過中心點。其中()稱為殘差(residual)。
醫(yī)學統計學一、簡單線性回歸2024/11/18第9章雙變量相關與回歸回歸方程的估計:最小二乘法(保證回歸方程滿足三個基本性質)保證各實測點至直線的縱向距離()的平方和,即殘差平方和最小。考查回歸直線是否正確的方法:
1、回歸直線必然通過中心點2,將回歸直線左端延長與Y軸相交,交點縱坐標為截距3,要注意,直線只能在實測范圍內應用,不能隨意延長!醫(yī)學統計學一、簡單線性回歸2024/11/19第9章雙變量相關與回歸回歸分析的統計推斷
Y變異的分解醫(yī)學統計學一、簡單線性回歸P(X,Y)XY2024/11/110第9章雙變量相關與回歸總體回歸系數的假設檢驗——t檢驗
注意:在簡單線性回歸模型中,由于只有一個自變量,回歸模型的方差分析等價于對回歸系數的檢驗,且t=。另外,對回歸系數的假設檢驗還有一種方法,即對相關系數作假設檢驗,在第二節(jié)講到!醫(yī)學統計學一、簡單線性回歸2024/11/111第9章雙變量相關與回歸擬合優(yōu)度檢驗與決定系數回歸系數大小和兩個變量的單位及大小有關,回歸系數越大,說明Y隨X的變化越快,但并不表明影響越大。為描述這種影響的大小以及回歸方程擬合效果的好壞,引入決定系數(coefficientofdetermination)的概念。決定系數是簡單線性回歸與多重線性回歸分析中一個重要的統計量,通常用R2表示。因SS回歸≤SS總,所以取值在0到1之間。它的大小反映了自變量對回歸的貢獻,說明在的總變異中用、回歸關系所能解釋的比重。決定系數越趨近于1,回歸方程的擬合效果越好,因此,常把它作為評價回歸方程效果,反映擬合優(yōu)度的指標。醫(yī)學統計學一、簡單線性回歸2024/11/112第9章雙變量相關與回歸回歸分析的前提條件(LINE)
線性(linear)獨立性(independence)正態(tài)性(normality)等方差(equalvariance)
簡單線性回歸分析應用(預測與控制)利用回歸方程進行預測預報X
Y
注意:均數的可信區(qū)間與個體值容許區(qū)間的意義不同。利用回歸方程進行統計控制YX不論預測或控制,都不能超出給出數據的范圍!醫(yī)學統計學一、簡單線性回歸2024/11/113第9章雙變量相關與回歸簡單線性回歸分析可以告訴我們應變量Y隨自變量X變化而變化的情況,研究的是變量之間的依存關系;但并未告訴我們二者間關系的密切程度。若要了解兩隨機變量間線性關系的程度與方向,就需進行簡單相關分析,也稱直線相關分析。相關分析中,變量無自變量和應變量之分,它只研究任兩個變量之間相關關系的程度和性質,變量間的地位是平等的,這是回歸分析與相關分析區(qū)別的關鍵,但二者又有著密切的聯系。醫(yī)學統計學二、簡單線性相關2024/11/114第9章雙變量相關與回歸★正相關★負相關★零相關★完全正相關★完全負相關醫(yī)學統計學二、簡單線性相關2024/11/115第9章雙變量相關與回歸若兩變量X與Y呈雙變量正態(tài)分布,散點圖呈線性趨勢,且各觀察值之間相互獨立,則兩變量之間的相關關系可采用Pearson積差相關系數表示,簡稱簡相關系數。樣本相關系數用r表示,總體相關系數用ρ表示。其取值范圍?1≤r≤1,一般地,r接近1表示兩變量間正向線性關聯程度較高;r接近-1表示兩變量間負向線性關聯程度較高;r接近0表示兩變量間線性關聯極弱,或無線性關聯存在。醫(yī)學統計學二、簡單線性相關2024/11/116第9章雙變量相關與回歸相關系數的統計推斷1.t檢驗對同一份資料,對總體相關系數做假設檢驗的t值與前面對總體回歸系數作假設檢驗的t值相等,由于Sb較難計算而Sr計算簡單,故對同一資料可通過計算tr來代替tb計算,這也就是前面所說的回歸系數假設檢驗的第三種方法。tb=tr2.查表法醫(yī)學統計學二、簡單線性相關2024/11/117第9章雙變量相關與回歸當資料服從雙變量正態(tài)分布時,采用第二節(jié)介紹的相關分析。若資料不服從雙變量正態(tài)分布,或數據為等級資料,或者分布型未知時,宜采用本節(jié)介紹的等級相關分析,也稱秩相關分析,采用Spearman秩相關系數來表示兩變量間相關關系的密切程度和相關方向。樣本Spearman相關系數用rs表示總體Spearman相關系數用ρs表示醫(yī)學統計學三、秩相關2024/11/118第9章雙變量相關與回歸與Pearson相關相比,Spearman秩相關只是多了一步:對原始數據排秩次。然后利用秩次進行Pearson相關分析。具體的相關系數計算與統計推斷完全一致。醫(yī)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 汽車抵押借款合同范本
- 基礎化學模擬練習題+參考答案
- 植物題庫+答案
- 小學五年級數學上冊口算能力競賽測試題
- 小倉鼠作文指導課件
- 簡易農業(yè)勞動者勞務合同
- 船運公司海上運輸合同范本
- 2025年部編版道德與法治四年級下冊第四單元復習課教案
- 二手設備買賣合同范本
- 藥品管理經驗分享
- 2023年高考真題-歷史(遼寧卷) 含答案
- 2024年湖北省武漢市中考英語真題(含解析)
- 諾如病毒課件教學課件
- 鋼結構廊架工程施工方案
- 2023年北京市初三二模數學試題匯編:新定義(第28題)
- 七年級下冊道德與法治第二單元《煥發(fā)青春活力》測試卷、答案及解析
- 項目二 物流基本功能活動管理
- 融資借款合同協議書范本(2024版)
- 工程項目審核現場踏勘記錄表
- 江蘇省儀征市第三中學蘇少版八年級下冊音樂教案(圖片版):第三單元 第二課時 共和國之戀教案1000字
- 2022-2023學年新疆維吾爾自治區(qū)喀什地區(qū)喀什市人教版六年級下冊期中測試數學試卷
評論
0/150
提交評論