2014下統(tǒng)計學課件和spss試題全集7.雙變量回歸與相關_第1頁
2014下統(tǒng)計學課件和spss試題全集7.雙變量回歸與相關_第2頁
2014下統(tǒng)計學課件和spss試題全集7.雙變量回歸與相關_第3頁
2014下統(tǒng)計學課件和spss試題全集7.雙變量回歸與相關_第4頁
2014下統(tǒng)計學課件和spss試題全集7.雙變量回歸與相關_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第九章 雙變量回歸與相關溫醫(yī)公衛(wèi)學院黃陳平概念: 回歸與相關是研究兩個或多個變量之間相互關系的一種分析方法。 回歸: 是研究變量之間統(tǒng)計依存關系的一種方法。 相關: 是研究隨機變量之間相互關系密切程度和方向的方法。 直線相關與回歸: 只涉及兩個變量,而且分析是否呈直線關系,是回歸、相關分析中最簡單的一種。又稱簡單相關和回歸?!盎貧w”起源“回歸”概念是19世紀80年代由英國科學家弗蘭西斯.高爾頓(Sir.Francis Galton,18221911)在研究父母與子女身高之間關系時提出來的。 他發(fā)現(xiàn)同一族群中,子女的平均身高介于其父母的身高和族群的平均身高之間。高個子父親的兒子的身高有低于其父親

2、身高的趨勢,而矮個子父親的兒子身高則有高于其父親的趨勢。也就是說,子代的身高有向族群平均身高“回歸”的趨勢,這就是統(tǒng)計學上“回歸”的最初含義。成年兒子身高父母平均身高回歸分析指建立應變量與自變量之間統(tǒng)計依賴關系的模型,用自變量對應變量進行“預測”,使“預測值”盡可能接近應變量的“觀測值”。變量間統(tǒng)計關系變量間函數(shù)關系變量間回歸統(tǒng)計關系因果性關系預測性關系描述性關系回歸分析基本類型 線性回歸 一元回歸 非線性回歸 多元回歸一、直線回歸1. 直線回歸方程 :X為某值時應變量Y的平均估計值a:截距b:回歸系數(shù)(樣本回歸方程)(總體回歸方程)回歸直線穿過點( xi ,i )(總體回歸方程) 20名糖尿

3、病人的血糖水平與胰島素水平的散點圖直線回歸方程的求法 原理(最小二乘法): 各散點距離回歸直線縱向距離平方和為最小而得到直線。計算:回歸直線必通過點資料要求:應變量Y服從正態(tài)分布,通常自變量X為可以精確測量或嚴格控制的因素。2. 建立直線回歸方程的具體步驟 20名糖尿病人的血糖水平與胰島素水平的散點圖繪制散點圖觀察兩變量見是否呈直線趨勢H0: 正態(tài)分布H1: 非正態(tài)分布 = 0.10正態(tài)x,y是否服從正態(tài)分布X = 346.6, Y=217.00, X2=6552.16, Y2=2517.1014 XY=3510.45, n=20, X=17.33, Y=10.85 即推斷總體回歸系數(shù)()是否

4、為零(1)方差分析 即:SS總=SS回歸+SS殘余3. 直線回歸的假設檢驗查附表3,P698,F(xiàn)0.01(1,18)=8.29 P 0.01(2)檢驗H0: = 0H1: 0(0.4585 0)/0.0699=6.56 = 18,t0.01(18) = 2.878 P 0.01F = t2=(-6.56)2 = 43.03(1)描述兩分析變量間的數(shù)量依存變化關系4. 直線回歸方程的應用4. 直線回歸方程的應用(2)預測: 1)點預測: 一般把易于測定、控制的變量作為自變量,建立回歸方程,然后對難以測定或控制的變量值進行預測。 2)區(qū)間預測: 當X是已知時,按一定概率估計應變量值或其均數(shù)所在范圍

5、當X是已知時,按一定概率估計應變量值或其均數(shù)所在范圍當X為某固定值X0時, 總體均數(shù)( )的可信區(qū)間 例6.1資料,當 X0= 15 mU/L,求 總體均數(shù)的95%可信區(qū)間。即:11.9182.1010.3396= ( 11.08, 12.76 )個體Y值的預報區(qū)間(容許區(qū)間)意義: 當X是某一固定值X0時,按一定概率估計應變量Y0的波動范圍。6.1資料,當X=15,求Y的波動范圍(=0.05)例 題 某地疾控中心根據(jù)10年來乙腦發(fā)病率(1/10萬,Y)與相應前一年7月份日照時間(小時,X)建立回歸方程,將乙腦發(fā)病率做平方根反正弦變換,即求得回歸方程已知今年7月份日照時間X=260小時,試估計

6、明年該地的乙腦發(fā)病率(設=0.05)。(3)控制: 指當要求因變量Y在一定范圍內(nèi)波動時,如何控制自變量X的取值。 例 :已知血糖正常范圍為(4.446.66 mmol/L),在例6.1資料的基礎上,問欲將血糖水平控制在正常范圍內(nèi)時,血中胰島素應維持在什么范圍內(nèi)? (=0.05) 解得:X( 33.95, 38.79)mU/L(4)利用回歸方程獲得精度更高的參考值范圍P 0, 正相關; r 0, 負相關。2. 相關系數(shù)的計算步驟(1)繪制散點圖觀察兩變量見是否呈直線趨勢;20名糖尿病人的血糖水平與胰島素水平的散點圖H0: 正態(tài)分布H1: 非正態(tài)分布 = 0.10正態(tài)(2) x,y是否服從正態(tài)分布

7、(3)計算相關系數(shù)計算例6.1資料的相關系數(shù)3. 相關系數(shù)的假設檢驗(t 檢驗)例6.1資料:H0: = 0 ; H1: 0;=0.05 查表得:P 0.01 (結果同回歸系數(shù)檢驗)三、直線相關、回歸的區(qū)別與聯(lián)系1. 區(qū)別:(1)在資料要求上不同; 回歸: 要求Y服從正態(tài)分布,X是可以精確測量或嚴格控制 的。此類回歸一般稱型回歸。 相關:要求X、Y均服從正態(tài)分布(雙變量正態(tài)分布)。此類資料進行回歸分析,稱II 型回歸。(2)在應用上不同。 回歸:反映兩變量間依存變化的數(shù)量關系; 相關:反映兩變量間相關的密切程度和方向。2. 聯(lián)系(1)同一組資料,r 與 b符號(正負號)一致; (注意:兩者大小

8、有一定關系,但不絕對)(2)同一組資料, r 與 b的假設檢驗是等價的,即tb = tr(3)可用回歸解釋相關 r2 稱為確定系數(shù),其意義為回歸變異占總變異的比值。例如:某一資料 r = 0.20 ,n = 100,求得 t =2.021,P 0.05 但 r2 = (0.20)2 =0.04, 表示回歸變異在總變異中僅占4%,說明兩變量間的相關關系實際意義不大。四、秩相關(等級相關)1. 適用于下列資料:(1)不服從雙變量正態(tài)分布的資料;(如二項分布)(2)總體分布型未知;(3)原始數(shù)據(jù)是用等級表示。2. 秩相關系數(shù)(rs)意義 不用原始數(shù)據(jù)計算,而是根據(jù)數(shù)值大小的秩次進行計算。其意義同直線

9、相關系數(shù)。 3. 秩相關系數(shù)的計算(1)按直線相關系數(shù)公式計算,只是用秩次代替原始觀察值。(2)Sperman公式法: 例6.2 為研究飲水中氟含量與氟中毒患病率之間的關系,測定了9個居民點井水中的氟含量X(mg/L),并同時通過體檢得到這些居民點中常住居民的氟中毒患病率Y(%),資料如下表:(1) (2)4. 秩相關系數(shù)的假設檢驗 H0: s = 0 ; H1: s 0;=0.05(1)查表法:n 50時,查附表14(P830) 秩相關系數(shù)界值表進行假設檢驗。 查表得:rs 0.001(9) = 0.933, P 50時,用下式進行假設檢驗。五、曲線配合(曲線擬合)兩變量之間不呈直線而是呈曲

10、線關系時,要用適當?shù)那€方程來描述兩變量間的關系。1. 曲線的類型 如指數(shù)曲線、冪曲線、多項式曲線、生長曲線等。2. 曲線配合的基本步驟(1)繪制散點圖;(2)根據(jù)兩變量間相關變化的曲線類型選擇適當?shù)那€方程;(3)用計算機有關統(tǒng)計軟件進行擬合;(4)根據(jù)配合適度指標(常用確定系數(shù)R2)來確定最優(yōu)方程。 3. 曲線配合的實例 例6.3 在一次麻疹流行中,調(diào)查了某小學各班級麻疹曾患率X(%)與發(fā)病率 Y(%)資料如下:Independent: X Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3 Y LIN .865 7 44.98 .000 17.4036 -.1954 Y LOG .714 7 17.45 .004 29.0928 -5.8222 Y INV .588 7 9.97 .016 3.0157 126.323 Y QUA .944 6 50.94 .000 13.5857 .0599 -.0030 Y CUB .945 5 28.73 .001 15.1887 -.1339 .0020 -4.E-05 Y COM .409 7 4.84 .064 43.4677 .9599 Y POW .267 7 2.54 .155

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論