第10章兩變量關聯(lián)性分析_第1頁
第10章兩變量關聯(lián)性分析_第2頁
第10章兩變量關聯(lián)性分析_第3頁
第10章兩變量關聯(lián)性分析_第4頁
第10章兩變量關聯(lián)性分析_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第九章一元線性相關學習目標1.熟悉用散點圖確定兩定量變量之間有否線性關系;2.掌握直線相關、相關分析、相關系數(shù)及相關系數(shù)的計算、假設檢驗;3.熟悉等級相關分析。2/3/202312/3/20232一、線性相關(Linearcorrelation)1.相關:研究的兩個變量之間的相互關系。(1)因果關系:(2)共變關系:(3)相關關系:2/3/20233直線相關:兩個變量在散點圖上呈現(xiàn)直線趨勢。直線相關分析:選擇合適的統(tǒng)計量研究兩變量是否存在相關關系、相關方向及密切程度的方法、過程。相關概念2/3/20234(1)線性相關系數(shù):定量描述兩個變量之間有無相關、相關方向及其密切程度的指標。又稱為Person積矩相關系數(shù)。樣本相關系數(shù)用符號r表示;總體相關系數(shù)用符號ρ表示。線性相關系數(shù)的取值范圍:-1≤r≤12.線性相關系數(shù)(linearcorrelationcoefficient)2/3/20235(2)線性相關系數(shù)的特點:A.相關系數(shù)是無量綱值;B.相關系數(shù)r取值范圍介于-1和+1之間;C.相關系數(shù)的“+”、“-”表示變量間的相關方向;D.r=+1完全正相關;r=-1完全負相關;r=0不相關;E.相關系數(shù)取值的大小表示相關的密切程度;F.相關系數(shù)r由樣本數(shù)據(jù)得來,需要假設檢驗。2/3/202362/3/202373.散點圖(scatterplot)(1)相關分析之前先做散點圖,看是否有相關關系;(2)變量X、Y分別為橫軸和縱軸建立坐標系XOY;(3)散點圖要有標題、標目、刻度、單位;(4)在XOY中描點(X,Y);(5)點的散布形狀和疏密程度表示相關趨勢和密切程度。2/3/202382/3/202392/3/2023104.直線相關:A.要求數(shù)據(jù)成對出現(xiàn);B.雙變量為連續(xù)性變量;C.雙變量正態(tài)分布;D.變量之間是線性關系。(1).直線相關適用的資料:2/3/202311(2).線性相關系數(shù)的計算:2/3/202312計算相關系數(shù)需要計算的基礎統(tǒng)計量:線性相關系數(shù)的計算公式:2/3/202313例11-1在某地一項膳食調(diào)查中,隨機抽取14名40-60歲的健康婦女,測得每人的基礎代謝(kj/d)與體重的數(shù)據(jù),見表11-1。據(jù)此數(shù)據(jù)如何判斷這兩項指標間有無相關?線性相關分析例題:2/3/2023142/3/202315由樣本數(shù)據(jù)計算得到的相關系數(shù)r,只是總體相關系數(shù)ρ的估計值,需要對總體相關系數(shù)ρ是否等于零進行假設檢驗才能判定兩個變量之間是不是存在相關性。檢驗方法:查r界值表法t檢驗法5.直線相關系數(shù)的統(tǒng)計推斷2/3/202316(1).查表法:根據(jù)自由度ν=n-2,查r界值表(附表13),比較|r|與r界值的大小,判斷P值。|r|越大,P值越小。(2).t檢驗法:r的標準誤本例n=14,r=0.964,ν=n-2=12,查r界值表得:r0.05,12=0.532,P<0.05。2/3/202317建立假設,確定檢驗水準:

本例

n=10,r=0.7919,ν=n-2=8t0.05,12=1.782,P<0.05。拒絕H0,接受H1,可以認為兩變量存在相關關系,即健康婦女的基礎代謝和體重之間存在正向相關關系。H0:ρ=0;H1:ρ≠0;α=0.052/3/202318

相關系數(shù)的假設檢驗,P<0.05,可以認為健康婦女的基礎代謝和體重之間存在正向相關關系。相關的密切程度要用總體相關系數(shù)ρ的置信區(qū)間來估計。相關系數(shù)r的轉(zhuǎn)換:2/3/202319可以證明,z近似地服從均數(shù)為,標準差為的正態(tài)分布。我們可以計算的1-α的置信區(qū)間。2/3/202320的1-α=95%的置信區(qū)間為:z=1.9996,Z0.05/2=1.96,帶入公式得(1.4086,2.5906)。將Z=1.4086和Z=2.5906帶入得:ρ95%CI:(0.8872,0.9888)2/3/2023216、直線相關應用中的注意事項:(1)直線相關分析之前必須先做散點圖;(2)線性相關分析要求兩變量是正態(tài)隨機變量;(3)出現(xiàn)異常值時慎用相關;P200圖11-5(a)(4)相關未必真有內(nèi)在聯(lián)系,但不一定是因果關系;(5)分層資料盲目合并易出現(xiàn)假象。圖11-5(b、c、d)2/3/202322思考題1.Pearson積矩相關系數(shù)r=0,是否意味著兩變量之間一定沒有關系?2.Pearson積矩相關系數(shù)r的假設檢驗有統(tǒng)計學意義,P值很小,是否意味著兩變量之間有很強的線性關系?2/3/202323二、秩相關(rankcorrelation)1.等級相關:指雙變量等級數(shù)據(jù)的直線相關分析,用于描述兩個等級變量線性相關的方向、密切程度,常用的是Spearman等級相關。樣本等級相關系數(shù)用rS表示,總體等級相關系數(shù)用ρS表示。2/3/202324(1)雙變量計量數(shù)據(jù)不服從正態(tài)分布;(2)雙變量等級數(shù)據(jù);(3)雙變量資料分布類型不清;(4)變量之間是直線關系。2.等級相關的適用資料:2/3/202325表11-2急性白血病患兒的血小板(109/L)和出血癥狀病人編號血小板數(shù)秩次p2出血癥狀秩次q2pqXpYq(1)(2)(3)(4)(5)(6)(7)(8)=(3).(6)12111+++11.5132.2511.513824++9.0811816539+7.04921310416-3.512.2514426525++9.08145540636++9.08154740749-3.52.2524.51060864-3.512.25281260981-3.512.2531.5129010100-3.512.2535143811121+++11.5132.25126.25200412144-3.512.2542合計—78650-786304512/3/2023263.等級相關系數(shù)的計算:2/3/202327假設檢驗:n≤50時,可查rs臨界值表,若秩相關系數(shù)超過臨界值,則拒絕H0;當n≥50時,也可采用t檢驗。本例rs=-0.422,查rs臨界值表,r0.1,12=0.5303,按α=0.05的水準,不能拒絕H0,可以認為急性白血病患兒的出血癥狀與血小板數(shù)之間無相關關系。4、秩相關系數(shù)的統(tǒng)計推斷2/3/202328三、分類變量的關聯(lián)性分析對定性變量之間的聯(lián)系通用的方法是根據(jù)兩個定性變量交叉分類計數(shù)所得的頻數(shù)資料(列聯(lián)表)作關聯(lián)性分析,即關于兩種屬性獨立性的卡方檢驗。交叉分類資料的獨立性檢驗與兩獨立樣本頻數(shù)的假設檢驗計算公式相同,但是研究目的、設計方案、數(shù)據(jù)結(jié)構(gòu)、結(jié)果解釋是不一樣的。2/3/2023291.交叉分類2×2表的關聯(lián)分析例11-6為觀察嬰兒腹瀉是否與喂養(yǎng)方式有關,某醫(yī)院兒科隨機收集了消化不良的嬰兒82例,對每個個體分別觀察腹瀉與否和喂養(yǎng)方式兩種屬性,2×2種結(jié)果分類記述如表11-3所示,試分析兩種屬性的關聯(lián)性。表11-3嬰兒腹瀉與喂養(yǎng)方式的關系喂養(yǎng)方式腹瀉合計有無人工301040母乳172542合計4735822/3/202330假設檢驗:H0:喂養(yǎng)方式與嬰兒腹瀉之間相互獨立H1:喂養(yǎng)方式與嬰兒腹瀉之間有關聯(lián)α=0.05按照α=0.05水準,拒絕H0,說明嬰兒腹瀉與喂養(yǎng)方式之間存在關聯(lián)性。2/3/202331嬰兒腹瀉與喂養(yǎng)方式之間存在關聯(lián)性,可以用列聯(lián)系數(shù)來描述。2/3/2023322.2×2配對資料的關聯(lián)性分析例11-7有56份咽喉涂抹標本,把每份標本一分為二,依同樣的條件分別接種于甲乙兩種白喉桿菌培養(yǎng)基上,觀察白喉菌生長的情況,結(jié)果如表11-5,問兩種培養(yǎng)基的結(jié)果有無關聯(lián)?表11-5兩種白喉桿菌培養(yǎng)結(jié)果甲培養(yǎng)基乙培養(yǎng)基合計+-+221840-21416合計2432562/3/202333假設檢驗H0:兩種培養(yǎng)基的結(jié)果之間互相獨立H1:兩種培養(yǎng)基的結(jié)果之間有關聯(lián)α=0.05按照α=0.05水準,有理由拒絕H0,可以認為甲、乙兩種培養(yǎng)基之間存在關聯(lián)性。2/3/2023343.R×C表分類資料的關聯(lián)性分析例11-8某地居民主要有三種祖籍,均流行甲狀腺腫。為探索甲狀腺腫類型與祖籍是否有關聯(lián),現(xiàn)根據(jù)居民甲狀腺腫篩查結(jié)果,按甲狀腺腫類型與祖籍兩種屬性交叉分類,得表11-6的資料。問甲狀腺腫類型與祖籍見有否關聯(lián)?表11-6某地居民按甲狀腺腫類型與祖籍兩種屬性的交叉分類表祖籍甲狀腺腫類型合計彌漫型

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論