版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第十章直線回歸與相關(guān)學(xué)時(shí)分配:6 學(xué)時(shí)掌握內(nèi)容:1.直線相關(guān)與直線回歸的概念、適用條件、分析步驟。2.相關(guān)系數(shù)的計(jì)算和檢驗(yàn)。3.回歸方程的求法及檢驗(yàn)。4.直線相關(guān)與直線回歸的應(yīng)用及其注意事項(xiàng)。熟悉內(nèi)容:1.總體相關(guān)系數(shù)與總體回歸系數(shù)可信區(qū)間的估計(jì)。2.直線相關(guān)與直線回歸的區(qū)別與聯(lián)系。3.等級(jí)相關(guān)分析的應(yīng)用和計(jì)算。了解內(nèi)容:1.可信區(qū)間的估計(jì)和個(gè)體y值容許區(qū)間的估計(jì)。2.曲線直線化。難點(diǎn)內(nèi)容:1. 直線相關(guān)與直線回歸的應(yīng)用及其注意事項(xiàng)。2. 總體相關(guān)系數(shù)與總體回歸系數(shù)可信區(qū)間的估計(jì)。在醫(yī)學(xué)科學(xué)研究中,常要分析變量間的關(guān)系,如年齡與血壓、吸煙與肺癌、藥物劑量與動(dòng)物死亡率、環(huán)境介質(zhì)中污染物濃度與污染
2、源的距離等,回歸與相關(guān)(regreSSion and correlation)就是研究這種關(guān)系的統(tǒng)計(jì)方法。本章只介紹回歸與相關(guān)中最簡(jiǎn)單、最基本的兩個(gè)變量間呈直線關(guān)系的分析方法。 第一節(jié)直線回歸一、直線回歸的概念直線回歸(linear regreSSion)是用直線回歸方程表示兩個(gè)數(shù)量變量間依存關(guān)系的統(tǒng)計(jì)分析方法,屬雙變量分析的范疇。如果某一個(gè)變量隨著另一個(gè)變量的變化而變化,并且它們的變化在直角坐標(biāo)系中呈直線趨勢(shì),就可以用一個(gè)直線方程來(lái)定量地描述它們之間的數(shù)量依存關(guān)系,這就是直線回歸分析。直線回歸分析中兩個(gè)變量的地位不同,其中一個(gè)變量是依賴(lài)另一個(gè)變量而變化的,因此分別稱(chēng)為因變量(dependen
3、t variable)和自變量(independent variable),習(xí)慣上分別用y和x來(lái)表示。其中x可以是規(guī)律變化的或人為選定的一些數(shù)值(非隨機(jī)變量),也可以是隨機(jī)變量,前者稱(chēng)為I型回歸,后者稱(chēng)為II型回歸。二、直線回歸分析的應(yīng)用條件1.兩變量的變化趨勢(shì)呈直線趨勢(shì)(linear);2.因變量y屬于正態(tài)隨機(jī)變量(normal distribution);3.對(duì)于I型要求對(duì)于每個(gè)選定的X,y都有一個(gè)正態(tài)分布的總體,并且這些總體的方差都相等(equal variance);對(duì)于II型回歸,要求x、y服從雙變量正態(tài)分布。三、直線回歸分析的一般步驟1.將n個(gè)觀察單位的變量對(duì)(x,y)在直角坐標(biāo)系
4、中繪制散點(diǎn)圖,若呈直線趨勢(shì),則可擬合直線回歸方程。2.求回歸方程的回歸系數(shù)和截矩。3.寫(xiě)出回歸方程,畫(huà)出回歸直線。4.對(duì)回歸方程進(jìn)行假設(shè)檢驗(yàn)。四、直線回歸方程及其求法(一)方程的形式及意義:直線回歸方程的一般形式為其中b稱(chēng)為回歸系數(shù)(coefficient of regression),含義為當(dāng)x每變化1個(gè)單位時(shí),因變量Y平均變化的單數(shù);a稱(chēng)為截矩(intercept),為回歸直線或其延長(zhǎng)線與y軸交點(diǎn)的縱坐標(biāo)。(二)直線回歸方程的求法:方程中的a 和b是兩個(gè)待定常數(shù),根據(jù)樣本實(shí)測(cè)(x,y)計(jì)算a 和b的過(guò)程就是求回歸方程的過(guò)程。為使方程能較好地反映各點(diǎn)的分布規(guī)律,應(yīng)該使各實(shí)測(cè)點(diǎn)到回歸直線的縱向
5、距離的平方和最小,這就是最小二乘法(least square method)原理。按以下公式計(jì)算:1.先求b:(12.2)式中l(wèi)xy為X、Y的離均差積和,lxx為X的離均差平方和;(12.3)(12.4)2.再求a:(12.5)因此,直線回歸方程也可用如下形式表示:。五、直線回歸方程的假設(shè)檢驗(yàn)回歸系數(shù)的檢驗(yàn)亦即是回歸關(guān)系的檢驗(yàn),又稱(chēng)回歸方程的檢驗(yàn),其目的是檢驗(yàn)求得的回歸方程在總體中是否成立,即是否樣本代表的總體也有直線回歸關(guān)系。我們知道即使X、Y的總體回歸系數(shù)為零,由于抽樣誤差的原因,其樣本回歸系數(shù)b也不一定為零,因此,需作是否為零的假設(shè)檢驗(yàn),方法有以下兩種:(一)方差分析其基本思想是將應(yīng)變量
6、Y的總變異SS總分解為SS回歸和SS剩余,然后利用F檢驗(yàn)來(lái)判斷回歸方程是否成立。SS總即,為Y的離均差平方和(total sum of squares),反映未考慮X與Y的回歸關(guān)系時(shí)Y的變異,其意義可通過(guò)圖12.2加以說(shuō)明。P(X,Y)YX圖12.2應(yīng)變量Y的平方和劃分示意圖任一點(diǎn)P的縱坐標(biāo)被回歸直線與均數(shù)截成三段:第一段,表示實(shí)測(cè)點(diǎn)P與回歸直線的縱向距離,即實(shí)際值Y與估計(jì)值之差,稱(chēng)為剩余或殘差。第二段,即Y估計(jì)值與均數(shù)之差,它與回歸系數(shù)的大小有關(guān)。|b|值越大,也越大,反之亦然。當(dāng)b=0時(shí),亦為零,則=,也就是回歸直線不能使殘差減小。第三段,是應(yīng)變量Y的均數(shù)。上述三段的代數(shù)和為:Y=+移項(xiàng):
7、Y-=+P點(diǎn)是散點(diǎn)圖中任取的一點(diǎn),將所有點(diǎn)都按上法處理,并將等式兩端平方后再求和,則有:上式用符號(hào)表示為:SS總=SS回+SS剩(12.6)式中,SS回即,為回歸平方和(regression sum of squares),它反映在Y的總變異SS總中由于X與Y的直線關(guān)系而使Y變異減小的部分,也就是在總平方和中可以用X解釋的部分。SS回越大,說(shuō)明回歸效果越好,即SS總中可用X與Y線性關(guān)系解釋的變異越多。SS剩即,為剩余平方和(residual sum of squares),它反映X對(duì)Y的線性影響之外的一切因素對(duì)Y的變異的作用,也就是在總平方和SS總中無(wú)法用X解釋的部分。在散點(diǎn)圖中,各實(shí)測(cè)點(diǎn)離回
8、歸直線越近,也就越小,說(shuō)明直線回歸的估計(jì)誤差越小。所以,總變異SS總是由回歸關(guān)系引起的SS回和與回歸無(wú)關(guān)的其它各種因素產(chǎn)生的SS剩所構(gòu)成。若回歸直線與各實(shí)測(cè)點(diǎn)十分吻合,則SS回將明顯大于SS剩,當(dāng)全部實(shí)測(cè)值都在回歸直線上時(shí),SS總=SS回,SS剩=0,反之,若回歸直線擬合不好,SS回相對(duì)較小,SS剩則相對(duì)增大。可見(jiàn)SS回/SS剩反映了回歸的效果。上述三 個(gè)平方和,各有其相應(yīng)的自由度,并有如下的關(guān)系:總=回+剩總=n-1,回=1,剩=n-2(12.7)式中,n為樣本含量。SS總的計(jì)算大家已熟悉,即(12.8)SS回和SS??赏ㄟ^(guò)下列公式進(jìn)行計(jì)算(12.9)SS剩= SS總-SS回(12.10)方
9、差分析時(shí)的步驟與一般假設(shè)檢驗(yàn)相同。統(tǒng)計(jì)量F的計(jì)算(12.11)(二)t檢驗(yàn)其基本思想是利用樣本回歸系數(shù)b與總體均數(shù)回歸系數(shù)?進(jìn)行比較來(lái)判斷回歸方程是否成立,實(shí)際應(yīng)用中因?yàn)榛貧w系數(shù)b的檢驗(yàn)過(guò)程較為復(fù)雜,而相關(guān)系數(shù)r的檢驗(yàn)過(guò)程簡(jiǎn)單并與之等價(jià),故一般用相關(guān)系數(shù)r的檢驗(yàn)來(lái)代替回歸系數(shù)b的檢驗(yàn)。統(tǒng)計(jì)量t的計(jì)算公式為(12.12)(12.13)(12.14)式中,Sb為樣本回歸系數(shù)的標(biāo)準(zhǔn)誤;SY.X為剩余標(biāo)準(zhǔn)差(residual standard deviation),它是指扣除了X對(duì)Y的線性影響后,Y的變異,可用以說(shuō)明估計(jì)值的精確性。SY.X越小,表示回歸方程的估計(jì)精度越高。說(shuō)明:兩種檢驗(yàn)方法是等價(jià)的,
10、F=t2。例10.1某醫(yī)生研究?jī)和w重與心臟橫徑的關(guān)系,測(cè)得13名8歲正常男童的體重與心臟橫徑,數(shù)據(jù)見(jiàn)表10.1。試作回歸分析。(1)以體重作為自變量,心臟橫徑作為因變量,作散點(diǎn)圖(圖10.1),發(fā)現(xiàn)呈直線趨勢(shì),可擬合直線回歸方程。表10.113名8歲健康男童體重與心臟橫徑的關(guān)系編號(hào)體重(kg,X)心臟橫徑(cm,Y)125.59.2219.57.8324.09.4420.58.6525.09.0622.08.8721.59.0823.59.4926.59.71023.58.81122.08.51220.08.21328.09.9(2)求回歸方程: 本例,,,故,回歸方程為。(3)回歸方程的檢
11、驗(yàn):方差分析:H0:總體回歸系數(shù)b=0,即8歲男童心臟橫徑與體重之間不存在直線關(guān)系H1:總體回歸系數(shù)b10,即8歲男童心臟橫徑與體重之間存在直線關(guān)系a=0.05,變異來(lái)源SSnMSFP總4.192312回歸3.344413.344443.390.01剩余0.8479110.0771查方差分析用的F界值表,得P0.01,按a=0.05水準(zhǔn)拒絕H0,接受H1,認(rèn)為8歲健康男童心臟橫徑與體重之間存在直線關(guān)系。t檢驗(yàn):H0:總體回歸系數(shù)b=0,即8歲男童心臟橫徑與體重之間不存在直線關(guān)系H1:總體回歸系數(shù)b10,即8歲男童心臟橫徑與體重之間存在直線關(guān)系a=0.05, 按n=11查t界值表,得P0.01,
12、按a=0.05水準(zhǔn)拒絕H0,接受H1,認(rèn)為8歲健康男童心臟橫徑與體重之間存在直線關(guān)系。六、直線回歸方程的圖示為了進(jìn)行直觀分析或?qū)嶋H需要,可在坐標(biāo)軸上任意取相距較遠(yuǎn)且易讀的兩X值,根據(jù)所求直線回歸方程算得對(duì)應(yīng)值,如上例取X1=20.0, X2=25.0,代入回歸方程算得,。在圖上確定(20.0,8.2945)和(25.0,9.3151)兩個(gè)點(diǎn),連接上述兩點(diǎn)就可得到回歸方程的圖示(見(jiàn)圖1)。應(yīng)注意的是,連出的回歸直線不應(yīng)超過(guò)X的實(shí)測(cè)值范圍;所繪回歸直線必然通過(guò);將直線的左端延長(zhǎng)與縱軸交點(diǎn)的縱坐標(biāo)必等于截距a,據(jù)此可判斷所繪圖形是否正確。七、直線回歸的區(qū)間估計(jì)(一)總體回歸系數(shù)的區(qū)間估計(jì)根據(jù)參數(shù)估計(jì)
13、原理,回歸系數(shù)b是總體回歸系數(shù)的點(diǎn)估計(jì),正像樣本均數(shù)不一定恰好等于總體均數(shù)一樣,需要通過(guò)式(12.15)對(duì)總體回歸系數(shù)進(jìn)行區(qū)間估計(jì)。(12.15)式中Sb為回歸系數(shù)的標(biāo)準(zhǔn)誤;n-2為自由度。例10.2根據(jù)例10.1資料的樣本回歸系數(shù)b=0.2141估計(jì)總體回歸系數(shù)的95%可信區(qū)間。已知b=0.2141,sb=0.03098,t0.05(11)=2.201則總體回歸系數(shù)的95%可信區(qū)間為(0.2141-2.2010.03098, 0.2041+2.2010.03098)=(0.1359,0.2723)(二)的區(qū)間估計(jì)是指總體中自變量X為某一定值X0時(shí),的總體均數(shù)。對(duì)的估計(jì)可計(jì)算可信區(qū)間:(12.
14、16)式中即的標(biāo)準(zhǔn)誤,可按下式計(jì)算:(12.17)式中SY.X為剩余標(biāo)準(zhǔn)差。當(dāng)時(shí),此時(shí),可信區(qū)間的范圍最窄,預(yù)測(cè)精度相對(duì)較高。例10.3根據(jù)例10.1資料,試計(jì)算當(dāng)X0=25.0kg時(shí),的95%可信區(qū)間。已知,, =4.2121+0.204125.0=9.3151t0.05(6)=2.201當(dāng)X0=1.00時(shí),的95%可信區(qū)間為(9.3151-2.2010.0952, 9.3151+2.2010.0952)=(9.106,9.525)即體重為25.0kg的8歲男童,估計(jì)其心臟橫徑的總體均數(shù)在(9.106,9.525)范圍內(nèi)的可能性為95%。(三)個(gè)體Y值的容許區(qū)間總體中,X為一定值時(shí),個(gè)體Y值
15、的波動(dòng)范圍,可按下式求出:(12.18)式中SY為X取一定值時(shí),個(gè)體Y值的標(biāo)準(zhǔn)差,其計(jì)算公式為(12.19)例10.4根據(jù)例10.1資料,試計(jì)算當(dāng)X0=25.0時(shí),個(gè)體Y值的95%容許區(qū)間。已知=9.3151,t0.05(11)=2.201,SY.X=0.2776故當(dāng)X0=1.00時(shí),個(gè)體Y值的95%容許區(qū)間為:(9.3151-2.2010.2935, 9.3151+2.2010.2935)=(8.6692,9.9610)即當(dāng)X0=25.0kg時(shí),總體中有95%的個(gè)體Y值波動(dòng)在(8.6692,9.9610)的范圍內(nèi)。八、直線回歸方程的應(yīng)用(一)定量描述兩變量之間的依存關(guān)系對(duì)回歸系數(shù)b進(jìn)行假設(shè)檢
16、驗(yàn)時(shí),若, 可認(rèn)為兩變量間存在直線回歸關(guān)系,則直線回歸方程即為兩個(gè)變量間依存關(guān)系的定量表達(dá)式。(二)利用回歸方程進(jìn)行預(yù)測(cè)(三)利用回歸方程進(jìn)行統(tǒng)計(jì)控制規(guī)定Y值的變化,通過(guò)控制X的范圍來(lái)實(shí)現(xiàn)統(tǒng)計(jì)控制的目標(biāo),所以統(tǒng)計(jì)控制是利用回歸方程進(jìn)行的逆估計(jì)。例10.5某市環(huán)境監(jiān)測(cè)站在某交通點(diǎn)連續(xù)測(cè)定30天,每天定時(shí)采樣3次,發(fā)現(xiàn)大氣中NO2濃度Y(mg/m3)與當(dāng)時(shí)的汽車(chē)流量X(輛/小時(shí))呈直線關(guān)系,根據(jù)90對(duì)觀測(cè)數(shù)據(jù)求得回歸方程,剩余標(biāo)準(zhǔn)差。若NO2最大容許濃度為0.15mg/m3,則汽車(chē)流量應(yīng)如何控制?設(shè)a=0.05。本例,a=0.05,n=90-2=88,查表得單側(cè)t0.05(88)=1.6624。由
17、于本例未給出每小時(shí)汽車(chē)流量的均數(shù)及,且樣本含量較大,故以代替,計(jì)算個(gè)體Y值單側(cè)95%容許區(qū)間的上限:當(dāng)時(shí),解得X=1209,即只要把汽車(chē)流量控制在1209輛/小時(shí)以下,那么就有95%可能使NO2不超過(guò)最大容許濃度0.15mg/m3。(四)應(yīng)用直線回歸的注意事項(xiàng)1.作回歸分析要有實(shí)際意義,不能把毫無(wú)關(guān)聯(lián)的兩種現(xiàn)象,隨意進(jìn)行回歸分析,忽視事物現(xiàn)象間的內(nèi)在聯(lián)系和規(guī)律;如對(duì)兒童身高與小樹(shù)的生長(zhǎng)數(shù)據(jù)進(jìn)行回歸分析既無(wú)道理也無(wú)用途。另外,即使兩個(gè)變量間存在回歸關(guān)系時(shí),也不一定是因果關(guān)系,必須結(jié)合專(zhuān)業(yè)知識(shí)作出合理解釋和結(jié)論。 2直線回歸分析的資料,一般要求應(yīng)變量Y是來(lái)自正態(tài)總體的隨機(jī)變量,自變量X可以是正態(tài)隨
18、機(jī)變量,也可以是精確測(cè)量和嚴(yán)密控制的值。若稍偏離要求時(shí),一般對(duì)回歸方程中參數(shù)的估計(jì)影響不大,但可能影響到標(biāo)準(zhǔn)差的估計(jì),也會(huì)影響假設(shè)檢驗(yàn)時(shí)P值的真實(shí)性。3進(jìn)行回歸分析時(shí),應(yīng)先繪制散點(diǎn)圖(scatter plot)。若提示有直線趨勢(shì)存在時(shí),可作直線回歸分析;若提示無(wú)明顯線性趨勢(shì),則應(yīng)根據(jù)散點(diǎn)分布類(lèi)型,選擇合適的曲線模型(curvilinear modal),經(jīng)數(shù)據(jù)變換后,化為線性回歸來(lái)解決。一般說(shuō),不滿足線性條件的情形下去計(jì)算回歸方程會(huì)毫無(wú)意義,最好采用非線性回歸方程的方法進(jìn)行分析。4繪制散點(diǎn)圖后,若出現(xiàn)一些特大特小的離群值(異常點(diǎn)),則應(yīng)及時(shí)復(fù)核檢查,對(duì)由于測(cè)定、記錄或計(jì)算機(jī)錄入的錯(cuò)誤數(shù)據(jù),應(yīng)予
19、以修正和剔除。否則,異常點(diǎn)的存在會(huì)對(duì)回歸方程中的系數(shù)a、b的估計(jì)產(chǎn)生較大影響。5回歸直線不要外延。直線回歸的適用范圍一般以自變量取值范圍為限,在此范圍內(nèi)求出的估計(jì)值稱(chēng)為內(nèi)插(interpolation);超過(guò)自變量取值范圍所計(jì)算的稱(chēng)為外延(extrapolation)。若無(wú)充足理由證明,超出自變量取值范圍后直線回歸關(guān)系仍成立時(shí),應(yīng)該避免隨意外延。 第二節(jié)直線相關(guān)分析一、直線相關(guān)的概念直線相關(guān)分析是描述兩變量間是否有直線關(guān)系以及直線關(guān)系的方向和密切程度的分析方法。直線回歸分析方法是描述兩變量間依存變化的方法。實(shí)際工作中有時(shí)并不要求由X估計(jì)Y(或者先不考慮這個(gè)問(wèn)題)而關(guān)心的是兩個(gè)變量間是否確有直線
20、相關(guān)關(guān)系,如有直線相關(guān)關(guān)系,那么它們之間的關(guān)系是正相關(guān)(positive correlation),還是負(fù)相關(guān)(negative correlation)以及相關(guān)程度(degree of relationship)如何? 此時(shí)可應(yīng)用相關(guān)分析。直線相關(guān)的定義:如果兩個(gè)隨機(jī)變量中,一個(gè)變量由小到大變化時(shí),另一個(gè)變量也相應(yīng)地由小到大(或由大到小)地變化,并且測(cè)得兩變量組成的坐標(biāo)點(diǎn)在直角坐標(biāo)系中呈直線趨勢(shì),就稱(chēng)這兩個(gè)變量存在直線相關(guān)關(guān)系。直線相關(guān)(1inear correlation)又稱(chēng)簡(jiǎn)單相關(guān)(simple correlation),用于雙變量正態(tài)分布(bivariate normal distr
21、ibution)資料,一般說(shuō)來(lái),兩個(gè)變量都是隨機(jī)變動(dòng)的,不分主次,處于同等地位。兩變量間的直線相關(guān)關(guān)系用相關(guān)系數(shù)r(correlation coefficient)描述。直線相關(guān)的性質(zhì)可由散點(diǎn)圖(圖12.3)直觀地說(shuō)明。(a)0r1(b)-1r0(c)r=1(d)r=-1(e)r=0(f)r=0(g)r=0(h)r=0圖12.3相關(guān)系數(shù)示意圖a,散點(diǎn)呈橢圓形分布,宏觀而言?xún)勺兞縓、Y變化趨勢(shì)是同向的,稱(chēng)為正線性相關(guān)或正相關(guān)(0r1);反之,圖b中的X、Y問(wèn)呈反向變化,稱(chēng)為負(fù)線性相關(guān)或負(fù)相關(guān)(-1r0)。圖c的散點(diǎn)在一條直線上、且X、Y是同向變化,稱(chēng)為完全正相關(guān)(perfect positive
22、 correlation, r=1);反之,圖d中的X、Y呈反向變化,稱(chēng)為完全負(fù)相關(guān)(perfect negative correlation, r=-1)。圖e-圖h,兩變量間毫無(wú)聯(lián)系或可能存在一定程度的曲線聯(lián)系而沒(méi)有直線相關(guān)關(guān)系、稱(chēng)為零相關(guān)(zero correlation, r=0)。正相關(guān)或負(fù)相關(guān)并不一定表示一個(gè)變量的改變是另一個(gè)變量變化的原因,有可能同受另一個(gè)因素的影響。二、相關(guān)系數(shù)的意義及計(jì)算相關(guān)系數(shù)亦稱(chēng)積差相關(guān)系數(shù)(coefficient of product-moment correlation),用r表示樣本相關(guān)系數(shù),表示總體相關(guān)系數(shù)。它是說(shuō)明有直線關(guān)系的兩變量間,相關(guān)關(guān)系密
23、切程度和相關(guān)方向的統(tǒng)計(jì)指標(biāo)。計(jì)算公式表示(12.20)相關(guān)系數(shù)沒(méi)有單位,其值-1r1。當(dāng)兩變量呈同向變化時(shí),0r1,為正相關(guān);兩變量呈反向變化,-1r0,為負(fù)相關(guān);r0為零相關(guān),表示無(wú)直線相關(guān)關(guān)系;兩變量呈同向或反向變化且點(diǎn)子分布在一條直線上,|r|1為完全相關(guān)。完全相關(guān)屬相關(guān)分析中的待例,由于醫(yī)學(xué)研究中影響因素眾多,個(gè)體變異不可避免,很少呈現(xiàn)完全相關(guān)。例10.6根據(jù)例10.1資料,試計(jì)算8歲健康男孩體重與心臟橫徑的相關(guān)系數(shù)。由例12.1已算得 ,lXX=80.2692,lYY=4.1923, lXY=16.3846三、相關(guān)系數(shù)的假設(shè)檢驗(yàn)相關(guān)系數(shù)r是樣本相關(guān)系數(shù),它只是總體相關(guān)系數(shù)的估計(jì)值。從
24、同一總體中抽出的不同樣本會(huì)提供不同的樣本相關(guān)系數(shù),因而,樣本相關(guān)系數(shù)也存在變異性。所以,即使從=0的總體作隨機(jī)抽樣,由于抽樣誤差的影響,所得r值,也不一定等于零。故當(dāng)計(jì)算算出r值后,接著應(yīng)做=0的假設(shè)檢驗(yàn),以判斷兩變量的總體是否有直線相關(guān)關(guān)系。常用t檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量t值的計(jì)算公式如下:(12.21)例10.7根據(jù)例10.6求得的r值,檢驗(yàn)該地飲水氟含量與氟骨癥發(fā)病率是否有直線相關(guān)關(guān)系。H0: =0H1: 0已知n=8,r=0.9338查t界值表,得P50時(shí),可通過(guò)u檢驗(yàn)進(jìn)行的假設(shè)檢驗(yàn),統(tǒng)計(jì)量u值的計(jì)算公式為,(12.28)例10.7在肝癌病因研究中,某地調(diào)查了10個(gè)鄉(xiāng)的肝癌死亡率(1/10萬(wàn))
25、與種食物中黃曲霉毒素相對(duì)含量(最高含量為10),見(jiàn)表12.1。試作直線相關(guān)分析。表12.1肝癌死亡率與黃曲霉毒素相對(duì)含量鄉(xiāng)編號(hào)(1)黃曲霉毒素相對(duì)含量肝癌死亡率(1/10萬(wàn))d(6)=(3)-(5)d2(7)X(2)秩次(3)Y(4)秩次(5)10.7121.532421.0218.920031.7314.412443.7446.57-3954.0527.341165.1664.69-3975.5746.361185.7834.253995.9977.610111010.01055.1824合計(jì)42將兩個(gè)變量的觀察值分別從小到大編秩,若同一變量有相同觀察值,則取平均秩次,見(jiàn)表12.1第(3)、(5)欄。已知n=10,查rs界值表,rs0.02(10)=0.745,得P0.02,按水準(zhǔn)拒絕H0,接受H1,故可以認(rèn)為黃曲霉毒素與肝癌死亡率間存在正相關(guān)關(guān)系。若上例中10個(gè)鄉(xiāng)的黃曲霉毒素含量為:1.0,1.0,1.0,1.0,1.0,5.0,5.0,5.0,10.0,10.0,則其秩次依次為:3,3,3,3,3,7,7,7,9.5, 9.5, 因相同秩次的個(gè)數(shù)較多,此時(shí)宜計(jì)算。如果其它數(shù)據(jù)不變,則TX為,查rs界值表,rs0.02(10)=0.745,得P0時(shí),Y隨X增大而增大
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024工程項(xiàng)目協(xié)議條款與監(jiān)管辦法
- SaaS平臺(tái)定制技術(shù)開(kāi)發(fā)服務(wù)協(xié)議
- 2023-2024學(xué)年重慶市永川北山中學(xué)高三二輪檢測(cè)試題(二模)數(shù)學(xué)試題試卷
- 2024定制出租車(chē)輛運(yùn)營(yíng)協(xié)議典范
- 2024年履約擔(dān)保協(xié)議范本下載指南
- 2024鍋爐維修工程協(xié)議格式
- 2024年度汽車(chē)租賃協(xié)議格式
- 2024商業(yè)秘密保護(hù)競(jìng)業(yè)限制協(xié)議樣本
- 2024年倉(cāng)庫(kù)轉(zhuǎn)租協(xié)議條款
- 動(dòng)產(chǎn)資產(chǎn)抵押協(xié)議范例2024年
- 高考地理一輪復(fù)習(xí)課件【知識(shí)精講+高效課堂】美食與地理環(huán)境關(guān)系
- 分居聲明告知書(shū)范本
- 2023年04月山東濟(jì)南市槐蔭區(qū)殘聯(lián)公開(kāi)招聘殘疾人工作“一專(zhuān)兩員”公開(kāi)招聘筆試參考題庫(kù)+答案解析
- 消失的13級(jí)臺(tái)階
- 營(yíng)銷(xiāo)管理知識(shí)點(diǎn)
- 船體強(qiáng)度與結(jié)構(gòu)設(shè)計(jì)課程設(shè)計(jì)
- 不寧腿綜合征診斷與治療
- 初中英語(yǔ)教學(xué)活動(dòng)設(shè)計(jì)
- 三寫(xiě)作的載體與受體
- GB/T 451.3-2002紙和紙板厚度的測(cè)定
- 網(wǎng)簽授權(quán)書(shū)(學(xué)生就業(yè)平臺(tái))
評(píng)論
0/150
提交評(píng)論