統(tǒng)計學(xué)教程相關(guān)與回歸_第1頁
統(tǒng)計學(xué)教程相關(guān)與回歸_第2頁
統(tǒng)計學(xué)教程相關(guān)與回歸_第3頁
統(tǒng)計學(xué)教程相關(guān)與回歸_第4頁
統(tǒng)計學(xué)教程相關(guān)與回歸_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學(xué)教程相關(guān)與回歸相關(guān)與回歸1第1頁,共46頁,2023年,2月20日,星期六基本內(nèi)容

統(tǒng)計描述統(tǒng)計推斷應(yīng)用計量資料頻數(shù)分布集中趨勢離散趨勢統(tǒng)計圖表抽樣誤差、標準誤

tuF檢驗正常值范圍區(qū)間估計計數(shù)資料相對數(shù)及其標準化統(tǒng)計圖表標準誤2檢驗率的區(qū)間估計人口統(tǒng)計疾病統(tǒng)計相關(guān)與回歸

rb統(tǒng)計圖表

t檢驗

相關(guān)與回歸2第2頁,共46頁,2023年,2月20日,星期六醫(yī)學(xué)上,許多現(xiàn)象之間都有相互聯(lián)系,例如:身高與體重、父親身高與兒子身高、體溫與脈搏、產(chǎn)前檢查與嬰兒體重、乙肝病毒與乙肝等。在這些有關(guān)系的現(xiàn)象中,它們之間聯(lián)系的程度和性質(zhì)也各不相同。相關(guān)與回歸3第3頁,共46頁,2023年,2月20日,星期六變量之間的關(guān)系:乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之間是因果關(guān)系;有的現(xiàn)象之間因果不清,只是伴隨關(guān)系,例如丈夫的身高和妻子的身高之間,就不能說有因果關(guān)系。相關(guān)與回歸4第4頁,共46頁,2023年,2月20日,星期六

相關(guān)與回歸就是用于研究和解釋兩個變量之間相互關(guān)系的。相關(guān)與回歸5第5頁,共46頁,2023年,2月20日,星期六主要內(nèi)容第一節(jié)直線相關(guān)第二節(jié)直線回歸第三節(jié)注意事項相關(guān)與回歸6第6頁,共46頁,2023年,2月20日,星期六第一節(jié)直線相關(guān)一、相關(guān)的類型二、相關(guān)系數(shù)

相關(guān)系數(shù)的計算公式相關(guān)系數(shù)的假設(shè)檢驗三、直線相關(guān)的意義相關(guān)與回歸7第7頁,共46頁,2023年,2月20日,星期六為研究父親與成年兒子身高之間的關(guān)系,皮爾遜測量了1078對父子的身高。把1078對數(shù)字表示在坐標上。X上的數(shù)代表父親身高,Y上的數(shù)代表兒子的身高1078個點形成圖形是一個散點圖。相關(guān)與回歸8第8頁,共46頁,2023年,2月20日,星期六散點圖

為了確定相關(guān)變量之間的關(guān)系,收集一些數(shù)據(jù),這些數(shù)據(jù)是成對的;然后在直角坐標系上描述這些點,這一組點集稱為散點圖。相關(guān)與回歸9第9頁,共46頁,2023年,2月20日,星期六相關(guān)的類型★正相關(guān)★負相關(guān)★完全正相關(guān)★完全負相關(guān)★稱零相關(guān)

相關(guān)與回歸10第10頁,共46頁,2023年,2月20日,星期六相關(guān)系數(shù)

樣本的相關(guān)系數(shù)用r表示r的值在-1和1之間;r的絕對值越接近1,兩變量的關(guān)聯(lián)程度越強,r的絕對值越接近0,兩變量的關(guān)聯(lián)程度越弱;正相關(guān)時,r值在0和1之間,這時一個變量增加,另一個變量也增加;負相關(guān)時,r值在-1和0之間,此時一個變量增加,另一個變量將減少。相關(guān)與回歸11第11頁,共46頁,2023年,2月20日,星期六相關(guān)系數(shù)的計算公式相關(guān)與回歸12第12頁,共46頁,2023年,2月20日,星期六一個產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量與產(chǎn)兒的體重有關(guān);于是設(shè)想,通過測量待產(chǎn)婦尿中雌三醇含量,可以預(yù)測產(chǎn)兒體重,以便對低出生體重進行預(yù)防。因此收集了31例待產(chǎn)婦24小時的尿,測量其中的雌三醇含量,同時記錄產(chǎn)兒的體重。問尿中雌三醇含量與產(chǎn)兒體重之間相關(guān)系數(shù)是多少?是正相關(guān)還是負相關(guān)?分析問題:總體-樣本、目的、變量、關(guān)系

相關(guān)與回歸13第13頁,共46頁,2023年,2月20日,星期六編號

(1)尿雌三醇mg/24h(2產(chǎn)兒體重kg(3)編號

(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2

待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系

第14頁,共46頁,2023年,2月20日,星期六14∑X=534∑Y=99.2∑X2=9876∑Y2=324.8∑XY=1750N=31相關(guān)與回歸15第15頁,共46頁,2023年,2月20日,星期六計算結(jié)果r的值說明了兩個變量X與Y之間關(guān)聯(lián)的密切程度(絕對值大小)與關(guān)聯(lián)的性質(zhì)(正負號)。相關(guān)與回歸16第16頁,共46頁,2023年,2月20日,星期六問題:我們能否得出結(jié)論:待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間成正相關(guān),相關(guān)系數(shù)是0.61。為什么?從計算結(jié)果可以知道,31例待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間程正相關(guān),相關(guān)系數(shù)r=0.61。相關(guān)與回歸17第17頁,共46頁,2023年,2月20日,星期六相關(guān)系數(shù)的假設(shè)檢驗

上例中的相關(guān)系數(shù)r等于0.61,說明了31例樣本中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只是總體中的一個樣本,由此得到的相關(guān)系數(shù)會存在抽樣誤差。因為,總體相關(guān)系數(shù)()為零時,由于抽樣誤差,從總體抽出的31例,其r可能不等于零。這就要對r進行假設(shè)檢驗,判斷r不等于零是由于抽樣誤差所致,還是兩個變量之間確實存在相關(guān)關(guān)系。

相關(guān)與回歸18第18頁,共46頁,2023年,2月20日,星期六相關(guān)系數(shù)的假設(shè)檢驗,常用t檢驗,選用統(tǒng)計量t的計算公式如下:

=n-2

相關(guān)與回歸19第19頁,共46頁,2023年,2月20日,星期六1.H0:

=0

H1:

≠02.=0.053.

t==n-2=31-2=29

t=4.144.確定P值:查t值表,t0.05(29)=2.045t=4.14>2.045,由t所推斷的P值小于0.055.結(jié)論:按=0.05水準拒絕??,接受??,認為臨產(chǎn)婦24小時內(nèi)尿中雌三醇濃度與產(chǎn)兒體重之間有正相關(guān)關(guān)系。

相關(guān)與回歸20第20頁,共46頁,2023年,2月20日,星期六直線相關(guān)的意義在確實存在相關(guān)關(guān)系的前提下(??),如果r的絕對值越大,說明兩個變量之間的關(guān)聯(lián)程度越強,那么,已知一個變量對預(yù)測另一個變量越有幫助;如果r絕對值越小,則說明兩個變量之間的關(guān)系越弱,一個變量的信息對猜測另一個變量的值無多大幫助。一般說來,當樣本量較大,并對r進行假設(shè)檢驗,有統(tǒng)計學(xué)意義時,r的絕對值大于0.7,則表示兩個變量高度相關(guān);r的絕對值大于0.4,小于等于0.7時,則表示兩個變量之間中度相關(guān);r的絕對值大于0.2,小于等于0.4時,則兩個變量低度相關(guān)。

相關(guān)與回歸21第21頁,共46頁,2023年,2月20日,星期六

雌三醇含量與產(chǎn)兒體重有相關(guān)關(guān)系:如果知道了一位待產(chǎn)婦的尿雌三醇含量能推斷出產(chǎn)兒的體重嗎?能預(yù)測產(chǎn)兒的體重可能在什么范圍內(nèi)?這要用直線回歸的方法來解決。

相關(guān)與回歸22第22頁,共46頁,2023年,2月20日,星期六第二節(jié)直線回歸一、回歸方程二、回歸系數(shù)三、回歸系數(shù)的假設(shè)檢驗四、直線回歸的應(yīng)用一個人的快樂,不是因為他擁有的多,而是因為他計較的少休息相關(guān)與回歸23第23頁,共46頁,2023年,2月20日,星期六一、回歸方程二、回歸系數(shù)三、回歸系數(shù)的假設(shè)檢驗四、直線回歸的應(yīng)用第二節(jié)直線回歸相關(guān)與回歸24第24頁,共46頁,2023年,2月20日,星期六知道了兩個變量之間有直線相關(guān)關(guān)系,并且一個變量的變化會引起另一個變量的變化,這時,如果它們之間存在準確、嚴格的關(guān)系,它們的變化可用函數(shù)方程來表示,叫它們是函數(shù)關(guān)系,它們之間的關(guān)系式叫函數(shù)方程。相關(guān)與回歸25第25頁,共46頁,2023年,2月20日,星期六實際上,由于其它因素的干擾,許多雙變量之間的關(guān)系并不是嚴格的函數(shù)關(guān)系,不能用函數(shù)方程反映,為了區(qū)別于兩變量間的函數(shù)方程,我們稱這種關(guān)系式為直線回歸方程,這種關(guān)系為直線回歸。相關(guān)與回歸26第26頁,共46頁,2023年,2月20日,星期六直線回歸就是用來描述一個變量如何依賴于另一個變量

其任務(wù)就是要找出一個變量隨另一個變量變化的直線方程,我們把這個直線方程叫做直線回歸方程。相關(guān)與回歸27第27頁,共46頁,2023年,2月20日,星期六回歸方程

abX=+

式中的是由自變量X推算應(yīng)變量Y的估計值,a是回歸直線在Y軸上的截距,即X=0時的Y值;b為樣本的回歸系數(shù),即回歸直線的斜率,表示當X變動一個單位時,Y平均變動b個單位。如果a、b已知,代入上式,就可求得直線回歸方程。

相關(guān)與回歸28第28頁,共46頁,2023年,2月20日,星期六y相關(guān)與回歸29第29頁,共46頁,2023年,2月20日,星期六回歸系數(shù)根據(jù)上例的數(shù)據(jù),求待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間的回歸方程。從相關(guān)系數(shù)的計算中,已經(jīng)求得:

相關(guān)與回歸30第30頁,共46頁,2023年,2月20日,星期六這就是我們求得的二者關(guān)系的回歸方程相關(guān)與回歸31第31頁,共46頁,2023年,2月20日,星期六回歸直線的描繪

根據(jù)求得的回歸方程,可以在自變量X的實測范圍內(nèi)任取兩個值,代入方程中,求得相應(yīng)的兩個Y值,以這兩對數(shù)據(jù)找出對應(yīng)的兩個坐標點,將兩點連接為一條直線,就是該方程的回歸直線。回歸直線一定經(jīng)過(0,a),()。這兩點可以用來核對圖線繪制是否正確。

相關(guān)與回歸32第32頁,共46頁,2023年,2月20日,星期六相關(guān)與回歸33第33頁,共46頁,2023年,2月20日,星期六=2.15+0.061X

是否一定能說明雌三醇與產(chǎn)兒體重之間存在回歸關(guān)系?

相關(guān)與回歸34第34頁,共46頁,2023年,2月20日,星期六與直線相關(guān)一樣,直線回歸方程也是從樣本資料計算而得的,同樣也存在著抽樣誤差問題。所以,需要對樣本的回歸系數(shù)b進行假設(shè)檢驗,以判斷b是否從回歸系數(shù)為零的總體中抽得。為了判斷抽樣誤差的影響,需對回歸系數(shù)進行假設(shè)檢驗??傮w的回歸系數(shù)一般用β表示。

相關(guān)與回歸35第35頁,共46頁,2023年,2月20日,星期六采用t檢驗方法其中Sy.x為各觀察值Y到回歸直線的距離的標準差,表示去除X影響后Y的變異程度,

相關(guān)與回歸36第36頁,共46頁,2023年,2月20日,星期六相關(guān)與回歸37第37頁,共46頁,2023年,2月20日,星期六

回歸系數(shù)的假設(shè)檢驗H0:β=0H1:β≠0α=0.05計算統(tǒng)計量:t=4.14;=31-2=29,t0.05(29)=2.045計算概率值P:P<0.05做出推論:按=0.05檢驗水準,拒絕H0,接受H1認為待產(chǎn)婦24小時尿中雌三醇含量與產(chǎn)兒體重之間存在直線回歸關(guān)系。,,相關(guān)與回歸38第38頁,共46頁,2023年,2月20日,星期六直線回歸的應(yīng)用

描述兩變量之間的依存關(guān)系:通過回歸系數(shù)的假設(shè)檢驗,若認為兩變量之間存在直線回歸關(guān)系,則可用直線回歸來描述。利用回歸方程進行預(yù)測:把自變量代入回歸方程,對應(yīng)變量進行估計,可求出應(yīng)變量的波動范圍。例如,已知某待產(chǎn)婦的尿雌三醇濃度,代入回歸方程,再用區(qū)間估計的方法,即可知道生產(chǎn)時,產(chǎn)兒的體重的范圍。

利用回歸方程進行統(tǒng)計控制:空氣質(zhì)量與汽車數(shù)量相關(guān)與回歸39第39頁,共46頁,2023年,2月20日,星期六

第三節(jié)應(yīng)用時注意事項一、注意事項二、相關(guān)與回歸的區(qū)別三、相關(guān)與回歸的聯(lián)系相關(guān)與回歸40第40頁,共46頁,2023年,2月20日,星期六應(yīng)用直線相關(guān)與回歸的注意事項

1.實際意義進行相關(guān)回歸分析要有實際意義,不可把毫無關(guān)系的兩個事物或現(xiàn)象用來作相關(guān)回歸分析。例如,有人說,孩子長,公園里的小樹也在長。求孩子和小樹之間的相關(guān)關(guān)系就毫無意義,用孩子的身高推測小樹的高度則更加慌謬。

2.相關(guān)關(guān)系相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,并不能證明事物間有內(nèi)在聯(lián)系,例如,有人發(fā)現(xiàn),對于在校兒童,鞋的大小與閱讀技能有很強的相關(guān)關(guān)系。然而,學(xué)會新詞并不能使腳變大,而是涉及到第三個因素??年齡。當兒童長大一些,他們的閱讀能力會提高而且由于長大也穿不下原來的鞋。

相關(guān)與回歸41第41頁,共46頁,2023年,2月20日,星期六3.利用散點圖對于性質(zhì)不明確的兩組數(shù)據(jù),可先做散點圖,在圖上看它們有無關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負相關(guān),然后再進行相關(guān)回歸分析。4.變量范圍相關(guān)分析和回歸方程僅適用于樣本的原始數(shù)據(jù)范圍之內(nèi),出了這個范圍,我們不能得出兩變量的相關(guān)關(guān)系和原來的回歸關(guān)系。相關(guān)與回歸42第42頁,共46頁,2023年,2月20日,星期六相關(guān)與回歸的區(qū)別

1.意義:相關(guān)反映兩變量的相互關(guān)系,即在兩個變量中,任何一個的變化都會引起另一個的變化,是一種雙向變化的關(guān)系?;貧w是反映兩個變量的依存關(guān)系,一個變量的改變會引起另一個變量的變化,是一種單向的關(guān)系。2.應(yīng)用:研究兩個變量的相互關(guān)系用相關(guān)分析。研究兩個變量的依存關(guān)系用回歸分析。3.研究性質(zhì):相關(guān)是對兩個變量之間的關(guān)系進行描述,看兩個變量是否有關(guān),關(guān)系是否密切,關(guān)系的性質(zhì)是什么,是正相關(guān)還是負相關(guān)?;貧w是對兩個變量做定量描述,研究兩個變量的數(shù)量關(guān)系,已知一個變量值可以預(yù)測出另一個變量值,可以得到定量結(jié)果。4.相關(guān)系數(shù)r與回歸系數(shù)b:r與b的絕對值反映的意義不同。r的絕對值越大,散點圖中的點越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。b

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論