統(tǒng)計(jì)學(xué)10-11直線(xiàn)相關(guān)與回歸課件_第1頁(yè)
統(tǒng)計(jì)學(xué)10-11直線(xiàn)相關(guān)與回歸課件_第2頁(yè)
統(tǒng)計(jì)學(xué)10-11直線(xiàn)相關(guān)與回歸課件_第3頁(yè)
統(tǒng)計(jì)學(xué)10-11直線(xiàn)相關(guān)與回歸課件_第4頁(yè)
統(tǒng)計(jì)學(xué)10-11直線(xiàn)相關(guān)與回歸課件_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

線(xiàn)性相關(guān)與回歸LinearCorrelation&RegressionFrancisGaltonFrancisGalton爵士(英,1822~1911)對(duì)統(tǒng)計(jì)學(xué)的主要貢獻(xiàn)是提出“相關(guān)”與“回歸”的概念,用統(tǒng)計(jì)方法對(duì)進(jìn)化論中的變異進(jìn)行研究,開(kāi)創(chuàng)了生物統(tǒng)計(jì)學(xué)。方法的提出KarlPearsonKarlPearson(英,1857~1936)是FrancisGalton的得意門(mén)生,他開(kāi)創(chuàng)了統(tǒng)計(jì)方法學(xué)。他對(duì)統(tǒng)計(jì)學(xué)的主要貢獻(xiàn):變異數(shù)據(jù)的處理、分布曲線(xiàn)的選配、卡方檢驗(yàn)的提出、回歸與相關(guān)的發(fā)展。方法的提出直線(xiàn)相關(guān)

(

linearcorrelation)

體重(kg),x肺活量(),YL十名女中學(xué)生體重與肺活量散點(diǎn)圖1.直線(xiàn)相關(guān)的概念

11名男青年身高與前臂長(zhǎng)度散點(diǎn)圖2.對(duì)資料的要求

3.相關(guān)系數(shù)

(correlationcoefficient,r)

表示方法:

-1r

1*意義:描述兩個(gè)變量直線(xiàn)相關(guān)的方向與與密切程度的指標(biāo)。x、y都是正態(tài)分布資料的隨機(jī)變量正相關(guān)負(fù)相關(guān)0<r<1-1<r<0相關(guān)系數(shù)示意:r=1r=-1完全正相關(guān)完全負(fù)相關(guān)相關(guān)系數(shù)計(jì)算方法:__(x-x)(y-y)l

xyr=————————————=——————___________________________(x-x)2(y-y)2

l

xx·l

yy__(x)(y)l

xy=(x-x)(y-y)=xy-—————n__(x)2lxx=(x-x)2=x2-————n_(y)2lyy=(y-y)2=y2-————n____________________________(x-x)2(y-y)2

l

xx·l

yy

計(jì)算:__(x-x)(y-y)l

xyr=————————————=——————__(x)(y)l

xy=(x-x)(y-y)=xy-—————n__=8.975(x)2lxx=(x-x)2=x2-————n_=98.5

(y)2lyy=(y-y)2=y2-————n_=1.69525r=8.975√98.51.69525=0.6945

編號(hào)身高(cm)前臂長(zhǎng)(cm)XYX2Y2(X)(Y)1170477990289002209217342726629929176431604470402560019364155416355240251681517347813129929220961885094003534425007178478366316842209818346841833489211691804988203240024011016543709527225184911166443174285612116合計(jì)1891500861853260812281011名男青年身高與前臂長(zhǎng)度4.相關(guān)系數(shù)的假設(shè)檢驗(yàn)公式:查表法

檢驗(yàn)假設(shè):H0:=0,H1:0,=0.05r-0rt=———=——————,Sr

1-r2———n-2________=n-2t=0.6945(1-0.69452)/(10-2)√=2.730=n–2=10–2=8P<0.05結(jié)論:可認(rèn)為該地女中學(xué)生的體重與肺活量有正相關(guān)關(guān)系

線(xiàn)性回歸LinearRegressionRegression釋義天文學(xué)上的“回歸”地球繞太陽(yáng)公轉(zhuǎn),在公轉(zhuǎn)的同時(shí)本身還自轉(zhuǎn),在本身自轉(zhuǎn)的同時(shí)地球的假設(shè)軸心還來(lái)回?cái)[動(dòng)。由于地球軸心的來(lái)回?cái)[動(dòng),太陽(yáng)光垂直照射到地球上就有南、北兩個(gè)極限位置(南、北緯23027’),分別稱(chēng)南、北回歸線(xiàn)。統(tǒng)計(jì)術(shù)語(yǔ)目前“回歸”已成為表示變量之間數(shù)量依存關(guān)系的統(tǒng)計(jì)術(shù)語(yǔ),并且衍生出“回歸方程”、“回歸系數(shù)”等統(tǒng)計(jì)學(xué)概念。

1.直線(xiàn)回歸的概念

體重(kg),x肺活量(),YL十名女中學(xué)生體重與肺活量散點(diǎn)圖a為回歸直線(xiàn)在y軸上的截距0yxa>0a=0a<0a0yxb>0b=0b<0b=0

b為回歸系數(shù)

__(x-x)(y-y)xy-(x)(y)/nb=————————=—————————_(x-x)2x2-(x)2/n

__a=y-bx4.直線(xiàn)回歸方程的計(jì)算方法y=a+bx

^

__(x-x)(y-y)xy-(x)(y)/nb=————————=——————————_(x-x)2x2-(x)2/nb=946.55-40523.15/10165014052/10=0.0911

__a=y-bx=23.15/10-0.0911405/10=-1.3746

女中學(xué)生肺活量對(duì)體重的直線(xiàn)回歸方程是:y=-1.3746+0.0911x

^=y(tǒng)/n-bx/n|b-0|bt=————=——,=n-2SbSbSyxSb=———————____________(x-x)2_Sb為樣本回歸系數(shù)標(biāo)準(zhǔn)誤Syx為剩余標(biāo)準(zhǔn)差5.回歸系數(shù)的假設(shè)檢驗(yàn)同一組資料作直線(xiàn)相關(guān)與回歸時(shí)tb與tr等值假設(shè):H0:=0,H1:0,=0.05;

(y-y)2Syx=—————n-2?(y-?)2=lyy-bl

xy

=1.69525-0.09118.975=0.87760.877610-2=0.3312=0.331298.5==0.0334Sb

=Syx(x–x)2

|b-0|bt=————=——SbSb=0.09110.0334=2.728=n–2=8P<0.05結(jié)論:總體回歸系數(shù)不等于零,即回歸方程y=-1.3746+0.0911x成立

^體重(kg),x肺活量(),YL十名女中學(xué)生體重與肺活量散點(diǎn)圖與回歸直線(xiàn)y=-1.3746+0.0911x

^x2=44?2=2.64x1=37?1=2.00

6.直線(xiàn)回歸方程的圖示p1p2p1p2

SPSS結(jié)果34描述兩變量的依存數(shù)量關(guān)系利用回歸方程進(jìn)行預(yù)測(cè):由易測(cè)的變量值估算難算的變量值(由x估計(jì)y)利用回歸方程進(jìn)行控制:即利用回歸方程進(jìn)行逆估計(jì)(由y估計(jì)x)7.直線(xiàn)回歸方程的應(yīng)用

區(qū)別:

1)意義 直線(xiàn)回歸反映兩變量的依存關(guān)系; 直線(xiàn)相關(guān)反映兩變量的相互關(guān)系。直線(xiàn)回歸與直線(xiàn)相關(guān)的聯(lián)系與區(qū)別

區(qū)別:

2)對(duì)資料的要求直線(xiàn)回歸:自變量是正態(tài)總體的隨機(jī)變量或指定變量,y一定是正態(tài)總體的隨機(jī)變量;直線(xiàn)相關(guān):兩變量均為正態(tài)總體的隨機(jī)變量。1)同一組資料的r

與b的正負(fù)符號(hào)是一致的;2)同一組資料的r

和b的假設(shè)檢驗(yàn)結(jié)果是一致的,即tr=tb。

聯(lián)系:3)相關(guān)回歸可以互相解釋R的平方稱(chēng)為確定系數(shù)

(coefficientofdetermination)應(yīng)用確定系數(shù),也可以從回歸的角度對(duì)相關(guān)程度做進(jìn)一步的了解。聯(lián)系:1.進(jìn)行相關(guān)與回歸時(shí)先繪制散點(diǎn)圖,還要觀察有無(wú)異常點(diǎn)。2.回歸與相關(guān)的應(yīng)用僅限于原實(shí)測(cè)數(shù)據(jù)的范圍內(nèi)使用。應(yīng)用注意事項(xiàng)孩子的身高與小樹(shù)的高度間顯示出顯著的相關(guān)性錯(cuò)誤應(yīng)用舉例小樹(shù)高度與孩子身高的關(guān)系研究第二節(jié)

Spearman秩相關(guān)

(等級(jí)相關(guān))

求兩變量的相關(guān)系數(shù),當(dāng)X、Y并不服從二元正態(tài)分布,對(duì)數(shù)據(jù)做秩變換后再計(jì)算直線(xiàn)相關(guān)系數(shù),用rs記之。

適用條件例題:某醫(yī)生做一種研究,欲了解人群中氟骨癥患病率(%)與飲用水中氟含量(mg/l)之間的關(guān)系。隨機(jī)觀察8個(gè)地區(qū)氟骨癥患病率與飲用水中氟含量,數(shù)據(jù)如表兩欄。試計(jì)算等級(jí)相關(guān)系數(shù)rs。

調(diào)查了某地區(qū)10個(gè)鄉(xiāng)的釘螺密度與血吸蟲(chóng)感染率(%)數(shù)據(jù)如表。試分析該地區(qū)螺密度與感染率之間有無(wú)相關(guān)關(guān)系?例題

代入公式:若資料中相同觀察值的例數(shù)較多時(shí),計(jì)算的結(jié)果偏差較大,此時(shí)可由公式

計(jì)算校正的rs值rs′。

Thankyou!擴(kuò)展:多元線(xiàn)性回歸

常數(shù)項(xiàng),表示當(dāng)所有自變量為0時(shí)應(yīng)變量Y的總體平均值的估計(jì)值

表示其它自變量固定不變的情況下,每改變一個(gè)測(cè)量單位時(shí)所引起的應(yīng)變量Y的平均改變量

bj為偏回歸系數(shù)(partialregressioncoefficient)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論