回歸與相關(guān)分析_第1頁(yè)
回歸與相關(guān)分析_第2頁(yè)
回歸與相關(guān)分析_第3頁(yè)
回歸與相關(guān)分析_第4頁(yè)
回歸與相關(guān)分析_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

回歸與相關(guān)分析第1頁(yè),共33頁(yè),2023年,2月20日,星期四第七章要點(diǎn)提示本章對(duì)兩個(gè)變量的相互關(guān)系進(jìn)行分析,是多元統(tǒng)計(jì)分析的基石。學(xué)習(xí)時(shí)①首先要求區(qū)分“回歸”術(shù)語(yǔ)古今含義的不同之處,充分認(rèn)識(shí)一元線性回歸與相關(guān)分析的基礎(chǔ)地位;②熟悉回歸關(guān)系與相關(guān)關(guān)系的本質(zhì)區(qū)別及兩者在統(tǒng)計(jì)表述方法上的聯(lián)系(如r與b在數(shù)學(xué)意義上的統(tǒng)一性)和各自的側(cè)重點(diǎn);③重點(diǎn)掌握直線回歸與相關(guān)分析的顯著性檢驗(yàn)方法和雙變量回歸模型的協(xié)方差分析技術(shù),以便將統(tǒng)計(jì)控制手段與試驗(yàn)控制手段一起綜合運(yùn)用到試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析中去。涉及教材內(nèi)容:第九章全五節(jié),第十章、第十一章各一節(jié)。作業(yè)布置:教材第十、十一章所余三節(jié)內(nèi)容自習(xí);

教材P191T5、T6、T9;

P224T7。第2頁(yè),共33頁(yè),2023年,2月20日,星期四第一節(jié)直線回歸一、回歸的含義“回歸”原文為regression,該術(shù)語(yǔ)最先由英國(guó)的F.Galton于1886年左右研究人類身高遺傳的規(guī)律時(shí)所作的“高爾頓解釋”中使用,詳情如右圖所示:高爾頓對(duì)此所作的解釋是:大自然有一種約束機(jī)制,使人類身高分布保持某種穩(wěn)定形態(tài)而不作兩極分化,也就是有回歸于中心的作用,這個(gè)中心值μ即該種族身高在一定歷史時(shí)期的平均值?,F(xiàn)在就“回歸”所作的定義是:如果兩個(gè)變量X和Y,總是Y隨著X的變化而變化,且這種變化關(guān)系不可逆,則稱X和Y為回歸關(guān)系。其中:

X叫自變量dependentvariable;Y叫因變量或依變量independentvariable。高:xg

71

72?gμ(69)

64?a矮:xa

67

調(diào)查n=1074個(gè)家庭,統(tǒng)計(jì)結(jié)果:X=68英寸?=69英寸得:?=X+1(1英寸=2.54cm)

但分組統(tǒng)計(jì)的結(jié)果卻并非如此父母為高個(gè)子組時(shí),?g<72+1父母為矮個(gè)子組時(shí),?a>64+1

走向指回歸的本意走向指回歸的今義第3頁(yè),共33頁(yè),2023年,2月20日,星期四第一節(jié)直線回歸二、建立直線回歸方程例7.1一些夏季害蟲(chóng)的盛發(fā)期遲早與春季溫度高低有關(guān)。江蘇武進(jìn)縣觀察1956-1964年3月下旬至4月中旬的3段旬均溫累積值X和一代三化螟盛發(fā)期Y(5月10日起算)所得結(jié)果如下,試予分析。解㈠描散點(diǎn)圖本例已知害蟲(chóng)盛發(fā)期遲早隨春季氣溫的變化而變化,且不可逆,又據(jù)散點(diǎn)圖反映的趨勢(shì)來(lái)看,在30—45℃的溫度范圍,盛發(fā)期天數(shù)隨值呈下降的線性變化關(guān)系。故可假定直線回歸方程為:

y=a+bx讀作“Y依x直線回歸”30354045年份195619571958195919601961196219631964ΣX(℃)35.534.131.740.336.840.231.739.244.2333.7Y(d)12169273139-170y=a+bx第4頁(yè),共33頁(yè),2023年,2月20日,星期四第一節(jié)直線回歸㈡數(shù)據(jù)整理由原始數(shù)據(jù)算出一級(jí)數(shù)據(jù)6個(gè):ΣX=333.7ΣY=70ΣXY=2436.4ΣX2=12517.49ΣY2=794n=9

再由一級(jí)數(shù)據(jù)算出二級(jí)數(shù)據(jù)5個(gè):SSX=ΣX2

-(ΣX)2/n=144.64SSY=ΣY2

-(ΣY)2/n=249.56SP=ΣXY-ΣXΣY/n=-159.04X=ΣX/n=37.08?=ΣY/n=7.78㈢計(jì)算三級(jí)數(shù)據(jù)

b=SP/SSX

=-1.10

=(-159.04)÷144.64a=?-bX=48.55

=7.78-(-1.10)×37.08

得所求直線回歸方程為:

y=48.55-1.10xy=48.55-1.10x3035404531.744.2第5頁(yè),共33頁(yè),2023年,2月20日,星期四第一節(jié)直線回歸三、直線回歸關(guān)系的顯著性檢驗(yàn)將a=?-bx代入Y=a+bx得:

y=?+b(x-x)及y-?=b(x-x)于是由因變量離均差的兩個(gè)線性分量:Σ(Y-?)2=Σ〔(Y-y)+(y

-?)〕2

可推導(dǎo)出因變量總SS的如下分解公式:Σ(Y-?)2=Σ(Y-y)2+Σ(y

-?)2

簡(jiǎn)寫(xiě)成:SSY=SSQ+

SSU=Q+U分別叫“離回歸平方和”與“回歸平方和”其計(jì)算公式及本例分解結(jié)果:

SSU=SP2/

SSX=159.042/144.64=174.89SSQ=SSY-

SSU=249.56-174.89=74.67

故F=MSU/MSQ

=16.4**

(F0.01,1,7=12.25)

=(174.89÷1)/(74.67÷7)

表明雙變量直線回歸關(guān)系極顯著,所得方程y=48.55-1.10x可用于預(yù)測(cè)。也可對(duì)回歸系數(shù)進(jìn)行t-test來(lái)證實(shí)。只是要利用df(分子)=1時(shí),F(xiàn)=t2的關(guān)系推導(dǎo)出回歸系數(shù)的標(biāo)準(zhǔn)誤Sb=Se/√SSX其中,Se2=SSQ/dfQ=74.67÷7

=10.67于是t-test的步驟如下:

H0:β=0(β為回歸系數(shù)b的真值)Sb=√Se2/SSX

=0.2715

=√10.67÷144.64t=(b-β)÷Sb=(-1.1)÷0.2715=-4.05(3)按自由度ν=7查得兩尾t0.01=3.50(4)推斷:t>t0.01H0

不成立??梢?jiàn)t-test與F-test的效果完全一致。若顯著性檢驗(yàn)結(jié)果不顯著,則三選一:⑴Y與X沒(méi)有回歸關(guān)系;⑵Y與X有回歸關(guān)系,但不是直線回歸;⑶Y與X有回歸關(guān)系,但不是簡(jiǎn)單回歸,而是多元回歸。第6頁(yè),共33頁(yè),2023年,2月20日,星期四第二節(jié)直線相關(guān)一、相關(guān)的含義如果兩個(gè)變量X和Y,總是X和Y相互制約、平行變化,則稱X和Y為相關(guān)關(guān)系。此時(shí),X和Y沒(méi)有嚴(yán)格意義上的自變量和因變量之分,既可以說(shuō)Y隨著X的變化而變化,也可以講X隨著Y的變化而變化。即不存在誰(shuí)決定誰(shuí)或誰(shuí)依賴誰(shuí)的問(wèn)題。如人或動(dòng)物的胸圍和體重,作物的生物產(chǎn)量和經(jīng)濟(jì)產(chǎn)量,樹(shù)干的胸徑與材積等??梢?jiàn),相關(guān)關(guān)系以雙向、平行為特征。但相關(guān)關(guān)系如果僅從數(shù)學(xué)角度看,和回歸關(guān)系是統(tǒng)一的,因?yàn)槠潆p變量變化規(guī)律如果是線性關(guān)系的話,也可以由根據(jù)“最小二乘法”原理得出的直線方程來(lái)表述,所以有些文獻(xiàn)不區(qū)分回歸關(guān)系和相關(guān)關(guān)系,將二者籠統(tǒng)地稱之“回歸”或者“相關(guān)”。從統(tǒng)計(jì)上講,相關(guān)分析的側(cè)重點(diǎn)和回歸分析不完全一樣。二、相關(guān)系數(shù)前已述及,具有線性回歸關(guān)系的雙變量中,Y變量的總變異量分解為:

SSY=SSQ+

SSU=Q+U

對(duì)于具有線性相關(guān)關(guān)系的雙變量,Y變量的總平方和也可以分解成同樣的兩個(gè)分量,只是分別改稱為“非相關(guān)平方和”與“相關(guān)平方和”于是有:r=±√SSU/SSY

=SP/√SSXSSY

“r”叫相關(guān)系數(shù),其絕對(duì)值越大,

SSU所占的比重就越大,在散點(diǎn)圖上就表現(xiàn)為各散點(diǎn)越靠近直線;反之,即SSQ所占的比重越大,各散點(diǎn)越遠(yuǎn)離直線。并且有以下性質(zhì):⑴r的正負(fù)和b一樣取決于SP的正負(fù);r>0,正相關(guān);r<0,負(fù)相關(guān)⑵r∈〔-1,1〕或r∈(-1,1);⑶決定系數(shù)

r2=b·b`或r=±√b·b`第7頁(yè),共33頁(yè),2023年,2月20日,星期四第二節(jié)直線相關(guān)三、相關(guān)分析舉例例7.2為研究綿羊胸圍(cm)和體重(kg)的相互關(guān)系,調(diào)查了10只綿羊胸圍和體重的對(duì)應(yīng)觀察值X和Y,所得結(jié)果如下表,試予分析。解㈠描散點(diǎn)圖本例已知綿羊胸圍(X)和體重(Y)為相關(guān)關(guān)系,散點(diǎn)圖也顯示兩者的變化規(guī)律呈線性正相關(guān),SP>0。故可假定直線相關(guān)方程為:

y=a+bx或x=a`

+b`y后一個(gè)方程也可寫(xiě)成:y=a`

+b`x綿羊12345678910ΣX(cm)68707071717173747676720Y(kg)50606865697271737577680y=a+bx807468625650第8頁(yè),共33頁(yè),2023年,2月20日,星期四第二節(jié)直線相關(guān)㈡數(shù)據(jù)整理由原始數(shù)據(jù)算出一級(jí)數(shù)據(jù)6個(gè):ΣX=720ΣY=680ΣXY=49123ΣX2=51904ΣY2=46818n=10

再由一級(jí)數(shù)據(jù)算出二級(jí)數(shù)據(jù)5個(gè):SSX=ΣX2

-(ΣX)2/n=64SSY=ΣY2

-(ΣY)2/n=578SP=ΣXY-ΣXΣY/n=163X=ΣX/n=72?=ΣY/n=68㈢計(jì)算三級(jí)數(shù)據(jù)

b=SP/SSX

=163÷64=2.547a=72-2.547×68=-115.4b`

=SP/SSY

=163÷578=0.282a`

=68-0.282×72=52.82

即所求相關(guān)方程可以有兩個(gè)(如右圖)r=SP/√SSXSSY

0.8475r2=b·b`=2.547×0.282=0.7192y=52.82+0.282x767268405060708080706050y=2.547x-115.4第9頁(yè),共33頁(yè),2023年,2月20日,星期四第二節(jié)直線相關(guān)㈣、直線相關(guān)關(guān)系的顯著性檢驗(yàn)和直線回歸關(guān)系的顯著性檢驗(yàn)原理一樣,直線相關(guān)關(guān)系的雙變量也可導(dǎo)出Y變量總SS的如下分解公式:Σ(Y-?)2=Σ(Y-y)2+Σ(y

-?)2

簡(jiǎn)寫(xiě)成:SSY=SSQ+

SSU=Q+U分別叫“非相關(guān)平方和”與“相關(guān)平方和”其計(jì)算公式引用三級(jí)數(shù)據(jù)后簡(jiǎn)化為:

SSY=(1-r2)SSY+r2

SSY或者SSX=(1-r2)SSX+r2

SSXSSU=r2SSY=0.7182×

578=415SSQ=(1-r2)SSY=0.2818×

578=163故F=MSU/MSQ

=20.4**

(F0.01,1,8=11.26)

=(n-2)

r2

/(1-r2)

表明雙變量直線相關(guān)關(guān)系極其顯著,所得兩個(gè)直線相關(guān)方程都可用于預(yù)測(cè)。也可對(duì)回歸系數(shù)進(jìn)行t-test來(lái)證實(shí)。只是要利用df(分子)=1時(shí),F(xiàn)=t2的關(guān)系推導(dǎo)出相關(guān)系數(shù)的標(biāo)準(zhǔn)誤:Sr=√(1-r2)

/(n-2)

并且Se2=SSQ/dfQ=163÷8

=20.4于是t-test的步驟如下:

H0:ρ=0(ρ為相關(guān)系數(shù)r的真值)Sr=√0.2818÷8=0.1877t=(r-ρ)÷Sr=0.8475÷0.1877=4.516(3)按自由度ν=8查得兩尾t0.01=3.355(4)推斷:t>t0.01H0

不成立??梢?jiàn)t-test與F-test的效果完全一致。若顯著性檢驗(yàn)結(jié)果不顯著,則三選一:⑴Y與X沒(méi)有相關(guān)關(guān)系;⑵Y與X有相關(guān)關(guān)系,但不是直線相關(guān);⑶Y與X有相關(guān)關(guān)系,但不是簡(jiǎn)單相關(guān),而是復(fù)相關(guān)。第10頁(yè),共33頁(yè),2023年,2月20日,星期四第二節(jié)直線相關(guān)四、回歸與相關(guān)關(guān)系的統(tǒng)一性既然相關(guān)關(guān)系和回歸關(guān)系的顯著性檢驗(yàn)原理一樣,那么,不論回歸還是相關(guān)關(guān)系,其檢驗(yàn)都可用“相關(guān)系數(shù)”r

進(jìn)一步簡(jiǎn)化如下:即由t2=F=(n-2)r2/(1-r2)

解得:r=√t2/(n-2+t2)

于是利用這一關(guān)系將各個(gè)自由度下的t臨界值t0.05和t0.01換算出相關(guān)系數(shù)r的臨界值r0.05和r0.01,從而得到直接用于檢驗(yàn)回歸或者是相關(guān)關(guān)系顯著性的臨界值表(附表10)。如從教材P376查得M=2,dfQ=8時(shí)

r0.05

=0.632,r0.01

=0.765今得r=0.8475**>r0.01

再由例7.1從P376查得M=2,dfQ=7時(shí)

r0.05

=0.666,r0.01

=0.798算得“r”

=0.8371**>r0.01

檢驗(yàn)效果與F-test或者是t-test完全一樣。例7.2關(guān)于體重(Y)的ANOVA表:SOVDFSSYMSFF0.01相關(guān)141541520.4**

11.26非相關(guān)816320.4總9578也可針對(duì)胸圍(X)做ANOVA表:SOVDFSSXMSFF0.01相關(guān)1464620.4**

11.26非相關(guān)8182.25總964例7.1只對(duì)盛發(fā)期(Y)做ANOVA表:SOVDFSSYMSFF0.01回歸117517516.4**

12.25離回歸77510.7總8250第11頁(yè),共33頁(yè),2023年,2月20日,星期四第三節(jié)多項(xiàng)式回歸例7.3觀測(cè)n=7塊小麥田孕穗期的葉面積指數(shù)(x)和每667m2的籽粒產(chǎn)量(y)的關(guān)系,得結(jié)果如下,試就其數(shù)量變化特點(diǎn)建立多項(xiàng)式回歸方程并予以分析。解先描散點(diǎn)圖;初步判斷為二次多項(xiàng)式通常稱之為拋物線;這種變化關(guān)系在農(nóng)業(yè)和生物學(xué)領(lǐng)域普遍存在;完成這類實(shí)例分析的方法是將曲線單回歸的問(wèn)題通過(guò)變量代換轉(zhuǎn)化為二元線性回歸的問(wèn)題來(lái)解決,這也是完成更高次多項(xiàng)式回歸分析的基本點(diǎn)。田塊1234567Σ

X3.374.124.875.626.377.127.8739.34Y(kg)3493743883954013973842688第12頁(yè),共33頁(yè),2023年,2月20日,星期四y2=a+b1x+b2x2的圖象一、確定多項(xiàng)式方程次數(shù)的方法b2<0

b2>0當(dāng)兩個(gè)變數(shù)間的曲線關(guān)系很難確定時(shí),可以使用多項(xiàng)式去逼近,稱為多項(xiàng)式回歸(polynomialregression)。最簡(jiǎn)單的多項(xiàng)式是二次多項(xiàng)式,其方程為:y2=a+b1x+b2x2

它的圖象是拋物線。當(dāng)b2>0時(shí),曲線凹向上,有一個(gè)極小值;b2<0時(shí),曲線凸向上,有一個(gè)極大值,見(jiàn)右圖。

本例(x,y)的散點(diǎn)圖呈單鋒趨勢(shì),沒(méi)有明顯的其它凹凸變化,故預(yù)期可用二次式配合。但多項(xiàng)式回歸方程通常只能用于描述試驗(yàn)范圍內(nèi)Y依X的變化關(guān)系,外推一般不可靠,這一點(diǎn)首先必須明確。第13頁(yè),共33頁(yè),2023年,2月20日,星期四三次多項(xiàng)式的方程為:y3=a+b1x+b2x+b3x3它的圖形是具有兩個(gè)彎曲(一個(gè)極大值和一個(gè)極小值)和一個(gè)拐點(diǎn)的曲線。當(dāng)b3>0時(shí),這類曲線由凸向上轉(zhuǎn)為凹向上;當(dāng)b3<0時(shí),這類曲線由凹向上轉(zhuǎn)為凸向上,見(jiàn)右圖。

多項(xiàng)式方程的一般形式:

y=a+b1x+b2x2+......+bkxk

這是k-1個(gè)具有個(gè)彎曲(k-1個(gè)極值)和k-2

個(gè)拐點(diǎn)的曲線;兩個(gè)變數(shù)的n對(duì)觀察值最多可配到k=n–1次多項(xiàng)式;k越大,包含的統(tǒng)計(jì)數(shù)越多,計(jì)算和解釋越復(fù)雜;一個(gè)多項(xiàng)式回歸方程應(yīng)取多少次為宜,可根據(jù)資料的散點(diǎn)圖作出初步選擇;散點(diǎn)圖趨勢(shì)所表現(xiàn)的曲線的

峰數(shù)+谷數(shù)+1,即為多項(xiàng)式回歸方程次數(shù)。散點(diǎn)波動(dòng)較大或峰谷兩側(cè)不對(duì)稱,可再高一次。一、確定多項(xiàng)式方程次數(shù)的方法b3>0b3<0y3=a+b1x+b2x2+b3x3

的圖象第14頁(yè),共33頁(yè),2023年,2月20日,星期四二、建立多項(xiàng)式回歸方程㈠變量代換(代換得到的變量個(gè)數(shù)以m表示)設(shè)例7.3的二次多項(xiàng)式方程為:y2=a+b1x+b2x2

令x1=x,x2=x2

則方程線性化為:y2=a+b1x1+b2x2㈡數(shù)據(jù)整理由原始數(shù)據(jù)算出一級(jí)數(shù)據(jù)9個(gè):

ΣX1=ΣX=39.34ΣY=2688ΣX1Y=ΣXY=15229.56ΣX2

=ΣX2=236.8408ΣY2=1034112.00ΣX1X2=ΣX3=1508.0760n=7ΣX22=ΣX4=10029.7617ΣX2Y=ΣX2Y=92170.76

再由一級(jí)數(shù)據(jù)算出二級(jí)數(shù)據(jù)9個(gè):

SS1=ΣX2

-(ΣX)2/n=15.75SS2=ΣX22

-(ΣX2)2/n=2016.39556

SP10=ΣX1Y-ΣX1ΣY/n=123SP20=ΣX2Y-ΣX2ΣY/n=1223.8928

SP12=SP21=ΣX1X2

-ΣX1ΣX2/n=177.030704SSY=1920?=ΣY/n=384x1=ΣX1/n=5.62x2=ΣX2/n=33.8344㈢仍按“最小二乘方”原理計(jì)算三級(jí)數(shù)據(jù)bi

例7.1已知a=?-bx,則二次多項(xiàng)式可類推,即:a=?-b1x1

-b2x2

也就是列方程組求算各回歸系數(shù)時(shí),不必把常數(shù)項(xiàng)列為未知數(shù)求解,這樣一來(lái),就可用階數(shù)更少的矩陣運(yùn)算來(lái)減少解方程的工作量。第15頁(yè),共33頁(yè),2023年,2月20日,星期四二、建立多項(xiàng)式回歸方程

1、只將bi列為未知數(shù)求解的方法;對(duì)于任意次多項(xiàng)式,y=a+b1x+b2x2+......+bkxk

若令x1=x,x2=x2,……,xk=xk,則該式可化為:yk=a+b1x1+b2x2+......+bkxk

這時(shí)多元線性方程采用矩陣方法只需求m=k元方程組的解。

SS11SP12

…SP1k

b1

SP10SP21SS22…SP1k

b2

SP20A

..…

.,b=.Z=.

SPm1SPm2

…SSmkbk

SPm0

也就是說(shuō),以二級(jí)數(shù)據(jù)為元素構(gòu)建的矩陣Ab=Z階數(shù)只有m×m

。求得A-1,并由b=A-1Z

可獲得相應(yīng)的多項(xiàng)式回歸方程中k個(gè)回歸系數(shù)bi的解,本例m=k=2,求解過(guò)程如下:A=

SS11SP12

15.750000177.030704

,Z=SP10

=123.0000

SP21SS22177.0307042016.395336SP20

1223.8926第16頁(yè),共33頁(yè),2023年,2月20日,星期四二、建立多項(xiàng)式回歸方程

1、只將bi列為未知數(shù)求解的方法;采用矩陣方法求解的關(guān)鍵在于求逆矩陣,這屬于線性代數(shù)范圍的知識(shí),教材分別在P171和P195提示了逆矩陣求算方法,本例用二級(jí)數(shù)據(jù)構(gòu)建兩個(gè)矩陣后簡(jiǎn)化了計(jì)算,只需對(duì)二階矩陣求逆(Cij叫高斯乘數(shù)),結(jié)果如下:A-1=

SS11SP12

-1

4.819803-0.42315765=

C11

C12

SP21SS22-0.423157650.03764733C21C22

b=A-1Z=4.819803-0.42315765123.0000

74.936168-0.423157650.037647331223.8926-5.972095

于是獲得本例多項(xiàng)式回歸方程中兩個(gè)回歸系數(shù):b1=74.9,b2=-5.97a=?-b1x1

-b2x2

=384-74.9×5.62-(-5.97)×33.8344=165.05I=A-1A=1.0000005680.000000346≈10(單位矩陣)0.0000063801.000003942

01第17頁(yè),共33頁(yè),2023年,2月20日,星期四二、建立多項(xiàng)式回歸方程

2、把常數(shù)項(xiàng)a列為未知數(shù)求解的方法;對(duì)于任意次多項(xiàng)式,y=a+b1x+b2x2+......+bkxk

若令x1=x,x2=x2,……,xk=xk,則該式可化為:yk=a+b1x1+b2x2+......+bkxk

一般的多元線性方程,采用矩陣方法需求m+1

元方程組的解。

1x12x22…xk21x12x122…x12ky11x11x21…xk11x11x112

…x11ky2X

...….=

...…

.,Y=.

1x1nx2n

…xkn1x1nx1n2

…x1nyn

求得X`X,X`Y和(X`X)-1,并由b=(X`X)-1(X`Y)

獲得相應(yīng)的多項(xiàng)式回歸方程中k個(gè)回歸系數(shù)bi和一個(gè)常數(shù)項(xiàng)a的解。教材從直線回歸的內(nèi)容開(kāi)始就介紹了利用矩陣計(jì)算三級(jí)數(shù)據(jù)a和b并進(jìn)行顯著性檢驗(yàn)的方法,以此作為用矩陣進(jìn)行多元回歸與相關(guān)分析的鋪墊。這在當(dāng)今電腦普及的時(shí)代意義非同小可,因?yàn)橛镁仃囘M(jìn)行回歸與相關(guān)分析可一石三鳥(niǎo):⑴更容易理解計(jì)算機(jī)解方程的程序;⑵其中的m+1階(或m=k階)逆矩陣可驗(yàn)證所得方程組的解是否正確包括其精度是否足夠;⑶該逆矩陣的對(duì)角線上的元素用于檢驗(yàn)回歸與相關(guān)關(guān)系的顯著性非常方便。第18頁(yè),共33頁(yè),2023年,2月20日,星期四

13.3711.356934914.1216.9744374X=∶∶∶Y=∶

17.8761.9369384739.34236.8408X`X=39.34236.84081508.0760

236.84081508.076010029.76172688X`Y=

15229.5692170.76E:\matlabR12\bin\win32\matlab.exe165.03532698b=

74.89269841

-5.96825397

圖11.13小麥孕穗期葉面積指數(shù)與產(chǎn)量的關(guān)系至此即獲得了二元線性回歸方程y2=165.03532698+74.89269841x1

-5.96825397x2y2=165.04+74.89x-5.97x2二、建立多項(xiàng)式回歸方程第19頁(yè),共33頁(yè),2023年,2月20日,星期四本例互逆矩陣驗(yàn)算結(jié)果

(m+1)×(m+1)

34.52472939-12.762465601.10370464(X`X)-1=

-12.762465604.81693498

-0.422904171.10370464-0.422904170.037624930.99926016-0.00000296-0.00001274

(X`X)(X`X)-1=-0.023255000.99990676

-0.00040240

-0.04719600-0.000188300.99919211

1

00

I

0

1

0

0

0

1

739.34236.8408X`X=

39.34236.84081508.0760236.84081508.076010029.7617第20頁(yè),共33頁(yè),2023年,2月20日,星期四多項(xiàng)式回歸分析中,Y變量的總平方和SSY亦可分解為回歸和離回歸兩部分,即:SSY=SSU+SSQ

上式中,SSU為k次多項(xiàng)式的總回歸效應(yīng)平方和,即Y變量總變異中能被X的k次多項(xiàng)式所說(shuō)明的部分,計(jì)算過(guò)程用矩陣表述為:SSY=Y(jié)`Y-(1`Y)2/n

=1034112.00-26882/7=1920.00SSQ為k次多項(xiàng)式的離回歸平方和,其中:SSQ=Y(jié)`Y-b`(X`Y)=12.7143

=1034112.00-(165.0353269874.89269841–5.96825397)(X`Y)SSU

=SSY-SSQ=1920.00-12.7143=1907.2857

也可利用二、三級(jí)數(shù)據(jù)直接計(jì)算總回歸效應(yīng)平方和SSU:

SSU

=b1SP10+b2SP20=1907.9436

=74.9362×123.0000+(-5.9721)×1223.8928SSQ

=SSY-SSU=1920.00-1907.9436=12.0564三、多項(xiàng)式回歸的假設(shè)測(cè)驗(yàn)第21頁(yè),共33頁(yè),2023年,2月20日,星期四㈠總回歸關(guān)系的F-test將Y變量的總平方和SSy分解成多項(xiàng)式回歸(SSU)和離回歸(SSQ)兩部分。前者由X的各次分量項(xiàng)的引起,包括一次回歸效應(yīng)和二次回歸效應(yīng),具有自由度df=k;后者與X的不同無(wú)關(guān),具有自由度df=n-(k+1),也就是誤差效應(yīng)。于是:

F=(SSU/k)/(SSQ/[n-(k+1)])可測(cè)驗(yàn)多項(xiàng)式回歸關(guān)系的真實(shí)性。根據(jù)本例已算得的結(jié)果,可作成方差分析表于下。該表的F測(cè)驗(yàn)結(jié)果極其顯著,表明用所得二次多項(xiàng)式來(lái)描述葉面積指數(shù)與畝產(chǎn)量是可行的。二次多項(xiàng)式回歸關(guān)系的F-test表

變異來(lái)源DFSSMSFF0.01

多項(xiàng)式回歸

21907.2857953.6429300.02**

18.00

離回歸

412.71433.1786

總61920.00第22頁(yè),共33頁(yè),2023年,2月20日,星期四㈡總回歸關(guān)系的R-test同多元相關(guān)系數(shù)Ry.12..m相類似,k次多項(xiàng)式的回歸平方和占Y總平方和的比率的平方根值(記作Ry.x.x2,….,xk),可用來(lái)表示Y與X的多項(xiàng)式的相關(guān)密切程度,即有:Ry.x.x2,….,xk

=√SSU/SSY

上式中的Ry.x.x2,….,xk叫相關(guān)指數(shù)。和線性相關(guān)的情況一樣:R2y.x.x2,….,xk=SSU/SSY

表示k次多項(xiàng)式的決定系數(shù),即在Y的總平方和SSY中,可由X的k次多項(xiàng)式引起的平方和SSU所占的比率。

Ry.x.x2,….,xk的顯著性可通過(guò)查表直接獲知。如本例查附表10,當(dāng)df=4,k=2(即附表10中的M=k+1=3)時(shí),R0.01=0.949,于是:Ry.x.x2,….,xk=√1907.2857÷1920.00=0.9967**>

R0.01

故Y與X的二次多項(xiàng)式的“復(fù)相關(guān)”(總回歸)關(guān)系極顯著。對(duì)于Ry.x.x2,….,xk的測(cè)驗(yàn)和本例F-test結(jié)論完全一致,擇一即可。但不論F-test還是R-test都只是一個(gè)綜合性測(cè)驗(yàn),表明葉面積指數(shù)與畝產(chǎn)量需要一個(gè)多項(xiàng)式來(lái)描述,并不能證實(shí)k次項(xiàng)或者其它各次項(xiàng)的顯著性。第23頁(yè),共33頁(yè),2023年,2月20日,星期四㈢各次分量項(xiàng)偏回歸關(guān)系的F-test本例總回歸效應(yīng)極顯著既然不能排除多項(xiàng)式方程中個(gè)別乃至若干個(gè)分量項(xiàng)不顯著的可能性,就有必要分別對(duì)各次分量項(xiàng)進(jìn)行偏回歸關(guān)系的F-test。這與多元線性回歸中偏回歸關(guān)系的假設(shè)測(cè)驗(yàn)相類似,亦需先計(jì)算各次分量項(xiàng)的偏回歸平方和SSbi,即:SSbi=bi2/C(i+1)(i+1)

此時(shí)SSbi具有自由度df=1,故由:F=SSbi/(SSQ/[n-(k+1)])可測(cè)驗(yàn)第i次分量是否顯著。本例由逆矩陣對(duì)角線上的元素算得Y對(duì)各次分量項(xiàng)的偏回歸平方和為:

SSb1=74.892698412/4.81693498=1164.4160SSb2=(-5.96825397)2/0.03762493=946.7142變異來(lái)源DFSSMSFF0。01一次分量11164.41601164.4160366.33**21.20二次分量1946.7142946.7142297.84**離回歸412.71433.1786

總61920.00

結(jié)果表明,在用二次多項(xiàng)式描述葉面積指數(shù)與畝產(chǎn)量時(shí),二次分量和一次分量均應(yīng)保留(但SSU≠SSb1+SSb2

!

)。第24頁(yè),共33頁(yè),2023年,2月20日,星期四各次分量項(xiàng)的F測(cè)驗(yàn)表變異來(lái)源DFSSMSFF0。01一次分量11164.41601164.4160366.33**21.20二次分量1946.7142946.7142297.84**離回歸412.71433.1786

結(jié)果表明,在用二次多項(xiàng)式描述教材表11.4資料時(shí),二次分量和一次分量均應(yīng)保留。㈢各次分量項(xiàng)偏回歸關(guān)系的F-test第25頁(yè),共33頁(yè),2023年,2月20日,星期四課后習(xí)題以光呼吸抑制劑亞硫酸氫鈉的不同濃度溶液(x,100mg/L)噴射滬選19水稻,2小時(shí)后測(cè)定劍葉的光合強(qiáng)度(y,co2mg/dm/h),得結(jié)果于下表。試計(jì)算(1)光合強(qiáng)度依亞硫酸氫鈉濃度的多項(xiàng)式回歸方程及離回歸標(biāo)準(zhǔn)差。(2)光合強(qiáng)度最高時(shí)的亞硫酸氫鈉濃度。X012345Y19.1023.0523.3321.3320.0519.35第26頁(yè),共33頁(yè),2023年,2月20日,星期四第四節(jié)協(xié)方差分析例7.4有一大豆浸種試驗(yàn)研究結(jié)果,k=10,隨機(jī)區(qū)組設(shè)計(jì),n=3,每個(gè)試驗(yàn)小區(qū)(1.5m2)點(diǎn)播的種子粒數(shù)均等。以各小區(qū)大豆收獲時(shí)的籽粒干重(10g)為試驗(yàn)指標(biāo)進(jìn)行觀察記載??紤]到每個(gè)小區(qū)結(jié)莢株數(shù)只占小區(qū)總株數(shù)的一部分,并且與該小區(qū)試驗(yàn)指標(biāo)之間可能存在著回歸關(guān)系,故在稱量小區(qū)干重y的同時(shí),對(duì)其結(jié)莢株數(shù)x一并予以記載(見(jiàn)下圖),試進(jìn)行協(xié)方差分析。N6.5J176.5E206.8I157.3D1210.8G198.0B1910.5H2010.1F228.0C149.7A2513.0B2117.5F2313.3J2418.4H2216.5C2816.0A2017.2D2414.0I2318.8G2615.5E2115.0A2619.5C3020.6D2914.3E2623.2G3714.8F2815.5I2915.4J2820.5H2616.4B27肥力梯度第27頁(yè),共33頁(yè),2023年,2月20日,星期四一、數(shù)據(jù)整理處理XYXYXYTxtTytXt?t?t`A259.72016.02615.07140.723.6713.5713.49B198.02113.02716.46737.422.3312.4712.75C148.02816.53019.57244.024.0014.6714.50D127.32417.22920.66545.121.6715.0315.49E206.52115.52614.36736.322.3312.1012.38F2210.12317.52814.87342.424.3314.1313.87G1910.82618.83723.28252.827.3317.6016.53H2010.52218.42920.56849.422.6716.4716.66I156.82314.02615.56736.322.3312.1012.38J176.52413.32815.46935.223.0011.7311.83Txr183232286701ΣXΣY419.623.37x?13.99Tyr84.2160.2175.2Cx=(ΣX)2/nk=16380SSx=ΣX2

-Cx=816.97Cy=(ΣY)2/nk=5868.8SSy=ΣY2

-Cy=628.69Cxy=ΣXΣY/nk=9804.7SPT=ΣXY-Cxy=574.16第28頁(yè),共33頁(yè),2023年,2月20日,星期四二、dfT、SPT、SSx、SSy的分解dfT=dft+dfr

+dfe29

=9

+2+18SPT=SPt

+SPr+SPeSPt=ΣTxt·Tyt/n-Cxy=52.68=71×40.7+67×37.4+…+69×35.2SPr=ΣTxr·Tyr/k-Cxy=463.57

=183×84.2+232×160.2+286×175.2SPe=SPT-SPt-SPr

=57.91SSxt=ΣTxt2/n-Cx=71.64=(712+672+……+692)/3-16380SSxr=ΣTxr2/k-Cx=530.87=(1832+2322+2862)/10-16380SSxe=SSx

-SSxt-SSxr=214.46SSyt=ΣTyt2/n-Cy=106.41=(40.72+37.42+…+35.22)/3-5868.8SSyr=ΣTyr2/k-Cy=476.07=(84.22+160.22+175.22)/10-5868.8SSye=SSy

-SSyt-SSyr=46.21三、SSye、dfye

的再分解與F-testSSue=SPe2/SSxe=15.64

=57.912/214.46SSQe=SSye-SSue=30.57

=46.21-15.64dfye=dfue+dfQe18

=1+17得檢驗(yàn)回歸關(guān)系的ANOVA表如下:SOVDFSSMSFF0.01回歸115.6415.648.69**

8.41離回歸1730.571.80總1846.21

本例因?yàn)榻Y(jié)莢株數(shù)與籽粒干重的直線回歸關(guān)系極其顯著,必須將試驗(yàn)指標(biāo)的方差分析過(guò)程與回歸分析結(jié)合起來(lái),也就是要做協(xié)方差分析。否則(即回歸關(guān)系的F-test不顯著),就可不必理睬協(xié)變量而直接對(duì)干重指標(biāo)進(jìn)行方差分析。第29頁(yè),共33頁(yè),2023年,2月20日,星期四四、列協(xié)方差分析表,修正部分?jǐn)?shù)據(jù)后再進(jìn)行F-testSOVDFSSxSPSSySSy`DF`MS`FF0.01

處理t971.6452.68106.4179.3098.894.89**3.68

誤差e18214.4657.9146.2130.57171.80t+e27286.10110.59152.62109.8726

區(qū)組2530.87463.57476.07

總29816.97574.16628.69

既然協(xié)變量x與試驗(yàn)結(jié)果y之間的回歸關(guān)系極其顯著,各誤差項(xiàng)或包含有誤差項(xiàng)的數(shù)據(jù)(平方和)就必須再分解為回歸效

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論