多元線性回歸與多項(xiàng)式回歸_第1頁(yè)
多元線性回歸與多項(xiàng)式回歸_第2頁(yè)
多元線性回歸與多項(xiàng)式回歸_第3頁(yè)
多元線性回歸與多項(xiàng)式回歸_第4頁(yè)
多元線性回歸與多項(xiàng)式回歸_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第九章多元線性回歸與多項(xiàng)式回歸直線回歸研究的是一個(gè)依變量與一個(gè)自變量之間的回歸問(wèn)題,但是,在畜禽、水產(chǎn)科學(xué)領(lǐng)域的許多實(shí)際問(wèn)題中,影響依變量的自變量往往不止一個(gè),而是多個(gè),比方綿羊的產(chǎn)毛量這一變量同時(shí)受到綿羊體重、胸圍、體長(zhǎng)等多個(gè)變量的影響,因此需要進(jìn)行一個(gè)依變量與多個(gè)自變量間的回歸分析,即多元回歸分析〔multipleregressionanalysis〕,而其中最為簡(jiǎn)單、常用并且具有根底性質(zhì)的是多元線性回歸分析〔multiplelinearregressionanalysis〕,許多非線性回歸〔non-linearregression〕和多項(xiàng)式回歸〔polynomialregression〕都可以化為多元線性回歸來(lái)解決,因而多元線性回歸分析有著廣泛的應(yīng)用。研究多元線性回歸分析的思想、方法和原理與直線回歸分析根本相同,但是其中要涉及到一些新的概念以及進(jìn)行更細(xì)致的分析,特別是在計(jì)算上要比直線回歸分析復(fù)雜得多,當(dāng)自變量較多時(shí),需要應(yīng)用電子計(jì)算機(jī)進(jìn)行計(jì)算。aaa第一節(jié)多元線性回歸分析多元線性回歸分析的根本任務(wù)包括:根據(jù)依變量與多個(gè)自變量的實(shí)際觀測(cè)值建立依變量對(duì)多個(gè)自變量的多元線性回歸方程;檢驗(yàn)、分析各個(gè)自變量對(duì)依自變量的綜合線性影響的顯著性;檢驗(yàn)、分析各個(gè)自變量對(duì)依變量的單純線性影響的顯著性,選擇僅對(duì)依變量有顯著線性影響的自變量,建立最優(yōu)多元線性回歸方程;評(píng)定各個(gè)自變量對(duì)依變量影響的相對(duì)重要性以及測(cè)定最優(yōu)多元線性回歸方程的偏離度等。多元線性回歸方程的建立〔一〕多元線性回歸的數(shù)學(xué)模型設(shè)依變量與自變量、、…、共有n組實(shí)際觀測(cè)數(shù)據(jù):變量序號(hào)…1…2…┆┆┆┆…┆…假定依變量y與自變量x1、x2、…、xm間存在線性關(guān)系,其數(shù)學(xué)模型為:〔9-1〕〔j=1,2,…,n〕式中,x1、x2、…、xm為可以觀測(cè)的一般變量〔或?yàn)榭梢杂^測(cè)的隨機(jī)變量〕;y為可以觀測(cè)的隨機(jī)變量,隨x1、x2、…、xm而變,受試驗(yàn)誤差影響;為相互獨(dú)立且都服從的隨機(jī)變量。我們可以根據(jù)實(shí)際觀測(cè)值對(duì)以及方差作出估計(jì)?!捕辰⒕€性回歸方程設(shè)對(duì)、、…、的元線性回歸方程為:其中的、、、…、為的最小二乘估計(jì)值。即、、、…、應(yīng)使實(shí)際觀測(cè)值y與回歸估計(jì)值的偏差平方和最小。令為關(guān)于、、、…、的+1元函數(shù)。根據(jù)微分學(xué)中多元函數(shù)求極值的方法,假設(shè)使到達(dá)最小,那么應(yīng)有:〔=1、2、…、〕經(jīng)整理得:(9-2)由方程組〔9-2〕中的第一個(gè)方程可得(9-3)即假設(shè)記〔、、、…、;k〕并將分別代入方程組〔9-2〕中的后個(gè)方程,經(jīng)整理可得到關(guān)于偏回歸系數(shù)、、…、的正規(guī)方程組〔normalequations〕為:〔9-4〕解正規(guī)方程組〔9-4〕即可得偏回歸系數(shù)、、…、的解,而于是得到元線性回歸方程元線性回歸方程的圖形為維空間的一個(gè)平面,稱為回歸平面;稱為回歸常數(shù)項(xiàng),當(dāng)==…==0時(shí),在b0有實(shí)際意義時(shí),表示的起始值;〔=、2、…、〕稱為依變量對(duì)自變量的偏回歸系數(shù)〔partialregressioncoefficient〕,表示除自變量以外的其余個(gè)自變量都固定不變時(shí),自變量每變化一個(gè)單位,依變量平均變化的單位數(shù)值,確切地說(shuō),當(dāng)>0時(shí),自變量每增加一個(gè)單位,依變量平均增加個(gè)單位;當(dāng)<0時(shí),自變量i每增加一個(gè)單位,依變量平均減少個(gè)單位。假設(shè)將代入上式,那么得〔9-5〕〔9-5〕式也為對(duì)、、…、的元線性回歸方程。對(duì)于正規(guī)方程組〔9-4〕,記,,那么正規(guī)方程組〔9-4〕可用矩陣形式表示為〔9-6〕即〔9-7〕其中A為正規(guī)方程組的系數(shù)矩陣、b為偏回歸系數(shù)矩陣〔列向量〕、B為常數(shù)項(xiàng)矩陣〔列向量〕。設(shè)系數(shù)矩陣A的逆矩陣為C矩陣,即,那么其中:C矩陣的元素〔,j=1、2、…、〕稱為高斯乘數(shù),是多元線性回歸分析中顯著性檢驗(yàn)所需要的。關(guān)于求系數(shù)矩陣A的逆矩陣A-1的方法有多種,如行〔或列〕的初等變換法等,請(qǐng)參閱線性代數(shù)教材,這里就不再贅述。對(duì)于矩陣方程〔9-7〕求解,有:即:〔9-8〕關(guān)于偏回歸系數(shù)、、…、的解可表示為:〔9-9〕〔=1、2、…、〕或者而【例9.1】豬的瘦肉量是肉用型豬育種中的重要指標(biāo),而影響豬瘦肉量的有豬的眼肌面積、胴體長(zhǎng)、膘厚等性狀。設(shè)依變量為瘦肉量〔〕,自變量為眼肌面積〔2〕,自變量為胴體長(zhǎng)〔〕,自變量為膘厚〔〕。根據(jù)三江豬育種組的54頭雜種豬的實(shí)測(cè)數(shù)據(jù)資料,經(jīng)過(guò)整理計(jì)算,得到如下數(shù)據(jù):試建立對(duì)、、的三元線性回歸方程。將上述有關(guān)數(shù)據(jù)代入〔9-5〕式,得到關(guān)于偏回歸系數(shù)、、的正規(guī)方程組:用線性代數(shù)有關(guān)方法求得系數(shù)矩陣的逆矩陣如下:=根據(jù)式〔9-8〕,關(guān)于、、的解可表示為:即關(guān)于b1、b2、b3的解為:而于是得到關(guān)于瘦肉量與眼肌面積、胴體長(zhǎng)、膘厚的三元線性回歸方程為:〔三〕多元線性回歸方程的偏離度以上根據(jù)最小二乘法,即使偏差平方和最小建立了多元線性回歸方程。偏差平方和的大小表示了實(shí)測(cè)點(diǎn)與回歸平面的偏離程度,因而偏差平方和又稱為離回歸平方和。統(tǒng)計(jì)學(xué)已證明,在m元線性回歸分析中,離回歸平方和的自由度為〔n-m-1〕。于是可求得離回歸均方為/〔n-m-1〕。離回歸均方是模型〔9-1〕中σ2的估計(jì)值。離回歸均方的平方根叫離回歸標(biāo)準(zhǔn)誤,記為〔或簡(jiǎn)記為Se〕,即〔9-10〕離回歸標(biāo)準(zhǔn)誤的大小表示了回歸平面與實(shí)測(cè)點(diǎn)的偏離程度,即回歸估計(jì)值與實(shí)測(cè)值y偏離的程度,于是我們把離回歸標(biāo)準(zhǔn)誤用來(lái)表示回歸方程的偏離度。離回歸標(biāo)準(zhǔn)誤大,表示回歸方程偏離度大,離回歸標(biāo)準(zhǔn)誤小,表示回歸方程偏離度小。利用公式計(jì)算離回歸平方和,因?yàn)橄软氂?jì)算出各個(gè)回歸預(yù)測(cè)值,計(jì)算量大,下面我們將介紹計(jì)算離回歸平方和的簡(jiǎn)便公式。二、多元線性回歸的顯著性檢驗(yàn)〔一〕多元線性回歸關(guān)系的顯著性檢驗(yàn)在畜禽、水產(chǎn)科學(xué)的許多實(shí)際問(wèn)題中,我們事先并不能斷定依變量與自變量、、…、之間是否確有線性關(guān)系,在根據(jù)依變量與多個(gè)自變量的實(shí)際觀測(cè)數(shù)據(jù)建立多元線性回歸方程之前,依變量與多個(gè)自變量間的線性關(guān)系只是一種假設(shè),盡管這種假設(shè)常常不是沒(méi)有根據(jù)的,但是在建立了多元線性回歸方程之后,還必須對(duì)依變量與多個(gè)自變量間的線性關(guān)系的假設(shè)進(jìn)行顯著性檢驗(yàn),也就是進(jìn)行多元線性回歸關(guān)系的顯著性檢驗(yàn),或者說(shuō)對(duì)多元線性回歸方程進(jìn)行顯著性檢驗(yàn)。這里應(yīng)用F檢驗(yàn)方法。與直線回歸分析即一元線性回歸分析一樣,在多元線性回歸分析中,依變量的總平方和可以剖分為回歸平方和與離回歸平方和兩局部,即:〔9-11〕依變量的總自由度也可以剖分為回歸自由度與離回歸自由度兩局部,即:〔9-12〕〔9-11〕與〔9-12〕兩式稱為多元線性回歸的平方和與自由度的劃分式或剖分式。在〔9-11〕式中,反映了依變量的總變異;反映了依變量與多個(gè)自變量間存在線性關(guān)系所引起的變異,或者反映了多個(gè)自變量對(duì)依變量的綜合線性影響所引起的變異;反映了除依變量與多個(gè)自變量間存在線性關(guān)系以外的其他因素包括試驗(yàn)誤差所引起的變異。〔9-11〕式中各項(xiàng)平方和的計(jì)算方法如下:〔9-12〕〔9-12〕式中各項(xiàng)自由度的計(jì)算方法如下:在上述計(jì)算方法中,為自變量的個(gè)數(shù),為實(shí)際觀測(cè)數(shù)據(jù)的組數(shù)。在計(jì)算出、與、之后,我們可以方便地算出回歸均方與離回歸均方:;檢驗(yàn)多元線性回歸關(guān)系是否顯著或者多元線性回歸方程是否顯著,就是檢驗(yàn)各自變量的總體偏回歸系數(shù)、2、…、〕是否同時(shí)為零,顯著性檢驗(yàn)的無(wú)效假設(shè)與備擇假設(shè)為:在H0成立條件下,有〔9-14〕由上述統(tǒng)計(jì)量進(jìn)行檢驗(yàn)即可推斷多元線性回歸關(guān)系的顯著性。這里特別要說(shuō)明的是,上述顯著性檢驗(yàn)實(shí)質(zhì)上是測(cè)定各自變量對(duì)依變量的綜合線性影響的顯著性,或者測(cè)定依變量與各自變量的綜合線性關(guān)系的顯著性。如果經(jīng)過(guò)檢驗(yàn),多元線性回歸關(guān)系或者多元線性回歸方程是顯著的,那么不一定每一個(gè)自變量與依變量的線性關(guān)系都是顯著的,或者說(shuō)每一個(gè)偏回歸系數(shù)不一定都是顯著的,這并不排斥其中存在著與依變量無(wú)線性關(guān)系的自變量的可能性。在上述多元線性回歸關(guān)系顯著性檢驗(yàn)中,無(wú)法區(qū)別全部自變量中,哪些是對(duì)依變量的線性影響是顯著的,哪些是不顯著的。因此,當(dāng)多元線性回歸關(guān)系經(jīng)顯著檢驗(yàn)為顯著時(shí),還必須逐一對(duì)各偏回歸系數(shù)進(jìn)行顯著性檢驗(yàn),發(fā)現(xiàn)和剔除不顯著的偏回歸關(guān)系對(duì)應(yīng)的自變量。另外,多元線性回歸關(guān)系顯著并不排斥有更合理的多元非線性回歸方程的存在,這正如直線回歸顯著并不排斥有更合理的曲線回歸方程存在一樣。對(duì)于【】,建立的三元線性回歸方程為:現(xiàn)在對(duì)三元線性回歸關(guān)系進(jìn)行顯著性檢驗(yàn)。已計(jì)算得:并且dfy=n-1=54-1=53dfR=m=3dfr=n-m-1=54-3-1=50列出方差分析表,進(jìn)行檢驗(yàn):表9-1三元線性回歸關(guān)系方差分析表變異來(lái)源SS回歸39.493**離回歸50總變異53由=3、=50查F值表得F(3,50)=4.20,因?yàn)镕>F(3,50),P<0.01。說(shuō)明,豬瘦肉量與眼肌面積、胴體長(zhǎng)、膘厚之間存在極顯著的線性關(guān)系,或者眼肌面積、胴體長(zhǎng)、膘厚對(duì)瘦肉量的綜合線性影響是極顯著的?!捕称貧w系數(shù)的顯著性檢驗(yàn)當(dāng)多元線性回歸關(guān)系經(jīng)顯著性檢驗(yàn)為顯著或極顯著時(shí),還必須對(duì)每個(gè)偏回歸系數(shù)進(jìn)行顯著性檢驗(yàn),以判斷每個(gè)自變量對(duì)依變量的線性影響是顯著的還是不顯著的,以便從回歸方程中剔除那些不顯著的自變量,重新建立更為簡(jiǎn)單的多元線性回歸方程。偏回歸系數(shù)、2、…、m)的顯著性檢驗(yàn)或某一個(gè)自變量對(duì)依變量的線性影響的顯著性檢驗(yàn)所建立的無(wú)效假設(shè)與備擇假設(shè)為:、2、…、m)有兩種完全等價(jià)的顯著性檢驗(yàn)方法──t檢驗(yàn)與F檢驗(yàn)。1、t檢驗(yàn)、2、…、m)〔9-15〕式中為偏回歸系數(shù)標(biāo)準(zhǔn)誤;為離回歸標(biāo)準(zhǔn)誤;為C=A-1的主對(duì)角線元素。2、F檢驗(yàn)在多元線性回歸分析中,回歸平方和SSR反映了所有自變量對(duì)依變量的綜合線性影響,它總是隨著自變量的個(gè)數(shù)增多而有所增加,但決不會(huì)減少。因此,如果在所考慮的所有自變量當(dāng)中去掉一個(gè)自變量時(shí),回歸平方和SSR只會(huì)減少,不會(huì)增加。減少的數(shù)值越大,說(shuō)明該自變量在回歸中所起的作用越大,也就是該自變量越重要。設(shè)SSR為m個(gè)自變量、、…、所引起的回歸平方和,為去掉一個(gè)自變量后m-1個(gè)自變量所引起的回歸平方和,那么它們的差即為去掉自變量之后,回歸平方和所減少的量,稱為自變量的偏回歸平方和,記為,即:可以證明:〔i=1、2、…、m〕〔9-16〕偏回歸平方和可以衡量每個(gè)自變量在回歸中所起作用的大小,或者說(shuō)反映了每個(gè)自變量對(duì)依變量的影響程度的大小。值得注意的是,在一般情況下,這是因?yàn)閙個(gè)自變量之間往往存在著不同程度的相關(guān),使得各自變量對(duì)依變量的作用相互影響。只有當(dāng)m個(gè)自變量相互獨(dú)立時(shí),才有偏回歸平方和是去掉一個(gè)自變量使回歸平方和減少的局部,也可理解為添入一個(gè)自變量使回歸平方和增加的局部,其自由度為1,稱為偏回歸自由度,記為,即。顯然,偏回歸均方為〔i=1、2、…、m〕〔9-17〕檢驗(yàn)各偏回歸系數(shù)顯著性的F檢驗(yàn)法應(yīng)用下述F統(tǒng)計(jì)量:〔i=1、2、…、m〕〔9-18〕可以將上述檢驗(yàn)列成方差分析表的形式。對(duì)于【】,我們已經(jīng)進(jìn)行了三元線性回歸關(guān)系的顯著性檢驗(yàn),且結(jié)果為極顯著的?,F(xiàn)在對(duì)三個(gè)偏回歸系數(shù)分別進(jìn)行顯著性檢驗(yàn)。t檢驗(yàn)法:首先計(jì)算然后計(jì)算各t統(tǒng)計(jì)量的值:由df=n-m-1=50查t值表得。因?yàn)?gt;、<、<,所以偏回歸系數(shù)b1是極顯著的,而偏回歸系數(shù)b2、b3都是不顯著的。F檢驗(yàn)法:首先計(jì)算各個(gè)偏回歸平方和:進(jìn)而計(jì)算各個(gè)偏回歸均方:最后計(jì)算各F的值:由df1=1,df2=50查F值表得F0.05〔1,50〕=4.03,F0.01〔1,50〕=7.17。因?yàn)?gt;F0.01〔1,50〕,<F0.05〔1,50〕,<F0.05〔1,50〕,因此偏回歸系數(shù)b1極顯著,而偏回歸系數(shù)b2、b3均不顯著。這與t檢驗(yàn)的結(jié)論是一致的。也可以把上述偏回歸系數(shù)顯著性檢驗(yàn)的F檢驗(yàn)結(jié)果列成方差分析表的形式:表9-2偏回歸系數(shù)顯著性檢驗(yàn)方差分析表變異來(lái)源SSdfMSF的偏回歸115.378**的偏回歸1的偏回歸1離回歸50(三)自變量剔除與重新建立多元線性回歸方程當(dāng)對(duì)顯著的多元線性回歸方程中各個(gè)偏回歸系數(shù)進(jìn)行顯著性檢驗(yàn)都為顯著時(shí),說(shuō)明各個(gè)自變量對(duì)依變量的單純影響都是顯著的。假設(shè)有一個(gè)或幾個(gè)偏回歸系數(shù)經(jīng)顯著性檢驗(yàn)為不顯著時(shí),說(shuō)明其對(duì)應(yīng)的自變量對(duì)依變量的作用或影響不顯著,或者說(shuō)這些自變量在回歸方程中是不重要的,此時(shí)應(yīng)該從回歸方程中剔除一個(gè)不顯著的偏回歸系數(shù)對(duì)應(yīng)的自變量,重新建立多元線性回歸方程,再對(duì)新的多元線性回歸方程或多元線性回歸關(guān)系以及各個(gè)新的偏回歸系數(shù)進(jìn)行顯著性檢驗(yàn),直至多元線性回歸方程顯著,并且各個(gè)偏回歸系數(shù)都顯著為止。此時(shí)的多元線性回歸方程即為最優(yōu)多元線性回歸方程〔thebestmultiplelinearregressionequation〕。1、自變量的剔除當(dāng)經(jīng)顯著性檢驗(yàn)有幾個(gè)不顯著的偏回歸系數(shù)時(shí),我們一次只能剔除一個(gè)不顯著的偏回歸系數(shù)對(duì)應(yīng)的自變量,被剔除的自變量的偏回歸系數(shù),應(yīng)該是所有不顯著的偏回歸系數(shù)中的F值〔或∣t∣值、或偏回歸平方和〕為最小者。這是因?yàn)樽宰兞恐g往往存在著相關(guān)性,當(dāng)剔除某一個(gè)不顯著的自變量之后,其對(duì)依變量的影響很大局部可以轉(zhuǎn)加到另外不顯著的自變量對(duì)依變量的影響上。如果同時(shí)剔除兩個(gè)以上不顯著的自變量,那就會(huì)比擬多地減少回歸平方和,從而影響利用回歸方程進(jìn)行估測(cè)的可靠程度。2、重新進(jìn)行少一個(gè)自變量的多元線性回歸分析我們一次剔除一個(gè)不顯著的偏回歸系數(shù)對(duì)應(yīng)的自變量,不能簡(jiǎn)單地理解為只須把被剔除的自變量從多元線性回歸方程中去掉就行了,這是因?yàn)樽宰兞块g往往存在相關(guān)性,剔除一個(gè)自變量,其余自變量的偏回歸系數(shù)的數(shù)值將發(fā)生改變,回歸方程的顯著性檢驗(yàn)、偏回歸系數(shù)的顯著性檢驗(yàn)也都須重新進(jìn)行,也就是說(shuō)應(yīng)該重新進(jìn)行少一個(gè)自變量的多元線性回歸分析。設(shè)依變量y與自變量、、…、的m元線性回歸方程為:如果為被剔除的自變量,那么m-1元線性回歸方程為:〔9-19〕我們可以應(yīng)用前面介紹過(guò)的m元線性回歸方程的建立方法根據(jù)實(shí)際觀測(cè)數(shù)據(jù)建立m-1元線性回歸方程,但是這需要重新進(jìn)行大量的計(jì)算。下面介紹利用m元線性回歸方程與m-1元線性回歸方程的對(duì)應(yīng)偏回歸系與的關(guān)系以及m元正規(guī)方程組系數(shù)矩陣逆矩陣C的元素與m-1元正規(guī)方程組系數(shù)矩陣逆矩陣的元素之間的關(guān)系建立m-1元線性回歸方程的方法。設(shè)關(guān)于m-1元線性回歸方程〔9-19〕中的偏回歸系、、…、、、…、的正規(guī)方程組系數(shù)矩陳的逆矩陣為,其各元素為:〔=1、2、…、i-1、i+1、…、m;j;)可以證明:(9-20)式中、、、均為m元正規(guī)方程組系數(shù)矩陣逆矩陣C的元素。這樣我們就非常方便地計(jì)算出新的m-1階逆矩陣的各元素,以進(jìn)行m-1元線性回歸方程的偏回歸系數(shù)的顯著性檢驗(yàn)。還可以證明,m-1元線性回歸方程中的偏回歸系數(shù)與m元線性回歸方程中偏回歸系數(shù)bj之間有如下關(guān)系:〔j=1、2、…、、、…、m〕〔9-21〕〔9-21〕式說(shuō)明了可以利用原來(lái)的m元線性回歸方程中的偏回歸系數(shù)和m元正規(guī)方程組系數(shù)矩陣的逆矩陣C的元素來(lái)計(jì)算剔除一個(gè)自變量之后新的m-1元線性回歸方程中的各偏回歸系數(shù)。而新的m-1元線性回歸方程中常數(shù)項(xiàng)由下式計(jì)算:〔9-22〕于是我們利用〔9-21〕和〔9-22〕式可以方便地算出新的m-1元線性回歸方程中的各個(gè)偏回歸系數(shù)及常數(shù)項(xiàng),這樣即建立了剔除一個(gè)自變量之后新的m-1元線性回歸方程:在重新建立m-1元線性回歸方程之后,仍然需要對(duì)m-1元線性回歸關(guān)系和偏回歸系數(shù)進(jìn)行顯著性檢驗(yàn),方法同前,但一些統(tǒng)計(jì)量需要重新進(jìn)行計(jì)算。對(duì)于m-1元線性回歸方程〔9-19〕:回歸平方和回歸自由度離回歸平方和離回歸自由度對(duì)偏回歸系數(shù)進(jìn)行顯著性檢驗(yàn)時(shí):而新的偏回歸平方和為:上式中的MSr仍為新的離回歸均方。重復(fù)上述步驟,直至回歸方程顯著以及各偏回歸系數(shù)都顯著為止,即建立了最優(yōu)多元線性回歸方程。對(duì)于【】,建立的三元線性回歸方程為經(jīng)顯著性檢驗(yàn),回歸方程極顯著,偏回歸系數(shù)b1極顯著,而b2、b3都是不顯著的。因?yàn)?,所以剔除偏回歸系數(shù)對(duì)應(yīng)的自變量〔胴體長(zhǎng)〕,重新建立瘦肉量對(duì)眼肌面積、膘厚的二元線性回歸方程:根據(jù)〔9-21〕式:計(jì)算和。這里i=2,j=1,3。而由〔9-22〕式計(jì)算:于是重新建立的二元線性回歸方程為:現(xiàn)在對(duì)二元線性回歸方程或者二元線性回歸關(guān)系進(jìn)行顯著性檢驗(yàn)。已計(jì)算得:列出方差分析表,進(jìn)行F檢驗(yàn):表9-3二元線性回歸關(guān)系方差分析表變異來(lái)源SSdfMSF回歸212.598**離回歸51總變異53由應(yīng)用線性內(nèi)插法求臨界F值,得F0.01〔2,51〕=5.05,因?yàn)镕>F(2,51),P<0.01,說(shuō)明二元線性回歸關(guān)系或二元線性回歸方程是極顯著的。下面對(duì)偏回歸系數(shù)和進(jìn)行顯著性檢驗(yàn),這里應(yīng)用F檢驗(yàn)法:首先應(yīng)用〔9-20〕式計(jì)算關(guān)于、的正規(guī)方程組系數(shù)矩陣的逆矩陣的主對(duì)角線上的各元素,這里i=2,j、k=1、3。下面計(jì)算偏回歸平方和:列出方差分析表,進(jìn)行F檢驗(yàn):表9-4偏回歸系數(shù)顯著性檢驗(yàn)方差分析表變異來(lái)源SSdfMSF的偏回歸115.294**的偏回歸18.500**離回歸51由應(yīng)用線性內(nèi)插法求臨界F值,得F(1,51)=7.16,因?yàn)?說(shuō)明二元線性回歸方程的偏回歸系數(shù)和都是極顯著的,或者說(shuō)明眼肌面積、膘厚分別對(duì)瘦肉量y的線性影響都是極顯著的。于是我們得到【】的最優(yōu)二元線性回歸方程為:回歸方程說(shuō)明:豬的瘦肉量與眼肌面積、膘厚有著極顯著的線性回歸關(guān)系。當(dāng)膘厚性狀保持不變時(shí),眼肌面積性狀每增加1cm2kg;而當(dāng)眼肌面積性狀保持不變時(shí),膘厚性狀每增加1cmkg。該回歸方程的離回歸標(biāo)準(zhǔn)誤為:〔四〕自變量主次的判斷在實(shí)際應(yīng)用中,我們經(jīng)常需要對(duì)最優(yōu)多元線性回歸方程中的自變量進(jìn)行主次判斷,以便抓住主要矛盾,更好地解決實(shí)際問(wèn)題。定義〔9-23〕為第i個(gè)自變量的標(biāo)準(zhǔn)偏回歸系數(shù)。式中:為第個(gè)自變量的樣本標(biāo)準(zhǔn)差,Sy為依變量y的樣本標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)偏回歸系數(shù)為不帶單位的相對(duì)數(shù),其絕對(duì)值的大小可以衡量對(duì)應(yīng)的自變量對(duì)依變量作用的相對(duì)重要性。標(biāo)準(zhǔn)偏回歸系數(shù)又稱“通徑系數(shù)〞,其應(yīng)用請(qǐng)參閱本章第五節(jié)。在多元線性回歸分析中,在各自變量之間無(wú)顯著相關(guān)的情況下,可以比擬各標(biāo)準(zhǔn)偏回歸系數(shù)絕對(duì)值的大小,大者,其對(duì)應(yīng)的自變量對(duì)依變量的作用是主要的。2、偏回歸平方和的比擬在多元線性回歸分析中,當(dāng)自變量間存在著顯著相關(guān)時(shí),或者當(dāng)無(wú)法判斷各自變量間的相關(guān)性時(shí),應(yīng)比擬各自變量的偏回歸平方和〔i=1、2、…、m〕的大小來(lái)判斷各自變量對(duì)依變量影響的主次,但凡偏回歸平方和大的自變量,其對(duì)依變量的作用一定是主要的。對(duì)于【】建立的最優(yōu)二元線性回歸方程:已算得因?yàn)?,所以在上述二元線性回歸方程中,自變量〔眼肌面積〕對(duì)依變量〔瘦肉量〕的影響是主要的。*第二節(jié)復(fù)相關(guān)分析一、復(fù)相關(guān)的概念及意義研究一個(gè)變量與多個(gè)變量的線性相關(guān)稱為復(fù)相關(guān)分析〔analysisofmultiplecorrelation〕。從相關(guān)分析角度來(lái)說(shuō),復(fù)相關(guān)中的變量沒(méi)有依變量與自變量之分,但是在實(shí)際應(yīng)用中,復(fù)相關(guān)分析經(jīng)常與多元線性回歸分析聯(lián)系在一起,因此,復(fù)相關(guān)分析一般指依變量y與m個(gè)自變量x1、x2、…、xm的線性相關(guān)。在多元線性回歸分析中,如果m個(gè)自變量對(duì)依變量的回歸平方和SSR占依變量y的總平方和SSy的比率越大,那么說(shuō)明依變量y和m個(gè)自變量的線性聯(lián)系越密切,或者說(shuō)明依變量y與m個(gè)自變量的線性相關(guān)越密切,因此定義:〔9-24〕為y與x1、x2、…、xm的復(fù)相關(guān)指數(shù),簡(jiǎn)稱相關(guān)指數(shù)〔correlationindex〕。相關(guān)指數(shù)R2表示多元線性回歸方程的擬合度,或者說(shuō)表示用多元線回歸方程進(jìn)行預(yù)測(cè)的可靠程度。顯然,定義:〔9-25〕為依變量與個(gè)自變量x1、x2、…、xm的復(fù)相關(guān)系數(shù)〔multiplecorrelationcoefficient〕。復(fù)相關(guān)系數(shù)表示與x1、x2、…、xm的線性關(guān)系的密切程度,由于包含了x1、x2、…、xm的綜合線性影響,因此,y與x1、x2、…、xm的復(fù)相關(guān)系數(shù)也就相當(dāng)于y與的簡(jiǎn)單相關(guān)系數(shù),即〔9-26〕復(fù)相關(guān)系數(shù)的取值范圍為:。在自由度一定時(shí),R愈近于1,復(fù)相關(guān)愈密切;愈近于0,愈不密切。二、復(fù)相關(guān)系數(shù)的顯著性檢驗(yàn)復(fù)相關(guān)系數(shù)的顯著性檢驗(yàn)也就是對(duì)y與x1、x2、…、xm的線性關(guān)系的顯著性檢驗(yàn),因此,復(fù)相關(guān)系數(shù)的顯著性檢驗(yàn)與相應(yīng)的多元線性回歸關(guān)系的顯著性檢驗(yàn)或多元線性回歸方程的顯著性檢驗(yàn)是完全等價(jià)的。復(fù)相關(guān)系數(shù)R的顯著性檢驗(yàn)有兩種方法——F檢驗(yàn)法與查表法。〔一〕F檢驗(yàn)法設(shè)為y與x1、x2、…、xm的總體復(fù)相關(guān)系數(shù),F(xiàn)檢驗(yàn)的無(wú)效假設(shè)與備擇假設(shè)為:由下述F統(tǒng)計(jì)量檢驗(yàn)R的顯著性:〔9-27〕注意:因?yàn)椋搿?-27〕式得說(shuō)明利用〔9-27〕式計(jì)算的FR值實(shí)際上就是多元線性回歸關(guān)系顯著性檢驗(yàn)——F檢驗(yàn)計(jì)算的F值,也就是說(shuō)復(fù)相關(guān)系數(shù)的顯著性檢驗(yàn)與多元線性回歸關(guān)系的顯著性檢驗(yàn)是完全等價(jià)的?!捕巢楸矸▽?duì)于〔9-27〕式,由于在一定時(shí),給定顯著水平的F值一定,因此,可計(jì)算出相應(yīng)于顯著水平時(shí)的臨界R值:并將其列成表。因此復(fù)相關(guān)系數(shù)顯著性檢驗(yàn)可用簡(jiǎn)便的查表法進(jìn)行。由和變量的總個(gè)數(shù)M=m+1查附表8《r和R的顯著數(shù)值表》得臨界R值:、,將R與、比擬:對(duì)于【例9.1】,依變量〔瘦肉量〕與自變量〔眼肌面積〕、〔胴體長(zhǎng)〕、〔膘厚〕的復(fù)相關(guān)系數(shù)由于,〔F0.01〔3,50〕=4.20〕說(shuō)明R極顯著。注意,這里的FR值與三元線性回歸關(guān)系顯著性檢驗(yàn)的F值是相同的。假設(shè)用查表法,那么由與M=m+1=3+1=4查附表8得R0.01〔50,4〕=0.449,因?yàn)镽>R0.01〔50,4〕,P<0.01,故R為極顯著。顯著性檢驗(yàn)結(jié)果說(shuō)明,豬的瘦肉量與眼肌面積、胴體長(zhǎng)、膘厚間存在極顯著的復(fù)相關(guān)。由于篇幅的限制,附表8僅列出了M=3,4,5的臨界R值。假設(shè)M>5,那么采用F檢驗(yàn)或根據(jù)多元線性回歸關(guān)系顯著性檢驗(yàn)的結(jié)果來(lái)推斷復(fù)相關(guān)系數(shù)的顯著性。*第三節(jié)偏相關(guān)分析多個(gè)相關(guān)變量間的關(guān)系是較為復(fù)雜的,任何兩個(gè)變量間常常存在不同程度的簡(jiǎn)單相關(guān)關(guān)系,但是這種相關(guān)關(guān)系又包含有其他變量的影響。因此簡(jiǎn)單相關(guān)分析即直線相關(guān)分析沒(méi)有考慮其他變量對(duì)這兩個(gè)變量的影響,簡(jiǎn)單相關(guān)分析實(shí)際上并不能真實(shí)反映兩個(gè)相關(guān)變量間的相關(guān)關(guān)系。而只有消除了其他變量的影響之后,研究?jī)蓚€(gè)變量間的相關(guān)性,才能真實(shí)地反映這兩個(gè)變量間相關(guān)的性質(zhì)與密切程度。偏相關(guān)分析就是固定其他變量不變而研究某兩個(gè)變量間相關(guān)性的統(tǒng)計(jì)分析方法。一、偏相關(guān)系數(shù)的意義與計(jì)算〔一〕偏相關(guān)系數(shù)的意義在多個(gè)相關(guān)變量中,其他變量保持固定不變,所研究的兩個(gè)變量間的線性相關(guān)稱為偏相關(guān)〔partialcorrelation〕。用來(lái)表示兩個(gè)相關(guān)變量偏相關(guān)的性質(zhì)與程度的統(tǒng)計(jì)量叫偏相關(guān)系數(shù)〔partialcorrelationcoefficient〕。根據(jù)被固定的變量個(gè)數(shù)可將偏相關(guān)系數(shù)分級(jí),偏相關(guān)系數(shù)的級(jí)數(shù)等于被固定的變量的個(gè)數(shù)。當(dāng)研究2個(gè)相關(guān)變量x1、x2的關(guān)系時(shí),用直線相關(guān)系數(shù)r12表示x1與x2線性相關(guān)的性質(zhì)與程度。此時(shí)固定的變量個(gè)數(shù)為0,所以直線相關(guān)系數(shù)r12又叫做零級(jí)偏相關(guān)系數(shù)。當(dāng)研究3個(gè)相關(guān)變量x1、x2、x3的相關(guān)時(shí),我們把x3保持固定不變,x1與x2的相關(guān)系數(shù)稱為x1與x2的偏相關(guān)系數(shù),記為r12.3,類似地,還有偏相關(guān)系數(shù)r13.2、r23.1。這3個(gè)偏相關(guān)系數(shù)固定的變量個(gè)數(shù)為1,所以都叫做一級(jí)偏相關(guān)系數(shù)。當(dāng)研究4個(gè)相關(guān)變量x1、x2、x3、x4的相關(guān)時(shí),須將其中的2個(gè)變量固定不變,研究另外兩個(gè)變量間的相關(guān)。即此時(shí)只有二級(jí)偏相關(guān)系數(shù)才真實(shí)地反映兩個(gè)相關(guān)變量間線性相關(guān)的性質(zhì)與程度。二級(jí)偏相關(guān)系數(shù)共有個(gè):r12.34,r13.24,r14.23,r23.14,r24.13,r34.12。一般,當(dāng)研究m個(gè)相關(guān)變量x1、x2、、、…、xm的相關(guān)時(shí),只有將其中的m-2個(gè)變量保持固定不變,研究另外兩個(gè)變量的相關(guān)才能真實(shí)地反映這兩個(gè)相關(guān)變量間的相關(guān),即此時(shí)只有m-2級(jí)偏相關(guān)系數(shù)才真實(shí)地反映了這兩個(gè)相關(guān)變量間線性相關(guān)的性質(zhì)與程度。m-2級(jí)偏相關(guān)系數(shù)共有個(gè)。xi與xj的m-2級(jí)偏相關(guān)系數(shù)記為rij.(i,j=1,2,…,m,i≠j)。偏相關(guān)系數(shù)的取值范圍為[-1,1],即:-1≤rij.≤1。〔二〕偏相關(guān)系數(shù)的計(jì)算1、一級(jí)偏相關(guān)系數(shù)的計(jì)算設(shè)三個(gè)相關(guān)變量共有n組實(shí)測(cè)數(shù)據(jù):序號(hào)12n一級(jí)偏相關(guān)系數(shù)可由零級(jí)偏相關(guān)系數(shù)即直線相關(guān)系數(shù)計(jì)算,計(jì)算公式為:〔9-28〕2、二級(jí)偏相關(guān)系數(shù)的計(jì)算設(shè)四個(gè)相關(guān)變量共有n組實(shí)測(cè)數(shù)據(jù):序號(hào)12n二級(jí)偏相關(guān)系數(shù)可由一級(jí)偏相關(guān)系數(shù)計(jì)算,計(jì)算公式為:(9-29)3、m-2級(jí)偏相關(guān)系數(shù)的計(jì)算設(shè)m個(gè)相關(guān)變量共有n組觀測(cè)數(shù)據(jù):序號(hào)…1…2…n…m-2級(jí)偏相關(guān)系數(shù)的計(jì)算方法如下:首先計(jì)算簡(jiǎn)單相關(guān)系數(shù)即直線相關(guān)系數(shù):,〔(9-30)其中:,,,并由簡(jiǎn)單相關(guān)系數(shù)rij組成相關(guān)系數(shù)矩陣:〔9-31〕然后求相關(guān)系數(shù)矩陣的逆矩陣〔9-32〕那么相關(guān)變量的-2級(jí)偏相關(guān)系數(shù)的計(jì)算公式為:〔9-33〕二、偏相關(guān)系數(shù)的顯著性檢驗(yàn)〔一〕t檢驗(yàn)法設(shè)相關(guān)變量的總體偏相關(guān)系數(shù)為,那么對(duì)偏相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)的無(wú)效假設(shè)與備擇假設(shè)為:,檢驗(yàn)公式為:〔9-34〕〔9-34〕式中,為偏相關(guān)系數(shù)標(biāo)準(zhǔn)誤,;n為觀測(cè)數(shù)據(jù)組數(shù),m為相關(guān)變量總個(gè)數(shù)。注意,m個(gè)相關(guān)變量的偏相關(guān)分析中的m指相關(guān)變量的總個(gè)數(shù);m元線性回歸分析中的m指自變量的個(gè)數(shù);這兩種分析方法中的m所表達(dá)的意義是不同的?!捕巢楸矸ㄓ杉白兞總€(gè)數(shù)2查附表8《r和R顯著數(shù)值表》得r0.05(n-m,2),r0.01(n-m,2)。將偏相關(guān)系數(shù)的絕對(duì)值r0.05(n-m,2)、r0.01(n-m,2)進(jìn)行比擬,即可作出統(tǒng)計(jì)推斷。【】對(duì)【例9.1】資料進(jìn)行偏相關(guān)分析。注意,此時(shí)相關(guān)變量總個(gè)數(shù)m=4。首先由【例9.1】的計(jì)算變量間的簡(jiǎn)單相關(guān)系數(shù):相關(guān)系數(shù)矩陣R為:然后求得相關(guān)系數(shù)矩陣的逆矩陣C為:因?yàn)槲覀冃枰芯康氖鞘萑饬俊瞴〕與眼肌面積〔x1〕、胴體長(zhǎng)〔x2〕、膘厚〔x3〕的二級(jí)偏相關(guān)系數(shù),由〔9-33〕式可以算得:現(xiàn)在對(duì)上述三個(gè)二級(jí)偏相關(guān)系數(shù)進(jìn)行t檢驗(yàn):由查值表得t0.05(50)=2.008、t0.01(50)=2.678,因?yàn)椋?所以為極顯著;而因此,都是不顯著的。,而為極顯著,都是不顯著的,這與t檢驗(yàn)結(jié)論一致。顯著性檢驗(yàn)結(jié)果說(shuō)明,瘦肉量〔y〕與眼肌面積〔x1〕呈極顯著的正的偏相關(guān),而瘦肉量〔y〕與胴體長(zhǎng)〔x2〕、膘厚〔x3〕的偏相關(guān)均為不顯著。從以上分析中,我們看到簡(jiǎn)單相關(guān)系數(shù),在數(shù)值上分別與相應(yīng)的二級(jí)偏相關(guān)系是有差異的。經(jīng)顯著性檢驗(yàn),都是極顯著的,是顯著的,而這與對(duì)應(yīng)的二級(jí)偏相關(guān)系數(shù)的顯著性也是不完全一致的。造成偏相關(guān)系數(shù)與簡(jiǎn)單相關(guān)系數(shù)在數(shù)值上相差的原因就在于各自變量間的相關(guān)性。在多變量資料中,偏相關(guān)系數(shù)與簡(jiǎn)單相關(guān)系數(shù)在數(shù)值上可以相差很大,甚至有時(shí)連符號(hào)都可能相反。只有偏相關(guān)分析才能正確地表示兩個(gè)變量間的線性相關(guān)的性質(zhì)和程度,才真實(shí)反映了兩變量間的本質(zhì)聯(lián)系。而簡(jiǎn)單相關(guān)分析那么可能由于其他變量的影響,反映的兩個(gè)變量間的關(guān)系只是非本質(zhì)的外表聯(lián)系,所以是不可靠的。因此,對(duì)多變量資料進(jìn)行相關(guān)分析時(shí),應(yīng)進(jìn)行偏相關(guān)分析。*第四節(jié)多項(xiàng)式回歸多項(xiàng)式回歸概念研究一個(gè)依變量與一個(gè)或多個(gè)自變量間多項(xiàng)式的回歸分析方法,稱為多項(xiàng)式回歸〔polynomialregression〕。如果自變量只有一個(gè)時(shí),稱為一元多項(xiàng)式回歸;如果自變量有多個(gè)時(shí),稱為多元多項(xiàng)式回歸。一元m次多項(xiàng)式回歸方程為:〔9-35〕二元二次多項(xiàng)式回歸方程為:〔9-36〕在一元回歸分析中,如果依變量與自變量的關(guān)系為非線性的,但是又找不到適當(dāng)?shù)暮瘮?shù)曲線來(lái)擬合,那么可以采用一元多項(xiàng)式回歸。多項(xiàng)式回歸的最大優(yōu)點(diǎn)就是可以通過(guò)增加x的高次項(xiàng)對(duì)實(shí)測(cè)點(diǎn)進(jìn)行逼近,直至滿意為止。事實(shí)上,多項(xiàng)式回歸可以處理相當(dāng)一類非線性問(wèn)題,它在回歸分析中占有重要的地位,因?yàn)槿我缓瘮?shù)都可以分段用多項(xiàng)式來(lái)逼近。因此,在通常的實(shí)際問(wèn)題中,不管依變量與其他自變量的關(guān)系如何,我們總可以用多項(xiàng)式回歸來(lái)進(jìn)行分析。多項(xiàng)式回歸分析的一般方法多項(xiàng)式回歸問(wèn)題可以通過(guò)變量轉(zhuǎn)換化為多元線性回歸問(wèn)題來(lái)解決。對(duì)于一元m次多項(xiàng)式回歸方程〔9-35〕,令、=、…、=,那么〔9-35〕就轉(zhuǎn)化為m元線性回歸方程因此用本章第一節(jié)的方法就可解決多項(xiàng)式回歸問(wèn)題。需要指出的是,在多項(xiàng)式回歸分析中,檢驗(yàn)回歸系數(shù)bi是否顯著,實(shí)質(zhì)上就是判斷自變量x的i次方項(xiàng)xi對(duì)依變量y的影響是否顯著。對(duì)于二元二次多項(xiàng)式回歸方程〔9-36〕,令,那么〔9-36〕就轉(zhuǎn)化為五元線性回歸方程但隨著自變量個(gè)數(shù)的增加,多元多項(xiàng)式回歸分析的計(jì)算量急劇增加。多元多項(xiàng)式回歸屬于多元非線性回歸問(wèn)題,在這里不作介紹。在多項(xiàng)式回歸中較為常用的是一元二次多項(xiàng)式回歸和一元三次多項(xiàng)式回歸,下面結(jié)合一實(shí)例對(duì)一元二次多項(xiàng)式回歸作詳細(xì)介紹。一元二次多項(xiàng)式回歸分析【】給動(dòng)物口服某種藥物A1000mg,每間隔1小時(shí)測(cè)定血藥濃度〔g/ml〕,得到表9-5的數(shù)據(jù)〔血藥濃度為5頭供試動(dòng)物的平均值〕。試建立血藥濃度〔依變量y〕對(duì)服藥時(shí)間〔自變量x〕的回歸方程。表9-5血藥濃度與服藥時(shí)間測(cè)定結(jié)果表血藥濃度y(g/ml)y-〔一〕根據(jù)表9-5的數(shù)據(jù)資料繪制x與y的散點(diǎn)圖(見(jiàn)圖9-1)。由散點(diǎn)圖我們看到:血藥濃度最大值出現(xiàn)在服藥后5小時(shí),在5小時(shí)之前血藥濃度隨時(shí)間的增加而增加,在5小時(shí)之后隨著時(shí)間的增加而減少,散點(diǎn)圖呈拋物線形狀,因此我們可以選用一元二次多項(xiàng)式來(lái)描述血藥濃度與服藥時(shí)間的關(guān)系,即進(jìn)行一元二次多項(xiàng)式回歸或拋物線回歸?!捕尺M(jìn)行變量轉(zhuǎn)換設(shè)一元二次多項(xiàng)式回歸方程為:圖9-1表9-5資料的散點(diǎn)圖圖9-1表9-5資料的散點(diǎn)圖令、,那么得二元線性回歸方程〔三〕進(jìn)行二元線性回歸分析先計(jì)算得:再計(jì)算得:于是得到關(guān)于求出上述正規(guī)方程組系數(shù)矩陣的逆矩陣為:關(guān)于即:而于是得到二元線性回歸方程為:現(xiàn)在對(duì)二元線性回歸方程或二元線性回歸關(guān)系進(jìn)行顯著性檢驗(yàn)。列出方差分析表,進(jìn)行F檢驗(yàn)。表9-6二元線性回歸關(guān)系方差分析表變異來(lái)源SSdfMSF回歸2511.750**離回歸6總變異8由查F值表得,因?yàn)镕>F(2,6),P<0.01,說(shuō)明二元線性回歸關(guān)系是極顯著的。偏回歸系數(shù)的顯著檢驗(yàn),應(yīng)用F檢驗(yàn)法:由查F值表得,因?yàn)椤?,說(shuō)明偏回歸系數(shù)都是極顯著的?!菜摹辰⒁辉味囗?xiàng)式回歸方程將復(fù)原為,復(fù)原為x2,即得一元二次多項(xiàng)式回歸方程為:〔五〕計(jì)算相關(guān)指數(shù)R2因?yàn)?,,相關(guān)指數(shù)R2為:說(shuō)明y對(duì)x的一元二次多項(xiàng)式回歸方程的擬合度是比擬高的,或者說(shuō)該回歸方程估測(cè)的可靠程度是比擬高的。*第五節(jié)通徑分析在研究多個(gè)相關(guān)變量間的線性關(guān)系時(shí),除了可以采用多元線性回歸分析和偏相關(guān)分析,還可以采用通徑分析〔pathanalysis〕。由S·Wright(1921)提出,并經(jīng)遺傳育種工作者不斷完善和改良的通徑分析,在研究多個(gè)相關(guān)變量間關(guān)系中具有精確、直觀等優(yōu)點(diǎn),在遺傳育種工作中廣泛應(yīng)用于研究遺傳相關(guān)、近交系數(shù)、親緣系數(shù)、遺傳力,確定綜合選擇指數(shù)、復(fù)合育種值,剖分性狀間的相關(guān)系數(shù)為直接作用與間接作用的代數(shù)和等等。一、通徑系數(shù)〔pathcoefficient〕與決定系數(shù)〔一〕通徑、相關(guān)線與通徑圖為直觀起見(jiàn),先討論一個(gè)依變量、兩個(gè)自變量的情況。設(shè)三個(gè)相關(guān)變量與、間存在線性關(guān)系,為依變量〔結(jié)果〕,、為自變量〔原因〕且彼此相關(guān),回歸方程為:〔9-37〕或〔9-38〕其中為剩余項(xiàng)??捎脠D9-2來(lái)表示三個(gè)相關(guān)變量間的關(guān)系。在圖9-2中,單箭頭線“〞表示變量間存在著因果關(guān)系,方向?yàn)橛稍虻浇Y(jié)果,稱為通徑〔path〕,也稱為直接通徑。雙箭頭線“〞表示變量間存在著平行關(guān)系〔互為因果〕,稱為相關(guān)線〔correlationline〕,一條相關(guān)線相當(dāng)于兩條尾端相聯(lián)的通徑。將包含兩條或兩條以上通徑、也圖9-2自變量、與可以包含一條相關(guān)線的鏈稱為間接通依變量的通徑圖徑。如圖9-2中,→為通徑或直接通徑,為間接通徑。這種用來(lái)表示相關(guān)變量間因果關(guān)系與平行關(guān)系的箭形圖稱為通徑圖〔pathchart〕。〔二〕通徑系數(shù)通徑圖直觀、形象地表達(dá)了相關(guān)變量間的關(guān)系,僅定性地表達(dá)還不夠,還須進(jìn)一步用數(shù)量表示因果關(guān)系中原因?qū)Y(jié)果影響的相對(duì)重要程度與性質(zhì)、平行關(guān)系中變量間相關(guān)的相對(duì)重要程度與性質(zhì),也就是必須用數(shù)量表示“通徑〞與“相關(guān)線〞的相對(duì)重要程度與性質(zhì)。表示“通徑〞相對(duì)重要程度與性質(zhì)的數(shù)量叫通徑系數(shù)。表示“相關(guān)線〞相對(duì)重要程度與性質(zhì)的數(shù)量叫相關(guān)系數(shù)。相關(guān)系數(shù)已在第八章進(jìn)行了詳細(xì)介紹。下面介紹通徑系數(shù)的數(shù)學(xué)表達(dá)式。設(shè)依變量與自變量、間存在線性關(guān)系,回歸方程為:或其中為剩余項(xiàng):,且;、彼此相關(guān)。表示這三個(gè)相關(guān)變量間關(guān)系的通徑圖見(jiàn)圖9-2。由于偏回歸系數(shù)、是帶有單位的,一般不能直接由、比擬自變量、〔原因〕對(duì)依變量〔結(jié)果〕影響的重要程度的大小。為了能直接比擬各自變量對(duì)依變量影響重要程度的大小,現(xiàn)將、、三個(gè)變量及剩余項(xiàng)進(jìn)行標(biāo)準(zhǔn)化變換,使、、及變?yōu)椴粠挝坏南鄬?duì)數(shù)。由可得〔9-39〕將上述兩式等號(hào)左右兩端相減得〔9-40〕再將〔9-40〕式兩端同除以的標(biāo)準(zhǔn)差,并作相應(yīng)的恒等變形,得:〔9-41〕式中:、、分別為、與的標(biāo)準(zhǔn)差。、為變量、標(biāo)準(zhǔn)化之后的偏回歸系數(shù),分別表示x1、x2對(duì)y影響的相對(duì)重要程度和性質(zhì);表示剩余項(xiàng)e對(duì)y影響的相對(duì)重要程度和性質(zhì);、和就是x1、x2和e到y(tǒng)的通徑系數(shù)的數(shù)學(xué)表達(dá)式。假設(shè)把x1、x2和e到y(tǒng)的通徑系數(shù)記為P0.1、P0.2、P0.e,那么有:,,一般,假設(shè)依變量與自變量、、間存在線性關(guān)系,回歸方程為:〔9-42〕或〔9-43〕當(dāng)自變量?jī)蓛上嚓P(guān)時(shí),其通徑圖如圖9-3所示。那么原因與剩余項(xiàng)到結(jié)果的通徑系數(shù)為:,圖9-3自變量、、與依變量的通徑圖〔三〕決定系數(shù)通徑系數(shù)的平方稱為決定系數(shù)〔determinationcoefficient〕。決定系數(shù)表示原因〔自變量〕或誤差對(duì)結(jié)果〔依變量〕的相對(duì)決定程度。對(duì)于情況,原因、和剩余項(xiàng)對(duì)結(jié)果的決定系數(shù)分別記為、、,那么:對(duì)于,原因〔〕和剩余項(xiàng)e對(duì)結(jié)果的決定系數(shù)記為d0.i(i=1,2,…,m)和d0.e。那么,二、通徑系數(shù)的性質(zhì)可以證明通徑系數(shù)有如下四個(gè)重要性質(zhì)。性質(zhì)1如果相關(guān)變量、、間存在線性關(guān)系,其中為依變量〔結(jié)果〕、和為自變量〔原因〕,且和彼此相關(guān),回歸方程為或通徑圖如圖9-2所示。那么:(9-44)(9-45)對(duì)于〔9-45〕式可以進(jìn)行如下通徑分析:由到有兩條通徑,第一條是直接通徑→,直接通徑系數(shù)p0.1表示對(duì)的直接作用;第二條是間接通徑→,并定義間接通徑系數(shù)等于組成該間接通徑的通徑與相關(guān)線系數(shù)的乘積:r12p0.2,那么間接通徑系數(shù)表示通過(guò)與其相關(guān)的對(duì)的間接作用。因此,與的相關(guān)系數(shù)剖分為對(duì)的直接作用與通過(guò)對(duì)的間接作用的代數(shù)和,即與y的相關(guān)系數(shù)等于與間的直接通徑系數(shù)與間接通徑系數(shù)之和。對(duì)于〔9-45〕式也可以進(jìn)行同樣的通徑分析:由到有兩條通徑,第一條是直接通徑→,第二條是間接通徑→。與的相關(guān)系數(shù)剖分為對(duì)的直接作用與通過(guò)對(duì)的間接作用的代數(shù)和,即,與的相關(guān)系數(shù)等于與的直接通徑系數(shù)與間接通徑系數(shù)之和。對(duì)于〔9-44〕與〔9-45〕式,可以改寫(xiě)為:〔9-46〕〔9-46〕式為關(guān)于通徑系數(shù)的正規(guī)方程組。如寫(xiě)成矩陣形式為:〔9-47〕如果相關(guān)系數(shù)已計(jì)算出,那么可以由〔9-46〕式或〔9-47〕式求出通徑系數(shù)和。一般,設(shè)相關(guān)變量與間存在線性關(guān)系,回歸方程為:或其中,為依變量,、、…、為自變量,且兩兩相關(guān),通徑圖如圖9-3所示。那么:〔9-48〕〔9-48〕式說(shuō)明,〔〕與的相關(guān)系數(shù)剖分為對(duì)的直接作用與間接作用的代數(shù)和,即與的相關(guān)系數(shù)等于到的直接通徑系數(shù)與通過(guò)與其相關(guān)的各個(gè)對(duì)的所有間接通徑系數(shù)之和。對(duì)于〔9-48〕式寫(xiě)成關(guān)于各通徑系數(shù)、、、的正規(guī)方程組形式為:(9-49)〔9-49〕式的矩陣形式為:〔9-50〕如果相關(guān)系數(shù)、〔已經(jīng)算出,那么可以由〔9-49〕式或〔9-50〕式求通徑系數(shù)。性質(zhì)1有兩個(gè)主要用途:一是利用相關(guān)系數(shù)求通徑系數(shù);二是將原因〔自變量〕與結(jié)果〔依變量〕的相關(guān)系數(shù)剖分為直接通徑系數(shù)與間接通徑系數(shù)的代數(shù)和,從而進(jìn)行原因?qū)Y(jié)果的直接作用、間接作用的分析。性質(zhì)2如果依變量與自變量、存在線性關(guān)系,且、彼此相關(guān)〔見(jiàn)圖9-2〕,那么原因、與剩余項(xiàng)對(duì)結(jié)果的決定系數(shù)、、與到的通徑系數(shù)、到的通徑系數(shù)同、間的相關(guān)系數(shù)乘積的兩倍之和為1,即:〔9-51〕在〔9-51〕式中,表示兩個(gè)相關(guān)原因、共同對(duì)結(jié)果的相對(duì)決定程度,稱為相關(guān)原因、共同對(duì)結(jié)果的決定系數(shù),記作,即:。因此,〔9-51〕式可以改寫(xiě)為:〔9-52〕即當(dāng)一個(gè)結(jié)果的兩個(gè)原因相關(guān)時(shí),兩個(gè)原因?qū)Y(jié)果的決定系數(shù)加上相關(guān)原因共同對(duì)結(jié)果的決定系數(shù)與剩余項(xiàng)對(duì)結(jié)果的決定系數(shù)之和等于1。根據(jù)〔9-52〕式,可以計(jì)算出剩余項(xiàng)對(duì)結(jié)果的決定系數(shù)與通徑系數(shù):〔9-53〕〔9-54〕一般,如果依變量與自變量、存在線性關(guān)系,且自變量?jī)蓛上嚓P(guān)〔見(jiàn)圖9-3〕,那么原因、分別對(duì)結(jié)果的決定系數(shù)與每?jī)蓚€(gè)相關(guān)原因共同對(duì)結(jié)果的決定系數(shù)以及剩余項(xiàng)對(duì)結(jié)果的決定系數(shù)之和為1,即:或簡(jiǎn)寫(xiě)為:〔9-55〕根據(jù)〔9-55〕式,可以計(jì)算出剩余項(xiàng)對(duì)結(jié)果的決定系數(shù)與通徑系數(shù):〔9-56〕〔9-57〕根據(jù)〔9-56〕式的計(jì)算結(jié)果,如果的絕對(duì)值較大,說(shuō)明可能還有對(duì)結(jié)果影響較大的原因未被考慮到,這在通徑分析時(shí)應(yīng)予以注意。性質(zhì)2的主要用途是利用各決定系數(shù)絕對(duì)值的大小來(lái)分析各個(gè)原因及兩兩相關(guān)原因?qū)Y(jié)果的相對(duì)決定程度,這是通徑分析中進(jìn)行決定程度分析的依據(jù)。同時(shí)性質(zhì)2也為計(jì)算、提供了簡(jiǎn)便方法。性質(zhì)3如果依變量與自變量、間存在線性關(guān)系,且自變量?jī)蓛砷g彼此相關(guān)〔見(jiàn)圖9-3〕,回歸方程為:或那么〔9-58〕簡(jiǎn)寫(xiě)為:并且〔9-59〕〔9-60〕(9-61)〔9-58〕、〔9-59〕、〔9-60〕、〔9-61〕式中R2為依變量與自變量、的相關(guān)指數(shù),也為標(biāo)準(zhǔn)化變量的回歸平方和;〔9-60〕、〔9-61〕式中的的d0.e為標(biāo)準(zhǔn)化變量的離回歸平方和?!?-58〕式中的、、可以看成為各原因、分別對(duì)結(jié)果y的總決定程度,這是因?yàn)楦鶕?jù)〔9-48〕式及兩相關(guān)原因共同對(duì)結(jié)果的決定系數(shù)的計(jì)算公式,可以導(dǎo)出如下結(jié)果:(9-62)根據(jù)〔9-58〕式,將、、分別稱為自變量、對(duì)回歸方程估測(cè)可靠程度的總奉獻(xiàn)。性質(zhì)3的主要用途為在通徑分析中進(jìn)行各原因?qū)貧w方程估測(cè)可靠程度的總奉獻(xiàn)分析。性質(zhì)4如果結(jié)果與結(jié)果分別與、間存在線性關(guān)系,即、是影響與的m個(gè)公共原因,且、兩兩相關(guān),〔見(jiàn)圖9-4〕。那么+〔9-63〕圖9-4x1、x2、…、xm與y1和y2的通徑圖圖9-5x1、x2與y1、y2的通徑圖性質(zhì)4是通徑分析中最重要的性質(zhì),利用它,可以計(jì)算任意兩個(gè)結(jié)果間的相關(guān)系數(shù)。性質(zhì)4在動(dòng)物遺傳育種的理論研究上有著十分重要的應(yīng)用。例如,結(jié)果和結(jié)果分別與、存在線性關(guān)系,、是影響與的兩個(gè)公共原因,且與相關(guān)〔見(jiàn)圖9-5〕,那么,結(jié)果與結(jié)果的相關(guān)系數(shù)為:三、通徑分析的顯著性檢驗(yàn)通徑分析是標(biāo)準(zhǔn)化變量的多元線性回歸分析。通徑分析的顯著性檢驗(yàn)包括回歸方程顯著性檢驗(yàn)、通徑系數(shù)顯著性檢驗(yàn)、通徑系數(shù)差異顯著性檢驗(yàn)、兩次通徑分析相應(yīng)通徑系數(shù)差異顯著性檢驗(yàn)四個(gè)內(nèi)容。后兩種檢驗(yàn)在一般的多元線性回歸分析中通常無(wú)法進(jìn)行,因?yàn)槠貧w系數(shù)所帶的單位通常不相同,后兩種檢驗(yàn)只能在通徑分析中進(jìn)行,這是通徑分析的優(yōu)點(diǎn)之一。設(shè)依變量與自變量、間存在線性關(guān)系,自變量?jī)蓛上嚓P(guān)。與、共有n組實(shí)際觀測(cè)數(shù)據(jù)。那么元線性回歸方程為:〔9-64〕現(xiàn)對(duì)、、分別進(jìn)行標(biāo)準(zhǔn)化變換:,〔〕其中。注意,為了進(jìn)行顯著性檢驗(yàn)簡(jiǎn)便易行,這里我們用作分母進(jìn)行標(biāo)準(zhǔn)化變換,與前面用作分母進(jìn)行標(biāo)準(zhǔn)化變換有所不同。兩種標(biāo)準(zhǔn)化變換所得的通徑系數(shù),即標(biāo)準(zhǔn)化回歸變量的偏回歸系數(shù)數(shù)值相同。標(biāo)準(zhǔn)化變量的m元線性回歸方程為:〔9-65〕〔9-65〕式中,〔為標(biāo)準(zhǔn)化變量的偏回歸系數(shù)即通徑系數(shù)。令,那么式〔9-65〕可改寫(xiě)為:〔9-66〕〔9-66〕式也為標(biāo)準(zhǔn)化變量的m元線性回歸方程。關(guān)于通徑系數(shù)的正規(guī)方程組為:〔一〕回歸方程顯著性檢驗(yàn)由于進(jìn)行通徑分析的前提是與、間存在顯著的線性關(guān)系,因此需要對(duì)回歸方程即式〔9-66〕進(jìn)行顯著性檢驗(yàn)。如果經(jīng)顯著性檢驗(yàn),回歸方程不顯著,那么不必繼續(xù)進(jìn)行通徑分析。采用F檢驗(yàn)法檢驗(yàn)回歸方程的顯著性。對(duì)于標(biāo)準(zhǔn)化變量的回歸方程〔9-66〕式,總平方和可以剖分為回歸平方和與離回歸平方和兩局部,即:〔9-67〕總自由度可剖分為回歸自由度與離回歸自由度兩局部,即:〔9-68〕可以證明在這里所進(jìn)行的標(biāo)準(zhǔn)化變化下:,,,由統(tǒng)計(jì)量(9-69)或〔9-70〕檢驗(yàn)回歸方程〔9-66〕是否顯著。〔二〕通徑系數(shù)的顯著性檢驗(yàn)1、F檢驗(yàn)由統(tǒng)計(jì)量()(9-71)檢驗(yàn)通徑系數(shù)〔是否顯著。其中為相關(guān)系數(shù)矩陣R的逆矩陣R-1=C中主對(duì)角線上的元素。2、t檢驗(yàn)由統(tǒng)計(jì)量〔9-72〕檢驗(yàn)通徑系數(shù)是否顯著。其中為通徑系數(shù)標(biāo)準(zhǔn)誤,其計(jì)算公式為:〔9-73〕注意,這里介紹的F檢驗(yàn)與t檢驗(yàn)等價(jià),在實(shí)際進(jìn)行通徑系數(shù)顯著性檢驗(yàn)時(shí),只須任選其一?!踩惩◤较禂?shù)差異顯著性檢驗(yàn)由于通徑系數(shù)為不帶單位的相對(duì)數(shù),因此可以進(jìn)行一次通徑分析中的兩個(gè)通徑系數(shù)差異顯著性檢驗(yàn)。1、F檢驗(yàn)由統(tǒng)計(jì)量〔9-74〕〔檢驗(yàn)通徑系數(shù)與之間的差異是否顯著。其中為相關(guān)系數(shù)矩陣R的逆矩陣的元素。2、t檢驗(yàn)由統(tǒng)計(jì)量〔9-75〕〔檢驗(yàn)通徑系數(shù)與間的差異是否顯著。其中稱為通徑系數(shù)差異標(biāo)準(zhǔn)誤,其計(jì)算公式為:(9-76)注意,這里介紹的F檢驗(yàn)與t檢驗(yàn)也是等價(jià)的。〔四〕兩次通徑分析相應(yīng)通徑系數(shù)差異顯著性檢驗(yàn)設(shè)兩次通徑分析有關(guān)數(shù)據(jù)與結(jié)果如下:自變量個(gè)數(shù)觀測(cè)值組數(shù)通徑系數(shù)離回歸平方和離回歸均方高斯乘數(shù)第一次通徑分析第二次通徑分析首先進(jìn)行兩次通徑分析剩余項(xiàng)方差齊性檢驗(yàn),這里應(yīng)用兩尾F檢驗(yàn)。由統(tǒng)計(jì)量〔9-77〕檢驗(yàn)差異是否顯著。注意在式〔9-77〕中,應(yīng)將較大的均方放在分子。如果差異不顯著,那么再用F檢驗(yàn)或與其等價(jià)的t檢驗(yàn)進(jìn)行兩次通徑分析相應(yīng)通徑系數(shù)差異顯著性檢驗(yàn)。1、F檢驗(yàn)由統(tǒng)計(jì)量(9-78)檢驗(yàn)兩次通徑分析相應(yīng)通徑系數(shù)與差異是否顯著。2、t檢驗(yàn)由統(tǒng)計(jì)量〔9-79)檢驗(yàn)兩次通徑分析相應(yīng)通徑系數(shù)與差異是否顯著。其中為兩次通徑分析的通徑系數(shù)差異標(biāo)準(zhǔn)誤,其計(jì)算公式為:(9-80)四、實(shí)例現(xiàn)結(jié)合一實(shí)例介紹通徑分析的根本步驟?!纠?.4】奶牛第一胎產(chǎn)奶量是奶牛的重要育種目標(biāo),由于奶牛的一個(gè)產(chǎn)奶周期較長(zhǎng)〔305天〕,如果能從奶牛的初期性狀中找到影響奶牛305天產(chǎn)奶量的主要因素,這對(duì)保證早期選種的準(zhǔn)確性,加速奶牛的育種工作有其重要意義。某奶牛場(chǎng)觀察記載了273頭黑白花奶牛的一胎305天產(chǎn)奶量〔〕,最高日產(chǎn)天數(shù)〔〕,最高月產(chǎn)〔〕,90天產(chǎn)奶量〔〕,最高日產(chǎn)〔〕5個(gè)性狀。試進(jìn)行通徑分析。〔一〕計(jì)算性狀間的相關(guān)系數(shù)由273組實(shí)測(cè)數(shù)據(jù)〔略〕計(jì)算得性狀間相關(guān)系數(shù)并進(jìn)行顯著性檢驗(yàn),如表9-7所示。表9-75個(gè)性狀間的相關(guān)系數(shù)最高月產(chǎn)90天產(chǎn)奶量最高日產(chǎn)一胎305天產(chǎn)奶量最高日產(chǎn)天數(shù)0.1320*0.2026**最高月產(chǎn)0.9573**0.9274**0.7644**90天產(chǎn)奶量0.9239**0.7981**最高日產(chǎn)0.7561**〔二〕計(jì)算各通徑系數(shù)關(guān)于通徑系數(shù)、、、的正規(guī)方程組為:寫(xiě)成矩陣形式,為:求得正規(guī)方程組系數(shù)矩陣即相關(guān)系數(shù)矩陣R的逆矩陣如下:于是求得各通徑系數(shù)為:即:,,,〔三〕顯著性檢驗(yàn)1、線性關(guān)系顯著性檢驗(yàn)——F檢驗(yàn)因?yàn)槎砸驗(yàn)镕=130.0417>F0.01(4,268)=3.389,P<0.01,說(shuō)明一胎305天產(chǎn)奶量y與最高日產(chǎn)天數(shù)、

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論