




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第四章相關(guān)分析和回歸分析10/16/20231相關(guān)分析和回歸分析第一節(jié)
地理要素間的相關(guān)分析第二節(jié)地理要素間的回歸分析10/16/20232一相關(guān)關(guān)系與函數(shù)關(guān)系二地理要素的相關(guān)類型三相關(guān)程度的程度方法及顯著性檢驗
第一節(jié)地理要素間的相關(guān)分析10/16/20233一相關(guān)關(guān)系與函數(shù)關(guān)系1.確定性的函數(shù)關(guān)系
。
2.不確定性的統(tǒng)計關(guān)系—相關(guān)關(guān)系
3.相關(guān)關(guān)系與函數(shù)關(guān)系的共同點,區(qū)別與聯(lián)系(1)共同點:都是反映現(xiàn)象變量之間存在的相互依存關(guān)系。(2)區(qū)別:相關(guān)關(guān)系是一種不嚴格的依存關(guān)系,函數(shù)關(guān)系是嚴格確定的依存關(guān)系。(3)聯(lián)系:由于觀察值和測量誤差的存在,函數(shù)關(guān)系在現(xiàn)實生活中往往通過相關(guān)關(guān)系表現(xiàn)出來;而相關(guān)關(guān)系又往往要使用函數(shù)關(guān)系的形式來模擬描述。10/16/20234為了研究父親與成年兒子身高之間的關(guān)系,卡爾.皮爾遜測量了1078對父子的身高。把1078對數(shù)字表示在坐標上,如圖。它的形狀象一塊橄欖狀的云,中間的點密集,邊沿的點稀少,其主要部分是一個橢圓。10/16/20235★正相關(guān)★負相關(guān)★完全正相關(guān)★完全負相關(guān)★零相關(guān)
10/16/20236二地理要素間的相關(guān)類型曲線相關(guān)(非線性相關(guān))按變量數(shù)量兩個變量兩個以上變量直線相關(guān)(線性相關(guān))復相關(guān)偏相關(guān)按質(zhì)量等級相關(guān)(順序相關(guān))品質(zhì)相關(guān)10/16/20237
三相關(guān)程度的度量及顯著性檢驗由于地理相關(guān)類型各不相同,因此測度的方法也不同。(一)線性相關(guān)程度的測度所謂相關(guān)程度,就是研究它們之間的相互關(guān)系是否密切。所謂相關(guān)方向,又可以分兩種,即正相關(guān)和負相關(guān)。正相關(guān)——變量同方向變化,同增同減負相關(guān)——變量反方向變化,一增一減不相關(guān)用來測度直線相關(guān)程度和方向的指標就是相關(guān)系數(shù)。10/16/20238當兩個變量之間為直線相關(guān)時,可以利用皮爾遜相關(guān)系數(shù)表示變量之間的相關(guān)關(guān)系及程度
設(shè)表示變量,的取值,為兩個變量的算術(shù)平均數(shù),,為這兩個變量的標準差,為自變量數(shù)列與因變量數(shù)列的協(xié)方差,為相關(guān)系數(shù),則直線相關(guān)系數(shù)定義為:1.簡單相關(guān)系數(shù)公式及檢驗(1)簡單相關(guān)系數(shù)公式10/16/2023910/16/20231010/16/20231110/16/202312(2)相關(guān)系數(shù)的性質(zhì)●相關(guān)系數(shù)的分布范圍,介于-1和+1之間●當相關(guān)系數(shù)為正值時,表示兩個要素(或變數(shù))之間呈正相關(guān),相關(guān)系數(shù)為負值時,表示兩個要素(或變數(shù))之間為負相關(guān);●相關(guān)系數(shù)的絕對值越大。表示兩個要素間相關(guān)程度越密切。當r=+1時,為完全正相關(guān)。R=-1時,為完全負相關(guān);r=0則完全無直線相關(guān),可能存在其他形式的相關(guān)關(guān)系。10/16/202313(3)相關(guān)程度的判斷當時,X與Y高度相關(guān)當時,X與Y顯著相關(guān)當時,X與Y低度相關(guān)當時,X與Y微相關(guān)或不相關(guān)10/16/202314例某企業(yè)生產(chǎn)某種產(chǎn)品的月產(chǎn)量和生產(chǎn)費用的統(tǒng)計資料如表,試判斷月產(chǎn)量與生產(chǎn)費用之間存在怎樣相關(guān)關(guān)系,相關(guān)程度為多少。表月產(chǎn)量和生產(chǎn)費用的統(tǒng)計資料(4)簡單相關(guān)系數(shù)的應(yīng)用10/16/202315相關(guān)系數(shù)數(shù)據(jù)計算表10/16/202316表明X與Y之間存在線性相關(guān)關(guān)系,且是高度相關(guān)。10/16/202317●和都是相互對稱的隨機變量●
線性相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系●
樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計值,由于抽樣波動,樣本相關(guān)系數(shù)是個隨機變量,其統(tǒng)計顯著性有待檢驗●
相關(guān)系數(shù)只能反映線性相關(guān)程度,不能確定因果關(guān)系,不能說明相關(guān)關(guān)系具體接近哪條直線
使用簡單相關(guān)系數(shù)時的注意事項10/16/202318相關(guān)系數(shù)是根據(jù)要素之間的樣本值計算出來的,它隨著樣本數(shù)的多少或取樣方式的不同而不同,因此它只是要素之間的樣本相關(guān)系數(shù),只有通過檢驗,才能知道它的可信度。
(5)相關(guān)系數(shù)的顯著性檢驗為什么?
一般情況下,相關(guān)系數(shù)的檢驗,是在給定的置信水平下,通過查相關(guān)系數(shù)檢驗的臨界值表來完成的。
10/16/202319檢驗相關(guān)系數(shù)ρ=0的臨界值(ra)表p{|r|>ra}=α
f值稱為自由度,其數(shù)值為f=n-2,這里n為樣本數(shù)
a代表不同的顯著性水平
表內(nèi)的數(shù)值代表不同的置信水平下相關(guān)系數(shù)ρ=0的臨界值,即ra
公式p={|r|>ra}=a的意思是當所計算的相關(guān)系數(shù)r的絕對值大于在a水平下的臨界值ra時,兩要素不相關(guān)(即ρ=0)的可能性只有a。
10/16/202320相關(guān)系數(shù)r的具體檢驗方法步驟如下:(1)計算相關(guān)系數(shù)r(2)給定顯著水平α,按n-2查相關(guān)系數(shù)臨界值,查出相應(yīng)的臨界值(3)比較r的絕對值與臨界值的大小。當r的絕對值大于或等于臨界值時,說明兩變量在α水平上達到顯著性;若小于臨界值,則說明兩變量沒有達到所要求的精度。如果仍需研究二者的關(guān)系,可考慮降低精度,即修改顯著性水平α、相關(guān)系數(shù)的顯著性檢驗步驟10/16/2023212、等級相關(guān)系數(shù)的計算公式及檢驗——表示兩個變量順序間直線相關(guān)程度和方向的系數(shù),稱為等級(或順序)相關(guān)系數(shù)。等級相關(guān)系數(shù)不僅適用于數(shù)量指標的相關(guān)分析,同時亦適用于質(zhì)量指標的相關(guān)分析?!燃壪嚓P(guān)系數(shù),又稱順序相關(guān)系數(shù)是將兩要素的樣本值按數(shù)值的大小順序排列位次,以各要素樣本值的位次代替實際數(shù)據(jù)而求得的一種統(tǒng)計量。實際上,它是位次分析方法的數(shù)量化。
10/16/202322(1)等級相關(guān)系數(shù)的計算公式10/16/202323(2)等級相關(guān)系數(shù)的計算及檢驗1985年全國各?。ㄊ?,區(qū))總?cè)丝谂c社會總產(chǎn)值
10/16/20232410/16/202325即:總?cè)丝冢▁)與社會總產(chǎn)值(y)的等級相關(guān)系數(shù)為0.72610/16/202326等級相關(guān)系數(shù)檢驗的臨界值
10/16/202327在上例中,n=29,表中沒有給出相應(yīng)的樣本數(shù)下的臨界值ra,但我們發(fā)現(xiàn),在同一顯著水平下,隨著樣本數(shù)的增大,臨界值ra減少。在n=28時,查表可知:r0.05=0.317,r0.01=0.448,由于r′xy=0.726>r0.01=0.448,故r′xy在a=0.01的置信水平上是顯著的。
等級相關(guān)系數(shù)檢驗結(jié)果
10/16/202328(二)多要素間相關(guān)程度的測定
1.偏相關(guān)系數(shù)的計算與檢驗在多要素所構(gòu)成的地理系統(tǒng)中,當我們研究某一個要素對另一個要素的影響或相關(guān)程度時,把其它要素的影響視為常數(shù)(保持不變),即暫不考慮其它要素的影響,而單獨研究那兩個要素之間的相互關(guān)系的密切程度時,則稱為偏相關(guān)。用以度量偏相關(guān)程度的統(tǒng)計量,稱為偏相關(guān)系數(shù)。
10/16/202329當研究2個相關(guān)變量x1、x2的關(guān)系時,用直線相關(guān)系數(shù)r12表示x1與x2線性相關(guān)的性質(zhì)與程度。此時固定的變量個數(shù)為0,所以直線相關(guān)系數(shù)r12又叫做零級偏相關(guān)系數(shù)。當研究3個相關(guān)變量x1、x2、x3的相關(guān)時,我們把x3保持固定不變,x1與x2的相關(guān)系數(shù)稱為x1與x2的偏相關(guān)系數(shù),記為r12.3,類似地,還有偏相關(guān)系數(shù)r13.2、r23.1。這3個偏相關(guān)系數(shù)固定的變量個數(shù)為1,所以都叫做一級偏相關(guān)系數(shù)。當研究4個相關(guān)變量x1、x2、x3、x4的相關(guān)時,須將其中的2個變量固定不變,研究另外兩個變量間的相關(guān)。即此時只有二級偏相關(guān)系數(shù)才真實地反映兩個相關(guān)變量間線性相關(guān)的性質(zhì)與程度。二級偏相關(guān)系數(shù)共有6個:r12.34,r13.24,r14.23,r23.14,r24.13,r34.12。10/16/202330一般,當研究m個相關(guān)變量x1、x2、、、…、xm的相關(guān)時,只有將其中的m-2個變量保持固定不變,研究另外兩個變量的相關(guān)才能真實地反映這兩個相關(guān)變量間的相關(guān),即此時只有m-2級偏相關(guān)系數(shù)才真實地反映了這兩個相關(guān)變量間線性相關(guān)的性質(zhì)與程度。m-2級偏相關(guān)系數(shù)共有個。xi與xj的m-2級偏相關(guān)系數(shù)記為rij.(i,j=1,2,…,m,i≠j)。10/16/202331偏相關(guān)系數(shù),可利用單相關(guān)系數(shù)來計算。假設(shè)有三個要素x1,x2,x3,其兩兩間單相關(guān)系數(shù)矩陣為10/16/202332對于上述三個要素x1,x2,x3,它們之間的偏相關(guān)系數(shù)共有三個,即r12·3,r13·2,r23·1(下標點后面的數(shù)字,代表在計算偏相關(guān)系數(shù)時,保持不變量,如r12·3即表示x3保持不變),其計算公式分別如下:式(5)—(7)表示三個偏相關(guān)系數(shù),稱為一級偏相關(guān)系數(shù)。10/16/202333若有四個要素X1,X2,X3,X4,則有六個偏相關(guān)系數(shù),即r12·34,r13·24,r14·23,r23·14,r24·12,r34·12,它們稱為二級偏相關(guān)系數(shù),其計算公式分別如下:在式(8)中,r12·34表示在x3和x4保持不變的條件,x1和x2的偏相關(guān)系數(shù)。
10/16/202334實例:對于某四個地理要素X1,X2,X3,X4的23個樣本數(shù)據(jù),經(jīng)過計算得到了如下的單相關(guān)系數(shù)矩陣:10/16/202335為了計算二級偏相關(guān)系數(shù),需要先計算一級偏相關(guān)系數(shù),由(5)式可求得
同理,依次可以計算出其它各一級偏相關(guān)系數(shù),見下表
10/16/202336在一級偏相關(guān)系數(shù)求出以后,便可代入公式計算二級偏相關(guān)系數(shù),如由(8)式計算可得同理,依次可計算出其它各二級偏相關(guān)系數(shù),見下表
10/16/202337偏相關(guān)系數(shù)具有下述性質(zhì):(1)偏相關(guān)系數(shù)分布的范圍在-1到1之間;(2)偏相關(guān)系數(shù)的絕對值越大,表示其偏相關(guān)程度越大;(3)偏相關(guān)系數(shù)的絕對值必小于或最多等于由同一系列資料所求得的復相關(guān)系數(shù),即R1·23≥|r12·3|。10/16/202338偏相關(guān)系數(shù)的顯著性檢驗偏相關(guān)系數(shù)的顯著性檢驗,一般采用t檢驗法。其統(tǒng)計量計算公式為在(15)式中,r12·34…m為偏相關(guān)系數(shù),n為樣本數(shù),m為自變量個數(shù)。10/16/202339對于前述計算得到的偏相關(guān)系數(shù)r24·13=0.821,由于n=23,m=3,故查t分布表,可得出不同顯著水平上的臨界值ta,若t>ta
,則表示偏相關(guān)顯著;反之,t<ta,則偏相關(guān)不顯著。在自由度為23-3-1=19時,查表得t0.001=3.883,所以t>ta,這表明在顯著性水平a=0.001上,偏相關(guān)系數(shù)r24·13是顯著的。10/16/202340年份GDP(億元)人口(萬人)19901511.19842419911810.54853419922196.53858019932770.37862019943844.5865319954953.35870119965883.8874719976537.07881019987021.35887219997493.84892220008337.47897520019195.049024200210275.59069200312078.159108200415021.849163200518516.879212200622077.369282山東省1990-2006年GDP和人口情況10/16/2023411.計算簡單相關(guān)系數(shù)10/16/202342---PARTIALCORRELATIONCOEFFICIENTS--Controllingfor..時間
GDP人口GDP1.0000-.0690人口-.06901.00002.計算偏相關(guān)系數(shù)如果令時間T不變,計算人口與GDP的偏相關(guān)系數(shù)為=-0.0690,且t=-0.259>0.8=α。由此可以看出,如果去掉時間的因素,人口與GDP之間的偏相關(guān)系數(shù)很小,即如果固定時間不變,人口與GDP之間的關(guān)系是微弱的,且經(jīng)檢驗人口與GDP之間沒有什么內(nèi)在的必然的線性聯(lián)系。人口越多未必GDP越高,這是比較合乎實際的。10/16/2023432.復相關(guān)系數(shù)的計算與檢驗復相關(guān)系數(shù):反映幾個要素與某一個要素之間的復相關(guān)程度。復相關(guān)系數(shù)的計算當有兩個自變量時當有三個自變量時10/16/202344當有k個自變量時復相關(guān)系數(shù)的性質(zhì)
①復相關(guān)系數(shù)介于0到1之間,即10/16/202345
②復相關(guān)系數(shù)越大,則表明要素(變量)之間的相關(guān)程度越密切。復相關(guān)系數(shù)為1,表示完全相關(guān);復相關(guān)系數(shù)為0,表示完全無關(guān)。
③復相關(guān)系數(shù)必大于或至少等于單相關(guān)系數(shù)的絕對值。復相關(guān)系數(shù)的顯著性檢驗F檢驗法。其統(tǒng)計量計算公式為10/16/202346例題:在上例中,若以x4為因變量,x1,x2,x3為自變量,試計算x4與x1,x2,x3之間的復相關(guān)系數(shù)。解:按照公式計算檢驗:,故復相關(guān)達到了極顯著水平。10/16/202347一回歸分析的意義與研究內(nèi)容二一元回歸分析三多元回歸分析四非線性回歸模型第二節(jié)地理要素間的回歸分析10/16/2023481、回歸分析意義回歸的古典意義:高爾頓遺傳學的回歸概念(父母身高與子女身高的關(guān)系)回歸的現(xiàn)代意義:一個因變量對若干自變量依存關(guān)系的研究回歸的目的(實質(zhì)):由固定的自變量去估計因變量的平均值一回歸分析的意義與研究內(nèi)容10/16/2023492、回歸分析的概念就是對具有相互聯(lián)系的要素,根據(jù)其聯(lián)系的形態(tài),選擇一個合適的數(shù)學模式,用來近似地表達要素間平均變化關(guān)系的數(shù)理統(tǒng)計方法。這個數(shù)學模式稱為回歸模型(回歸方程)10/16/2023503、回歸分析的目的
用樣本回歸函數(shù)去估計總體回歸函數(shù)。由于樣本對總體總是存在代表性誤差,樣本回歸函數(shù)總會過高或過低估計總體回歸函數(shù)。要解決的問題:尋求一種規(guī)則和方法,使得到的樣本回歸函數(shù)的參數(shù)和盡可能“接近”總體回歸函數(shù)中的參數(shù)和。這樣的“規(guī)則和方法”有多種,最常用的是最小二乘法10/16/202351
樣本
總體
A
10/16/2023524、回歸分析研究的主要內(nèi)容——從一組地理數(shù)據(jù)出發(fā),確定這些要素(變量)間的定量數(shù)學表達式,即回歸模型?!鶕?jù)一個或幾個要素(自變量)的值來預測或控制另一個要素(因變量)的取值?!獜挠绊懩骋坏乩磉^程中的許多要素中,找出哪些要素(變量)是主要的,哪些因素是次要的,這些要素之間又有什么聯(lián)系。
回歸分析研究的地理數(shù)學模型,依要素(變量)的多少可分為一元地理回歸模型和多元地理回歸模型。10/16/2023535、回歸分析與相關(guān)分析①相關(guān)分析所研究的變量是對等關(guān)系;回歸分析所研究的兩個變量不是對等關(guān)系。②對兩個變量來說,相關(guān)分析只能計算出一個相關(guān)系數(shù),而回歸分析,可分別建立兩個不同的回歸方程。③相關(guān)分析要求兩個變量都必須是隨機的,而回歸分析的要求,自變量是給定的,因變量是隨機的。計量地理學關(guān)心:變量間的因果關(guān)系及隱藏在隨機性后面的統(tǒng)計規(guī)律性,這有賴于回歸分析方法10/16/202354二、一元回歸分析(一)一元線性回歸及其基本思想1.一元線性回歸的最小二乘法某城市各年居民生活費收入與消費支出額的數(shù)據(jù)表序號生活費收入消費支出額序號生活費收入消費支出額1234525029036042045017025029031033067891049057065075082037040050055064010/16/202355根據(jù)表中的資料,確定生活費收入與消費支出之間存在的關(guān)系。用X表示生活費收入,Y表示消費支出,把表中數(shù)據(jù)的關(guān)系用坐標系中的相關(guān)點表示,10/16/202356從圖中我們看到,相關(guān)點的分布呈現(xiàn)出線性的形態(tài),這說明,生活費收入與消費支出之間不僅存在著相關(guān)關(guān)系,而且它們之間具有線性關(guān)系。因此我們就希望通過這些相關(guān)點確定出一條直線,利用這條直線表示它們的線性關(guān)系。設(shè)這條直線的方程為對于這些相關(guān)點,可以做出多條直線表示變量之間的關(guān)系,我們希望在這些直線中找出最有“代表性”的直線。尋找最有“代表性”直線的常用方法是“最小二乘法”?;?0/16/202357
最小二乘法的基本思想是:最有“代表性”的直線應(yīng)該是直線到各點的距離最近。等價的提法是:各點到直線的縱向距離最近。對于變量X的每一個值,相關(guān)點到直線的縱向距離是離差,為避免出現(xiàn)負號可用表示。對于多個點,點到直線的距離用表示。即利用離差的平方和表示多個點到直線的距離。根據(jù)最小二乘法的原理,最佳的直線是“的實際值與估計值之間的離差平方和為最小”10/16/202358稱為誤差平方和,將代入上式得到10/16/202359解方程組得10/16/2023602.一元回歸方程參數(shù)的求解公式10/16/202361(手算)3、具體計算方法(1)將原始數(shù)據(jù)根據(jù)需要列表(2)根據(jù)公式計算b(3)計算a(4)寫出回歸模型(5)一般情況下還要求出相關(guān)系數(shù)10/16/202362回歸方程數(shù)據(jù)表10/16/20236310/16/202364得回歸方程為:10/16/202365(二)一元線性回歸模型應(yīng)用條件
自變量X與因變量Y,X與Y之間的線性相關(guān)關(guān)系用函數(shù)關(guān)系表達式一般可以表示為德國數(shù)學家高斯提出了如下理論假設(shè).1.零均值假設(shè)。又稱為無偏性假設(shè),在給定的條件下,的條件數(shù)學期望等于0.即2同方差假設(shè)。又稱為等方差性假設(shè)。即對所有的,的條件方差都相等,且為常數(shù)。即10/16/2023663.無自相關(guān)假設(shè)。又稱為獨立性假設(shè)。它假設(shè)隨機誤差項的逐次觀察值互不相關(guān),即4.與X不相關(guān)假設(shè)?;貧w模型中的隨機誤差項與自變量各自獨立影響因變量Yi。即5.正態(tài)性假設(shè)。假設(shè)隨機誤差項服從均值為零,方差為的正態(tài)分布。即:
10/16/2023671、線性關(guān)系檢驗線性關(guān)系檢驗:是指檢驗自變量與因變量之間關(guān)系能否用一個線性模型來表示。
擬合優(yōu)度檢驗—判定系數(shù)法
擬合優(yōu)度檢驗就是檢驗回歸模型擬和實際數(shù)據(jù)的擬和程度。一元分析中Y值的變化可以看成是由兩個原因的變化引起的,一個是由于自變量X變動引起的,二是由于其它因素變動引起的,如圖。(三)回歸模型的檢驗10/16/202368①擬合優(yōu)度?
概念:樣本回歸線是對樣本數(shù)據(jù)的一種擬合,不同估計方法可擬合出不同的回歸線,擬合的回歸線與樣本觀測值總有偏離。樣本回歸線對樣本觀測數(shù)據(jù)擬合的優(yōu)劣程度——擬合優(yōu)度擬合優(yōu)度的度量建立在對總變差分解的基礎(chǔ)上10/16/202369②總變差的分解
分析Y的觀測值、估計值與平均值的關(guān)系將上式兩邊平方加總,可證得
(TSS)(ESS)(RSS)
10/16/202370
總變差(TSS):因變量Y的觀測值與其平均值的離差平方和(總平方和)
解釋了的變差(ESS):因變量Y的估計值與其平均值的離差平方和(回歸平方和)
剩余平方和(RSS):因變量觀測值與估計值之差的平方和(未解釋的平方和)10/16/202371
變差分解的圖示10/16/202372③可決系數(shù)以TSS同除總變差等式兩邊:或
定義:回歸平方和(解釋了的變差ESS)在總變差(TSS)中所占的比重稱為可決系數(shù),用表示:
或
10/16/202373簡捷計算公式:或10/16/202374作用:可決系數(shù)越大,說明在總變差中由模型作出了解釋的部分占的比重越大,模型擬合優(yōu)度越好。反之可決系數(shù)小,說明模型對樣本觀測值的擬合程度越差。特點:●可決系數(shù)取值范圍:●隨抽樣波動,樣本可決系數(shù)是隨抽樣而變動的隨機變量●可決系數(shù)是非負的統(tǒng)計可決系數(shù)的作用和特點10/16/202375可決系數(shù)與相關(guān)系數(shù)的關(guān)系a聯(lián)系
數(shù)值上,可決系數(shù)等于因變量與自變量之間簡單相關(guān)系數(shù)的平方:10/16/202376可決系數(shù)與相關(guān)系數(shù)的關(guān)系可決系數(shù)相關(guān)系數(shù)就模型而言就兩個變量而言說明解釋變量對應(yīng)變量的解釋程度度量兩個變量線性依存程度。度量不對稱的因果關(guān)系度量不含因果關(guān)系的對稱相關(guān)關(guān)系取值:[0,1]取值:[-1,1]b區(qū)別10/16/202377在上例中10/16/20237810/16/2023792、回歸系數(shù)檢驗回歸系數(shù)檢驗主要是對檢驗(1)假設(shè)(2)計算檢驗統(tǒng)計量其中是的標準差,n為樣本中數(shù)據(jù)的個數(shù)10/16/202380(3)根據(jù)統(tǒng)計知識可知服從自由度為n-2的分布(4)用樣本計算t的值若:則拒絕,認為X,Y之間有線性關(guān)系若:則接受,認為X,Y之間無線性關(guān)系給定顯著性水平,查自由度為n-2的t分布表得臨界值10/16/202381現(xiàn)對上例中的模型進行t檢驗(1)假設(shè)(3)給定顯著性水平α=0.05,查自由度為8的t分布臨界值表,得(4)因為則方程的t檢驗通過,說明X與Y之間是線性關(guān)系的假設(shè)成立.10/16/202382基本思想在多元回歸中有多個解釋變量,需要說明所有解釋變量聯(lián)合起來對應(yīng)變量影響的總顯著性或整個方程總的聯(lián)合顯著性。對方程總顯著性檢驗需要在方差分析的基礎(chǔ)上進行F檢驗。3、回歸方程的顯著性檢。10/16/202383總變差自由度
模型解釋了的變差自由度
剩余變差自由度變差來源平方和自由度方差歸于回歸模型歸于剩余總變差方差分析表10/16/202384檢驗的步驟為:(1)提出假設(shè)(2)計算回歸方程的檢驗值(3)確定檢驗的臨界值10/16/202385服從自由度為,的分布,對于給定的顯著性水平,可以通過分布表查得顯著性水平為、自由度分別為、的臨界值
(4)檢驗1)若〉,則否定假設(shè),回歸方程總體線性關(guān)系的顯著性檢驗通過,
將值與臨界值比較2)若〈,則接受假設(shè),回歸方程總體線性關(guān)系的顯著性檢驗未通過,
10/16/202386對上例中的模型進行檢驗1)假設(shè)2)
計算3)
給定顯著性水平0.05,查分布的臨界值表4)檢驗:≥5.23=,則模型的檢驗通過。10/16/202387三、多元線性回歸分析(一)二元線性回歸分析二元線性回歸分析的模型可以由下式表示:二元線性回歸分析就是根據(jù)n個已知的樣本觀察值…,來計算出參數(shù)值,得到回歸模型參數(shù)的計算主要是采用最小二乘法10/16/202388由最小二乘法,參數(shù)的計算是使SSE10/16/20238910/16/202390(二)多元線性回歸分析k元線性回歸模型為1、多元線性回歸模型模型中參數(shù)是偏回歸系數(shù)。偏回歸系數(shù):控制其它自變量不變的條件下,第k個自變量的單位變動對因變量平均值的影響。或10/16/2023912、多元線性回歸模型的矩陣表示
K個解釋變量的多元線性回歸模型的n個觀測樣本,可表示為
10/16/202392
用矩陣表
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中學化學習題研究知到課后答案智慧樹章節(jié)測試答案2025年春牡丹江師范學院
- 三級人力資源管理師-企業(yè)人力資源管理師(三級)《理論知識》考前沖刺卷5
- 普通高等學校高三招生全國統(tǒng)一考試仿真卷(六)理綜
- 射洪縣2018年高三歷史(3月)練題(二)及解析
- 市場經(jīng)濟背景下民商法信用體系完善的重要性研究
- 酒精性脂肪性肝病合并乙型肝炎病毒肝內(nèi)復制小鼠模型的建立及其對膽固醇代謝的影響研究
- 小學道德與法治實踐性作業(yè)優(yōu)化策略研究
- 英語游戲引入課堂教學的價值與應(yīng)用
- cro服務(wù)合同范例
- 上海市2024年高中化學考點匯編3生命的結(jié)構(gòu)基礎(chǔ)無答案
- 2024版工程合同變更流程
- 運用PDCA縮短ST段抬高型急性心肌梗死病人在急診停留時間
- 陜西省咸陽彩虹中學2025年高考數(shù)學試題模擬卷(1)含解析
- 2023年全省職業(yè)院校技能大賽高職教師組護理技能賽項競賽規(guī)程
- 車庫租賃合同
- 法人不參與經(jīng)營免責協(xié)議
- 小學生心理健康主題家長會
- QB/T 4031-2024 阻燃性汽車空氣濾紙(正式版)
- DZ∕T 0130-2006 地質(zhì)礦產(chǎn)實驗室測試質(zhì)量管理規(guī)范(正式版)
- 《“光盤”行動-從我做起!》課件
- 杠桿原理及其應(yīng)用實驗報告總結(jié)
評論
0/150
提交評論