版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Good is good, but better carries it.精益求精,善益求善。spss終期考核作業(yè)-第六章線性回歸分析2010級(jí)研究生:嚴(yán)飛學(xué)號(hào):201011080122.多元線性回歸的顯著性檢驗(yàn)包括哪些內(nèi)容?如何進(jìn)行?答:經(jīng)過(guò)查找資料并總結(jié)得出多元線性回歸的顯著性檢驗(yàn)主要包括:擬合優(yōu)度檢驗(yàn)、方程顯著性檢驗(yàn)和變量顯著性檢驗(yàn)三種。(一)擬合優(yōu)度檢驗(yàn)(R2檢驗(yàn))擬合優(yōu)度檢驗(yàn)是檢驗(yàn)回歸方程對(duì)樣本觀測(cè)值的擬合程度,即檢驗(yàn)所有解釋變量與被解釋變量之間的相關(guān)程度。檢驗(yàn)的方法是構(gòu)造一個(gè)可以表征擬合程度的指標(biāo),這個(gè)指標(biāo)是通過(guò)對(duì)總變差(總離差)的分解而得到??傋儾钇椒胶蚐總是各個(gè)觀察值與樣本均值之
2、差的平方和,反映了全部數(shù)據(jù)之間的差異;殘差平方和S殘是總變差平方和中未被回歸方程解釋的部分,由解釋變量xl、x2xk中未包含的一切因素對(duì)被解釋變量y的影響而造成的;回歸平方和S回是總變差平方和中由回歸方程解釋的部分。一個(gè)擬合得好的回歸模型,體現(xiàn)在總體平方和與回歸平方和的接近程度,即S總中S殘?jiān)叫≡胶?。于是采用:?duì)回歸方程的擬合優(yōu)度進(jìn)行檢驗(yàn)。如果所有樣本觀測(cè)值都位于回歸方程上,即:此時(shí)回歸方程完全擬合了樣本觀測(cè)值,R等于1。如果R越接近1,則說(shuō)明回歸方程的擬合優(yōu)度越高。(二)方程顯著性檢驗(yàn)(F檢驗(yàn))方程顯著性檢驗(yàn)就是對(duì)模型中解釋變量與被解釋變量之間的線性關(guān)系在總體上是否顯著成立作出推斷。即檢驗(yàn)被
3、解釋變量y與所有解釋變量xl、x2xk之間的線性關(guān)系是否顯著,方程顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中假設(shè)檢驗(yàn)。檢驗(yàn)的原假設(shè)H0與對(duì)立假設(shè)H1分別為:H0:0=1=k=0H1:至少有一個(gè)1不為零應(yīng)用數(shù)理統(tǒng)計(jì)理論可以證明:S回與S殘相互獨(dú)立,且當(dāng):H0:0=1=k=0為真時(shí),S回與S殘分別服從自由度為k、n-k-1的X2分布,故有:即:F統(tǒng)計(jì)量服從以(k、n-k-1)為自由度的F分布。首先根據(jù)樣本觀測(cè)值及回歸值計(jì)算出統(tǒng)計(jì)量F,于是在給定的顯著性水平下,若FF(K、n-k-1),則拒絕H0,判定被解釋變量y與所有解釋變量xl、x2xk之間的回歸效果顯著,即確實(shí)存在線性關(guān)系;反之,則不顯著。(三)變
4、量顯著性檢驗(yàn)(t檢驗(yàn))R2檢驗(yàn)和F檢驗(yàn)都是將所有的解釋變量作為一個(gè)整體來(lái)檢驗(yàn)它們與被解釋變量y的相關(guān)程度以及回歸效果,但對(duì)于多元回歸模型,方程的總體顯著性并不意味每個(gè)解釋變量對(duì)被解釋變量y的影響都是顯著的。如果某個(gè)解釋變量并不顯著,則應(yīng)該從方程中把它剔除,重新建立更為簡(jiǎn)單的方程。所以必須對(duì)每個(gè)解釋變量進(jìn)行顯著性檢驗(yàn)。等價(jià)于對(duì)每個(gè)解釋變量檢驗(yàn)假設(shè):H0:j=0H1:j0其中j=0,1,2k。應(yīng)用數(shù)理統(tǒng)計(jì)理論可以證明:當(dāng):H0:j=0為真時(shí),統(tǒng)計(jì)量tj服從自由度為(n-k-1)的t分布,即:在給定的顯著性水平下:若tjt/2(n-k-1),則拒絕H0,說(shuō)明解釋變量xj對(duì)被解釋變量y有顯著影響,即x
5、j是影響Y的主要因素;反之,接受,說(shuō)明解釋變量xj對(duì)被解釋變量y無(wú)顯著影響,則應(yīng)刪除該因素。當(dāng)影響Y的主要因素只有一個(gè)變量x時(shí),問(wèn)題變成了元回歸分析,此時(shí)t檢驗(yàn)和F檢驗(yàn)的作用是一樣的,因此可以不用再做F檢驗(yàn)。3.如何建立多元線性回歸方程?偏相關(guān)系數(shù)有何意義?答:(一)建立多元線性回歸方程的步驟可總結(jié)如下:1)確定研究目標(biāo),即明確建立回歸方程的自變量變量和因變量,然后在一定樣本中取得自變量與因變量所對(duì)應(yīng)的觀測(cè)值。通常,預(yù)測(cè)變量是現(xiàn)實(shí)中容易測(cè)量的,被預(yù)測(cè)變量則是現(xiàn)實(shí)中較難測(cè)量或是指未來(lái)發(fā)展的結(jié)果。2)利用散點(diǎn)圖或相關(guān)分析確定自變量與因變量之間是否存在線性關(guān)系。3)利用確定的計(jì)算方法或計(jì)算機(jī)軟件計(jì)算
6、回歸方程的回歸常數(shù)和回歸系數(shù),得到回歸方程。4)進(jìn)行擬合優(yōu)度檢驗(yàn)。就是檢驗(yàn)樣本數(shù)據(jù)聚集在樣本回歸線周圍的密集程度,從而判斷回歸方程對(duì)樣本數(shù)據(jù)的代表程度。多元線性回歸方程中由于引入的自變量不同,所以比較不同回歸方程的擬合度時(shí)需要使用調(diào)整后的擬合度判定系數(shù)。5)回歸方程的顯著性檢驗(yàn)?;貧w方程顯著性檢驗(yàn)是對(duì)因變量與自變量之間線性關(guān)系是否顯著的一種檢驗(yàn)。檢驗(yàn)方法采用方差分析:F值等于平均的回歸平方和與平均的殘差平方和之比。6)對(duì)回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))?;貧w方程顯著性檢驗(yàn)是從總體上顯示回歸系數(shù)顯著,多元線性回歸,還需分別檢驗(yàn)各回歸系數(shù)的顯著性。(二)偏相關(guān)系數(shù)的意義在多個(gè)相關(guān)變量中,其他變量保持
7、固定不變,所研究的兩個(gè)變量間的線性相關(guān)稱為偏相關(guān)。用來(lái)表示兩個(gè)相關(guān)變量偏相關(guān)的性質(zhì)與程度的統(tǒng)計(jì)量叫偏相關(guān)系數(shù),絕對(duì)值越大,偏相關(guān)程度越大。根據(jù)被固定的變量個(gè)數(shù)可將偏相關(guān)系數(shù)分級(jí),偏相關(guān)系數(shù)的級(jí)數(shù)等于被固定的變量的個(gè)數(shù)。1)當(dāng)研究2個(gè)相關(guān)變量x1、x2的關(guān)系時(shí),用直線相關(guān)系數(shù)r12表示x1與x2線性相關(guān)的性質(zhì)與程度。此時(shí)固定的變量個(gè)數(shù)為0,所以直線相關(guān)系數(shù)r12又叫做零級(jí)偏相關(guān)系數(shù)。2)當(dāng)研究3個(gè)相關(guān)變量x1、x2、x3的相關(guān)時(shí),我們把x3保持固定不變,x1與x2的相關(guān)系數(shù)稱為x1與x2的偏相關(guān)系數(shù),記為r12-3,類似地,還有偏相關(guān)系數(shù)r13-2、r23-1。這3個(gè)偏相關(guān)系數(shù)固定的變量個(gè)數(shù)為1
8、,所以都叫做一級(jí)偏相關(guān)系數(shù)。3)當(dāng)研究4個(gè)相關(guān)變量x1、x2、x3、x4的相關(guān)時(shí),須將其中的2個(gè)變量固定不變,研究另外兩個(gè)變量間的相關(guān)。即此時(shí)只有二級(jí)偏相關(guān)系數(shù)才真實(shí)地反映兩個(gè)相關(guān)變量間線性相關(guān)的性質(zhì)與程度。二級(jí)偏相關(guān)系數(shù)共有個(gè):r12-34,r13-24,r14-23,r23-14,r24-13,r34-12。一般,當(dāng)研究m個(gè)相關(guān)變量x1、x2、xm的相關(guān)時(shí),只有將其中的m-2個(gè)變量保持固定不變,研究另外兩個(gè)變量的相關(guān)才能真實(shí)地反映這兩個(gè)相關(guān)變量間的相關(guān),即此時(shí)只有m-2級(jí)偏相關(guān)系數(shù)才真實(shí)地反映了這兩個(gè)相關(guān)變量間線性相關(guān)的性質(zhì)與程度。m-2級(jí)偏相關(guān)系數(shù)共有個(gè)。xi與xj的m-2級(jí)偏相關(guān)系數(shù)記
9、為rij.(i,j=1,2,m,ij)。偏相關(guān)系數(shù)的取值范圍為-1,1,即:-1rij.1。5.如何將多項(xiàng)式回歸轉(zhuǎn)化為多元線性回歸?多項(xiàng)式回歸問(wèn)題可以通過(guò)變量轉(zhuǎn)換化為多元線性回歸問(wèn)題來(lái)解決。對(duì)于一元m次多項(xiàng)式回歸方程(9-35),令、=、=,則(9-35)就轉(zhuǎn)化為m元線性回歸方程:因此用本章第一節(jié)的方法就可解決多項(xiàng)式回歸問(wèn)題。需要指出的是,在多項(xiàng)式回歸分析中,檢驗(yàn)回歸系數(shù)bi是否顯著,實(shí)質(zhì)上就是判斷自變量x的i次方項(xiàng)xi對(duì)依變量y的影響是否顯著。對(duì)于二元二次多項(xiàng)式回歸方程(9-36),令,則(9-36)就轉(zhuǎn)化為五元線性回歸方程:但隨著自變量個(gè)數(shù)的增加,多元多項(xiàng)式回歸分析的計(jì)算量急劇增加,于是就
10、需要轉(zhuǎn)化為多元線性回歸方程進(jìn)行分析了。下面是我找的一具體實(shí)例對(duì)一元二次多項(xiàng)式回歸作詳細(xì)介紹:(大體上了解了多項(xiàng)式回歸轉(zhuǎn)化為多元回歸的具體過(guò)程,不過(guò)其中數(shù)學(xué)水平要求高,還是有些地方不是很清楚,會(huì)繼續(xù)努力看明白的)【例9.3】給動(dòng)物口服某種藥物A1000mg,每間隔1小時(shí)測(cè)定血藥濃度(g/ml),得到表9-5的數(shù)據(jù)(血藥濃度為5頭供試動(dòng)物的平均值)。試建立血藥濃度(依變量y)對(duì)服藥時(shí)間(自變量x)的回歸方程。表9-5血藥濃度與服藥時(shí)間測(cè)定結(jié)果表服藥時(shí)間x(小時(shí))123456789血藥濃度y(g/ml)21.8947.1361.8670.7872.8166.3650.3425.313.1722.71
11、8246.256362.268470.754571.714665.148751.056829.43890.2950y-0.82820.8737-0.40840.02551.09541.2113-0.7168-4.12982.8750(一)根據(jù)表9-5的數(shù)據(jù)資料繪制x與y的散點(diǎn)圖(見下圖)。由散點(diǎn)圖我們看到:血藥濃度最大值出現(xiàn)在服藥后5小時(shí),在5小時(shí)之前血藥濃度隨時(shí)間的增加而增加,在5小時(shí)之后隨著時(shí)間的增加而減少,散點(diǎn)圖呈拋物線形狀,因此我們可以選用一元二次多項(xiàng)式來(lái)描述血藥濃度與服藥時(shí)間的關(guān)系,即進(jìn)行一元二次多項(xiàng)式回歸或拋物線回歸。圖1表9-5資料的散點(diǎn)圖(二)進(jìn)行變量轉(zhuǎn)換設(shè)一元二次多項(xiàng)式回歸方
12、程為:令、,則得二元線性回歸方程(三)進(jìn)行二元線性回歸分析先計(jì)算得:再計(jì)算得:于是得到關(guān)于求出上述正規(guī)方程組系數(shù)矩陣的逆矩陣為:關(guān)于即:而于是得到二元線性回歸方程為:現(xiàn)在對(duì)二元線性回歸方程或二元線性回歸關(guān)系進(jìn)行顯著性檢驗(yàn)。列出方差分析表,進(jìn)行F檢驗(yàn)。表9-6二元線性回歸關(guān)系方差分析表變異來(lái)源SSdfMSF回歸4830.916222415.4581511.750*離回歸28.320264.7200總變異4859.23648由查F值表得,因?yàn)镕F0.01(2,6),P0.01,表明二元線性回歸關(guān)系是極顯著的。偏回歸系數(shù)的顯著檢驗(yàn),應(yīng)用F檢驗(yàn)法:由查F值表得,因?yàn)?、,表明偏回歸系數(shù)都是極顯著的。(四
13、)建立一元二次多項(xiàng)式回歸方程將還原為,還原為x2,即得一元二次多項(xiàng)式回歸方程為:(五)計(jì)算相關(guān)指數(shù)R2因?yàn)?,相關(guān)指數(shù)R2為:表明y對(duì)x的一元二次多項(xiàng)式回歸方程的擬合度是比較高的,或者說(shuō)該回歸方程估測(cè)的可靠程度是比較高的。6.某地區(qū)的人均收入與同期某種耐用消費(fèi)品的銷售額之間的統(tǒng)計(jì)資料如下表所示?,F(xiàn)要求確定兩者之間是否存在相關(guān)關(guān)系。年份1987198819891990199119921993199419951996人均收入1.61.82.33.03.43.84.54.85.25.4銷售額(百萬(wàn)元)4.75.97.08.210.5121313.51415具體操作步驟:1)輸入數(shù)據(jù)(圖1)圖12)分析
14、(圖2)圖23)變量選擇(圖3)圖34)結(jié)果(圖4)通過(guò)以上步驟獲得結(jié)果顯示,人均收入與同期某種耐用消費(fèi)品的銷售額之間存在顯著相關(guān)關(guān)系。7.一家商場(chǎng)20032005年個(gè)季度的銷售額數(shù)據(jù)如下表所示。試建立一個(gè)多元回歸模型預(yù)測(cè)2006,、2007年每季度的銷售額。季度/年銷售額2003年2004年2005年13890384041252250021903146319891765143444365421345311.數(shù)據(jù)輸入2.分析:點(diǎn)擊分析回歸線性(L)設(shè)置統(tǒng)計(jì)量點(diǎn)擊“統(tǒng)計(jì)量”進(jìn)入統(tǒng)計(jì)量設(shè)置菜單設(shè)置完成點(diǎn)擊繼續(xù)回到主界面繪圖設(shè)置點(diǎn)擊“繪制”進(jìn)入并設(shè)置,設(shè)置完成點(diǎn)擊繼續(xù)回到主界面。選項(xiàng)攝體保存設(shè)置點(diǎn)擊
15、“保存”,并設(shè)置,設(shè)置完成點(diǎn)擊繼續(xù)返回。點(diǎn)擊“選項(xiàng)”,并設(shè)置,再點(diǎn)擊繼續(xù)回到主界面設(shè)置完成上述參數(shù),點(diǎn)擊主界面“確定”,得到如下結(jié)果:REGRESSION/MISSINGLISTWISE/STATISTICSCOEFFOUTSBCOVRANOVACOLLINTOL/CRITERIA=PIN(.05)POUT(.10)CIN(95)/NOORIGIN/DEPENDENT銷售額/METHOD=ENTER年份季度/SCATTERPLOT=(*SDRESID,*ZPRED)(*ZRESID,*ZPRED)/RESIDUALSHIST(ZRESID)/CASEWISEPLOT(ZRESID)OUTLIE
16、RS(3)/SAVECOOKLEVERMCINICIN.回歸附注創(chuàng)建的輸出22-十一月-201116時(shí)20分18秒注釋輸入活動(dòng)的數(shù)據(jù)集數(shù)據(jù)集0過(guò)濾器權(quán)重拆分文件工作數(shù)據(jù)文件中的N行12缺失值處理對(duì)缺失的定義用戶定義的缺失值作為缺失數(shù)據(jù)對(duì)待。使用的案例統(tǒng)計(jì)是在所使用的變量不帶有缺失值的案例基礎(chǔ)上進(jìn)行的。語(yǔ)法REGRESSION/MISSINGLISTWISE/STATISTICSCOEFFOUTSBCOVRANOVACOLLINTOL/CRITERIA=PIN(.05)POUT(.10)CIN(95)/NOORIGIN/DEPENDENT銷售額/METHOD=ENTER年份季度/SCATTERP
17、LOT=(*SDRESID,*ZPRED)(*ZRESID,*ZPRED)/RESIDUALSHIST(ZRESID)/CASEWISEPLOT(ZRESID)OUTLIERS(3)/SAVECOOKLEVERMCINICIN.資源處理器時(shí)間0:00:01.922已用時(shí)間0:00:02.250所需內(nèi)存1644個(gè)字節(jié)殘差圖需要額外內(nèi)存832個(gè)字節(jié)創(chuàng)建或修改的變量COO_1CooksDistanceLEV_1CenteredLeverageValueLMCI_1銷售額的95%平均置信區(qū)間下限UMCI_1銷售額的95%平均置信區(qū)間上限LICI_1銷售額的95%單個(gè)置信區(qū)間下限UICI_1銷售額的95
18、%單個(gè)置信區(qū)間上限數(shù)據(jù)集0輸入移去的變量b模型輸入的變量移去的變量方法1季度,年份a.輸入a.已輸入所有請(qǐng)求的變量。b.因變量:銷售額模型匯總b模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差1.175a.031-.1851112.5668a.預(yù)測(cè)變量:(常量),季度,年份。b.因變量:銷售額Anovab模型平方和df均方FSig.1回歸352741.2672176370.633.142.869a殘差1.114E791237804.970總計(jì)1.149E711a.預(yù)測(cè)變量:(常量),季度,年份。b.因變量:銷售額系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.共線性統(tǒng)計(jì)量B標(biāo)準(zhǔn)誤差試用版容差VIF1(常量)-3706
19、73.167788277.356-.470.649年份186.500393.352.156.474.6471.0001.000季度70.467287.264.081.245.8121.0001.000a.因變量:銷售額系數(shù)相關(guān)a模型季度年份1相關(guān)性季度1.000.000年份.0001.000協(xié)方差季度82520.331.000年份.000154725.621a.因變量:銷售額共線性診斷a模型維數(shù)特征值條件索引方差比例(常量)年份季度112.8841.000.00.00.022.1164.996.00.00.9838.300E-85895.0701.001.00.00a.因變量:銷售額殘差統(tǒng)計(jì)量a極小值
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度綠色車間承包維護(hù)及升級(jí)服務(wù)合同3篇
- 二零二五版苗圃基地苗木栽培技術(shù)培訓(xùn)與推廣合同4篇
- 2025年度出租車駕駛員勞動(dòng)合同書(含績(jī)效考核辦法)2篇
- 2025年生態(tài)保護(hù)項(xiàng)目草籽供應(yīng)服務(wù)合同3篇
- 二零二五年度甲級(jí)辦公租賃合同模板2篇
- 2025年度私人車輛產(chǎn)權(quán)轉(zhuǎn)讓及車輛保險(xiǎn)代理合同
- 2025年度房地產(chǎn)項(xiàng)目合作出資轉(zhuǎn)讓合同參考4篇
- 2025版現(xiàn)代農(nóng)業(yè)病蟲害防治與食品安全保障合同3篇
- 2025年度大摩中金平和分手協(xié)議書(資產(chǎn)清算版)4篇
- 二零二五年度新能源汽車充電站建設(shè)合同4篇
- 鐵路征地拆遷總結(jié)匯報(bào)
- 手術(shù)室護(hù)士的職業(yè)暴露及防護(hù)措施護(hù)理課件
- 水果店選址分析報(bào)告
- 人員測(cè)評(píng)與選拔的主要方法課件
- 智慧審計(jì)方案
- 企業(yè)信息化建設(shè)現(xiàn)狀與未來(lái)規(guī)劃匯報(bào)
- 工程開工報(bào)審表及工程開工報(bào)審表、開工報(bào)告
- 音樂協(xié)會(huì)管理制度
- 2024年水發(fā)集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 阿米巴落地實(shí)操方案
- 藥物制劑工(三級(jí))理論試題題庫(kù)及答案
評(píng)論
0/150
提交評(píng)論