線性回歸分析_第1頁(yè)
線性回歸分析_第2頁(yè)
線性回歸分析_第3頁(yè)
線性回歸分析_第4頁(yè)
線性回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

§8.3線性回歸分析一、回歸分析原理回歸分析實(shí)際上就是建立某種數(shù)學(xué)模型并做檢驗(yàn)。假定:一列(或多列)數(shù)據(jù)的變化同另一列數(shù)據(jù)的變化呈某種函數(shù)關(guān)系,衡量數(shù)據(jù)聯(lián)系強(qiáng)度的指標(biāo),并通過(guò)指標(biāo)檢驗(yàn)其符合的程度,就稱為回歸分析?;貧w分析包括:一元回歸、多元回歸以及線性回歸和非線性回歸:一元回歸:Y(因變量)取值:y1y2y3…X(自變量)取值:x1x2x3…建立一元線性回歸方程:Y=BX+C(方程中的B為回歸系數(shù),C為常數(shù))或者是非線性回歸方程:Y=f(X)多元回歸:Y(因變量)取值:y1y2y3…X1(自變量1)取值:x11x12x13…X2(自變量2)取值:x21x22x23………Xn(自變量n)取值:

xn1xn2xn3…建立多元線性回歸方程:Y=B1X1+B2X2…+BnXn+B0(方程中的Bi為回歸系數(shù))或者是非線性回歸方程:Y=f(X1X2…Xn)二、回歸分析的概念假定測(cè)量數(shù)據(jù)為:因變量自變量1自變量2…自變量ny1x11x21…

xn1y2x12x22…

xn2………ymx1mx2m…

xnm建立因變量與自變量的關(guān)系,回歸方程:Y=B1X1+B2X2…+B0納入前:

εj為隨機(jī)因素影響,即殘差。納入后:

要求組內(nèi)離差平方和最小。

納入方程的自變量應(yīng)滿足:①自變量的作用顯著X的變化應(yīng)引起Y的顯著變化。從而需要對(duì)回歸方程做F檢驗(yàn):組間離差平方和:組內(nèi)離差平方和:總離差平方和:回歸均方差(組間方差):殘差均方差(組內(nèi)方差):計(jì)算F值,由F值查表,得到P。討論顯著度水平:<=α自變量作用顯著P

>α自變量作用不顯著將未進(jìn)入方程的某自變量Xi與Y做方差分析,各水平均值差異顯著,滿足:F>3.84或P<=0.05則該Xi可以進(jìn)入回歸方程。而已進(jìn)入回歸方程的Xi與回歸后的Y如果出現(xiàn):F<2.71,P>0.1則該Xi必須從回歸方程中剔除。②方程中回歸系數(shù)的作用顯著對(duì)已進(jìn)入方程的變量的回歸系數(shù)做T檢驗(yàn),該檢驗(yàn)的零假設(shè)是Bi=0,即回歸系數(shù)可以忽略,備擇假設(shè)是Bi不為零。T值的計(jì)算為:通過(guò)查表可以得到P(即:SigT)。若P>0.1的Xi須可以考慮首先從回歸方程中剔除。其中:Bi為偏回歸系數(shù)SEBi為偏回歸系數(shù)的標(biāo)準(zhǔn)誤③欲進(jìn)入方程的自變量應(yīng)當(dāng)與已進(jìn)入的自變量相關(guān)程度足夠低。引進(jìn)描述相關(guān)程度的量:容忍度Tolerance,即變量之間的相關(guān)系數(shù)的顯著度水平。若:Tolerance>0.0001表明欲進(jìn)入方程的自變量與其它自變量的相關(guān)程度低,即:xi與xj相關(guān)程度低,則xi可以進(jìn)入回歸方程。三、自變量納入回歸方程的方式SPSSforWin8.0系統(tǒng)提供的自變量納入方程的方式有五種,分別為:①?gòu)?qiáng)行介入法Enter(一次性進(jìn)入)這是一種不檢驗(yàn)F和Tolerance,一次將全部自變量無(wú)條件地納入回歸方程。②強(qiáng)行剔除Remove(一次性剔除)指定某些變量不能進(jìn)入方程。這種方法通常同別的方法聯(lián)合使用,而不能首先或單獨(dú)使用,因?yàn)榈谝淮问褂没騿为?dú)使用將意味著沒(méi)有哪個(gè)變量進(jìn)入方程。③逐步進(jìn)入Stepwise每次選擇符合進(jìn)入條件的自變量進(jìn)入方程,進(jìn)入后立即檢驗(yàn),不合格者剔除,直到全部合格自變量進(jìn)入方程。④反向剔除Backward先強(qiáng)行介入,再逐個(gè)剔除不合格變量,直到全合格。⑤正向進(jìn)入Forward每次選擇符合進(jìn)入條件的自變量進(jìn)入方程,逐個(gè)選擇,逐個(gè)進(jìn)入,直到全部合格自變量進(jìn)入方程。四、操作步驟⒈回歸分析命令菜單執(zhí)行:[Statistics][Regression][Linear]選擇因變量到:“Dependent”因變量框內(nèi)選擇若干個(gè)自變量移動(dòng)到:“Independent(s)”自變量框內(nèi)。⒉回歸方法“Method”下拉菜單提供了五種回歸方法供選擇:強(qiáng)行介入法Enter正向進(jìn)入Forward反向剔除Backward逐步進(jìn)入Stepwise強(qiáng)行剔除Remove“Block1ofn”可以將回歸步驟分為若干組塊。在指定了一組因變量和自變量后,可以用“Next”按鈕再建立另一個(gè)組塊,以便再次指定一組因變量和自變量。在建立了若干組塊以后,執(zhí)行回歸分析命令,將能夠逐一組塊地進(jìn)行分析。例如:在研究“小麥產(chǎn)量”時(shí),收集了“土壤成分”、“農(nóng)家肥料”、“化肥”、“灌溉”以及“種谷物的產(chǎn)量”等數(shù)據(jù)。假定:“小麥產(chǎn)量”為因變量。要求在回歸方程中先以“土壤成分”、“化肥”和“種谷物的產(chǎn)量”為自變量,然后剔除“種谷物的產(chǎn)量”,再將其它自變量根據(jù)系統(tǒng)的計(jì)算來(lái)確定是否納入方程。因此可以分成三個(gè)組塊來(lái)完成:①在第一組塊Block1中使用強(qiáng)行介入法Enter,選“土壤成分”、“化肥”和“種谷物的產(chǎn)量”為自變量。單擊“Next”按鈕。②在第二組塊Block2中使用強(qiáng)行剔除Remove,選擇“種谷物的產(chǎn)量”。再單擊“Next”按鈕。③在第三組塊Block3中使用正向進(jìn)入Forward,選擇其它自變量。在最后結(jié)果中,“土壤成分”、“化肥”將成為自變量無(wú)條件進(jìn)入方程,而“種谷物的產(chǎn)量”將不出現(xiàn)在方程中,其它自變量將根據(jù)其對(duì)方程的作用顯著程度決定是否進(jìn)入方程?!癝electionVariable”為指定抽樣變量以及抽樣規(guī)則。例如:以年份year為抽樣變量,并指定抽樣規(guī)則為1985年以后的樣本,則可以指定“SelectionVariable”為year。在定義抽樣規(guī)則項(xiàng)“DefineSelectionrule”中定義:Greaterthan1985。⒊統(tǒng)計(jì)量的計(jì)算單擊計(jì)算統(tǒng)計(jì)按鈕:“Statistics”在計(jì)算統(tǒng)計(jì)對(duì)話窗口中,可以見到如下幾方面的內(nèi)容:⑴回歸系數(shù)的計(jì)算RegressionCoefficients:①“Estimates”計(jì)算各個(gè)自變量的回歸系數(shù)B、相關(guān)系數(shù)R、標(biāo)準(zhǔn)誤SEB、標(biāo)準(zhǔn)化回歸系數(shù)Beta、t檢驗(yàn)的雙側(cè)概率以及容忍度Tolerance。②“Confidenceinterval”回歸系數(shù)的95%的置信區(qū)間。③“Covariancematrix”生成協(xié)方差矩陣。⑵統(tǒng)計(jì)輸出選項(xiàng)①“Modelfit”模式擬合。計(jì)算相關(guān)系數(shù)R、可決系數(shù)R2、調(diào)整相關(guān)系數(shù)AdjustedR-Square以及計(jì)算標(biāo)準(zhǔn)誤Std.ErrorofEstimates。②“Rsquaredchange”可決系數(shù)的變化。當(dāng)納入的一個(gè)自變量的可決系數(shù)顯著大于其它自變量的可決系數(shù),說(shuō)明該自變量能夠很好地描述因變量。③“Descriptives”計(jì)算描述統(tǒng)計(jì)量:平均值、標(biāo)準(zhǔn)差、相關(guān)系數(shù)的顯著度水平的檢驗(yàn)矩陣。④“PartandpartialCorrelate”計(jì)算零階以及偏相關(guān)系數(shù)。⑤“Collinearitydiagnostics”自變量線性相關(guān)檢驗(yàn),即容忍度檢驗(yàn)。⑶殘差及樣本的檢驗(yàn)①“Durbin-Watson”杜賓-沃特森檢驗(yàn)對(duì)殘差的系列相關(guān)檢驗(yàn)。進(jìn)一步還計(jì)算殘差與自變量值的匯總統(tǒng)計(jì)。②“Casewisediagnostic”樣本診斷對(duì)符合回歸標(biāo)準(zhǔn)的樣本進(jìn)行檢驗(yàn),并產(chǎn)生樣本診斷表。其中有兩個(gè)標(biāo)準(zhǔn)可供選擇:●Outliersoutside(n)Standarddeviations:奇異值(Outlier)的診斷。定義大于n個(gè)標(biāo)準(zhǔn)差的樣本觀測(cè)值為奇異值。系統(tǒng)默認(rèn)n=3?!馎llcases:診斷所有的樣本。⒋生成回歸統(tǒng)計(jì)圖形單擊統(tǒng)計(jì)圖形按鈕“Plots”可以定義作圖變量以及圖形類型。系統(tǒng)將根據(jù)所選擇的變量和圖形類型產(chǎn)生相應(yīng)的圖形。圖形包括:①散點(diǎn)圖(Scatterplot)在對(duì)話窗口變量列表中選擇自變量X和因變量Y建立圖形。圖形中的每個(gè)點(diǎn)將是這兩個(gè)變量的值決定的。用“Scatternof”的按鈕“Previous”和“Next”可以定義更多的自變量X和因變量Y來(lái)產(chǎn)生圖形。圖形對(duì)話窗口允許生成最多達(dá)9個(gè)散點(diǎn)圖。變量列表中的變量分別表示:DEPENDENT:因變量*ZPRED標(biāo)準(zhǔn)化預(yù)測(cè)值(預(yù)測(cè)值就是回歸后因變量的取值,區(qū)別于回歸前的觀測(cè)值)*ZRESID標(biāo)準(zhǔn)化殘差(預(yù)測(cè)值與觀測(cè)值之差的標(biāo)準(zhǔn)化)*DRESID剔除殘差*ADJPRED調(diào)整預(yù)測(cè)值*SRESID經(jīng)過(guò)t值化的殘差*SDRESID經(jīng)過(guò)t值化的剔除殘差②偏回歸圖復(fù)選項(xiàng)“Produceallpartialplot”將生成每個(gè)自變量的殘差同因變量的殘差圖。③標(biāo)準(zhǔn)化殘差圖復(fù)選項(xiàng)“Histogram”標(biāo)準(zhǔn)化殘差的直方圖。復(fù)選項(xiàng)“Normalprobabilityplot”正態(tài)概率圖,顯示了標(biāo)準(zhǔn)化殘差的觀測(cè)積累概率同期望積累概率的關(guān)系。五、保存變量“Save”將把分析產(chǎn)生的結(jié)果用新變量保存起來(lái)??梢员4娴男伦兞坑校孩兕A(yù)測(cè)值項(xiàng)PredictedValuesUnstandardized非標(biāo)準(zhǔn)化預(yù)測(cè)值變量Standardized標(biāo)準(zhǔn)化預(yù)測(cè)值變量Adjusted調(diào)整預(yù)測(cè)值變量S.E.ofmeanpredictions預(yù)測(cè)值的標(biāo)準(zhǔn)誤變量②距離值項(xiàng)Distances保存有關(guān)不同距離計(jì)算的變量:Mahalanobis關(guān)于Mahalanobis距離變量Cook's關(guān)于Cook距離變量Leveragevalues關(guān)于中心點(diǎn)杠桿值變量預(yù)測(cè)區(qū)間項(xiàng)Predictionintervals保存預(yù)測(cè)區(qū)間有關(guān)的變量:Mean預(yù)測(cè)區(qū)間上下限的平均值變量Individual觀測(cè)區(qū)間變量③殘差項(xiàng)Residuals保存有關(guān)殘差的變量Unstandardized非標(biāo)準(zhǔn)化殘差變量Standardized標(biāo)準(zhǔn)化殘差變量Studentized學(xué)生化殘差變量Deleted剔除殘差變量StandardizedDeleted標(biāo)準(zhǔn)化剔除殘差變量④影響統(tǒng)計(jì)項(xiàng)Influencestatistics保存有關(guān)影響統(tǒng)計(jì)的變量DfBeta(s)產(chǎn)生的變量將反映:剔除一個(gè)可能是影響點(diǎn)的觀測(cè)值所引起的回歸系數(shù)的變化。當(dāng)一個(gè)觀測(cè)值的標(biāo)準(zhǔn)化殘差的絕對(duì)值超過(guò)3,則該觀測(cè)值就是奇異值,回歸運(yùn)算不應(yīng)考慮StandardizedDfBeta(s)經(jīng)標(biāo)準(zhǔn)化的DfBeta(s)值。DfFit產(chǎn)生的變量將反映:剔除一個(gè)可能是影響點(diǎn)的觀測(cè)值所引起的預(yù)測(cè)值的變化。CovarianceRatio生成一個(gè)協(xié)方差率矩陣。該矩陣將是剔除一個(gè)可能是影響點(diǎn)的觀測(cè)值后的協(xié)方差矩陣與保留全部觀測(cè)值的協(xié)方差矩陣之比。⑤Savetonewfile項(xiàng)選項(xiàng)CoefficientsStatistics的作用是生成一個(gè)關(guān)于回歸系數(shù)的文件。六、選項(xiàng)“Options”選項(xiàng):⑴SteppingMethodCriteria項(xiàng)本選項(xiàng)是設(shè)置變量納入方程或從方程中剔除的判據(jù)的。UseprobabilityofF用F檢驗(yàn)的顯著度水平SigF。默認(rèn)值F的Pin<=0.05可以納入回歸方程。F的Pout>=0.1將從回歸方程中剔除。UseFvalue用F檢驗(yàn)的F值本身為判據(jù)。當(dāng)Fin值>=3.84,將可以納入回歸方程。當(dāng)Fout值<=2.71,將從回歸方程中剔除。⑵Includeconstantinequation在回歸方程中是否包含常數(shù)項(xiàng)。⑶Missingvalue項(xiàng)Excludecaseslistwise排除列表中變量含有缺失值的樣本。Excludecasespariwise排除運(yùn)算變量含有缺失值的樣本。Replacewithmean用平均值代替缺失值參與運(yùn)算。七、線性回歸分析所產(chǎn)生的結(jié)果經(jīng)過(guò)線性回歸分析,可以產(chǎn)生的主要結(jié)果有:⒈回歸方程

例如:Salnow=1.73408Salbeg+2.98048960Edle

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論