回歸分析之理解和實例課件_第1頁
回歸分析之理解和實例課件_第2頁
回歸分析之理解和實例課件_第3頁
回歸分析之理解和實例課件_第4頁
回歸分析之理解和實例課件_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2023/8/151回歸分析

2023/8/11回歸分析12023/8/152回歸分析◆回歸分析概述

●功能:回歸分析是研究一個變量(即因變量)(或多個變量)對于一個或多個其他變量(即解釋變量)的依存關(guān)系,并用數(shù)學(xué)模型加以模擬,目的在于根據(jù)已知的或在多次重復(fù)抽樣中固定的解釋變量之值,估計、預(yù)測因變量的總體平均值

◆涵義:一般地,把在研究回歸模型時所采用的估計、計算方法,檢驗、分析理論統(tǒng)稱為回歸分析?;貧w分析方法又稱因素分析方法、經(jīng)濟(jì)計量模型方法。屬于多元統(tǒng)計分析方法之一。2023/8/12回歸分析◆回歸分析概述22023/8/153回歸分析回歸分析◆回歸分析的研究思路和步驟

●根據(jù)研究問題的性質(zhì)、要求建立回歸模型。

●根據(jù)樣本觀測值對回歸模型參數(shù)進(jìn)行估計,求得回歸方程。對回歸方程、參數(shù)估計值進(jìn)行顯著性檢驗。并從影響因變量的自變量中判斷哪些顯著,哪些不顯著。

●利用回歸方程進(jìn)行預(yù)測。2023/8/13回歸分析回歸分析32023/8/154回歸分析

◆回歸分析包括:一元回歸、多元回歸以及線性回歸和非線性回歸:一元回歸:Y(因變量)取值:y1y2y3…X(自變量)取值:x1x2x3…建立一元線性回歸方程:Y=BX+C(方程中的B為回歸系數(shù),C為常數(shù))或者是非線性回歸方程:Y=f(X)2023/8/14回歸分析◆回歸分析包括:一元回歸42023/8/155回歸分析回歸分析

◆多元回歸:Y(因變量)取值:y1y2y3…X1(自變量1)取值:x11x12x13…X2(自變量2)取值:x21x22x23…

……Xn(自變量n)取值:xn1xn2xn3…

建立多元線性回歸方程:Y=B1X1+B2X2…+BnXn+B0(方程中的Bi為回歸系數(shù))或者是非線性回歸方程:Y=f(X1X2…Xn)2023/8/15回歸分析回歸分析5在大多數(shù)的實際問題中,影響因變量的因素不是一個而是多個,我們稱這類回問題為多元回歸分析。可以建立因變量y與各自變量xj(j=1,2,3,…,n)之間的多元線性回歸模型:其中:b0是回歸常數(shù);bk(k=1,2,3,…,n)是回歸參數(shù);e是隨機誤差。在大多數(shù)的實際問題中,影響因變量的因素不是一個而是多個,我們62023/8/157回歸分析線性回歸分析◆執(zhí)行菜單命令[Analyze][Regression][Linear]●選擇因變量到:“Dependent”因變量框內(nèi)●選擇若干個自變量移動到:“Independent(s)”自變量框內(nèi)2023/8/17回歸分析線性回歸分析72023/8/158回歸分析線性回歸分析◆回歸方法●“Method”下拉菜單提供了五種回歸方法供選擇:強行介入法Enter正向進(jìn)入Forward反向剔除Backward逐步進(jìn)入Stepwise強行剔除Remove2023/8/18回歸分析線性回歸分析82023/8/159回歸分析回歸分析◆自變量納入回歸方程的方式●強行介入法Enter(一次性進(jìn)入)這是一種不檢驗F和Tolerance,一次將全部自變量無條件地納入回歸方程?!駨娦刑蕹齊emove(一次性剔除)指定某些變量不能進(jìn)入方程。這種方法通常同別的方法聯(lián)合使用,而不能首先或單獨使用,因為第一次使用或單獨使用將意味著沒有哪個變量進(jìn)入方程。2023/8/19回歸分析回歸分析92023/8/1510回歸分析回歸分析

◆自變量納入回歸方程的方式●逐步進(jìn)入Stepwise每次選擇符合進(jìn)入條件的自變量進(jìn)入方程,進(jìn)入后立即檢驗,不合格者剔除,直到全部合格自變量進(jìn)入方程●反向剔除Backward先強行介入,再逐個剔除不合格變量,直到全合格●正向進(jìn)入Forward每次選擇符合進(jìn)入條件的自變量進(jìn)入方程,逐個選擇,逐個進(jìn)入,直到全部合格自變量進(jìn)入方程2023/8/110回歸分析回歸分析10線性回歸分析中的共線性檢測(一)共線性帶來的主要問題高度的多重共線性會使回歸系數(shù)的標(biāo)準(zhǔn)差隨自變量相關(guān)性的增大而不斷增大,以至使回歸系數(shù)的置信區(qū)間不斷增大,造成估計值精度減低.回歸方程檢驗顯著但所有偏回歸系數(shù)均檢驗不顯著偏回歸系數(shù)估計值大小或符號與常識不符定性分析對因變量肯定有顯著影響的因素,在多元分析中檢驗不顯著,不能納入方程去除一個變量,偏回歸系數(shù)估計值發(fā)生巨大變化線性回歸分析中的共線性檢測(一)共線性帶來的主要問題11線性回歸分析中的共線性檢測(二)共線性診斷自變量的容忍度(tolerance)和方差膨脹因子容忍度:Toli=1-Ri2.其中:Ri2是自變量xi與方程中其他自變量間的復(fù)相關(guān)系數(shù)的平方.容忍度越大則與方程中其他自變量的共線性越低,應(yīng)進(jìn)入方程.(具有太小容忍度的變量不應(yīng)進(jìn)入方程,spss會給出警告)(據(jù)經(jīng)驗T<0.1一般認(rèn)為具有多重共線性)方差膨脹因子(VIF):容忍度的倒數(shù)SPSS在回歸方程建立過程中不斷計算待進(jìn)入方程自變量的容忍度,并顯示目前的最小容忍度線性回歸分析中的共線性檢測(二)共線性診斷12多重共線性的對策增大樣本量(不太可能)多種自變量篩選方法結(jié)合(選擇最優(yōu)方程)人為去除次要變量(定性分析為較次要,或無需分析)主成分回歸分析(提取因子作為影響因素)多重共線性的對策增大樣本量(不太可能)13多元回歸應(yīng)用實例某地區(qū)病蟲測報站用相關(guān)系數(shù)法選取了以下4個預(yù)報因子;x1為最多連續(xù)10天誘蛾量(頭);x2為4月上、中旬百束小谷草把累計落卵量(塊);x3為4月中旬降水量(毫米),x4為4月中旬雨日(天);預(yù)報粘蟲幼蟲發(fā)生量y(頭/m2)。分級別數(shù)值列成表2-1。多元回歸應(yīng)用實例某地區(qū)病蟲測報站用相關(guān)系數(shù)法選取了以下4個預(yù)14回歸分析之理解和實例ppt課件15分析預(yù)報量y:每平方米幼蟲0~10頭為1級,11~20頭為2級,21~40頭為3級,40頭以上為4級。

預(yù)報因子:x1誘蛾量0~300頭為l級,301~600頭為2級,601~1000頭為3級,1000頭以上為4級;x2卵量0~150塊為1級,15l~300塊為2級,301~550塊為3級,550塊以上為4級;x3降水量0~10.0毫米為1級,10.1~13.2毫米為2級,13.3~17.0毫米為3級,17.0毫米以上為4級;x4雨日0~2天為1級,3~4天為2級,5天為3級,6天或6天以上為4級。

分析161)準(zhǔn)備分析數(shù)據(jù)在SPSS數(shù)據(jù)編輯窗口中,創(chuàng)建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼蟲密度”變量,并輸入數(shù)據(jù)。再創(chuàng)建蛾量、卵量、降水量、雨日和幼蟲密度的分級變量“x1”、“x2”、“x3”、“x4”和“y”,它們對應(yīng)的分級數(shù)值可以在SPSS數(shù)據(jù)編輯窗口中通過計算產(chǎn)生。1)準(zhǔn)備分析數(shù)據(jù)在SPSS數(shù)據(jù)編輯窗口中,創(chuàng)建“年份”、“17回歸分析之理解和實例ppt課件18單擊SPSS主菜單的“Analyze”下的“Regression”中“Linear”項,將打開線性回歸過程窗口。單擊SPSS主菜單的“Analyze”下的“Regressi193)設(shè)置分析變量設(shè)置因變量:用鼠標(biāo)選中左邊變量列表中的“幼蟲密度[y]”變量,然后點擊“Dependent”欄左邊的向右拉按鈕,該變量就移到“Dependent”因變量顯示欄里。設(shè)置自變量:將左邊變量列表中的“蛾量[x1]”、“卵量[x2]”、“降水量[x3]”、“雨日[x4]”變量,選移到“Independent(S)”自變量顯示欄里。設(shè)置控制變量:本例子中不使用控制變量,所以不選擇任何變量。選擇標(biāo)簽變量:選擇“年份”為標(biāo)簽變量。選擇加權(quán)變量:本例子沒有加權(quán)變量,因此不作任何設(shè)置。3)設(shè)置分析變量204)回歸方式本例子中的4個預(yù)報因子變量是經(jīng)過相關(guān)系數(shù)法選取出來的,在回歸分析時不做篩選。因此在“Method”框中選中“Enter”選項,建立全回歸模型。4)回歸方式215)設(shè)置輸出統(tǒng)計量

單擊“Statistics”按鈕,將打開如圖對話框。該對話框用于設(shè)置相關(guān)參數(shù)。其中各項的意義分別為:

5)設(shè)置輸出統(tǒng)計量

單擊“Statistics”按鈕,將打開22①“RegressionCoefficients”回歸系數(shù)選項:

“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計量。

“Confidenceinterval”回歸系數(shù)的95%置信區(qū)間。

“Covariancematrix”回歸系數(shù)的方差-協(xié)方差矩陣。本例子選擇“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計量。①“RegressionCoefficients”回歸系數(shù)23②“Residuals”殘差選項:“Durbin-Watson”Durbin-Watson檢驗。

“Casewisediagnostic”輸出滿足選擇條件的觀測量的相關(guān)信息。選擇該項,下面兩項處于可選狀態(tài):

“Outliersoutsidestandarddeviations”選擇標(biāo)準(zhǔn)化殘差的絕對值大于輸入值的觀測量;

“Allcases”選擇所有觀測量。本例子都不選。②“Residuals”殘差選項:“Durbin-Watso24③

其它輸入選項“Modelfit”輸出相關(guān)系數(shù)、相關(guān)系數(shù)平方、調(diào)整系數(shù)、估計標(biāo)準(zhǔn)誤、ANOVA表。

“Rsquaredchange”輸出由于加入和剔除變量而引起的復(fù)相關(guān)系數(shù)平方的變化。

“Descriptives”輸出變量矩陣、標(biāo)準(zhǔn)差和相關(guān)系數(shù)單側(cè)顯著性水平矩陣。

“Partandpartialcorrelation”相關(guān)系數(shù)和偏相關(guān)系數(shù)。

“Collinearitydiagnostics”顯示單個變量和共線性分析的公差。本例子選擇“Modelfit”項。③其它輸入選項“Modelfit”輸出相關(guān)系數(shù)、相關(guān)系數(shù)256)繪圖選項在主對話框單擊“Plots”按鈕,將打開如圖所示的對話框窗口。該對話框用于設(shè)置要繪制的圖形的參數(shù)。圖中的“X”和“Y”框用于選擇X軸和Y軸相應(yīng)的變量。6)繪圖選項在主對話框單擊“Plots”按鈕,將打開如圖所示26左上框中各項的意義分別為:“DEPENDNT”因變量?!癦PRED”標(biāo)準(zhǔn)化預(yù)測值?!癦RESID”標(biāo)準(zhǔn)化殘差?!癉RESID”刪除殘差?!癆DJPRED”調(diào)節(jié)預(yù)測值。“SRESID”學(xué)生氏化殘差。“SDRESID”學(xué)生氏化刪除殘差。“StandardizedResidualPlots”設(shè)置各變量的標(biāo)準(zhǔn)化殘差圖形輸出。其中共包含兩個選項:“Histogram”用直方圖顯示標(biāo)準(zhǔn)化殘差。

“Normalprobabilityplots”比較標(biāo)準(zhǔn)化殘差與正態(tài)殘差的分布示意圖?!癙roduceallpartialplot”偏殘差圖。對每一個自變量生成其殘差對因變量殘差的散點圖。本例子不作繪圖,不選擇。左上框中各項的意義分別為:277)保存分析數(shù)據(jù)的選項在主對話框里單擊“Save”按鈕,將打開如圖所示的對話框。7)保存分析數(shù)據(jù)的選項在主對話框里單擊“Save”按鈕,將28①“PredictedValues”預(yù)測值欄選項:Unstandardized非標(biāo)準(zhǔn)化預(yù)測值。就會在當(dāng)前數(shù)據(jù)文件中新添加一個以字符“PRE_”開頭命名的變量,存放根據(jù)回

歸模型擬合的預(yù)測值。

Standardized標(biāo)準(zhǔn)化預(yù)測值。

Adjusted調(diào)整后預(yù)測值。

S.E.ofmeanpredictions預(yù)測值的標(biāo)準(zhǔn)誤。本例選中“Unstandardized”非標(biāo)準(zhǔn)化預(yù)測值。②“Distances”距離欄選項:Mahalanobis:距離。

Cook’s”:Cook距離。

Leveragevalues:杠桿值。①“PredictedValues”預(yù)測值欄選項:29③“PredictionIntervals”預(yù)測區(qū)間選項:Mean:區(qū)間的中心位置。

Individual:觀測量上限和下限的預(yù)測區(qū)間。在當(dāng)前數(shù)據(jù)文件中新添加一個以字符“LICI_”開頭命名的變量,存放

預(yù)測區(qū)間下限值;以字符“UICI_”開頭命名的變量,存放預(yù)測區(qū)間上限值。

ConfidenceInterval:置信度。本例不選。④“SavetoNewFile”保存為新文件:選中“Coefficientstatistics”項將回歸系數(shù)保存到指定的文件中。本例不選。⑤“ExportmodelinformationtoXMLfile”

導(dǎo)出統(tǒng)計過程中的回歸模型信息到指定文件。本例不選。③“PredictionIntervals”預(yù)測區(qū)間選項:30⑥“Residuals”保存殘差選項:“Unstandardized”非標(biāo)準(zhǔn)化殘差。

“Standardized”標(biāo)準(zhǔn)化殘差。

“Studentized”學(xué)生氏化殘差。

“Deleted”刪除殘差。

“Studentizeddeleted”學(xué)生氏化刪除殘差。本例不選。⑦“InfluenceStatistics”統(tǒng)計量的影響?!癉fBeta(s)”刪除一個特定的觀測值所引起的回歸系數(shù)的變化。

“StandardizedDfBeta(s)”標(biāo)準(zhǔn)化的DfBeta值。

“DiFit”刪除一個特定的觀測值所引起的預(yù)測值的變化。

“StandardizedDiFit”標(biāo)準(zhǔn)化的DiFit值。

“Covarianceratio”刪除一個觀測值后的協(xié)方差矩隈的行列式和帶有全部觀測值的協(xié)方差矩陣的行列式的比率。本例子不保存任何分析變量,不選擇。⑥“Residuals”保存殘差選項:318)其它選項

在主對話框里單擊“Options”按鈕,將打開如圖所示的對話框。

8)其它選項

在主對話框里單擊“Options”按鈕,將打開32①“SteppingMethodCriteria”

框用于進(jìn)行逐步回歸時內(nèi)部數(shù)值的設(shè)定。其中各項為:“Useproba

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論