相關分析與回歸分析SPSS實現_第1頁
相關分析與回歸分析SPSS實現_第2頁
相關分析與回歸分析SPSS實現_第3頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、相關分析與回歸分析、試驗目標與要求本試驗工程的目的是學習并使用 SPSS軟件進行相關分析和回歸分析,具體 包括:(1) 皮爾遜pearson簡單相關系數的計算與分析(2) 學會在SPS上實現一元與多元回歸模型的計算與檢驗。(3) 學會回歸模型的散點圖與樣本方程圖形。(4) 學會對所計算結果進行統(tǒng)計分析說明。(5) 要求試驗前,了解回歸分析的如下容。參數a、B的估計回歸模型的檢驗方法:回歸系數B的顯著性檢驗(t 檢驗);回歸 方程顯著性檢驗(F 檢驗)。、試驗原理1 相關分析的統(tǒng)計學原理相關分析使用某個指標來說明現象之間相互依存關系的密切程度。用來測度簡單線性相關關系的系數是Pearson簡單相

2、關系數。2 回歸分析的統(tǒng)計學原理相關關系不等于因果關系,要明確因果關系必須借助于回歸分析?;貧w分析是研究兩個變量或多個變量之間因果關系的統(tǒng)計方法。其根本思想是,在相關分析的根底上,對具有相關關系的兩個或多個變量之間數量變化的一般關系進行測 定,確立一個適宜的數據模型,以便從一個量推斷另一個未知量。 回歸分析 的主要任務就是根據樣本數據估計參數, 建立回歸模型,對參數和模型進行檢驗 和判斷,并進行預測等。線性回歸數學模型如下:y 0 i Xii 2X12k Xiki在模型中,回歸系數是未知的,可以在已有樣本的根底上,使用最小二乘法 對回歸系數進行估計,得到如下的樣本回歸函數:yi?Xi1k Xi

3、kei回歸模型中的參數估計出來之后,還必須對其進行檢驗。如果通過檢驗發(fā)現重新選擇被解釋變量模型有缺陷,那么必須回到模型的設定階段或參數估計階段, 和解釋變量與其函數形式,或者對數據進行加工整理之后再次估計參數?;貧w模 型的檢驗包括一級檢驗和二級檢驗。 一級檢驗又叫統(tǒng)計學檢驗,它是利用統(tǒng)計學 的抽樣理論來檢驗樣本回歸方程的可靠性,具體又可以分為擬和優(yōu)度評價和顯著 性檢驗;二級檢驗又稱為經濟計量學檢驗,它是對線性回歸模型的假定條件能否 得到滿足進行檢驗,具體包括序列相關檢驗、異方差檢驗等。三、試驗演示容與步驟1 連續(xù)變量簡單相關系數的計算與分析在上市公司財務分析中,常常利用資產收益率、凈資產收益率

4、、每股凈收益 和托賓Qfi4個指標來衡量公司經營績效。本試驗利用 SPS對這4個指標的相關性 進行檢驗。操作步驟與過程:翻開數據文件“上市公司財務數據連續(xù)變量相關分析.sav ,依次選擇 “分析相關雙變量翻開對話框如圖,將待分析的4個指標移入右邊 的變量列表框。其他均可選擇默認項,單擊 ok提交系統(tǒng)運行。圖 5.1 Bivariate Correlations對話框結果分析:表給出了 Pearson簡單相關系數,相關檢驗t統(tǒng)計量對應的p值。相關系數右上 角有兩個星號表示相關系數在0.01的顯著性水平下顯著。從表中可以看出,每股收益、凈資產收益率和總資產收益率3個指標之間的相關系數都在0.8以上

5、,對應 的p值都接近0,表示3個指標具有較強的正相關關系,而托賓 0值與其他3個變量 之間的相關性較弱。表5.1 Pearson簡單相關分析Correlations每股收益率凈資產收益率資產收益率托賓C值每股收益率Pearson1.877(*).824(*)-.073CorrelationSig. (2-tailed).000.000.199N315315315315凈資產收益率Pearson.877(*)1.808(*)-.001CorrelationSig. (2-tailed).000.000.983N315315315315資產收益率Pearson.824(*).808(*)1.011

6、CorrelationSig. (2-tailed).000.000.849N315315315315托賓C值Pearson-.073-.001.0111CorrelationSig. (2-tailed).199.983.849N315315315315* Correlation is significant at the 0.01 level (2-tailed).2元線性回歸分析實例分析:家庭住房支出與年收入的回歸模型在這個例子里,考慮家庭年收入對住房支出的影響,建立的模型如下:yixi i其中,yi是住房支出,xi是年收入線性回歸分析的根本步驟與結果分析:(1) 繪制散點圖 翻開數據文

7、件,選擇圖形卜舊對話框卜散點/點狀,如 圖5.2所示。圖5.2散點圖對話框選擇簡單分布,單擊定義,翻開子對話框,選擇X變量和Y變量,如圖5.3所示單擊ok提交系統(tǒng)運行,結果見圖5.4所示圖 5.3 Simple Scatterplot子對話框從圖上可直觀地看出住房支出與年收入之間存在線性相關關系7 0(r-6 00-5 00-4 00-3 00-2 QO-1 00-80080 86.t)0BOO10.0012.00 1J.OO 16.0018.0020.00年收入T%)圖5.4散點圖2簡單相關分析選擇分析 相關 雙變量,翻開對話框,將變量“住房支出與“年收入移入variables列表框,點擊o

8、k運行,結果如表5.2所示。表5.2住房支岀與年收入相關系數表Correlations住房支岀千美元年收入千美元住房支岀千美元Pearson Correlation1.966(*)Sig. (2-tailed).000N2020年收入千美元Pearson Correlation.966(*)1Sig. (2-tailed).000N2020* Correlation is significant at the 0.01 level (2-tailed).從表中可得到兩變量之間的皮爾遜相關系數為0.966,雙尾檢驗概率p值尾0.0000.05 ,故變量之間顯著相關。根據住房支出與年收入之間的散點

9、圖與相關 分析顯示,住房支出與年收入之間存在顯著的正相關關系。在此前提下進一步進行回歸分析,建立一元線性回歸方程。3線性回歸分析步驟1:選擇菜單“分析 回歸 線性,翻開Lin ear Regressi on 對話框。將變量住房支出y移入Dependent列表框中,將年收入x移入Independents 列表框中。在Method框中選擇Enter選項,表示所選自變量全部進入回歸模型。圖 5.5 Lin ear Regresssi on對話框步驟2:單擊Statistics按鈕,如圖在Statistics 子對話框。該對話框中設置要輸出的統(tǒng)計量。這里選中估計、模型擬合度復選框。圖5.6 Stati

10、stics 子對話框估計:輸出有關回歸系數的統(tǒng)計量,包括回歸系數、回歸系數的標準 差、標準化的回歸系數、t統(tǒng)計量與其對應的P值等。置信區(qū)間:輸出每個回歸系數的95%的置信度估計區(qū)間。協(xié)方差矩陣:輸出解釋變量的相關系數矩陣和協(xié)差陣。模型擬合度:輸出可決系數、調整的可決系數、回歸方程的標準誤差、 回歸方程F檢驗的方差分析。步驟3:單擊繪制按鈕,在Plots子對話框中的標準化殘差圖選項欄中選中正 態(tài)概率圖復選框,以便對殘差的正態(tài)性進行分析。圖5.7 plots 子對話框步驟4:單擊保存按鈕,在Save子對話框中殘差選項欄中選中未標準化復選框, 這樣可以在數據文件中生成一個變量名尾res_1的殘差變量

11、,以便對殘差進行進 一步分析。圖5.8 Save子對話框其余保持Spss默認選項。在主對話框中單擊ok按鈕,執(zhí)行線性回歸命令,其 結果如下:表5.3給出了回歸模型的擬和優(yōu)度(RSquare)、調整的擬和優(yōu)度(Adjusted R Square)、估計標準差(Std. Error of the Estimate )以與 Durbin Watson 統(tǒng)計量。從結果來看,回歸的可決系數和調整的可決系數分別為0.934和0.93 ,即住房支出的90%以上的變動都可以被該模型所解釋,擬和優(yōu)度較高。表5.4給出了回歸模型的方差分析表,可以看到,F統(tǒng)計量為252.722,對應的 p值為0,所以,拒絕模型整體

12、不顯著的原假設,即該模型的整體是顯著的。表5.5給出了回歸系數、回歸系數的標準差、標準化的回歸系數值以與各個回 歸系數的顯著性t檢驗。從表中可以看到無論是常數項還是解釋變量x,其t統(tǒng)計量對應的p值都小于顯著性水平0.05,因此,在0.05的顯著性水平下都通過了 t 檢驗。變量x的回歸系數為0.237,即年收入每增加1千美元,住房支出就增加0.237 千美元。表5.3回歸模型擬和優(yōu)度評價與 Durbin Watson檢驗結果Model Summary(b)ModelRR SquareAdjusted RSquareStd. Error of the Estimate1.966(a).934.93

13、0.37302a Predictors: (Constant), 年收入(千美元) b Dependent Variable:住房支出(千美元)表5.4方差分析表ANOVA(b)ModelSum ofSquaresdfMean SquareFSig.1Regression35.165135.165252.722.000(a)Residual2.50518.139Total37.67019a Predictors: (Constant),年收入(千美元)b Dependent Variable:住房支出(千美元)表5.5回歸系數估計與其顯著性檢驗Coefficients(a)ModelUnsta

14、ndardizedCoefficientsStandardizedCoefficientsBetatSig.BStd. Error1(Constant).890.2044.356.000年收入(千美元).237.015.96615.897.000a Dependent Variable:住房支出(千美元)為了判斷隨機擾動項是否服從正態(tài)分布,觀察圖5.9所示的標準化殘差的P P圖,可以發(fā)現,各觀測的散點根本上都分布在對角線上, 據此可以初步判斷殘差 服從正態(tài)分布。為了判斷隨機擾動項是否存在異方差,根據被解釋變量 y與解釋變量x的散點 圖,如圖5.4所示,從圖中可以看到,隨著解釋變量x的增大,被解

15、釋變量的波動 幅度明顯增大,說明隨機擾動項可能存在比擬嚴重的異方差問題, 應該利用加權 最小二乘法等方法對模型進行修正。Normal P-P Plot of Regressi on Stan dardized ResidualDependent Variable:住房支出 千美元1.00.8 -uc deLceDKC0.6 -0.40.20.00.00.20.40.60.81.0Observed Cum Prob圖5.9標準化殘差的P- P圖四、備擇試驗現有19872003年省全社會固定資產投資總額NINV和GD兩個指標的年度數 據,見下表。試研究全社會固定資產投資總額和 GD的數量關系,并建立全社會 固定資產投資總額和GD之間的線性回歸方程。省全社會固定資產投資和GDI年度數據年份GDP億元NINV 億元年份GDP億元NINV億元198750

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論