版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、Good is good, but better carries it.精益求精,善益求善。spss多元線性回歸實例-SPSS19.0實戰(zhàn)之多元線性回歸分析(2011-12-0912:19:11)HYPERLINKjavascript:;轉載標簽:HYPERLINK/?c=blog&q=%CE%C4%BB%AF&by=tagt_blank文化分類:HYPERLINK/s/articlelist_2482873935_10_1.htmlt_blank軟件介紹線性回歸數據(全國各地區(qū)能源消耗量與產量)來源,可點擊協(xié)會博客數據挖掘欄:國泰安數據服務中心的經濟研究數據庫。1.1數據預處理數據預處理包括
2、的內容非常廣泛,包括數據清理和描述性數據匯總,數據集成和變換,數據歸約,數據離散化等。本次實習主要涉及的數據預處理只包括數據清理和描述性數據匯總。一般意義的數據預處理包括缺失值填寫和噪聲數據的處理。于此我們只對數據做缺失值填充,但是依然將其統(tǒng)稱數據清理。1.1.1數據導入與定義單擊“打開數據文檔”,將xls格式的全國各地區(qū)能源消耗量與產量的數據導入SPSS中,如圖1-1所示。圖1-1導入數據導入過程中,各個字段的值都被轉化為字符串型(String),我們需要手動將相應的字段轉回數值型。單擊菜單欄的“”-“”將所選的變量改為數值型。如圖1-2所示:圖1-2定義變量數據類型1.1.2數據清理數據清
3、理包括缺失值的填寫和還需要使用SPSS分析工具來檢查各個變量的數據完整性。單擊“”-“”,將檢查所輸入的數據的缺失值個數以及百分比等。如圖1-3所示:圖1-3缺失值分析能源數據缺失值分析結果如表1-1所示:單變量統(tǒng)計N均值標準差缺失極值數目a計數百分比低高能源消費總量309638.506175.9240.001煤炭消費量309728.997472.2590.002焦炭消費量30874.611053.0080.002原油消費量281177.511282.74426.701汽油消費量30230.05170.2700.001煤油消費量2845.4066.18926.704柴油消費量30392.343
4、00.9790.002燃料油消費量30141.00313.4670.003天然氣消費量3019.5622.0440.002電力消費量30949.64711.6640.003原煤產量269125.9712180.689413.302焦炭產量291026.491727.73513.302原油產量181026.481231.7241240.000燃料油產量2590.72134.150516.703汽油產量26215.18210.090413.302煤油產量2048.4462.1301033.300柴油產量26448.29420.675413.301天然氣產量2029.2849.3911033.303
5、電力產量30954.74675.2300.000表2-1能源消耗量與產量數據缺失值分析表1-1能源消耗量與產量數據缺失值分析SPSS提供了填充缺失值的工具,點擊菜單欄“”-“”,即可以使用軟件提供的幾種填充缺失值工具,包括序列均值,臨近點中值,臨近點中位數等。結合本次實習數據的具體情況,我們不使用SPSS軟件提供的替換缺失值工具,主要是手動將缺失值用零值來代替。1.1.3描述性數據匯總描述性數據匯總技術用來獲得數據的典型性質,我們關心數據的中心趨勢和離中趨勢,根據這些統(tǒng)計值,可以初步得到數據的噪聲和離群點。中心趨勢的量度值包括:均值(mean),中位數(median),眾數(mode)等。離中
6、趨勢量度包括四分位數(quartiles),方差(variance)等。SPSS提供了詳盡的數據描述工具,單擊菜單欄的“”-“”-“”,將彈出如圖2-4所示的對話框,我們將所有變量都選取到,然后在選項中勾選上所希望描述的數據特征,包括均值,標準差,方差,最大最小值等。由于本次數據的單位不盡相同,我們需要將數據標準化,同時勾選上“將標準化得分另存為變量”。圖1-4描述性數據匯總得到如表1-2所示的描述性數據匯總。N極小值極大值均值標準差方差能源消費總量30911261649638.506175.92438142034.412煤炭消費量30332290019728.997472.259558346
7、51.378焦炭消費量30195461874.611053.0081108824.853原油消費量30055551099.011273.2651621202.562汽油消費量3018771230.05170.27028991.746煤油消費量30026242.3764.8964211.520柴油消費量30271368392.34300.97990588.441燃料油消費量3001574141.00313.46798261.261天然氣消費量30110619.5622.044485.947電力消費量30983004949.64711.664506464.953原煤產量300581427909.1
8、711741.3881.379E8焦炭產量3009202992.281707.9982917256.193原油產量2904341637.121085.3791178048.432燃料油產量30049775.60126.79116075.971汽油產量3001032186.49208.77143585.122煤油產量30021932.3055.3943068.535柴油產量3001911388.52420.216176581.285天然氣產量30016419.5242.3711795.341電力產量30972536954.74675.230455935.003有效的N(列表狀態(tài))29表1-2描述
9、性數據匯總標準化后得到的數據值,以下的回歸分析將使用標準化數據。如圖1-5所示:圖1-5數據標準化我們還可以通過描述性分析中的“”來得到各個變量的眾數,均值等,還可以根據這些量繪制直方圖。我們選取個別變量(能源消費總量)的直方圖,可以看到我們因變量基本符合正態(tài)分布。如圖1-6所示:圖1-6能源消費總量1.2回歸分析我們本次實驗主要考察地區(qū)能源消費總額(因變量)與煤炭消費量、焦炭消費量、原油消費量、原煤產量、焦炭產量、原油產量之間的關系。以下的回歸分析所涉及只包括以上幾個變量,并使用標準化之后的數據。1.2.1參數設置1.單擊菜單欄“”-“”-“”,將彈出如圖1-7所示的對話框,將通過選擇因變量
10、和自變量來構建線性回歸模型。因變量:標準化能源消費總額;自變量:標準化煤炭消費量、標準化焦炭消費量、標準化原油消費量、標準化原煤產量、標準化焦炭產量、標準化原油產量。自變量方法選擇:進入,個案標簽使用地名,不使用權重最小二乘法回歸分析即WLS權重為空。圖1-7選擇線性回歸變量還需要設置統(tǒng)計量的參數,我們選擇回歸系數中的“”和其他項中的“”。選中估計可輸出回歸系數B及其標準誤,t值和p值,還有標準化的回歸系數beta。選中模型擬合度復選框:模型擬合過程中進入、退出的變量的列表,以及一些有關擬合優(yōu)度的檢驗:R,R2和調整的R2,標準誤及方差分析表。如圖1-8所示:圖1-8設置回歸分析統(tǒng)計量3.在設
11、置繪制選項的時候,我們選擇繪制標準化殘差圖,其中的正態(tài)概率圖是rankit圖。同時還需要畫出殘差圖,Y軸選擇:ZRESID,X軸選擇:ZPRED。如圖1-9所示:圖1-9設置繪制左上框中各項的意義分別為:“DEPENDNT”因變量“ZPRED”標準化預測值“ZRESID”標準化殘差“DRESID”刪除殘差“ADJPRED”調節(jié)預測值“SRESID”學生化殘差“SDRESID”學生化刪除殘差4.許多時候我們需要將回歸分析的結果存儲起來,然后用得到的殘差、預測值等做進一步的分析,“保存”按鈕就是用來存儲中間結果的??梢源鎯Φ挠校侯A測值系列、殘差系列、距離(Distances)系列、預測值可信區(qū)間系
12、列、波動統(tǒng)計量系列。本次實驗暫時不保存任何項。5.設置回歸分析的一些選項,有:步進方法標準單選鈕組:設置納入和排除標準,可按P值或F值來設置。在等式中包含常量復選框:用于決定是否在模型中包括常數項,默認選中。如圖1-10所示:圖1-10設置選項1.2.2結果輸出與分析在以上選項設置完畢之后點擊確定,SPSS將輸出一系列的回歸分析結果。我們來逐一貼出和分析,并根據它得到最后的回歸方程以及驗證回歸模型。1.表1-3所示,是回歸分析過程中輸入、移去模型記錄。具體方法為:enter(進入)輸入移去的變量模型輸入的變量移去的變量方法1Zscore(原油產量),Zscore(原煤產量),Zscore(焦炭
13、消費量),Zscore(原油消費量),Zscore(煤炭消費量),Zscore(焦炭產量).輸入表1-3輸入的變量表1-4所示是模型匯總,R稱為多元相關系數,R方(R2)代表著模型的擬合度。我們可以看到該模型是擬合優(yōu)度良好。模型匯總模型匯總模型RR方調整R方標準估計的誤差Sig.1.962.925.905.30692707.000表1-4模型匯總3.表1-5所示是離散分析。,F(xiàn)的值較大,代表著該回歸模型是顯著。也稱為失擬性檢驗。模型平方和df均方F1回歸25.66064.27745.397殘差2.07222.094總計27.73228表1-5離散分析4.表1-6所示的是回歸方程的系數,根據這些
14、系數我們能夠得到完整的多元回歸方程。觀測以下的回歸值,都是具有統(tǒng)計學意義的。因而,得到的多元線性回歸方程:Y=0.008+1.061x1+0.087x2+0.157x3-0.365x4-0.105x5-0.017x6(x1為煤炭消費量,x2為焦炭消費量,x3為原油消費量,x4為原煤產量,x5為原炭產量,x6為原油產量,Y是能源消費總量)結論:能量消費總量由主要與煤炭消費總量所影響,成正相關;與原煤產量成一定的反比。系數模型非標準化系數標準系數tSig.B標準誤差beta1(常量).008.057.149.883Zscore(煤炭消費量)1.061.1261.0718.432.000Zscore(焦炭消費量).087.101.088.856.401Zscore(原油消費量).157.085.1591.848.078Zscore(原煤產量)-.365.155-.372-2.360.028Zscore(焦炭產量)-.105.150-.107-.697.493Zscore(原油產量)-.017.070-.017-
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東財貿職業(yè)學院《工程荷載與可靠度設計》2023-2024學年第一學期期末試卷
- 《客戶細分》課件
- 廣東碧桂園職業(yè)學院《餐飲經營與管理》2023-2024學年第一學期期末試卷
- 《民法學課件》課件
- 贛南醫(yī)學院《稅收籌劃》2023-2024學年第一學期期末試卷
- 贛南衛(wèi)生健康職業(yè)學院《混凝土與砌體結構設計B》2023-2024學年第一學期期末試卷
- 贛南科技學院《社會工作專業(yè)論文寫作》2023-2024學年第一學期期末試卷
- 司機培訓課件內容
- 《生兒肺透明膜病》課件
- 七年級語文上冊第五單元動物世界18狼高效教案新人教版
- 小學數學綜合素質評價專項方案
- 模型預測控制現(xiàn)狀與挑戰(zhàn)
- 閩教版2023版3-6年級全8冊英語單詞表
- MOOC創(chuàng)新創(chuàng)業(yè)與管理基礎(東南大學)
- 華為財務分析報告
- 快速出具舊機動車評估報告
- 人員保有培訓課件
- 水上拋石安全專項施工方案
- 中職課程思政說課比賽 課件
- 臺大歐麗娟《紅樓夢》公開課全部筆記
- 數據治理在物流行業(yè)的應用
評論
0/150
提交評論