數(shù)據(jù)分析作業(yè)_第1頁
數(shù)據(jù)分析作業(yè)_第2頁
數(shù)據(jù)分析作業(yè)_第3頁
數(shù)據(jù)分析作業(yè)_第4頁
數(shù)據(jù)分析作業(yè)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、多元線性回歸分析目錄實驗題目:車速與其他因素的多元線性回歸錯誤!未定義書簽。1數(shù)據(jù)分析11) 數(shù)據(jù)基本處理12) 單個自變量與因變量的相關(guān)性分析32線性回3求解103結(jié)果分析121數(shù)據(jù)分析1)數(shù)據(jù)基本處理察看所給數(shù)據(jù),發(fā)現(xiàn)區(qū)域變量數(shù)據(jù)沒有統(tǒng)計完全,即對其分類沒有完成,所以要進行下一步研究,必須先對數(shù)據(jù)完成分類,利用google地圖,將區(qū)域變量按照1為浦東地區(qū),2為浦西內(nèi)環(huán)以內(nèi),3為浦西內(nèi)環(huán)以外,完成數(shù)據(jù)統(tǒng)計,部分數(shù)據(jù)如下所示:多元線性回歸分析道路名起登點第段高峰運行速度所在區(qū)域RaadS電newSpeedR華出并虹橋路凱旅路-壽愚路34318342虹橋路番思路-宜山北路32.609232虹橋路

2、宜山北路-漕謨北路23.S57162肇豪浜路漕澳北路-天鑰橋路16.524482肇嘉浜路天鑰橋路-宛平路J6.SI9062董嘉浜路宛平路高安路43.744202里嘉浜路高安路二烏魯木齊南路J3.897742董真浜路烏魯木齊南路一岳陽路19.572032嘉浜路岳陽路-太原路34.139312鰲袁浜路太原路-襄陽南路一”987752里嘉浜路襄陽南路-大木橋路33,022172里真浜踏大木新路-陜西南路240641S2暨嘉浜路陜西南路-瑞金南路28554722徐家匯路瑞金南路-打浦路§2招5422長寧路水城路.美掾江路31.454673長寧路芙蓉江路-古北路2S.534653長寧路古北路錦

3、屏路25.984753長寧路錦屏路-婁山關(guān)路21,417193長寧路婁山美路遵義路22.632263長寧路遵義踣-中山西路6518723長寧路中山西路-凱旋路19.210902長寧路凱旋端匯川路23,702272對于行人過街形式,雖然應分為無行人過街,1次行人過街,2次行人過街和天橋或地道4種類型,但是由于采集的數(shù)據(jù)只有無行人過街和1次行人過街2種形式,所以這里也只區(qū)分這2種。確定其他數(shù)據(jù)無誤后,確定因變量是高峰運行車速(y),自變量暫定為所在區(qū)域(X1),道路長度(X2),高峰流量(X3),中央分隔(X4),機非分隔(X5),起點行人過街形式(X6),終點行人過街形式(X7)和接入口數(shù)量(X

4、8)。其中自變量道路長度、高峰流量和接入口數(shù)為數(shù)值型變量,其余自變量都是分類型自變量。對于分類型自變量都需要進行量化,即將定性的數(shù)據(jù)定量化描述,對于k個等級的定性變量,只要設(shè)定k-1個虛擬變量就行。具體定義如下表格:虛擬變量含義X11X12所在區(qū)域(X1)定性變量00浦東區(qū)10浦西內(nèi)環(huán)01浦四內(nèi)環(huán)外多元線性回歸分析虛擬變量含義X41X42中央分隔(X4)定性變量00無分隔10中央分隔欄01中央分隔帶虛擬變量含義X51X52機非分隔(X5)定性變量00無分隔10機非分隔欄01機非分隔帶虛擬變量X6含義起點行人過街形式(X6)定性變量0無行人過街11次行人過街時虛擬變量X7含義終點行人過街形式(X

5、7)定性變量0無行人過街11次行人過街時2)單個自變量與因變量的相關(guān)性分析對于道路長度、高峰流量和接入口數(shù)這樣的數(shù)值型自變量,我們采取畫散點圖觀察它們各自與因變量的關(guān)系。利用sas的統(tǒng)計功能得如下結(jié)果:圖一流量與速度散點圖.高幡運行速度多元線性回歸分析40-20-50015001000道路長度高峰運行謨度圖二長度與速度散點圖4U-0tlLI248接入口數(shù)里高幅運行速度圖三接入口數(shù)與速度散點圖從圖中可以看出流量與速度和長度與速度的線性相關(guān)度還是很高的,所以把這2個自變量引入回歸模型,并作為線性因變量,對于其對因變量的影響是否顯著,將在后面分析。而對于剩下的分類型變量,我采取列聯(lián)分析,去觀察相關(guān)性

6、。在分析之前,我先對因變量做如下變換:速度范圍(Km/h)等級10-20120-30230-40340-50450-60560-705然后使用sas得出各個分類變量與因變量的列聯(lián)表,再進行工方檢驗。其中檢驗假設(shè)為:H0:速度與區(qū)域之間相互獨立H1:速度與區(qū)域之間不獨立統(tǒng)計量服從自由度為(R-1)*(C-1)的工方分布,且我選擇置信水平為0.05。具體結(jié)果如下:(1)速度與所在區(qū)域列聯(lián)分析結(jié)果由結(jié)果可知,卡方值為37.118對應的概率小于0.05,所以拒絕H0,表明速度與區(qū)域之間存在相關(guān)性,至于相關(guān)性是否顯著將在回歸之后檢驗分析。多元線性回歸分析_G0LE(高雄運行速度)工此堂所在區(qū)嫉)1.a1

7、合計LX1Q2.7tQQ。,圜D.0C舊1S10.80辨,辨114.843$.251J013*6411扁n12.60L251。磔2,846.1722J369530333,52JE.B4朝工9n11.9E6£0,83GE.ae3146.02S15.62!22J:4133432.72719.9275,5626.56GB.647?9.4113.332908醒25.572212.50412.7!H.140.940.8J13167.3359.03110.1608.25O.OG(JJQQ.006J20-G25.1440.Of)9.0933-CSU1J0BO.OO£.34

8、00.7306Q,000.000.00L_52.3410.57j0J210.5100.01口間1100.72730.0。機®0.C000.14770.000.000.00合計L2:1乙511F11292E176"門314.77100.001£,C0L2眼_GOL3m表的統(tǒng)計量統(tǒng)計里自由度值想窣似京比卡方MintePHdenszBl卡方OOCraterV統(tǒng)計里37-11BO<.000134.9016o.eooi£1.4364<.C0010-45920.41730.3247TOHNG:Fisher精確檢檢表騰率(P)3,1Q?E-11F<=

9、PL3加EF4數(shù)(2)速度與中央分隔列聯(lián)分析結(jié)果多元線性回歸分析由結(jié)果可知,卡方值為25.0707對應的概率小于0.05,所以拒絕H0,表明速度與中央分隔形式之間存在相關(guān)性,至于相關(guān)性是否顯著將在回歸之后檢驗分析。_CQL?(高U蠹岸運行座居U-一T7553.3$5L52IG.G7:),a1卜-T75卷753演31.42L6(中央分2一一一8TL3754,553C.366.?9隔合計,2212.502州19.3314.773?_iaGL9013.7913.0728.4063.492241.901況!9貂.5195.1646.029310,7335.11皿的21.4391L股45J1加貝20.9

10、92?23.Z67此346V.G02S.6?4526.B7405.250.(100M25,3751J45.094.郎201L375!1.SC30J加.$2212.ED601.19320.00Q.UO0見213ELU40.904用32.58521.70ec.ooS.3058U.23/0.UDQ.000.0000.2413。風O.tJO0.90i0.617(1.5?mMuwj0.57合計422k犯4324.498151JU176100.00自由度值概率in25.07070,02103E259VO.OUOf117.0765<.01:1010.97740.3531Q.2t69Fisher精確椅蛤

11、多元線性回歸分析,JC0L2米乩£"表的統(tǒng)計里統(tǒng)計亶酸比卡方Mantel-Haensel卡方矗期Cram"V統(tǒng)計量表概率(P)2,592E-MPr<=P9上軸E-04啊瞅二嚴(3)速度與機非分隔列聯(lián)分析結(jié)果由結(jié)果可知,卡方值為13.8902對應的概率大于0.05,所以接受H0,表明速度與機非分隔形式之間不存在相關(guān)性,將此變量剔出模型。_COL?(曷曜廷仃廛度)(機非與篇)0jQ1752615.8753.8750.003那2.S4憶的77.2725.790.0013.3916.13含討2212.5C2gC2S415.1111J1MM的4M$4展74,0747.

12、241214.267E*82】4138.71138n34.602332.47?7.3261J.5B1C.484*5517.76&4.4417-7841.14212.83甌時141332.2515,9753.S750.5710.231.704辰81位用55£14.17S.50320.51143.SO30.3807Q.M1.701.140.90川加40-000.00九器6,45e0D10.10230,72160T17510.000.050.57o.ao0.00100:-00ELMO.OD8.23合計181E73110.S372.1617.614$駝4525.572212.502.

13、S410.571761。.皿多元線性回歸分析SAS系統(tǒng)2。能年口gFREQPROCEDUREH_C0L2«_CCL7*衰的統(tǒng)計里統(tǒng)計里械比卡歸MfiriteI-l-iaieriszeI卡方麻藕4宙Cr&rV統(tǒng)計里自由度值概率10133020.17S11014事。力G.138310J4880.2SOS0.270519帕0.7016WAFNING:Ffsher藉確梭哈表概挈(P)2.060E-07Pr仔PQ.2136射腦眇J"(4)速度與起點行人過街形式-COL2(品皤瑪仃_COL8由結(jié)果可知,卡方值為13.5373對應的概率小于0.05,所以拒絕H0,表明速度與起點行

14、人過街形式之間存在相關(guān)性,至于相關(guān)性是否顯著將在回歸之后檢驗分析。麝疆雄ftt給主)23456.-一耳02.50.00b.如O1.OlO?9.20453,969.S435.385-1”白4.6517.7840.on32-5T.7013.5415.nO1Q/6820,5720.ao5.001。川蛤0.57100.005,加卜2213,612.50ICJD.0014.107471.79542.0581.3647.4一-1一,3739.sen21.0£院.2222.721919+610.80解.3白12.1644.431R2.2780.002.5S00.80640.000.00Q.00卜2

15、Z12,50印46.02,45阪“2212.502,6410.57號黑運街形式口,臺*2015S17S11.施SS.64100.00多元線性回歸分析FREUPROCEDURE,COL2用表的統(tǒng)計量統(tǒng)計厘自由度值概率髓比胡Mantel-Hfterisz&l卡方CrncrY統(tǒng)計里513.53730.0198512.31340.080717.15240.00760.277a0.2B73Q.2773昭RNIMG;5叫Fisher精確杞聆小。粉率(F)5.301E-O5Pr<=F3a2(5)速度與終點行人過街形式由結(jié)果可知,卡方值為7.0046對應的概率大于0.05,所以接受H0,表明速度

16、與終點行人過街形式之間不存在相關(guān)性,將此變量剔出模型。工院孤行人過街形式D)雷篡秘0卜1_T1-+1141.82524271«,183(,771320.375IC,2381521一一2r-t95.8831.705,7023.09r-7875.01744.9296.3。47.51353.32392.8411/19B;464041.67522_73ec.ea24.fi44511.S25ft.574.557.C900.3633C.OO(I-0&C.OO2120.37511.93況4554.63072a100.00307-4+00.11739c.ooc.aO0.001C.3261t)

17、VOO-OIJt).£l合計187.3316332.61*TT合計2212.60&1拈.024525.&?22120Z.S40.571761CD.007.O04E0,2i036.70370.2430,938313建60.199«G.W5E0.19S5IARNING:5聰Fisher精確檢腦袤概率(P)Pr<=P0.00110.1932多元線性回歸分析SAS系豌2頰年。FREEPROCEDURE“.COL2*taC0L957關(guān)的統(tǒng)計重嫦計里自由度值概率藤比卡方一Mftntel-Haenszel卡方凝蠢CramerM癡+第3)單個因變量之間的相關(guān)性分析從因

18、變量的選取來看,沒有相互間絕對共線的自變量(multicollinear),但是有接近共線的自變量(nearmulticollinear),如車道長度與接入口數(shù)之間,一般的車道長度越長,接入口數(shù)余越多。但是我們不能去掉其中一個,否則會變成omittedvariableproblem,這樣誤差更大。所以我們應該把接入口數(shù)換成單位長度接入口數(shù),這樣既考慮了車道長度和接入口數(shù)目的影響,又消減了相互問的相關(guān)性。但是由于數(shù)據(jù)來源有限,我們在這里只能都將其引入模型。同樣對于自變量流量和區(qū)域,也存在高相關(guān)性。2線性回歸求解1)根據(jù)上述分析,我們將機非分隔和終點行人過街形式剔出自變量,建立線性回歸模型如下:Y

19、=a0+a1X11+a2X12+a3X2+a4X3+a5X41+a6X42+a7X61+a8X62+a9X63+a10X8+其中e是服從正態(tài)分布的隨即變量,利用最小二乘法,即使殘差之和最小,求得各個偏回歸系數(shù)(a0a14)。2)對整體進行相關(guān)檢驗,看整體是否符合線性相關(guān),檢驗假設(shè)如下:H0:a0=a1=-a10=0H1:其中一個不等于010多元線性回歸分析在符合H0時,統(tǒng)計量F=8/11服從F(11,164)分布,并以S殘/(176-11-1)0.05為置信水平。3)對每個自變量進行相關(guān)性檢驗,檢驗假設(shè)如下:H0i:ai=0;H1i:ai=0;在符合H0時,統(tǒng)計量服從t(164)分布,并以0.

20、05為置信水平并對數(shù)據(jù)進行處理如下:rXHg2X?加X6跆工wc加L06113M01IJ3J00000I0劃151301122瞅00L0的3沖10iL3UtHKflC,IQ1933436011103,00000L0湖34”010J40)領(lǐng)I0用01103,00000I0班充巧01L01.WCOOI032634260110*瞅加I02953156Di0JJ.WCOOI021S乃如0_110JJOOMOI02443S8501I0工WCMEQ129352101I02JOOOOOL0物36620iL33.1WCW0314網(wǎng)0I0Q011S4231000LP02.000000I班2370Q1IQ0131

21、3M加°112,(000I3?0250001122.WCOO1)13S2255G01L12.000000i20?283301i0LDOCOOI0503空001L22.mwE0BS父行0-1I04.(00I0274網(wǎng)01I211多元線性回歸分析3結(jié)果分析利用SAS可得如下結(jié)果:如f)q年UR月?1日星期五1ThsPEGProcedureModeI:MfJDEL1DopendentV*rIftb<o:¥¥Nitmtrf?rofNumberofNuwiberof17717cflhs-erwatiorisRfcEObiervitiafktUs-cdObservitI

22、onswithMissingIusjn&lj/s<&ofVar14neaStim0fMconDFScjuar&sSquareModoIErrorJorrectFicIlotaI87h6711514昵*M翎鄲15890FValuePr>F7.93C0001RootNSFDependent8.3034329.67G3627.73075R-SqIIAFAAdjR-SqCcjeffVarParaunieterEmIImiSLlesP*r*nwt«r£1and*rdYariblcLab?|lOFEtiErrvrInt*rmptIntercept12

23、9.475174.40099JdlK1117.63647£.89BBS用士XI?1崗7居趾?.?6Q53乂之210.001CCD.Ot)即5(3>C31O-OOJCO0_OOCDSM刈K4)10.ZB182i腳31b尺421U1Q4231.90940xe1-1_4fi04a2.OS90?X8般1O-06B/3D.EMJ0BDrr.?n40.2407IYaiuc8.70-3,54???.03i.i.If.0+5®-0.71D.13Pr?|tj<.OOCt0.0012U,OOC50.559C0,002B0.60050.56380.47S10.8S41從上表可知,回歸

24、方程整體顯著性檢驗的F統(tǒng)計量值為7.93,其對應的P值小于0.0001,非常顯著,所以本線性回歸模型整體上是顯著的。通過對各個自變量對應回歸系數(shù)的t檢當P值的大小,可以判定各個回歸系數(shù)的是否顯著。在本實驗0.05的顯著性水平下,X11X12X3$量的P值均遠遠小于0.05,說明其影響顯著。而其他變量的P值均大于0.05,說明其影響不顯著。而對于影響不顯著的變量,應該剔出模型。所以彳留X11X12X而重新進行回歸分析,得如下結(jié)果:12多元線性回歸分析ImpendentYari曲E;YYNumberofObseryationsRead177NumberofObservatiorisUsed176NumberofObaervation

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論