《基于隨機(jī)森林模型的交通事故預(yù)測實(shí)證探究》18000字(論文)_第1頁
《基于隨機(jī)森林模型的交通事故預(yù)測實(shí)證探究》18000字(論文)_第2頁
《基于隨機(jī)森林模型的交通事故預(yù)測實(shí)證探究》18000字(論文)_第3頁
《基于隨機(jī)森林模型的交通事故預(yù)測實(shí)證探究》18000字(論文)_第4頁
《基于隨機(jī)森林模型的交通事故預(yù)測實(shí)證探究》18000字(論文)_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

-PAGE21-基于隨機(jī)森林模型的交通事故預(yù)測實(shí)證研究摘要:隨著我國經(jīng)濟(jì)的持續(xù)健康發(fā)展和機(jī)動車持有率的不斷增加,交通的管理控制壓力逐漸增大,隨之而來的交通問題也日趨嚴(yán)峻。頻發(fā)的交通事故不僅帶來巨額的財(cái)產(chǎn)生命損失,也加劇了交通的擁堵情況。因此通過交通事故的數(shù)據(jù)來進(jìn)行可視化分析和理解交通事故的發(fā)生規(guī)律,進(jìn)而提出有效的解決措施,以減少交通事故的發(fā)生是本研究的主要目的。首先,分析英國道路發(fā)展現(xiàn)狀和交通安全整體環(huán)境。其次,基于tableau商用軟件對英國交通事故數(shù)據(jù)來分析交通事故發(fā)生規(guī)律及其事故成因。之后,通過隨機(jī)森林對英國交通事故數(shù)據(jù)進(jìn)行預(yù)測并對結(jié)果進(jìn)行評估。最后為減少交通事故提出了4項(xiàng)措施。關(guān)鍵詞:交通事故可視化分析事故成因隨機(jī)森林目錄TOC\o"1-2"\h\u1緒論 31.1研究背景 31.2研究目的和意義 51.3文獻(xiàn)綜述 52研究相關(guān)的基本概念和研究方法 72.1交通事故與事故數(shù)據(jù) 72.2可視化分析簡介相關(guān)概念 82.3可供選擇的數(shù)據(jù)可視化工具 93交通事故成因分析 103.1數(shù)據(jù)獲得與數(shù)據(jù)預(yù)處理 113.2英國交通總體情況 113.3分析方法及其具體內(nèi)容 123.4英國2014年交通數(shù)據(jù)可視化 123.5具體路段可視化分析 153.6深度分析交通事故成因 214交通事故預(yù)測 234.1交通事故預(yù)測模型介紹 234.2交通事故預(yù)測模型選擇 264.3隨機(jī)森林交通事故預(yù)測過程 265減少交通事故的措施 295.1實(shí)時車輛的監(jiān)控管理 295.2加強(qiáng)安全宣傳教育,提高交通參與人文明守法意識 295.3加大道路交通資金投入,提高交通智能化管理水平 295.4合理規(guī)劃路網(wǎng)建設(shè),完善交通安全設(shè)施 30結(jié)論 31參考文獻(xiàn) 33附錄A 37附表 401緒論1.1研究背景1.1.1交通發(fā)展現(xiàn)狀 在我國古代交通狀況并不便利的情況下,人們?yōu)榱松?,盡量沿河流生活。于是,最早的交通運(yùn)輸方式——水路運(yùn)輸便跟著當(dāng)時的現(xiàn)狀而生。“伏羲氏刳木為舟,剡木為楫”,說明水上交通早已在中國出現(xiàn)。而在陸上交通方面,以馴服的馬匹作為主要交通工具出現(xiàn)的最早,由于古代沒有像現(xiàn)在這樣先進(jìn)的可供選擇的交通工具,因此交通事故的發(fā)生概率也比較低,嚴(yán)重程度也不及現(xiàn)代交通事故。自工業(yè)革命以來,各種新式交通工具層出不窮,使得機(jī)動船和機(jī)車的出現(xiàn),從此近代運(yùn)輸業(yè)逐漸開始發(fā)展。1885年第一輛以內(nèi)燃機(jī)為動力的汽車被德國人本茨成功制造出來。1899年,在美國發(fā)生了世界范圍內(nèi)第一起交通事故,從此交通事故成為了困擾人類發(fā)展的一大難題。城市交通的發(fā)展使得我們的出行變得十分便利。但與此同時,城市的交通系統(tǒng)也與古代單一交通模式相比有了巨大的不同,變得更加復(fù)雜,車輛也日趨增多,帶來了交通堵塞、環(huán)境污染和經(jīng)濟(jì)損失等許多問題。交通事故如今已經(jīng)成為全球傷亡的主要原因之一,在世界衛(wèi)生組織2015年對交通事故的調(diào)查中,平均一年有超過125萬人死于交通事故,2000萬至5000萬人受傷,全球每10萬居民中有18人死亡。這些致死事故大多數(shù)發(fā)生在相對落后的國家(大約占16%)和發(fā)展中國家(大約占74%),這使得交通事故造成的死亡不僅成為公共衛(wèi)生問題,還成為阻礙社會經(jīng)濟(jì)發(fā)展的攔路虎。在我國,盡管近幾年來道路人均交通死亡人數(shù)與之前相比有所下降,但直到2015年,死亡率和傷害率一直在上升,在每起交通事故死亡的人數(shù)也呈緩慢上升趨勢,這說明交通事故嚴(yán)重程度仍然在上升,因此開展相關(guān)研究既是非常有必要的,也是一種必然的發(fā)展趨勢。1.1.2交通數(shù)據(jù)可視化發(fā)展 在信息可視化和可視分析飛速發(fā)展的當(dāng)今時代背景下,可視化分析逐漸受到人們關(guān)注。人都是視覺動物,與傳統(tǒng)的統(tǒng)計(jì)分析相比,可視化利用計(jì)算機(jī)圖像處理技術(shù)將枯燥無味的數(shù)據(jù)用圖像呈現(xiàn)出來,給人以直觀的數(shù)據(jù)印象。可視化數(shù)據(jù)有以下重要的作用:直觀分析大量視覺信息;檢測一般規(guī)律和趨勢;檢測離群和不尋常的圖案??梢暬治龈軇討B(tài)分析交通數(shù)據(jù)之間內(nèi)在的特征。第一次提出可視化技術(shù)是在1987年,后來,可視化技術(shù)開始逐漸興起,越來越多的科學(xué)家發(fā)現(xiàn)了可視化的價(jià)值。于是,在許多研究領(lǐng)域上可視化技術(shù)都得到了使用。之后漸漸地發(fā)展出了諸如科學(xué)計(jì)算可視化、數(shù)據(jù)可視化、信息可視化等研究分支,直到現(xiàn)在衍生出了可視分析。第一次提出可視化分析是在2005年,它是一種融合了信息可視化、數(shù)據(jù)挖掘、人機(jī)交互、認(rèn)知科學(xué)等多方面知識的新型研究方向。交通數(shù)據(jù)同時具有時間和空間的屬性、多元異構(gòu)性、多維性,這就注定了它與其它類型的數(shù)據(jù)有許多不同,用可視化分析對交通數(shù)據(jù)進(jìn)行處理更能體現(xiàn)其處理數(shù)據(jù)的優(yōu)勢。最近幾年來,可視化分析在智能交通的研究領(lǐng)域中使用愈加廣泛,相關(guān)的研究成果也運(yùn)用于解決許多交通問題。在當(dāng)前的研究成果中,與交通事故可視化相關(guān)的成果還比較稀少。這是因?yàn)榻煌ㄊ鹿实南嚓P(guān)數(shù)據(jù)需要大量的數(shù)據(jù)采集,交通數(shù)據(jù)是根據(jù)每一件真實(shí)發(fā)生的交通事故形成的日志類型的數(shù)據(jù),需要專業(yè)人士對交通事故的信息進(jìn)行手動記錄,再將所采集好的數(shù)據(jù)導(dǎo)入到相應(yīng)的數(shù)據(jù)庫里,工作過程十分繁瑣。因此,目前亟待更多交通可視化相關(guān)理論和分析方法的出現(xiàn)來解決這一問題。1.2研究目的和意義近幾年來,我國城鎮(zhèn)化進(jìn)程不斷地加快,城市經(jīng)濟(jì)發(fā)展日益繁榮、人口的數(shù)量急劇增長,在一定程度上刺激了交通發(fā)展。根據(jù)統(tǒng)計(jì)資料表明,直至2019年上半年我國機(jī)動車持有數(shù)量已經(jīng)達(dá)到約3.4億輛,其中66個城市的機(jī)動車保有量超過100萬輛。上海、北京和廣東等11個城市超過300萬輛。城市的現(xiàn)代化發(fā)展給居民帶來出行便利的同時,交通阻塞、環(huán)境污染等一系列問題接踵而來。在這當(dāng)中,交通事故不僅帶來了大量人員傷害,讓無數(shù)家庭遭遇不幸,還嚴(yán)重影響了經(jīng)濟(jì)的發(fā)展和社會的穩(wěn)定。交通事故在現(xiàn)代化科技日趨發(fā)達(dá)的今天,尚未有完全解決交通事故這一大經(jīng)濟(jì)社會問題的有效方法。道路交通事故的影響因素不僅包括人、車、路、環(huán)境,還包括與之相關(guān)的社會政治、經(jīng)濟(jì)、文化等方方面面。事故發(fā)生可歸結(jié)為這些因素耦合失調(diào)導(dǎo)致的,屬于隨機(jī)性、偶然性事件,很難通過實(shí)驗(yàn)去真實(shí)反映事故發(fā)生過程以及各因素對事故的影響效應(yīng)。隨著大數(shù)據(jù)技術(shù)的飛速發(fā)展以及人工智能技術(shù)在銀行、智慧城市等領(lǐng)域的落地應(yīng)用,為道路交通大數(shù)據(jù)生態(tài)建設(shè)、時空數(shù)據(jù)挖掘提供了新的思路。交通事故的相關(guān)數(shù)據(jù)與交通事故的發(fā)生息息相關(guān),對交通事故數(shù)據(jù)進(jìn)行處理并分析理解,以掌握交通事故發(fā)生的內(nèi)在原因,了解交通事故的發(fā)生規(guī)律,通過分析研究交通事故的成果來幫助道路決策者做出有利于減少交通事故的舉措顯得尤為關(guān)鍵。1.3文獻(xiàn)綜述查閱交通事故可視化模型相關(guān)的文獻(xiàn),其中文獻(xiàn)從知網(wǎng)平臺獲得。同時以交通事故(Trafficaccident)和可視化模型(Visualizationmodel)兩個為關(guān)鍵詞,可查詢到有關(guān)的文獻(xiàn)較為稀少,其中知網(wǎng)包含6篇,故基本上難以從前輩研究工作中借鑒。為解決這個問題,我將課題拆開,分為交通事故和可視化模型,再進(jìn)行查閱,發(fā)現(xiàn)兩個關(guān)鍵詞在知網(wǎng)都有相當(dāng)豐富的研究成果,說明交通事故和可視化模型研究工作已經(jīng)十分完備了,接下來我將具體介紹前人的研究成果。DeyuWang等人用病死率(CFR)和人身傷害(HD)來評估每一起交通事故的嚴(yán)重程度,并且從宏觀和多方面分析中國道路交通事故的嚴(yán)重性,并闡明幾個關(guān)鍵的原因。根據(jù)這些分析,提出了降低事故嚴(yán)重性的可能對策。PENGXuan等對公路交通事故大數(shù)據(jù)可視化分析中存在的問題,結(jié)合大數(shù)據(jù)可視化分析方法,從數(shù)據(jù)處理、可視化方案及可視化系統(tǒng)實(shí)現(xiàn)等方面設(shè)計(jì)出一條基于大數(shù)據(jù)環(huán)境下的公路交通事故可視化分析技術(shù)路線,為提升公路交通事故分析能力以及交通安全措施和政策制定提供參考。YuanLi用地理信息和數(shù)據(jù)可視化技術(shù)對近3年道路交通事故的分析,發(fā)現(xiàn)道路工程和交通組織缺陷是引發(fā)和造成事故的主要因素,初步得出以下結(jié)論:道路照明存在問題;道路渠化存在問題;道路橫斷面形式存在問題;道路設(shè)施存在問題。PlugC等人通過時間、空間和時空的研究方法來分析1999-2008年西澳大利亞不同模式下的交通事故,使用核密度估計(jì)分析在三個不同的尺度上分析了車輛碰撞的空間結(jié)構(gòu),結(jié)果表明,不同的事故原因下碰撞差異較為顯著,所采用的的分析技術(shù)可以有效幫助決策者指定合理戰(zhàn)略。Pack等人提出了一種新型的、基于網(wǎng)絡(luò)可視化的工具ICE,它可以提供對用戶友好的數(shù)據(jù)集,解決用戶瀏覽交通數(shù)據(jù)集的要求。Gutierrez-OsorioC等人通過計(jì)算機(jī)技術(shù)——機(jī)器學(xué)習(xí)算法和優(yōu)秀的信息分析技術(shù)來預(yù)測道路事故的最新進(jìn)展,并根據(jù)數(shù)據(jù)來源和特點(diǎn)提出一種分類分類方法。ALKHEDERS等人應(yīng)用三種數(shù)據(jù)挖掘模型對交通事故嚴(yán)重性的相關(guān)風(fēng)險(xiǎn)因素進(jìn)行綜合分析,結(jié)果證實(shí),與司機(jī)和乘客相比,行人是最脆弱的道路使用者,男性司機(jī)和前排乘客更容易受到嚴(yán)重或致命的傷害,同樣,老年司機(jī)有更高受到嚴(yán)重或致命傷害的幾率。GAShafabakhsh等人利用地理信息系統(tǒng)作為事故分析的管理系統(tǒng),結(jié)合空間統(tǒng)計(jì)方法,揭示了空間因素對伊朗第二大人口大城市馬什哈德市造成的影響。我國交通事故、傷亡人數(shù)、日均死亡人數(shù)從2005年開始呈現(xiàn)出下降的趨勢,但放眼世界,我國的交通狀況還是趨于非常嚴(yán)重的狀態(tài)下。廣大學(xué)者為減少交通事故的發(fā)生展開了各方面的研究,交通事故的可視化模型有助于對交通事故進(jìn)行分析,分析交通事故發(fā)生情況和事故類型之間的關(guān)系,來幫助決策者制定有效的交通安全措施,從而達(dá)到減少交通事故發(fā)生的目的。減少交通事故的發(fā)生,進(jìn)而成為交通安全強(qiáng)國,還需要廣大研究者和民眾的共同努力。2研究相關(guān)的基本概念和研究方法2.1交通事故與事故數(shù)據(jù)交通事故是指車輛在道路上因過錯或者意外造成人身傷亡或者財(cái)產(chǎn)損失的事件。交通事故不僅是由不特定的人員違反道路交通安全法規(guī)造成的;也可以是由于地震、臺風(fēng)、山洪、雷擊等不可抗拒的自然災(zāi)害造成。而交通數(shù)據(jù)則是將每一件真實(shí)發(fā)生的交通事故,以日志的形式進(jìn)行記錄,這些內(nèi)容包括了事件發(fā)生的坐標(biāo)、路段、天氣狀況、路面條件、交通事故嚴(yán)重程度、照明條件等信息,再由交通管理部門的相關(guān)工作人員對數(shù)據(jù)導(dǎo)入至數(shù)據(jù)庫中,形成立體的交通事故數(shù)據(jù)。2.2可視化分析簡介相關(guān)概念可視化(Visualization)是將計(jì)算機(jī)所具備的圖像處理和圖形轉(zhuǎn)換等功能,將數(shù)據(jù)轉(zhuǎn)換成讓人可以一目了然地看出,并能夠進(jìn)行交互處理的一種非常新穎的理論、方法和技術(shù)。而可視化分析是結(jié)合了數(shù)據(jù)分析和人機(jī)交互,并聯(lián)系可視化和決策理論以及融合認(rèn)知科學(xué)等多個研究領(lǐng)域發(fā)展下所產(chǎn)生的新的分析方法??梢暬治雠c傳統(tǒng)可視化不同,可視化分析是建立在可視化的基礎(chǔ)上,不僅是單純地將數(shù)據(jù)展示為圖形和表格的形式,還通過可視化和交互將用戶引導(dǎo)進(jìn)數(shù)據(jù)分析的過程當(dāng)中,建立了用戶與數(shù)據(jù)溝通對話的橋梁。一般完整的可視化分析運(yùn)作流程如圖2.1所示。從可視分析流程圖中不難發(fā)現(xiàn),該模式具有明顯的循環(huán)特征:從數(shù)據(jù)出發(fā)到知識,再從知識又回到循環(huán)。中間有兩條不同的途徑:一是數(shù)據(jù)和用戶交互的可視化方法;二是自動的數(shù)據(jù)挖掘方法。這兩個途徑的中間過程分別是對數(shù)據(jù)的交互可視化結(jié)果和從數(shù)據(jù)中提煉的數(shù)據(jù)模型。用戶既可以修正所生成的可視化結(jié)果,也可以改進(jìn)參數(shù)來完善所使用的模型。從數(shù)據(jù)中洞悉知識的過程也主要依賴兩條主線的互動與協(xié)作。圖2.2可視分析流程圖 2.3可供選擇的數(shù)據(jù)可視化工具計(jì)算機(jī)科學(xué)逐漸興起和發(fā)展,可視化技術(shù)也隨之得到了發(fā)展,相對應(yīng)可選擇的可視化軟件種類也越來越多。學(xué)習(xí)相應(yīng)軟件可以降低專業(yè)研究人員亦或是業(yè)余研究愛好者的研究難度,使人們可以更加容易地分析和使用數(shù)據(jù),接下來將介紹幾種典型的可視化軟件。ExcelExcel是Microsoft為Windows操作系統(tǒng)的用戶所編寫的一款免費(fèi)的電子表格軟件,用戶可以在了解該軟件后輕松使用其功能。它可以在用戶導(dǎo)入數(shù)據(jù)后,按要求對數(shù)據(jù)進(jìn)行求和等處理計(jì)算,并將數(shù)據(jù)轉(zhuǎn)化為用戶所需的柱狀圖、扇形圖等圖表形式。它是一款最基礎(chǔ)、最容易上手的數(shù)據(jù)可視化軟件。TableauTableau在可視化的能力相比于其它同類型的可視化軟件,優(yōu)勢在于它可視化能力比較突出,可視化效果不華麗但很出色,而且給用戶提供了非常自由的圖表制作能力,基本可以輕易做出大多數(shù)想要做的圖表。相比Excel,Tableau具有豐富的數(shù)據(jù)源支持,靈活的可視化功能和強(qiáng)大的數(shù)據(jù)圖表制作能力。但Tableau作為一款商用軟件,需要支付一定的費(fèi)用才可以使用。FineBIFineBI是帆軟軟件有限公司制作的軟件,雖然是一款商業(yè)智能分析工具,其優(yōu)勢在于一旦準(zhǔn)備好數(shù)據(jù)可自助式的隨意分析,大數(shù)據(jù)量的處理性能。支持多數(shù)據(jù)源接入軟件在易用性和功能上做的都很不錯??梢暬浖⒉恢痪窒抻谝陨先N,該類可視化軟件都能滿足用戶對數(shù)據(jù)處理和分析出圖的要求,簡單易上手。3交通事故成因分析由于駕駛?cè)藛T、行人及乘客等交通參與者的交通法制意識及安全意識淡薄,我國的道路交通安全現(xiàn)狀仍不容樂觀。因此,本章通過分析英國交通事故發(fā)生的數(shù)據(jù),探討了導(dǎo)致道路交通事故的主要因素,對交通事故成因進(jìn)行分析,并提出相應(yīng)的改善措施,旨在為我國道路交通部門相關(guān)管理者制定管理策略時提供一定的借鑒和參考。3.1數(shù)據(jù)獲得與數(shù)據(jù)預(yù)處理由于國內(nèi)的交通事故數(shù)據(jù)較難獲得,在咨詢了導(dǎo)師的意見之后,本章采用英國交通事故數(shù)據(jù)進(jìn)行分析,獲取的途徑為國外數(shù)據(jù)庫Kaggle,包含了本章所需分析英國2014年一整年的交通事故記錄,總計(jì)146321條,并通過商用軟件Tableau對數(shù)據(jù)進(jìn)行了可視化處理。交通事故記錄含有較多的信息,包含時間、經(jīng)緯度、天氣狀況、路面情況、道路類型、夜間光照情況等信息,共有32種。由于本章僅需要對交通數(shù)據(jù)進(jìn)行分析進(jìn)而得出交通事故成因,故不需對數(shù)據(jù)所有列進(jìn)行分析。從原始數(shù)據(jù)篩選出用于之后工作所需數(shù)據(jù)類型及內(nèi)容如下表所示:表3.1篩選后用于之后工作的數(shù)據(jù)類型及內(nèi)容字段名稱數(shù)據(jù)格式字段描述舉例LatitudeLongitudeFloat交通事故發(fā)生地點(diǎn)的經(jīng)緯度51.49343,-0.1691WeatherConditionsVarchar交通事故發(fā)生天氣狀況RainingwithouthighwindsLightConditionsVarchar交通事故發(fā)生的光照條件Darkness:StreetlightspresentandlitDayofweekInt交通事故發(fā)生在一周的具體一天1RoadSurfaceConditionsVarchar交通事故發(fā)生的路面條件Wet3.2英國交通總體情況根據(jù)英國交通部2021年發(fā)布的消息,截止到2020年底,英國公路里程將達(dá)到24.75萬英里(約39.6萬公里),比2010年增長了0.26萬英里,漲幅來到1.1%,其中主要公路里程為3.18萬英里,次要公路里程為21.57萬英里,占比分別為12.8%、87.2%。公路主要分布在蘇格蘭境內(nèi),為18.97萬英里;蘇格蘭境內(nèi)公路里程為3.68萬英里,占比15%;威爾士境內(nèi)公路里程為2.1萬英里,占比9%。3.3分析方法及其具體內(nèi)容(1)連續(xù)性時間分析為了觀察與交通事故發(fā)生有關(guān)的連續(xù)性時間模式,首先按不同的時間跨度(年,季度,月份)對交通事故發(fā)生數(shù)據(jù)量進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)后交通事故數(shù)量的變化表現(xiàn)了交通事故發(fā)生情況隨時間的趨勢。在可視分析系統(tǒng)中,可以配合柱狀圖或折線圖這類表現(xiàn)走勢的可視化進(jìn)行展示。(2)周期性時間特性分析為了觀察與交通事故發(fā)生有關(guān)的周期性時間模式,首先按不同的時間跨度(4個季度,12個月份,一星期中的7天,一天中的24個時段)來對交通事故發(fā)生數(shù)據(jù)量進(jìn)行周期性地統(tǒng)計(jì),統(tǒng)計(jì)后交通事故數(shù)量分布聚集性就表現(xiàn)了交通事故發(fā)生是否存在一定的周期規(guī)律。在可視分析中,可以配合直方圖這類時間段分布的可視化進(jìn)行展示。(3)天氣相關(guān)性分析為了了解不同天氣與交通事故發(fā)生情況的關(guān)聯(lián),從而認(rèn)識其對交通事故發(fā)生的影響程度,對數(shù)據(jù)從兩個角度進(jìn)行統(tǒng)計(jì):不同天氣條件下的交通事故數(shù)量,不同路面狀況下的交通事故數(shù)量從這兩個方面綜合比較分析,來了解不同天氣與交通事故的關(guān)聯(lián)程度。在可視分析系統(tǒng)中,可以使用餅狀圖這類表現(xiàn)數(shù)量占比情況的可視化進(jìn)行它們之間關(guān)聯(lián)的展示。(4)事故熱點(diǎn)區(qū)域分析想要觀察交通事故的空間分布情況,一般情況可以直接使用經(jīng)緯度坐標(biāo)數(shù)據(jù)將點(diǎn)在地圖上標(biāo)注,結(jié)合事故嚴(yán)重度和密度這兩個指標(biāo),對圖中數(shù)據(jù)進(jìn)行處理后,配合不同顏色所對應(yīng)的事故嚴(yán)重程度熱力圖,即可得到某一路段的事故多發(fā)地點(diǎn)以及道路危險(xiǎn)程度。這樣就可以對事故熱點(diǎn)區(qū)域作更充分的分析。3.4英國2014年交通數(shù)據(jù)可視化(1)交通事故時間段分布規(guī)律 通過對英國2014年全年146321條交通事故信息進(jìn)行分析(時間段分布規(guī)律見圖3.41),一天中的0~6時人們主要處于睡眠狀態(tài),道路交通事故案件量較少;7~9時案件量量逐漸提升,并達(dá)到一定峰值,這段時間包含早高峰8~9時;9~10時案件量略有下降,因?yàn)樵绺叻宓慕Y(jié)束,但依舊有較多的案件數(shù);10~15時的案件量相比早高峰略有減少,但數(shù)量仍然較多;15~19時交通事故案件量逐漸增多,并在17時達(dá)到一天中最高交通事故案件數(shù),在達(dá)到一天峰值后數(shù)量仍居高不下直至19時,在這期間包含晚高峰17~19時;19時后,案件量一直下降,直到一天結(jié)束。英國2014年一天的交通事故發(fā)生時間高峰集中在早高峰和晚高峰,這與我國交通規(guī)律相符合。圖3.41英國2014年交通事故時間段分布直方圖(2)不同天氣條件下的交通事故分布特征圖3.42不同天氣狀況下的交通事故分布餅狀圖圖3.43不良天氣狀況下的交通事故分布餅狀圖如圖3.42,對未知天氣情況數(shù)據(jù)進(jìn)行刪除后,該圖展現(xiàn)了不同天氣條件下交通事故發(fā)生的比例,可以看到大多數(shù)交通事故都發(fā)生在晴好天氣,但惡劣天氣所占的交通事故發(fā)生比例也不能忽視。推測在天氣晴好的條件下,駕駛員心態(tài)過于放松,車速較快,難以及時反應(yīng)即將到來的危險(xiǎn),而惡劣天氣更有可能導(dǎo)致嚴(yán)重的交通事故。在排除了天氣良好情況下和未知天氣情況下的交通事故量后,保留了非晴好氣象條件下的數(shù)據(jù)共22631條(氣候條件與交通量發(fā)生關(guān)系圖3.43)。在所有事故中,80.1%的事故發(fā)生在雨天,2.74%的事故發(fā)生在霧天,3.02%的事故發(fā)生在雪天,9.34%的事故發(fā)生在其他條件下??梢姡晏焓遣涣继鞖鈼l件下導(dǎo)致交通事故發(fā)生的主要因素。(3)不同路面條件下的交通事故分布特征圖3.44不良路面條件下的交通事故分布餅狀圖如圖3.44,該圖展現(xiàn)了不同路面條件下交通事故發(fā)生的比例,可以看到路面干燥情況下發(fā)生交通事故的比率最高達(dá)到68.84%,推測在路面條件不良時,路上行人和車流量會減少,行駛中的車輛會提高警惕,減速慢行。在排除了地面干燥的交通事故數(shù)量后,得到數(shù)據(jù)共44303條。在所有事故中,94.6%的事故發(fā)生在潮濕的路面條件下,3.8%的事故發(fā)生在霜凍的路面條件下,其他不良條件下的交通事故發(fā)生量均不足1%??梢姡睗竦穆访媸遣涣悸访鏃l件下導(dǎo)致交通事故發(fā)生的主要因素。不同光照條件下的交通事故分布特征圖3.45不同光照條件下的交通事故分布如圖3.45,該圖展現(xiàn)了不同光照條件下交通事故發(fā)生的比例,可以看到白天和夜間照明正常工作的情況下,交通事故發(fā)生占了絕大多數(shù)。首先考慮到白天與夜晚的交通流分布差異(白天較多),這與天氣和路面情況原因相似,環(huán)境舒適,人車較多,警惕性一下降,交通事故就容易發(fā)生。對于路面照明條件良好時發(fā)生交通事故比沒有照明發(fā)生更多這一點(diǎn),推測英國的基礎(chǔ)照明措施比較完善,大部分的路段都已覆蓋,光照條件充足也有可能發(fā)生交通事故。3.5具體路段可視化分析 上一個小節(jié)對英國交通事故數(shù)據(jù)進(jìn)行了可視化處理,并稍微對數(shù)據(jù)進(jìn)行了直觀的分析,接下來本小節(jié)將以英國路厄斯罕自治市為例子進(jìn)行具體分析。(1)道路分析LewishamWay是位于英國倫敦東南部的路厄斯罕自治市附近的一條主要道路,道路走向是東南-西北。LewishamWay是由英國主要道路A2分流而來的,道路限速30英里/小時(約為48千米/小時),是通往路厄斯罕自治市主要路線之一。在2012-2014年共發(fā)生了175起交通事故,在路厄斯罕自治市內(nèi)處于中等水平。從圖3.51可以看到,LewishamWay月交通事故總數(shù)總體呈震蕩分布,每個月發(fā)生的交通事故數(shù)量差距總體較小,10月為交通事故多發(fā)月份,而2月交通事故總體發(fā)生量較少。仔細(xì)對LewishamWay月發(fā)生交通事故數(shù)量進(jìn)行分析,發(fā)現(xiàn)交通事故數(shù)量隨月份變化呈現(xiàn)出一定的規(guī)律,1-2月份是全年發(fā)生事故較少的兩個月,根據(jù)實(shí)際情況可以推測,路厄斯罕自治市此時正處于冬季,主要?dú)夂驐l件為冰雪氣象,車輛難以在道路上通行,車流量就會相對減少,所以此時事故量并不會太多。3-5月事故數(shù)量正處于上升期,推測這是因?yàn)長ewishamWay此時已進(jìn)入春季,冰雪消融,車流輛逐漸恢復(fù)成常規(guī)。6-7月交通事故數(shù)維持穩(wěn)定。8-10月來到一年中交通事故發(fā)生最多的月份,推測此時正處于夏秋季節(jié),英國屬于溫帶海洋型氣候,天氣環(huán)境較好,且正值旅游度假盛季,車輛行人比6-7月多。圖3.51LewishamWay月交通事故折線圖從圖3.52可以看出2012-2014年年發(fā)生交通事故數(shù)量相差不大,具有周期性,推測2012-2014年當(dāng)?shù)卣⑽磳υ摋l道路進(jìn)行較大的改變,交通設(shè)施也沒有較大的翻新。比較2012-2014年交通事故和每月交通事故總數(shù)折線圖不難看出,時間跨度較小的月折線圖更能反映出交通事故發(fā)生的規(guī)律。圖3.52LewishamWay2012-2014年交通事故折線圖圖3.53為LewishamWay交通事故在道路路線上的分布情況,該路段位于圖中東南至西北走向。地圖結(jié)合所產(chǎn)生的的交通事故分布圖與上面幾章的分析相比,我們可以更加直觀的得知事故發(fā)生具體的位置,更利于我們進(jìn)行空間可視化分析。于是從中選取4個交通事故發(fā)生最為密集的點(diǎn)(見3.54),可以看到有三個密集的點(diǎn)位位于交叉口,還有一個密集的點(diǎn)位位于岔路口上,均為事故多發(fā)地。觀察不良條件時發(fā)生交通事故圖,如圖3.55為不良天氣條件下交通事故發(fā)生的分布圖,黃色代表發(fā)生事故時為雨天,綠色代表發(fā)生事故時為雨天且有強(qiáng)烈大風(fēng),其余不良天氣的條件并沒有導(dǎo)致當(dāng)?shù)匕l(fā)生交通事故,圖3.55為不同夜間光照條件下交通事故發(fā)生的分布圖,紅色代表夜間照明條件良好,黃色代表夜間照明條件未知,藍(lán)色代表夜間照明沒有正常工作。綜合圖3.53、圖3.54和圖3.55不難看出,該路段事故多發(fā)地為交叉路口和匝道;在環(huán)境因素影響交通事故發(fā)生方面,雨天是導(dǎo)致LewishamWay發(fā)生交通事故的主要原因,夜間照明條件狀況的良好時依然發(fā)生交通事故,推測主要事故原因是夜間行車司機(jī)注意力下降。綜上所述,LewishamWay發(fā)生交通事故的條件與英國總體發(fā)生交通事故的規(guī)律相符合,結(jié)合地圖對道路進(jìn)行分析,得出更容易在道路的交叉路口與匝道發(fā)生交通事故。圖3.53LewishamWay地理位置及交通事故分布情況圖3.54LewishamWay交通事故分布密集區(qū)圖3.55LewishamWay不良條件交通事故分布(2)城市分析圖3.56路厄斯罕市交通事故分布圖主要以路厄斯罕自治市交通事故發(fā)生進(jìn)行分析,交通事故比較集中在城市中心和周邊的主要公路上,可以發(fā)現(xiàn)有三條主要道路上交通事故的分布較多,其中以西南-東北走向的LewishamHighSt交通事故的分布最為密集,在路厄斯罕自治市的西南部有頗為發(fā)達(dá)的商業(yè)區(qū)卡特福德,它是大倫敦地區(qū)的主要35個中心之一。在卡特福德商業(yè)區(qū)和路厄斯罕自治市之間的LewishamHighSt承受著繁華商業(yè)區(qū)以及市中心的人流客運(yùn)壓力。從圖3.57LewishamHighSt星期時間分布圖可以看出,發(fā)生在周末的交通事故較少,而發(fā)生在工作日的交通事故明顯數(shù)量較多,在比對LewishamWay發(fā)生的各種不良條件下所發(fā)生的交通事故,結(jié)果發(fā)生交通事故的規(guī)律相近。故可推測,LewishamHighSt交通事故分布密集的主要原因來源于上班族,因?yàn)樵陔p休日時就無需出行前往工作單位,大幅減少了道路的交通負(fù)荷,所以在工作日發(fā)生的交通事故數(shù)量比周六日發(fā)生的交通多很多。圖3.57LewishamHighSt星期時間分布圖3.6深度分析交通事故成因以上五節(jié)分別對英國2014年交通事故的數(shù)據(jù)以及LewishamWay和路厄斯罕自治市進(jìn)行了可視化不利氣象因素與路面條件對交通安全的直接影響主要有2點(diǎn):對駕駛員心理生理的不良影響。在不利的天氣條件下,司機(jī)精神高度集中,因此可能心理壓力較正常天氣條件的時候更大,甚至產(chǎn)生恐慌的心理。駕駛員精神高度集中會容易導(dǎo)致精神疲勞,最終導(dǎo)致注意力分散,降低了外界的綜合判斷能力,通常只能對外界情況作出簡單模糊的判斷,在緊急情況下,尤其是在短途行駛時,有一些年輕的司機(jī)往往會比較沖動,有時甚至是超速行駛,以至于制動剎車時間太長,提升了行車的危險(xiǎn)性。同時,久坐會增加司機(jī)的疲勞,在司機(jī)長時間保持相同的姿勢來行駛車輛的情況下,比較容易引起脊椎、大腦和頸部等的不良反應(yīng),加重駕駛員的疲勞程度。對能見度以及行車附著系數(shù)等道路行車條件的影響。在霧天能見度較低的情況下,駕駛員對周圍情況的判斷會出現(xiàn)一定偏差,對前車的距離難以把控,因此當(dāng)駕駛員對前方車輛進(jìn)行反應(yīng)時,安全制動反應(yīng)時間已經(jīng)被大大縮短了,因此極易發(fā)生追尾等嚴(yán)重的交通事故。能見度是保證交通安全行駛,確定最小行車速度的重要指標(biāo)之一。路面的抗滑性能對道路交通安全更是具有極其重要的影響,通常用路面和輪胎之間的附著系數(shù)來加以評價(jià)。路面在潤滑狀態(tài)下抗滑性能降低,當(dāng)路面與輪胎之間形成水膜時,其抗滑行能更低。在積雪地區(qū),冰雪覆蓋下的路面的抗滑性能不再由路面與輪胎之間的摩擦特性決定,而完全取決于積冰和積雪的特性。通常冰雪路面的抗滑性能極差,是交通事故多發(fā)的主要誘因。霧、雨、雪、路面結(jié)冰等不利氣象因素對公路交通安全的影響主要是導(dǎo)致能見度降低和路面凍結(jié)、濕潤造成路面附著系數(shù)降低。2)通過分析英國交通事故發(fā)生數(shù)據(jù),得出每天17時至19時發(fā)生的交通事故約占全部事故的1/4。17至19時處于黃昏到夜晚的時間段,光線由陰轉(zhuǎn)暗,有些路段的路燈設(shè)置為定時開啟,在天氣昏暗的情況下不會開啟,光照條件不良時司機(jī)容易出現(xiàn)視覺障礙,導(dǎo)致判斷失誤,措施不當(dāng)。加上經(jīng)過一天的工作和旅途勞頓后,會出現(xiàn)眼干、喉燥、頭暈?zāi)垦?、打哈欠等一系列疲倦癥狀。此時如不停車休息,很容易造成交通事故。另外,行人在行走時也由于出現(xiàn)視覺障礙而導(dǎo)致觀察不清,躲讓過往車輛判斷不準(zhǔn),加之回家心切,行走速度快,也極易造成交通事故。3)交通事故主要由人為、車輛、道路和環(huán)境等因素影響,其中人為因素是最主要的原因,約占道路交通事故總數(shù)的95%。人為因素對象包括駕駛員、乘車人、行人等所有交通參與者者,其中駕駛員超速駕駛、違章駕駛、疲勞駕駛和酒后駕駛等行為在交通事故發(fā)生原因中占有較高比例。4)對于英國在夜間不同條件下所出現(xiàn)的路燈亮起反而交通事故較多的情況。我認(rèn)為有以下兩種原因:英國基礎(chǔ)設(shè)施建造相對完備,即使光照條件較好也有一定的事故發(fā)生概率;在良好的光照條件下,相比于不良光照條件下,駕駛員的警惕性容易下降,需要設(shè)立警示標(biāo)志。5)高速公路出口區(qū)域上游或下游路段通常還設(shè)有高速公路入口,在出、入口附近的路段,駛離、駛?cè)搿Ⅰ傔^高速公路的3股不同流向、不同速度的車流交織,形成了車輛間橫向干擾,剛駛?cè)氲能囕v與欲駛離的車輛速度相對較低,與主線正常通行車輛間又形成了縱向干擾。行車環(huán)境的復(fù)雜性導(dǎo)致高速公路出口區(qū)域易發(fā)交通事故加之有些駕駛?cè)嗽谠训捞幫蝗蛔兊馈⑼\?、倒車等瞬間加劇了行車的危險(xiǎn)性。4交通事故預(yù)測第三章我們通過已有的交通數(shù)據(jù)對交通事故的形成原因進(jìn)行了分析,也能夠因此得到了一些有效減少交通事故的措施。不過,為了減少交通事故的發(fā)生,光知道了交通事故的成因和減少交通事故的措施還是不夠的,交通事故數(shù)據(jù)是具有一定規(guī)律的數(shù)據(jù)集。通過對將來即將發(fā)生的交通事故進(jìn)行預(yù)測,可以對即將的發(fā)生的交通事故進(jìn)行識別并降低交通事故的發(fā)生率,幫助相關(guān)部門針對性的制定交通預(yù)防的政策。還可以根據(jù)交通事故數(shù)的歷史發(fā)展規(guī)律,預(yù)測交通事故的近期發(fā)展態(tài)勢,為制定交通安全管理目標(biāo)提供依據(jù)的同時,也可為交通安全宣傳教育提供依據(jù)。4.1交通事故預(yù)測模型介紹 道路交通事故預(yù)測方法主要有:回歸分析法、時間序列分析法、神經(jīng)網(wǎng)絡(luò)模型法、灰色模型法、隨機(jī)森林法等。時間序列模型具有不需要大量的數(shù)據(jù),快速掌握事故宏觀發(fā)展趨勢等優(yōu)點(diǎn)。常用的有移動平均模型(ARIMA)、指數(shù)預(yù)測模型(單指數(shù)平滑、Holt指數(shù)平滑、Holt-Winters指數(shù)平滑以及狀態(tài)空間指數(shù)平滑)。在道路交通事故預(yù)測問題上,大部分研究是基于傳統(tǒng)預(yù)測模型,基于機(jī)器學(xué)習(xí)的非線性時間序列預(yù)測的研究較少,特別是在道路交通事故數(shù)宏觀態(tài)勢的預(yù)測這一方面。因此本文將介紹隨機(jī)森林法、BP神經(jīng)網(wǎng)絡(luò)預(yù)測和決策樹模型這三種機(jī)器學(xué)習(xí)算法,并采用隨機(jī)森林模型對英國2005-2007、2009-2014年發(fā)生的交通事故的數(shù)據(jù)進(jìn)行分析。4.1.1決策樹預(yù)測模型(1)概念及應(yīng)用決策樹(Decision

Tree)是一種非參數(shù)的有監(jiān)督學(xué)習(xí)方法,它能夠從一系列有特征和標(biāo)簽的數(shù)據(jù)中總結(jié)出決策規(guī)則,并用樹狀圖的結(jié)構(gòu)來呈現(xiàn)這些規(guī)則,以解決分類和回歸問題。決策樹算法容易理解,適用各種數(shù)據(jù),在解決各種問題時都有良好表現(xiàn),尤其是以樹模型為核心的各種集成算法,在各個行業(yè)和領(lǐng)域都有廣泛的應(yīng)用。(2)工作原理決策樹構(gòu)造的輸入是一組帶有類別標(biāo)記的例子,構(gòu)造的結(jié)果是一棵二叉樹或多叉樹。二叉樹的內(nèi)部節(jié)點(diǎn)(非葉子節(jié)點(diǎn))一般表示為一個邏輯判斷,如形式為a=ai的邏輯判斷,其中a是屬性,ai是該屬性的所有取值:樹的邊是邏輯判斷的分支結(jié)果。多叉樹(ID3)的內(nèi)部結(jié)點(diǎn)是屬性,邊是該屬性的所有取值,有幾個屬性值就有幾條邊。樹的葉子節(jié)點(diǎn)都是類別標(biāo)記。由于數(shù)據(jù)表示不當(dāng)、有噪聲或者由于決策樹生成時產(chǎn)生重復(fù)的子樹等原因,都會造成產(chǎn)生的決策樹過大。因此,簡化決策樹是一個不可缺少的環(huán)節(jié)。尋找一棵最優(yōu)決策樹,主要應(yīng)解決以下3個最優(yōu)化問題:①生成最少數(shù)目的葉子節(jié)點(diǎn);②生成的每個葉子節(jié)點(diǎn)的深度最小;③生成的決策樹葉子節(jié)點(diǎn)最少且每個葉子節(jié)點(diǎn)的深度最小。(3)決策樹的幾個重要參數(shù)Criterion:用來衡量分支質(zhì)量的指標(biāo),即衡量不純度的指標(biāo),可使用信息熵(Entropy)或基尼系數(shù)(GiniImpurity)。Splitter:用于確定每個節(jié)點(diǎn)的分支策略,輸入“best”使用最佳分支,或輸入“random”使用最佳隨機(jī)分支。(4)決策樹預(yù)測模型的優(yōu)缺點(diǎn)決策樹是一種十分常用的分類方法,很容易理解和解釋;即使只有很少的數(shù)據(jù)也有價(jià)值??梢曰诜治龅贸龅那闆r生成確定不同方案的最差,最佳和預(yù)期值;可以與其他決策技術(shù)結(jié)合使用;它運(yùn)用了可視化模型。但它是不穩(wěn)定的,這意味著數(shù)據(jù)的微小變化可能導(dǎo)致最優(yōu)決策樹結(jié)構(gòu)的巨大變化;通常相對不準(zhǔn)確,許多其他預(yù)測模型使用類似數(shù)據(jù)表現(xiàn)更好;對于包括具有不同級別數(shù)的分類變量的數(shù)據(jù),決策樹中的信息增益偏向于具有更多級別的那些屬性;計(jì)算可能變得非常復(fù)雜,特別是如果許多值不確定和許多結(jié)果是相關(guān)的。4.1.2BP人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型(1)概念及應(yīng)用人工神經(jīng)網(wǎng)絡(luò)通過數(shù)學(xué)建模的方式,能夠?qū)Σ皇蔷€性映射的復(fù)雜問題提供較為穩(wěn)定的一種解決方法,而不需要特定的式子來解析,且用建模的方法預(yù)測精度高,因此常常適用于復(fù)雜的交通事故預(yù)測。BP網(wǎng)絡(luò)作為人工神經(jīng)網(wǎng)絡(luò)的一種,常常用于解決實(shí)際問題。與其他數(shù)學(xué)模型相比,BP神經(jīng)網(wǎng)絡(luò)應(yīng)用的較為廣泛,且取得了相當(dāng)好的效果。(2)工作原理人工神經(jīng)網(wǎng)絡(luò)無需事先確定輸入輸出之間映射關(guān)系的數(shù)學(xué)方程,僅通過自身的訓(xùn)練,學(xué)習(xí)某種規(guī)則,在給定輸入值時得到最接近期望輸出值的結(jié)果。作為一種智能信息處理系統(tǒng),人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)其功能的核心是算法。BP神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播(簡稱誤差反傳)訓(xùn)練的多層前饋網(wǎng)絡(luò),其算法稱為BP算法,它的基本思想是梯度下降法,利用梯度搜索技術(shù),以期使網(wǎng)絡(luò)的實(shí)際輸出值和期望輸出值的誤差均方差為最小。(3)BP人工神經(jīng)網(wǎng)絡(luò)模型優(yōu)缺點(diǎn)BP神經(jīng)網(wǎng)絡(luò)無論在網(wǎng)絡(luò)理論還是在性能方面已比較成熟。其突出優(yōu)點(diǎn)就是具有很強(qiáng)的非線性映射能力和柔性的網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)的中間層數(shù)、各層的神經(jīng)元個數(shù)可根據(jù)具體情況任意設(shè)定,并且隨著結(jié)構(gòu)的差異其性能也有所不同。但是BP神經(jīng)網(wǎng)絡(luò)也存在以下的一些主要缺陷:學(xué)習(xí)速度慢,即使是一個簡單的問題,一般也需要幾百次甚至上千次的學(xué)習(xí)才能收斂;容易陷入局部極小值;網(wǎng)絡(luò)層數(shù)、神經(jīng)元個數(shù)的選擇沒有相應(yīng)的理論指導(dǎo);網(wǎng)絡(luò)推廣能力有限。4.1.3隨機(jī)森林預(yù)測模型(1)概念及應(yīng)用 隨機(jī)森林(Randomforest)是由多棵決策樹組成的集成學(xué)習(xí)算法。對于分類問題,一個測試樣本會送到每一棵決策樹中進(jìn)行預(yù)測,然后進(jìn)行投票,得票最多的類為最終分類結(jié)果。對于回歸問題隨機(jī)森林的預(yù)測輸出是所有決策樹輸出的均值。(2)工作原理輸入:訓(xùn)練數(shù)據(jù)集D={(x1,y2),(x2,y2),…,(xn,yn)},樣本子集的個數(shù)T輸出:最終的的強(qiáng)分類器f(x)從原始樣本集中隨機(jī)的抽取m個樣本點(diǎn),得到一個訓(xùn)練集。用訓(xùn)練集訓(xùn)練一個CART決策樹,這里在訓(xùn)練的過程中,對每個節(jié)點(diǎn)的切分規(guī)則是先從所有特征中隨機(jī)的選擇k個特征,然后在從這k個特征中選擇最優(yōu)的切分點(diǎn)在做左右子樹的劃分。如果是分類算法,則預(yù)測的最終類別為該樣本點(diǎn)所到葉節(jié)點(diǎn)中投票數(shù)最多的類別;如果是回歸算法,則最終的類別為該樣本點(diǎn)所到葉節(jié)點(diǎn)的均值。(3)優(yōu)缺點(diǎn)隨機(jī)森林算法訓(xùn)練可以高度并行化,對于大數(shù)據(jù)時代的大樣本訓(xùn)練速度有較大優(yōu)勢;由于可以隨機(jī)選擇決策樹節(jié)點(diǎn)劃分特征,這樣在樣本特征維度很高的時候,仍然能高效地訓(xùn)練模型,且采用了隨機(jī)采樣,訓(xùn)練出的模型的方差小,泛化能力強(qiáng);對部分特征缺失不敏感。但是在某些樣本中,隨機(jī)森林算法容易有過擬合的問題;取值劃分比較多的特征容易對隨機(jī)森林的決策產(chǎn)生更大的影響,從而影響擬合的模型的效果。4.2交通事故預(yù)測模型選擇 決策樹模型預(yù)測數(shù)據(jù)較為不穩(wěn)定,BP人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速度慢。而隨機(jī)森林模型可以處理大量數(shù)據(jù),在樣本特征維度較高的時候仍然能高效地訓(xùn)練模型。綜合比較后,本文選擇隨機(jī)森林模型來對英國的交通數(shù)據(jù)進(jìn)行預(yù)測。4.3隨機(jī)森林交通事故預(yù)測過程 本文所選預(yù)測模型的數(shù)據(jù)同樣來源于外國數(shù)據(jù)網(wǎng)站kaggle,選擇了2005-2007年、2009-2014年的每月總交通事故數(shù)據(jù)作為研究對象(數(shù)據(jù)庫網(wǎng)站缺少2008年的數(shù)據(jù)),具體數(shù)據(jù)如下表所示:進(jìn)行了數(shù)據(jù)準(zhǔn)備工作之后,之后的工作就是將數(shù)據(jù)帶入到隨機(jī)森林預(yù)測模型進(jìn)行預(yù)測了。首先讀取相應(yīng)的數(shù)據(jù),對數(shù)據(jù)進(jìn)行預(yù)處理。將年份和月份均作為x,以2005年1月為例,x1為2005,x2為1。將每月交通事故發(fā)生總數(shù)作為y。之后將2005-2007年和2009-2013年的交通事故數(shù)據(jù)作為訓(xùn)練集,2014年的交通事故數(shù)據(jù)作為訓(xùn)練集進(jìn)行預(yù)測。之后導(dǎo)入數(shù)據(jù)庫,調(diào)整參數(shù)randomstate為2020保證每次結(jié)果運(yùn)行一致不會出現(xiàn)隨機(jī)性結(jié)果。具體程序見附錄,得出預(yù)測結(jié)果數(shù)據(jù)和折線圖,見下圖4.3以及表4.3。圖4.3隨機(jī)森林預(yù)測值與真實(shí)值對比折線圖表4.3隨機(jī)森林預(yù)測值與真實(shí)值對比數(shù)據(jù)年月交通事故真實(shí)值交通事故預(yù)測值2014年1月12086102852014年2月10780100292014年3月11915102882014年4月11008105272014年5月12303114342014年6月12532119692014年7月13026125222014年8月12108120052014年9月11832121872014年10月13450130902014年11月13246131192014年12月1203612313 通過折線圖對比可以看到除了前三個月的擬合略微有些偏差以外,后面的擬合情況較為合理,光通過直觀圖片分析是無法說明結(jié)果的。于是本文引入三個參數(shù)進(jìn)行評估。帶入模型評估后得到評價(jià)見下表4.4:表4.4隨機(jī)森林預(yù)測模型評價(jià)指標(biāo)評級指標(biāo)評價(jià)值平均絕對誤差(MAE)0.33608均方根誤差(RMSE)0.43085平均絕對誤差(MAE)是所有單個觀測值與算術(shù)平均值的偏差的絕對值的平均。平均絕對誤差可以避免誤差相互抵消的問題,因而可以準(zhǔn)確反映實(shí)際預(yù)測誤差的大小。對于本次的隨機(jī)森林的預(yù)測模型,平均絕對誤差的值是0.33608處于較低的水平,滿足模型的擬合要求。均方根誤差(RMSE)是預(yù)測值與真實(shí)值偏差的平方與觀測次數(shù)n比值的平方根。它值越小,說明擬合效果就越好,均方根誤差的值是0.43085符合模型的擬合要求。 綜上所述,采用隨機(jī)森林的預(yù)測模型對英國2005-2007年、2009年-2014年的交通事故數(shù)據(jù)預(yù)測擬合是十分合理且有效的。5減少交通事故的措施5.1實(shí)時車輛的監(jiān)控管理雖然交通運(yùn)輸主管部門對運(yùn)輸企業(yè)的監(jiān)控與管理對于減少道路交通安全隱患非常重要,但實(shí)際運(yùn)行該方法的過程中往往難以有效率地管理與監(jiān)控車輛。因此需要要進(jìn)一步推進(jìn)車載GPS和車載定位系統(tǒng)安裝,嚴(yán)格監(jiān)管道路交通來往車輛。同時,可以安裝攝像頭在需要重點(diǎn)管理與監(jiān)控的道路運(yùn)輸車輛上,通過車載攝像頭把當(dāng)前道路的具體信息反映到道路信息預(yù)警系統(tǒng)中,通過系統(tǒng)對當(dāng)前道路情況的分析,以智能化手段對運(yùn)輸車輛進(jìn)行實(shí)時動態(tài)監(jiān)控,并根據(jù)當(dāng)前預(yù)警等級對駕駛員進(jìn)行通知,實(shí)現(xiàn)對運(yùn)輸車輛的“預(yù)先警告”。5.2加強(qiáng)安全宣傳教育,提高交通參與人文明守法意識近年來隨著我國道路交通的發(fā)展,司機(jī)和行人的數(shù)量逐漸增多,但交通參與者的交通安全和守法意識相對薄弱,嚴(yán)格遵守交通規(guī)則的參與者并非占大多數(shù),不斷有多種不文明交通現(xiàn)象發(fā)生,最為人所熟知的就有“中國式過馬路”,這其實(shí)就是行人對自己的安全重視度不高的表現(xiàn)。當(dāng)然駕駛?cè)艘灿性S多不文明現(xiàn)象,例如隨意開車窗拋灑物品、路邊停車和追逐行駛等。因此加強(qiáng)交通安全宣傳教育,可以通過利用報(bào)刊、互聯(lián)網(wǎng)、宣傳單和新聞媒體等進(jìn)行交通安全知識的普及,不斷提高交通參與者的交通安全意識和法制觀念,才能從根本上減少交通事故,使交通安全的意識深入人心。5.3加大道路交通資金投入,提高交通智能化管理水平我國城市道路交通基礎(chǔ)設(shè)施和道路的承載能力和日益增加的交通需要之間的相互矛盾仍然會長期保持,如果想要尋找一個在有限的資源和空間里容納更多交通人流的方式,就必須進(jìn)一步提高道路交通工具設(shè)備的科學(xué)技術(shù)含量,使交通實(shí)現(xiàn)高效率、智能化的管理水平。隨著互聯(lián)網(wǎng)技術(shù)的進(jìn)一步發(fā)展和應(yīng)用、大數(shù)據(jù)技術(shù)的普及和發(fā)展,其對于車輛安全性的分析、總結(jié)等功能都可以被廣泛地應(yīng)用于交通管理當(dāng)中。例如匯總和分析我國歷年的道路交通事故統(tǒng)計(jì)資料,找出事故的多發(fā)地帶和相應(yīng)的造成交通事故的原因和違法情況,并根據(jù)違法情況和原因確定了有重點(diǎn)的、具有針對性的調(diào)整。同樣我們也可以利用大數(shù)據(jù)的手段進(jìn)行分析各個路段主干道的交通量,引導(dǎo)駕駛員選擇最佳的路線或錯峰地出行。運(yùn)用移動互聯(lián)網(wǎng)視頻信息處理技術(shù)進(jìn)一步提高了汽車事故保險(xiǎn)理賠的工作速度,實(shí)現(xiàn)輕微的交通事故現(xiàn)場可由當(dāng)事人自行停車攝像或者自行拍照視頻下載,事故現(xiàn)場短暫的緊急撤離,提高效率且也降低了交通擁堵及次生車輛事故事件的持續(xù)發(fā)展。每一起重大道路交通事故都可能是偶然,不一定能被準(zhǔn)確預(yù)測,但長期跟蹤追查或者長期跟蹤特殊時間地區(qū)的重大道路交通安全事故發(fā)生原因和統(tǒng)計(jì)數(shù)據(jù),并把一定的一段時期內(nèi)某個特殊時間地段的重大交通安全事故發(fā)生原因和統(tǒng)計(jì)數(shù)據(jù)綜合進(jìn)行分析加以長期綜合性的統(tǒng)計(jì)和歸類分析,不難看出,事故的頻繁發(fā)生都可能是由于其本身所含有的各種共性交通安全隱患,這些造成共性交通安全隱患的各種誘因如果加以疊加結(jié)合到一起就必然增大了交通事故的頻繁發(fā)生的概率,隨著事故時間的不斷流逝而逐漸加以積累,安全隱患也比較多的地理位置必將直接導(dǎo)致更多的大型道路重大交通事故。交通事故的產(chǎn)生具有一定的偶然性、隨機(jī)性,受多種原因共同影響。統(tǒng)計(jì)學(xué)分析道路交通事故產(chǎn)生的原因具有重大的意義,能夠揭露其中的客觀規(guī)律及發(fā)展趨勢,為道路交通法規(guī)的研究制訂提供了參考和依據(jù),提高道路交通行政管理工作的針對性和效率。但是完全減少交通事故的發(fā)生并不太現(xiàn)實(shí),交通事故預(yù)防處置是一個系統(tǒng)工程,需要各個部門之間進(jìn)行協(xié)同和共管。建立政府各相關(guān)部門的交通聯(lián)席會議制度,發(fā)揮各相關(guān)部門職能優(yōu)勢,明確細(xì)化責(zé)任和分工,形成齊抓共管的長效機(jī)制,才能最大限度的預(yù)防和減少交通事故的發(fā)生,遏制道路交通事故高發(fā)、降低交通事故損害依然任重道遠(yuǎn)。5.4合理規(guī)劃路網(wǎng)建設(shè),完善交通安全設(shè)施目前我國高速公路的建成通車管理與運(yùn)營已經(jīng)取得了一定的成就,總運(yùn)營里程已經(jīng)處于世界頂尖水平,但是公路交通運(yùn)輸安全管理情況與發(fā)達(dá)國家的高速公路管理運(yùn)營情況相比仍然有一段距離。在力求實(shí)現(xiàn)民用道路總體規(guī)劃和民用建筑物的總體設(shè)計(jì)中,要把安全道路防護(hù)放在首位,采用科學(xué)有效的防護(hù)措施,合理地進(jìn)行設(shè)計(jì)和組織施工,并定期地組織進(jìn)行日常道路安全養(yǎng)護(hù)。在加強(qiáng)高速公路交通建設(shè)安全方面,我國的道路地形、土壤結(jié)構(gòu)復(fù)雜多樣,山區(qū)上和高原上小型車輛陡坡跌落,以及大型車輛高速撞擊高山懸崖等各種可能直接導(dǎo)致行人或者身體局部受傷的重特大道路交通安全事故時有發(fā)生,嚴(yán)防這種特殊類型的道路交通事故還需要從許多安全方面措施入手,山區(qū)的類型道路減速應(yīng)該及時增設(shè)路邊護(hù)欄及加強(qiáng)安全防護(hù)欄,針對盤山公道路段的急轉(zhuǎn)、陡坡等類型道路減速要求應(yīng)該增設(shè)減速警示牌和增加減速帶。盡量減少設(shè)置高速公路沿線的狹窄小型交通路口,有必要在該處進(jìn)行設(shè)置的小路口,工作人員們還應(yīng)當(dāng)注意提前及時布設(shè)交通減速帶和設(shè)置路口的交通警示牌等標(biāo)識,并且一定要及時消除該處設(shè)置路口上的廣告牌和路邊樹木等遮擋物,使該處設(shè)置路口的沿線視野范圍變得開闊而不至于沿線有任何死角。根據(jù)道路超速而可能導(dǎo)致的道路交通違法事故以及數(shù)量都比較多的交通情況,在道路超速容易同時發(fā)生,尤其特別是長途車和平直高速道路上還增加了一個區(qū)間性的交通測速預(yù)警裝置,抓拍了不少超速的交通違法行為。在正確建立城市綠化交通城市樹林風(fēng)光路線圖的基礎(chǔ)同時,要特別注意如何避免城市樹林空氣污染嚴(yán)重影響綠化城市道路的正常通行和公眾視線,注意定期保護(hù)更新修剪城市樹林以及建立防止樹林遮蔽公共交通和道路監(jiān)控監(jiān)視裝置。結(jié)論我國經(jīng)濟(jì)快速發(fā)展,城鎮(zhèn)化建設(shè)愈發(fā)成熟,機(jī)動車的數(shù)量持續(xù)增加,人們出行變得越來越便利,道路交通在社會進(jìn)步與發(fā)展的過程中扮演著越來越重要的角色。隨之而來,道路交通安全問題對社會經(jīng)濟(jì),人身、財(cái)產(chǎn)安全也產(chǎn)生了巨大的威脅。本文便針對交通事故的成因展開研究,探討了不同條件下交通事故發(fā)生情況,還通過商業(yè)軟件tableau對數(shù)據(jù)和具體路段進(jìn)行了可視化分析?;陔S機(jī)森林預(yù)測模型對英國2005-2007年、2009-2014年的交通數(shù)據(jù)進(jìn)行了交通事故預(yù)測。在交通事故分析和交通事故預(yù)測后,本文對減少交通事故提了幾點(diǎn)建議。本文主要內(nèi)容有兩個方面,分別如下:1.數(shù)據(jù)收集與可視化研究本文所選擇交通數(shù)據(jù)來源于數(shù)據(jù)庫網(wǎng)站kaggle,包含了本文可視化分析研究所需的路面條件、天氣狀況、照明條件、事故發(fā)生具體時間(年、月、日、星期和時刻)和事故嚴(yán)重程度等。通過tableau可視化分析2014年英國全年發(fā)生的交通事故數(shù)據(jù)可以得知:(1)事故多發(fā)于早晚高峰,這與人們的工作生活習(xí)性有關(guān)。早晚高峰正處于上班族的上下班時間,道路上的車流量明顯增高,于是交通事故發(fā)生的數(shù)量也就隨之增加(2)事故多發(fā)于晴好的天氣狀況。除去晴好天氣占據(jù)較大部分的時間的因素外,晴好的天氣反而容易發(fā)生交通事故。與晴好天氣類似,路面情況、光照條件同樣是在條件較好的情況下反而交通事故發(fā)生的比例更高,這顯然是與常理不符合的。經(jīng)過分析后,在行駛環(huán)境良好的條件下,駕駛員心態(tài)可能會過于放松,行駛速度加快,對周圍可能發(fā)生的情況沒有防備,從而導(dǎo)致交通事故的發(fā)生。在各種不良條件的分析下得知,路面濕滑、雨天、路面照明情況不佳是導(dǎo)致交通事故發(fā)生的主要誘因,惡劣天氣給駕駛員判斷周圍情況帶來了麻煩,因此容易發(fā)生交通事故。(3)地圖結(jié)合交通數(shù)據(jù)可視化分析結(jié)果表明,高速公路的匝道以及交叉口是LewishamWay發(fā)生交通事故的熱點(diǎn)地區(qū)。在不同天氣條件下所表現(xiàn)的交通事故分布特征也與英國發(fā)生事故的特征基本一致。結(jié)合交通事故散點(diǎn)圖可以發(fā)現(xiàn)路厄斯罕市西南-東北走向的道路明顯交通事故總量要高于其余兩條主要道路,推測是因?yàn)榕R近商業(yè)區(qū),承受了來自市中心和繁華商業(yè)區(qū)的較大的交通壓力導(dǎo)致發(fā)生交通事故。2.交通事故預(yù)測本文采用了數(shù)據(jù)網(wǎng)站kaggle的數(shù)據(jù)進(jìn)行交通事故預(yù)測,在多種預(yù)測模型的橫向?qū)Ρ认?,最終選擇了隨機(jī)森林模型對數(shù)據(jù)進(jìn)行預(yù)測。以2005-2007年、2009-2013年的數(shù)據(jù)作為訓(xùn)練集,2014年的數(shù)據(jù)作為測試集進(jìn)行預(yù)測。得到了2014年每月交通事故量預(yù)測值,并與真實(shí)值進(jìn)行比對繪制出折線圖。最后采用模型評價(jià)指標(biāo)MAE和RMSE對模型進(jìn)行評價(jià),結(jié)果顯示,隨機(jī)森林預(yù)測交通量擬合效果良好。3.論文的不足和展望由于本人能力不足,論文有很多可以改善的地方。本文的可視化分析內(nèi)容僅基于tableau商業(yè)化軟件所出的成果圖??煞治龅膬?nèi)容可以考慮增加死亡人數(shù)、受傷人數(shù)、直接經(jīng)濟(jì)損失等事故統(tǒng)計(jì)指標(biāo)。本文的研究主體是基于2005-2014年英國的數(shù)據(jù),因其存在時間上的滯后性和地區(qū)局限性,無法將預(yù)測結(jié)論更好地應(yīng)用到我國交通的實(shí)際中,因此,在后續(xù)研究中,如果能取得最新和最全面的數(shù)據(jù)來預(yù)測分析,將會更具有實(shí)踐指導(dǎo)意義。參考文獻(xiàn)[1]CaulfieldXC.Spatialandtemporalvisualisationtechniquesforcrashanalysis[J].AccidentAnalysis&Prevention,2011.[2]饒永明,張延孔,謝文軍,等.交通事故時空模式可視分析方法[J].計(jì)算機(jī)科學(xué),2019,046(004):14-21.[3]WongsuphasawatK,PackML,DFilippova,etal.VisualAnalyticsforTransportationIncidentDataSets[J].TransportationResearchRecordJournaloftheTransportationResearchBoard,2009,2138(2138):135-145.[4]WangD,LiuQ,MaL,etal.Roadtrafficaccidentseverityanalysis:Acensus-basedstudyinChina[J].JournalofSafetyResearch,2019,70(Sep.):135-147.[5]RoadtrafficmortalityinChina:analysisofnationalsurveillancedatafrom2006to2016.[J].LancetPublicHealth,2019.[6]ZhangG,YauK,ChenG.RiskfactorsassociatedwithtrafficviolationsandaccidentseverityinChina[J].AccidentAnalysisandPrevention,2013,59:18-25.[7]劉祖德,劉永泰,王淸淸.相關(guān)關(guān)系和因果關(guān)系在事故分析中的應(yīng)用——研究綜述與啟示[J].安全與環(huán)境學(xué)報(bào),2020,v.20;No.115(01):174-182.[8]RusdiR,MazharulH,MohammadS,etal.CrashseverityalongruralmountainoushighwaysinMalaysia:Anapplicationofacombineddecisiontreeandlogisticregressionmodel[J].TrafficInjuryPrevention,2018:1.[9]XuX,ShiY,WuY,etal.ResearchingonTrafficAccidentBasedonRelevanceAnalysis[C]//2019IEEEInternationalConferenceonPower,IntelligentComputingandSystems(ICPICS).IEEE,2019.[10]AlkhederS,AlrukaibiF,AiashA.Riskanalysisoftrafficaccidents'severities:Anapplicationofthreedataminingmodels[J].ISATransactions,2020.[11]于志青.基于大數(shù)據(jù)架構(gòu)的智能交通可視化平臺設(shè)計(jì)[J].中州大學(xué)學(xué)報(bào),2021,38(01):120-123.[12]曹惠茹,成海秀,劉永鑫,陳鳳宜,詹錫隆.基于云計(jì)算的城市軌道交通數(shù)據(jù)可視化方法及案例研究[J].計(jì)算機(jī)應(yīng)用與軟件,2021,38(02):33-36+49.[13]謝燕剛,張毅,劉正寅.基于WebGL技術(shù)的軌道交通綜合安防系統(tǒng)三維可視化應(yīng)用研究[J].中小企業(yè)管理與科技(上旬刊),2021(02):177-179.[14]吳向平,平力俊,徐董事.結(jié)合社交媒體數(shù)據(jù)的城市交通事件可視分析方法[J/OL].系統(tǒng)仿真學(xué)報(bào):1-11[2021-03-28].[15]張昊,張健欽,王家川,石睿軒,陸浩,張安基于云存儲的城市交通大數(shù)據(jù)可視化系統(tǒng)[J]科學(xué)技術(shù)創(chuàng)新,2021(01):81-82.[16]吳佩潔,孟祥海,曹夢迪.城市交通事故多發(fā)點(diǎn)鑒別與時空模式挖掘[J].中國安全科學(xué)學(xué)報(bào),2020,30(11):127-133.[17]朱楠,劉晶.基于出租車GPS數(shù)據(jù)下的交通可視化研究[J].黑龍江交通科技,2020,43(11):158-160.[18]曾春海.交通流量數(shù)據(jù)可視化平臺應(yīng)用分析[J].交通與運(yùn)輸,2020,33(S1):200-204.[19]張博中.基于船舶大數(shù)據(jù)的交通狀態(tài)識別及可視化技術(shù)研究[D].大連海事大學(xué),2020.[20]李瀟.基于軌跡數(shù)據(jù)的城市交通模式提取與可視分析[D].浙江工業(yè)大學(xué),2020.[21]吳培寧.基于GIS的三維交通噪聲屏障路段環(huán)評可視化技術(shù)研究與實(shí)踐[J].計(jì)算機(jī)應(yīng)用與軟件,2020,037(005):82-89,107.[22]李杰,曾砜,李平,姜晨明.道路交通安全文獻(xiàn)的知識可視化綜述[J].交通信息與安全,2020,38(01):13-19+26.[23]劉芳芳,張錦濤,黃杰.基于大數(shù)據(jù)的城市交通可視化技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用,2019,37(05):92+94.[24]劉學(xué)軍,孫文高.城市軌道交通及傳統(tǒng)公交網(wǎng)絡(luò)可視化研究[J].今日財(cái)富(中國知識產(chǎn)權(quán)),2019(05):211.[25]CharlottePlug,Jianhong(Cecilia)Xia,CraigCaulfield.Spatialandtemporalvisualisationtechniquesforcrashanalysis[J].AccidentAnalysisandPrevention,2011,43(6).[26]袁力.基于地理信息和數(shù)據(jù)可視化的道路交通事故調(diào)研分析與對策建議[J].汽車與安全,2018(07):90-95.

!附錄A隨機(jī)森林預(yù)測模型importpandasaspdimportnumpyasnpfromsklearn.metricsimportmean_absolute_error,mean_squared_error,r2_scorefromsklearn.preprocessingimportStandardScalerfromsklearn.model_selectionimporttrain_test_split,KFold,cross_val_score,RandomizedSearchCV,GridSearchCVfromsklearn.ensembleimportRandomForestRegressorfromsklearn.svmimportSVRdata_1=pd.read_csv('accidents_2005_to_2007.csv')data_2=pd.read_csv('accidents_2009_to_2011.csv')data_3=pd.read_csv('accidents_2012_to_20141.csv',encoding='gbk')data_3=data_3.drop(['事故數(shù)'],axis=1)data=pd.concat((data_1,data_2,data_3),axis=0)print(data.shape)date=data.Date.valuesdiction={}years_month_collection=[]#以下是做數(shù)據(jù)集處理的,用的字典的方式,把每月的事故數(shù)統(tǒng)計(jì)起來forsingle_dateindate:line=single_date.split('/')years_month_string=line[2]+'/'+line[1]years_month_collection.append(years_month_string)forsingle_years_monthinyears_month_collection:ifsingle_years_monthnotindiction.keys():diction[single_years_month]=1else:values=diction[single_years_month]values+=1diction[single_years_month]=valuesdata=np.array(list(diction.keys()))dataset=[]forsingle_dataindata:data_set=[]years,month=single_data.split('/')data_set.append(years)data_set.append(month)dataset.append(data_set)label=np.array(list(diction.values()))all_data=np.concatenate((dataset,label.reshape(-1,1)),axis=1)all_data=pd.DataFrame(all_data,columns=['years','month','count'])all_data.to_csv('123.csv')print(dataset[0],

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論