版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、摘要IABSTRACTII1 緒 論11.1 本課題研究背景11.2 本課題研究意義11.3 國內(nèi)外研究現(xiàn)狀21.4 本課題研究內(nèi)容32 交通流特性的相關(guān)研究5交通流的概念5交通流的基本參數(shù)52.2.1 交通流量52.2.2 平均速度62.2.3 密集度62.3 交通流特性72.3.1 速度密度(u-k)模型82.3.2 速度流量(u-q)模型102.3.3 流量密度 (q-k) 模型11數(shù)據(jù)模型概述13數(shù)據(jù)流研究背景13不確定數(shù)據(jù)研究背景143 交通流數(shù)據(jù)質(zhì)量檢測算法研究163.1 交通流數(shù)據(jù)質(zhì)量檢測理論163.1.1 交通流數(shù)據(jù)常見問題163.1.2 交通數(shù)據(jù)故障識別方法17數(shù)據(jù)問題的處理
2、方法183.2 故障數(shù)據(jù)檢測算法223.2.1 故障數(shù)據(jù)檢測步驟243.2.2 故障數(shù)據(jù)檢測263.3 特長高速公路隧道交通流故障數(shù)據(jù)檢測273.4 本章小結(jié)304 全文總結(jié)與展望31致謝32參考文獻33摘 要隨著特長高速公路隧道交通安全研究的深入,特長高速公路隧道實時交通流數(shù)據(jù)質(zhì)量逐漸受到重視和關(guān)注,對特長高速公路隧道交通流數(shù)據(jù)進行故障數(shù)據(jù)檢測是提高數(shù)據(jù)質(zhì)量的關(guān)鍵。在智能交通系統(tǒng)(ITS, intelligent transportation system)的大背景下,如何利用豐富的交通檢測數(shù)據(jù),對現(xiàn)在的交通流狀態(tài),特別是在城市中處于重要地位的快速路的交通狀態(tài)進行檢測,對于提高交通運輸效率,
3、特別是物流企業(yè)的效率具有重要的理論意義和實用價值。智能交通系統(tǒng)(ITS, intelligent transportation system)運行的基礎(chǔ)是ITS數(shù)據(jù)。當路上采集到的ITS數(shù)據(jù)源源不斷地傳輸?shù)浇煌ㄖ笓]中心后,中心會對數(shù)據(jù)進行相應(yīng)的處理和應(yīng)用,如集成、抽樣、壓縮、存儲、發(fā)布等。由于傳輸設(shè)備故障、路面交通狀況和環(huán)境因素的異常以及ITS設(shè)備的連續(xù)性工作特點所引發(fā)的間歇性工作故障,都會使所采集的數(shù)據(jù)出現(xiàn)錯誤、丟失及不精確的情況,若直接采用包含有質(zhì)量問題的數(shù)據(jù)提供給道路交通應(yīng)用,必將給應(yīng)用帶來不穩(wěn)定和不安全隱患的后果。因此,有必要對ITS數(shù)據(jù)進行質(zhì)量檢測,降低問題數(shù)據(jù)對整體數(shù)據(jù)精確度的影響
4、,保證對ITS數(shù)據(jù)的成功處理和安全應(yīng)用。就ITS數(shù)據(jù)而言,質(zhì)量檢測意味著用一定的方法產(chǎn)生高質(zhì)量的數(shù)據(jù)信息來滿足數(shù)據(jù)用戶的需求,ITS數(shù)據(jù)質(zhì)量檢測技術(shù)旨在對錯誤、丟失和不精確等問題數(shù)據(jù)進行判別并且給予修正,最終得到更為準確的數(shù)據(jù)。本文在綜合學(xué)習(xí)相關(guān)學(xué)者關(guān)于交通流故障數(shù)據(jù)研究成果基礎(chǔ)上,針對特長高速公路隧道交通特點,綜合考慮特長高速公路隧道交通流特性,對特長高速公路隧道歷史交通流數(shù)據(jù)質(zhì)量進行檢測。關(guān)鍵字:智能交通系統(tǒng)、數(shù)據(jù)錯誤、交通流數(shù)據(jù)質(zhì)量、故障數(shù)據(jù)檢測AbstractWith the deepening of specialty highway tunnel traffic safety re
5、search, real-time traffic flow data quality expertise highway tunnel gradually more attention and concern, the specialty highway tunnel traffic flow data for fault data detection is the key to improving data quality. Context of intelligent transportation system (the ITS, intelligent transportation s
6、ystem), how to use the wealth of data on traffic detection, traffic flow state, especially in an important position in the highway traffic in the city state for testing, for improving the transportation efficiency, especially the efficiency of logistics enterprises has important theoretical signific
7、ance and practical value.Intelligent transportation system (the ITS, intelligent transportation system) running on the basis of ITS data. Way acquisition to the ITS data are continuously transmitted to the traffic control center, the center will data processing and applications such as integrated sa
8、mpling, compression, storage, release. Intermittent failures caused due to the continuity of the work characteristics of the transmission equipment failure, road traffic conditions and environmental factors, abnormal and ITS equipment will make the data collected by an error, missing and inaccurate,
9、 if used directly contains the quality of the data available to road traffic applications, bound to the application of the consequences of the hidden dangers of instability and insecurity. Therefore, it is necessary for the ITS data quality testing to reduce the impact of the problem data on the ove
10、rall data accuracy, and to ensure the success of the ITS data processing and security applications. ITS data quality testing means that a certain way to produce high-quality data to meet the needs of data users, the ITS data quality detection technology is designed to distinguish and give the correc
11、t error, missing and inaccurate data, and ultimately get more accurate data.Integrated learning and scholars on the basis of the results of the fault data traffic flow on specialty highway tunnel traffic characteristics, considering the expertise highway tunnel traffic flow characteristics, the hist
12、orical traffic flow data quality expertise highway tunnel detection.Keywords:Intelligent transportation systems, data errors, the quality of traffic flow data, fault data detection1 緒 論1.1 本課題研究背景解決交通問題的傳統(tǒng)方法是修建道路,但無論是哪個國家,對于越來越復(fù)雜的交通大系統(tǒng),單獨從車輛或道路方面考慮,都很難完美地解決交通問題。另一方面,信息技術(shù)的飛速進步為綜合解決交通問題帶來了機遇。在此背景下,把車輛
13、、道路及環(huán)境綜合起來,系統(tǒng)地解決交通問題的思想便產(chǎn)生了,這就是智能交通系統(tǒng)(ITS)。智能交通系統(tǒng)中采集的交通流數(shù)據(jù)中承載著眾多交通信息,通過對交通流數(shù)據(jù)進行分析,發(fā)掘數(shù)據(jù)中存在的有用信息。面對智能交通系統(tǒng)海量的交通流數(shù)據(jù),在數(shù)據(jù)采集或數(shù)據(jù)傳輸中由于技術(shù)原因或設(shè)備原因造成數(shù)據(jù)故障,使得數(shù)據(jù)質(zhì)量下降、可信度降低,因此需要對智能交通系統(tǒng)交通流數(shù)據(jù)質(zhì)量展開研究,通過數(shù)據(jù)檢測和修正,提高智能交通系統(tǒng)交通流數(shù)據(jù)質(zhì)量。隨著特長高速公路隧道交通安全研究的深入,特長高速公路隧道實時交通流數(shù)據(jù)質(zhì)量逐漸受到重視和關(guān)注,對特長高速公路隧道交通流數(shù)據(jù)進行故障數(shù)據(jù)檢測是提高數(shù)據(jù)質(zhì)量的關(guān)鍵。并且隨著數(shù)據(jù)采集技術(shù)的提高,目
14、前交通流數(shù)據(jù)采集設(shè)備采樣周期越來越短,并且智能交通安全管理系統(tǒng)對交通流數(shù)據(jù)更新時間也越來越精確。在實際交通管理過程中,采集到的原始交通流數(shù)據(jù)利用率欠佳,美國得克薩斯州的每5分鐘時間間隔交通流采樣數(shù)據(jù)樣本中將近約20%的實時交通數(shù)據(jù)不能得到有效歸檔利用。實時的交通流數(shù)據(jù)信息為交通安全管理與控制提供正確的交通信息,并為下一個采樣周期內(nèi)交通安全控制策略提供可靠依據(jù),正確的高效的智能交通安全控制策略又為實時交通提供準確及時的誘導(dǎo)方案。1.2本課題研究意義智能交通系統(tǒng)在歐洲也稱道路交通信息通訊系統(tǒng),是基于系統(tǒng)工程、電子、通信、信息等多種高新技術(shù),并已滲透到航空、水運、鐵路交通領(lǐng)域的新型交通系統(tǒng). ITS
15、的建立可以提高路網(wǎng)通行能力和服務(wù)水平,改善環(huán)保質(zhì)量,提高能源利用率.“國家中長期科學(xué)與技術(shù)發(fā)展規(guī)劃綱要(2006-2020)”中明確提出“發(fā)展一個系統(tǒng),解決三個熱點問題”。其中,一個系統(tǒng)就是綜合運輸系統(tǒng),三個熱點問題就是交通能源和環(huán)境、交通安全和大城市交通擁堵問題。隨著智能交通系統(tǒng)交通流數(shù)據(jù)應(yīng)用研究的深入,采集的交通流數(shù)據(jù)的質(zhì)量逐漸受到重視和關(guān)注,對智能交通系統(tǒng)交通流數(shù)據(jù)進行質(zhì)量檢測是提高交通流數(shù)據(jù)質(zhì)量和數(shù)據(jù)可信度的關(guān)鍵,因此針對智能交通系統(tǒng)交通流數(shù)據(jù)質(zhì)量檢測算法展開相應(yīng)研究有利于提高智能交通系統(tǒng)的服務(wù)效率和服務(wù)水平。智能交通系統(tǒng)(ITS)是交通發(fā)展的必然趨勢,利用交通檢測器獲取海量信息,經(jīng)過
16、有效處理進行信息發(fā)布。但在智能交通系統(tǒng)(ITS)交通流數(shù)據(jù)采集或數(shù)據(jù)傳輸中,由于技術(shù)原因或設(shè)備原因造成的丟失數(shù)據(jù)、故障數(shù)據(jù)或時間點不規(guī)則等數(shù)據(jù)質(zhì)量問題,若直接采用具有質(zhì)量問題的交通流數(shù)據(jù)進行交通研究,將會為應(yīng)用帶來不穩(wěn)定或不安全的隱患。通過研究智能交通系統(tǒng)交通流數(shù)據(jù)質(zhì)量檢測算法,促使交通流數(shù)據(jù)質(zhì)量得到有效控制,可以為智能公共信息平臺所提供的交通數(shù)據(jù)查詢子系統(tǒng)提供高質(zhì)量的數(shù)據(jù)支持服務(wù),可以提高智能交通系統(tǒng)交通信息服務(wù)平臺發(fā)布數(shù)據(jù)的精度,可以為用戶提供高質(zhì)量的實時交通流數(shù)據(jù)從而提供快速高效的交通決策等。因此關(guān)于智能交通系統(tǒng)交通流數(shù)據(jù)質(zhì)量檢測算法研究預(yù)期成果的應(yīng)用前景良好,交通流數(shù)據(jù)質(zhì)量控制可以給智
17、能交通系統(tǒng)提供有力的數(shù)據(jù)質(zhì)量保障和較高的數(shù)據(jù)運行效率,預(yù)期成果所帶來的效益表現(xiàn)為提高道路通行能力和道路服務(wù)水平,有利于緩解城市交通擁堵和促進道路交通安全。 國內(nèi)外研究現(xiàn)狀對動態(tài)交通系統(tǒng)所采集到的數(shù)據(jù)進行研究之前,首先要對數(shù)據(jù)進行記錄檢查,找出負值或缺損數(shù)據(jù),然后除去這些記錄。宏觀交通數(shù)據(jù)的篩選主要分為兩類:閾值檢查和基于交通流理論的檢查,以保證數(shù)據(jù)的有效性完備性等質(zhì)量指標。目前應(yīng)用最普遍的檢查就是通過閾值確定數(shù)據(jù)的有效性,另外,通過應(yīng)用交通流理論中交通流參數(shù)之間的關(guān)系,可以進行進一步更復(fù)雜、更深入的數(shù)據(jù)篩選。國外自從Hawkins D給異常數(shù)據(jù)本質(zhì)定義之后,數(shù)據(jù)檢測算法研究慢慢受到關(guān)注,先后由
18、Rousseeuw和Ruts提出了基于深度算法、Clifford和Berndt提出了基于統(tǒng)計算法、Ng和Knorr進行了基于距離算法研究、Kriegel 和Breuning基于密度算法研究還有Aggarwal和Yu提出對于高維數(shù)據(jù)進行降低維數(shù)異常檢測思路等。Clifford J和Berndt J.D將統(tǒng)計學(xué)運用到數(shù)據(jù)異常數(shù)據(jù)檢測;Ruts和Rousseeuw將空間映射運用到層次劃分從而提出了基于深度的數(shù)據(jù)檢測算法;Breuning和 Kriegel將數(shù)據(jù)聚類算法與數(shù)據(jù)檢測算法相結(jié)合,對基于距離檢測算法進行改進,賦予了每個數(shù)據(jù)相應(yīng)局部異常因子來反映數(shù)據(jù)異常程度,提出了基于密度檢測算法;Knorr
19、和Ng應(yīng)用聚類劃分提出了基于距離的數(shù)據(jù)檢測算法,采用設(shè)定閾值對數(shù)據(jù)進行檢測,通過各個數(shù)據(jù)點對應(yīng)相應(yīng)聚類中心距離來實現(xiàn)數(shù)據(jù)檢測功能;Aggarwal 和 Yu提出了針對高維數(shù)據(jù)進行降低維數(shù)處理,通過降低維數(shù)來實現(xiàn)數(shù)據(jù)檢測算法。將高維數(shù)據(jù)映射到低維子空間,并根據(jù)子空間的映射數(shù)據(jù)稀疏程序來判斷是否存在異常數(shù)據(jù)。我國在ITS領(lǐng)域的研究起步較晚,但隨著全球范圍智能交通系統(tǒng)研究的興起,進入20世紀90年代,我國明顯加快了對智能交通技術(shù)研究的步伐。70年代中期至80年代初,理論研究重點圍繞交通流理論、交通工程學(xué)、城市路口自動控制數(shù)學(xué)模型等工作展開,技術(shù)開發(fā)包括點、線、面控計算機軟件、北京前三門交通控制試驗系
20、統(tǒng)、天津線控、面控試驗系統(tǒng)、信號機、檢測器的開發(fā)等。80年代中期至90年代初,公路系統(tǒng)的ITS理論研究主要有高速公路監(jiān)控系統(tǒng)數(shù)據(jù)模型、交通堵塞自動判斷模型、標志和標線視認性研究,駕駛心理研究等;開發(fā)應(yīng)用包括天津疏港公路交通工程技術(shù)研究(通信、監(jiān)控、安全設(shè)施),可變情報板、可變限速標志、通信適配器、通信控制器、緊急電話的研制,廣佛高速公路監(jiān)控系統(tǒng)、交通和氣象數(shù)據(jù)采集設(shè)備的研制、電子收費系統(tǒng)和不停車收費的試驗,以及交通工程CAD等。1.4 本課題研究內(nèi)容隨著智能交通系統(tǒng)交通流數(shù)據(jù)應(yīng)用研究的深入,交通流數(shù)據(jù)質(zhì)量逐漸受到重視和關(guān)注,對交通流數(shù)據(jù)進行故障數(shù)據(jù)檢測是提高數(shù)據(jù)質(zhì)量的關(guān)鍵。尤其是交通流各指標值
21、違背交通流指標特性關(guān)系而造成的不合理的錯誤數(shù)據(jù),得不到充分檢測。本課題在綜合學(xué)習(xí)相關(guān)學(xué)者關(guān)于交通流數(shù)據(jù)質(zhì)量檢測研究成果基礎(chǔ)上,針對智能交通系統(tǒng)交通流特性,綜合考慮交通流特性,對歷史交通流數(shù)據(jù)進行聚類,并根據(jù)聚類結(jié)果進行運算,通過交通流量-速度-時間占有率曲線擬合,實現(xiàn)智能交通系統(tǒng)交通流數(shù)據(jù)檢測。對于實時交通流數(shù)據(jù)進行質(zhì)量檢測,包括不規(guī)則時間點、丟失數(shù)據(jù)和故障數(shù)據(jù).針對不規(guī)則時間點檢測,采用原始交通流數(shù)據(jù)樣本中的時間值與正常情況下的采集時間點相對比,通過比較容許時間偏差范圍進行不規(guī)則時間點檢測;針對丟失數(shù)據(jù)檢測,采用交通流數(shù)據(jù)指標進行判斷,通過比較交通流數(shù)據(jù)各指標參數(shù)閾值范圍,進行交通流丟失數(shù)據(jù)
22、檢測;故障數(shù)據(jù)檢測,指針對各項指標均在閾值范圍內(nèi),但不符合交通流數(shù)據(jù)特性的故障數(shù)據(jù),綜合考慮交通流特性,對歷史交通流數(shù)據(jù)按照聚類結(jié)果進行交通流量-速度-時間占有率曲線擬合;確定不規(guī)則時間點檢測算法和丟失數(shù)據(jù)檢測算法;提出故障數(shù)據(jù)檢測算法;提高智能交通系統(tǒng)實時交通流數(shù)據(jù)質(zhì)量。2交通流特性的相關(guān)研究交通流的概念交通流是指道路上的人、車、貨從甲地到乙地的流動形態(tài),其分類如圖2一1所示。沒有特指的交通流一般指機動車流。2.2交通流的基本參數(shù)交通流運行狀態(tài)的定性、定量特征稱為交通流特性,用以描述交通流特性的一些物理量稱為交通流參數(shù),參數(shù)的變化反映了交通流的基本性質(zhì)。表征交通流特性的三個基本參數(shù)分別是:交
23、通流量、速度和密集度。交通流量交通流量是指在單位時間內(nèi),通過道路某一點、某一斷面或某一條車道的交通實體數(shù)(對于機動車而言就是車輛數(shù))。流量可以通過調(diào)查車頭時距獲得。車頭時距H:指同一地點車輛經(jīng)過的時間間距。如圖2-2所示,交通量q可以表示為平均車頭時距萬的倒數(shù):q = (2-1)圖2-2 車輛行駛軌跡的時空圖 平均速度一般分為地點速度和平均速度。地點速度就是平常所說的瞬時速度,即速度儀表上某時刻的顯示速度。在交通分析中,一般采用的平均速度v,即觀測時間內(nèi)通過道路某斷面的所有車輛速度的算術(shù)平均值:v=(2-2)2.2.3密集度密集度,包括占有率和密度兩種含義。密度是表示交通流擁擠狀態(tài)的恰當指標,
24、它是指一定長度的車道內(nèi)擁有的車輛數(shù),因此觀測困難,在交通控制與管理中,多采用時間占有率作為參數(shù)。 交通流特性通過特長高速公路隧道各段的數(shù)據(jù)采集設(shè)備獲得通過該檢測點某個采集時間間隔內(nèi)的交通流量、交通速度、交通密度、車頭時距、以及時間占有率等特征指標,在進行交通流特性分析時,采用交通流量、交通速度以及交通密度三項指標進行分析。由于交通系統(tǒng)中的主要元素車輛和人到達的隨機性,這些變量組成的交通流必然也是隨機的,也就是說交通量、速度、占有率三大參數(shù)也是隨機變量。當?shù)缆吠〞?,交通流平穩(wěn)均勻時,由交通流量-交通密度-交通速度三項指標得到交通流基本模型,如式(2-3)所示。 (2-3)取某特長高速公路隧道交通
25、流實測數(shù)據(jù)樣本,共816組,密度采用實測時間占有率代替,速度-時間占有率-交通流量實際交通流數(shù)據(jù)分布如圖2-3所示。圖2-3 實測交通流v-o-q分布速度-密度(u-k)模型在u-k模型中,每個密度值都對應(yīng)唯一的速度值,多用于理論研究。qk模型和q-u模型則不是。由于流量與密度、速度之間存在密切的相互影響關(guān)系,一旦知道了密度和速度,就可以計算出流量。1934 年,Greenshields 從航拍照片中獲得了速度和密度的數(shù)據(jù),據(jù)此提出了第一個線性模型;而后,Greenberg認為非線性模型更適合描述交通流的關(guān)系,于1959年提出了對數(shù)模型,Underwood關(guān)注暢通狀態(tài)的交通流,提出了指數(shù)模型,
26、分別描述了大密度和小密度狀態(tài)下的速度密度關(guān)系;后來,有關(guān)研究者提出了u-k關(guān)系的 S 型曲線模型,用一組單段式曲線族來描述u-k關(guān)系,Drew 在 Greenshields 模型的基礎(chǔ)上引入了另外一個參數(shù),得到了一個通用模型;Pipes-Munjal 提出了與 Drew 類似但是更加一般化的通用模型;Edie和 Dick 則考慮在不同流量下各模型的適用性的基礎(chǔ)上,提出多段式組合模型。具體模型見圖 2-4 所示。 圖 2-4 速度密度關(guān)系圖由于密度數(shù)據(jù)很難直接采集,而本文主要數(shù)據(jù)來源于快速路路面鋪設(shè)環(huán)形線圈,可以直接得到占有率的數(shù)據(jù)。占有率直接反映了交通密度的高低,更能表明道路被實際占用的情況,
27、因此多通過占有率來反映密度特征,同時本文研究u-o模型來替代u-k模型。根據(jù)對 NX03 檢測斷面的檢測數(shù)據(jù)進行統(tǒng)計分析,并盡量用一個函數(shù)來描述其關(guān)系。u-o散點關(guān)系圖和擬合曲線見圖 2-5。圖 2-5 速度占有率散點關(guān)系圖及擬合曲線曲線擬合的具體結(jié)果見表2-1。從圖2-5和表2-1中的具體擬合判決系數(shù)2R 來看,曲線的擬合程度還是比較高的,而且2R 除了對數(shù)擬合模型之外,都達到了0.95 左右,而對數(shù)模型也達到了 0.85 以上。表21 速度占有率關(guān)系的模型回歸 速度流量(u-q)模型速度和流量數(shù)據(jù)容易直接采集,因此國內(nèi)外對速度流量關(guān)系的研究也比較多。速度流量模型通常用于評價交通運行狀況、估
28、算服務(wù)水平。最早且經(jīng)典的速度流量模型是 Greenshields 的拋物線模型,其表達式為:。它是在u-k線性模型的基礎(chǔ)上得到的,基本反映了速度和流量的變化趨勢,多年來一直被廣泛采用。然而 H.B.James、和 H.C.Chin的研究結(jié)果表明:根據(jù)實際數(shù)據(jù)來研究u-q關(guān)系,u-q曲線應(yīng)該分為三段:第一段表示暢通狀況,第二段表示排隊后消散過程,第三段表示擁堵(伴隨有排隊)狀況;交通流在暢通狀態(tài)和擁擠狀態(tài)之間過渡時并不一定要經(jīng)過通行能力,交通狀態(tài)可以從暢通直接跳到擁擠的狀態(tài)。給出的u-q關(guān)系如圖 2-6 所示,這種曲線并不是某一種函數(shù)式,而是從大量的實測數(shù)據(jù)中分析出的結(jié)果。圖 2-6 速度流量曲
29、線模,如圖 2-7所示:圖 2-7 速度流量散點圖及其二次多項式回歸從圖 2-7 中,可以看到速度流量關(guān)系的曲線擬合程度還是相當高的,判決系數(shù)2R 達到了 0.8854。從散點圖來看,可以對交通流狀態(tài)進行一個初步判斷:速度流量數(shù)據(jù)大多主要集中在等待部分,即阻塞狀態(tài);在自由流狀態(tài)的數(shù)據(jù)相對較少,主要集中在小密度狀態(tài)下;而阻塞與自由流之間的過渡過程,即等待隊列消散的過程的數(shù)據(jù)最少。 流量密度(q-k)模型早期的通行能力研究,主要遵循兩個途徑:一是探討交通密度小時的速度流量關(guān)系式;二是探討交通密度大時的車頭時距規(guī)律。而流量密度模型把這兩種途徑同一起來。并且流量密度模型在交通控制中也有重要的作用,常把
30、密度作為控制參數(shù),流量作為目標函數(shù)對快速路進行控制,所以經(jīng)常把q-k曲線稱為“交通基本圖表”。Greenshields、Greenburg、Underwood 根據(jù)基本的u-k模型推導(dǎo)了各自的q-k模型;此外,Koshi 提出了反 模型,Hall 提出了倒V 模型。此外,與多段式 u-k模型對應(yīng),一些學(xué)者還提出了不連續(xù)的 q-k曲線模型如圖 2-8所示:圖 2-8 流量密度關(guān)系模由于密度數(shù)據(jù)難以獲得,Aothl(1965)建議使用q-o關(guān)系確定擁擠的發(fā)生。根據(jù)實地采集的數(shù)據(jù)所作的q-o散點圖以及擬合曲線如圖 2-9,可以看到,流量占有率的二次多項式擬合曲線的判決系數(shù)2R 高達 0.9864,擬
31、合程度相當高。圖 2-9 流量占有率散點圖及二次多項式回歸擬2.4數(shù)據(jù)模型概述近些年來,隨著科學(xué)技術(shù)的不斷進步,人們收集處理數(shù)據(jù)的方式發(fā)生了巨大的變化。一方面,在很多應(yīng)用中出現(xiàn)了數(shù)據(jù)流,其廣泛存在于網(wǎng)絡(luò)監(jiān)控、日志分析、傳感器網(wǎng)絡(luò)、金融預(yù)測等領(lǐng)域中,數(shù)據(jù)流數(shù)據(jù)規(guī)模龐大、到達速率極快、且每個數(shù)據(jù)只能夠被訪問一次,這些與傳統(tǒng)數(shù)據(jù)模型截然不同的特征給數(shù)據(jù)的查詢和管理工作提出了新的要求;另一方面,隨著數(shù)據(jù)采集技術(shù)的進步,人們對數(shù)據(jù)不確定性的認識也逐步深入,在諸如經(jīng)濟、軍事、物流、金融、電信等領(lǐng)域的具體應(yīng)用中,數(shù)據(jù)的不確定性普遍存在,不確定性數(shù)據(jù)的表現(xiàn)形式多種多樣,它們以關(guān)系型數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、流數(shù)據(jù)或
32、移動對象數(shù)據(jù)等形式出現(xiàn),這同樣給數(shù)據(jù)的進一步處理工作帶來了新的挑戰(zhàn)。2.4.1數(shù)據(jù)流研究背景有關(guān)數(shù)據(jù)流(dataStream)的聚類分析與異常檢測是目前國際數(shù)據(jù)庫領(lǐng)域的一個研究熱點。自上個世紀末以來,隨著計算機技術(shù)在諸如網(wǎng)絡(luò)流量監(jiān)控、金融信息處理、Web訪問和傳感器網(wǎng)絡(luò)等領(lǐng)域應(yīng)用的普及和深入,傳統(tǒng)數(shù)據(jù)庫技術(shù)面臨新的挑戰(zhàn)。數(shù)據(jù)流應(yīng)用場景中所處理的數(shù)據(jù)通常具有如下特點:1.數(shù)據(jù)都是實時到達的。2.數(shù)據(jù)到達的次序往往是獨立的,不受系統(tǒng)所控制。3.數(shù)據(jù)流的速度和規(guī)模大小不是預(yù)知的,也就是說往往不能夠?qū)ζ渌俣群鸵?guī)模進行預(yù)定義。4.數(shù)據(jù)一經(jīng)處理,除非特意保存,否則不能夠被再次取出處理,或者再次提取數(shù)據(jù)代價
33、昂貴。盡管主要的數(shù)據(jù)流處理模型與傳統(tǒng)數(shù)據(jù)庫技術(shù)息息相關(guān),但是兩者仍然存在諸多差異。例如,如果利用傳統(tǒng)技術(shù)進行數(shù)據(jù)處理,必須將數(shù)據(jù)全部存儲到介質(zhì)(如關(guān)系數(shù)據(jù)庫)中,然后通過相應(yīng)的算法來尋求挖掘結(jié)果。但是,當數(shù)據(jù)規(guī)模宏大且到達速度很快時,因執(zhí)行查詢操作需要大量的I/O交換,效率低下,往往難以滿足實時性要求。此時,數(shù)據(jù)流處理技術(shù)的解決策略是:不保存整個數(shù)據(jù)集,僅維護一個遠小于其規(guī)模的概要數(shù)據(jù)結(jié)構(gòu),該概要數(shù)據(jù)結(jié)構(gòu)能夠常駐內(nèi)存。此時數(shù)據(jù)流挖掘算法將包含兩部分:一部分監(jiān)控流中的數(shù)據(jù),實時更新概要數(shù)據(jù)結(jié)構(gòu);另一部分響應(yīng)用戶查詢或挖掘處理請求,返回近似查詢結(jié)果。一般來說,想直接應(yīng)用傳統(tǒng)的OLAP或數(shù)據(jù)挖掘算法
34、到高速,大流量的數(shù)據(jù)流場景中往往是行不通的,其主要原因表現(xiàn)在如下幾個方面:1.數(shù)據(jù)流中的數(shù)據(jù)是海量的,無法通過內(nèi)存,甚至硬盤來存儲整個流數(shù)據(jù)。2.由于數(shù)據(jù)量巨大,無法全部存儲的特點使傳統(tǒng)的多遍掃描數(shù)據(jù)的挖掘方法變得不可行,因此對數(shù)據(jù)流的挖掘算法應(yīng)該是一個單遍掃描過程(one-passsean)。3.數(shù)據(jù)流是時序的,對流中的數(shù)據(jù)元素只能按其流入順序依次讀取,如關(guān)系數(shù)據(jù)庫那種的隨機訪問是不現(xiàn)實的。4.數(shù)據(jù)流應(yīng)用要求較快的響應(yīng)時間,挖掘過程應(yīng)該是一個連續(xù)的過程,而不是偶然進行一次。5.數(shù)據(jù)流往往天生就是高維的(High-Dimensional),有時會帶來嚴重的“維度災(zāi)難”。2.4.2不確定數(shù)據(jù)研究
35、背景在數(shù)據(jù)流技術(shù)研究方興未艾之時,一種更加廣泛存在于數(shù)據(jù)本身中的問題一不確定性(uncertainty),近些年來也逐步引起學(xué)術(shù)界的關(guān)注。在此之前,確定性數(shù)據(jù) (deterministic data)管理與挖掘技術(shù)得到了充分的發(fā)展,在確定性數(shù)據(jù)應(yīng)用中,數(shù)據(jù)的存在性和精確性均確鑿無疑。然而,近幾年來,不確定性數(shù)據(jù)(uncertain data)在越來越多的應(yīng)用中扮演關(guān)鍵角色,例如經(jīng)濟、軍事、物流、金融、電信等,而傳統(tǒng)數(shù)據(jù)管理技術(shù)無法有效處理這類新問題,墮需開發(fā)新型數(shù)據(jù)管理技術(shù)。不確定性數(shù)據(jù)的產(chǎn)生原因復(fù)雜,例如原始數(shù)據(jù)不準確、使用粗粒度數(shù)據(jù)集合、滿足特殊應(yīng)用目的、處理缺失值、數(shù)據(jù)集成等。1. 原始
36、數(shù)據(jù)不準確。這是產(chǎn)生不確定性數(shù)據(jù)最直接的原因。首先,物理儀器所采集數(shù)據(jù)的準確度受儀器的精度制約。其次,在網(wǎng)絡(luò)傳輸過程(特別是無線網(wǎng)絡(luò)傳輸)中,數(shù)據(jù)的準確性受到帶寬、傳輸延時、能量等因素影響。最后,在傳感器網(wǎng)絡(luò)應(yīng)用睜s與RFID應(yīng)用中,周圍環(huán)境也將影響原始數(shù)據(jù)的準確度。2. 使用粗粒度數(shù)據(jù)集合。從粗粒度數(shù)據(jù)集合轉(zhuǎn)換到細粒度數(shù)據(jù)集合的過程會引入不確定性。例如,假設(shè)某人口分布數(shù)據(jù)庫記錄了全國各鄉(xiāng)的總?cè)丝跀?shù),而某應(yīng)用要求查詢以村為基礎(chǔ)單位的人口數(shù)量,查詢結(jié)果就存在不確定性。3. 滿足特殊應(yīng)用目的。出于隱私保護等特殊目的,某些應(yīng)用無法獲取原始的精確數(shù)據(jù),而僅能夠得到變換之后的不精確數(shù)據(jù)。4. 處理缺失值
37、。缺失值的產(chǎn)生原因很多,例如裝備故障、無法獲取、與其他字段不一致、歷史原因等。一種典型的處理方法是插值,插值之后的數(shù)據(jù)可看作服從特定概率分布。另外,也可以刪除所有含缺失值的記錄,但是這個操作也從側(cè)面變動了原始數(shù)據(jù)的分布特性。與以上的單一不確定性產(chǎn)生原因相比,某些應(yīng)用中的不確定性數(shù)據(jù)往往是多種因素共同作用產(chǎn)生的。例如,基于位置的服務(wù)(Location一 BasedService,LBS)是移動計算領(lǐng)域的核心問題,在軍事、通信、交通、服務(wù)業(yè)等中有著廣泛的應(yīng)用。LBS應(yīng)用獲取各移動對象的位置,為用戶提供定制服務(wù),該過程存在若干不確定性。首先,受技術(shù)手段(例如GPS技術(shù))限制,移動對象的位置信息存在一
38、定誤差。其次,某些查詢要求保護用戶的隱私信息,必須采用“位置隱私”等方式處理查詢。實際上,針對不確定數(shù)據(jù)的研究工作已經(jīng)有幾十年歷史了。從二十世紀八十年代末開始,針對概率數(shù)據(jù)庫(Probabilisti。database)的研究工作就從未間斷,這類研究工作將不確定性引入到關(guān)系數(shù)據(jù)模型中去,取得較大成果。近年來,針對不確定性數(shù)據(jù)的研究工作則在更廣的范圍內(nèi)取得了更大的進展,即在更豐富的數(shù)據(jù)類型上處理更多種類的查詢?nèi)蝿?wù)。3交通流數(shù)據(jù)質(zhì)量檢測算法研究3.1 交通流數(shù)據(jù)質(zhì)量檢測理論 交通流數(shù)據(jù)常見問題交通流數(shù)據(jù)常見問題分為數(shù)據(jù)缺失、數(shù)據(jù)失真和數(shù)據(jù)時間點3類問題,針對這些問題,提出了一種交通流數(shù)據(jù)質(zhì)量檢驗方
39、法。(1)數(shù)據(jù)缺失由于設(shè)備老化、線路故障等原因,交通流數(shù)據(jù)中偶爾會發(fā)生數(shù)據(jù)點缺失的現(xiàn)象,屬于比較常見的問題。通常是丟失一個時間點的一組數(shù)據(jù)。雖然丟失的數(shù)據(jù)不多,但如果沒有及時發(fā)現(xiàn)此問題,對于間隔固定行數(shù)循環(huán)提取數(shù)據(jù)的交通流分析方法,有著嚴重的影響。(2)數(shù)據(jù)無效數(shù)據(jù)無效指的是獲得的交通流數(shù)據(jù)有數(shù)據(jù)突變點或不符合交通流三要素相互關(guān)系,主要依據(jù)閾值理論和交通流理論判定數(shù)據(jù)的有效性,由于無效的概念比較模糊,相對不易判別。另一個比較常見的問題是,在車流量比較少的時候,常測得不符合實際情況的較高速度,顯然是錯誤數(shù)據(jù),需要有針對性地予以處理。(3)數(shù)據(jù)時間點問題比如理論上一些交通流數(shù)據(jù)獲取頻率應(yīng)為120s
40、(秒)一次,但實際上間隔通常小于120s,如1 19s、1 18s等,而且因為網(wǎng)絡(luò)傳輸問題,沒有明顯的規(guī)律可循。經(jīng)過時間的積累,會帶來比較大的誤差。如6車道一周的數(shù)據(jù)理論上應(yīng)為6 (車道) 30 (次每小時)*24(小時) 7 (天)=30240條,而實際獲得30462條,多了222條,即37組,74分鐘的數(shù)據(jù)。此外,還發(fā)現(xiàn)交通流數(shù)據(jù)記錄順序有時會改變,如本來各道路記錄順序為:1、2、3、11、12、13,會突然改變?yōu)椋?、3、1、12、13、11。這對于不識別路段編號,直接間隔固定的行數(shù)、循環(huán)提取數(shù)據(jù)的方法也有很嚴重的影響。如果各個監(jiān)測點記錄順序的差異較大,沒有統(tǒng)一的順序,就造成了對于不同的
41、檢測點數(shù)據(jù)需使用不同的分析程序代碼,也會給科研人員帶來了不必要的工作量。 交通數(shù)據(jù)故障識別方法在城市道路交通數(shù)據(jù)采集過程中,由于存在各種干擾,使采集到的數(shù)據(jù)信息常出現(xiàn)丟失和偏離真值等情況。因此要進行交通流數(shù)據(jù)的質(zhì)量檢測,首先需要對其中的丟失數(shù)據(jù)、不精確數(shù)據(jù)、和錯誤數(shù)據(jù)進行判別。(1) 丟失數(shù)據(jù)故障識別無論是固定檢測器,還是移動檢測器都是按照一定的時間間隔來采集數(shù)據(jù),但是在實際情況中,檢測器掃描頻率不固定,傳輸線路出現(xiàn)故障,車輛過度密集造成檢測器無法檢測車輛等多種原因都會使采集到的交通數(shù)據(jù)無法嚴格按照一定的時間間隔上傳,甚至?xí)胁糠謹?shù)據(jù)丟失,給以后的數(shù)據(jù)處理和交通預(yù)測工作帶來不利的影響。本文設(shè)計
42、了一種丟失數(shù)據(jù)的識別方法,把在一定時間段內(nèi)得到的數(shù)據(jù)定義成某一時段的數(shù)據(jù),例如,將采集數(shù)據(jù)的時間間隔規(guī)定為5min,則在8:00到8:05這個時間段內(nèi)得到的數(shù)據(jù)均視為8:00的數(shù)據(jù),然后對數(shù)據(jù)的時間段進行掃描,如果在某一時間段內(nèi)沒有得到數(shù)據(jù),則認為該時段的數(shù)據(jù)產(chǎn)生了丟失,按照第一類數(shù)據(jù)故障的修復(fù)方法對其進行處理。(2) 失真數(shù)據(jù)故障識別當交通檢測器或傳輸線路出現(xiàn)故障時,采集到的數(shù)據(jù)通常都是錯誤的,不能反應(yīng)真實的交通狀況。錯誤的數(shù)據(jù)通常表現(xiàn)為0,或是數(shù)值超過路段允許的最大流量,將數(shù)值等于0和超過流量允許最大值的數(shù)據(jù)定義為第二類異常數(shù)據(jù)。定義允許的流量最大值為 Q = fCT/60 (3-1)式中
43、: f為修正系數(shù);C為道路通行能力(veh/h);T為檢測時間間隔(min)。由于車輛的計數(shù)是在一個相當短的時間內(nèi)完成的(數(shù)十秒或數(shù)分鐘),所以測得的隨機流量值可能會大于道路的通行能力,因此,用道路的通行能力 C與修正系數(shù)f的乘積來確定流量的最大值。(3)異常數(shù)據(jù)故障識別在正常交通狀態(tài)下,網(wǎng)絡(luò)交通流的變化是一個平穩(wěn)的隨機過程,流量數(shù)據(jù)的幅值應(yīng)該在某一區(qū)間內(nèi)變化,但是當?shù)缆分谐霈F(xiàn)交通事件時,流量數(shù)據(jù)與正常情況下的數(shù)據(jù)之間會出現(xiàn)很大的偏差。本文采用t時段之前n個數(shù)據(jù)的平均值和方差來識別此類數(shù)據(jù)故障。當時,認為數(shù)據(jù)是正常的,否則認為此時的交通數(shù)據(jù)為第三類故障數(shù)據(jù)。3.1.3數(shù)據(jù)問題的處理方法針對以上
44、問題,我們提出了一種交通流數(shù)據(jù)檢驗與修復(fù)方法:為了方便的檢測數(shù)據(jù)點的缺失情況,先把數(shù)據(jù)的時間點標準化,使所有數(shù)據(jù)具有相同的記錄順序;然后修復(fù)丟失數(shù)據(jù)和無效數(shù)據(jù)。本檢驗程序已使用Matlab 7實現(xiàn),總體流程如圖3-l所示。圖3-1 交通流數(shù)據(jù)檢驗與修復(fù)方法總體流程1) 數(shù)據(jù)時間點順序標準化。統(tǒng)一記錄順序標準為:由外環(huán)到內(nèi)環(huán),路編號由小到大。標準化后,不但有利于下一步準確發(fā)現(xiàn)缺失的數(shù)據(jù),而且也為編寫后期分析程序提供了較大便利。算法的詳細流程如下:(1)相關(guān)變量初始化。(2)導(dǎo)入交通流數(shù)據(jù)。(3)初始化交通流數(shù)據(jù)車道數(shù)、編號等特征信息。(4)由特征信息確定一個標準車道編號排序,如1、2、3、11、
45、12、13。(5)從第1條數(shù)據(jù)開始,將每2 m in內(nèi)的數(shù)據(jù)分為1組。(6)將每組內(nèi)以道路編號為準將數(shù)據(jù)順序標準化。(7)如組內(nèi)的數(shù)據(jù)值小于應(yīng)有車道數(shù),將相應(yīng)的數(shù)據(jù)缺失情況記錄到日志文件。(8)依次處理每組數(shù)據(jù),直至結(jié)束。(9)輸出標準化后的數(shù)據(jù)至文件。現(xiàn)以北京市環(huán)路數(shù)據(jù)為例,詳細介紹本文所提算法的數(shù)據(jù)處理效果。表3-1所示為未經(jīng)處理的2006203204北京市環(huán)路交通流原數(shù)據(jù)的2組(每2min為1組)數(shù)據(jù),來自二環(huán)路上編號為02023的檢測點,地點為左安門橋西800 m處。表3-1交通流原數(shù)據(jù)(檢測點02023)由表3-1可以看出,數(shù)據(jù)庫中的數(shù)據(jù)是按照記錄到來的時間先后排序的,并不是按照道路
46、編號的順序排序。以表3-1所示數(shù)據(jù)為例,所示數(shù)據(jù)道路順序為: 1、12、13、11、2、3,而且此順序還可能會因為線路傳輸?shù)葐栴}產(chǎn)生變化。這就給數(shù)據(jù)的使用帶來了很多不便,我們通過1. 2所述的方法將其標準化為1、2、3、11、12、13的順序。效果如表3-2所列。表3-2順序標準化后的交通流數(shù)據(jù)(檢測點02023)雖然修正了時間點順序,但因未檢測缺失的數(shù)據(jù),這會導(dǎo)致數(shù)據(jù)讀取時造成了“串行”的現(xiàn)象。需要在下一步進行解決。2)缺失/無效數(shù)據(jù)的判別與補充。將數(shù)據(jù)時間點標準化后,再判別缺失或無效的數(shù)據(jù),并予以補充。通過線性插值法對錯誤數(shù)據(jù)和丟失數(shù)據(jù)進行修正和補齊。若tj對應(yīng)的數(shù)據(jù)組是錯誤數(shù)據(jù),ti和t
47、k分別是與tj最為接近的左鄰和右鄰正確數(shù)據(jù)組對應(yīng)的時間點。則 (3-2)式中: xtj為tj所對應(yīng)的交通量、速度和占有率修正后的數(shù)據(jù)值。算法的詳細流程如下: 相關(guān)變量初始化; 導(dǎo)入標準化后的交通流數(shù)據(jù); 初始化交通流數(shù)據(jù)車道數(shù)、編號等特征信息; 依據(jù)標準數(shù)據(jù)判斷數(shù)據(jù)是否缺失; 如缺失則依據(jù)線性插值法補充數(shù)據(jù); 判斷數(shù)據(jù)的有效性并修正; 依次處理每組數(shù)據(jù),直至結(jié)束; 輸出標準化后的數(shù)據(jù)至文件。此交通流數(shù)據(jù)檢驗與修復(fù)方法的整體流程如圖3-2所示。圖3-2 交通流數(shù)據(jù)檢驗與修復(fù)方法整體流程經(jīng)過上一節(jié)的數(shù)據(jù)時間點標準化后,再對標準化后的數(shù)據(jù)進行缺失 無效數(shù)據(jù)的判別與補充,如在表1、表3-2中第2組缺失
48、的11車道數(shù)據(jù)使用線性插值法得到了補充,如表3-3所列。表3-3修復(fù)缺失的交通流數(shù)據(jù)(檢測點02023)分別打開原始數(shù)據(jù)與完成修正的數(shù)據(jù),可以發(fā)現(xiàn)修正數(shù)據(jù)的時間點已被標準化,實現(xiàn)了統(tǒng)一的記錄順序,并且之前缺失或無效的數(shù)據(jù)也得到了補充和修正。處理后的數(shù)據(jù)即為最終完成修正的數(shù)據(jù),將原始數(shù)據(jù)與最終完成修正的數(shù)據(jù)進行比較,效果分別如圖3-3、圖3-4所示。圖3-305: 0009: 00原始數(shù)據(jù)與修正數(shù)據(jù)對比圖3-415: 0019: 00原始數(shù)據(jù)與修正數(shù)據(jù)對比3.2故障數(shù)據(jù)檢測算法利用最小二乘法對歷史交通流數(shù)據(jù)進行離線曲線擬合,對實時交通流數(shù)據(jù)進行在線故障數(shù)據(jù)檢測,對交通流密度、速度和流量三項指標進
49、行綜合檢測,即基于交通流量-速度-時間占有率的交通流故障數(shù)據(jù)檢測算法VSO-ADDM (Abnormal Data Detection Method based on the Traffic Volume、Traffic Speed and Time Occupancy,VSO-ADDM)。首先,根據(jù)原始交通流數(shù)據(jù)進行統(tǒng)計分析,確定相應(yīng)指標變化均值;其次,得到不同速度均值對應(yīng)的平均流量值,按照速度值進行變換,得到一致的平均密度、平均速度和平均流量值,并對其進行曲線擬合;然后根據(jù)均方差進行閾值估算,得到一定確信度的安全區(qū)域和待定安全區(qū)域;在安全區(qū)域范圍內(nèi)數(shù)據(jù)為正常數(shù)據(jù),待定安全區(qū)域數(shù)據(jù)再次進行二
50、次檢測;超出待定安全區(qū)域數(shù)據(jù)認定為交通流指標間不合理異常數(shù)據(jù),即故障數(shù)據(jù)。MATLAB 作為一種應(yīng)用廣泛的科學(xué)計算軟件,不僅可以通過直接交互的指令和操作方式進行強大的數(shù)值計算、繪圖等,還可以像 C、C+ 等高級程序語言一樣,根據(jù)自己的語法規(guī)則來進行程序設(shè)計。編寫的程序文件以 .m 作為擴展名,稱之為M文件。通過編寫M文件,用戶可以像編寫批處理命令一樣,將多個MATLAB命令集中在一個文件中,既能方便地進行調(diào)用,又便于修改;還可以根據(jù)用戶自身的情況,編寫用于解決特定問題的M文件,這樣就實現(xiàn)了結(jié)構(gòu)化程序設(shè)計,并降低代碼重用率。實際上,MATLAB 自帶的許多函數(shù)就是M函數(shù)文件。MATLAB 提供的
51、編輯器可以使用戶方便地進行M文件的編寫。本課題采用MATLAB M文件編程實現(xiàn)故障數(shù)據(jù)檢測算法,具體操作步驟如下,先打開MATLAB,如圖3-5所示:圖3-5 MATLAB原始界面然后新建M文件編程: File New M-File,M文件如圖3-6所示:圖3-6M文件編程3.2.1故障數(shù)據(jù)檢測步驟故障檢測部分分為歷史交通流數(shù)據(jù)離線曲線擬合,得到相應(yīng)閾值;在線獲得實時交通流數(shù)據(jù),對其進行在線檢測。歷史交通流數(shù)據(jù)樣本,首先對其進行聚類分析,確定其高速交通流聚類中心和低速交通流聚類中心;然后確定不同速度安全區(qū)域范圍;通過判斷交通流數(shù)據(jù)所處的區(qū)域進行檢測;最后對檢測結(jié)果進行按誤差比糾正偏差。Step
52、1將原始數(shù)據(jù)樣本按照高速交通流速度和低速交通流速度進行更新數(shù)據(jù),將原數(shù)據(jù)更新為對應(yīng)高速交通流速度的高速交通流和低速交通流速度的低速交通流;按照時間占有率對平面進行區(qū)域劃分得到L個區(qū)域,按照平均速度和分別進行流量調(diào)整,獲得不同速度條件下不同占有率的平均流量值; Step2按照平均時間占有率-平均交通流量進行曲線擬合,得到相應(yīng)平均速度對應(yīng)的擬合曲線;擬合曲線將L個區(qū)域又劃分為高區(qū)域和低區(qū)域共2L個高速交通流子區(qū)域;按照平均時間占有率-平均交通流量進行曲線擬合,得到相應(yīng)平均速度對應(yīng)的擬合曲線;擬合曲線將L個區(qū)域又劃分為高區(qū)域和低區(qū)域共2L個低速交通流子區(qū)域;Step3高速交通流子區(qū)域上半平面交通流均
53、值以及高速交通流子區(qū)域下半平面交通流均值;低速交通流子區(qū)域的上半平面交通流均值以及低速交通流子區(qū)域的下半平面交通流均值;Step4對高低區(qū)域上下半平面各點均方差運算確定安全區(qū)域邊界值,得到針對原始歷史交通流數(shù)據(jù)的高速安全區(qū)域最高邊界值、最低邊界值和低速安全區(qū)域最高邊界值、最低邊界值;Step5對高速安全區(qū)域和低速安全區(qū)域各自最高邊界值和最低邊界值分別進行曲線擬合,得到交通流量的高速安全區(qū)域上下限曲線以及低速安全區(qū)域上下限曲線;Step6當時安全區(qū)域范圍為;當時安全區(qū)域;當時安全區(qū)域;Step7若,該數(shù)據(jù)歸為正常數(shù)據(jù),轉(zhuǎn)到step9;若,則暫時將該數(shù)據(jù)歸為待定故障數(shù)據(jù),轉(zhuǎn)到step8;Step8
54、當為待定故障數(shù)據(jù)時,需要進一步進行誤差比計算,若誤差比,則將該數(shù)據(jù)糾正為正常數(shù)據(jù),否則確定為故障數(shù)據(jù)。Step9數(shù)據(jù)為正常數(shù)據(jù),保存更新交通流數(shù)據(jù),本次檢測結(jié)束;由于交通流數(shù)據(jù)樣本越多,對數(shù)據(jù)檢測算法越有效,因此可根據(jù)實際需要選擇每天或每周進行一次樣本數(shù)據(jù)更新,從而不斷更新完善安全區(qū)域邊界值。3.2.2故障數(shù)據(jù)檢測待檢測數(shù)據(jù)為,原始數(shù)據(jù)交通流量,則該數(shù)據(jù)為正常數(shù)據(jù);當,則為待定狀態(tài),需要進一步判斷:l對應(yīng)速度平均值,安全區(qū)域邊界曲線分別取高速和低速相應(yīng)邊界曲線的均值。當,安全區(qū)域由式(3-3)得到: (3-3)當時,若,則該數(shù)據(jù)為正常數(shù)據(jù);否則歸為待定故障數(shù)據(jù)。l當,安全區(qū)域如式(3-4):(
55、3-4)當時,若,則該數(shù)據(jù)為正常數(shù)據(jù);否則歸為待定故障數(shù)據(jù)。l當,安全區(qū)域如式(3-5):(3-5)當時,若,則該數(shù)據(jù)為正常數(shù)據(jù);否則歸為待定故障數(shù)據(jù)。對于第ie個待定故障數(shù)據(jù),按照其安全區(qū)域邊界值進行誤差和誤差比計算,如式(3-6)所示:(3-6)若誤差比或時,認為待定故障數(shù)據(jù)為正常數(shù)據(jù);否則待定故障數(shù)據(jù)確認為故障數(shù)據(jù),進行刪除或修正。 3.3 特長高速公路隧道交通流故障數(shù)據(jù)檢測對某特長高速公路隧道y方向交通流數(shù)據(jù)為例進行分析。首先對樣本數(shù)據(jù)流進行聚類分析,得到高速交通流聚類中心和低速交通流聚類中心,數(shù)據(jù)樣本如圖3-7所示的藍色數(shù)據(jù)。圖3-7 隧道交通流數(shù)據(jù)樣本觀察其速度變化對影響,由圖3-
56、7可知,交通流速度變化較大時,相對應(yīng)相同時間占有率的交通流量值會發(fā)生較大變化。數(shù)據(jù)分析時,需要將綜合考慮速度影響因素。由于該隧道交通流較小,在所取時間間隔內(nèi)其最大時間占有率小于10。本系統(tǒng)中,特長高速公路隧道交通流密度低,兼顧計算時間和算法精度兩者要求,按照實際交通流時間占有率處于低密度狀態(tài),故本系統(tǒng)將按照占有率高低進行劃分區(qū)域取,得到個子區(qū)域。進行交通流數(shù)據(jù)檢測,特將原有816組數(shù)據(jù)樣本中任意加入13組故障數(shù)據(jù),將這些數(shù)據(jù)存入EXCEL表格中,對其命名并設(shè)置好存放路徑,例如設(shè)置路徑為:D:shuchushujux0.按照第檢測算法進行MATLAB編程對EXCEL表格中的數(shù)據(jù)進行故障檢測,檢測
57、結(jié)果還是存入到EXCEL表格中,路徑還是為:D:shuchushujux0.檢測到13組故障數(shù)據(jù)結(jié)果如圖3-8所示:圖3-8 檢測故障數(shù)據(jù)結(jié)果由圖3-8檢測結(jié)果可看出原樣本數(shù)據(jù)中存在的故障數(shù)據(jù)。按照流量閾值計算,根據(jù)時間占有率-流量經(jīng)驗知識可知,其可擬合為三次多項式。在曲線擬合時,樣本點數(shù)要大于多項式未知參數(shù)。按照故障數(shù)據(jù)檢測算法對歷史交通流數(shù)據(jù)進行分析,當時間占有率在0,10時,得到低速安全區(qū)域邊界擬合曲線和高速安全區(qū)域邊界擬合曲線,對應(yīng)時間占有率-交通流量變化區(qū)域邊界曲線如圖3-9所示:圖3-9 時間占有率-交通流量變化區(qū)域邊界曲線由于樣本數(shù)量有限,其安全區(qū)域擬合曲線有待更多樣本學(xué)習(xí)進行完善,另外當故障數(shù)據(jù)各指標未明顯違背指標特性關(guān)系時,故障數(shù)據(jù)被漏檢,因此故障數(shù)據(jù)檢測算法需要大量樣本進行學(xué)習(xí),逐漸完善安全區(qū)域邊界曲線,從而提高算法檢測效率。3.4本章小結(jié)本章對特長高速公路隧道實時交通流故障數(shù)據(jù)展開相關(guān)研究,根據(jù)特長高速公路隧道交通流指標特性,提出了基于流量-速度-時間占有率的故障數(shù)據(jù)檢測算法。通過對歷史交通
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 展會宣傳推廣合同(2篇)
- 小賣鋪租賃合同(2篇)
- 2025年度建筑密封硅酮膠招標采購合同3篇
- 二零二五年度智慧城市物聯(lián)網(wǎng)設(shè)備采購合同2篇
- 二零二五版果園果樹種植技術(shù)指導(dǎo)與承包合同3篇
- 2024版短期貸款合同范例3篇
- 二零二五年度消防工程監(jiān)理合同2篇
- 二零二五年度建筑工程項目招投標與合同履約擔(dān)保服務(wù)合同3篇
- 二零二五版股權(quán)代持糾紛調(diào)解與風(fēng)險防范合同5篇
- 二零二五年度不動產(chǎn)權(quán)屬轉(zhuǎn)移擔(dān)保合同3篇
- 2025年度影視制作公司兼職制片人聘用合同3篇
- 兒童糖尿病的飲食
- 2025屆高考語文復(fù)習(xí):散文的結(jié)構(gòu)與行文思路 課件
- 干細胞項目商業(yè)計劃書
- 浙江省嘉興市2024-2025學(xué)年高一數(shù)學(xué)上學(xué)期期末試題含解析
- 2024年高考新課標Ⅱ卷語文試題講評課件
- 回收二手機免責(zé)協(xié)議書模板
- 2023年系統(tǒng)性硬化病診斷及診療指南
- 外科醫(yī)師手術(shù)技能評分標準
- 《英語教師職業(yè)技能訓(xùn)練簡明教程》全冊配套優(yōu)質(zhì)教學(xué)課件
- 采購控制程序
評論
0/150
提交評論