版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
BessonJ,RobardetC,BoulicautJF.Constraint-basedminingofformalconceptsintransactionaldata[M]//AdvancesinKnowledgeDiscoveryandDataMining.SpringerBerlinHeidelberg,2004:615-624.IanH.Witten,EibeFrank.數(shù)據(jù)挖掘?qū)嵱脵C(jī)器學(xué)習(xí)技術(shù)[M].:機(jī)械工業(yè),2006GESTSInternationalTransactionsonComputerScienceandEngineering,2006,32(1):71-82.ofthe16thACMSIGKDDinternationalconferenceonKnowledgediscoveryanddatamining.ACM,2010:919-928.計(jì)算機(jī)學(xué)院(系) 畢業(yè)設(shè)計(jì)()時(shí)間:2014年3月3日至2014年6月3答辯時(shí)間:2014年6月11日 指導(dǎo)教師 季書(shū)教師或答疑教師(并所負(fù)責(zé)部分系(教研室 (簽字 生:李棟指導(dǎo)教師:季書(shū)試圖分析出城市的擁堵區(qū)域,從而節(jié)約人力和資源,更加集中效率的治理D-miner算法挖掘頻繁閉1-矩形的能力,挖掘出來(lái)頻繁擁堵區(qū)域。但是挖掘出來(lái)的擁堵區(qū)域很多,需要提供一個(gè)量化指標(biāo)來(lái)比較這些擁堵區(qū)域。緊接著創(chuàng)新地提出了度的概念,將數(shù)據(jù)點(diǎn)被挖掘出來(lái)的擁堵區(qū)域覆蓋的次數(shù)作為其度。利用核心度可以量化的評(píng)比擁堵的區(qū)域與擁堵的瓶頸路段。在一塊擁堵區(qū)域中可以繼續(xù)劃分出擁堵區(qū)域,從而實(shí)現(xiàn)了“類(lèi)中類(lèi)”的效果。:數(shù)據(jù)挖掘,模式挖掘,城市擁堵,緒 研究背 國(guó)內(nèi)外研究現(xiàn) 智慧城市與智慧交 頻繁模式挖 目前研究的不 本文的研究?jī)?nèi)容和主要?jiǎng)?chuàng)新 課題來(lái) 組織結(jié) 相關(guān)技術(shù)概 數(shù)據(jù)挖 關(guān)聯(lián)規(guī) 聚 分 模式挖 數(shù)據(jù)預(yù)處 D-miner算法概 D-miner算法實(shí) 挖掘擁堵區(qū) 度與擁堵區(qū) 4.1 擁堵區(qū) 實(shí)驗(yàn)對(duì) 總結(jié)與展 總結(jié)及主要貢 緒不僅僅是的問(wèn)題。世界各大城市都飽受堵車(chē)之苦。莫斯科的最為不幸,他們平著力建設(shè)無(wú)縫整合的交通樞紐,僅700多平方公里的上居住著500多萬(wàn)人,而這樣雖然,對(duì)于擁堵的也取得了一定的成果,但是大多只停留于標(biāo)注出擁堵路段。對(duì)于擁堵模式并沒(méi)有進(jìn)行進(jìn)一步研究。出于建立智慧城市和優(yōu)化城市狀況的角勢(shì)?,F(xiàn)今,已經(jīng)通過(guò)市的出租車(chē)到一定的交通數(shù)據(jù)。因此我著眼于將數(shù)據(jù)“智慧城市”(SmartCity)出現(xiàn)以來(lái),國(guó)內(nèi)外的學(xué)者、科研機(jī)構(gòu)、企業(yè)團(tuán)體紛紛似的概念還有數(shù)字城市等。2008年11月,恰逢2007年-2012年金融伊始,對(duì)智慧城市的歸納定義主要集中于三點(diǎn):第一,智慧城市建設(shè)必然以應(yīng)用為主線。智慧城市可以被認(rèn)為是城市信息化的高級(jí)階段,必然涉及到的創(chuàng)新應(yīng)在IBM的《智慧的城市》白皮書(shū)中,基于科技的發(fā)展,對(duì)智慧城市的定義即智能傳感設(shè)備將城市公共設(shè)施物聯(lián)成網(wǎng),物聯(lián)網(wǎng)與互聯(lián)網(wǎng)系統(tǒng)完全對(duì)接融合,、智慧城市定義為新一代支撐、知識(shí)社會(huì)下一代創(chuàng)新(創(chuàng)新2.0)環(huán)境下的城市征的可持續(xù)創(chuàng)新,塑造城市公共價(jià)值并為其中的每一位市民創(chuàng)造獨(dú)特價(jià) 智慧城市將成為一個(gè)城市的整體發(fā)展,將作為經(jīng)濟(jì)、產(chǎn)業(yè)升級(jí)、城市提升智能交通系統(tǒng)(InligentTransportationSystemITS)是未來(lái)交通系統(tǒng)的發(fā)展方安全、提高效率,因而,日益受到各國(guó)的重視。智能交通:智能交通是一個(gè)基于現(xiàn)代電子面向交通的服務(wù)系統(tǒng)。它的頻繁模式(frequentpattern)是頻繁地出現(xiàn)在數(shù)據(jù)集的眾多模式(如項(xiàng)集、子序列和深入,又提出了閉頻繁項(xiàng)集和極大頻繁項(xiàng)集的概念。如果不存在真超項(xiàng)集Y使得Y與XDXD中是閉的(closedX在DX是數(shù)據(jù)集D(closedfrequentitemset。如X是頻繁的,并且不存在超項(xiàng)集Y使得?????YD中是頻繁的。[4]有效率和更加全面的管理,比如此文利用數(shù)據(jù)挖掘來(lái)研究城市堵車(chē)問(wèn)題。在不斷的提高。但是挖掘的結(jié)果并不太是滿意。這個(gè)的首要問(wèn)題是頻繁模式過(guò)于雜多,數(shù)量過(guò)于龐大且有些并不是所感的。針對(duì)這個(gè)問(wèn)題,緊接著提出了頻繁閉城市交通問(wèn)題的根源是交通需求與供給之間的不平衡。實(shí)踐證路的發(fā)展遠(yuǎn)遠(yuǎn)路、消除瓶頸、人工疏堵等方法。然而要實(shí)現(xiàn)這些方法的首要目標(biāo)是找到擁堵的區(qū)域。完善整個(gè)道路網(wǎng)絡(luò)體系的成本非常高,而完善擁堵區(qū)域道路網(wǎng)絡(luò)體系的成本卻沒(méi)那么高。知道了擁堵的區(qū)域后,對(duì)這些重點(diǎn)地區(qū)進(jìn)行完善是可行的。加寬整消除瓶頸的主要問(wèn)題是找到瓶頸,當(dāng)然瓶頸就是擁堵區(qū)域。人工是有限的,面對(duì)著龐大的交通網(wǎng)絡(luò),有限的必須在最有效率的地方人工疏堵。自然,最有效率的地方就是擁堵區(qū)域。所以,不難理解這篇文章的目的就是研究一種定義度和挖掘出擁堵區(qū)域的方法。結(jié)合出租車(chē)GPS數(shù)據(jù),借鑒D-miner算法挖掘出城市地點(diǎn)和時(shí)間的擁堵模式定義擁堵后面挖掘擁堵區(qū)域和瓶頸路段做準(zhǔn)備。結(jié)合度挖掘出擁堵區(qū)首先,定義了一個(gè)關(guān)于“度”的全新概念。其次,提出了一整套全新的行了實(shí)驗(yàn)對(duì)比,證明了度的優(yōu)勢(shì)和其應(yīng)用意義。本文的主要內(nèi)容是提出一套全新的挖掘擁堵區(qū)域方法??梢岳眠@套方法之后,本文提出了重要的定義——度的概念,接著解釋了度的合理性。然后本文利用度的概念來(lái)對(duì)擁堵區(qū)域進(jìn)行量化,從而形成了擁堵區(qū)域。最后,本文進(jìn)行了實(shí)驗(yàn)對(duì)比,展示度在應(yīng)用的意義。第一章緒論最后展示了課題來(lái)源和組織結(jié)構(gòu)。本章還概述了Weka這個(gè)工具。在本章首先介紹了數(shù)據(jù)預(yù)處理過(guò)程。然后介紹了D-miner算法的概要。最后展示了如何借鑒D-miner算法挖掘擁堵區(qū)域。第四章度與擁堵區(qū)度來(lái)量化擁堵區(qū)域,從而挖掘出擁堵區(qū)域。第六章總結(jié)和展望相關(guān)技術(shù)界、和研究界,“數(shù)據(jù)挖掘”通常用來(lái)表示整個(gè)知識(shí)發(fā)現(xiàn)過(guò)程。因此,采用廣義數(shù)據(jù)集中標(biāo)記的實(shí)例例如,在識(shí)別的問(wèn)題中,一組手寫(xiě)圖像learning如,一個(gè)無(wú)監(jiān)督學(xué)習(xí)方法可以取一個(gè)手寫(xiě)數(shù)字的圖像集合作為輸入。假設(shè)它找100~910個(gè)不同的數(shù)字。然而,由不能告訴發(fā)現(xiàn)的簇的語(yǔ)義。標(biāo)記的實(shí)例進(jìn)一步改進(jìn)類(lèi)邊界。對(duì)于兩類(lèi)問(wèn)題,可以把屬于一個(gè)類(lèi)的實(shí)例Apriori算法,這個(gè)算法為布爾關(guān)聯(lián)規(guī)則挖掘頻繁項(xiàng)集的性算法[5]。Apriori算法使用一種稱為逐層搜索的迭代方法,其中k項(xiàng)集用(強(qiáng)關(guān)聯(lián)規(guī)則滿足最小支持度和最小置信度AprioriApriori算法的變形來(lái)提高效率。包括Growthtree數(shù)據(jù)庫(kù)。對(duì)于每個(gè)“模式片段”,只需要與它相關(guān)聯(lián)數(shù)據(jù)集。因此,隨著被很低時(shí)更是如此。所以,隨著研究的深入,又提出了閉頻繁項(xiàng)集和極大頻繁項(xiàng)集的YYXDXD中是閉的(closedXDXD中的閉頻繁項(xiàng)集(closedfrequentitemsetXY使得?????YD上面的都是挖掘頻繁模式。然而,有時(shí)令人感的不是頻繁模式,而是聚類(lèi)分析(clusterysis)簡(jiǎn)稱聚類(lèi),是一個(gè)把數(shù)據(jù)對(duì)象(或觀測(cè))劃分成子集的(cluster不同的聚類(lèi)方法可能會(huì)產(chǎn)生不同的聚類(lèi)。通過(guò)聚類(lèi),可能會(huì)發(fā)現(xiàn)數(shù)據(jù)內(nèi)事先未知的nk個(gè)分區(qū),每K-means[8]K-meds[9]算法。K-means算法通被凝聚在一起。的方法剛開(kāi)始把所有的簇放在一起,然后把這個(gè)簇分為更基于網(wǎng)格的方法:上面的算法的復(fù)雜度都是基于對(duì)象點(diǎn)的數(shù)量的,當(dāng)對(duì)象點(diǎn)很多時(shí),算法的效率很糟糕。而基于網(wǎng)格的方法則首先把對(duì)象空間分割成有限個(gè)網(wǎng)格結(jié)構(gòu)。把每一個(gè)網(wǎng)格結(jié)構(gòu)的對(duì)象點(diǎn)進(jìn)行統(tǒng)計(jì),以這個(gè)網(wǎng)格來(lái)代表所有網(wǎng)格內(nèi)的對(duì)象點(diǎn)。之后的聚類(lèi)過(guò)程都是基于網(wǎng)格結(jié)構(gòu)的。這使得算法的效率大據(jù)進(jìn)行分類(lèi)。EnvironmentforKnowledgeysis。它是一個(gè)集合了一些前沿機(jī)器學(xué)習(xí)算法Weka的使用方式之一是將一種學(xué)習(xí)方法應(yīng)用于一個(gè)數(shù)據(jù)集,然后分析其輸出,從而的了解這些數(shù)據(jù)。另外式則是使用已學(xué)習(xí)到的模型對(duì)新的實(shí)例做出Weka平臺(tái)最有價(jià)值的部分是真實(shí)學(xué)習(xí)方案的實(shí)現(xiàn)。其次當(dāng)屬數(shù)據(jù)預(yù)處理工具,不適用。但是使用知識(shí)流界面可以使用部分用來(lái)處理大型的數(shù)據(jù)集的遞增算法。Weka的第三個(gè)界面是實(shí)驗(yàn)者(Experimenter)視圖。這個(gè)視圖專(zhuān)門(mén)來(lái)幫助用戶解答使模式息、緯度信息、速度信息、方向信息、甚至包含是否有乘客的信息(3.1一般的出租車(chē)GPS數(shù)據(jù)大多數(shù)以前的研究大多關(guān)注信息,甚至有些還關(guān)注是否有乘客的信息。以前的研究方向,但是隨著研究的深入,研究發(fā)現(xiàn)在大多應(yīng)用情況下,這個(gè)假設(shè)并息的精確度沒(méi)有太大要求,這意味著不用太在意GPS經(jīng)緯位置誤差對(duì)結(jié)果造成的3.2出租車(chē)的位置分布與實(shí)際擁堵區(qū)域(此圖自[13]實(shí)際擁堵區(qū)域的密度情況通過(guò)顏色深度來(lái)表示,紅色小點(diǎn)表示正在載客的出租車(chē)位置,黑色小點(diǎn)表示未載客的出租車(chē)位置??梢郧逦目匆?jiàn)大多數(shù)出租車(chē)3.2由于數(shù)據(jù)所限,研究目標(biāo)限于市的二環(huán)路區(qū)域。因?yàn)樘峁┑氖且徽貐^(qū)。因此,本文的關(guān)注點(diǎn)暫定于市二環(huán)路區(qū)域。況且的二環(huán)路也非常典收集了多天的二環(huán)路的出租車(chē)行駛速度情況。這些數(shù)據(jù)精確到每200米一個(gè)監(jiān)測(cè)點(diǎn),每一個(gè),并且這些速度數(shù)據(jù)是當(dāng)時(shí)經(jīng)過(guò)那個(gè)檢測(cè)點(diǎn)的所有出租車(chē)的平3.3二環(huán)某天的出租車(chē)速度數(shù)據(jù),每一行表示一個(gè)監(jiān)測(cè)點(diǎn)24小時(shí)的檢測(cè)數(shù)據(jù),在二環(huán)總共有314個(gè)監(jiān)測(cè)點(diǎn),所以數(shù)據(jù)有314行,每一列表示在同一時(shí)間的不同路段的速度情況,5分鐘一個(gè)數(shù)據(jù),所24小時(shí)對(duì)應(yīng)288個(gè)數(shù)據(jù),即有288列。首先,對(duì)于這份數(shù)據(jù),發(fā)現(xiàn)當(dāng)時(shí)間位于0點(diǎn)至6點(diǎn)時(shí),很多數(shù)據(jù)是缺少狀態(tài)(-大。所以,第一部分0點(diǎn)至6點(diǎn)的數(shù)據(jù)剔除,主要研究6點(diǎn)至24點(diǎn)的數(shù)據(jù)。其624點(diǎn)的數(shù)據(jù)其中也有很少一部分?jǐn)?shù)據(jù)是缺失的,對(duì)于這些缺失數(shù)據(jù),經(jīng)過(guò)以上步驟,基本噪聲數(shù)據(jù)和缺失數(shù)據(jù)都已經(jīng)被處理完畢。下面針對(duì)后面的算法操作來(lái)對(duì)數(shù)據(jù)進(jìn)行格式的改造。在下一節(jié)會(huì)具體講到使用到的D-們其實(shí)并不關(guān)心那些出租車(chē)是多大的速度,更加關(guān)心的是它處在一個(gè)什么狀態(tài),是平均速度是42km/h。因此設(shè)定擁堵的閾值為平均速度的一半,即21km/h。也就是說(shuō),對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,將大于21的值設(shè)為0(暢通狀態(tài)將小于21的值設(shè)為130公里/30公里/203.4D-minerD-miner算法是J′er′emyBessonC′elineRobardet,Jean-Fran以及coisBoulicaut在《Constraint-BasedMiningofFormalConceptsinTransactionalData》中算法[15]。D-miner算法是用來(lái)布爾型處理事務(wù)數(shù)據(jù)的。何謂事務(wù)數(shù)據(jù)呢?這種數(shù)據(jù)來(lái)源于購(gòu)次事務(wù)也就包括了的東西。物品在這次購(gòu)物中被就在該物品下記1,否則記0。多個(gè)事務(wù)就組成了事務(wù)數(shù)據(jù)。見(jiàn)表格3.1一個(gè)簡(jiǎn)單的事務(wù)數(shù)據(jù)01的布表格3.1…101001001111111APRIORI算法已經(jīng)在過(guò)去十年被設(shè)計(jì)出來(lái)來(lái)都不小時(shí),這些算法不適用了。而D-miner在數(shù)據(jù)密集時(shí)候的效果反而更加好。D-miner算法是在這樣的事務(wù)數(shù)據(jù)中來(lái)基于一定的約束挖掘頻繁閉合模式。何謂頻模式過(guò)于繁多,以至于不能夠很好的利用。所以后面研究發(fā)展了頻繁閉和模式(frequentclosedpattern)M,M的超項(xiàng)集,但樣看表格3.1事務(wù)中出現(xiàn)的最小次數(shù)的限制,記為????。另一是最小項(xiàng)集長(zhǎng)度的約束,也就是模式品的種類(lèi)的最小限制,記為????rectange’(t,’表格多個(gè)頻繁閉合模式。他們其中的兩個(gè)是({t1,t2,t3,t5},g1,g3})({t2,t3},g1,g2,g3,g4,g9,g10})。表格3.2D-minerD-miner算法是的第一步是計(jì)算出切割集。用H來(lái)表示一個(gè)0-矩形,即矩陣中(0,H必須盡可能的小來(lái)減少遞歸的深度和執(zhí)行的時(shí)間。另一方面,不應(yīng)該花太多時(shí)間D-miner算法對(duì)于一個(gè)布爾矩形,它從整個(gè)矩形開(kāi)始,通H中的切割點(diǎn),遞歸地H1-H中的元素(a,b)可以用來(lái)切割矩形(X,Y)當(dāng)且僅當(dāng)??∩??≠?且??∩??≠?。為了方便,定義(X,Y)的左切割后為(X\a,Y,右切割后為(X,Y\b。但是發(fā)現(xiàn)有時(shí)候切割得到的1-矩形3.5右切割得到的(t3,g3)和(t2t3,g3)并不是閉合的,因?yàn)椋╰1t2t3,g3為了避免有這種不閉合的模式產(chǎn)生,在切割的過(guò)程中還要及早剪枝。為了這種時(shí)在(從Y中移除某些元素,須檢查?(??,??)∈????(??,??),??∩??≠?。算法偽代1:D-miner函輸入:nmr,行集O和列P,最小支持度的約束????和最小項(xiàng)集長(zhǎng)度輸出:滿足約束????和????的頻繁閉合模式集合HL←Q←cutting((O,P),H,0,Hsize,HL);算法偽代2:cutting輸入:矩陣(XY,切割集H,迭代次數(shù)i,H的大小Hsize,左切割點(diǎn)集合,????最小輸出:滿足約束????和????的頻繁閉合模式集Qa,b)←H[i]If(i≤Hsize?If((a∩X=?)or(b∩Y=∪cutting((X,Y),H,i+If(????(X\a)HL←HL∪(a,∪cutting((X\a,Y),H,i+1,Hsize,HL)HL←HL\(a,b)If(????(Y\b)∧?(a’,b’)∈HL,b’∩Y\b≠
Q←(X,Y
∪cutting((X,Y\b),H,i+1,Hsize,Return挖掘的是事務(wù)數(shù)據(jù),但是出租車(chē)數(shù)據(jù)并不是事務(wù)數(shù)據(jù)。但是可以互相借鑒。事務(wù)的數(shù)據(jù)的一行表示1次交易,此行中的1表示在該次交易中該列的物品被,此表示小支持度(min_sup)的約束,也就是模式同時(shí)在事務(wù)中出現(xiàn)的最小次數(shù)的限制。表示最小項(xiàng)集長(zhǎng)度的約束,也就是模式品的種類(lèi)的最小限制。在出租車(chē)數(shù)據(jù)中[18]所以對(duì)區(qū)域的二維也都有最小限制。????表示最小同時(shí)擁堵路段數(shù)量限制,也就是同堵車(chē)的路段數(shù)必須大于????。????24個(gè)小時(shí)擁操作做鋪墊。以一個(gè)監(jiān)測(cè)地點(diǎn)的24小時(shí)數(shù)據(jù)為行,以同一時(shí)刻不同地點(diǎn)的數(shù)據(jù)列。同樣是二維矩陣,要挖掘出頻繁閉合的1-矩形。設(shè)置????=22,????=12,鐘22和12的結(jié)果如圖3.6,每一行代表一個(gè)1-矩形,冒號(hào)前面的為行號(hào),冒號(hào)后面的為列號(hào)。 度與擁堵區(qū) 雖然挖掘了很多擁堵區(qū)域,但是當(dāng)擁堵區(qū)域很多時(shí),無(wú)法比較這些擁堵區(qū)勤的有限,必須把部署在最擁堵的區(qū)域或者說(shuō)那些瓶頸區(qū)域去人工疏堵。需要一個(gè)量化指標(biāo)來(lái)比較擁堵區(qū)域的擁堵程度。所以,提出一個(gè)度的概念。觀察上一節(jié)挖掘出來(lái)的擁堵區(qū)域,發(fā)現(xiàn)挖掘出來(lái)的很多擁堵區(qū)域都存在一部分的覆蓋情況。發(fā)現(xiàn)覆蓋的區(qū)域基本是擁堵的中心區(qū)域,所以考慮能否用一個(gè)量圖4.1,從一個(gè)4乘4的矩形(圖4.1左)挖掘大于2乘2的頻繁閉合模式,可以看到有一個(gè)點(diǎn)均被3個(gè)模式所覆蓋。把每個(gè)點(diǎn)被頻繁模式覆蓋的次數(shù)顯示出來(lái),如圖4.1(右)中顯示,可以看出這個(gè)數(shù)值大的點(diǎn)也是所以這個(gè)數(shù)據(jù)集所有1的中心點(diǎn)。所以依據(jù)此提出了度的定義。圖4.1度的提最大的點(diǎn)就為所有模式的點(diǎn)。也就是說(shuō),如果一個(gè)點(diǎn)在多個(gè)模式中都出現(xiàn),那么它的度就高。反之,則低。同時(shí)也可以發(fā)現(xiàn)這個(gè)點(diǎn)能在多個(gè)模式中出現(xiàn),其必然是在1的中心的位置。擁堵區(qū)度的提出使得獲得了一種評(píng)價(jià)擁堵區(qū)域的指標(biāo)。可以利用度來(lái)得到擁堵區(qū)域。對(duì)于擁堵的情況,有時(shí)更加關(guān)心擁堵的瓶頸路段。何謂瓶頸路段4.21114.3117號(hào)堵車(chē)狀態(tài)圖,都多次出現(xiàn)倒三4.21114.3117一點(diǎn)為瓶頸路段附近路段,比較低的為由于瓶頸路段擁堵而后續(xù)擁堵的路段。如圖4.4,對(duì)于第一行的瓶頸路段,度會(huì)高一些,而后面由于瓶頸路段擁堵而后續(xù)擁堵的路段的度并不高。圖4.4瓶頸路段的所以,度可以精確的表示擁堵的區(qū)域和瓶頸路段??梢园凑斩葹榧t色的點(diǎn)是度最高的點(diǎn),黃色的點(diǎn)度次高,淺藍(lán)色的點(diǎn)度最低。但是由于度從60萬(wàn)到1差距過(guò)大,很多點(diǎn)的顏色太淺不能顯著的顯示出來(lái),所以又畫(huà)了圖4.6將度大于3000的點(diǎn)均用紅色表示,從而使得度較小的點(diǎn)也能夠被直觀的觀察出來(lái)。從圖中,可以鮮明的看到擁堵的區(qū)域度都非常高,那些瓶頸路段的度也很高。結(jié)合圖4.5和圖4.6對(duì)比的看,可以發(fā)現(xiàn)度在不同路段的差距性顯著,這使得可以選擇那些區(qū)域去更有效率的進(jìn)行疏堵工作。圖4.5擁堵點(diǎn)的圖4.6擁堵點(diǎn)的度(度大于3000的點(diǎn)均用紅色表示實(shí)驗(yàn)在這一章節(jié),作對(duì)比試驗(yàn)來(lái)體現(xiàn)度的意義,更加形象的展示度的優(yōu)有的處理方法應(yīng)用于新的數(shù)據(jù)集。Weka還提供了一定的可視化界面,使得可以更首先,使用經(jīng)典的K-means方法來(lái)對(duì)未計(jì)算度的數(shù)據(jù)和計(jì)算度的數(shù)分別使用K-means方法來(lái)對(duì)未計(jì)算度的數(shù)據(jù)和計(jì)算度的數(shù)據(jù)分別進(jìn)行K105.1K-means算法,數(shù)據(jù)聚類(lèi)效果并不是跟好,不能很好的分別出擁堵區(qū)域。圖5.2顯示了對(duì)利用加了度的數(shù)據(jù)進(jìn)行聚類(lèi)續(xù)劃分出擁堵區(qū)域,從而實(shí)現(xiàn)了“類(lèi)中類(lèi)”的效果。圖 圖5.2對(duì)計(jì)算度過(guò)后數(shù)據(jù)使用K-means算看圖5.3原始數(shù)據(jù)與聚類(lèi)和結(jié)果對(duì)比,可以看出用本文一整套流程可以準(zhǔn)確5.3總結(jié)與處理。優(yōu)先選擇速度屬性用基于移動(dòng)性的方法代替了傳統(tǒng)的根據(jù)位置基于密度的方法。之后對(duì)數(shù)據(jù)進(jìn)行了平滑處理和噪聲數(shù)據(jù)去除,最后根據(jù)后面的操作將數(shù)值性的然后實(shí)現(xiàn)了D-miner算法,并利用D-miner算法挖掘頻繁閉合1-矩形的能力,了度的概念,將數(shù)據(jù)點(diǎn)被挖掘出來(lái)的擁堵區(qū)域覆蓋的次數(shù)作為其度。利用度可以量化的評(píng)比擁堵的區(qū)域與擁堵的瓶頸路段。塊擁堵區(qū)域中可以繼續(xù)劃分出擁堵區(qū)域,從而實(shí)現(xiàn)了“類(lèi)中類(lèi)”的效果。主要貢獻(xiàn):定義了一個(gè)關(guān)于“度”的全新概念。用它可以量化的評(píng)比擁堵的區(qū)域與擁堵的瓶頸路段。其次,提出了一整套全新的挖掘擁堵區(qū)域方法miner算法時(shí),需要設(shè)定兩個(gè)約束????和????的閾值。????表示最小同時(shí)擁堵路段數(shù)量制,也就是同時(shí)堵車(chē)的路段數(shù)必須大于????。????表示路段最小擁堵時(shí)間限制,也就是該24個(gè)小時(shí)擁堵的時(shí)間必須大于????0致所能呈現(xiàn)。但是感謝之情卻可以借此略微表達(dá)。首先感謝導(dǎo)師——季書(shū)帆老師。季老師不僅是我學(xué)習(xí)中的導(dǎo)師,而且也是我生并不,人生的得失遠(yuǎn)比想的復(fù)雜又簡(jiǎn)單。作一個(gè)有意義的人比作一個(gè)規(guī)則的接下來(lái)感謝父母。他們給了我生命,塑造了我這個(gè)人。他們是后背。他們感謝大學(xué)同學(xué)、吳煜、、姚銘、賈偉等,他們使得大學(xué)生活在最后感謝,感謝我是個(gè)健全的人,感謝我接受了良好的教育。感謝我可以參考[1]網(wǎng)易旅游綜合. 全球最擁堵城市[OL]. [2]百科.智慧城市[OL]. [3]百科.智慧交通[OL]. JiaweiHan,MichelineKamber,JianPei.數(shù)據(jù)挖掘概念與技術(shù)[M].:機(jī)械工業(yè)AgrawalR,SrikantR.Fastalgorithmsforminingassociationrules[C]//Proc.20thint.conf.verylargedatabases,VLDB.1994,1215:487-499.KotsiantisS,KanellopoulosD.Associationrulesmining:Arecentoverview[J].GESTSInternationalTransactionsonComputerScienceandEngineering,2006,32(1):71-82.BerkhinP.Asurveyofclusteringdataminingtechniques[M]//Groumultidimensionaldata.SpringerBerlinHeidelberg,2006:25-71.HartiganJA,WongMA.AlgorithmAS136:Ak-meansclusteringalgorithm[J].Appliedstatistics,1979:100-108.ParkHS,JunCH.AsimpleandfastalgorithmforK-medsclustering[J].ExpertSystemswithApplications,2009,36(2):3336-3341.陳燕.數(shù)據(jù)挖掘技術(shù)與
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度電力行業(yè)風(fēng)險(xiǎn)管理電力購(gòu)銷(xiāo)合同范本3篇
- 2025年鐵路貨運(yùn)合同第三方監(jiān)管范本3篇
- 二零二五版美容院設(shè)備采購(gòu)與維護(hù)服務(wù)合同4篇
- 2025年項(xiàng)目施工安全協(xié)議書(shū)完善施工現(xiàn)場(chǎng)安全管理體系3篇
- 二零二五版生活垃圾處理設(shè)施投資建設(shè)合作協(xié)議3篇
- 2025年項(xiàng)目部安全生產(chǎn)責(zé)任協(xié)議書(shū)執(zhí)行示范范本3篇
- 二零二五年度高效節(jié)能型10KV線路及變臺(tái)安裝施工合作協(xié)議3篇
- 2025年度農(nóng)業(yè)大棚租賃與智能控制系統(tǒng)安裝合同2篇
- 個(gè)人健身會(huì)員卡2024年度合同2篇
- 2025版鋁塑窗環(huán)保材料認(rèn)證與推廣合同4篇
- 人教版初中語(yǔ)文2022-2024年三年中考真題匯編-學(xué)生版-專(zhuān)題08 古詩(shī)詞名篇名句默寫(xiě)
- 2024-2025學(xué)年人教版(2024)七年級(jí)(上)數(shù)學(xué)寒假作業(yè)(十二)
- 山西粵電能源有限公司招聘筆試沖刺題2025
- 醫(yī)療行業(yè)軟件系統(tǒng)應(yīng)急預(yù)案
- 使用錯(cuò)誤評(píng)估報(bào)告(可用性工程)模版
- 《精密板料矯平機(jī) 第2部分:技術(shù)規(guī)范》
- 2024光伏發(fā)電工程交流匯流箱技術(shù)規(guī)范
- 旅游活動(dòng)碳排放管理評(píng)價(jià)指標(biāo)體系構(gòu)建及實(shí)證研究
- 2022年全國(guó)職業(yè)院校技能大賽-電氣安裝與維修賽項(xiàng)規(guī)程
- 2024年黑龍江省政工師理論知識(shí)考試參考題庫(kù)(含答案)
- 四年級(jí)上冊(cè)脫式計(jì)算300題及答案
評(píng)論
0/150
提交評(píng)論