版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Tankertanker DesignTankertanker DesignAuthors: Natalia Andrienko Gennady AndrienkoPublished in:Data Mining and Knowledge DiscoveryThe premier technical journal focused on the theory, techniques andpractice for extracting information from large databases.A visual analytics framework for spatio-tempor
2、alanalysis and modelingTankertanker DesignTankertanker Design1、A visual analytics framework is proposed which enables practitioners to built time-series models for large heterogeneous spatio-temporal data sets in an interactive data-driven way. 2、Building on existing time series modeling tools and c
3、lustering tools, interactive grouping, modeling, and model evaluation of time series is supported.大量數(shù)據(jù)來(lái)自不同的位置,不同的時(shí)間,如何去分析?文章采用TS分析(DS),利用交互與可視化,基于現(xiàn)有的分析工具與算法(稍有完善),進(jìn)行兩個(gè)實(shí)例的分析,包括了聚類(lèi)、建模、模型評(píng)估、用途。AbstractTankertanker DesignTankertanker Design1、 Spatio-temporal data often have or can be transformed to the
4、form of numeric time series (TS) referring to different locations in space or different geographical objects spatial time series時(shí)間序列分析:動(dòng)態(tài)數(shù)據(jù)處理的統(tǒng)計(jì)方法;側(cè)重研究數(shù)據(jù)序列的互相依賴關(guān)系。原理:承認(rèn)事物發(fā)展的延續(xù)性,應(yīng)用過(guò)去數(shù)據(jù),就能推測(cè)事物的發(fā)展趨勢(shì)。方法:統(tǒng)計(jì)分析中加權(quán)平均法對(duì)歷史數(shù)據(jù)進(jìn)行處理。特點(diǎn):趨勢(shì)、季節(jié)變動(dòng)、循環(huán)波動(dòng)和不規(guī)則波動(dòng)。2、 However, analyzing and modeling each spatial TS independ
5、ently from others ignores relationships and similarities that may exist among spatial locations or objects clustering and interactive grouping單獨(dú)分析忽視了關(guān)系與相似性,本文用到了聚類(lèi)技術(shù),并鋪以可視化來(lái)優(yōu)化聚類(lèi)IntroductionTankertanker DesignTankertanker DesignPresentation of the framework ( Components of the framework & Analysi
6、s workflow )Components of the framework:1、 兩種展示方式Cartographic map display & TS display2、聚類(lèi)方法基于現(xiàn)有的開(kāi)源資源( Weka library & SOM Toolbox )3、TS 建模工具來(lái)自統(tǒng)計(jì)工具包OpenForecast.4、提供交互的可視接口(用于調(diào)整參數(shù)、完善聚類(lèi)結(jié)果、評(píng)估模型).Analysis workflow:1、Analysis of the spatio-temporal variation of a single space and time-related att
7、ribute, such as the ice cream sales;2、Analysis of dependencies between two space and time-related attributes, for example, sales of ice cream and average air temperature.Tankertanker DesignTankertanker DesignPresentation of the framework ( Components of the framework & Analysis workflow )Tankert
8、anker DesignTankertanker DesignPresentation of the framework ( Components of the framework & Analysis workflow )Tankertanker DesignTankertanker DesignUse of the frameworkThefirstdataset,providedbytheItaliantelecommunicationcompanyWIND,consistsofrecordsabout2,956,739mobilephonecallsmadeduring9day
9、sfrom30/10/2008till07/11/2008.asinglespaceandtimerelated(時(shí)間、電話量)Theseconddataset,providedbyComunediMilano(MunicipalityofMilan),consistsofGPStracksof17,241carsduring1weekstartingfromApril1,2007.twospaceandtime-related(時(shí)間、車(chē)流量、車(chē)速)Tankertanker DesignTankertanker DesignUse of the frameworkphone callsStep
10、0:Datapreparation把該地區(qū)分成307個(gè)區(qū)域,每個(gè)區(qū)域得到一個(gè)TS(共307條TS),每條TS按小時(shí)劃分時(shí)間判斷(便于統(tǒng)計(jì)數(shù)量),共216個(gè)時(shí)間片。(9天)Step 1: Grouping TS displayTankertanker DesignTankertanker DesignUse of the frameworkphone callsStep1:GroupingCartographicmapdisplay從中發(fā)現(xiàn)一些潛在模式,前幾個(gè)類(lèi)都聚集在比較熱鬧的地方,地鐵站,交通線交叉口等等。Tankertanker DesignTankertanker DesignUse o
11、f the frameworkphone callsStep1:GroupingprogressiveclusteringTankertanker DesignTankertanker DesignUse of the frameworkphone callsStep1:GroupinggroupingresultsStep2:AnalysisandmodelingModelingmethodstripleexponentialsmoothing(三次指數(shù)平滑法)Tankertanker DesignTankertanker DesignUse of the frameworkphone ca
12、llsStep2:Analysisandmodeling1、用戶一個(gè)個(gè)考慮先前的聚類(lèi)結(jié)果2、代表TS用均值方法獲得(藍(lán)色的)3、用戶選建模方法,開(kāi)始結(jié)束時(shí)間(綠紅線),模型會(huì)自動(dòng)變化參數(shù),不小心就會(huì)有bestfittingmodel,黃線是預(yù)測(cè)的,最后兩個(gè)月可以檢驗(yàn)。Tankertanker DesignTankertanker DesignUse of the frameworkphone callsStep2:Analysisandmodeling沒(méi)有最合適的模型出現(xiàn),可手動(dòng)調(diào)整參數(shù)BeforeAfterTankertanker DesignTankertanker DesignUse o
13、f the frameworkphone callsStep3:Modelevaluation1、利用殘差(現(xiàn)實(shí)數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)之間的差異)來(lái)進(jìn)行模型評(píng)估。2、誤差的絕對(duì)值不重要,不是整體誤差最小的模型最好,而是模型能夠把握特征,讓誤差隨機(jī)分布,盡量不影響原有特征。從圖中發(fā)現(xiàn)一個(gè)問(wèn)題:intheeveningsoftheworkingdaysnegativevaluesaremorefrequentthanpositivevalues.Tankertanker DesignTankertanker DesignUse of the frameworkphone callsStep3:Modele
14、valuation為了找到問(wèn)題,查看殘差TS圖的細(xì)節(jié),為了減少工作量,聚類(lèi)分析。1、黑線表示殘差平均值,下圖明顯分布不均,對(duì)聚類(lèi)3重新劃分組,分別建模。2、評(píng)估完所有組后,保存模型參數(shù)及數(shù)據(jù)描述等信息。Tankertanker DesignTankertanker DesignUse of the frameworkphone callsUseofthemodels1、預(yù)測(cè)(若沒(méi)有周期模式,則只能預(yù)測(cè)一小段)2、探測(cè)異常(黑線:圣西羅球場(chǎng))Tankertanker DesignTankertanker DesignUse of the frameworkGPS dataStep0:Datapr
15、eparation7天被分成168個(gè)時(shí)間間隔;將城市劃分區(qū)域,從一個(gè)區(qū)域到另一個(gè)區(qū)域稱為一個(gè)flow,共2155個(gè)flows;每一個(gè)flow有大小和速度,大小表示車(chē)流量,速度統(tǒng)計(jì)得到(文中取平均)。可視圖中沒(méi)有顯示速度量變化Tankertanker DesignTankertanker DesignUse of the frameworkGPS dataStep0:DatapreparationTS of flow magnitudes (top) TS of average speeds (bottom)Speedstendtodecreaseatthetimeswhentheflowmag
16、nitudesincrease.Tankertanker DesignTankertanker DesignUse of the frameworkGPS dataStep0:Datapreparation由于有2個(gè)空間屬性,需要對(duì)TS分析做一定的變換,提出了根據(jù)dependencyseries(DS)來(lái)進(jìn)行分析的方法。(flowmagnitude&averagespeed)1、flowmagnitude劃分為23個(gè)intervals(02,35,68見(jiàn)下右圖X軸)2、過(guò)濾maximummagnitude少于5的(因?yàn)橄掠覉D中X軸很短)Step1:GroupingTankertanke
17、r DesignTankertanker DesignUse of the frameworkGPS dataStep2:AnalysisandmodelingTS分析模型不能用,本文用多項(xiàng)式回歸,分別對(duì)每一類(lèi)進(jìn)行建模Tankertanker DesignTankertanker DesignUse of the frameworkGPS dataStep3:Modelevaluation聚類(lèi)2的圖看到模型得到值往往偏高,故分析得到圖D(morenegativeresidualvaluesthanpositiveones)將聚類(lèi)2細(xì)分為AC,然后得到殘差分析圖ETankertanker DesignTankertanker DesignUse of the frameworkGPS dataUseofthemodels基于上圖的模型,進(jìn)行預(yù)測(cè)。結(jié)果比對(duì)基本相似,但預(yù)測(cè)值會(huì)略高于實(shí)際值,因?yàn)槟P褪腔谧畲笃骄俣葮?gòu)建。最大速度模型:基于現(xiàn)有或預(yù)測(cè)的交通狀況,某一個(gè)行程至少需要時(shí)間估算。Tankertanker
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《導(dǎo)醫(yī)工作流程》課件
- 單位管理制度集合大全【人員管理篇】
- 單位管理制度集粹選集【人事管理篇】
- 單位管理制度匯編大全【員工管理】
- 單位管理制度分享合集【職工管理】十篇
- 單位管理制度呈現(xiàn)大全【員工管理篇】十篇
- 《員工的激勵(lì)與考核》課件
- 《語(yǔ)文大自然的語(yǔ)言》課件
- 八年級(jí)下冊(cè)期末考試專(zhuān)項(xiàng)訓(xùn)練03 論述題30(答案及解析)
- 《標(biāo)準(zhǔn)的理解要點(diǎn)》課件
- 青島版科學(xué)三年級(jí)上冊(cè)全冊(cè)課件教材
- Project項(xiàng)目管理(從菜鳥(niǎo)到實(shí)戰(zhàn)高手)
- 6S視覺(jué)管理之定置劃線顏色管理及標(biāo)準(zhǔn)樣式
- 2024國(guó)家開(kāi)放大學(xué)電大本科《西方行政學(xué)說(shuō)》期末試題及答案
- 四年級(jí)數(shù)學(xué)(除數(shù)是兩位數(shù))計(jì)算題專(zhuān)項(xiàng)練習(xí)及答案
- DL∕T 5783-2019 水電水利地下工程地質(zhì)超前預(yù)報(bào)技術(shù)規(guī)程
- 2024-2030年中國(guó)電子級(jí)四氟化硅行業(yè)風(fēng)險(xiǎn)評(píng)估及未來(lái)全景深度解析研究報(bào)告
- JGJ106-2014建筑基樁檢測(cè)技術(shù)規(guī)范
- 中考字音字形練習(xí)題(含答案)-字音字形專(zhuān)項(xiàng)訓(xùn)練
- 四柱萬(wàn)能液壓機(jī)液壓系統(tǒng) (1)講解
- JTT 1501-2024 潛水作業(yè)現(xiàn)場(chǎng)安全監(jiān)管要求(正式版)
評(píng)論
0/150
提交評(píng)論