




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、大數(shù)據(jù)可視化,張磊 2015.7.28,1,可視化分支,一幅圖勝過(guò)千言萬(wàn)語(yǔ).人類(lèi)從外界獲得的信息約有80%以上來(lái)自于視覺(jué)系統(tǒng),當(dāng)大數(shù)據(jù)以直觀的可視化的圖形形式展示在分析者面前時(shí),分析者往往能夠一眼洞悉數(shù)據(jù)背后隱藏的信息并轉(zhuǎn)化知識(shí)以及智慧。,2,將196 個(gè)國(guó)家的35 萬(wàn)個(gè)網(wǎng)站數(shù)據(jù)整合起來(lái),并根據(jù)200 多萬(wàn)個(gè)網(wǎng)站鏈接將這些星球通過(guò)關(guān)系鏈聯(lián)系起來(lái),每一個(gè)星球的大小根據(jù)其網(wǎng)站流量來(lái)決定,而星球之間的距離遠(yuǎn)近則根據(jù)鏈接出現(xiàn)的頻率、強(qiáng)度和用戶跳轉(zhuǎn)時(shí)創(chuàng)建的鏈接。,3,大數(shù)據(jù)可視分析是指在大數(shù)據(jù)自動(dòng)分析挖掘方法的同時(shí),利用支持信息可視化的用戶界面以及支持分析過(guò)程的人機(jī)交互方式與技術(shù),有效融合計(jì)算機(jī)的計(jì)算能
2、力和人的認(rèn)知能力,以獲得對(duì)于大規(guī)模復(fù)雜數(shù)據(jù)集的洞察力(insight).,4,信息可視化可以理解為編碼(encoding)和解碼(decoding)兩個(gè)映射過(guò)程31:編碼是將數(shù)據(jù)映射為可視化圖形的視覺(jué)元素如形狀、位置、顏色、文字、符號(hào)等;解碼則是對(duì)視覺(jué)元素的解析,包括感知和認(rèn)知兩部分. 一個(gè)好的可視化編碼需同時(shí)具備兩個(gè)特征:效率和準(zhǔn)確性.效率指的是能夠瞬間感知到大量信息,準(zhǔn)確性則指的是解碼所獲得的原始真實(shí)信息.,5,文本可視化,文本信息是大數(shù)據(jù)時(shí)代非結(jié)構(gòu)化數(shù)據(jù)類(lèi)型的典型代表,是互聯(lián)網(wǎng)中最主要的信息類(lèi)型,也是物聯(lián)網(wǎng)各種傳感器采集后生成的主要信息類(lèi)型,人們?nèi)粘9ぷ骱蜕钪薪佑|最多的電子文檔也是以文
3、本形式存在.文本可視化的意義在于,能夠?qū)⑽谋局刑N(yùn)含的語(yǔ)義特征(例如詞頻與重要度、邏輯結(jié)構(gòu)、主題聚類(lèi)、動(dòng)態(tài)演化規(guī)律等)直觀地展示出來(lái).,6,典型的文本可視化技術(shù)是標(biāo)簽云,將關(guān)鍵詞根據(jù)詞頻或其他規(guī)則進(jìn)行排序,按照一定規(guī)律進(jìn)行布局排列,用大小、顏色、字體等圖形屬性對(duì)關(guān)鍵詞進(jìn)行可視化,7,DAViewer將文本的敘述結(jié)構(gòu)語(yǔ)義以樹(shù)的形式進(jìn)行可視化, 同時(shí)展現(xiàn)了相似度統(tǒng)計(jì)、修辭結(jié)構(gòu)、以及相應(yīng)的文本內(nèi)容;DocuBurst以放射狀層次圓環(huán)的形式展示文本結(jié) 構(gòu).基于主題的文本聚類(lèi)是文本數(shù)據(jù)挖掘的重要研究?jī)?nèi)容,為了可視化展示文本聚類(lèi)效果,通常將一維的文本信息投射到二維空間中,以便于對(duì)聚類(lèi)中的關(guān)系予以展示.,8,
4、ThemeRiver用河流作為隱喻,河流從左至右的流淌代表時(shí)間序列,將文本中的主題按照不同的顏色的色帶表示,主題的頻度以色帶的寬窄表示.基于河流隱喻,研究者又提出了TextFlow,進(jìn)一步展示了主題的合并和分支關(guān)系以及演變. 其中將新聞進(jìn)行了聚類(lèi),并以氣泡的形式展示出來(lái).,9,社會(huì)媒體輿情分析是大數(shù)據(jù)典型應(yīng)用之一,在對(duì)文本本身語(yǔ)義特征進(jìn)行展示的同時(shí),通常需要結(jié)合文本的空間、時(shí)間屬性形成綜合的可視化界面.,10,網(wǎng)絡(luò)數(shù)據(jù)可視化,網(wǎng)絡(luò)關(guān)聯(lián)關(guān)系是大數(shù)據(jù)中最常見(jiàn)的關(guān)系,例如互聯(lián)網(wǎng)與社交網(wǎng)絡(luò).層次結(jié)構(gòu)數(shù)據(jù)也屬于網(wǎng)絡(luò)信息的一種特殊情況.基于網(wǎng)絡(luò)節(jié)點(diǎn)和連接的拓?fù)潢P(guān)系,直觀地展示網(wǎng)絡(luò)中潛在的模式關(guān)系,例如節(jié)點(diǎn)
5、或邊聚集性,是網(wǎng)絡(luò)可視化的主要內(nèi)容之一.對(duì)于具有海量節(jié)點(diǎn)和邊的大規(guī)模網(wǎng)絡(luò),如何在有限的屏幕空間中進(jìn)行可視化,將是大數(shù)據(jù)時(shí)代面臨的難點(diǎn)和重點(diǎn).除了對(duì)靜態(tài)的網(wǎng)絡(luò)拓?fù)潢P(guān)系進(jìn)行可視化,大數(shù)據(jù)相關(guān)的網(wǎng)絡(luò)往往具有動(dòng)態(tài)演化性,因此,如何對(duì)動(dòng)態(tài)網(wǎng)絡(luò)的特征進(jìn)行可視化,也是不可或缺的研究?jī)?nèi)容。,11,經(jīng)典的基于節(jié)點(diǎn)和邊的可視化,是圖可視化的主要形式.圖中主要展示了具有層次特征的圖可視化的典型技術(shù),例如H 狀樹(shù)H-Tree、圓錐樹(shù)Cone Tree、氣球圖Balloon View、放射圖Radial Graph、三維放射圖3D Radial、雙曲樹(shù)Hyperbolic Tree 等.對(duì)于具有層次特征的圖,空間填充法
6、也是常采用的可視化方法,例如樹(shù)圖技術(shù)Treemaps及其改進(jìn)技術(shù),12,基于矩形填充、Voronoi 圖填充、嵌套圓填充的樹(shù)可視化技術(shù),Gou 等人綜合集成了上述多種圖可視化技術(shù),提出了TreeNetViz,綜合了放射圖、基于空間填充法的樹(shù)可視化技術(shù).這些圖可視化方法技術(shù)的特點(diǎn)是直觀表達(dá)了圖節(jié)點(diǎn)之間的關(guān)系。,13,大規(guī)模網(wǎng)絡(luò)中,隨著海量節(jié)點(diǎn)和邊的數(shù)目不斷增多,例如規(guī)模達(dá)到百萬(wàn)以上時(shí),可視化界面中會(huì)出現(xiàn)節(jié)點(diǎn)和邊大量聚集、重疊和覆蓋問(wèn)題,使得分析者難以辨識(shí)可視化效果.圖簡(jiǎn)化(graph simplification)方法是處理此類(lèi)大規(guī)模圖可視化的主要手段: 一類(lèi)簡(jiǎn)化是對(duì)邊進(jìn)行聚集處理,例如基于邊捆綁(edge bundling)的方法,使得復(fù)雜網(wǎng)絡(luò)可視化效果更為清晰,圖10 展示了3 種基于邊捆綁的大規(guī)模密集圖可視化技術(shù).此外,Ersoy 等人還提出了基于骨架的圖可視化技術(shù),主要方法是根據(jù)邊的分布規(guī)律計(jì)算出骨架,然后再基于骨架對(duì)邊進(jìn)行捆綁; 另一類(lèi)簡(jiǎn)化是通過(guò)層次聚類(lèi)與多尺度交互,將大規(guī)模圖轉(zhuǎn)化為層次化樹(shù)結(jié)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 三方駕駛培訓(xùn)合作協(xié)議
- 長(zhǎng)沙報(bào)關(guān)委托協(xié)議
- 汽車(chē)租賃合同范本大全
- 鋼筋運(yùn)輸應(yīng)急預(yù)案協(xié)議
- 《Linux操作系統(tǒng)》課件-9.Linux軟件包管理
- 產(chǎn)品銷(xiāo)售周期趨勢(shì)報(bào)告表
- 基于物聯(lián)網(wǎng)技術(shù)的智能農(nóng)產(chǎn)品倉(cāng)儲(chǔ)解決方案
- 電力行業(yè)清潔能源與智能電網(wǎng)方案
- 商砼站建設(shè)項(xiàng)目可行性研究報(bào)告
- 環(huán)境保護(hù)行業(yè)報(bào)告
- 中國(guó)國(guó)際航空內(nèi)蒙古有限公司2025屆空中乘務(wù)員航空安全員高校畢業(yè)生校園招聘筆試參考題庫(kù)附帶答案詳解
- 2025江蘇省安全員考試題庫(kù)附答案
- 4.2 明確概念的方法 課件高中政治統(tǒng)編版選擇性必修三邏輯與思維
- 2024年國(guó)網(wǎng)陜西省電力有限公司招聘筆試真題
- 2025年共同成立子公司的戰(zhàn)略合作協(xié)議書(shū)
- 安保部績(jī)效考核方案
- 2025年中國(guó)硫酸慶大霉素片行業(yè)市場(chǎng)深度分析及行業(yè)發(fā)展趨勢(shì)報(bào)告
- 2025年江蘇農(nóng)林職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2025山東能源集團(tuán)中級(jí)人才庫(kù)選拔高頻重點(diǎn)提升(共500題)附帶答案詳解
- 腰椎ODI評(píng)分完整版
- 關(guān)于超細(xì)碳酸鈣粉體的干法表面改性分析
評(píng)論
0/150
提交評(píng)論