大數(shù)據(jù)可視化技術(shù)與應(yīng)用 習(xí)題及答案匯總 第1-7章 數(shù)據(jù)可視化概述 -復(fù)雜數(shù)據(jù)可視化_第1頁
大數(shù)據(jù)可視化技術(shù)與應(yīng)用 習(xí)題及答案匯總 第1-7章 數(shù)據(jù)可視化概述 -復(fù)雜數(shù)據(jù)可視化_第2頁
大數(shù)據(jù)可視化技術(shù)與應(yīng)用 習(xí)題及答案匯總 第1-7章 數(shù)據(jù)可視化概述 -復(fù)雜數(shù)據(jù)可視化_第3頁
大數(shù)據(jù)可視化技術(shù)與應(yīng)用 習(xí)題及答案匯總 第1-7章 數(shù)據(jù)可視化概述 -復(fù)雜數(shù)據(jù)可視化_第4頁
大數(shù)據(jù)可視化技術(shù)與應(yīng)用 習(xí)題及答案匯總 第1-7章 數(shù)據(jù)可視化概述 -復(fù)雜數(shù)據(jù)可視化_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

單選題:1.以下哪一個(gè)不是數(shù)據(jù)可視化主要從數(shù)據(jù)中尋找的信息A:模式B:關(guān)系C:異常D:分布2.哪一時(shí)期,人類社會(huì)進(jìn)入了統(tǒng)計(jì)圖形學(xué)的黃金時(shí)期A:17世紀(jì)B:19世紀(jì)上半葉C:19世紀(jì)下半葉D:20世紀(jì)上半葉3.可視化領(lǐng)域發(fā)展最早、最成熟的一個(gè)學(xué)科是A:科學(xué)可視化B:信息可視化C:可視分析學(xué)D:信息圖形化4.數(shù)據(jù)可視化的作用不包括以下哪一項(xiàng)A:記錄信息B:存儲(chǔ)信息C:分析推理D:信息傳播與協(xié)同5.信息可視化所處理的主要對象是什么A:科學(xué)領(lǐng)域數(shù)據(jù)B:工程領(lǐng)域數(shù)據(jù)C:結(jié)構(gòu)化數(shù)據(jù)D:非結(jié)構(gòu)化數(shù)據(jù)對錯(cuò)題:1.學(xué)生的檔案記錄、貨物的運(yùn)輸情況是數(shù)據(jù)。對2.異常的數(shù)據(jù)一定是錯(cuò)誤的數(shù)據(jù)錯(cuò)3.我們常見的地圖是地理信息數(shù)據(jù),屬于科學(xué)可視化的范疇。錯(cuò)4.可視化分析中的預(yù)測性分析的主要目的是回答“發(fā)生了什么”和“正在發(fā)生什么”。 錯(cuò)5.數(shù)據(jù)可視化極大地降低了數(shù)據(jù)理解的復(fù)雜度。對填空題:1.數(shù)據(jù)間的關(guān)系大多可分為三類:數(shù)據(jù)間的比較、數(shù)據(jù)的構(gòu)成、數(shù)據(jù)的分布或聯(lián)系2.《圖形符號(hào)學(xué)》是現(xiàn)代信息可視化的理論基礎(chǔ)。3.數(shù)據(jù)可視化的處理對象是數(shù)據(jù)。4.科學(xué)可視化的主要方法包括:顏色映射法、輪廓法。5.在計(jì)算機(jī)科學(xué)中,數(shù)據(jù)是指所有能輸入到計(jì)算機(jī)并被計(jì)算機(jī)程序處理的符號(hào)的介質(zhì)的總稱。可視化基礎(chǔ)題目——錢城張馨月一、選擇題:1、外部數(shù)據(jù)采集指的數(shù)通過一些方法獲取企業(yè)外部的一些數(shù)據(jù),具體目的包括,獲取競品的數(shù)據(jù)、獲取官方機(jī)構(gòu)官網(wǎng)公布的一些行業(yè)數(shù)據(jù)等。獲取外部數(shù)據(jù),通常采用的二手?jǐn)?shù)據(jù)采集方法為(A)A.業(yè)務(wù)數(shù)據(jù)庫埋點(diǎn) B.網(wǎng)絡(luò)爬蟲 C.調(diào)查法 D.實(shí)驗(yàn)法2、若采集到的數(shù)據(jù)存在數(shù)據(jù)不一致現(xiàn)象,這指的是(D)A.遺漏了數(shù)據(jù)對象,或者包含了本不應(yīng)包含的其他數(shù)據(jù)對象B.存在不同于數(shù)據(jù)集中其他大部分?jǐn)?shù)據(jù)對象特征的數(shù)據(jù)對象C.數(shù)據(jù)對象的一個(gè)或多個(gè)屬性值缺失,導(dǎo)致數(shù)據(jù)收集不全D.收集到的數(shù)據(jù)明顯不合常理,或者多個(gè)屬性值之間互相矛盾3、下列問號(hào)位置應(yīng)填入的是(C)A.數(shù)據(jù)采集 B.處理變換 C.可視映射 D.用戶感知4、(B)是最傳統(tǒng)的數(shù)據(jù)存儲(chǔ)模型,數(shù)據(jù)按行存儲(chǔ)在有架構(gòu)界定的表中。表中的每個(gè)列都有名稱和類型,表中的所有記錄都要符合表的定義。用戶可查找符合條件的記錄,通過表連接在多表之間查詢記錄,表中的記錄可以被創(chuàng)建和除,記錄中的字段也可以單獨(dú)更新。A.圖形數(shù)據(jù)庫 B.關(guān)系數(shù)據(jù)庫 C.內(nèi)存數(shù)據(jù)庫 D.以上說法均不正確5、下列不屬于可視化設(shè)計(jì)原則的是:(D)A.數(shù)據(jù)篩選原則B.視圖選擇與交互設(shè)計(jì)原則C.美學(xué)原則D.完整性原則二、判斷題√1、數(shù)據(jù)可視化不是簡單的視覺映射,而是一個(gè)以數(shù)據(jù)流向?yàn)橹骶€的一個(gè)完整流程。√2、直接拿采集的數(shù)據(jù)進(jìn)行分析或者可視化,得出的結(jié)論往往會(huì)誤導(dǎo)用戶做出錯(cuò)誤的決策,因此,對采集到的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和規(guī)范化,是數(shù)據(jù)可視化流程中不可缺少的一環(huán)?!?、數(shù)據(jù)處理和數(shù)據(jù)變換,是進(jìn)行數(shù)據(jù)可視化的前提條件,也是數(shù)據(jù)分析和可視化的第一步(不是第一步)?!?、數(shù)據(jù)良好的組織與管理是優(yōu)秀數(shù)據(jù)可視化方案的前提條件。在大數(shù)據(jù)時(shí)代,只有選擇適合的數(shù)據(jù)組織與管理方式,才能得到最好的可視化性能,才又可能實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)的可視化展示?!?、與普通認(rèn)知不同,人們在進(jìn)行隱喻認(rèn)知時(shí)需要先根據(jù)現(xiàn)有信息與以往經(jīng)驗(yàn)尋找相似記憶,并建立映射關(guān)系,再進(jìn)行認(rèn)知、推理等信息加工。解碼隱喻內(nèi)容,才能真正了解信息傳遞的內(nèi)容。三、填空題1、數(shù)據(jù)可視化的流程主要有:數(shù)據(jù)采集、數(shù)據(jù)處理與變換、可視化映射與人機(jī)交互、用戶感知。2、數(shù)據(jù)質(zhì)量問題主要有數(shù)據(jù)收集錯(cuò)誤、存在離群點(diǎn)、存在遺漏值、數(shù)據(jù)不一致、重復(fù)值的存在等。3、可視化元素由三個(gè)部分組成,分別為:可視化空間、標(biāo)記、視覺通道。4、分布式文件系統(tǒng)是指文件在物理上可能被分散存儲(chǔ)在不同地點(diǎn)的節(jié)點(diǎn)上,各節(jié)點(diǎn)通過計(jì)算機(jī)網(wǎng)絡(luò)進(jìn)行通信和數(shù)據(jù)傳輸,但在邏輯上仍然是一個(gè)完整的文件。5、數(shù)據(jù)篩選原則指可視化展示的信息要適度,以保證用戶獲取數(shù)據(jù)信息的效率。若展示的信息過少則會(huì)使用戶無法更好地理解信息;若包含過多的信息則可能造成用戶的思維混亂,甚至可能會(huì)導(dǎo)致錯(cuò)失重要信息。單選題點(diǎn)線圖是——的一種變形,但更令人聚焦到端點(diǎn)。A、柱形圖B、熱圖C、階梯圖D、折線圖2、如果柱形的——小于間距,則會(huì)使讀者的注意力集中在空白處而忽略了數(shù)據(jù)。A、長度B、寬度C、高度D、面積3、數(shù)據(jù)的可視化涉及三個(gè)維度:表達(dá)、比例和——。時(shí)間線B、次序C、類別D、布局4、階梯圖可以用無規(guī)律、——的方式表達(dá)數(shù)值隨時(shí)間的變化。A、間歇階躍B、連續(xù)過渡C、曲線變化趨勢D、周期性變化5、次序,次序比例中連續(xù)事件之間的距離是相等的,只表達(dá)事件的——。A、順序B、時(shí)間C、結(jié)果D、間隔對錯(cuò)題1、連續(xù)型時(shí)間數(shù)據(jù)在任意兩個(gè)時(shí)間點(diǎn)之間可以細(xì)分出無限多個(gè)數(shù)值,它是連續(xù)不斷變化現(xiàn)象的記錄。()2、離散型時(shí)間數(shù)據(jù)又稱不連續(xù)性時(shí)間數(shù)據(jù),這類數(shù)據(jù)在任何兩個(gè)時(shí)間點(diǎn)之間的個(gè)數(shù)是無限的。()3、若圖中的橫軸過長,則用戶又有可能看不出數(shù)據(jù)的變化趨勢。()4、熱圖依賴顏色來表達(dá)數(shù)值,可以提取特定數(shù)據(jù)點(diǎn)或準(zhǔn)確指出色塊間的差異。()5、時(shí)間數(shù)據(jù)還可能有循環(huán)性。很多事情都是在規(guī)律性地重復(fù)著。因?yàn)閿?shù)據(jù)在重復(fù),所以比較每周同一天的數(shù)據(jù)就有了意義。填空題1、分析時(shí)間數(shù)據(jù)的目的是——2、連續(xù)型時(shí)間數(shù)據(jù)可視化方法包括——、——、——、——3、離散型時(shí)間數(shù)據(jù)可視化方法包括——、——、——、——4、螺旋圖的圖表從螺旋形的中心點(diǎn)開始往外發(fā)展。十分多變,可使用——、——或——。5、表達(dá)維度包括——、——、——、——、——答案單選題:1、A2、B3、D4、A5、A對錯(cuò)題:1、對2、錯(cuò)有限的3、錯(cuò)若圖中的橫軸過長,點(diǎn)與點(diǎn)之間分割的間距比較大,則會(huì)使得整個(gè)曲線非常夸張;若橫軸過短,則用戶又有可能看不出數(shù)據(jù)的變化趨勢。4、錯(cuò)熱圖依賴顏色來表達(dá)數(shù)值,難以提取特定數(shù)據(jù)點(diǎn)或準(zhǔn)確指出色塊間的差異。5、對填空題:1、從中發(fā)現(xiàn)數(shù)據(jù)隨時(shí)間變化的趨勢2、階梯圖、折線圖、螺旋圖、熱圖3、散點(diǎn)圖、柱形圖、堆疊柱形圖、電線圖4、條形、線條、數(shù)據(jù)點(diǎn)5、線性徑向網(wǎng)格螺旋隨機(jī)一、單選題1、當(dāng)類目數(shù)據(jù)較多且有多個(gè)層次的時(shí)候,利用(C)能更清晰、層次化地展示數(shù)據(jù)的占比關(guān)系。A、餅圖 B、堆疊柱狀圖 C、矩形樹圖 D、環(huán)形圖2、下列哪個(gè)不是環(huán)形圖的特點(diǎn)(D)A、其中有一個(gè)空洞 B、環(huán)中的一段表示樣本中的一部分?jǐn)?shù)據(jù)C、可顯示多個(gè)樣本各部分所占的相應(yīng)比例 D、采用角度衡量比例大小3、與普通面積圖對比,堆面積圖的特點(diǎn)為(B)A、能夠表現(xiàn)數(shù)據(jù)在一段時(shí)間、一個(gè)數(shù)據(jù)區(qū)間內(nèi)的趨勢B、側(cè)重于表現(xiàn)不同時(shí)間段(數(shù)據(jù)區(qū)間)的多個(gè)分類累加值之間的趨勢C、可顯示各部分所占的相應(yīng)比例D、可以將抽象的數(shù)據(jù)直觀化4、關(guān)于餅圖,下列哪個(gè)說法是錯(cuò)誤的(B)A、餅圖中的每一個(gè)楔形都代表著某個(gè)類別或數(shù)值B、數(shù)值大小與楔形角度成正比,總和180°C、所有楔形的總和應(yīng)該代表整體,即100%D、有時(shí)楔形角度過小,數(shù)據(jù)標(biāo)注會(huì)存在一定困難,無法兼顧美觀,這使得餅圖不太適合表示精確的數(shù)據(jù)5、關(guān)于矩形樹圖,下列那個(gè)說法是錯(cuò)誤的(D)A、是一種基于面積的可視化方式B、外部矩形代表父類別C、內(nèi)部矩形代表子類別D、數(shù)值與板塊的面積成非線性關(guān)系二、判斷題1、餅圖適合用于表示精確的數(shù)據(jù)(×)2、餅圖中所有楔形的總和應(yīng)該代表整體(√)3、不同于餅圖采用的角度,環(huán)形圖是通過各個(gè)弧形的長度衡量比例大小(√)4、分類數(shù)據(jù)的比較應(yīng)使用堆面積圖,而不是堆柱狀圖(×)5、堆疊柱狀圖在進(jìn)行不同比例之間的變化的比較時(shí)以及時(shí)間序列比較時(shí)是具有優(yōu)勢的(√)三、填空題1、對比例數(shù)據(jù)進(jìn)行可視化是為了尋找_______、________、__________。(整體中的最大值與最小值、整體的分布構(gòu)成、各部分之間的相對關(guān)系)2、堆疊柱形圖的基本框架有______、_________、________、__________。(數(shù)值軸、類別軸、柱形高度、內(nèi)部柱形高度)3、堆疊柱狀圖實(shí)際應(yīng)用中一般用_______表示比例。(數(shù)值軸)4、矩形樹圖的構(gòu)成要素_______、________、_________。(唯一的根節(jié)點(diǎn)、左子樹、右子樹)5、堆柱狀圖和堆面積圖的差別在于堆面積圖的X軸上只能表示______,堆疊柱狀圖的X軸上只能表示________。(連續(xù)數(shù)據(jù)、分類數(shù)據(jù))一、選擇題1在數(shù)據(jù)可視化中,當(dāng)要在不考慮時(shí)間的情況下比較大量數(shù)據(jù)點(diǎn)時(shí),常使用__A___圖散點(diǎn)圖B.莖葉圖C.直方圖D.密度圖2比較跨類別的聚合數(shù)據(jù),一般可以有__B___種關(guān)系A(chǔ).2B.3C.4D.53以下哪個(gè)類別的圖不能用于研究數(shù)據(jù)的分布性A散點(diǎn)圖B.莖葉圖C.直方圖D.密度圖4氣泡圖可以讓我們同時(shí)比較___B__種數(shù)據(jù)之間的關(guān)系A(chǔ).2B.3C.4D.55密度圖曲線與x軸之間的面積大小為__D__數(shù)據(jù)總量*(最高數(shù)據(jù)+最低數(shù)據(jù))/2B.數(shù)據(jù)總量*(最高數(shù)據(jù)+最低數(shù)據(jù))C.0.5 D.1判斷題1莖葉圖的優(yōu)點(diǎn)是統(tǒng)計(jì)圖上沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到(T)2散點(diǎn)圖中包含的數(shù)據(jù)越多,比較的效果就越差(F)3莖葉圖的思路是將數(shù)組中的數(shù)按位數(shù)進(jìn)行比較,將數(shù)的大小基本不變或變化不大的位作為一分枝(葉),將變化大的位的數(shù)作為主干(莖)(F)4數(shù)據(jù)的關(guān)聯(lián)性,其核心就是指量化的兩個(gè)數(shù)據(jù)間的數(shù)理關(guān)系。(T)5事物之間的關(guān)聯(lián)性是比較容易被發(fā)現(xiàn)的,但是關(guān)聯(lián)并不代表存在因果關(guān)系。(T)填空題1在散點(diǎn)圖種,數(shù)據(jù)之間正相關(guān)時(shí),橫軸數(shù)據(jù)和縱軸數(shù)據(jù)變化趨勢相同;負(fù)相關(guān)時(shí),橫軸數(shù)據(jù)和縱軸數(shù)據(jù)變化趨勢相反2當(dāng)直方圖分段放大時(shí),分段之間的組距就會(huì)縮短,此時(shí)依著直方圖畫出的折線就會(huì)逐漸變成一條光滑的曲線,這條曲線就稱為總體的密度分布曲線。3莖葉圖是一個(gè)與直方圖相類似的特殊工具,但又與直方圖不同,莖葉圖保留原始資料的資訊,直方圖則失去原始資料的訊息。4氣泡圖依靠氣泡的大小反映除x軸y軸外第三維度的信息。5直方圖反映的是一組數(shù)據(jù)的分布情況,直方圖的水平軸是連續(xù)性的,整個(gè)圖表呈現(xiàn)的是柱形,用戶無法獲知每個(gè)柱形的內(nèi)部變化。而在莖葉圖中,用戶可以看到具體數(shù)字,但是要求比較數(shù)值間的差距大小并不是很明確。為了呈現(xiàn)更多的細(xì)節(jié),人們提出了密度圖,可用它對分布的細(xì)節(jié)變化進(jìn)行可視化處理。單選題TF-IDF指標(biāo)是將TF和IDF()得到的,該指標(biāo)綜合考慮了一個(gè)詞語在目標(biāo)文本和其他文本中出現(xiàn)的頻率。相加B.相減C.相乘D.相除以下哪項(xiàng)是關(guān)鍵詞可視化的方法()文檔散B.主體河流C.文本流D.詞語樹文本弧的特性之一是用一條()來表示一篇文章。直線B.弧線C.虛線D.螺旋線語義級(jí)使用()信息挖掘方法來支持信息的挖掘。A.各類分詞算法B.句法分析算法C.主題提取算法D.語義提取算法以下哪個(gè)不是文本關(guān)系可視化的方法()A.詞語樹 B.短語網(wǎng)絡(luò) C.星系視圖 D.文檔散判斷題一個(gè)詞語若在一個(gè)文本中出現(xiàn)頻率較高,那么這個(gè)詞語就是這個(gè)文本的關(guān)鍵詞。()一般來講,標(biāo)簽云中關(guān)鍵詞的權(quán)重越大,則其字體越大,顏色越鮮艷,透明度越低。()在文本弧中,若詞語只是在局部出現(xiàn)得比較頻繁,則其靠近螺旋線分布。()一個(gè)只處理單個(gè)靜態(tài)頁面的程序(比如下載某一個(gè)網(wǎng)頁)是網(wǎng)絡(luò)爬蟲。()短語網(wǎng)絡(luò)包括節(jié)點(diǎn)和直線兩種屬性。()填空題關(guān)鍵詞可視化常用的2種方法為和。時(shí)序文本可視化的常用的3種流圖分別為,和。時(shí)序文本具有和。文本可視化可分為:、、。文本關(guān)系可視化的目的是。答案:單選題1.TF-IDF指標(biāo)是將TF和IDF(C)得到的,該指標(biāo)綜合考慮了一個(gè)詞語在目標(biāo)文本和其他文本中出現(xiàn)的頻率。相加B.相減C.相乘D.相除2.以下哪項(xiàng)是關(guān)鍵詞可視化的方法(A)文檔散B.主體河流C.文本流D.詞語樹3.文本弧的特性之一是用一條(D)來表示一篇文章。直線B.弧線C.虛線D.螺旋線4.語義級(jí)使用(C)信息挖掘方法來支持信息的挖掘。A.各類分詞算法B.句法分析算法C.主題提取算法D.語義提取算法5.以下哪個(gè)不是文本關(guān)系可視化的方法(D)A.詞語樹 B.短語網(wǎng)絡(luò) C.星系視圖 D.文檔散判斷題1.一個(gè)詞語若在一個(gè)文本中出現(xiàn)頻率較高,那么這個(gè)詞語就是這個(gè)文本的關(guān)鍵詞。(×)2.一般來講,標(biāo)簽云中關(guān)鍵詞的權(quán)重越大,則其字體越大,顏色越鮮艷,透明度越低。(√)3.在文本弧中,若詞語只是在局部出現(xiàn)得比較頻繁,則其靠近螺旋線分布。(√)4.一個(gè)只處理單個(gè)靜態(tài)頁面的程序(比如下載某一個(gè)網(wǎng)頁)是網(wǎng)絡(luò)爬蟲。(×)5.短語網(wǎng)絡(luò)包括節(jié)點(diǎn)和直線兩種屬性。(×)填空題1.關(guān)鍵詞可視化常用的2種方法為標(biāo)簽云和文檔散。2.時(shí)序文本可視化的常用的3種流圖分別為主體河流,文本流和故事流。3.時(shí)序文本具有時(shí)間性和順序性。4.文本可視化可分為:文本內(nèi)容的可視化、文本關(guān)系的可視化、文本多層面信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論