版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2024年商業(yè)經(jīng)濟(jì)行業(yè)技能考試-數(shù)據(jù)挖掘工程師歷年考試高頻考點(diǎn)試題附帶答案(圖片大小可自由調(diào)整)第1卷一.參考題庫(kù)(共25題)1.簡(jiǎn)述聯(lián)機(jī)分析處理的四個(gè)特征?2.在數(shù)據(jù)訪問(wèn)模式上,數(shù)據(jù)倉(cāng)庫(kù)以()為主,而日常應(yīng)用數(shù)據(jù)庫(kù)則以()為主。3.聚類分析常作為一個(gè)獨(dú)立的工具來(lái)獲得()4.可視化技術(shù)對(duì)于分析的數(shù)據(jù)類型通常不是專用性的。5.數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)常見(jiàn)的存儲(chǔ)優(yōu)化方法包括()、反向規(guī)范化引入冗余、表的物理分割。6.簡(jiǎn)述分類模型的評(píng)價(jià)。7.常用的數(shù)值屬性概念分層的方法有哪些?8.下面哪種分類方法是屬于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法?()A、判定樹(shù)歸納B、貝葉斯分類C、后向傳播分類D、基于案例的推理9.具有較高的支持度的項(xiàng)集具有較高的置信度。10.為什么說(shuō)數(shù)據(jù)倉(cāng)庫(kù)具有隨時(shí)間而變化的特征?11.ROLAP12.數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的組成部分包括數(shù)據(jù)倉(cāng)庫(kù),倉(cāng)庫(kù)管理,數(shù)據(jù)抽取,分析工具等四個(gè)部分。13.調(diào)和數(shù)據(jù)是存儲(chǔ)在()數(shù)據(jù)倉(cāng)庫(kù)和操作型數(shù)據(jù)存儲(chǔ)中的數(shù)據(jù)。14.以下哪項(xiàng)關(guān)于決策樹(shù)的說(shuō)法是錯(cuò)誤的?()A、冗余屬性不會(huì)對(duì)決策樹(shù)的準(zhǔn)確率造成不利的影響B(tài)、子樹(shù)可能在決策樹(shù)中重復(fù)多次C、決策樹(shù)算法對(duì)于噪聲的干擾非常敏感D、尋找最佳決策樹(shù)是NP完全問(wèn)題15.以下兩種描述分別對(duì)應(yīng)哪兩種對(duì)分類算法的評(píng)價(jià)標(biāo)準(zhǔn)?() (1)警察抓小偷,描述警察抓的人中有多少個(gè)是小偷的標(biāo)準(zhǔn)。 (2)描述有多少比例的小偷給警察抓了的標(biāo)準(zhǔn)。A、Precision,RecallB、Recall,PrecisionC、Precision,ROCD、Recall,ROC16.簡(jiǎn)述數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)設(shè)計(jì)過(guò)程?17.數(shù)據(jù)倉(cāng)庫(kù)中間層OLAP服務(wù)器只能采用關(guān)系型OLAP。18.在抽樣方法中,當(dāng)合適的樣本容量很難確定時(shí),可以使用的抽樣方法是:()。A、有放回的簡(jiǎn)單隨機(jī)抽樣B、無(wú)放回的簡(jiǎn)單隨機(jī)抽樣C、分層抽樣D、漸進(jìn)抽樣19.假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個(gè)箱。等頻(等深)劃分時(shí),15在第幾個(gè)箱子內(nèi)?()A、第一個(gè)B、第二個(gè)C、第三個(gè)D、第四個(gè)20.簡(jiǎn)述數(shù)據(jù)挖掘的過(guò)程。21.簡(jiǎn)述處理空缺值的方法。22.下列幾種數(shù)據(jù)挖掘功能中,()被廣泛的用于購(gòu)物籃分析。A、關(guān)聯(lián)分析B、分類和預(yù)測(cè)C、聚類分析D、演變分析23.一個(gè)典型的數(shù)據(jù)挖掘系統(tǒng)應(yīng)該包括哪些組成部分?24.數(shù)據(jù)聚合需要考慮的問(wèn)題有哪些?25.計(jì)算一個(gè)單位的平均工資,使用哪個(gè)中心趨勢(shì)度量將得到最合理的結(jié)果?()A、算術(shù)平均值B、截尾均值C、中位數(shù)D、眾數(shù)第2卷一.參考題庫(kù)(共25題)1.數(shù)據(jù)挖掘技術(shù)對(duì)聚類分析的要求有哪幾個(gè)方面?2.OLAP服務(wù)器的類型主要包括:()、()和()3.簡(jiǎn)述數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的三級(jí)模型的基本內(nèi)容。4.考慮下表所示二元分類問(wèn)題的數(shù)據(jù)集。 (1)計(jì)算按照屬性A和B劃分時(shí)的信息增益。決策樹(shù)歸納算法將會(huì)選擇哪個(gè)屬性? (2)計(jì)算按照屬性A和B劃分時(shí)Gini系數(shù)。決策樹(shù)歸納算法將會(huì)選擇哪個(gè)屬性?5.給定由兩次運(yùn)行K均值產(chǎn)生的兩個(gè)不同的簇集,誤差的平方和最大的那個(gè)應(yīng)該被視為較優(yōu)。6.ROLAP是基于()的OLAP實(shí)現(xiàn),而MOLAP是基于多維數(shù)據(jù)結(jié)構(gòu)組織的OLAP實(shí)現(xiàn)。7.預(yù)測(cè)型知識(shí)8.連續(xù)型屬性的數(shù)據(jù)樣本之間的距離有歐氏距離、曼哈頓距離和()9.一種常用的確定離群點(diǎn)的簡(jiǎn)單方法是()10.簡(jiǎn)述抽樣的定義及分類。11.比較統(tǒng)計(jì)學(xué)與數(shù)據(jù)挖掘的異同?12.為什么要建立數(shù)據(jù)倉(cāng)庫(kù)?13.數(shù)據(jù)庫(kù)中的知識(shí)挖掘(KDD)包括以下七個(gè)步驟:()、()、()、()、()、()和()14.通過(guò)聚集多個(gè)分類器的預(yù)測(cè)來(lái)提高分類準(zhǔn)確率的技術(shù)稱為()。A、組合(ensemble)B、聚集(aggregate)C、合并(combination)D、投票(voting)15.數(shù)據(jù)挖掘16.列舉操作型數(shù)據(jù)與分析型數(shù)據(jù)的主要區(qū)別。17.為什么時(shí)間總是數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市的維?18.何謂相異度矩陣?它有什么特點(diǎn)?19.數(shù)據(jù)壓縮可分為:()和()兩種類型。20.如何用決策樹(shù)進(jìn)行分類?21.以下哪個(gè)指標(biāo)不是表示對(duì)象間的相似度和相異度?()A、Euclidean距離B、Manhattan距離C、Eula距離D、Minkowski距離22.聚類分析中常見(jiàn)的數(shù)據(jù)類型有哪些?23.確定了數(shù)據(jù)倉(cāng)庫(kù)的粒度模型以后,為提高數(shù)據(jù)倉(cāng)庫(kù)的使用性能,還需要根據(jù)擁護(hù)需求設(shè)計(jì)()24.關(guān)聯(lián)規(guī)則25.熵是為消除不確定性所需要獲得的信息量,投擲均勻正六面體骰子的熵是:()。A、1比特B、2.6比特C、3.2比特D、3.8比特第3卷一.參考題庫(kù)(共25題)1.如果規(guī)則不滿足置信度閾值,則形如的規(guī)則一定也不滿足置信度閾值,其中是X的子集。2.以下是哪一個(gè)聚類算法的算法流程()。 ①構(gòu)造k-最近鄰圖。 ②使用多層圖劃分算法劃分圖。 ③repeat:合并關(guān)于相對(duì)互連性和相對(duì)接近性而言,最好地保持簇的自相似性的簇。 ④until:不再有可以合并的簇。A、MSTB、OPOSSUMC、ChameleonD、Jarvis-Patrick(JP)3.求和函數(shù)sum()是一個(gè)()的函數(shù)。4.()將兩個(gè)簇的鄰近度定義為兩個(gè)簇合并時(shí)導(dǎo)致的平方誤差的增量,它是一種凝聚層次聚類技術(shù)。A、MIN(單鏈)B、MAX(全鏈)C、組平均D、Ward方法5.什么是數(shù)據(jù)清洗?6.Web挖掘包括哪些步驟?7.數(shù)據(jù)倉(cāng)庫(kù)在技術(shù)上的工作過(guò)程是()。A、數(shù)據(jù)的抽取B、存儲(chǔ)和管理C、數(shù)據(jù)的表現(xiàn)D、數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)8.簡(jiǎn)述數(shù)據(jù)挖掘的對(duì)象。9.如果允許一條記錄觸發(fā)多條分類規(guī)則,把每條被觸發(fā)規(guī)則的后件看作是對(duì)相應(yīng)類的一次投票,然后計(jì)票確定測(cè)試記錄的類標(biāo)號(hào),稱為()。A、無(wú)序規(guī)則B、窮舉規(guī)則C、互斥規(guī)則D、有序規(guī)則10.下面的散點(diǎn)圖顯示哪種屬性相關(guān)性?() A、不相關(guān);B、正相關(guān);C、負(fù)相關(guān);D、先正相關(guān)然后負(fù)相關(guān)11.Bayes法是一種在已知后驗(yàn)概率與類條件概率的情況下的模式分類方法,待分樣本的分類結(jié)果取決于各類域中樣本的全體。12.給定兩個(gè)向量對(duì)象,分別表示為p1(22,1,42,10),p2(20,0,36,8): (a)計(jì)算兩個(gè)對(duì)象之間的歐幾里得距離 (b)計(jì)算兩個(gè)對(duì)象之間的曼哈頓距離 (c)計(jì)算兩個(gè)對(duì)象之間的閔可夫斯基距離,用x=3 (d)計(jì)算兩個(gè)對(duì)象之間的切比雪夫距離13.業(yè)務(wù)元數(shù)據(jù)主要包含的內(nèi)容是什么?14.Apriori算法所面臨的主要的挑戰(zhàn)包括()。A、會(huì)消耗大量的內(nèi)存B、會(huì)產(chǎn)生大量的候選項(xiàng)集C、對(duì)候選項(xiàng)集的支持度計(jì)算非常繁瑣D、要對(duì)數(shù)據(jù)進(jìn)行多次掃描15.MOLAP16.維度表一般又主鍵、分類層次和描述屬性組成。對(duì)于主鍵可以選擇兩種方式:一種是采用自然鍵,另一種是采用()17.下列幾種數(shù)據(jù)挖掘功能中,()被廣泛的應(yīng)用于股票價(jià)格走勢(shì)分析。A、關(guān)聯(lián)分析B、分類和預(yù)測(cè)C、聚類分析D、演變分析18.簡(jiǎn)述數(shù)據(jù)清理的基本內(nèi)容。19.數(shù)據(jù)變換的內(nèi)容是什么?20.根據(jù)顧客的收入和職業(yè)情況,預(yù)測(cè)他們?cè)谟?jì)算機(jī)設(shè)備上的花費(fèi),所使用的相應(yīng)數(shù)據(jù)挖掘功能是()。A、關(guān)聯(lián)分析B、分類和預(yù)測(cè)C、演變分析D、概念描述21.簡(jiǎn)述典型的聚類分析任務(wù)包括的步驟。22.數(shù)據(jù)挖掘處理的對(duì)象有哪些?請(qǐng)從實(shí)際生活中舉出至少三種。23.檢測(cè)一元正態(tài)分布中的離群點(diǎn),屬于異常檢測(cè)中的基于()的離群點(diǎn)檢測(cè)。A、統(tǒng)計(jì)方法B、鄰近度C、密度D、聚類技術(shù)24.尋找模式和規(guī)則主要是對(duì)數(shù)據(jù)進(jìn)行干擾,使其符合某種規(guī)則以及模式。25.什么是技術(shù)元數(shù)據(jù)?主要包含的內(nèi)容是什么?第1卷參考答案一.參考題庫(kù)1.參考答案: (1)快速性:用戶對(duì)OLAP的快速反應(yīng)能力有很高的要求。 (2)可分析性:OLAP系統(tǒng)應(yīng)能處理任何邏輯分析和統(tǒng)計(jì)分析。 (3)多維性:系統(tǒng)必須提供對(duì)數(shù)據(jù)分析的多維視圖和分析。 (4)信息性:OLAP系統(tǒng)應(yīng)能及時(shí)獲得信息,并且管理大容量的信息。2.參考答案:事務(wù)操作;只讀查詢3.參考答案:數(shù)據(jù)分布的情況4.參考答案:錯(cuò)誤5.參考答案:表的歸并與簇文件6.參考答案:分類過(guò)程一般分為兩步:第一步是利用分類算法對(duì)訓(xùn)練集進(jìn)行學(xué)習(xí),建立分類模型;第二步是用分類模型對(duì)標(biāo)號(hào)未知的測(cè)試數(shù)據(jù)進(jìn)行分類。7.參考答案:分箱、直方圖分析,聚類分析,基于熵的離散化和通過(guò)自然劃分分段。8.參考答案:C9.參考答案:錯(cuò)誤10.參考答案: 1,數(shù)據(jù)倉(cāng)庫(kù)的時(shí)間范圍比操作數(shù)據(jù)庫(kù)系統(tǒng)要長(zhǎng)的多。操作數(shù)據(jù)庫(kù)系統(tǒng)主要保存當(dāng)前數(shù)據(jù),而數(shù)據(jù)倉(cāng)庫(kù)從歷史的角度提供信息。 2,數(shù)據(jù)倉(cāng)庫(kù)中的每一個(gè)關(guān)鍵結(jié)構(gòu)都隱式或顯式的包含時(shí)間元素,而操作數(shù)據(jù)庫(kù)中的關(guān)鍵結(jié)構(gòu)可能就不包含時(shí)間元素。11.參考答案:是基于關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)方式的,在這種結(jié)構(gòu)中,多維數(shù)據(jù)被映像成二維關(guān)系表,通常采用星型或雪花型架構(gòu),由一個(gè)事實(shí)表和多個(gè)維度表構(gòu)成。12.參考答案:錯(cuò)誤13.參考答案:企業(yè)級(jí)14.參考答案:C15.參考答案:A16.參考答案:收集、分析和確認(rèn)業(yè)務(wù)分析需求,分析和理解主題和元數(shù)據(jù)、事實(shí)及其量度、粒度和維度的選擇與設(shè)計(jì)、數(shù)據(jù)倉(cāng)庫(kù)的物理存儲(chǔ)方式的設(shè)計(jì)等。17.參考答案:錯(cuò)誤18.參考答案:D19.參考答案:B20.參考答案:數(shù)據(jù)清洗,數(shù)據(jù)集成(考慮數(shù)據(jù)一致性和冗余),數(shù)據(jù)選擇,數(shù)據(jù)轉(zhuǎn)換,數(shù)據(jù)挖掘,模式評(píng)估,知識(shí)表示。21.參考答案: ①忽略該記錄; ②去掉屬性; ③手工填寫(xiě)空缺值; ④使用默認(rèn)值; ⑤使用屬性平均值; ⑥使用同類樣本平均值。22.參考答案:A23.參考答案: 1,數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)或其他信息庫(kù); 2,數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器; 3,知識(shí)庫(kù); 4,數(shù)據(jù)挖掘引擎; 5,模式評(píng)估模塊; 6.圖形用戶界面。24.參考答案:(1)模式識(shí)別:這主要是實(shí)體識(shí)別問(wèn)題; (2)冗余:一個(gè)屬性是冗余的,即它能由另一個(gè)表導(dǎo)出,如果屬性或維的命名不一致,也可能導(dǎo)致冗余,可以用相關(guān)分析來(lái)檢測(cè); (3)數(shù)據(jù)值沖突的檢測(cè)與處理:有些屬性因表示比例或編碼不同,會(huì)導(dǎo)致屬性不同。25.參考答案:B第2卷參考答案一.參考題庫(kù)1.參考答案:可伸縮性;處理不同類型屬性的能力;發(fā)現(xiàn)任意形狀聚類的能力;減小對(duì)先驗(yàn)知識(shí)和用戶自定義參數(shù)的依賴性;處理噪聲數(shù)據(jù)的能力;可解釋性和實(shí)用性。2.參考答案:關(guān)系OLAP服務(wù)器;多維OLAP服務(wù)器;混合OLAP服務(wù)器3.參考答案: (1)概念模型設(shè)計(jì)是在較高的抽象層次上的設(shè)計(jì),其主要內(nèi)容包括:界定系統(tǒng)邊界和確定主要的主題域。 (2)邏輯模型設(shè)計(jì)的主要內(nèi)容包括:分析主題域、確定粒度層次劃分、確定數(shù)據(jù)分割策略、定義關(guān)系模式、定義記錄系統(tǒng)。 (3)物理數(shù)據(jù)模型設(shè)計(jì)的主要內(nèi)容包括:確定數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)、確定數(shù)據(jù)存放位置、確定存儲(chǔ)分配以及確定索引策略等。4.參考答案:按照屬性A和B劃分時(shí),數(shù)據(jù)集可分為如下兩種情況: 按照屬性A劃分樣本集分別得到的兩個(gè)子集(A取值T和A取值F)的信息熵分別為: 按照屬性B劃分樣本集分別得到的兩個(gè)子集(B取值T和B取值F)的信息熵分別為: 因此,決策樹(shù)歸納算法將會(huì)選擇屬性A。 (2) 劃分前的Gini值為G=1-0.42-0.62=0.48 按照屬性A劃分時(shí)Gini指標(biāo): 因此,決策樹(shù)歸納算法將會(huì)選擇屬性B。5.參考答案:錯(cuò)誤6.參考答案:關(guān)系數(shù)據(jù)庫(kù)7.參考答案:是根據(jù)時(shí)間序列型數(shù)據(jù),由歷史的和當(dāng)前的數(shù)據(jù)去推測(cè)未來(lái)的數(shù)據(jù),也可以認(rèn)為是以時(shí)間為關(guān)鍵屬性的關(guān)聯(lián)知識(shí)。8.參考答案:明考斯基距離9.參考答案:出落在至少高于第三個(gè)四分位數(shù)或低于第一個(gè)四分位數(shù)1.5*IQR處的值10.參考答案:抽樣:長(zhǎng)期用于數(shù)據(jù)的事先調(diào)查和最終的數(shù)據(jù)分析,在數(shù)據(jù)挖掘中,抽樣是選擇數(shù)據(jù)子集進(jìn)行分析的常用方法。 1)無(wú)放回的簡(jiǎn)單隨機(jī)抽樣方法 2)有放回的簡(jiǎn)單隨機(jī)抽樣方法 3)分層抽樣方法11.參考答案: 統(tǒng)計(jì)學(xué)主要是對(duì)數(shù)量數(shù)據(jù)(數(shù)值)或連續(xù)值數(shù)據(jù)(如年齡、工資等),進(jìn)行數(shù)值計(jì)算(如初等運(yùn)算)的定量分析,得到數(shù)量信息。 數(shù)據(jù)挖掘主要對(duì)離散數(shù)據(jù)(如職稱、病癥等)進(jìn)行定性分析(覆蓋、歸納等),得到規(guī)則知識(shí)。 統(tǒng)計(jì)學(xué)與數(shù)據(jù)挖掘是有區(qū)別的。但是,它們之間是相互補(bǔ)充的。12.參考答案: 建立數(shù)據(jù)倉(cāng)庫(kù)的目的有3個(gè): 一是為了解決企業(yè)決策分析中的系統(tǒng)響應(yīng)問(wèn)題,數(shù)據(jù)倉(cāng)庫(kù)能提供比傳統(tǒng)事務(wù)數(shù)據(jù)庫(kù)更快的大規(guī)模決策分析的響應(yīng)速度。 二是解決決策分析對(duì)數(shù)據(jù)的特殊需求問(wèn)題。決策分析需要全面的、正確的集成數(shù)據(jù),這是傳統(tǒng)事務(wù)數(shù)據(jù)庫(kù)不能直接提供的。 三是解決決策分析對(duì)數(shù)據(jù)的特殊操作要求。決策分析是面向?qū)I(yè)用戶而非一般業(yè)務(wù)員,需要使用專業(yè)的分析工具,對(duì)分析結(jié)果還要以商業(yè)智能的方式進(jìn)行表現(xiàn),這是事務(wù)數(shù)據(jù)庫(kù)不能提供的。13.參考答案:數(shù)據(jù)清理;數(shù)據(jù)集成;數(shù)據(jù)選擇;數(shù)據(jù)變換;數(shù)據(jù)挖掘;模式評(píng)估;知識(shí)表示14.參考答案:A15.參考答案:從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。16.參考答案:17.參考答案:因?yàn)閿?shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市的數(shù)據(jù)總是歷史的數(shù)據(jù),需要時(shí)間維來(lái)區(qū)別。18.參考答案: 相異度矩陣是用于存儲(chǔ)所有對(duì)象兩兩之間相異度的矩陣,為一個(gè)nn維的單模矩陣。 其特點(diǎn)是d(i,j)=d(j,i),d(i,i)=0,d(j,j)=0。如下所示: 19.參考答案:有損壓縮;無(wú)損壓縮20.參考答案:決策樹(shù)用于對(duì)新樣本的分類,即通過(guò)決策樹(shù)對(duì)新樣本屬性值的測(cè)試,從樹(shù)的根結(jié)點(diǎn)開(kāi)始,按照樣本屬性的取值,逐漸沿著決策樹(shù)向下,直到樹(shù)的葉結(jié)點(diǎn),該葉結(jié)點(diǎn)表示的類別就是新樣本的類別。決策樹(shù)方法是數(shù)據(jù)挖掘中非常有效的分類方法。21.參考答案:C22.參考答案:常見(jiàn)數(shù)據(jù)類型有區(qū)間標(biāo)度變量、比例標(biāo)度型變量、二元變量、標(biāo)稱型、序數(shù)型以及混合類型等。23.參考答案:聚合模型24.參考答案:同時(shí)滿足最小支持度閾值和最小可信度閾值的規(guī)則稱之為關(guān)聯(lián)規(guī)則。25.參考答案:B第3卷參考答案一.參考題庫(kù)1.參考答案:正確2.參考答案:C3.參考答案:分布4.參考答案:D5.參考答案:數(shù)據(jù)清洗是一種使用模式識(shí)別和其他技術(shù),在將原始數(shù)據(jù)轉(zhuǎn)換和移到數(shù)據(jù)倉(cāng)庫(kù)之前來(lái)升級(jí)原始數(shù)據(jù)質(zhì)量的技術(shù)。6.參考答案:數(shù)據(jù)清理(可能有占全過(guò)程的60%的工作量);將數(shù)據(jù)存入數(shù)據(jù)倉(cāng)庫(kù);建立數(shù)據(jù)立方體;選擇用來(lái)進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù);數(shù)據(jù)挖掘(選擇適當(dāng)?shù)乃惴▉?lái)找到感興趣的模式);展現(xiàn)挖掘結(jié)果;將模式或者知識(shí)應(yīng)用或者存入知識(shí)庫(kù)。7.參考答案:A,B,C,D8.參考答案:關(guān)系數(shù)據(jù)庫(kù)(借助集合代數(shù)等概念和方法來(lái)處理數(shù)據(jù)庫(kù)中的數(shù)據(jù))、數(shù)據(jù)倉(cāng)庫(kù)(數(shù)據(jù)集合,用于支持管理決策)、事務(wù)數(shù)據(jù)庫(kù)(每個(gè)記錄代表一個(gè)事務(wù))、空間數(shù)據(jù)庫(kù)、事態(tài)數(shù)據(jù)庫(kù)和時(shí)間序列數(shù)據(jù)庫(kù)、流數(shù)據(jù)、多媒體數(shù)據(jù)庫(kù)、文本數(shù)據(jù)庫(kù)、萬(wàn)維數(shù)據(jù)庫(kù)。9.參考答案:A10.參考答案:C11.參考答案:錯(cuò)誤12.參考答案:(a)計(jì)算兩個(gè)對(duì)象之間的歐幾里得距離 (b)計(jì)算兩個(gè)對(duì)象之間的曼哈頓距離 (c)計(jì)算兩個(gè)對(duì)象之間的閔可夫斯基距離,其中參數(shù)r=3 13.參考答案:業(yè)務(wù)元數(shù)據(jù):從業(yè)務(wù)角度描述了DW中的數(shù)據(jù),提供了介于使用者和實(shí)際系統(tǒng)之間的語(yǔ)義層,主要包括: 1.使用者的業(yè)務(wù)屬于所表達(dá)的數(shù)據(jù)模型、對(duì)象名和屬性名。 2.訪問(wèn)數(shù)據(jù)的原則和數(shù)據(jù)的來(lái)源。 3.系統(tǒng)提供的分析方法及公式和報(bào)表的信息。14.參考答案:B,C,D15.參考答案:是基于類似于“超立方”塊的OLAP存儲(chǔ)結(jié)構(gòu),由許多經(jīng)壓縮的、類似于多維數(shù)組的對(duì)象構(gòu)成,并帶有高度壓縮的索引及指針結(jié)構(gòu),通過(guò)直接偏移計(jì)算進(jìn)行存取。16.參考答案:代理鍵17.參考答案:D18.參考答案:①盡可能賦予屬性名和屬性值明確的含義;②統(tǒng)一多數(shù)據(jù)源的屬性值編碼;③去除無(wú)用的惟一屬性或鍵值(如自動(dòng)增長(zhǎng)的id);④去除重復(fù)屬性(在某些分析中,年齡和出生日期可能就是重復(fù)的屬性,但在某些時(shí)候它們可能又是同時(shí)需要的);⑤去除
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版搬運(yùn)企業(yè)節(jié)能減排合同范本3篇
- 2025年度木材加工設(shè)備租賃及維護(hù)服務(wù)合同范本4篇
- 2025版民爆物品裝卸作業(yè)環(huán)境保護(hù)合同4篇
- 2025年度個(gè)人消費(fèi)分期付款合同范本(2025版)3篇
- 農(nóng)業(yè)機(jī)械化與農(nóng)村振興人才培育考核試卷
- 2025版事業(yè)單位聘用合同正規(guī)范本(含試用期)2篇
- 2025版人工智能研發(fā)中心錄用合同范本3篇
- 2025年公益活動(dòng)加盟合同
- 2025年大型活動(dòng)合作協(xié)議
- 2025年度高科技實(shí)驗(yàn)室租賃合同4篇
- 【探跡科技】2024知識(shí)產(chǎn)權(quán)行業(yè)發(fā)展趨勢(shì)報(bào)告-從工業(yè)轟鳴到數(shù)智浪潮知識(shí)產(chǎn)權(quán)成為競(jìng)爭(zhēng)市場(chǎng)的“矛與盾”
- 《中國(guó)政法大學(xué)》課件
- GB/T 35270-2024嬰幼兒背帶(袋)
- 遼寧省沈陽(yáng)名校2025屆高三第一次模擬考試英語(yǔ)試卷含解析
- 2024-2025學(xué)年高二上學(xué)期期末數(shù)學(xué)試卷(新題型:19題)(基礎(chǔ)篇)(含答案)
- 2022版藝術(shù)新課標(biāo)解讀心得(課件)小學(xué)美術(shù)
- Profinet(S523-FANUC)發(fā)那科通訊設(shè)置
- 醫(yī)學(xué)教程 常見(jiàn)化療藥物歸納
- 統(tǒng)編版九年級(jí)歷史下冊(cè)第一單元教案教學(xué)設(shè)計(jì)
- GB/T 25000.51-2016系統(tǒng)與軟件工程系統(tǒng)與軟件質(zhì)量要求和評(píng)價(jià)(SQuaRE)第51部分:就緒可用軟件產(chǎn)品(RUSP)的質(zhì)量要求和測(cè)試細(xì)則
- 外科學(xué)試題庫(kù)及答案(共1000題)
評(píng)論
0/150
提交評(píng)論