江蘇開放大學(xué)數(shù)據(jù)挖掘技術(shù)第2次形考作業(yè)_第1頁(yè)
江蘇開放大學(xué)數(shù)據(jù)挖掘技術(shù)第2次形考作業(yè)_第2頁(yè)
江蘇開放大學(xué)數(shù)據(jù)挖掘技術(shù)第2次形考作業(yè)_第3頁(yè)
江蘇開放大學(xué)數(shù)據(jù)挖掘技術(shù)第2次形考作業(yè)_第4頁(yè)
江蘇開放大學(xué)數(shù)據(jù)挖掘技術(shù)第2次形考作業(yè)_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

江蘇開放大學(xué)數(shù)據(jù)挖掘技術(shù)第2次形考作業(yè)單選題題型:?jiǎn)芜x題客觀題分值2分難度:一般得分:21在抽樣方法中,當(dāng)合適的樣本容量很難確定時(shí),可以使用的抽樣方法是()。A有放回的簡(jiǎn)單隨機(jī)抽樣B無(wú)放回的簡(jiǎn)單隨機(jī)抽樣C分層抽樣D漸進(jìn)抽樣正確答案:D題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:22下列哪個(gè)不是專門用于可視化時(shí)間空間數(shù)據(jù)的技術(shù):()A等高線圖B餅圖C曲面圖D矢量場(chǎng)圖正確答案:B題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:23一所大學(xué)內(nèi)的各年紀(jì)人數(shù)分別為:一年級(jí)200人,二年級(jí)160人,三年級(jí)130人,四年級(jí)110人。則年級(jí)屬性的眾數(shù)是()。A一年級(jí)B二年級(jí)C三年級(jí)D四年級(jí)正確答案:A題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:24下列哪一項(xiàng)不是數(shù)據(jù)規(guī)范化的常用方法()。A、按小數(shù)定標(biāo)規(guī)范化B、最小-最大值規(guī)范化C、z-score規(guī)范化D、按整數(shù)定標(biāo)規(guī)范法正確答案:D題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:25下列哪一個(gè)選項(xiàng)是數(shù)據(jù)立方體中的基本方體的概念()。A不同層創(chuàng)建的數(shù)據(jù)立方體B最高層抽象的立方體C最低抽象層創(chuàng)建的立方體D每一個(gè)數(shù)據(jù)立方體正確答案:C題型:?jiǎn)芜x題客觀題分值2分難度:中等得分:26考慮值集{12243324556826},其四分位數(shù)極差是()。A、31B、24C、55D、3正確答案:A題型:?jiǎn)芜x題客觀題分值2分難度:較難得分:27假定用于分析的數(shù)據(jù)包含屬性age。數(shù)據(jù)元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問(wèn)題:使用按箱平均值平滑方法對(duì)上述數(shù)據(jù)進(jìn)行平滑,箱的深度為3。第二個(gè)箱子值為()。A、18.3B、22.6C、26.8D、27.9正確答案:A題型:?jiǎn)芜x題客觀題分值2分難度:較難得分:28假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對(duì)屬性income的73600元將被轉(zhuǎn)化為()。A、0.821B、1.224C、1.458D、0.716正確答案:D題型:?jiǎn)芜x題客觀題分值2分難度:一般得分:29熵是為消除不確定性所需要獲得的信息量,投擲均勻正六面體骰子的熵是()。A、1比特B、2.6比特C、3.2比特D、3.8比特正確答案:B題型:?jiǎn)芜x題客觀題分值2分難度:一般得分:210、下面()屬于映射數(shù)據(jù)到新的空間的方法。A、傅里葉變換B、特征加權(quán)C、漸進(jìn)抽樣D、維歸約正確答案:A題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:211、OLAP技術(shù)的核心是()。A、在線性B、對(duì)用戶的快速響應(yīng)C、互操作性D、多維分析正確答案:D題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:212、在有關(guān)數(shù)據(jù)倉(cāng)庫(kù)測(cè)試,下列說(shuō)法不正確的是()。A、在完成數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施過(guò)程中,需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行各種測(cè)試.測(cè)試工作中要包括單元測(cè)試和系統(tǒng)測(cè)試.B、當(dāng)數(shù)據(jù)倉(cāng)庫(kù)的每個(gè)單獨(dú)組件完成后,就需要對(duì)他們進(jìn)行單元測(cè)試C、系統(tǒng)的集成測(cè)試需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)的所有組件進(jìn)行大量的功能測(cè)試和回歸測(cè)試D、在測(cè)試之前沒必要制定詳細(xì)的測(cè)試計(jì)劃正確答案:D題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:213、有關(guān)數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)特點(diǎn),不正確的描述是()。A、數(shù)據(jù)倉(cāng)庫(kù)開發(fā)要從數(shù)據(jù)出發(fā)B、數(shù)據(jù)倉(cāng)庫(kù)使用的需求在開發(fā)出去就要明確C、數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)是一個(gè)不斷循環(huán)的過(guò)程,是啟發(fā)式的開發(fā)D、在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)分析和處理更靈活,且沒有固定的模式正確答案:A題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:214、下面關(guān)于數(shù)據(jù)粒度的描述不正確的是()。A、粒度是指數(shù)據(jù)倉(cāng)庫(kù)小數(shù)據(jù)單元的詳細(xì)程度和級(jí)別B、數(shù)據(jù)越詳細(xì),粒度就越小,級(jí)別也就越高C、數(shù)據(jù)綜合度越高,粒度也就越大,級(jí)別也就越高D、粒度的具體劃分將直接影響數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量以及查詢質(zhì)量正確答案:C題型:?jiǎn)芜x題客觀題分值2分難度:一般得分:215、關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指()。A、基本元數(shù)據(jù)與數(shù)據(jù)源,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息B、基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息C、基本元數(shù)據(jù)包括日志文件和簡(jiǎn)歷執(zhí)行處理的時(shí)序調(diào)度信息D、基本元數(shù)據(jù)包括關(guān)于裝載和更新處理,分析處理以及管理方面的信息正確答案:D題型:?jiǎn)芜x題客觀題分值2分難度:一般得分:216、數(shù)據(jù)倉(cāng)庫(kù)是隨著時(shí)間變化的,下面的描述不正確的是()。A、數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容B、捕捉到的新數(shù)據(jù)會(huì)覆蓋原來(lái)的快照C、數(shù)據(jù)倉(cāng)庫(kù)隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容D、數(shù)據(jù)倉(cāng)庫(kù)中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行重新綜合正確答案:C題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:217、數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的三級(jí)數(shù)據(jù)模型不包括()。A、概念模型B、邏輯模型C、物理模型D、數(shù)據(jù)模型正確答案:D題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:218、數(shù)據(jù)倉(cāng)庫(kù)的三層體系結(jié)構(gòu)不包括()。A、數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器B、OLAP服務(wù)器C、前端工具D、SMTP服務(wù)器正確答案:D題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:219下列哪一項(xiàng)不是數(shù)據(jù)倉(cāng)庫(kù)的關(guān)鍵性質(zhì)()。A面向主題B與時(shí)間相關(guān)C與空間相關(guān)D集成性正確答案:C題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:220將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)()。A頻繁模式挖掘B分類和預(yù)測(cè)C數(shù)據(jù)預(yù)處理D數(shù)據(jù)流挖掘正確答案:C題型:?jiǎn)芜x題客觀題分值2分難度:中等得分:221未來(lái)房?jī)r(jià)的預(yù)測(cè),這種屬于數(shù)據(jù)挖掘的哪類問(wèn)題()。A分類B聚類C關(guān)聯(lián)規(guī)則D回歸分析正確答案:D題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:222在圖集合中發(fā)現(xiàn)一組公共子結(jié)構(gòu),這樣的任務(wù)稱為()。A頻繁子集挖掘B頻繁子圖挖掘C頻繁數(shù)據(jù)項(xiàng)挖掘D頻繁模式挖掘正確答案:B題型:?jiǎn)芜x題客觀題分值2分難度:中等得分:223考慮下面的頻繁3-項(xiàng)集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定數(shù)據(jù)集中只有5個(gè)項(xiàng),采用合并策略,由候選產(chǎn)生過(guò)程得到4-項(xiàng)集不包含()。A、1,2,3,4B、1,2,3,5C、1,2,4,5D、1,3,4,5正確答案:C題型:?jiǎn)芜x題客觀題分值2分難度:一般得分:224、頻繁項(xiàng)集、頻繁閉項(xiàng)集、最大頻繁項(xiàng)集之間的關(guān)系是()A、頻繁項(xiàng)集頻繁閉項(xiàng)集=最大頻繁項(xiàng)集B、頻繁項(xiàng)集=頻繁閉項(xiàng)集最大頻繁項(xiàng)集C、頻繁項(xiàng)集頻繁閉項(xiàng)集最大頻繁項(xiàng)集D、頻繁項(xiàng)集=頻繁閉項(xiàng)集=最大頻繁項(xiàng)集正確答案:C題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:225、概念分層圖是()圖。A、無(wú)向無(wú)環(huán)B、有向無(wú)環(huán)C、有向有環(huán)D、無(wú)向有環(huán)正確答案:B題型:?jiǎn)芜x題客觀題分值2分難度:一般得分:226、設(shè)X={1,2,3}是頻繁項(xiàng)集,則可由X產(chǎn)生()個(gè)關(guān)聯(lián)規(guī)則。A、4B、5C、6D、7正確答案:C題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:227、關(guān)于OLAP和OLTP的說(shuō)法,下列不正確的是()。A、OLAP事務(wù)量大,但事務(wù)內(nèi)容比較簡(jiǎn)單且重復(fù)率高B、OLAP的最終數(shù)據(jù)來(lái)源與OLTP不一樣C、OLTP面對(duì)的是決策人員和高層管理人員D、OLTP以應(yīng)用為核心,是應(yīng)用驅(qū)動(dòng)的正確答案:A題型:?jiǎn)芜x題客觀題分值2分難度:中等得分:228、OLAM技術(shù)一般簡(jiǎn)稱為”數(shù)據(jù)聯(lián)機(jī)分析挖掘”,下面說(shuō)法正確的是()。A、OLAP和OLAM都基于客戶機(jī)/服務(wù)器模式,只有后者有與用戶的交互性B、由于OLAM的立方體和用于OLAP的立方體有本質(zhì)的區(qū)別C、基于WEB的OLAM是WEB技術(shù)與OLAM技術(shù)的結(jié)合D、OLAM服務(wù)器通過(guò)用戶圖形借口接收用戶的分析指令,在元數(shù)據(jù)的知道下,對(duì)超級(jí)立方體作一定的操作正確答案:D題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:229、關(guān)于OLAP和OLTP的區(qū)別描述,不正確的是()。A、OLAP主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù).它與OTAP應(yīng)用程序不同B、與OLAP應(yīng)用程序不同,OLTP應(yīng)用程序包含大量相對(duì)簡(jiǎn)單的事務(wù)C、OLAP的特點(diǎn)在于事務(wù)量大,但事務(wù)內(nèi)容比較簡(jiǎn)單且重復(fù)率高D、OLAP是以數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ)的,但其最終數(shù)據(jù)來(lái)源與OLTP一樣均來(lái)自底層的數(shù)據(jù)庫(kù)系統(tǒng),兩者面對(duì)的用戶是相同的正確答案:C題型:?jiǎn)芜x題客觀題分值2分難度:簡(jiǎn)單得分:230、關(guān)于OLAP的特性,下面正確的是()。(1)快速性(2)可分析性(3)多維性(4)信息性(5)共享性A、(1)(2)(3)B、(2)(3)(4)C、(1)(2)(3)(4)D、(1)(2)(3)(4)(5)正確答案:D填空題題型:填空題客觀題答案不允許亂序分值5分難度:簡(jiǎn)單得分:51、相關(guān)性分析有第1空分值:2分第2空分值:2分第3空分值:2分第4空分值:2分第5空分值:2分正確答案:提升度;杠桿度;皮爾森相關(guān)系數(shù);IS度量;確信度題型:填空題客觀題答案不允許亂序分值2分難度:簡(jiǎn)單得分:22、項(xiàng)集包含或_項(xiàng)的集合第1空分值:2分第2空分值:2分正確答案:0個(gè);多個(gè)題型:填空題客觀題答案不允許亂序分值5分難度:簡(jiǎn)單得分:53、回歸分析的步驟。第1空分值:2分第2空分值:2分第3空分值:2分第4空分值:2分第5空分值:2分正確答案:確定變量;建立預(yù)測(cè)模型;進(jìn)行相關(guān)分析;計(jì)算預(yù)測(cè)誤差;確定預(yù)測(cè)值題型:填空題客觀題答案不允許亂序分值2分難度:簡(jiǎn)單得分:24、變量之間的關(guān)系可分為第1空分值:2分第2空分值:2分正確答案:確定性關(guān)系;非確定性關(guān)系題型:填空題客觀題答案不允許亂序分值3分難度:簡(jiǎn)單得分:35、多維數(shù)據(jù)模型主要分為。第1空分值:2分第2空分值:2分第3空分值:2分正確答案:星型模型;雪花模型;事實(shí)星座模型簡(jiǎn)答題題型:簡(jiǎn)答題主觀題分值6分難度:簡(jiǎn)單得分:61、變量間的確定性關(guān)系和非確定性關(guān)系分別指的是什么?正確答案:①變量間的確定性關(guān)系:確定性關(guān)系是指當(dāng)一些變量的值確定以后另一些變量的值也隨之完全確定的關(guān)系,這些變量間的關(guān)系完全是已知的,變量之間的關(guān)系可以用函數(shù)關(guān)系來(lái)表示。②變量間的非確定性關(guān)系:非確定性關(guān)系是指變量之間有一定的依賴關(guān)系,變量之間雖然相互影響和相互制約,但由于受到無(wú)法預(yù)計(jì)和控制的因素的影響,使得變量間的關(guān)系呈現(xiàn)不確定性,當(dāng)一些變量的值確定以后,另一些變量值雖然隨之變化,卻不能完全確定,這時(shí)變量間的關(guān)系就不可以精確地用函數(shù)來(lái)表示。題型:簡(jiǎn)答題主觀題分值7分難度:簡(jiǎn)單得分:72、簡(jiǎn)述數(shù)據(jù)倉(cāng)庫(kù)概念模型與邏輯模型的設(shè)計(jì)步驟。正確答案:數(shù)據(jù)倉(cāng)庫(kù)概念模型設(shè)計(jì)步驟:①界定系統(tǒng)邊界,即全方位了解任務(wù)和環(huán)境,充分理解需求,繪制大致的系統(tǒng)邊界。也就是完成數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)設(shè)計(jì)的需求分析。②確定主要的主題域,完成對(duì)一些屬性、主題域公共碼以及主題域之間聯(lián)系的描述工作,其中的屬性能夠清楚、充分地代表主題。③細(xì)分具體內(nèi)容及確定分析維度,維元素對(duì)應(yīng)的是分析角度,通常是一些離散型的數(shù)據(jù);度量對(duì)應(yīng)的是指標(biāo),實(shí)際使用中要根據(jù)指標(biāo)的存儲(chǔ)和查詢使用的頻度,來(lái)判斷分析指標(biāo)屬于維元素還是維屬性。數(shù)據(jù)倉(cāng)庫(kù)邏輯模型設(shè)計(jì)步驟:①分析主題域,確定要裝載到數(shù)據(jù)倉(cāng)庫(kù)的主題;②粒度層次劃分,通過(guò)估計(jì)數(shù)據(jù)量和所需的存儲(chǔ)設(shè)備來(lái)確定粒度劃分方案;③確定數(shù)據(jù)分隔策略,將邏輯上整體的數(shù)據(jù)分割成較小的、可以獨(dú)立管理的物理單元進(jìn)行存儲(chǔ);④定義關(guān)系模式,概念設(shè)計(jì)階段時(shí),基本的主題已經(jīng)確定,在邏輯模型設(shè)計(jì)階段,要將主題劃分成多個(gè)表,并確定表的結(jié)構(gòu)。邏輯模型設(shè)計(jì)的關(guān)鍵是細(xì)化主題劃分,并建立維度模型,主要的工作是進(jìn)行事實(shí)表模型設(shè)計(jì)和維表模型設(shè)計(jì)。題型:簡(jiǎn)答題主觀題分值10分難度:困難得分:103、【案例分析題】某公司存儲(chǔ)員工信息的數(shù)據(jù)庫(kù)中表示收入的字段income排序后的值(元)為:900,1000,1300,1600,1600,1900,2000,2400,2600,2900,3000,3600,4000,4600,4900,5000。1.按照等深分箱法進(jìn)行分箱。2.按照等寬分箱法進(jìn)行分箱。正確答案:1.等深分箱法:設(shè)定權(quán)重(箱子深度)為4,分箱后有:箱1:900,1000,1300,1600箱2:1600,1900,2000,2400箱3:2600,2900,3000,3600箱4:4000,4600,4900,5000使用平均值平滑結(jié)果為:箱1:1200,1200,1200,1200箱2:1975,19

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論