北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1_第1頁
北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1_第2頁
北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1_第3頁
北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1_第4頁
北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

北外大數(shù)據(jù)分析入門網(wǎng)考復(fù)習(xí)答案1答案一、單選題(每題2分,共60分)12345678910DBBBBBBDCD11121314151617181920ADCCACABBA21222324252627282930BDBDCDDBCC二、是非題(每題0.5分,共10分)12345678910TFTFFFTTFF11121314151617181920TTFFTTTFTF三、問答題(每題10分,共30分)1.《數(shù)據(jù)分析報(bào)告》結(jié)論和建議部分編寫的注意事項(xiàng)是什么?答案:《數(shù)據(jù)分析報(bào)告》結(jié)論和建議負(fù)責(zé)得出結(jié)論、提出建議、解決矛盾(得2分),結(jié)論編寫應(yīng)措辭嚴(yán)謹(jǐn)、準(zhǔn)確、鮮明(每點(diǎn)得2分,計(jì)6分);其建議部分應(yīng)畫龍點(diǎn)睛(得2分):大部分決策者沒有時(shí)間通讀分析報(bào)告,但決策過程中報(bào)告的結(jié)論和建議等章節(jié)將會被重點(diǎn)閱讀。2.請說明相關(guān)分析和回歸分析的相同點(diǎn)和不同點(diǎn)都有什么?答案:相同點(diǎn):相關(guān)分析和回歸分析能分析出多個(gè)變量之間的關(guān)系,從而分析目標(biāo)變量未來的發(fā)展變化趨勢,是預(yù)測方法之一(得2分)。不同點(diǎn)一:相關(guān)分析研究的是隨機(jī)變量,不分自變量、因變量;(得2分)而回歸分析有自變量X和因變量Y之分,其中自變量X是普通變量,因變量Y是隨機(jī)變量。(得2分)不同點(diǎn)二:相關(guān)分析主要描述兩變量之間線性關(guān)系的緊密程度;(得2分)而回歸分析不僅揭示變量X對因變量Y的影響大小,還由回歸模型進(jìn)行預(yù)測。(得2分)3.針對大數(shù)據(jù)如何進(jìn)行相關(guān)分析?答案:相關(guān)分析步驟:1、根據(jù)預(yù)測目標(biāo),確定自變量和因變量;(得2分)2、收集整理數(shù)據(jù)形成相關(guān)表:收集整理兩變量數(shù)據(jù)形成相關(guān)表,相關(guān)表中自變量可以是數(shù)據(jù)直接進(jìn)行排序,也可以是個(gè)分組。(得2分)3、繪制散點(diǎn)圖/折線圖,確定相關(guān)模型類型;通過折線圖查看自變量對因變量的影響。(得2分)4、設(shè)置分析對象,對相關(guān)模型進(jìn)行檢驗(yàn)。(得2分)5、相關(guān)系數(shù)來進(jìn)行相關(guān)分析:函數(shù)計(jì)算r,分析兩變量的相關(guān)系數(shù)利用相關(guān)系數(shù)r分析數(shù)據(jù)相關(guān)性。(得2分)大數(shù)據(jù)分析入門(知識要點(diǎn))課程編號:BWCST3008學(xué)籍號:______________________學(xué)習(xí)中心:______________________姓名:______________________注意事項(xiàng):1、本試卷滿分100分,考試時(shí)間90分鐘;2、請將答案一律寫在答題紙上。一、單選題(每題2分,共60分)1.用戶提取大數(shù)據(jù)分析結(jié)果,可以不使用或使用()等工具。A、ExcelB、TableauC、數(shù)據(jù)庫SQLServerD、運(yùn)行在亞馬遜EC2彈性MapReduce計(jì)算云2.以下關(guān)于大數(shù)據(jù)說法中,不正確的是()。A、大數(shù)據(jù)和大數(shù)據(jù)分析是研究大量的數(shù)據(jù)的過程中尋找模式,相關(guān)性和其他有用的信息,可以幫助企業(yè)更好地適應(yīng)變化,并做出更明智的決策。B、大數(shù)據(jù)級別的容量可能是TB、PB、YB、BB、DBC、大數(shù)據(jù)通常是萬億或EB,可能收集自傳感器、氣候信息、公開信息(如雜志報(bào)紙文章)、或購買交易記錄、網(wǎng)絡(luò)日志、病歷、軍事監(jiān)控、視頻和圖像檔案、大型電子商務(wù)大數(shù)據(jù)……D、大數(shù)據(jù)中,價(jià)值密度通常較低,如果能夠合理利用并正確、準(zhǔn)確地分析,將會帶來很高的價(jià)值回報(bào)。3.()能夠展示單個(gè)數(shù)據(jù)變量的分布情況。A、二維餅圖B、直方圖型柱形圖C、雷達(dá)圖D、散點(diǎn)圖4.RobertG.Brown提出指數(shù)平滑法,建立在一定的假設(shè)為前提下才能有效發(fā)揮預(yù)測作用。以下前提中,不適用于指數(shù)平滑的時(shí)間預(yù)測方法的是()。A、時(shí)間序列的態(tài)勢具有穩(wěn)定性,時(shí)間序列才能被合理地猜測。B、過去態(tài)勢會持續(xù)到未來,所以將較大的關(guān)注放在時(shí)間序列中較遠(yuǎn)的數(shù)據(jù)上。C、最近的過去態(tài)勢,某種程度上會持續(xù)到未來,所以將較大的關(guān)注放在最近數(shù)據(jù)上。D、時(shí)間序列的態(tài)勢具有規(guī)則性,時(shí)間序列才能被合理地順勢推延。5.()是指兩個(gè)有聯(lián)系的指標(biāo)對比計(jì)算而得到的數(shù)值,用于反映客觀現(xiàn)象之間數(shù)量聯(lián)系程度的綜合指標(biāo)。A、絕對數(shù)B、相對數(shù)C、眾數(shù)D、均值6.大數(shù)據(jù)整理需要經(jīng)過無數(shù)次對海量數(shù)據(jù)的()處理才能得到一個(gè)簡潔結(jié)果。A、收集整理B、甄別真?zhèn)蜟、邏輯運(yùn)算及其分析匯總D、論證檢查7.數(shù)據(jù)的直方圖分析屬于數(shù)據(jù)分析法中的()種分析。A、推斷統(tǒng)計(jì)分析工具B、描述性分析工具C、數(shù)據(jù)預(yù)測分析工具D、假設(shè)檢驗(yàn)分析工具8.以下判斷數(shù)據(jù)間關(guān)系的相關(guān)系數(shù)r的若干說法中,不正確的是()。A、相關(guān)系數(shù)r反映變量間線性相關(guān)強(qiáng)度,是相關(guān)性的度量指標(biāo)B、相關(guān)系數(shù)r取值范圍[-1,1]C、關(guān)系數(shù)r的正負(fù)號能反映相關(guān)方向,大于零代表正相關(guān),小于零代表負(fù)相關(guān)。D、相關(guān)系數(shù)r大小可以反映相關(guān)程度,r越大則相關(guān)性越弱。9.線性相關(guān)中,一個(gè)數(shù)值變化時(shí),另一現(xiàn)象會有若干數(shù)值與之對應(yīng)變化,并遵循一定規(guī)律,圍繞若干數(shù)值的上下波動,其原因是影響現(xiàn)象變化的因素的數(shù)目()。A、為零B、為一個(gè)C、不止一個(gè)D、上述答案都不對10.24小時(shí)內(nèi)血壓動態(tài)監(jiān)測儀獲得的血壓監(jiān)測數(shù)據(jù)屬于以下數(shù)據(jù)分析類的()數(shù)據(jù)。A、縱向比較B、橫向比較C、分類比較D、動態(tài)分析11.為了分析運(yùn)動量A和燃脂速度C之間的關(guān)系,C會隨A的提高而的增高,遵循明顯規(guī)律,二者屬于()關(guān)系。A、函數(shù)相關(guān)B、復(fù)相關(guān)C、強(qiáng)相關(guān)D、不相關(guān)12.時(shí)間序列預(yù)測,簡單地說,是根據(jù)事件發(fā)展來預(yù)測未來發(fā)展。關(guān)于該方法的說法中,不正確的是它()。A、假設(shè)事物發(fā)展趨勢會延伸到未來B、預(yù)測所依據(jù)的數(shù)據(jù)具有不規(guī)則性C、不考慮事物發(fā)展之間的因果關(guān)系D、不考慮社會因素和突發(fā)事件13.相關(guān)關(guān)系分析的相關(guān)程度不包括()。A、完全相關(guān)B、不完全相關(guān)C、函數(shù)相關(guān)D、不相關(guān)14.為了廣告費(fèi)A和產(chǎn)品利潤B是否存在關(guān)系,但從數(shù)據(jù)表面上無法確定具體關(guān)系,并非嚴(yán)格遵循A升高多大比例,B也升高相應(yīng)程度,二者屬于()關(guān)系。A、比例B、復(fù)數(shù)C、相關(guān)D、函數(shù)15.一個(gè)數(shù)據(jù)分布的鋒度系數(shù)為()時(shí),該數(shù)據(jù)分布曲線更趨近于平均分布。A、-1.12B、-0.13C、0.02D、1.216.在數(shù)據(jù)分布的描述分析上,平均值和眾數(shù)決定了數(shù)據(jù)分布是否遵循正態(tài)分布分析中,數(shù)值測度的()。A、分布形狀B、離散程度C、集中趨勢D、有效性17.在數(shù)據(jù)分布的描述分析上,偏度和峰度決定了數(shù)據(jù)分布是否遵循正態(tài)分布分析中,數(shù)值測度的()。A、分布形狀B、相關(guān)系數(shù)C、集中趨勢D、有效性18.大數(shù)據(jù)分析結(jié)果的表現(xiàn)形式中,直觀描述3個(gè)變量間關(guān)系則應(yīng)該選擇()。A、散點(diǎn)圖B、氣泡圖C、柱形圖D、餅圖19.()能有效預(yù)測房地產(chǎn)開發(fā)中存在的風(fēng)險(xiǎn),及時(shí)提醒規(guī)避。A、相關(guān)分析B、回歸分析C、描述統(tǒng)計(jì)分析D、對比分析20.2016年3月,特朗普在阿拉巴馬、阿肯色、喬治亞、馬薩諸塞、田納西、佛蒙特和維吉尼亞這7個(gè)州得票領(lǐng)先,但在得克薩斯、科羅拉多和俄克拉荷馬敗給克魯茲,在明尼蘇達(dá)州落后于盧比奧,得票率在共和黨內(nèi)處于領(lǐng)先地位,這樣的數(shù)據(jù)分析方法稱為()。A、橫向比較B、縱向比較C、分組分析D、結(jié)構(gòu)分析21.為了調(diào)研商品毛重量A、運(yùn)輸距離B和運(yùn)輸成本C的關(guān)系,分析數(shù)據(jù)確定三者的具體關(guān)系,遵循一定變化規(guī)律,三者屬于()關(guān)系。A、函數(shù)相關(guān)B、復(fù)相關(guān)C、線性相關(guān)D、非線性相關(guān)22.以下有關(guān)PowerPivot的說法中,不正確的是()。A、PowerPivot整合多數(shù)據(jù)源:能從Web服務(wù)、文本文件、關(guān)系型數(shù)據(jù)庫等任何數(shù)據(jù)源導(dǎo)入數(shù)據(jù);B、PowerPivot處理海量數(shù)據(jù):支持大數(shù)據(jù)性能卓越,幾百萬行數(shù)據(jù)集就如處理幾百行一樣出色C、PowerPivot操作簡潔,熟悉Excel就能用PPD、PP實(shí)現(xiàn)任意平臺、任意系統(tǒng)的無邊界信息共享,并不局限于PPforSharePoint共享和發(fā)布上網(wǎng),還能兼容任何數(shù)據(jù)庫平臺的任何共享操作。23.2015年末中國大陸總?cè)丝?37462萬人,其中,男性人口70414萬人,女性人口67048萬人。男女性別比為1.28:1該“男女性別比”屬于()數(shù)據(jù)。A、絕對數(shù)B、相對數(shù)C、眾數(shù)D、均值24.國際連鎖百貨零售企業(yè)大數(shù)據(jù)挖掘中,使用()能找出如何通過交叉銷售得到更大收入。A、回歸分析B、描述性分析C、抽樣調(diào)查D、關(guān)聯(lián)分析25.數(shù)據(jù)的相關(guān)分析屬于()類型的數(shù)據(jù)分析方法。A、客觀描述分析B、直方圖分析C、推斷預(yù)測分析D、抽樣分析26.指數(shù)平滑法中選擇加權(quán)的阻尼系數(shù)需要根據(jù)一定經(jīng)驗(yàn)做范圍選擇,因此,面對時(shí)間數(shù)據(jù)序列曲線波動較平穩(wěn),應(yīng)選擇阻尼系數(shù)區(qū)間()更合適。A、[0.05~0.2]B、[0.3~0.5]C、[0.6~0.8]D、[0.8~0.95]27.以下關(guān)于數(shù)據(jù)準(zhǔn)備階段的數(shù)據(jù)清洗工作的說法中,存在問題的選項(xiàng)是()。A、數(shù)據(jù)清洗是數(shù)據(jù)分析前必不可少階段。B、數(shù)據(jù)清洗提供簡潔、完整、正確的數(shù)據(jù)給后續(xù)數(shù)據(jù)加工。C、數(shù)據(jù)清洗原則是“多一分則肥,少一分則瘦”。D、數(shù)據(jù)清洗的目標(biāo)是為數(shù)據(jù)分析提供準(zhǔn)確的、數(shù)量足夠的數(shù)據(jù),因此刪除不合格的數(shù)據(jù)、修改錯(cuò)誤數(shù)據(jù)、填充缺失數(shù)據(jù)是十分必要的。任何數(shù)據(jù)經(jīng)過清洗都適合進(jìn)行數(shù)據(jù)分析。28.數(shù)據(jù)清洗過程中,去除數(shù)據(jù)臟點(diǎn)不包括以下選項(xiàng)中的()的操作。A、清除不必要的重復(fù)數(shù)據(jù)B、修改邏輯錯(cuò)誤的數(shù)據(jù)C、填充缺失數(shù)據(jù)D、檢測邏輯錯(cuò)誤的數(shù)據(jù)29.以下關(guān)于回歸分析的說法中,不正確的是()。A、回歸分析基于觀測數(shù)據(jù),建立變量間適當(dāng)?shù)囊蕾囮P(guān)系,以分析數(shù)據(jù)內(nèi)在規(guī)律,主要用于預(yù)報(bào)、控制等實(shí)際問題。B、歸分析是確定兩種及兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法C、回歸分析研究現(xiàn)象間是否存在依存關(guān)系,并探討依存關(guān)系的相關(guān)方向和相關(guān)程度。D、回歸分析能分析出多個(gè)變量之間的關(guān)系,從而分析目標(biāo)變量未來的發(fā)展變化趨勢。30.某新產(chǎn)品的推廣費(fèi)用和銷售額的相關(guān)系數(shù)=0.213,則該商品的廣告和銷售的關(guān)系屬于()。A、不相關(guān)B、強(qiáng)正相關(guān)C、低度相關(guān)D、中度相關(guān)二、是非題(每題0.5分,共10分)1.大數(shù)據(jù)分析中,若兩個(gè)數(shù)據(jù)變量彼此數(shù)量變化相互獨(dú)立,完全無關(guān),則可以認(rèn)為其關(guān)系為不相關(guān)。2.非線性相關(guān)意味著,當(dāng)給定某現(xiàn)象一個(gè)數(shù)值時(shí),另一現(xiàn)象會有若干數(shù)值與之對應(yīng)變化,并遵循一定規(guī)律波動。3.如果統(tǒng)計(jì)一組大數(shù)據(jù)分布得到鋒度系數(shù)屬于[-1.2~0)區(qū)間,則稱其分布曲線具有平闊峰,這類數(shù)據(jù)分布較為平坦,峰度系數(shù)越趨近于-1.2,則曲線更矮、更胖(平坦)。4.在數(shù)據(jù)分析方法中,橫向比較是通過比較同一事物在不同的時(shí)間的狀態(tài),在不同時(shí)間條件下對事物總體指標(biāo)的靜態(tài)比較,對多種相關(guān)事物同層次的比較,了解其大小、多少和優(yōu)劣,以便為決策提供參考。5.對大數(shù)據(jù)做相關(guān)分析時(shí),相關(guān)系數(shù)r大小可以反映相關(guān)程度,r=0表示變量間存在函數(shù)相關(guān)關(guān)系。6.大數(shù)據(jù)是一個(gè)全新的技術(shù)領(lǐng)域,它不同于計(jì)算機(jī)技術(shù),應(yīng)用統(tǒng)計(jì)學(xué)、管理學(xué)等理論,可以為各種不同的應(yīng)用領(lǐng)域的相關(guān)數(shù)據(jù)提供大數(shù)據(jù)及其分析技術(shù)支持。7.大數(shù)據(jù)經(jīng)過清洗是否可以進(jìn)行數(shù)據(jù)分析,需要統(tǒng)計(jì)臟點(diǎn)出現(xiàn)的概率,如果超過10%的數(shù)據(jù)都是臟點(diǎn)就失去分析價(jià)值了,過高的錯(cuò)誤率使得分析結(jié)果有可能出現(xiàn)不可原諒的錯(cuò)誤。8.數(shù)據(jù)中重復(fù)、錯(cuò)誤、空白和遺失等問題需要在初期統(tǒng)一處理,使用自動化的方法進(jìn)行數(shù)據(jù)準(zhǔn)備不僅效率高,而且自動檢索的處理保證的進(jìn)入分析階段的數(shù)據(jù)質(zhì)量比較高。9.回歸分析有自變量X和因變量Y之分,其中自變量X是隨機(jī)變量,因變量Y是普通變量。10.一組數(shù)據(jù)的描述統(tǒng)計(jì)結(jié)果中,眾數(shù)代表排序后居于所有數(shù)據(jù)的數(shù)值最中間位置的數(shù)值,它不能充分利用已知信息,但衡量時(shí)不受異常值影響,適合作為平均值的輔助參數(shù)之一,開共同衡量數(shù)據(jù)分布的集中趨勢。11.當(dāng)大數(shù)據(jù)分布統(tǒng)計(jì)曲線的集中程度越高,曲線兩側(cè)極端數(shù)據(jù)就相對更少,集中程度超過正態(tài)分布時(shí)峰態(tài)系數(shù)往往高于0。因此數(shù)據(jù)更集中分布在眾數(shù)周圍時(shí)尖削峰分布曲線更高、更瘦,越尖削則峰態(tài)系數(shù)越大。12.數(shù)據(jù)預(yù)測性分析通過分析現(xiàn)有數(shù)據(jù)間的相關(guān)性,探尋數(shù)據(jù)間存在的聯(lián)系,并進(jìn)一步通過建立相關(guān)回歸模型的方式對未來進(jìn)行合理的預(yù)測,因此,預(yù)測性分析屬于展望未來的數(shù)據(jù)分析方式。13.曲面圖是對所選變量之間相關(guān)關(guān)系的一種直觀描述。14.現(xiàn)象之間存在的依存關(guān)系,對于某一變量的每一個(gè)數(shù)值,都有另一變量值與之對應(yīng),該關(guān)系能用一個(gè)數(shù)學(xué)表達(dá)式精確反映出來,這種關(guān)系稱為相關(guān)關(guān)系。15.大數(shù)據(jù)的數(shù)據(jù)集來源可能包括:傳感器、氣候信息、公開信息(如雜志,報(bào)紙,文章)、購買交易記錄、網(wǎng)絡(luò)日志、病歷、軍事監(jiān)控、視頻和圖像檔案及大型電子商務(wù),通常是萬億或EB的大小,龐大而復(fù)雜,需要專門設(shè)計(jì)的硬件和軟件工具進(jìn)行處理。16.回歸分析就是要挖掘出函數(shù)關(guān)系的數(shù)學(xué)模型,可以根據(jù)回歸模型的規(guī)律預(yù)測未來變化。17.調(diào)查問卷具體形式可以是紙質(zhì)調(diào)查問卷,后期數(shù)字化后存儲形成結(jié)構(gòu)化數(shù)據(jù)表,也可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論