商務(wù)數(shù)據(jù)分析測試題_第1頁
商務(wù)數(shù)據(jù)分析測試題_第2頁
商務(wù)數(shù)據(jù)分析測試題_第3頁
商務(wù)數(shù)據(jù)分析測試題_第4頁
商務(wù)數(shù)據(jù)分析測試題_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

商務(wù)數(shù)據(jù)分析測試題簡答題一、商務(wù)數(shù)據(jù)搜集要注意的原則有哪些?為了保證收集工作的有效性和數(shù)據(jù)價(jià)值,需要注意以下幾個(gè)原則:(1)及時(shí)性。注意數(shù)據(jù)的產(chǎn)生時(shí)間,過時(shí)的數(shù)據(jù)解決不了當(dāng)下的問題。(2)全面性。充分考慮到內(nèi)部和外部的數(shù)據(jù)來源,盡量避免幸存者偏差、選擇性偏差等。(3)相關(guān)性。避免犯兩類錯誤:有什么數(shù)據(jù)就用什么數(shù)據(jù),且喜歡復(fù)雜的模型;不進(jìn)行事前調(diào)查,沒有任何基礎(chǔ)就想當(dāng)然的收集數(shù)據(jù)。(4)經(jīng)濟(jì)性。在選擇要分析的商業(yè)指標(biāo)、確定數(shù)據(jù)收集方法以及收集流程的過程中,要將可能產(chǎn)生的效益與花費(fèi)的人力、物力、財(cái)力、時(shí)間等成本進(jìn)行衡量,從而制定更為經(jīng)濟(jì)可行的數(shù)據(jù)收集方案。二、說明商務(wù)數(shù)據(jù)收集的流程數(shù)據(jù)分析人員可以按照如下的流程進(jìn)行操作:(1)定位商業(yè)問題,確定有理有據(jù)的收集指標(biāo)。定位商業(yè)問題的最終目的是要透過現(xiàn)象看本質(zhì),運(yùn)用4W提問法挖掘期望成果和行動之間的因果關(guān)系。(2)考慮指標(biāo)特征,選擇經(jīng)濟(jì)可行的收集方法。確定了要收集的數(shù)據(jù)指標(biāo)后,就需要著手根據(jù)指標(biāo)特征結(jié)合收集成本,考慮獲取數(shù)據(jù)應(yīng)使用的方法。(3)明確任務(wù)分工,制定切實(shí)有效的收集方案。在正式進(jìn)行數(shù)據(jù)收集工作前,應(yīng)明確數(shù)據(jù)收集的指標(biāo)范圍和時(shí)間范圍。接著明確這些數(shù)據(jù)需要從哪些途徑及部門收集,最后確定參與部門和人員配備并落實(shí)為工作方案。(4)建立數(shù)據(jù)規(guī)范,進(jìn)行完整準(zhǔn)確的數(shù)據(jù)檢查數(shù)據(jù)指標(biāo)需對數(shù)據(jù)進(jìn)行唯一性標(biāo)識,并且貫穿之后的數(shù)據(jù)查詢、分析和應(yīng)用,建立數(shù)據(jù)指標(biāo)規(guī)范是為了使后續(xù)工作有一個(gè)可以遵循的原則,也為龐雜的數(shù)據(jù)分析工作確定了可以識別的唯一標(biāo)識。三.說明通過各種渠道收集的原始數(shù)據(jù)存在的問題?原始數(shù)據(jù)主要存在以下幾個(gè)問題:(1)缺失數(shù)據(jù),是指在實(shí)踐過程中因種種原因沒有能夠獲取觀測對象的相關(guān)信息,造成數(shù)據(jù)不完全。(2)異常值數(shù)據(jù),也可稱為離群點(diǎn),是指所獲得的數(shù)據(jù)中與平均值的偏差超過兩倍及兩倍以上標(biāo)準(zhǔn)差的數(shù)據(jù)。(3)重復(fù)數(shù)據(jù),一般分為實(shí)體重復(fù)和字段重復(fù)兩種。其中,實(shí)體重復(fù)是指所有字段完全重復(fù),字段重復(fù)則表示某一個(gè)或多個(gè)不該重復(fù)的字段重復(fù)。(4)冗余數(shù)據(jù),一方面是指多個(gè)數(shù)據(jù)集合并時(shí),同一內(nèi)容不同命名或者編碼,例如某數(shù)據(jù)集中的變量名稱為“用戶編碼”,在另一個(gè)數(shù)據(jù)集中卻為“id”;另一方面也指數(shù)據(jù)集中的2個(gè)或多個(gè)變量之間存在相關(guān)或者推導(dǎo)關(guān)系。冗余數(shù)據(jù)會造成數(shù)據(jù)重復(fù)或分析結(jié)果產(chǎn)生偏差。(5)不一致數(shù)據(jù),一般表現(xiàn)為3個(gè)方面的問題:一是人為/機(jī)械原因?qū)е碌匿浫脲e誤或者數(shù)據(jù)規(guī)范不同;二是變量單位或者量綱不匹配;三是數(shù)據(jù)特征不適應(yīng)特定數(shù)據(jù)分析模型的需求或變量過多分析難度較大。四、分析數(shù)據(jù)集數(shù)列,哪些指標(biāo)可以測度數(shù)據(jù)的集中趨勢?答:測度數(shù)據(jù)的集中趨勢的指標(biāo)可分為數(shù)值平均數(shù)和位置代表值兩大類。數(shù)據(jù)平均數(shù)主要包括算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù);位置代表值主要有中位數(shù)和眾數(shù)。數(shù)列的算術(shù)平均數(shù)為15,調(diào)和平均數(shù)為5.14,幾何平均數(shù)10.50,中位數(shù)為13,沒有眾數(shù)。論述題一、二手?jǐn)?shù)據(jù)的收集方法有哪些?舉例說明。二手?jǐn)?shù)據(jù)包括內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)兩種。(1)內(nèi)部數(shù)據(jù)內(nèi)部數(shù)據(jù)來自于組織內(nèi)部,因其他目的而收集。內(nèi)部數(shù)據(jù)的收集來源為業(yè)務(wù)資料、統(tǒng)計(jì)資料、數(shù)據(jù)庫等(企業(yè)數(shù)據(jù)庫、部門溝通等),收集方法包括報(bào)表收集、數(shù)據(jù)庫收集、系統(tǒng)日志數(shù)據(jù)收集等。①報(bào)表收集。報(bào)表收集是指企業(yè)可以通過相關(guān)業(yè)務(wù)部門每日、周的工作報(bào)表進(jìn)行數(shù)據(jù)收集,如銷售明細(xì)、出入庫清單、客服記錄等。②數(shù)據(jù)庫收集。數(shù)據(jù)庫收集是指企業(yè)將數(shù)據(jù)庫收集系統(tǒng)直接對接到業(yè)務(wù)后臺服務(wù)器,業(yè)務(wù)后臺每時(shí)每刻產(chǎn)生的大量業(yè)務(wù)記錄即可寫入到數(shù)據(jù)庫中,最后由特定的處理系統(tǒng)進(jìn)行數(shù)據(jù)分析。③系統(tǒng)日志數(shù)據(jù)收集。系統(tǒng)日志數(shù)據(jù)收集主要針對互聯(lián)網(wǎng)上的商務(wù)活動。網(wǎng)站日志會記錄訪客IP地址、訪問時(shí)間、訪問次數(shù)、停留時(shí)間、訪客來源等數(shù)據(jù)。通過對這些日志信息進(jìn)行收集、分析,可以挖掘企業(yè)業(yè)務(wù)平臺日志數(shù)據(jù)中的潛在價(jià)值。(2)外部數(shù)據(jù)外部數(shù)據(jù)是指從組織外部獲得的二手?jǐn)?shù)據(jù)。外部數(shù)據(jù)的收集來源為公開出版的資料、計(jì)算機(jī)數(shù)據(jù)庫、其它來自互聯(lián)網(wǎng)的資料(網(wǎng)站日志、第三方平臺統(tǒng)計(jì)、互聯(lián)網(wǎng)檢索、網(wǎng)絡(luò)爬蟲等),收集方法包括文獻(xiàn)收集、網(wǎng)頁數(shù)據(jù)收集等。文獻(xiàn)收集即通過政府部門、機(jī)構(gòu)協(xié)會、新聞媒體、出版社等發(fā)布的統(tǒng)計(jì)收據(jù)、行業(yè)調(diào)查報(bào)告、新聞報(bào)道、出版物。案例分析:日期周一周二周三周四周五周六周日銷售額(元)5063505250325009504334323607假設(shè)你是某家公司的分析師,表中所示為該公司B2C電子網(wǎng)站一周的銷售數(shù)據(jù),該網(wǎng)站主要用戶群是辦公室,女性為主銷售額集中在五種產(chǎn)品以上。(1)從圖中你看出了什么問題?從這一周的數(shù)據(jù)可以看出,周末的銷售額明顯偏低。這其中的原因可以從兩個(gè)角度來分析:站在消費(fèi)者的角度來看,周末可能不用上班,因而也沒有購買該產(chǎn)品的欲望;站在產(chǎn)品的角度來看,該產(chǎn)品不能在周末的時(shí)候引起消費(fèi)者足夠的注意力。如果要求你提出一個(gè)運(yùn)營改進(jìn)建議,你會怎么做?針對該問題背后的兩方面原因,運(yùn)營改進(jìn)計(jì)劃也分兩方面:一是針對消費(fèi)者周末沒有購買欲望的心理,引導(dǎo)提醒消費(fèi)者周末就應(yīng)該準(zhǔn)備好該產(chǎn)品:二是通過該產(chǎn)品的一些類似于打折促銷的活動來提升該產(chǎn)品在周末的人氣和購買力。案例分析2對超市某月會員消費(fèi)情況進(jìn)行統(tǒng)計(jì)后發(fā)現(xiàn),數(shù)據(jù)表中存在缺失值、異常值和重復(fù)值,如表所示,空白單元格為缺失數(shù)據(jù),填充底紋數(shù)據(jù)為異常值,請論述如何進(jìn)行數(shù)據(jù)清洗處理?可做如下數(shù)據(jù)清洗:(1)對于缺失值,id為A002的會員缺失信息過多,在分析線上消費(fèi)金額字段時(shí)可參與運(yùn)算,在分析其他字段時(shí)可考慮刪除改行。id為A001的會員線上消費(fèi)金額缺失,需追溯數(shù)據(jù)源,在這里也可通過公式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論