《新媒體數(shù)據(jù)分析與應(yīng)用》新媒體數(shù)據(jù)的處理_第1頁(yè)
《新媒體數(shù)據(jù)分析與應(yīng)用》新媒體數(shù)據(jù)的處理_第2頁(yè)
《新媒體數(shù)據(jù)分析與應(yīng)用》新媒體數(shù)據(jù)的處理_第3頁(yè)
《新媒體數(shù)據(jù)分析與應(yīng)用》新媒體數(shù)據(jù)的處理_第4頁(yè)
《新媒體數(shù)據(jù)分析與應(yīng)用》新媒體數(shù)據(jù)的處理_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

新媒體數(shù)據(jù)的處理是指在分析數(shù)據(jù)之前,先對(duì)數(shù)據(jù)進(jìn)行一定的清洗和加工,主要目的是清除異常數(shù)據(jù)、糾正錯(cuò)誤數(shù)據(jù)等,以保證數(shù)據(jù)的準(zhǔn)確性、完整性,這樣得出的數(shù)據(jù)分析結(jié)果才更科學(xué)、更有參考價(jià)值。本章將詳細(xì)介紹新媒體數(shù)據(jù)清洗、數(shù)據(jù)加工等方面的知識(shí)。新媒體數(shù)據(jù)的處理數(shù)據(jù)清洗3.1目錄CONTENTS數(shù)據(jù)加工3.2數(shù)據(jù)清洗3.1數(shù)據(jù)清洗是指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識(shí)別的錯(cuò)誤,包括檢查數(shù)據(jù)一致性,處理無(wú)效值和缺失值等。新媒體運(yùn)營(yíng)者可以使用Excel來(lái)開(kāi)展數(shù)據(jù)清洗工作。3.1.1缺失值的處理缺失值是指數(shù)據(jù)集中某個(gè)或某些屬性不完全的值。缺失值產(chǎn)生的原因有很多,基本上可以分為機(jī)械原因和人為原因。機(jī)械原因是指由于數(shù)據(jù)收集或保存失敗造成的數(shù)據(jù)缺失。人為原因主要是指由于歷史局限、有意隱瞞或主觀失誤造成的數(shù)據(jù)缺失。3.1.1缺失值的處理處理缺失值的方式替換缺失值某些缺失值可以從本數(shù)據(jù)源或其他數(shù)據(jù)源中推導(dǎo)出來(lái),然后用樣本平均值、中位數(shù)或眾數(shù)代替缺失值。還有一種方法,就是根據(jù)調(diào)查對(duì)象給出的其他問(wèn)題的答案,通過(guò)分析變量間的相關(guān)性或邏輯關(guān)系進(jìn)行推導(dǎo)與估算。刪除整個(gè)樣本刪除整個(gè)樣本,就是將含有缺失值的某個(gè)樣本全部刪除。這種方法只適合某個(gè)樣本中缺失關(guān)鍵變量的情況,或者是含有無(wú)效值、缺失值的樣本的重要性較低的情況。刪除變量如果調(diào)查結(jié)果中某個(gè)變量的缺失值較多,且該變量在所研究的問(wèn)題中所占的權(quán)重較小,就可以考慮刪除該變量。成對(duì)刪除成對(duì)刪除是指不改變數(shù)據(jù)集中的全部變量和樣本,而將其中的缺失值用一個(gè)特殊碼(通常是9、99、999等)來(lái)表示。成對(duì)刪除是一種比較保守的處理缺失值的方法,它能讓樣本中的可用數(shù)據(jù)得到最大限度的保留。3.1.1缺失值的處理缺失值的查找與替換在數(shù)據(jù)表中,缺失值最常見(jiàn)的表現(xiàn)形式就是空值或錯(cuò)誤標(biāo)識(shí)符,下面介紹使用Excel2016查找并替換缺失值的方法。3.1.2重復(fù)值的處理重復(fù)值就是數(shù)據(jù)表中被重復(fù)輸入的數(shù)據(jù)。30天內(nèi)某直播間各款商品的銷(xiāo)量和銷(xiāo)售額3.1.2重復(fù)值的處理使用“刪除重復(fù)項(xiàng)”功能查找并刪除重復(fù)值“刪除重復(fù)項(xiàng)”是Excel2016提供的數(shù)據(jù)去重功能,新媒體運(yùn)營(yíng)者使用這一功能可以快速刪除重復(fù)項(xiàng),方法如下。3.1.2重復(fù)值的處理使用“排序”功能查找并刪除重復(fù)值使用Excel2016的“排序”功能也可以查找重復(fù)值。使用這種方法查找到重復(fù)值后,新媒體運(yùn)營(yíng)者要先判斷重復(fù)值是否有用,無(wú)用的重復(fù)值可以刪除。例如,在統(tǒng)計(jì)人員信息時(shí),可能會(huì)出現(xiàn)人名相同的情況,出現(xiàn)這種情況的原因可能是有的人同姓同名,也可能是重復(fù)錄入,此時(shí)就需要新媒體運(yùn)營(yíng)者先進(jìn)行判斷,再對(duì)重復(fù)數(shù)據(jù)進(jìn)行處理。使用“排序”功能查找并刪除重復(fù)值的方法如下。3.1.2重復(fù)值的處理使用“條件格式”功能查找并刪除重復(fù)值使用Excel2016的“條件格式”功能可以快速查找并標(biāo)識(shí)出重復(fù)值。使用“條件格式”功能查找并刪除重復(fù)值的方法如下。3.1.3數(shù)據(jù)邏輯性檢查數(shù)據(jù)邏輯性檢查是指將不符合邏輯的數(shù)據(jù)查找出來(lái),并采取合適的方法進(jìn)行處理。DOU+投放7日花費(fèi)3.1.3數(shù)據(jù)邏輯性檢查使用“條件格式”檢查數(shù)據(jù)邏輯性使用“條件格式”檢查數(shù)據(jù)邏輯性的方法如下。3.1.3數(shù)據(jù)邏輯性檢查使用函數(shù)檢查數(shù)據(jù)邏輯性下面使用Excel2016中的IF函數(shù)判斷數(shù)據(jù)的邏輯是否正確,方法如下。數(shù)據(jù)加工3.2通過(guò)數(shù)據(jù)清洗環(huán)節(jié),新媒體運(yùn)營(yíng)者找到并處理了數(shù)據(jù)中的錯(cuò)誤值。接下來(lái)要根據(jù)數(shù)據(jù)分析的目的對(duì)數(shù)據(jù)進(jìn)行加工,如對(duì)數(shù)據(jù)進(jìn)行計(jì)算等,讓數(shù)據(jù)更好地滿足數(shù)據(jù)分析的需要。3.2.1數(shù)據(jù)計(jì)算在數(shù)據(jù)表中,有些數(shù)據(jù)并不能直接從數(shù)據(jù)表中提取出來(lái),而需要經(jīng)過(guò)計(jì)算才能獲得。5款商品24小時(shí)的推廣效果3.2.1數(shù)據(jù)計(jì)算簡(jiǎn)單計(jì)算簡(jiǎn)單計(jì)算就是對(duì)字段進(jìn)行加、減、乘、除等簡(jiǎn)單計(jì)算,從而得到符合需求的數(shù)據(jù)。商品利潤(rùn)的計(jì)算公式為:利潤(rùn)=單價(jià)×銷(xiāo)量-單件成本×銷(xiāo)量-推廣費(fèi)用。根據(jù)利潤(rùn)計(jì)算公式,在Excel2016中計(jì)算每款商品利潤(rùn)的方法如下。3.2.1數(shù)據(jù)計(jì)算函數(shù)計(jì)算在計(jì)算5款商品24小時(shí)產(chǎn)生的總利潤(rùn)時(shí),雖然可以使用公式“=F2+F3+F4+F5+F6”來(lái)計(jì)算,但如果商品的數(shù)量較多,如有50款商品,再用這種輸入公式的方法計(jì)算就會(huì)比較麻煩,此時(shí)新媒體運(yùn)營(yíng)者可以使用Excel中的函數(shù)進(jìn)行數(shù)據(jù)計(jì)算。在Excel中,新媒體運(yùn)營(yíng)者可以快速插入常用的函數(shù),如求和、平均值、計(jì)數(shù)、最大值、最小值等函數(shù)。下面使用求和函數(shù)計(jì)算總利潤(rùn),方法如下。3.2.2數(shù)據(jù)分組數(shù)據(jù)分組就是按照一定的標(biāo)準(zhǔn)將數(shù)據(jù)劃分為不同的組別,從而判斷數(shù)據(jù)的表現(xiàn)情況,然后根據(jù)數(shù)據(jù)的表現(xiàn)情況對(duì)數(shù)據(jù)進(jìn)行分析。5月份各款商品在直播間產(chǎn)生的銷(xiāo)量3.2.2數(shù)據(jù)分組使用Excel中的VLOOKUP函數(shù)對(duì)商品進(jìn)行分類(lèi)的方法如下。3.2.3數(shù)據(jù)抽取數(shù)據(jù)抽取分為兩種情況:一種是從某個(gè)字段中抽取部分?jǐn)?shù)據(jù);另一種是從不同的數(shù)據(jù)表中抽取多個(gè)字段,并組成新的數(shù)據(jù)表。數(shù)據(jù)抽取是指從原有數(shù)據(jù)中抽取部分?jǐn)?shù)據(jù)作為數(shù)據(jù)分析的對(duì)象。3.2.3數(shù)據(jù)抽取從某個(gè)字段中抽取部分?jǐn)?shù)據(jù)一個(gè)字段可能包含多層信息,而有些數(shù)據(jù)分析只需使用該字段中的某一層信息即可,此時(shí)就需要新媒體運(yùn)營(yíng)者從該字段中抽取需要用到的那層信息。新品銷(xiāo)量統(tǒng)計(jì)3.2.3數(shù)據(jù)抽取從某個(gè)字段中抽取部分?jǐn)?shù)據(jù)在Excel2016中進(jìn)行數(shù)據(jù)抽取時(shí),可以使用LEFT函數(shù)和RIGHT函數(shù)。LEFT函數(shù)是從文本字符串的左側(cè)第一個(gè)字符開(kāi)始,截取指定數(shù)目的字符;RIGHT函數(shù)是從文本字符串的右側(cè)第一個(gè)字符開(kāi)始,截取指定數(shù)目的字符。使用LEFT函數(shù)抽取“推廣人員類(lèi)型”這一層信息的方法如下。3.2.3數(shù)據(jù)抽取從不同的數(shù)據(jù)表中抽取多個(gè)字段新媒體運(yùn)營(yíng)者在采集數(shù)據(jù)時(shí)可能會(huì)采集到多個(gè)數(shù)據(jù)表,而在進(jìn)行數(shù)據(jù)分析時(shí),所需要的數(shù)據(jù)可能來(lái)自不同的數(shù)據(jù)表,此時(shí)就需要從數(shù)據(jù)表中抽取需要的字段。直播運(yùn)營(yíng)團(tuán)隊(duì)人員職務(wù)表主播和副播7日銷(xiāo)售成績(jī)3.2.3數(shù)據(jù)抽取從不同的數(shù)據(jù)表中抽取多個(gè)字段使用VLOOKUP函數(shù)從不同的數(shù)據(jù)表中抽取字段的方法如下。3.2.4數(shù)據(jù)轉(zhuǎn)換新媒體運(yùn)營(yíng)者在進(jìn)行數(shù)據(jù)分析前,要確定所采集到的數(shù)據(jù)的統(tǒng)計(jì)形式是否便于開(kāi)展數(shù)據(jù)分析,如數(shù)據(jù)表中行與列的字段設(shè)置是否得當(dāng),數(shù)據(jù)的記錄方式是否統(tǒng)一等。如果數(shù)據(jù)的統(tǒng)計(jì)形式不符合要求,就需要對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換。3.2.4數(shù)據(jù)轉(zhuǎn)換行列互換新媒體運(yùn)營(yíng)者要分析數(shù)據(jù)表中行與列的字段設(shè)置是否得當(dāng),以便于后續(xù)開(kāi)展數(shù)據(jù)分析。某個(gè)美食類(lèi)抖音賬號(hào)的各條短視頻數(shù)據(jù)3.2.4數(shù)據(jù)轉(zhuǎn)換行列互換在Excel2016中進(jìn)行行列轉(zhuǎn)換的方法如下。3.2.4數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)記錄方式的轉(zhuǎn)換數(shù)據(jù)統(tǒng)計(jì)者不同、統(tǒng)計(jì)標(biāo)準(zhǔn)不同,可能會(huì)導(dǎo)致數(shù)據(jù)記錄方式不同。用戶(hù)是否曾經(jīng)在直播間購(gòu)物的統(tǒng)計(jì)結(jié)果3.2.4數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)記錄方式的轉(zhuǎn)換使用查找、替換方式對(duì)數(shù)據(jù)記錄方式進(jìn)行轉(zhuǎn)換的方法如下。課后習(xí)題1.處理缺失值的方式有哪些?2.打開(kāi)“素材文件\第3章\習(xí)題:近15

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。