數(shù)據(jù)采集與處理 課件 任務(wù)2 認(rèn)知數(shù)據(jù)清洗_第1頁(yè)
數(shù)據(jù)采集與處理 課件 任務(wù)2 認(rèn)知數(shù)據(jù)清洗_第2頁(yè)
數(shù)據(jù)采集與處理 課件 任務(wù)2 認(rèn)知數(shù)據(jù)清洗_第3頁(yè)
數(shù)據(jù)采集與處理 課件 任務(wù)2 認(rèn)知數(shù)據(jù)清洗_第4頁(yè)
數(shù)據(jù)采集與處理 課件 任務(wù)2 認(rèn)知數(shù)據(jù)清洗_第5頁(yè)
已閱讀5頁(yè),還剩49頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

項(xiàng)目三數(shù)據(jù)預(yù)處理認(rèn)知任務(wù)2認(rèn)知數(shù)據(jù)清洗一、數(shù)據(jù)清洗概述數(shù)據(jù)清洗是指對(duì)數(shù)據(jù)進(jìn)行重新審查和校驗(yàn)的過(guò)程中,發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識(shí)別的錯(cuò)誤,按照一定的規(guī)則把錯(cuò)誤或沖突的數(shù)據(jù)洗掉,包括檢查數(shù)據(jù)一致性,處理無(wú)效值、缺失值和冗余值等,數(shù)據(jù)清理一般是由計(jì)算機(jī)而不是人工完成。二、數(shù)據(jù)清洗的方法缺失數(shù)據(jù)一般在數(shù)據(jù)表中表現(xiàn)為空白單元格或錯(cuò)誤標(biāo)識(shí)符(#div/0!)。檢測(cè)方法:在Excel軟件中可單擊“開(kāi)始”選項(xiàng)卡的“編輯”功能區(qū),通過(guò)“定位”→“定位條件”→“空值”→“確定”(或者使用【Ctrl+G】組合鍵),將缺失數(shù)據(jù)一次性選定。(一)缺失數(shù)據(jù)的清洗符號(hào)產(chǎn)生原因解決方法#DIV/0!①公式中的除數(shù)使用了指向空白單元格或包含零值的單元格的引用②輸入的公式中包含明顯的除數(shù)零①修改單元格引用,或在用作除數(shù)的單元格中輸入不為零的值②將零改為非零值二、數(shù)據(jù)清洗的方法(一)缺失數(shù)據(jù)的清洗處理方法:①忽略缺失值:將有缺失數(shù)據(jù)的記錄保留,僅在相應(yīng)的分析中做必要的排除。當(dāng)調(diào)查的樣本量比較大,缺失數(shù)據(jù)的數(shù)量又不是很多,而且變量之間也不存在高度相關(guān)的情況下,采用這種方式處理缺失數(shù)據(jù)比較可行。②刪除缺失值:將有缺失數(shù)據(jù)的記錄刪除,刪除記錄會(huì)導(dǎo)致樣本量減少,所以此方法不適于小樣本量的數(shù)據(jù)集。③填充缺失值:如果可以推斷出正確數(shù)值,則填充為邏輯正確值如果無(wú)法推斷出正確數(shù)值,則可以填充“未知”,或者用樣本統(tǒng)計(jì)量代替缺失數(shù)據(jù),最典型的做法是使用變量的平均值替代。替代后由于該變量的平均值會(huì)保持不變,因此其他的統(tǒng)計(jì)量(如標(biāo)準(zhǔn)差和相關(guān)系數(shù)等)也不會(huì)受很大的影響。二、數(shù)據(jù)清洗的方法(一)缺失數(shù)據(jù)的清洗練習(xí)題:整理某店鋪9月的銷售數(shù)據(jù),其中9月25日的支付金額和客單價(jià)數(shù)據(jù)缺失??紤]到每天的客單價(jià)相對(duì)穩(wěn)定,因此可以用平均客單價(jià)代替缺失數(shù)據(jù)。步驟1:選中D列,在Excel窗口下方的狀態(tài)欄中可以看到平均值為152.7。

步驟2:在D7單元格中輸入152.7,然后選擇B7單元格,在編輯欄中輸入公式"=C7*D7"按【Enter】鍵確認(rèn),得出支付金額數(shù)據(jù)。二、數(shù)據(jù)清洗的方法二、數(shù)據(jù)清洗的方法(二)重復(fù)數(shù)據(jù)的清洗為了保證數(shù)據(jù)的一致性,我們需要對(duì)重復(fù)數(shù)據(jù)進(jìn)行處理。在完成重復(fù)數(shù)據(jù)的查找后,即可刪除重復(fù)數(shù)據(jù)。實(shí)體重復(fù)字段重復(fù)所有字段完全重復(fù)某一個(gè)或多個(gè)不該重復(fù)的字段重復(fù),如Name字段重復(fù)重復(fù)數(shù)據(jù)

的類型二、數(shù)據(jù)清洗的方法(二)重復(fù)數(shù)據(jù)的清洗選擇“開(kāi)始”|“條件格式”|“突出顯示單元格規(guī)則”|“重復(fù)值”命令把重復(fù)的數(shù)據(jù)及其所在單元格標(biāo)為不同顏色以便識(shí)別條件格式法重復(fù)數(shù)據(jù)的查找高級(jí)篩選法函數(shù)法數(shù)據(jù)透視表法利用Excel的“高級(jí)篩選”功能,選擇不重復(fù)的記錄選擇不重復(fù)的記錄該函數(shù)的語(yǔ)法規(guī)則:COUNTIF(range,criteria)range:計(jì)算其中非空單元格數(shù)目的區(qū)域criteria:以數(shù)字、表達(dá)式或文本形式定義的條件利用COUNTIF函數(shù)對(duì)重復(fù)數(shù)據(jù)進(jìn)行識(shí)別拖動(dòng)選擇相應(yīng)字段,設(shè)置“計(jì)數(shù)”匯總,其中出現(xiàn)兩次及以上的數(shù)據(jù)就屬于重復(fù)項(xiàng)統(tǒng)計(jì)各數(shù)據(jù)出現(xiàn)的頻次二、數(shù)據(jù)清洗的方法(二)重復(fù)數(shù)據(jù)的清洗通過(guò)按鈕刪除重復(fù)項(xiàng)通過(guò)排序刪除重復(fù)項(xiàng)通過(guò)篩選刪除重復(fù)項(xiàng)單擊“數(shù)據(jù)”選項(xiàng)卡下的“刪除重復(fù)項(xiàng)”按鈕,將顯示有多少重復(fù)值被刪除,有多少唯一值被保留在利用COUNTIF函數(shù)對(duì)重復(fù)數(shù)據(jù)進(jìn)行識(shí)別的基礎(chǔ)上,對(duì)有重復(fù)標(biāo)記的列進(jìn)行降序排列,刪除數(shù)值大于1的項(xiàng)在利用COUNTIF函數(shù)對(duì)重復(fù)數(shù)據(jù)進(jìn)行識(shí)別的基礎(chǔ)上,對(duì)有重復(fù)標(biāo)記的列進(jìn)行篩選,篩選出數(shù)值不等于1的項(xiàng)刪除重復(fù)數(shù)據(jù)的方法二、數(shù)據(jù)清洗的方法(二)重復(fù)數(shù)據(jù)的清洗練習(xí)題:利用第三方采集工具從京東商城采集關(guān)于玻璃杯的商品數(shù)據(jù),其中包含了多條重復(fù)的數(shù)據(jù),請(qǐng)用不同方法對(duì)重復(fù)數(shù)據(jù)進(jìn)行識(shí)別,并刪除重復(fù)數(shù)據(jù)。二、數(shù)據(jù)清洗的方法(二)重復(fù)數(shù)據(jù)的清洗練習(xí)題:COUNTIF函數(shù)法:1.在“京東價(jià)”左側(cè)插入一列,標(biāo)題設(shè)為“第幾次出現(xiàn)”2.在C2單元格輸入公式“=COUNTIF($B$2:B2,B2)”,該公式用于對(duì)“商品ID”進(jìn)行計(jì)數(shù)3.篩選出大于1的數(shù)據(jù),即為重復(fù)數(shù)據(jù)(也可排序找出重復(fù)數(shù)據(jù),但順序會(huì)亂)二、數(shù)據(jù)清洗的方法實(shí)操練習(xí):在采集某商品的庫(kù)存數(shù)據(jù)時(shí),由于部分SKU(商品最小存貨單位)的期初庫(kù)存和期末庫(kù)存數(shù)據(jù)無(wú)法采集,導(dǎo)致對(duì)應(yīng)的庫(kù)存周轉(zhuǎn)率結(jié)果錯(cuò)誤,同時(shí)考慮到這些數(shù)據(jù)無(wú)法手動(dòng)修改。因此,這里僅需要對(duì)表格中的錯(cuò)誤信息進(jìn)行處理,即對(duì)于數(shù)據(jù)不完整的SKU,其庫(kù)存周轉(zhuǎn)率用“/”號(hào)來(lái)表示,最后再對(duì)整個(gè)表格的數(shù)據(jù)進(jìn)行去重檢查與處理。1選擇單元格區(qū)域、設(shè)置公式2修改錯(cuò)誤、刪除重復(fù)數(shù)據(jù)二、數(shù)據(jù)清洗的方法3擴(kuò)展選定區(qū)域、設(shè)置檢查項(xiàng)4提示已經(jīng)刪除了重復(fù)數(shù)據(jù)專家點(diǎn)撥:

IFERROR

函數(shù)的語(yǔ)法格式為"

IFERROR

(

Value

,

Value

_

If

_

Error

)",該函數(shù)可用于捕獲和處理公式中的錯(cuò)誤。如果公式的計(jì)算結(jié)果為錯(cuò)誤值,則

IFERROR

函數(shù)將返回參數(shù)"

Value

_

If

_

Error

"所設(shè)置的值,否則將返回參數(shù)"

Value

"的值。二、數(shù)據(jù)清洗的方法二、數(shù)據(jù)清洗的方法(三)錯(cuò)誤數(shù)據(jù)的清洗錯(cuò)誤原因查找方法清洗方法手工錄入錯(cuò)誤條件格式標(biāo)注錯(cuò)誤值錯(cuò)誤數(shù)據(jù)清洗輸入不符合要求其他原因COUNTIF函數(shù)糾正錯(cuò)誤二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:(1)被調(diào)查者輸入的信息不符合要求在進(jìn)行問(wèn)卷調(diào)查時(shí),多項(xiàng)選擇題最多可選3項(xiàng),但被調(diào)查者選擇了4項(xiàng)或4項(xiàng)以上。對(duì)于這種情況,我們可以結(jié)合COUNTIF函數(shù),根據(jù)指定的條件利用IF函數(shù)來(lái)判斷其真假,然后根據(jù)邏輯計(jì)算的真假值(TRUE或FALSE)返回相應(yīng)的內(nèi)容。以客戶滿意度調(diào)查中的多項(xiàng)選擇題為例,介紹如何找出不符合要求的數(shù)據(jù)。二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:方法1-使用COUNTIF函數(shù)完成檢驗(yàn)步驟1:針對(duì)"題目1"設(shè)置了

A

、

B

C

、

D

E

、

F

G

共7個(gè)選項(xiàng),這7個(gè)選項(xiàng)共有4條相關(guān)記錄,這4條記錄分別代表了4個(gè)客戶對(duì)"題目1"的回答,可以看出"客戶2"選擇了4項(xiàng),不符合最多可選3項(xiàng)的要求。二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:方法1-使用COUNTIF函數(shù)完成檢驗(yàn)步驟2:選擇I3單元格,在編輯欄中輸入公式=COUNTIF(B3:H3,“<>0),該公式用于判斷被調(diào)查者是否選擇了3項(xiàng)以上。步驟3:選中檢驗(yàn)列,“條件格式”-“突出顯示單元格規(guī)則”-“大于”-3,對(duì)所有大于3的單元格突出顯示二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:方法2-使用COUNTIF和IF函數(shù)完成檢驗(yàn)步驟1:針對(duì)"題目1"設(shè)置了

A

、

B

、

C

、

D

、

E

、

F

、

G

共7個(gè)選項(xiàng),這7個(gè)選項(xiàng)共有4條相關(guān)記錄,這4條記錄分別代表了4個(gè)客戶對(duì)"題目1"的回答,可以看出"客戶2"選擇了4項(xiàng),不符合最多可選3項(xiàng)的要求。二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:方法2-使用COUNTIF和IF函數(shù)完成檢驗(yàn)步驟2:選擇J3單元格,在編輯欄中輸入公式"=IF(COUNTIF(B3:H3,“<>0”)>3,"錯(cuò)誤","正確")",該公式用于判斷被調(diào)查者是否選擇了3項(xiàng)以上。如果超過(guò)3項(xiàng),表達(dá)式即為TRUE,返回"錯(cuò)誤";否則為

FALSE

,返回"正確"。二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:(2)手工錄入錯(cuò)誤在手動(dòng)錄入的調(diào)查問(wèn)卷中,出現(xiàn)了0和1之外的數(shù)據(jù)。對(duì)于這種情況,我們可以采用條件格式,利用OR函數(shù)標(biāo)記錯(cuò)誤。該函數(shù)的語(yǔ)法規(guī)則為:OR(logicall,logical2,…)。在其參數(shù)組中,任何一個(gè)參數(shù)邏輯值為TRUE即返回TRUE;所有參數(shù)的邏輯值為FALSE才返回FALSE。二、數(shù)據(jù)清洗的方法1.邏輯錯(cuò)誤數(shù)據(jù)的清洗練習(xí)題:(2)手工錄入錯(cuò)誤步驟1:在手動(dòng)錄入調(diào)查問(wèn)卷時(shí),錄入除0和1之外的數(shù)據(jù),從表中可以看出,單元格中出現(xiàn)了3、2、3這樣的數(shù)字。步驟2:選中B3:H6單元格區(qū)域,在“開(kāi)始”選項(xiàng)卡下單擊“條件格式”下拉按鈕,在彈出的下拉列表中選擇“新建規(guī)則”選項(xiàng),彈出“新建格式規(guī)則”對(duì)話框,選擇“使用公式確定要設(shè)置格式的單元格”選項(xiàng),然后輸入公式“=OR(B3=1,B3=0)=FALSE“,表示既不為1也不為0的單元格會(huì)被標(biāo)記出來(lái)。步驟3:?jiǎn)螕簟案袷健卑粹o,在彈出的“設(shè)置單元格格式”對(duì)話框中選擇“填充”選項(xiàng)卡,此時(shí)錯(cuò)誤數(shù)據(jù)被自動(dòng)標(biāo)記出來(lái)。二、數(shù)據(jù)清洗的方法二、數(shù)據(jù)清洗的方法2.格式錯(cuò)誤數(shù)據(jù)的清洗數(shù)據(jù)格式問(wèn)題主要有以下幾類:(一)時(shí)間、日期、數(shù)值、半全角等顯示格式不一致。直接將數(shù)據(jù)轉(zhuǎn)換為一類格式即可,該問(wèn)題一般出現(xiàn)在多個(gè)數(shù)據(jù)源整合的情況下。(二)內(nèi)容中有不該存在的字符。如在身高字段下有些變量帶單位,有些沒(méi)有,這時(shí)去除不需要的字符即可。(三)數(shù)據(jù)格式不滿足要求。在不同的計(jì)算方式下對(duì)數(shù)據(jù)格式要求不同,可根據(jù)分析要求進(jìn)行格式調(diào)整。二、數(shù)據(jù)清洗的方法練習(xí):某企業(yè)采集了競(jìng)爭(zhēng)對(duì)手的相關(guān)數(shù)據(jù),發(fā)現(xiàn)一級(jí)類目下的數(shù)據(jù)表達(dá)格式未統(tǒng)一,且客單價(jià)與銷售額的格式也不相同,需要進(jìn)行整理,其具體操作如下。1輸入查找與替換的內(nèi)容2確認(rèn)替換一級(jí)類目統(tǒng)一替換為:女裝/女士精品二、數(shù)據(jù)清洗的方法4選擇多個(gè)單元格區(qū)域5設(shè)置數(shù)據(jù)類型3查找與替換其他數(shù)據(jù)二、數(shù)據(jù)清洗的方法(四)異常數(shù)據(jù)的清洗檢測(cè)方法:(1)定義法:檢測(cè)數(shù)據(jù)與平均值的偏差,與檢測(cè)數(shù)據(jù)兩倍標(biāo)準(zhǔn)差比較大小(2)箱形圖:由數(shù)據(jù)的上邊緣、上四分位數(shù)、中位數(shù)、下四分位數(shù)和下邊緣組成的圖形,其中上邊緣和下邊緣線所代表的就是臨界值,超過(guò)上下邊界的離群點(diǎn)則為需要關(guān)注的異常值。操作要求:在excel表格中檢測(cè)“消費(fèi)次數(shù)”的異常值。運(yùn)用函數(shù):AVERAGE(平均值函數(shù))、ABS(絕對(duì)值函數(shù))、STDEV.S(標(biāo)準(zhǔn)差函數(shù))二、數(shù)據(jù)清洗的方法(四)異常數(shù)據(jù)的清洗處理方法:①參考后續(xù)的數(shù)據(jù)分析模型,選擇刪除或者保留異常值。②用一個(gè)樣本統(tǒng)計(jì)量去代替異常值,比如平均值、中位數(shù)、眾數(shù)等。③分箱法,即通過(guò)考察相鄰數(shù)據(jù)的取值對(duì)異常值進(jìn)行平滑處理,可視為一種局部平滑方法。首先將異常值所在指標(biāo)下的所有數(shù)據(jù)按照大小排序,并適當(dāng)分組(也稱作分“箱”),然后用組內(nèi)數(shù)據(jù)的平均值、中位數(shù)或邊界值來(lái)代替異常值。分組時(shí),如果每個(gè)“箱”的數(shù)據(jù)個(gè)數(shù)相同就為等深分箱;如果每個(gè)“箱”內(nèi)數(shù)據(jù)值的區(qū)間范圍是一個(gè)常量就為等寬分箱。三、數(shù)據(jù)加工數(shù)據(jù)加工是指對(duì)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、計(jì)算等操作,使經(jīng)過(guò)加工后的數(shù)據(jù)成為簡(jiǎn)潔、規(guī)范、清晰的樣本數(shù)據(jù)。一般情況下,當(dāng)數(shù)據(jù)經(jīng)過(guò)清洗之后仍然不能滿足用戶的分析需求時(shí),就需要利用數(shù)據(jù)加工對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的處理,形成分析所需要的一系列新的字段。數(shù)據(jù)加工環(huán)節(jié)直接影響數(shù)據(jù)質(zhì)量的價(jià)值性、可用性和準(zhǔn)確性。因此在進(jìn)行數(shù)據(jù)加工時(shí),要根據(jù)數(shù)據(jù)特點(diǎn)合理選擇數(shù)據(jù)加工方法,以實(shí)現(xiàn)數(shù)據(jù)質(zhì)量的最優(yōu)化。三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取數(shù)據(jù)抽取就是對(duì)數(shù)據(jù)庫(kù)中現(xiàn)有字段進(jìn)行整合加工,使能夠形成分析所需要的數(shù)據(jù)。1.從某個(gè)字段中抽取部分?jǐn)?shù)據(jù)字段拆分就是為了截取某一字段中的部分信息,將該字段拆分成兩個(gè)或多個(gè)字段。三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取Excel的“快速填充”功能一般來(lái)說(shuō),沒(méi)有規(guī)律的數(shù)據(jù)都需要手動(dòng)輸入,但對(duì)于一些相同或有規(guī)律的數(shù)據(jù),如員工編號(hào)、部門名稱等,則可通過(guò)填充的方式快速輸入。三、數(shù)據(jù)加工三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取2.從不同的數(shù)據(jù)表中抽取多個(gè)字段VLOOKUP函數(shù)打開(kāi)素材文件“2數(shù)據(jù)抽取-素材”,其中包括兩個(gè)表,第一個(gè)表為近期店鋪方可排名前10的商品表,包括商品標(biāo)題、商品ID、商品貨號(hào)等屬性,第二個(gè)表為店鋪商品信息表,記錄了店鋪中所有商品的信息,運(yùn)營(yíng)者需要為這些商品添加相應(yīng)的商品貨號(hào)。三、數(shù)據(jù)加工三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取練習(xí):字段拆分打開(kāi)素材文件“3數(shù)據(jù)抽取-素材”,已知某公司實(shí)習(xí)員工的信息表,將員工的出生年月日字段拆分成年、月、日三個(gè)字段;三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取練習(xí):字段拆分分隔符號(hào)根據(jù)實(shí)際情況選擇或輸入三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取練習(xí):字段拆分請(qǐng)大家嘗試用YEAR、MONTH、DAY、MID、LEFT、RIGHT等函數(shù)抽取信息;用VLOOKUP函數(shù)將考核得分抽取到基本信息表中。三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取3.字段合并字段合并就是將若干字段合并成為一個(gè)新的字段,或者將字段值與文字、數(shù)字等組合形成新的字段。字段合并可以利用CONCATENATE函數(shù)或者“&”(邏輯與)運(yùn)算符。三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取3.字段合并請(qǐng)將基本信息表中員工的工號(hào)和姓名字段合并,合并成“**的工號(hào)是**”,例如“周慧的工號(hào)是1801201”。(1)利用&運(yùn)算符合并三、數(shù)據(jù)加工(一)數(shù)據(jù)抽取3.字段合并(2)利用CONCATENATE函數(shù)合并三、數(shù)據(jù)加工(二)數(shù)據(jù)轉(zhuǎn)換由于不同來(lái)源的數(shù)據(jù)可能存在不同的結(jié)構(gòu),數(shù)據(jù)轉(zhuǎn)化主要是將數(shù)據(jù)轉(zhuǎn)換成規(guī)范、清晰、易于分析的結(jié)構(gòu)。數(shù)據(jù)轉(zhuǎn)換包括數(shù)據(jù)行列轉(zhuǎn)換、數(shù)據(jù)類型轉(zhuǎn)換、數(shù)據(jù)排序和數(shù)據(jù)分組。三、數(shù)據(jù)加工1.數(shù)據(jù)行列轉(zhuǎn)換在進(jìn)行數(shù)據(jù)報(bào)表分析時(shí),常常要從不同的維度觀察數(shù)據(jù)。例如,從時(shí)間的維度查看匯總數(shù)據(jù),從地區(qū)的維度觀察匯總數(shù)據(jù),這樣需要對(duì)行列數(shù)據(jù)進(jìn)行轉(zhuǎn)換(又稱轉(zhuǎn)置)。

例如,下圖的數(shù)據(jù)轉(zhuǎn)換,可以將原數(shù)據(jù)復(fù)制,然后利用"選擇性粘貼"對(duì)話框中的"轉(zhuǎn)置"選項(xiàng)完成這個(gè)操作。三、數(shù)據(jù)加工2.數(shù)據(jù)類型轉(zhuǎn)換(1)數(shù)值轉(zhuǎn)字符在Excel中輸入數(shù)據(jù)的時(shí)候,會(huì)默認(rèn)使用數(shù)值型數(shù)據(jù);若是數(shù)字太長(zhǎng),會(huì)變成用科學(xué)記數(shù)法表示的數(shù),不利于查看數(shù)據(jù)。我們可以利用“數(shù)據(jù)”選項(xiàng)卡中的“分列”功能進(jìn)行轉(zhuǎn)換。步驟:1)選擇要轉(zhuǎn)換的數(shù)字所在的單元格,隨后單擊“分列”按鈕,在“文本分列向?qū)А睂?duì)話框中,使用默認(rèn)設(shè)置,連續(xù)單擊“下一步”按鈕;2)進(jìn)入“文本分列向?qū)А钡?步,選中“列數(shù)據(jù)格式”欄中的“文本”單選項(xiàng),單擊“完成”按鈕即可完成設(shè)置;3)設(shè)置完成后,返回Excel數(shù)據(jù)表,數(shù)據(jù)前有小三角符號(hào),代表已轉(zhuǎn)換成功。三、數(shù)據(jù)加工2.數(shù)據(jù)類型轉(zhuǎn)換(2)字符轉(zhuǎn)數(shù)字在進(jìn)行數(shù)據(jù)統(tǒng)計(jì)時(shí),有時(shí)獲取的原始數(shù)據(jù)是以文本字符形式展現(xiàn)的,雖然這不影響數(shù)據(jù)展現(xiàn),但無(wú)法進(jìn)行計(jì)算。直接選中要轉(zhuǎn)換的數(shù)據(jù)列,單擊數(shù)據(jù)列前出現(xiàn)的提醒符號(hào),在給出的選項(xiàng)中選擇“轉(zhuǎn)換為數(shù)字”選項(xiàng),即可將文本字符轉(zhuǎn)換為數(shù)值。三、數(shù)據(jù)加工(三)數(shù)據(jù)排序數(shù)據(jù)排序是指將數(shù)據(jù)按照方便我們處理分析的順序進(jìn)行有規(guī)則的排列,如按照分?jǐn)?shù)降序排序、按照日期升序排序等。(1)添加條件將數(shù)據(jù)按照“訪客數(shù)”和“下單買家數(shù)”兩個(gè)字段進(jìn)行排序,均為降序排序。(2)自定義排序?qū)?shù)據(jù)根據(jù)流量來(lái)源進(jìn)行排序。1)選擇“文件”菜單中的“選項(xiàng)”命令,彈出“Excel選項(xiàng)”對(duì)話框,切換到“高級(jí)”選項(xiàng)卡,單擊“編輯自定義列表”按鈕;2)在彈出的“自定義序列”對(duì)話框中輸入序列(即按照我們希望該字段排列的順序輸入),單擊“添加”按鈕,將其添加到自定義序列中,單擊“確定”按鈕完成添加三、數(shù)據(jù)加工三、數(shù)據(jù)加工(四)數(shù)據(jù)分組數(shù)據(jù)分組是根據(jù)統(tǒng)計(jì)研究需要,將原始數(shù)據(jù)按照某種標(biāo)準(zhǔn)劃分成不同的組別,分組后的數(shù)據(jù)稱為分組數(shù)據(jù)。在Excel中我們可以通過(guò)VLOOKUP函數(shù)快速實(shí)現(xiàn)數(shù)據(jù)分組。我們想將員工的“考核得分”按照分組要求顯示考核等級(jí)。三、數(shù)據(jù)加工(四)數(shù)據(jù)分組(1)在數(shù)據(jù)表中的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論