




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
客戶畫像分析人口屬性畫像操作實(shí)例確定目標(biāo)維度01數(shù)據(jù)預(yù)處理02標(biāo)簽建模03數(shù)據(jù)可視化04學(xué)習(xí)目標(biāo)熟悉并掌握人口屬性畫像的制作流程數(shù)據(jù)源數(shù)據(jù)來源:數(shù)據(jù)集來源于阿里巴巴天池,數(shù)據(jù)來自淘寶和天貓上購買嬰兒用戶,本數(shù)據(jù)集包括2個(gè)excel文件(sample)sam_tianchi_mum_baby圖1數(shù)據(jù)源(sample)sam_tianchi_mum_baby_trade_history確定目標(biāo)維度項(xiàng)目分析目標(biāo):根據(jù)嬰兒年齡、性別進(jìn)行客戶畫像項(xiàng)目維度:嬰兒年齡、性別數(shù)據(jù)預(yù)處理重命名表名:表1(sample)sam_tianchi_mum_baby_trade_history.csv)
命名為:購買商品信息表表2((sample)sam_tianchi_mum_baby.csv)命名為:嬰兒信息表表數(shù)據(jù)預(yù)處理缺失值處理:表1購買商品中商品屬性列存在缺失值,但不屬于研究范圍,故可忽略。圖2缺失值處理數(shù)據(jù)預(yù)處理異常數(shù)據(jù)處理:將表2中對(duì)gender列進(jìn)行篩選發(fā)現(xiàn)標(biāo)識(shí)為2的數(shù)據(jù),因?yàn)閿?shù)據(jù)標(biāo)識(shí)中,0標(biāo)注為女性,1標(biāo)注為男性,因此標(biāo)識(shí)為2的數(shù)據(jù)為異常數(shù)據(jù),執(zhí)行刪除操作;同時(shí)刪除表2中出生日期為19840616的數(shù)據(jù)。圖3異常數(shù)據(jù)處理數(shù)據(jù)預(yù)處理一致化處理:將表1和表2中的日期設(shè)置成規(guī)范的日期格式;圖4一致化處理數(shù)據(jù)預(yù)處理將“嬰兒信息表”中的gender的0,1統(tǒng)一更換為女,男,方便統(tǒng)計(jì)圖5將0,1更換為女,男標(biāo)簽建模由于性別、年齡兩個(gè)字段在表中均有明確顯示,且無缺失數(shù)據(jù),故無需建立算法模型,只需做統(tǒng)計(jì)分析即可。標(biāo)簽建模1、數(shù)據(jù)合并處理:由于需要了解產(chǎn)品各個(gè)年齡段銷量情況,通過購買日期和出生日期可以計(jì)算出嬰兒的年齡,為此嬰兒信息表表中在gender字段后面增加一個(gè)buy_date字段,用vlookup函數(shù)將購買商品信息表中的day字段匹配到該列,生成購買‘buy_date’如下.圖6數(shù)據(jù)合并處理標(biāo)簽建模2、將“嬰兒信息表”中的age通過DATEDif函數(shù)求出。圖7求嬰兒的age數(shù)據(jù)預(yù)處理3、將“嬰兒信息表”中的age按照(0_1),(2_4),(5_7),(8歲以上)的年齡段對(duì)該表中的嬰兒年齡進(jìn)行分段處理,得到fenzu字段。圖8年齡分段處理標(biāo)簽建模4.將“嬰兒信息表”中的user_id進(jìn)行統(tǒng)計(jì),得出總?cè)藬?shù)。圖9總?cè)藬?shù)標(biāo)簽建模5.將“嬰兒信息表”中的gender進(jìn)行統(tǒng)計(jì),得出男、女的各自人數(shù)及所占比例。圖10男女的人數(shù)及所占比例標(biāo)簽建模6、將“嬰兒信息表”中的fenzu字段進(jìn)行統(tǒng)計(jì),得到各組的人數(shù)及相應(yīng)比例。圖11各年齡段的人數(shù)及比例數(shù)據(jù)可視化利用柱狀圖和條形圖,對(duì)性別屬性及年齡屬性進(jìn)行畫像分析。圖12性別、年齡畫像畫像分析根據(jù)可視化的結(jié)果,可知網(wǎng)站上嬰兒性別分布較為均勻,女寶寶用戶量比男寶寶用戶量要稍微多點(diǎn)。嬰兒在年齡段0-1歲之間的用戶為平臺(tái)的主要購買
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 電商平臺(tái)物流配送外包協(xié)議
- 新一代智慧城市物流規(guī)劃與建設(shè)方案研究
- 遙控?zé)o人機(jī)航拍合同
- 建筑工地施工安全責(zé)任與風(fēng)險(xiǎn)免責(zé)協(xié)議
- 五保戶照料協(xié)議書
- 基金投資行業(yè)保密協(xié)議
- 合作居間費(fèi)的合同
- 天然氣工程施工合同
- 物流園區(qū)投資開發(fā)合同
- 人教版五年級(jí)下冊數(shù)學(xué)求最大公因數(shù)練習(xí)200題及答案
- 2024年度核醫(yī)學(xué)科危重癥患者應(yīng)急預(yù)案流程圖
- 書畫同源 課件-2023-2024學(xué)年高中美術(shù)人教版(2019)選擇性必修2 中國書畫
- 全飛秒激光近視手術(shù)
- 建筑工人實(shí)名制管理制度及實(shí)施方案
- 《養(yǎng)老護(hù)理員》-課件:協(xié)助老年人穿脫簡易矯形器
- GB 1886.227-2024食品安全國家標(biāo)準(zhǔn)食品添加劑嗎啉脂肪酸鹽果蠟
- 部編版五年級(jí)下冊語文作業(yè)本答案
- 電網(wǎng)調(diào)度運(yùn)行人員考試:電網(wǎng)調(diào)度調(diào)控考試試題及答案(最新版)
- 成都市深基坑管理規(guī)定課件
- 五年級(jí)數(shù)學(xué)(方程)習(xí)題及答案匯編
- 蕭條中的生存智慧:越是不景氣越要成為引擎般的存在
評(píng)論
0/150
提交評(píng)論