30第七章-電商數(shù)據(jù)分析綜合案例課件_第1頁
30第七章-電商數(shù)據(jù)分析綜合案例課件_第2頁
30第七章-電商數(shù)據(jù)分析綜合案例課件_第3頁
30第七章-電商數(shù)據(jù)分析綜合案例課件_第4頁
30第七章-電商數(shù)據(jù)分析綜合案例課件_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第七章電商數(shù)據(jù)分析綜合案例中國IT教育解決方案專家2019年**月第七章電商數(shù)據(jù)分析綜合案例中國IT教育解決方案專家1目錄

Contents01電商數(shù)據(jù)背景分析02數(shù)據(jù)處理03數(shù)據(jù)分析04數(shù)據(jù)展示目錄01電商數(shù)據(jù)背景分析02數(shù)據(jù)處理03數(shù)據(jù)分析04數(shù)據(jù)2電商數(shù)據(jù)背景分析01電商數(shù)據(jù)背景分析017.1電商數(shù)據(jù)背景分析大數(shù)據(jù)時(shí)代給電子商務(wù)發(fā)展帶來新的機(jī)遇與挑戰(zhàn),大數(shù)據(jù)技術(shù)幫助電子商務(wù)行業(yè)發(fā)現(xiàn)新的商業(yè)模式,尤其是用戶行為預(yù)測分析和購物商品關(guān)聯(lián)分析己經(jīng)在電商領(lǐng)域得到了很好的應(yīng)用,并已經(jīng)幫助電商獲得了巨大的利潤。其中用戶行為分析是大數(shù)據(jù)電商應(yīng)用領(lǐng)域最常用的技術(shù)手段,該技術(shù)通過研究用戶在互聯(lián)網(wǎng)上的行為數(shù)據(jù),如用戶在訪問某個(gè)電商網(wǎng)站時(shí),用戶瀏覽、點(diǎn)擊、購買、評價(jià)某種商品的行為,可以讓企業(yè)更加詳細(xì)、清楚地了解用戶的行為習(xí)慣,從而為企業(yè)的經(jīng)營提供支持。案例以某電商類網(wǎng)站商品交易數(shù)據(jù)為基礎(chǔ),對“雙十一“在內(nèi)的近六個(gè)月的交易數(shù)據(jù)(脫敏數(shù)據(jù))完成數(shù)據(jù)處理,同時(shí)對數(shù)據(jù)中品牌商品,尤其是熱門品牌和商品,進(jìn)行點(diǎn)擊量、加入購物車量、購買量、關(guān)注量進(jìn)行分析和預(yù)測,對購買客戶的年齡、性別、區(qū)域特點(diǎn)進(jìn)行分析和總結(jié)。7.1電商數(shù)據(jù)背景分析大數(shù)據(jù)時(shí)代給電子商務(wù)發(fā)展帶來新的機(jī)遇與47.1電商數(shù)據(jù)背景分析1.user_id|買家id2.item_id|商品id3.cat_id|商品類別id4.merchant_id|賣家id5.brand_id|品牌id6.month|交易時(shí)間:月7.day|交易事件:日8.action|行為,取值范圍{0,1,2,3},0表示點(diǎn)擊,1表示加入購物車,2表示購買,3表示關(guān)注商品9.age_range|買家年齡分段:1表示年齡<18,2表示年齡在[18,24],3表示年齡在[25,29],4表示年齡在[30,34],5表示年齡在[35,39],6表示年齡在[40,49],7和8表示年齡>=50,0和NULL則表示未知10.gender|性別:0表示女性,1表示男性,2和NULL表示未知11.province|收獲地址省份12.ident_code|商品唯一標(biāo)識碼13.score|用戶評分7.1電商數(shù)據(jù)背景分析1.user_id|買家id95數(shù)據(jù)處理02數(shù)據(jù)處理027.2數(shù)據(jù)處理【任務(wù)描述】對電商數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,要求如下:(1)根據(jù)日期建立時(shí)間列,時(shí)間列格式為日期格式,如2015-01-01,列名為date,并去除原來的‘month’和‘day’列。(2)統(tǒng)計(jì)2015年10月11日-2015年11月11日之間,每天用戶的不同行為的數(shù)量,列名為不同行為,時(shí)間為索引?!静僮鞑襟E】(1)根據(jù)“month”和“day”列數(shù)據(jù),運(yùn)用Date函數(shù)生成date列。①鼠標(biāo)單擊“action”所在列,選中該列,右鍵單擊鼠標(biāo),在彈出的快捷菜單中單擊“插入”菜單項(xiàng),則在“day”列和“action”列之間插入一空列,如圖7-1所示。7.2數(shù)據(jù)處理【任務(wù)描述】77.2數(shù)據(jù)處理圖7-1電商案例源數(shù)據(jù)7.2數(shù)據(jù)處理圖7-1電商案例源數(shù)據(jù)87.2數(shù)據(jù)處理②光標(biāo)定位于H2單元格,鼠標(biāo)單擊“插入函數(shù)”按鈕,彈出“插入函數(shù)”對話框,選擇類別“日期與時(shí)間”—“Date”函數(shù),單擊“確定”按鈕,彈出如圖7-2所示的“函數(shù)參數(shù)”對話框。③光標(biāo)定位于Year右側(cè)的輸入框,輸入2015,光標(biāo)定位于Month右側(cè)的輸入框,選取F2單元格,光標(biāo)定位于Day右側(cè)的輸入框,選取G2單元格,單擊“確定”按鈕,即可生成Date列數(shù)據(jù)。④選中Date列,設(shè)置其格式為:“日期”-“2012-03-14”。圖7-2Date函數(shù)參數(shù)對話框7.2數(shù)據(jù)處理②光標(biāo)定位于H2單元格,鼠標(biāo)單擊“插入函97.2數(shù)據(jù)處理(2)統(tǒng)計(jì)2015年10月11日-2015年11月11日之間,每天用戶的不同行為的數(shù)量,列名為不同行為,時(shí)間為索引。①單擊“數(shù)據(jù)”選項(xiàng)卡中的“篩選”按鈕。②單擊Date列右側(cè)的向下箭頭,在彈出的快捷菜單中,單擊“日期篩選”—“自定義篩選”,如圖7-3所示。圖7-3篩選快捷菜單7.2數(shù)據(jù)處理(2)統(tǒng)計(jì)2015年10月11日-201107.2數(shù)據(jù)處理③在彈出的“自定義自動篩選方式”對話框中,設(shè)置顯示行Date“在以下日期之后或與之相同—“2015-10-11”,“在以下日期之前或與之相同--“2015-11-11”,單擊“確定”按鈕,將篩選出來的數(shù)據(jù)復(fù)制至一個(gè)新的sheet表,并將其重命名為“10月11月數(shù)據(jù)”。④選中新表中的數(shù)據(jù)源,單擊“插入”→“數(shù)據(jù)透視表”,彈出“創(chuàng)建數(shù)據(jù)透視表”對話框,如圖7-4所示。選擇需要分析的數(shù)據(jù)區(qū)域,以及數(shù)據(jù)透視表放置的位置,單擊“確定”按鈕。圖7-4創(chuàng)建數(shù)據(jù)透視表7.2數(shù)據(jù)處理③在彈出的“自定義自動篩選方式”對話框中117.2數(shù)據(jù)處理⑤進(jìn)入數(shù)據(jù)透視表的分析窗口,按日分析統(tǒng)計(jì)不同行為的數(shù)量,則拖動date字段至“行”區(qū)域,拖動action字段至“列”區(qū)域,再將action字段拖動至“值”區(qū)域,并設(shè)置其“值字段匯總方式”為“計(jì)數(shù)”,如圖圖7-5所示。圖7-5數(shù)據(jù)透視表字段設(shè)置7.2數(shù)據(jù)處理⑤進(jìn)入數(shù)據(jù)透視表的分析窗口,按日分析統(tǒng)計(jì)127.2數(shù)據(jù)處理⑥修改分析顯示結(jié)果中的列標(biāo)簽,“0”修改為“點(diǎn)擊”,“1”修改為“加入購物車”,“2”修改為“購買”,“3”修改為“關(guān)注商品”,最終結(jié)果如圖7-6所示。圖7-6數(shù)據(jù)透視表結(jié)果7.2數(shù)據(jù)處理⑥修改分析顯示結(jié)果中的列標(biāo)簽,“0”修改13數(shù)據(jù)分析03數(shù)據(jù)分析037.3數(shù)據(jù)分析【任務(wù)描述】針對某電商平臺2015年幾個(gè)月的用戶行為數(shù)據(jù),挖掘點(diǎn)擊量與購買量之間的關(guān)系,并預(yù)測假如10000點(diǎn)擊量購買量為多少?【操作步驟】(1)統(tǒng)計(jì)每日用戶行為數(shù)據(jù)①選中電商源數(shù)據(jù),鼠標(biāo)單擊“插入”選項(xiàng)卡“圖表”區(qū)域的“數(shù)據(jù)透視圖”,彈出如圖7-7所示的“創(chuàng)建數(shù)據(jù)透視圖”對話框,單擊“確定”按鈕即可。圖7-7“創(chuàng)建數(shù)據(jù)透視表”對話框7.3數(shù)據(jù)分析【任務(wù)描述】圖7-7“創(chuàng)建數(shù)據(jù)透視157.3數(shù)據(jù)分析②進(jìn)入數(shù)據(jù)透視表的分析窗口,按日分析統(tǒng)計(jì)不同行為的數(shù)量,則拖動date字段至“行”區(qū)域,拖動action字段至“列”區(qū)域,再將action字段拖動至“值”區(qū)域,并設(shè)置其“值字段匯總方式”為“計(jì)數(shù)”,如圖7-8所示。圖7-8數(shù)據(jù)透視表字段設(shè)置7.3數(shù)據(jù)分析②進(jìn)入數(shù)據(jù)透視表的分析窗口,按日分析統(tǒng)計(jì)167.3數(shù)據(jù)分析③修改分析顯示結(jié)果中的列標(biāo)簽,“0”修改為“點(diǎn)擊”,“1”修改為“加入購物車”,“2”修改為“購買”,“3”修改為“關(guān)注商品”,最終結(jié)果如圖7-9所示。圖7-9數(shù)據(jù)透視表結(jié)果7.3數(shù)據(jù)分析③修改分析顯示結(jié)果中的列標(biāo)簽,“0”修改177.3數(shù)據(jù)分析④選取“數(shù)據(jù)透視表結(jié)果”中的日期、點(diǎn)擊、購買列數(shù)據(jù),復(fù)制至一個(gè)新的工作表,將無數(shù)據(jù)的單元格用“0”替換,如圖7-10所示。圖7-10處理后的數(shù)據(jù)分析源數(shù)據(jù)7.3數(shù)據(jù)分析④選取“數(shù)據(jù)透視表結(jié)果”中的日期、點(diǎn)擊、187.3數(shù)據(jù)分析(2)分析“點(diǎn)擊”和“購買”二個(gè)變量間的相關(guān)性①選中數(shù)據(jù)分析源數(shù)據(jù),單擊“數(shù)據(jù)”選項(xiàng)卡中的“數(shù)據(jù)分析”,彈出如圖7-11所示的對話框,選擇其中的“相關(guān)系數(shù)”,單擊“確定”按鈕。圖7-11“數(shù)據(jù)分析”對話框7.3數(shù)據(jù)分析(2)分析“點(diǎn)擊”和“購買”二個(gè)變量間的197.3數(shù)據(jù)分析②在如圖7-12所示的“相關(guān)系數(shù)”對話框中,設(shè)置“輸入?yún)^(qū)域”為“點(diǎn)擊”和“購買”所在列數(shù)據(jù),“分組方式”選擇“逐列”,勾選“標(biāo)志位于第一行”,根據(jù)需要設(shè)置“輸出選項(xiàng)”,此處設(shè)置“輸出區(qū)域”為$F$1,則在源數(shù)據(jù)所在工作表的F1單元格為左上角的矩形區(qū)域顯示相關(guān)分析結(jié)果,單擊“確定”按鈕。圖7-12“相關(guān)系數(shù)”對話框7.3數(shù)據(jù)分析②在如圖7-12所示的“相關(guān)系數(shù)”對話207.3數(shù)據(jù)分析③相關(guān)系數(shù)分析結(jié)果如圖7-13所示,“點(diǎn)擊”和“購買”二個(gè)變量的相關(guān)系數(shù)是0.918079,屬高度正相關(guān)。(3)建立“點(diǎn)擊”和“購買”二個(gè)變量回歸分析模型①單擊“數(shù)據(jù)”選項(xiàng)卡中的“數(shù)據(jù)分析”按鈕,在如圖7-11所示的“數(shù)據(jù)分析”對話框中,選擇“回歸”,單擊“確定”按鈕。圖7-13“相關(guān)系數(shù)”分析結(jié)果7.3數(shù)據(jù)分析③相關(guān)系數(shù)分析結(jié)果如圖7-13所示,“217.3數(shù)據(jù)分析②在如圖7-14所示的“回歸”對話框中,對各類參數(shù)做如下設(shè)置。Y值輸入?yún)^(qū)域:輸入需要分析的因變量數(shù)據(jù)區(qū)域,此處選擇“購買”列所在數(shù)據(jù)。X值輸入?yún)^(qū)域:輸入需要分析的自變量數(shù)據(jù)區(qū)域,此處選擇“點(diǎn)擊”列所在數(shù)據(jù)。標(biāo)志:勾選“標(biāo)志”復(fù)選框。置信度:勾選“置信度”復(fù)選框,輸入“95%”。輸出區(qū)域:此處選擇F6單元格,回歸分析結(jié)果顯示在以F6單元格為左上角的區(qū)域。殘差:勾選“殘差”和“標(biāo)準(zhǔn)殘差”圖7-14“回歸”參數(shù)設(shè)置對話框7.3數(shù)據(jù)分析②在如圖7-14所示的“回歸”對話框中227.3數(shù)據(jù)分析③在如圖7-15所示的回歸統(tǒng)計(jì)表中顯示,MultipleR為0.9181,說明“點(diǎn)擊”和“購買”二個(gè)變量高度正相關(guān);RSquare為0.8429,說明回歸模型擬合效果較好④在如圖7-16所示的方差分析表中顯示,F(xiàn)統(tǒng)計(jì)量值為981.6318,說明“點(diǎn)擊”和“購買”二個(gè)變量具有顯著的線性關(guān)系;SignificanceF值為1.84E-75,小于等于0.01,說明檢驗(yàn)結(jié)果具有極其顯著的統(tǒng)計(jì)學(xué)意義。圖7-14“回歸”參數(shù)設(shè)置對話框圖7-16方差分析表7.3數(shù)據(jù)分析③在如圖7-15所示的回歸統(tǒng)計(jì)表中顯示237.3數(shù)據(jù)分析⑤如圖7-17所示的回歸系數(shù)表顯示,回歸模型的斜率為0.1160,截距為-12.42,因此點(diǎn)擊量和購買量的簡單線性回歸模型為Y=0.116X-12.42。⑥根據(jù)上述簡單線性回歸模型,預(yù)測點(diǎn)擊量為10000時(shí),購買量約為1148。圖7-17回歸系數(shù)表7.3數(shù)據(jù)分析⑤如圖7-17所示的回歸系數(shù)表顯示,回24數(shù)據(jù)展示04數(shù)據(jù)展示047.4數(shù)據(jù)展示【任務(wù)描述】根據(jù)電商數(shù)據(jù)進(jìn)行如下可視化分析展示:(1)用折線圖畫出用戶10月份每日購買、點(diǎn)擊、加入購物車、關(guān)注的變化趨勢圖。(2)分析出各個(gè)地區(qū)男女購買量的特點(diǎn),用柱狀圖表示,橫坐標(biāo)為省份,縱坐標(biāo)上半部分為男性購買量,下半部分為女性購買量,總量為總購買量?!静僮鞑襟E】(1)用折線圖畫出用戶10月份每日購買、點(diǎn)擊、加入購物車、關(guān)注的變化趨勢圖①選中電商源數(shù)據(jù),鼠標(biāo)單擊“插入”選項(xiàng)卡“圖表”區(qū)域的“數(shù)據(jù)透視圖”,彈出如圖7-18所示的“創(chuàng)建數(shù)據(jù)透視圖”對話框,單擊“確定”按鈕即可。②需要展示每日用戶行為變化趨勢,因此在“數(shù)據(jù)透視圖字段”對話框中,將Date字段拖動至軸類別區(qū)域,將系統(tǒng)默認(rèn)增加的“月”字段拖動至“篩選”區(qū)域,將action字段拖動至“圖例(系列)”區(qū)域,再將action字段拖動至“值”區(qū)域并將“值字段設(shè)置”為“計(jì)數(shù)”,如圖7-19所示。7.4數(shù)據(jù)展示【任務(wù)描述】267.4數(shù)據(jù)展示圖7-18“創(chuàng)建數(shù)據(jù)透視圖”對話框圖7-19“數(shù)據(jù)透視圖字段”對話框7.4數(shù)據(jù)展示圖7-18“創(chuàng)建數(shù)據(jù)透視圖”對話框圖277.4數(shù)據(jù)展示③鼠標(biāo)單擊“數(shù)據(jù)透視工具”選項(xiàng)卡中的“更改圖表類型”,選擇“帶數(shù)據(jù)標(biāo)記的折線圖”,單擊“確定”按鈕。④單擊“月”字段右側(cè)向下箭頭,選擇“10月”,單擊“確定”按鈕,如圖7-20所示,即可以折線圖展示10月份用戶的行為趨勢,結(jié)果如圖7-21所示。圖7-20選擇月份圖7-2110月用戶行為趨勢圖7.4數(shù)據(jù)展示③鼠標(biāo)單擊“數(shù)據(jù)透視工具”選項(xiàng)卡中的“更287.4數(shù)據(jù)展示(2)分析各個(gè)地區(qū)男女購買量的特點(diǎn)①選中電商源數(shù)據(jù),鼠標(biāo)單擊“插入”選項(xiàng)卡“圖表”區(qū)域的“數(shù)據(jù)透視圖”,彈出如圖7-18所示的“創(chuàng)建數(shù)據(jù)透視圖”對話框,單擊“確定”按鈕即可。②需要展示各地區(qū)男女購買量,因此在“數(shù)據(jù)透視圖字段”對話框中,將province字段拖動至軸類別區(qū)域,將gender字段拖動至“圖例(系列)”區(qū)域,再將gender字段拖動至“值”區(qū)域并將“值字段設(shè)置”為“計(jì)數(shù)”,如圖7-22所示。圖7-22“數(shù)據(jù)透視圖字段”設(shè)置對話框7.4數(shù)據(jù)展示(2)分析各個(gè)地區(qū)男女購買量的特點(diǎn)圖7-297.4數(shù)據(jù)展示③鼠標(biāo)單擊“數(shù)據(jù)透視工具”選項(xiàng)卡中的“更改圖表類型”,選擇“堆積柱形圖”,單擊“確定”按鈕,結(jié)果如圖7-23所示。圖7-23各地區(qū)男女購買量可視化展示圖7.4數(shù)據(jù)展示③鼠標(biāo)單擊“數(shù)據(jù)透視工具”選項(xiàng)卡中的“更30THANKS!THANKS!31第七章電商數(shù)據(jù)分析綜合案例中國IT教育解決方案專家2019年**月第七章電商數(shù)據(jù)分析綜合案例中國IT教育解決方案專家32目錄

Contents01電商數(shù)據(jù)背景分析02數(shù)據(jù)處理03數(shù)據(jù)分析04數(shù)據(jù)展示目錄01電商數(shù)據(jù)背景分析02數(shù)據(jù)處理03數(shù)據(jù)分析04數(shù)據(jù)33電商數(shù)據(jù)背景分析01電商數(shù)據(jù)背景分析017.1電商數(shù)據(jù)背景分析大數(shù)據(jù)時(shí)代給電子商務(wù)發(fā)展帶來新的機(jī)遇與挑戰(zhàn),大數(shù)據(jù)技術(shù)幫助電子商務(wù)行業(yè)發(fā)現(xiàn)新的商業(yè)模式,尤其是用戶行為預(yù)測分析和購物商品關(guān)聯(lián)分析己經(jīng)在電商領(lǐng)域得到了很好的應(yīng)用,并已經(jīng)幫助電商獲得了巨大的利潤。其中用戶行為分析是大數(shù)據(jù)電商應(yīng)用領(lǐng)域最常用的技術(shù)手段,該技術(shù)通過研究用戶在互聯(lián)網(wǎng)上的行為數(shù)據(jù),如用戶在訪問某個(gè)電商網(wǎng)站時(shí),用戶瀏覽、點(diǎn)擊、購買、評價(jià)某種商品的行為,可以讓企業(yè)更加詳細(xì)、清楚地了解用戶的行為習(xí)慣,從而為企業(yè)的經(jīng)營提供支持。案例以某電商類網(wǎng)站商品交易數(shù)據(jù)為基礎(chǔ),對“雙十一“在內(nèi)的近六個(gè)月的交易數(shù)據(jù)(脫敏數(shù)據(jù))完成數(shù)據(jù)處理,同時(shí)對數(shù)據(jù)中品牌商品,尤其是熱門品牌和商品,進(jìn)行點(diǎn)擊量、加入購物車量、購買量、關(guān)注量進(jìn)行分析和預(yù)測,對購買客戶的年齡、性別、區(qū)域特點(diǎn)進(jìn)行分析和總結(jié)。7.1電商數(shù)據(jù)背景分析大數(shù)據(jù)時(shí)代給電子商務(wù)發(fā)展帶來新的機(jī)遇與357.1電商數(shù)據(jù)背景分析1.user_id|買家id2.item_id|商品id3.cat_id|商品類別id4.merchant_id|賣家id5.brand_id|品牌id6.month|交易時(shí)間:月7.day|交易事件:日8.action|行為,取值范圍{0,1,2,3},0表示點(diǎn)擊,1表示加入購物車,2表示購買,3表示關(guān)注商品9.age_range|買家年齡分段:1表示年齡<18,2表示年齡在[18,24],3表示年齡在[25,29],4表示年齡在[30,34],5表示年齡在[35,39],6表示年齡在[40,49],7和8表示年齡>=50,0和NULL則表示未知10.gender|性別:0表示女性,1表示男性,2和NULL表示未知11.province|收獲地址省份12.ident_code|商品唯一標(biāo)識碼13.score|用戶評分7.1電商數(shù)據(jù)背景分析1.user_id|買家id936數(shù)據(jù)處理02數(shù)據(jù)處理027.2數(shù)據(jù)處理【任務(wù)描述】對電商數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,要求如下:(1)根據(jù)日期建立時(shí)間列,時(shí)間列格式為日期格式,如2015-01-01,列名為date,并去除原來的‘month’和‘day’列。(2)統(tǒng)計(jì)2015年10月11日-2015年11月11日之間,每天用戶的不同行為的數(shù)量,列名為不同行為,時(shí)間為索引?!静僮鞑襟E】(1)根據(jù)“month”和“day”列數(shù)據(jù),運(yùn)用Date函數(shù)生成date列。①鼠標(biāo)單擊“action”所在列,選中該列,右鍵單擊鼠標(biāo),在彈出的快捷菜單中單擊“插入”菜單項(xiàng),則在“day”列和“action”列之間插入一空列,如圖7-1所示。7.2數(shù)據(jù)處理【任務(wù)描述】387.2數(shù)據(jù)處理圖7-1電商案例源數(shù)據(jù)7.2數(shù)據(jù)處理圖7-1電商案例源數(shù)據(jù)397.2數(shù)據(jù)處理②光標(biāo)定位于H2單元格,鼠標(biāo)單擊“插入函數(shù)”按鈕,彈出“插入函數(shù)”對話框,選擇類別“日期與時(shí)間”—“Date”函數(shù),單擊“確定”按鈕,彈出如圖7-2所示的“函數(shù)參數(shù)”對話框。③光標(biāo)定位于Year右側(cè)的輸入框,輸入2015,光標(biāo)定位于Month右側(cè)的輸入框,選取F2單元格,光標(biāo)定位于Day右側(cè)的輸入框,選取G2單元格,單擊“確定”按鈕,即可生成Date列數(shù)據(jù)。④選中Date列,設(shè)置其格式為:“日期”-“2012-03-14”。圖7-2Date函數(shù)參數(shù)對話框7.2數(shù)據(jù)處理②光標(biāo)定位于H2單元格,鼠標(biāo)單擊“插入函407.2數(shù)據(jù)處理(2)統(tǒng)計(jì)2015年10月11日-2015年11月11日之間,每天用戶的不同行為的數(shù)量,列名為不同行為,時(shí)間為索引。①單擊“數(shù)據(jù)”選項(xiàng)卡中的“篩選”按鈕。②單擊Date列右側(cè)的向下箭頭,在彈出的快捷菜單中,單擊“日期篩選”—“自定義篩選”,如圖7-3所示。圖7-3篩選快捷菜單7.2數(shù)據(jù)處理(2)統(tǒng)計(jì)2015年10月11日-201417.2數(shù)據(jù)處理③在彈出的“自定義自動篩選方式”對話框中,設(shè)置顯示行Date“在以下日期之后或與之相同—“2015-10-11”,“在以下日期之前或與之相同--“2015-11-11”,單擊“確定”按鈕,將篩選出來的數(shù)據(jù)復(fù)制至一個(gè)新的sheet表,并將其重命名為“10月11月數(shù)據(jù)”。④選中新表中的數(shù)據(jù)源,單擊“插入”→“數(shù)據(jù)透視表”,彈出“創(chuàng)建數(shù)據(jù)透視表”對話框,如圖7-4所示。選擇需要分析的數(shù)據(jù)區(qū)域,以及數(shù)據(jù)透視表放置的位置,單擊“確定”按鈕。圖7-4創(chuàng)建數(shù)據(jù)透視表7.2數(shù)據(jù)處理③在彈出的“自定義自動篩選方式”對話框中427.2數(shù)據(jù)處理⑤進(jìn)入數(shù)據(jù)透視表的分析窗口,按日分析統(tǒng)計(jì)不同行為的數(shù)量,則拖動date字段至“行”區(qū)域,拖動action字段至“列”區(qū)域,再將action字段拖動至“值”區(qū)域,并設(shè)置其“值字段匯總方式”為“計(jì)數(shù)”,如圖圖7-5所示。圖7-5數(shù)據(jù)透視表字段設(shè)置7.2數(shù)據(jù)處理⑤進(jìn)入數(shù)據(jù)透視表的分析窗口,按日分析統(tǒng)計(jì)437.2數(shù)據(jù)處理⑥修改分析顯示結(jié)果中的列標(biāo)簽,“0”修改為“點(diǎn)擊”,“1”修改為“加入購物車”,“2”修改為“購買”,“3”修改為“關(guān)注商品”,最終結(jié)果如圖7-6所示。圖7-6數(shù)據(jù)透視表結(jié)果7.2數(shù)據(jù)處理⑥修改分析顯示結(jié)果中的列標(biāo)簽,“0”修改44數(shù)據(jù)分析03數(shù)據(jù)分析037.3數(shù)據(jù)分析【任務(wù)描述】針對某電商平臺2015年幾個(gè)月的用戶行為數(shù)據(jù),挖掘點(diǎn)擊量與購買量之間的關(guān)系,并預(yù)測假如10000點(diǎn)擊量購買量為多少?【操作步驟】(1)統(tǒng)計(jì)每日用戶行為數(shù)據(jù)①選中電商源數(shù)據(jù),鼠標(biāo)單擊“插入”選項(xiàng)卡“圖表”區(qū)域的“數(shù)據(jù)透視圖”,彈出如圖7-7所示的“創(chuàng)建數(shù)據(jù)透視圖”對話框,單擊“確定”按鈕即可。圖7-7“創(chuàng)建數(shù)據(jù)透視表”對話框7.3數(shù)據(jù)分析【任務(wù)描述】圖7-7“創(chuàng)建數(shù)據(jù)透視467.3數(shù)據(jù)分析②進(jìn)入數(shù)據(jù)透視表的分析窗口,按日分析統(tǒng)計(jì)不同行為的數(shù)量,則拖動date字段至“行”區(qū)域,拖動action字段至“列”區(qū)域,再將action字段拖動至“值”區(qū)域,并設(shè)置其“值字段匯總方式”為“計(jì)數(shù)”,如圖7-8所示。圖7-8數(shù)據(jù)透視表字段設(shè)置7.3數(shù)據(jù)分析②進(jìn)入數(shù)據(jù)透視表的分析窗口,按日分析統(tǒng)計(jì)477.3數(shù)據(jù)分析③修改分析顯示結(jié)果中的列標(biāo)簽,“0”修改為“點(diǎn)擊”,“1”修改為“加入購物車”,“2”修改為“購買”,“3”修改為“關(guān)注商品”,最終結(jié)果如圖7-9所示。圖7-9數(shù)據(jù)透視表結(jié)果7.3數(shù)據(jù)分析③修改分析顯示結(jié)果中的列標(biāo)簽,“0”修改487.3數(shù)據(jù)分析④選取“數(shù)據(jù)透視表結(jié)果”中的日期、點(diǎn)擊、購買列數(shù)據(jù),復(fù)制至一個(gè)新的工作表,將無數(shù)據(jù)的單元格用“0”替換,如圖7-10所示。圖7-10處理后的數(shù)據(jù)分析源數(shù)據(jù)7.3數(shù)據(jù)分析④選取“數(shù)據(jù)透視表結(jié)果”中的日期、點(diǎn)擊、497.3數(shù)據(jù)分析(2)分析“點(diǎn)擊”和“購買”二個(gè)變量間的相關(guān)性①選中數(shù)據(jù)分析源數(shù)據(jù),單擊“數(shù)據(jù)”選項(xiàng)卡中的“數(shù)據(jù)分析”,彈出如圖7-11所示的對話框,選擇其中的“相關(guān)系數(shù)”,單擊“確定”按鈕。圖7-11“數(shù)據(jù)分析”對話框7.3數(shù)據(jù)分析(2)分析“點(diǎn)擊”和“購買”二個(gè)變量間的507.3數(shù)據(jù)分析②在如圖7-12所示的“相關(guān)系數(shù)”對話框中,設(shè)置“輸入?yún)^(qū)域”為“點(diǎn)擊”和“購買”所在列數(shù)據(jù),“分組方式”選擇“逐列”,勾選“標(biāo)志位于第一行”,根據(jù)需要設(shè)置“輸出選項(xiàng)”,此處設(shè)置“輸出區(qū)域”為$F$1,則在源數(shù)據(jù)所在工作表的F1單元格為左上角的矩形區(qū)域顯示相關(guān)分析結(jié)果,單擊“確定”按鈕。圖7-12“相關(guān)系數(shù)”對話框7.3數(shù)據(jù)分析②在如圖7-12所示的“相關(guān)系數(shù)”對話517.3數(shù)據(jù)分析③相關(guān)系數(shù)分析結(jié)果如圖7-13所示,“點(diǎn)擊”和“購買”二個(gè)變量的相關(guān)系數(shù)是0.918079,屬高度正相關(guān)。(3)建立“點(diǎn)擊”和“購買”二個(gè)變量回歸分析模型①單擊“數(shù)據(jù)”選項(xiàng)卡中的“數(shù)據(jù)分析”按鈕,在如圖7-11所示的“數(shù)據(jù)分析”對話框中,選擇“回歸”,單擊“確定”按鈕。圖7-13“相關(guān)系數(shù)”分析結(jié)果7.3數(shù)據(jù)分析③相關(guān)系數(shù)分析結(jié)果如圖7-13所示,“527.3數(shù)據(jù)分析②在如圖7-14所示的“回歸”對話框中,對各類參數(shù)做如下設(shè)置。Y值輸入?yún)^(qū)域:輸入需要分析的因變量數(shù)據(jù)區(qū)域,此處選擇“購買”列所在數(shù)據(jù)。X值輸入?yún)^(qū)域:輸入需要分析的自變量數(shù)據(jù)區(qū)域,此處選擇“點(diǎn)擊”列所在數(shù)據(jù)。標(biāo)志:勾選“標(biāo)志”復(fù)選框。置信度:勾選“置信度”復(fù)選框,輸入“95%”。輸出區(qū)域:此處選擇F6單元格,回歸分析結(jié)果顯示在以F6單元格為左上角的區(qū)域。殘差:勾選“殘差”和“標(biāo)準(zhǔn)殘差”圖7-14“回歸”參數(shù)設(shè)置對話框7.3數(shù)據(jù)分析②在如圖7-14所示的“回歸”對話框中537.3數(shù)據(jù)分析③在如圖7-15所示的回歸統(tǒng)計(jì)表中顯示,MultipleR為0.9181,說明“點(diǎn)擊”和“購買”二個(gè)變量高度正相關(guān);RSquare為0.8429,說明回歸模型擬合效果較好④在如圖7-16所示的方差分析表中顯示,F(xiàn)統(tǒng)計(jì)量值為981.6318,說明“點(diǎn)擊”和“購買”二個(gè)變量具有顯著的線性關(guān)系;SignificanceF值為1.84E-75,小于等于0.01,說明檢驗(yàn)結(jié)果具有極其顯著的統(tǒng)計(jì)學(xué)意義。圖7-14“回歸”參數(shù)設(shè)置對話框圖7-16方差分析表7.3數(shù)據(jù)分析③在如圖7-15所示的回歸統(tǒng)計(jì)表中顯示547.3數(shù)據(jù)分析⑤如圖7-17所示的回歸系數(shù)表顯示,回歸模型的斜率為0.1160,截距為-12.42,因此點(diǎn)擊量和購買量的簡單線性回歸模型為Y=0.116X-12.42。⑥根據(jù)上述簡單線性回歸模型,預(yù)測點(diǎn)擊量為10000時(shí),購買量約為1148。圖7-17回歸系數(shù)表7.3數(shù)據(jù)分析⑤如圖7-17所示的回歸系數(shù)表顯示,回55數(shù)據(jù)展示04數(shù)據(jù)展示

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論