![營銷數(shù)據(jù)分析 課件 第2章 基于聚類算法的價格帶分析_第1頁](http://file4.renrendoc.com/view11/M01/0C/34/wKhkGWWBmNmAXqlpAAEoXp_7_Zw684.jpg)
![營銷數(shù)據(jù)分析 課件 第2章 基于聚類算法的價格帶分析_第2頁](http://file4.renrendoc.com/view11/M01/0C/34/wKhkGWWBmNmAXqlpAAEoXp_7_Zw6842.jpg)
![營銷數(shù)據(jù)分析 課件 第2章 基于聚類算法的價格帶分析_第3頁](http://file4.renrendoc.com/view11/M01/0C/34/wKhkGWWBmNmAXqlpAAEoXp_7_Zw6843.jpg)
![營銷數(shù)據(jù)分析 課件 第2章 基于聚類算法的價格帶分析_第4頁](http://file4.renrendoc.com/view11/M01/0C/34/wKhkGWWBmNmAXqlpAAEoXp_7_Zw6844.jpg)
![營銷數(shù)據(jù)分析 課件 第2章 基于聚類算法的價格帶分析_第5頁](http://file4.renrendoc.com/view11/M01/0C/34/wKhkGWWBmNmAXqlpAAEoXp_7_Zw6845.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于聚類算法的價格帶分析Let’sStart第2章聚類算法Clusteringalgorithm案例示范CaseDemonstration問題的提出QuestionCONTENTS目錄思考與練習(xí)Thinkingandexercise1問題的提出(一)價格帶分析
價格帶(PriceZone)指的是某一類商品品種的價格由低到高所形成的價格幅度,其寬度決定了該類商品所面對的消費者的層次和數(shù)量。在商品價格帶中,由于其價格高低幅度的不同,其中所包含的種類也有所不同。同時,由于各價格段的商品陳列量的差異,導(dǎo)致商店陳列呈現(xiàn)不同形態(tài),最終形成商店的經(jīng)營特點和特性,從而進一步滿足顧客對商品豐富性的需求。價格帶的本質(zhì)是針對于小分類商品進行商品品類管理,這建立在商品品類管理的基礎(chǔ)之上,其最終目標價值就是解決管理問題的其中一項指標。(一)價格帶分析
商品價格帶分析是市場調(diào)研過程中普遍采用的一種方法,在商品定價的過程中不可或缺。在商品管理過程中,運用好價格帶分析,不僅可以幫助企業(yè)節(jié)約有限的資源,還可以提高企業(yè)的經(jīng)濟效益。企業(yè)可以依據(jù)其競爭對手的經(jīng)營策略以及顧客的消費習(xí)慣來分析價格帶,同時還可以根據(jù)消費者的反饋和市場中其他企業(yè)的經(jīng)營情況,及時調(diào)整自身的經(jīng)營策略和商品結(jié)構(gòu),加強企業(yè)自身競爭力。因此,無論是對于經(jīng)營商還是供銷商,都需要密切關(guān)注市場中類似商品品類的價格變化,從而劃定適合自己經(jīng)營的價格空間,靈活有效的與對手競爭。(二)問題設(shè)計
某商家計劃近期舉辦一場營銷活動,為確定促銷商品的價格區(qū)間,該店鋪通過問卷調(diào)查、顧客反饋以及市場類似商品的價格空間變化等市場調(diào)研方式,結(jié)合商品構(gòu)成狀態(tài),來確定適合自己經(jīng)營的價格。
商品構(gòu)成狀態(tài)指的是在一定售價條件下,店鋪內(nèi)銷售量、陳列量或者商品品目數(shù)量的狀態(tài)。商品構(gòu)成狀態(tài)的衡量和把握也是商家是否能夠經(jīng)營成功的關(guān)鍵所在,如果某個商店能夠?qū)⑵渖唐窐?gòu)成狀態(tài)維持在領(lǐng)先地位,那么來店購買的顧客量自然會增加。同時,價格帶分析方法必須要遵循商品品類管理的原則,不可以將不同分類的商品放在一起進行比較。尤其對于連鎖店鋪價格的確定,要根據(jù)其所在商圈的特點,兼顧不同層次的顧客需求,采取由“因店制宜”制定“適中價格”的策略。在價格帶的選擇方面,要滿足低價位、商品價格種類少、窄價格帶、充分的陳列量等基本前提。(三)問題解決思路1.價格帶的制定價格帶分析不僅和單品價格有所聯(lián)系,還需要與商品品牌、氣候、促銷等因素聯(lián)合起來進行分析,制定適宜的價格帶具體步驟如下:①企業(yè)需要進入商品銷售區(qū)域或賣場,把握競爭對手和顧客的消費習(xí)慣,了解商品的價格變化情況;②根據(jù)經(jīng)營情況和顧客的反饋,并結(jié)合競爭對手的經(jīng)營策略,及時調(diào)整商品結(jié)構(gòu),加強競爭力;③明確價格帶分析的必要組成因素,即競爭者和企業(yè)自身產(chǎn)品的詳細資料、公司內(nèi)部的商品組織分析表以及分析報表;④尋找商品品類中的“價格點”,這也是價格帶分析的關(guān)鍵所在;⑤根據(jù)價格線找到價格點,給出最終商品價格圖。(三)問題解決思路2.市場價格細分利用聚類分析進行市場價格細分,基本思路如下:①在進行產(chǎn)品行業(yè)聚類時找到具有代表性的指標;②對相關(guān)指標利用聚類相關(guān)算法進行聚類分析;③根據(jù)聚類分析所得出的結(jié)果進行可視化的數(shù)據(jù)分析,得出不同類型商品的特性;④根據(jù)聚類和可視化分析的結(jié)果做市場價格細分。2聚類算法(一)聚類算法簡介在基本術(shù)語中,聚類算法是指在數(shù)據(jù)中尋找結(jié)構(gòu),使得同一聚類(或組)中的元素彼此之間比其他聚類中的元素更相似,同時也是在沒有訓(xùn)練和不知道劃分類別的前提條件下,根據(jù)信息的相似性原則,對樣本進行分類。聚類分析是數(shù)據(jù)挖掘的重要技術(shù)之一,也是最常用的一類無監(jiān)督機器學(xué)習(xí)算法,其目的是將數(shù)據(jù)劃分為有意義或有用的組(也稱為簇)。這些區(qū)分可以根據(jù)業(yè)務(wù)需求或建模需求進行,也可以純粹用于輔助探索數(shù)據(jù)的自然結(jié)構(gòu)和分布。例如,如果企業(yè)有很多當(dāng)前和潛在的客戶信息,可以使用聚類將客戶分組,有助于進一步的進行分析并制定營銷活動。最著名的客戶價值判斷模型是RFM,該模型就經(jīng)常與聚類分析結(jié)合使用。除此之外,聚類還可以用于降維和矢量量化(vectorquantization),可以將高維特征壓縮到單個列中,常用于圖像、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù),可以顯著壓縮數(shù)據(jù)量。(二)K-Means算法原理聚類算法有很多種,K-Means是最常用的聚類算法之一,也是最基本、最重要的算法。該算法的主要特點是簡單、易于理解且計算速度快,但它只適用于連續(xù)型的數(shù)據(jù),并且必須在對數(shù)據(jù)進行聚類之前手動指定所要分成的類別。k-means算法是一種簡單的迭代聚類算法,它使用距離作為相似性指標來查找給定數(shù)據(jù)集中的k個類別。其中每個類的中心是根據(jù)類中所有值的均值得到,每個類用聚類中心來描述。聚類的目標是使用歐氏距離作為相似度指標,使得各類的聚類平方和最小。k-means的基本思想:通過迭代找到一種方法來劃分出k個聚類,然后用這k個聚類的均值來表示對應(yīng)樣本時總體誤差是最小的。(二)K-Means算法原理其大致算法流程如下:(1)首先選取數(shù)據(jù)空間中的k個對象作為初始中心,每個對象代表一個聚類中心;(2)根據(jù)樣本數(shù)據(jù)對象與聚類中心的歐氏距離,以距離最近為準則,分到距離最近的類,其中,歐氏距離表達式為:(3)更新聚類中心并判斷聚類中心和目標函數(shù)的值是否發(fā)生改變,若不變,則輸出結(jié)果,若改變,則返回上一步。算法流程詳解如圖2-1所示(二)K-Means算法原理總體來說,K-means是一種基于距離的聚類算法,它是將所有數(shù)據(jù)歸類到其最鄰近的中心。它適用于對球形簇分布的數(shù)據(jù)進行聚類分析,其可應(yīng)用于客戶細分、市場細分等分析場景。用戶在使用時需要指定聚類個數(shù)。(三)聚類算法的分類1.基于劃分的聚類算法
基于劃分的聚類算法的基本思想是將簇的質(zhì)心作為聚類中心,其中簇的質(zhì)心是由數(shù)據(jù)點構(gòu)成的。接著依照距離的大小將數(shù)據(jù)對象進行簇類劃分,以此來實現(xiàn)數(shù)據(jù)集的聚類操作。主要思想為將一個包括n個數(shù)據(jù)對象的數(shù)據(jù)集,將其劃分為k個類簇,同時每個類簇代表數(shù)據(jù)集中的一組相似度最高的數(shù)據(jù)對象。比較經(jīng)典的基于劃分的聚類算法有K-means算法、CLARANS算法等。但是目前大多數(shù)的層次聚類算法都存在靈活性較差的問題,并且算法需要預(yù)先輸入終止條件。(三)聚類算法的分類2.基于層次的聚類算法基于層次的聚類算法主要按照“自底向上”和“自頂而下”的策略,將其分為凝聚層次聚類和分裂層次聚類。凝聚層次聚類是先進行合并,將數(shù)據(jù)集中所有的數(shù)據(jù)對象分別看成一個類簇,然會對簇進行一定規(guī)則的合并操作,直到合并的簇族滿足預(yù)定的類簇族或者劃分的類簇滿足某個預(yù)設(shè)終止條件,則為完成聚類運算。分裂層次聚類是先進行劃分,將所有的數(shù)據(jù)對象看成一個簇,然后對簇進行子簇的劃分,遞歸劃分直到劃分出的子簇滿足終止條件,則為完成聚類運算?;趯哟蔚木垲愃惴梢栽诓煌膶哟紊险故緮?shù)據(jù)集的聚類結(jié)果情況,并且可以通過繪制樹狀圖實現(xiàn)聚類結(jié)果的可視化,從而進一步凸顯出聚類算法中包含的物理意義。目前應(yīng)用比較廣泛的層次聚類算法有CURE算法、BIRCH算法等。(三)聚類算法的分類3.基于密度的聚類算法基于密度的聚類算法主要是利用樣本點分布緊湊程度,使用樣本點的數(shù)量大小代替距離測度,從而實現(xiàn)對數(shù)據(jù)樣本點間相似性的度量。同時,基于密度的聚類算法在一些方面彌補了一些類別聚類算法的不足,例如,它解決了一些類別聚類算法只能發(fā)現(xiàn)球型簇的問題。目前比較經(jīng)典的基于密度的聚類算法主要有:DBSCAN算法、OPTICS算法以及DENCLUE算法等。(三)聚類算法的分類4.基于網(wǎng)格的聚類算法基于網(wǎng)格的聚類算法主要通過人為構(gòu)建網(wǎng)格數(shù)據(jù)結(jié)構(gòu),利用數(shù)據(jù)集的數(shù)據(jù)填充網(wǎng)格單元,從而實現(xiàn)對數(shù)據(jù)集的間接壓縮,接著通過對網(wǎng)格中包含的數(shù)據(jù)樣本點個數(shù)進行信息統(tǒng)計,最后按照網(wǎng)格單元中的統(tǒng)計信息對數(shù)據(jù)集進行聚類操作。目前比較典型的基于網(wǎng)格的聚類算法主要有STING算法、CLIQUE算法以及WAVECLUSTER算法等。同時,基于網(wǎng)格的聚類算法具有的優(yōu)點是聚類處理時間比較短,適合處理低維數(shù)據(jù)集。但其具有一定的局限性,即網(wǎng)格的劃分粗細在不同程度上會影響算法的效率和精度。對于高維數(shù)據(jù)集,數(shù)據(jù)集的劃分可能會過于稀疏,從而導(dǎo)致聚類效果達不到理想的狀態(tài)。(三)聚類算法的應(yīng)用1.查找信息百度包含數(shù)億個web網(wǎng)頁,網(wǎng)絡(luò)搜索引擎可以返回數(shù)千個頁面。這里可以使用聚類將搜索結(jié)果分成若干簇,其中每個簇捕獲查詢的特定方面。2.企業(yè)并購績效評價并購已經(jīng)成為影響上市企業(yè)業(yè)績的重要行為之一,傳統(tǒng)的企業(yè)并購績效評價方法主要是事件研究法和財務(wù)指標研究法,但基于層次聚類算法的企業(yè)并購績效評價方法通過構(gòu)建并購績效評價模型,可以以行業(yè)的角度來評價企業(yè)并購績效,從而可以對企業(yè)的并購行為有更加全面和深層次的認識。3.客戶細分企業(yè)會收集有關(guān)當(dāng)前和潛在客戶的大量信息。聚類可用于將客戶分組以進行進一步分析和營銷活動。例如,最流行的客戶價值判斷模型RFM經(jīng)常與聚類分析結(jié)合使用,從而確定客戶價值得分水平。3案例示范實驗背景:現(xiàn)某商家計劃舉辦一場營銷活動,為確定活動商品的價格區(qū)間,該商家運營部基于多種市場調(diào)研方式,確定適合商家的經(jīng)營價格范圍。在商品價格帶中,由于各個商家商品價格的高低幅度、包含種類以及陳列數(shù)量的不同,因此商家需要結(jié)合自己店鋪的經(jīng)營特色和理念合理制定適合自己的價格,從而進一步滿足消費者的商品服務(wù)需求。在本案例中,采用與“電腦椅”相關(guān)的商品數(shù)據(jù),在運用聚類分析算法對價格段進行劃分的基礎(chǔ)之上,結(jié)合數(shù)字化手段進行市場細分,最后得出商家電腦椅的聚合和可視化結(jié)果。同時在兼顧商品成本和效益的前提下,依據(jù)市場細分結(jié)果制定出適合商家的定價參照范圍。(一)探索數(shù)據(jù)源案例主要采用了與“電腦椅”相關(guān)的商品數(shù)據(jù),共400條記錄,其內(nèi)容如表2-1所示。表2-1序號寶貝標題寶貝id原價最低原價最高折扣率1職員學(xué)生宿舍弓型會議椅63908328307216926966.54%2卡勒維家用皮質(zhì)鐵架電競椅包郵55833688008130974977.30%3電腦椅學(xué)生游戲椅子電競椅可躺617248419464318103850.00%4電腦椅子靠背家用宿舍書桌麻將座椅弓形辦公室職員會議椅舒適久坐62695690797611219850.00%5廠家直銷電腦椅人體工學(xué)辦公椅64226942032813833850.00%6椅子靠背家用一棵檸檬塑料透氣62566215062215639650.00%7可躺電腦椅家用辦公椅游戲電競椅子靠背人體工學(xué)舒適久坐學(xué)生座椅65354119576521847850.00%8人體工學(xué)電腦椅靠背家用書房452765090911699169947.03%..................序號寶貝標題寶貝id原價最低原價最高折扣率1職員學(xué)生宿舍弓型會議椅63908328307216926966.54%2卡勒維家用皮質(zhì)鐵架電競椅包郵55833688008130974977.30%3電腦椅學(xué)生游戲椅子電競椅可躺617248419464318103850.00%4電腦椅子靠背家用宿舍書桌麻將座椅弓形辦公室職員會議椅舒適久坐62695690797611219850.00%5廠家直銷電腦椅人體工學(xué)辦公椅64226942032813833850.00%6椅子靠背家用一棵檸檬塑料透氣62566215062215639650.00%7可躺電腦椅家用辦公椅游戲電競椅子靠背人體工學(xué)舒適久坐學(xué)生座椅65354119576521847850.00%8人體工學(xué)電腦椅靠背家用書房452765090911699169947.03%..................(二)特征選擇根據(jù)上述的案例實現(xiàn)思路,需要將“銷售價最低”數(shù)據(jù)設(shè)置為特征,為下面的算法運用創(chuàng)造條件,如圖2-2所示。圖2-2特征選擇(三)設(shè)置K均值與聚類訓(xùn)練在平臺中實現(xiàn)k-means算法,需要設(shè)置k均值,并且對數(shù)據(jù)進行聚類訓(xùn)練。該步驟的目的是為了通過聚類算法將產(chǎn)品銷售價細分成多個價格帶。本案例對K均值進行設(shè)置時,將K值設(shè)置為“7”,代表了一共會形成7個類,分別對應(yīng)7個價格帶。另外,歸一化可以讓不同維度之間的特征在數(shù)值上有一定比較性,這樣可以大大提高分類器的準確性。這里歸一化的方法選擇為MinMaxScaler,其它設(shè)置如圖2-3所示,整體模型流程如圖2-4所示。圖2-3設(shè)置K均值參數(shù)圖2-4k-means算法實現(xiàn)圖2-5預(yù)測結(jié)果
根據(jù)聚類訓(xùn)練的基本算法步驟,預(yù)測結(jié)果如圖2-5所示,共有數(shù)據(jù)400條,其中prediction字段為對應(yīng)的類別。(四)聚合通過對聚類訓(xùn)練的輸出結(jié)果進行聚合,獲取每個類的價格帶范圍,具體包括:以分類結(jié)果prediction為分組依據(jù),獲取“銷售價最低”字段的最小值(Min)和最大值(Max);對“總銷售額”字段進行求和(Sum),獲取每個價格帶的總銷售額;對“總銷量”字段進行求和(Sum),獲取每個價格帶的總銷量;對“寶貝id”字段進行計數(shù)(Count),獲取每個價格帶的在線商品數(shù);對“總銷售額”字段進行求平均數(shù)(Avg),獲取每個價格帶的平均銷售額,即為了便于商家觀察數(shù)據(jù)找到合適的價格帶進行產(chǎn)品定價,這里可以拖拽“聚合”節(jié)點,建立如圖2-6所示關(guān)聯(lián)。圖2-6聚合進一步添加聚合配置如表2-2所示。表2-2
聚合條件配置已選字段結(jié)果列名操作prediction分類Group銷售價最低價格帶(最低)Min銷售價最低價格帶(最高)Max總銷售額總銷售額Sum總銷量總銷量Sum寶貝id在線商品數(shù)Count總銷售額平均銷售額Avg拖實驗結(jié)果按照“銷售價最低”將市場價格細分為7個價格帶,不同價格帶的數(shù)據(jù)展現(xiàn)如表2-3所示。表2-3
聚合結(jié)果分類價格帶(最低)價格帶(最高)總銷量在線商品數(shù)13959449957871366388638813406132488263916574353288328832451141699217910897162549134911639964803250914470742338通過聚合結(jié)果可以看出每個類的價格段(表2-4):表2-4
價格段展示分類價格段032-509元13959-4499元2549-1349元32488-2639元41699-2179元53288元66388元(五)可視化將聚合結(jié)果轉(zhuǎn)為平臺數(shù)據(jù)集(數(shù)據(jù)集→新建自助數(shù)據(jù)集),再利用【自助儀表盤】進行數(shù)據(jù)可視化:(1)查看每個類的總銷售金額;(2)查看每個類的總銷量;(3)查看每個類的商品數(shù)量;(4)查看每個類的平均銷售金額。圖2-7選擇數(shù)據(jù)集圖2-8圖形以上4個內(nèi)容的步驟相同,這里以第1個圖形“總銷售金額”的制作進行舉例。首先,在界面左側(cè)選擇對應(yīng)的數(shù)據(jù)集(如圖2-7);其次,將上方的菜單欄中的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度旅游項目開發(fā)貸款合同模板
- 生鐵購銷合同
- 電影項目投資制作合同
- 環(huán)境污染治理設(shè)施運營服務(wù)合同
- 新興技術(shù)孵化項目投資合同
- 機械設(shè)備租賃使用免責(zé)合同
- 二零二五年度啤酒品牌形象設(shè)計與宣傳合同4篇
- 物流信息化系統(tǒng)建設(shè)投資合同
- 連鎖加盟合同
- 土地合同貸款抵押合同范本
- 城鄉(xiāng)環(huán)衛(wèi)一體化保潔服務(wù)迎接重大節(jié)日、活動的保障措施
- 醫(yī)院-9S管理共88張課件
- 設(shè)立登記通知書
- 高考作文復(fù)習(xí):議論文論證方法課件15張
- 2022醫(yī)學(xué)課件前列腺炎指南模板
- MySQL數(shù)據(jù)庫項目式教程完整版課件全書電子教案教材課件(完整)
- 藥品生產(chǎn)質(zhì)量管理工程完整版課件
- 《網(wǎng)絡(luò)服務(wù)器搭建、配置與管理-Linux(RHEL8、CentOS8)(微課版)(第4版)》全冊電子教案
- 職業(yè)衛(wèi)生教學(xué)課件生物性有害因素所致職業(yè)性損害
- 降“四高”健康教育課件
- 五十鈴、豐田全球化研究
評論
0/150
提交評論