版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
客戶關系管理第1頁,共63頁,2023年,2月20日,星期四Modeler界面四個工作區(qū)域:數(shù)據(jù)流區(qū)、節(jié)點區(qū)(選項板)、管理器區(qū)、工程管理區(qū)建模:通過連接節(jié)點構成數(shù)據(jù)流建立模型節(jié)點類型數(shù)據(jù)源節(jié)點:將數(shù)據(jù)引入SPSSModeler記錄處理節(jié)點:對數(shù)據(jù)記錄執(zhí)行操作,如選擇、合并和追加等字段選項節(jié)點:對數(shù)據(jù)字段執(zhí)行操作,如過濾、導出新字段等圖形節(jié)點:在建模前后以圖表形式顯示數(shù)據(jù)建模節(jié)點:使用SPSSModeler中提供的建模算法輸出節(jié)點:生成可在SPSSModeler中查看的數(shù)據(jù)、圖表和模型等多種輸出結果導出節(jié)點:生成可在外部應用程序中查看的多種輸出2第2頁,共63頁,2023年,2月20日,星期四Modeler數(shù)據(jù)分析步驟讀取數(shù)據(jù)數(shù)據(jù)整理字段和記錄:數(shù)據(jù)初處理數(shù)據(jù)理解建模模型評估結果發(fā)布3第3頁,共63頁,2023年,2月20日,星期四構建數(shù)據(jù)流的基本操作節(jié)點增加節(jié)點刪除節(jié)點的編輯節(jié)點連接:以形成數(shù)據(jù)流4第4頁,共63頁,2023年,2月20日,星期四一、數(shù)據(jù)源可變文件:從自由格式文本文件(其記錄包含的字段數(shù)不變,但包含的字符數(shù)可改變)中讀資料;固定文件:從固定字段文本文件中讀入資料(其字段沒有被分隔,但開始位置相同且長度固定);數(shù)據(jù)庫:使用ODBC來源節(jié)點從其它各種數(shù)據(jù)庫中導入資料Excel用戶輸入:字段名、字段類型、值,生成所有組合或按順序的數(shù)據(jù)序列5第5頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)類型數(shù)據(jù)存儲類型:字符串型、整數(shù)型、實數(shù)型、日期型、時間型等;數(shù)據(jù)類型:連續(xù)型、離散型、標志型、集合型、有序集合、無類型;標志:用于只取兩個具體值的數(shù)據(jù)(Yes/No,0/1)集合:用于描述帶有多個具體值的數(shù)據(jù)(地區(qū));有序集合:用于描述帶有多個具體值且有順序的數(shù)據(jù)(教育程度)6第6頁,共63頁,2023年,2月20日,星期四二、記錄選項選擇:根據(jù)具體條件從資料流程中選擇或排除某一記錄子集;抽樣:限制通過流的記錄數(shù)或排除一定比例的記錄;匯總:把一系列輸入記錄變換成匯總性輸出記錄;排序:根據(jù)一個或多個字段值對記錄進行升序或降序排列7第7頁,共63頁,2023年,2月20日,星期四三、字段選項類型:指定字段的一系列重要屬性;過濾:(1)從通過的記錄中過濾或剔除字段;(2)重命名字段;(3)把字段從一個來源節(jié)點映射到另一個填充:替換字段值以及改變存儲類型8第8頁,共63頁,2023年,2月20日,星期四Modeler模型的類型(1)決策樹模型用于分類,基于一組決策規(guī)則來預測或分類未來的觀測值。C&RT(分類和回歸樹)節(jié)點生成可用于預測和分類未來觀測值的決策樹CHAID使用卡方統(tǒng)計量來生成決策樹,以確定最佳的分割。CHAID與C&RT節(jié)點不一樣,它可以生成非二元樹,這意味著有些分割將有多于兩個的分支。C5.0節(jié)點構建決策樹或規(guī)則集。目標字段必須為分類字段。9第9頁,共63頁,2023年,2月20日,星期四Modeler模型的類型(2)神經(jīng)網(wǎng)絡模型神經(jīng)網(wǎng)絡節(jié)點使用的模型是對人類大腦處理信息的方式簡化了的模型。只需要最少的統(tǒng)計或數(shù)學知識就可以對其進行訓練或應用。10第10頁,共63頁,2023年,2月20日,星期四Modeler模型的類型(3)聚類模型K-Means節(jié)點將數(shù)據(jù)集聚類到不同分組(或聚類)TwoStep節(jié)點使用兩步聚類方法。第一步完成簡單數(shù)據(jù)處理,以便將原始輸入數(shù)據(jù)壓縮為可管理的子聚類集合。第二步使用層級聚類方法將子聚類一步一步合并為更大的聚類。Kohonen節(jié)點會生成一種神經(jīng)網(wǎng)絡,此神經(jīng)網(wǎng)絡可用于將數(shù)據(jù)集聚類到各個差異組。11第11頁,共63頁,2023年,2月20日,星期四Modeler模型的類型(4)關聯(lián)模型將一組條件與一個特定結論(例如決定購買某樣東西)相關聯(lián)廣義規(guī)則歸納法(GRI)節(jié)點將發(fā)現(xiàn)數(shù)據(jù)關聯(lián)規(guī)則。例如,購買了剔須刀的客戶在購買剔須膏之后,還可能會購買剔須霜。Apriori(先驗)節(jié)點從數(shù)據(jù)抽取一組規(guī)則,即抽取信息內容最多的規(guī)則。序列節(jié)點可發(fā)現(xiàn)連續(xù)數(shù)據(jù)或與時間有關的數(shù)據(jù)中的關聯(lián)規(guī)則。例如,一個購買了剃刀和須后水的顧客可能在下次購物時購買剃須膏。12第12頁,共63頁,2023年,2月20日,星期四四、圖形使用圖形節(jié)點對數(shù)據(jù)進行探索性分析散點圖分布圖直方圖集合網(wǎng)絡圖……13第13頁,共63頁,2023年,2月20日,星期四建模分析(1):CHAID決策樹背景:某電話公司的數(shù)據(jù)倉庫包含有關該公司的5000名客戶對特定促銷活動響應的信息。數(shù)據(jù)中包括客戶年齡、職業(yè)、收入和電話使用統(tǒng)計量。其中有三個“目標”字段,顯示客戶是否響應這三種促銷。公司希望利用此數(shù)據(jù)幫助預測未來中最有可能對類似的促銷活動作出響應的客戶。數(shù)據(jù)源:customer_dbase.sav14第14頁,共63頁,2023年,2月20日,星期四使用CHAID決策樹開發(fā)模型,用以預測最有可能響應某一次促銷活動(Response_01)的客戶。方法:不使用特征選擇。數(shù)據(jù)集中的所有預測變量字段用作CHAID樹的輸入。使用特征選擇模型。使用特征選擇節(jié)點選擇最佳的10個預測變量,然后將其輸入到CHAID樹中。15第15頁,共63頁,2023年,2月20日,星期四添加類型節(jié)點并將response_01的方向設置為輸出;將客戶ID(custid)和其他響應字段(response_02和response_03)的方向設置為無;將所有其他字段的方向設置為輸入;添加特征選擇建模節(jié)點;執(zhí)行流以生成特征選擇模型。16第16頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)流生成的特征選擇模型顯示了所找到的對預測非常有用的字段,選擇前10個預測變量17第17頁,共63頁,2023年,2月20日,星期四CHAID分析結果18第18頁,共63頁,2023年,2月20日,星期四結果解釋查看器-生成樹第二個樹比第一個樹包含的樹節(jié)點要少,但其是否能夠有效分出對于促銷活動相應的客戶?有效性比較-收益選擇目標類別為1(即響應營銷活動的),將樹的終端節(jié)點分組為四分位數(shù)。要比較兩個模型的有效性,可查看每個表中四分位數(shù)的提升(即指數(shù)值的變化)。同時考慮終端葉子節(jié)點的數(shù)量19第19頁,共63頁,2023年,2月20日,星期四建模分析(2):C&RT決策樹分類和回歸樹節(jié)點(C&RT)是一種基于樹的分類和預測方法,此方法使用遞歸分區(qū)將訓練記錄分割為多個具有相似的輸出字段值的段。背景:將C&RT決策樹模型應用于有線電視銷售的客戶分析,其中的目標字段為是否有意預訂有線電視交互服務。預測變量字段包括年齡、性別、教育、收入類別、每天看電視的時間和子女數(shù)(按有序集合編碼,值5表示5個或更多)。數(shù)據(jù)源:NewsChan.sav20第20頁,共63頁,2023年,2月20日,星期四類型節(jié)點設置NEWSCHAN設置為標志,方向設置為輸出;其他所有字段用作預測變量(輸入)。模型參數(shù)設置交互會話選擇專家模式,修剪樹和使用標準誤規(guī)則,最小雜質改變值設置為0.003(增加此值可傾向于生成較簡單的樹)。停止標準:最小絕對臨界值為25和10。21第21頁,共63頁,2023年,2月20日,星期四執(zhí)行節(jié)點。此時將出現(xiàn)交互樹窗口,在其中可以生成并編輯樹。生成樹和修剪(五層和五個終端節(jié)點)根據(jù)當前樹生成模型可使用此流生成模型,將生成的NEWSCHAN1模型連接到類型節(jié)點。并將其連接表節(jié)點并執(zhí)行流。22第22頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)流23第23頁,共63頁,2023年,2月20日,星期四結果解釋單擊交互樹窗口底部的收益選項卡,選擇1為目標類別以查看響應“是”的收益。收益:節(jié)點中具有目標類別的數(shù)量/占總體的百分比響應:節(jié)點中具有目標類別的百分比指數(shù)值:大于100%的節(jié)點表示,通過從這些節(jié)點中選擇記錄而不是從整個樣本中隨機選擇記錄,能夠有更多的機會找到愿意接受預訂的用戶。選中目標節(jié)點,生成“選擇節(jié)點”從總體數(shù)據(jù)中生成滿足目標類別的樣本生成模型——導出到表(預測值、置信度)24第24頁,共63頁,2023年,2月20日,星期四建模分析(3):關聯(lián)分析與客戶描述關聯(lián)規(guī)則分析的兩種方法:可視化技術(例如Web圖節(jié)點)關聯(lián)規(guī)則模型背景:超市客戶數(shù)據(jù),包括客戶基本信息和購買商品信息,通過關聯(lián)分析尋找客戶購買產(chǎn)品之間的關系并且按人口統(tǒng)計信息(年齡、收入等)刻畫其目標客戶群體的特征數(shù)據(jù)源:BASKETS1n文本數(shù)據(jù)25第25頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)流構建類型節(jié)點設置讀取值設置類型:將用戶卡號cardid的類型設置為無類型,統(tǒng)計數(shù)據(jù)的方向均設置為無(在模型中不使用),產(chǎn)品類別設置為標志類型,并將方向設置為雙向(同時作為模型的輸入和輸出變量)。加入表節(jié)點:進行數(shù)據(jù)瀏覽三大類型數(shù)據(jù):購物籃信息(卡號、購買價格、支付方式),持卡人信息(性別、住房、收入、年齡),商品類型信息(蔬菜水果類、鮮肉類、奶制品、罐頭蔬菜類等等)26第26頁,共63頁,2023年,2月20日,星期四模型建立加入web圖節(jié)點加入關聯(lián)分析Apriori\CARMA\GRI模型(一般規(guī)則歸納法)Apriori模型可以接受兩種數(shù)據(jù)排列方式,GRI和CARMA只接受一種排列方式;只接受名義字段,且字段在方向設定時必須為雙向。設置模型參數(shù)支持度S=P(A∪B)置信度C=P(B|A)Lift=P(AUB)/P(A)P(B)27第27頁,共63頁,2023年,2月20日,星期四28第28頁,共63頁,2023年,2月20日,星期四結果解釋GRI關聯(lián)分析結果:多種商品之間存在關聯(lián);Web圖29第29頁,共63頁,2023年,2月20日,星期四設置web圖選擇全部產(chǎn)品類型字段,僅顯示真值標志(同時為T的購買記錄)拉動鏈接數(shù)顯示滑塊,當顯示鏈接高于100時,可獲得三個強鏈接Web輸出控件的對話框中可指定弱連接和強連接(單擊工具欄上的黃色雙箭頭按鈕,展開顯示)在web圖設置選項中可預設30第30頁,共63頁,2023年,2月20日,星期四結果解釋三類關聯(lián)商品突出顯示:魚和果蔬;酒和糖果;啤酒、冷凍肉和罐裝蔬菜決策建議:商品陳列:在擺放貨架時,應該把罐裝蔬菜、冷凍肉品和啤酒放在相鄰的位置,把酒和糖果放在一起;客戶細分:三種關聯(lián)產(chǎn)品類別意味著三種不同購買習慣的客戶31第31頁,共63頁,2023年,2月20日,星期四客戶細分和描述根據(jù)客戶購買的產(chǎn)品類型標識了三個客戶群,但是還要知道這些客戶是誰,即識別他們的人口統(tǒng)計學特征,需要為每個群中的每名客戶添加標志使用規(guī)則歸納(C5.0模型,除了生成決策樹外還可以生成規(guī)則)來基于規(guī)則描繪這些標志的特征,可以實現(xiàn)這一點。32第32頁,共63頁,2023年,2月20日,星期四構建數(shù)據(jù)流使用創(chuàng)建的Web圖,可以自動生成每個群的標志。使用鼠標右鍵,單擊fruitveg和fish之間的鏈接,并選擇為鏈接生成導出節(jié)點。加入新類型節(jié)點,并進行參數(shù)設置:輸入、輸出變量。加入C5.0模型節(jié)點,設置為輸出規(guī)則集33第33頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)流34第34頁,共63頁,2023年,2月20日,星期四結果解釋規(guī)則1用于Tifincome<=16900andsex=MthenT購買“非健康食品”的客戶特征為收入小于16900且性別為Male決策建議:在零售領域,可能會使用這種客戶組確定特殊優(yōu)惠目標,以提高促銷響應率。35第35頁,共63頁,2023年,2月20日,星期四建模分析(4):Logistic回歸分析Logistic回歸可根據(jù)輸入字段的值對記錄進行分類。這種統(tǒng)計方法類似于線性回歸,但是它使用的是分類目標字段而非數(shù)值目標字段。背景:假設某個電信服務提供商非常關心流失到競爭對手那里的客戶數(shù)。如果可以使用服務使用數(shù)據(jù)預測有可能轉移到其他提供商的客戶,則可通過定制服務使用數(shù)據(jù)來盡可能多地保留這些客戶。因為目標含有兩個截然不同的類別,因此將使用二項模型。如果目標中含有多個類別,則會轉而創(chuàng)建多項模型。數(shù)據(jù)源:telco.sav36第36頁,共63頁,2023年,2月20日,星期四類型節(jié)點設置添加類型節(jié)點以定義字段,確保所有類型都已正確設置。例如,值為0和1的大多數(shù)字段都可看作是標志字段。流失字段(churn)的類型設置為標志,并將其方向設置為輸出。所有其他字段的方向應設置為輸入。37第37頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)流構建將特征選擇節(jié)點添加到SPSS文件節(jié)點并運行,從生成的模型節(jié)點中創(chuàng)建過濾節(jié)點,使用過濾節(jié)點選擇被認為很重要的數(shù)據(jù)來用作預測變量。將Logistic節(jié)點添加到超節(jié)點。在Logistic節(jié)點上,單擊“模型”選項卡并選擇二項過程。在二項過程區(qū)域,選擇前進法(逐步向模型中增加預測變量)。38第38頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)流39第39頁,共63頁,2023年,2月20日,星期四結果解釋獲得客戶流失的五個關鍵性影響變量分類表:識別流失客戶的準確率42.4%,識別非流失客戶的準確率92.3%,總體準確率79.2%方程中的變量:回歸系數(shù)、顯著性輸出表節(jié)點:每個客戶的流失與否的概率40第40頁,共63頁,2023年,2月20日,星期四建模分析(4):Logistic回歸分析背景:假設該電信服務提供商已按照服務使用模式對其客戶群進行了劃分(custcat字段),將這些客戶分類到四個組中。使用人口統(tǒng)計數(shù)據(jù)預測客戶的所屬類別。數(shù)據(jù)源:telco.sav類型節(jié)點設置:客戶類別字段(custcat)的方向設置為輸出。所有其他字段的方向都應設置為輸入。過濾節(jié)點設置:使用過濾節(jié)點以選取相關字段(地區(qū)、年齡、婚姻狀況、地址、收入、教育程度、行業(yè)、退休、性別、居住地和客戶類別)。其他字段可以排除在此分析之外。41第41頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)流構建添加Logistic節(jié)點,參數(shù)設置:選擇多項式Logistic,單擊模型選項卡并選擇逐步法。在“專家”選項卡上,選中專家模式,選中輸出,然后在“高級輸出”對話框中選中分類表。42第42頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)流43第43頁,共63頁,2023年,2月20日,星期四結果解釋回歸方程顯示在人口統(tǒng)計指標中,模型識別出可用于預測客戶分組的主要指標包括:地址、教育程度、行業(yè)、居住地。分類表顯示了此模型的結果,其總體分類正確率為39.9%。特別是,此模型在識別類別4客戶時表現(xiàn)優(yōu)異(56.8%),而在識別類別2客戶時表現(xiàn)很差(4.6%)。44第44頁,共63頁,2023年,2月20日,星期四建模分析(5):神經(jīng)網(wǎng)絡神經(jīng)網(wǎng)絡節(jié)點用于創(chuàng)建并訓練神經(jīng)網(wǎng)絡,通過學習過程(檢查單個記錄、為每個記錄生成預測、發(fā)現(xiàn)錯誤預測便對模型權值進行調整),神經(jīng)網(wǎng)絡可不斷提高預測效果。神經(jīng)網(wǎng)絡的三層:輸入層、隱藏層、輸出層隱藏層與神經(jīng)單元越多,神經(jīng)網(wǎng)絡越利于分析復雜關系45第45頁,共63頁,2023年,2月20日,星期四構建數(shù)據(jù)流預測零售產(chǎn)品類型和促銷活動對銷售的影響數(shù)據(jù)源節(jié)點:GOODS1n和GOODS2n字段選項節(jié)點:導出節(jié)點:增加Increase字段類型節(jié)點加入散點圖節(jié)點:探索Increase與Promotion之間的變化關系。加入神經(jīng)網(wǎng)絡模型,并通過表節(jié)點輸出結果46第46頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)流47第47頁,共63頁,2023年,2月20日,星期四結果解釋-散點圖促銷投入與銷量增長之間的潛在線性關系48第48頁,共63頁,2023年,2月20日,星期四結果解釋-神經(jīng)網(wǎng)絡 估計的準確性:91.892
輸入層:7個神經(jīng)元 隱藏層1:3個神經(jīng)元 輸出層:1個神經(jīng)元 輸入的相對重要性
Class0.4626 Promotion0.282694 Cost0.0247975 Before0.013556949第49頁,共63頁,2023年,2月20日,星期四模型應用可以將該神經(jīng)網(wǎng)絡模型用于預測促銷投入對于銷售增長的拉動效果。導入數(shù)據(jù)GOOD2n,進行預測,將預測結果輸出為表,生成的$N-Increase為預測值50第50頁,共63頁,2023年,2月20日,星期四建模分析(6):聚類分析Modeler中聚類分析模型包括Kohonen、Kmeans、TwoStep。Kohonen由一個輸入單元層和一個處理單元組成的神經(jīng)網(wǎng)絡生成聚類映像。K-Means通過定義一組起始聚類中心進行分類,然后根據(jù)記錄的輸入閾值把每個記錄分到與其最相似的聚類。TwoStep是一種分兩步進行的聚類方法,第一步單獨通過數(shù)據(jù),第二步使用層次聚類方法。51第51頁,共63頁,2023年,2月20日,星期四聚類分析數(shù)據(jù)背景:對目標人群的健康情況進行分析,主要測量數(shù)據(jù)包括膽固醇、Na、Ka元素的含量,從而分為不同類別數(shù)據(jù)源:DRUG1n52第52頁,共63頁,2023年,2月20日,星期四類型節(jié)點:由于事先不知道數(shù)據(jù)的分類情況,聚類模型中參與分類的所有的字段方向均設置為輸入,Drug方向設置為無。加入聚類模型Kmeans節(jié)點:設置聚類數(shù)生成距離字段:某記錄與該類中心的距離顯示相似度:類與類間的距離執(zhí)行,生成模型結果節(jié)點加入圖形節(jié)點:分布圖53第53頁,共63頁,2023年,2月20日,星期四數(shù)據(jù)流54第54頁,共63頁,2023年,2月20日,星期四結果解釋55第55頁,共63頁,2023年,2月20日,星期四決策列表通過目標變量(yes或no)標識了子組或段,例如,尋找那些最不可能流失的客戶或最有可能對某個商業(yè)活動作出積極響應的客戶。段、規(guī)則和條件:模型由段列表組成,每個段由選擇匹配記錄的規(guī)則進行定義,給定的規(guī)則可以有多個條件要求:目標變量為標志類型或集合的分類目標字段,至少一個預測變量(輸入)字段。當目標字段類型為集合時,必須手動選擇一個值作為匹配或響應;所有其他值集中在一起作為不匹配。56第56頁,共63頁,2023年,2月2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同管理培訓合同:上海項目實踐與招投標(2025版)
- 二零二五年度智慧城市建設名義合伙人合同3篇
- 2025年度農(nóng)民工勞動合同電子化管理方案及實施細則3篇
- 二零二五年度農(nóng)業(yè)產(chǎn)業(yè)鏈金融服務創(chuàng)新合同-@-1
- 2025版企業(yè)內部設備維修承包合同規(guī)范文本4篇
- 2025年度排洪渠項目監(jiān)理合同模板3篇
- 二零二五年度人工智能核心算法軟件知識產(chǎn)權獨家轉讓合同3篇
- 二零二五年度全新品牌專賣店開設服務合同范本4篇
- 2025年度票據(jù)代理業(yè)務委托合同范本6篇
- 2025年度苗圃技術員崗位聘用合同修訂版
- 勞務派遣勞務外包服務方案(技術方案)
- GB/T 43391-2023市場、民意和社會調查調查報告編制指南
- 拔罐技術操作考核評分標準
- 戒賭法律協(xié)議書范本
- 競選市級三好學生PPT
- 2024屆甘肅省蘭州市五十一中生物高一上期末檢測模擬試題含解析
- 高標準農(nóng)田建設上圖入庫(技術培訓)
- 火災隱患整改登記表
- 天津華寧KTC101說明書
- 【智慧校園】-智慧校園系統(tǒng)方案
- 外研版高中新教材英語單詞表(必修一)
評論
0/150
提交評論