大數(shù)據(jù)與商務(wù)智能 研究家庭收入跟教育程度年齡就業(yè)年限之間的關(guān)系_第1頁
大數(shù)據(jù)與商務(wù)智能 研究家庭收入跟教育程度年齡就業(yè)年限之間的關(guān)系_第2頁
大數(shù)據(jù)與商務(wù)智能 研究家庭收入跟教育程度年齡就業(yè)年限之間的關(guān)系_第3頁
大數(shù)據(jù)與商務(wù)智能 研究家庭收入跟教育程度年齡就業(yè)年限之間的關(guān)系_第4頁
大數(shù)據(jù)與商務(wù)智能 研究家庭收入跟教育程度年齡就業(yè)年限之間的關(guān)系_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、基于SPSS軟件的Statistics 分析研究家庭收入跟教育程度,年齡,就業(yè)年限之間的關(guān)系 家庭收入的描述性統(tǒng)計Household Encome In77J35003:3B5034thou胡M尋平嗎馳95%拄倩區(qū)風(fēng)下呱倚上陋7C.B9241B4.177595%嚴(yán)懇蝕値62J 5S6747.0000011458.453107,0441659J0D166B.nDIBEDOD54 000Q.64369.597.155瞄異國工0岳尋&邯-Twrrtr可審罵當(dāng) 溝“ B 3PF!H,*af p豆Frmqlfwnfy .S1E 日 hETMFT2J09 1 JW 心黑 4 鴉瞥會彗 777 B.舉LL.

2、oli s占二& 2囂盂iLt卅如蠱4富說主畫-t融CR輻曹說樂Issn鳥匚|國裁駆ar Did 燈 cojrpte r*匸一 P-Q匸*禍n 口工ODODie moll-igntCTOCl tegj e*h gh achoalsvnt eotfsCdflQr dtQie Pol-jirgracuite dEQrct家庭收入和就業(yè)年限的散點圖2000.000SPLtfJMno 上一 u-4JIUQPW poHW5n0H1500.000-looo.aoo500.030ooooti9JODO4DWD5DOOO就業(yè)年限Pearson相關(guān)性系數(shù)分析相關(guān)性Household income in thou

3、sands教育程度Household income inPearson相關(guān)性1.114*|thousands顯著性(雙尾).000N10001000教育程度Pearson相關(guān)性*.1141顯著性(雙尾).000N10001000*.在置信度(雙測)為0.01時,相關(guān)性是顯著的。相關(guān)性Householdincome inthousands就業(yè)年限Household income inPearson相關(guān)性1.516 *nthousands顯著性(雙尾).000N10001000就業(yè)年限Pearson相關(guān)性*.5161顯著性(雙尾).000HN10001000*.在置信度(雙測)為0.01時,相關(guān)性

4、是顯著的。相關(guān)性Householdincome inthousands就業(yè)年限Age in years 教攵Household income inPearson相關(guān)性1|.516|.328thousands顯著性(雙尾).000.000N100010001000就業(yè)年限Pearson相關(guān)性*.5161|.670顯著性(雙尾).000.000N100010001000Age in yearsPearson相關(guān)性*.328|.6701顯著性(雙尾).000.000N100010001000教育程度Pearson相關(guān)性*.114|-.229|-.155顯著性(雙尾).000.000.000N1000

5、10001000*.在置信度(雙測)為 0.01時,相關(guān)性是顯著的、實驗(實訓(xùn))概述:【目的及要求】目的:熟悉數(shù)據(jù)流的構(gòu)建過程,掌握決策樹模型在客戶分析中的應(yīng)用。要求:根據(jù)實驗步驟完成數(shù)據(jù)流建立,并獲得分析結(jié)果。實驗結(jié)束后提交實驗報告?!净驹怼繑?shù)據(jù)挖掘流程;決策樹模型;【實施環(huán)境】(使用的材料、設(shè)備、軟件)Win dows 操作系統(tǒng), Modeler 14.1二、實驗(實訓(xùn))內(nèi)容:【項目內(nèi)容】應(yīng)用Modeler 14.1 的決策樹模型(CHAID )進行客戶數(shù)據(jù)分析,獲得客戶分類結(jié)果?!痉桨冈O(shè)計】應(yīng)用exp1.sav數(shù)據(jù),預(yù)測對于產(chǎn)生流失行為(churn=1)的客戶特征,使用交互會話方式生

6、成決策樹模型。a)數(shù)據(jù)準(zhǔn)備:對原始數(shù)據(jù)中缺失值過多的字段按照自定義規(guī)則(說明規(guī)則內(nèi)容) 進行處理;b)隨機抽取n% (n為個人學(xué)號最后兩位加上 30的值,若個人學(xué)號最后兩位為14則n值為44)的記錄,使用 CHAID模型進行預(yù)測,說明 CHAID模型的參數(shù)設(shè)置,生成交互式?jīng)Q策樹,找出模型結(jié)果中索引指數(shù)最大的幾個葉子節(jié)點,并 分析這些最可能流失客戶的特征;c)先使用特征選擇模型,選擇最重要的10個變量,然后再用 CHAID模型預(yù)測,說明CHAID模型的參數(shù)設(shè)置,生成更為簡潔的決策樹,找出模型結(jié)果中索引指數(shù)最大的幾個葉子節(jié)點,并分析這些最可能流失客戶的特征;【實驗(實訓(xùn))過程】(步驟、記錄、數(shù)據(jù)、

7、程序等)a)選擇服務(wù)時限,年齡,收入,受教育程度,雇傭時長,性別,設(shè)備租用,以及上網(wǎng)時間,電子賬單作為預(yù)測變量ME磋5阿WMHKjruMltijHgarlijubMh11* AOi .&a : 酉it! 一 v電護二一 Ir* ejn.jMjrqRIL71VTB,* A 雹竜 土比丸壬 *= M 也 r- * T_7;誥置施機敎種子確走 取消設(shè)置目標(biāo)變量和預(yù)測變量如下Q超如詫尸7擁李袖U呂祎標(biāo)隹複型誠則W初屜.僥冋_輕4一再行八財注翌包構(gòu)進選血 櫃型詡頁刪 注釋C侵用憑走交角色U 倉恨用自走賈學(xué)皿分取設(shè)置模型名稱為自己的學(xué)號和姓名運行決策樹J 側(cè)汽?用門- lEMiT SPSS E文件ittt

8、 I4. 屈 IM曲右直期助點擊查看器可以看到整個決策樹如下26 000.67 000)節(jié)D MO它 qtnpMl F ffO CDO一卡巧=2鯛.af=lett軸;9itenfjieMJ P HE EHJQ.卡護 1J5 93*.昨 3QlOOO 7MQ 494啟計 1Q0 OOO 698ctiurn1.000.憂1昂朋2終有可能流失的客戶特征如下:節(jié)點3-節(jié)點7 :服務(wù)時限節(jié)約26到57之間,非租用設(shè)備r0 0DO計 2&O71 T92BH MC0101定計 iU73 toe側(cè)卩H.000,嘀方斗工財忑d#= 1OQCC 33 50J 柏 *tOO0 80.3M *1節(jié)穴good 門廠.9

9、節(jié)點T曲_豊吏J K0 F9 H W21000 10909 201 &000節(jié)點I糞31舊 旦:0 000 31 42? 2JJU翌丄衛(wèi)號怎“稠第査2%fi0 00056.939 119 I QOO43 06 2 9DSI+J9 刑 3 209H36 000. 26 (MO1. 57 000 丄筋4%1 nQ.QQD如斯131 1 0OQ5 0口7.Sit1977T 13添加特征選擇模型,運行,可以得到最重要的字段khumX亠文件 o (lESIm)KLsIr帥Fr22連解等級宀區(qū)兀equip&2 W internetjM3 乜? ebill*4沏云:-匸X獎乂乂序義V宕宕名名有名立:oice

10、 0 _8 wireless 水馭IO g訛二*名義112 i 16 * multline 17 region:18 ;gento=LJ 杓 C/0- -tiX文義義文義$lilJI7LLIA- ur, -Jllr.- a IJ 7LLTL TJmr 1 hl.- IJHrJ -.rxL-TlgJJS99ini- i H -.-TJ*1JA?0r?4?-|W1W-一V.WBl_!L?,w-13 CCS陽浮罰:0筑*萬二r h碣 審已(l : 1Q【結(jié)論】(結(jié)果、分析)最有可能流失客戶的特征如下:非租用設(shè)備,有Call機,不上網(wǎng),沒有語音信箱,沒有電子賬單三、指導(dǎo)教師評語及成績: 評語:成績:指

11、導(dǎo)教師簽名:批閱日期:【項目內(nèi)容】應(yīng)用Modeler 14.1的決策樹模型(C&RT )與貝葉斯網(wǎng)絡(luò)模型進行客戶數(shù)據(jù)分析,獲得客 戶分類結(jié)果?!痉桨冈O(shè)計】注意:在建模操作過程中,將模型名稱修改為自己的學(xué)號+姓名。應(yīng)用exp2.xls數(shù)據(jù),預(yù)測產(chǎn)生服務(wù)預(yù)訂行為(是否預(yù)訂本服務(wù)=1)的客戶特征。按照自己學(xué)號最后兩位,隨機抽取該比例加30%的數(shù)據(jù)記錄(學(xué)號為 1號,抽取31%的數(shù)據(jù)記錄),使用特征選擇模型選取重要性等于1的字段,使用貝葉斯網(wǎng)絡(luò)模型獲得貝葉斯網(wǎng)絡(luò)圖;分析模型預(yù)測準(zhǔn)確性?!緦嶒灒▽嵱?xùn))過程】(步驟、記錄、數(shù)據(jù)、程序等)導(dǎo)入excel數(shù)據(jù),并設(shè)置是否預(yù)定本服務(wù)為目標(biāo)SB OH IG P7

12、H * WlH IBrJ RkMMtl5 m遠(yuǎn)工阿s 越時勻舌團生出 於 Hllttc 述里當(dāng)豐H?毛験機脅 夠徉耶制E由迓迪是二龍陽祇珂哇槽七忙加“1 D2S.3Q.4D H11D0 DQ laZDJQi1 D 2 flr10 4 9.5 0 MMdIMO 姙 fiJOh 1*.6Hh4 逋 AoFtiTJiVfi-仲01MQ1AD0IMOtna MQ IMO1040 iMia選用記錄選項的樣本選項,根據(jù)自己學(xué)號的后兩位38+30,選取68% 的樣本躋班 層孚Ofc ? *誡卻住:灑昨觀鶴血二乜邏邏:選取建模選項里面的特征選擇,運行選取重要性大于1的字段訂本服芻w FL文件。生成txM1G1J3伽I$40 9980.9B& !0一湘0加J0.389(1884值1 0性W-匡3 _ bE港裁 愛-旁-HU HL-妾戛 垂一. 3*- 33 3- 3- 33 3- Fln 3- 3-*重要|:重萼 直重要8 94 6152 311 21 1k用用用用W用有 g使=1的字段作為輸入M201S7373B 李永剛字段模型專家分析注解使用類型節(jié)戌設(shè)蓋_1使用頻數(shù)芋拔啟使用定制設(shè)置確定Jl運行運)取消i應(yīng)用Sff_運行得到貝葉斯網(wǎng)絡(luò)【結(jié)論】(結(jié)果、分析)貝葉斯網(wǎng)絡(luò)I.在輸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論