




已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)挖掘與商務(wù)智能實驗實 驗 報 告實驗題目: 分類分析:決策樹 姓名: 王俊 學(xué)號: 201430850164 指導(dǎo)教師: 張大斌 實驗時間: 2016.11.10 2016年 11 月 12 日 實驗9 分析類型:決策樹一、 實驗?zāi)康模?) 了解和熟悉SPSS Modeler及其相關(guān)知識;(2) 掌握SPSS Modeler工具建立CHAID決策樹的方法;(3) 學(xué)會運用SPSS CHAID決策樹進行相關(guān)的內(nèi)容分析。二、 實驗內(nèi)容 本實驗以電信客戶數(shù)據(jù)(文件名為Telephone.sav)為例,數(shù)據(jù)中包含的變量x1到x15分別是:居住地、年齡、婚姻情況、家庭月收入(百萬)、受教育程度、性別、家庭人數(shù)、基本服務(wù)累計開通月數(shù)、是否申請無線轉(zhuǎn)移服務(wù)、上月基本費用、上月限制性免費服務(wù)項目的費用、無線服務(wù)費用、是否電子支付、客戶所申請的服務(wù)套餐類型和是否流失。本節(jié)的分析是在基本分析的基礎(chǔ)上進行的,具體的CHAID算法如下所示:三、 實驗步驟與結(jié)果 步驟1 創(chuàng)建CHAID數(shù)據(jù)流 (1)通過“statistic文件”節(jié)點讀入文件名為Telephone.sav的數(shù)據(jù)。 (2)數(shù)據(jù)流中添加“分區(qū)”節(jié)點,將樣本集劃分為訓(xùn)練集和測試集,如圖9-1所示。 (3)選擇建模模塊中的“CHAID(C)”節(jié)點,將其連接到數(shù)據(jù)流的恰當(dāng)位置。步驟2 設(shè)置具體參數(shù) (1)右擊鼠標(biāo),在“構(gòu)建選項”-“基本(B)”,選擇數(shù)的生長算法為Exhaustive CHAID。 自定義最大樹狀圖深度為5,如圖9-2所示。 (2)其他相關(guān)參數(shù)默認(rèn)設(shè)置。 步驟3 結(jié)果運行 實驗結(jié)果如圖9-3所示。 CHIAID首先確定開通月數(shù)為最佳的分組變量,將其分為3組,開通月數(shù)小于等于5的,開通月數(shù)大于31和開通月數(shù)大于5小于30的。按照一層一層進行分組,但很快會發(fā)現(xiàn)其中某些推理規(guī)則沒有太大的參考價值。例如,對于開通月數(shù)大于31個月的用戶,無論是否采用電子支付方式,年齡如何,婚姻如何,最終的結(jié)果都是未流失。這種情況于該算法的剪枝方式有一定的聯(lián)系。4、 實驗分析與擴展練習(xí)實驗分析:對于CHAID算法,SPSS Modeler如何進行交互方式建模?答:在進行交互建模時候,以下這些參數(shù)的調(diào)整都會對建模的結(jié)果造成一定的影響:A. 數(shù)據(jù)分區(qū)中的訓(xùn)練和測試分區(qū)以及設(shè)置隨機種子B.相關(guān)CHAID參數(shù)設(shè)置中的樹生長算法選擇和最大樹狀圖深度設(shè)置C.相關(guān)CHAID參數(shù)設(shè)置中的成長規(guī)則D.相關(guān)CHAID參數(shù)設(shè)置中的整體設(shè)置D.相關(guān)CHAID參數(shù)設(shè)置中的高級設(shè)置的分割和合并五、結(jié)論與討論(重點)通過這次實驗,我總結(jié)一下知識點:1.決策樹算法的優(yōu)點如下:(1)分類精度高;(2)生成的模式簡單;(3)對噪聲數(shù)據(jù)有很好的健壯性。因而是目前應(yīng)用最為廣泛的歸納推理算法之一,在數(shù)據(jù)挖掘中受到研究者的廣泛關(guān)注。 2.CHAID的一般步驟:(1.)屬性變量的預(yù)處理(2.)確定當(dāng)前分支變量和分隔值屬性變量的預(yù)處理:(1)對定類的屬性變量,在其多個分類水平中找到對目標(biāo)變量取值影響不顯著的分類,并合并它們; (2)對定距型屬性變量,先按分位點分組,然后再合并具有同質(zhì)性的組;(3)如果目標(biāo)變量是定類變量,則采用卡方檢驗(4)如果目標(biāo)變量為定距變量,則采用F檢驗每對預(yù)測分類的評估,以確定最顯著差異的因變量。由于這些合并步驟,通過計算修正邦費羅尼p值來合并交叉表。3.CHAID算法優(yōu)點:(1)可產(chǎn)生多分枝的決策樹(2)目標(biāo)變量可以定距或定類(3)從
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 爆破安全培訓(xùn)試題及答案
- 膀胱腫瘤考試題及答案
- 安全作業(yè)考試題庫及答案
- 安全員試題及答案
- 安全管理試題及答案
- 中國受辱課件在線觀看
- 顧客為先的培訓(xùn)課件
- 群發(fā)中暑急救培訓(xùn)課件
- 村醫(yī)死因培訓(xùn)課件
- 原諒的幼兒繪本課件
- 電離輻射安全與防護基礎(chǔ)知識
- 《競爭情報分析》課件
- 急診科外科急癥的處理與救治
- 環(huán)衛(wèi)工人消防安全知識培訓(xùn)課件
- 安全編碼和開發(fā)培訓(xùn)
- 電氣工程及其自動化-10KV某中學(xué)教學(xué)樓配電系統(tǒng)設(shè)計
- 基于零知識證明和同態(tài)加密的隱私保護算法研究
- 《酒店服務(wù)情景英語》課程整體設(shè)計說明
- 機械加工工藝過程表格-
- 國家基本公共衛(wèi)生服務(wù)項目規(guī)范
- 氣管切開非機械通氣患者氣道護理課件
評論
0/150
提交評論