Clementine決策樹C5.0算法_第1頁
Clementine決策樹C5.0算法_第2頁
Clementine決策樹C5.0算法_第3頁
Clementine決策樹C5.0算法_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1.C5.0輸出類型:指定分析輸出的內(nèi)容。指定希望最終生成的模型是決策樹還是規(guī)則集。組符號:如果選擇該選項,C5.0會嘗試將所有與輸出字段格式相似的字符值合并(采用ChiMerge分箱法檢查當前分組變量個各個類別能否合并,如果可以應(yīng)先合并后再分支)。如果沒有選擇該選項,C5.0會為用于拆分母節(jié)點的字符字段的每個值創(chuàng)建一個子節(jié)點。使用推進:提高其精確率。這種方法按序列建立多重模型。第一個模型以通常的方式建立。隨后,建立第二個模型,聚焦于被第一個模型錯誤分類的記錄。以此類推,最后應(yīng)用整個模型集對樣本進行分類,使用加權(quán)投票過程把分散的預(yù)測合并成綜合預(yù)測。試驗次數(shù)選項允許控制用于助推的模型數(shù)量。交互驗

2、證:如果選擇了該選項,C5.0將使用一組基于訓練數(shù)據(jù)自己建立的模型,來估計基于全部數(shù)據(jù)建立的模型的精確度。如果數(shù)據(jù)集過小,不能拆分成傳統(tǒng)意義上的訓練集和測試集,這將非常有用?;蛴糜诮徊骝炞C的模型數(shù)目。模式:對于簡單的訓練,絕大多數(shù)C5.0參數(shù)是自動設(shè)置。高級訓練模式選項允許對訓練參數(shù)更多的直接控制。簡單模式:偏好(支持):選擇“準確性”C5.0會生成盡可能精確的決策樹,某些情況下,會導(dǎo)致過度擬合。選擇“普遍性”以使用不易受該問題影響的算法設(shè)置。預(yù)期噪聲(%):指定訓練集中的噪聲或錯誤數(shù)據(jù)期望比率專家模式:模式僱勇嚴重性:每個子分支的最小記錄數(shù):0使用全局催剪宇段模型成本分析注解執(zhí)行取消修剪純度

3、:決定生成決策樹或規(guī)則集被修剪的程度。提高純度值將獲得更小,更簡潔的決策樹。降低純度值將獲得更加精確的決策樹。子分支最小記錄數(shù):子群大小可以用于限制決策樹任一分支的拆分數(shù)。全局修剪:第一階段:局部修剪;第二階段:全局修剪。辨別屬性:如果選擇了該選項,C5.0會在建立模型前檢測預(yù)測字段的有用性。被發(fā)現(xiàn)與分析無關(guān)的預(yù)測字段將不參與建模過程。這一選項對許多預(yù)測字段元的模型非常有用,并且有助于避免過度擬合。C5.0成本選項見“CHAID“成本”選項-誤判成本值,調(diào)整誤判C5.0的模型評價可通過Analysis節(jié)點實現(xiàn)。另外Analysis還可以實現(xiàn)不同模型之間的評估對比可通過Evaluation節(jié)點實現(xiàn)模型評估圏表類型:増益響應(yīng)提升利弼投資回報率圄回累稅散點囹回包含基線包含最佳線-複型使用以下內(nèi)容査找目標呼頁則孌重字段:檯型輸出寧段元數(shù)據(jù)寧眾名楷式備妝,亦炸T機已tfi巳彷)其他得分宇段繪制得分宇段目

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論