版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、.數(shù)說(shuō)任務(wù)室 jiayounet:.;貝葉斯網(wǎng)絡(luò)預(yù)測(cè)信譽(yù)卡欺詐行為 貝葉斯網(wǎng)絡(luò)運(yùn)用1一、實(shí)際闡明1 貝葉斯網(wǎng)絡(luò)的運(yùn)用運(yùn)用貝葉斯網(wǎng)絡(luò),可以經(jīng)過(guò)將察看到并記錄下的數(shù)據(jù)與實(shí)踐常識(shí)結(jié)合起來(lái)構(gòu)建概率模型,以經(jīng)過(guò)運(yùn)用外表看上去不相關(guān)的屬性確定發(fā)生的能夠性,找出一個(gè)結(jié)果究竟與哪些影響變量相關(guān),或者說(shuō),終究是什么要素影響了結(jié)果。貝葉斯分類模型承繼了貝葉斯網(wǎng)絡(luò)的優(yōu)點(diǎn)并具有良好的分類精度,正遭到越來(lái)越多的關(guān)注,并廣泛的運(yùn)用在欺詐識(shí)別、客戶管理、醫(yī)學(xué)診斷上、互聯(lián)網(wǎng)搜索上,比如,利用貝葉斯分類模型建立客戶的等級(jí)分類,如信譽(yù)等級(jí)、忠實(shí)等級(jí),當(dāng)新客戶出現(xiàn)時(shí),即可以按該分類模型對(duì)其等級(jí)情況做出分類預(yù)測(cè)。又比如本文所例舉的,
2、根據(jù)信譽(yù)卡用戶的信譽(yù)記錄及相關(guān)信息建立用戶的信譽(yù)模型,并監(jiān)測(cè)哪些用戶會(huì)做出貸款拖欠的行為。2 貝葉斯網(wǎng)絡(luò)模型1貝葉斯原理統(tǒng)計(jì)學(xué)分成兩派,一派是傳統(tǒng)的頻率學(xué)派,一派是貝葉斯派,可以在統(tǒng)計(jì)學(xué)界自成一派,可見(jiàn)其影響。貝葉斯的中心思想在于一個(gè)公式P(A|X)=P(X|A)P(A)/P(X)其中A是隨機(jī)變量,X是數(shù)據(jù),P(X|A)是似然,P(A)是先驗(yàn)分布,P(A|X)是后驗(yàn)分布,P(X)是一個(gè)數(shù)。這個(gè)公式的意義在于,我們可以經(jīng)過(guò)一個(gè)閱歷的概率,加上數(shù)據(jù)的實(shí)際,來(lái)得出一個(gè)后驗(yàn)的概率,也就是說(shuō)“閱歷+數(shù)據(jù)=結(jié)果。那么將這個(gè)原理用在貝葉斯網(wǎng)絡(luò)上,即將先驗(yàn)貝葉斯網(wǎng)絡(luò)和數(shù)據(jù)相結(jié)合而得到一個(gè)后驗(yàn)貝葉斯網(wǎng)絡(luò)。那么什
3、么是貝葉斯網(wǎng)絡(luò)?2貝葉斯網(wǎng)絡(luò)模型概述貝葉斯網(wǎng)絡(luò)(Bayesian network),又叫概率因果網(wǎng)絡(luò)、信任網(wǎng)絡(luò)、知識(shí)圖等,是一種有向無(wú)環(huán)圖。一個(gè)貝葉斯網(wǎng)絡(luò)由兩個(gè)部分構(gòu)成,一個(gè)是具有K個(gè)節(jié)點(diǎn)的有向無(wú)環(huán)圖,圖中有節(jié)點(diǎn)和銜接節(jié)點(diǎn)的有向邊,節(jié)點(diǎn)代表隨機(jī)變量,有向邊代表了節(jié)點(diǎn)間的相互關(guān)聯(lián)關(guān)系。另一個(gè)是與每個(gè)節(jié)點(diǎn)相關(guān)的條件概率表Conditional Probabilities Table,CPTP,它表示了節(jié)點(diǎn)和父節(jié)點(diǎn)之前的相關(guān)關(guān)系,這個(gè)關(guān)系就是條件概率。那么由這個(gè)圖G和概率表P構(gòu)成的網(wǎng)絡(luò)就是貝葉斯網(wǎng)絡(luò),貝葉斯網(wǎng)絡(luò)有如下假設(shè)或者規(guī)定:給定一個(gè)父節(jié)點(diǎn),那么它的子節(jié)點(diǎn)獨(dú)立于任何非這個(gè)子節(jié)點(diǎn)的后代節(jié)點(diǎn)和其構(gòu)成
4、的任何節(jié)點(diǎn)子集。即假設(shè)用A(V i)表示非V i后代節(jié)點(diǎn)構(gòu)成的任何節(jié)點(diǎn)子集,用(V i)表示V i的直接雙親節(jié)點(diǎn),那么p(Vi|A(Vi),(V i)=p(Vi|(Vi)在這個(gè)假定下,變量Vi的結(jié)合概率就是:給定每個(gè)節(jié)點(diǎn)的父節(jié)點(diǎn)情況下,每個(gè)節(jié)點(diǎn)條件概率只積,如圖中的結(jié)合概率為p(V1,V2,.,V6)=p(V6|V5)p(V5|V2,V3)p(V4|V2)p(V3|V1)p(V2|V1)p(V1)這就是貝葉斯網(wǎng)絡(luò)和其網(wǎng)絡(luò)的概率。我們可以讓貝葉斯網(wǎng)絡(luò)經(jīng)過(guò)數(shù)據(jù)不斷的學(xué)習(xí)修正,上次修正的貝葉斯網(wǎng)絡(luò)又是下次學(xué)習(xí)的先驗(yàn)貝葉斯網(wǎng)絡(luò),繼續(xù)的學(xué)習(xí)使得網(wǎng)絡(luò)更能表達(dá)數(shù)據(jù)的意義,即,讓數(shù)據(jù)來(lái)說(shuō)話!2樹(shù)加強(qiáng)樸素貝葉斯
5、網(wǎng)絡(luò)模型概述雖然貝葉斯網(wǎng)絡(luò)有良好的邏輯性、預(yù)測(cè)性、并在處置復(fù)雜問(wèn)題上有很大的優(yōu)勢(shì),但它的假設(shè)還是帶給了它一定的局限性還記得剛剛說(shuō)的貝葉斯網(wǎng)絡(luò)那拗口的假設(shè)?給定一個(gè)父節(jié)點(diǎn),那么它的子節(jié)點(diǎn)獨(dú)立于任何非這個(gè)子節(jié)點(diǎn)的后代節(jié)點(diǎn)和其構(gòu)成的任何節(jié)點(diǎn)子集。近年來(lái),很多學(xué)者對(duì)貝葉斯網(wǎng)絡(luò)模型做了改良,其中一個(gè)重要的改良模型就是樹(shù)加強(qiáng)的樸素貝葉斯網(wǎng)絡(luò)模型Tree Augmented Nave Bayes,英文簡(jiǎn)稱TAN。TAN放松了獨(dú)立性的假設(shè),它的中心在于:除了父節(jié)點(diǎn)之外,每個(gè)節(jié)點(diǎn)還可以有一個(gè)節(jié)點(diǎn)的邊指向它。 樹(shù)加強(qiáng)的樸素貝葉斯主要用來(lái)分類,由于他允許一個(gè)節(jié)點(diǎn)被除父節(jié)點(diǎn)之外的另一個(gè)節(jié)點(diǎn)指向,因此有更高的分類精度。
6、但是TAN要求節(jié)點(diǎn),即隨機(jī)變量均為離散型,因此有必要將延續(xù)的變量離散化,但這卻損失了延續(xù)變量中包含的信息。3馬爾科夫鏈貝葉斯網(wǎng)絡(luò)模型概述馬爾科夫毯貝葉斯網(wǎng)絡(luò)模型Markov Blanket Algorithms,事前不對(duì)節(jié)點(diǎn)之前做邊指向,換句話說(shuō),初試圖是一個(gè)只需節(jié)點(diǎn)沒(méi)有邊的空?qǐng)D,而后經(jīng)過(guò)一定的檢驗(yàn)來(lái)識(shí)別變量之間的條件獨(dú)立,并逐漸識(shí)別出貝葉斯網(wǎng)絡(luò)的構(gòu)造。但這也會(huì)帶來(lái)計(jì)算的復(fù)雜性,并破費(fèi)更長(zhǎng)的時(shí)間,一個(gè)方法是用特征選擇過(guò)程Feature Selection來(lái)挑選對(duì)目的變量關(guān)系顯著的變量。二、案例分析1 案例闡明某銀行希望根據(jù)現(xiàn)有的客戶貸款拖欠數(shù)據(jù),來(lái)預(yù)測(cè)未來(lái)哪些潛在客戶能夠在歸還貸款時(shí)有問(wèn)題,以
7、便對(duì)這些“不良風(fēng)險(xiǎn)的客戶減少貸款,或者為他們提供其他產(chǎn)品?,F(xiàn)有的客戶數(shù)據(jù)包含了當(dāng)前貸款拖欠情況default、客戶年齡age、受教育程度ed、職業(yè)employ、家庭地址address、收入income、負(fù)債率debtinc、信譽(yù)卡債務(wù)creddebt,其他債務(wù)othdebt和三個(gè)其他相關(guān)變量preddef1、preddef2、preddef3,如今用SPSS CLEMENTINE對(duì)已有的數(shù)據(jù)進(jìn)展三種貝葉斯網(wǎng)絡(luò)模型的建模TAN、馬爾科夫毯貝葉斯網(wǎng)絡(luò)、特征選擇的馬爾科夫毯貝葉斯網(wǎng)絡(luò),并同時(shí)用人工神經(jīng)網(wǎng)絡(luò)模型建模,以比較這四個(gè)模型的分類效果。2 軟件實(shí)現(xiàn) 運(yùn)用CLEMENTINE讀入數(shù)據(jù),并將def
8、ault的字段方向改為輸出,用過(guò)濾節(jié)點(diǎn)過(guò)濾掉無(wú)效的空值。接著用對(duì)數(shù)據(jù)創(chuàng)建TAN、馬爾科夫毯貝葉斯網(wǎng)絡(luò)、特征選擇的馬爾科夫毯貝葉斯網(wǎng)絡(luò),和人工神經(jīng)網(wǎng)絡(luò)也可以用來(lái)預(yù)測(cè)。3 結(jié)果闡明1TAN模型如以下圖:可以看出,TAN模型創(chuàng)建的結(jié)果是變量preddef2對(duì)能否拖欠貸款最重要,其次是變量preddef1和其他負(fù)債情況othdebt2馬爾科夫毯模型結(jié)果如下:可以看出,馬爾科夫毯模型結(jié)果是變量preddef3對(duì)能否拖欠貸款最重要,其次是變量preddef2和preddef1. 3特征選擇的馬爾科夫毯模型結(jié)果如下:由于進(jìn)展了特征選擇,圖中可以看出只選擇了兩個(gè)變量,對(duì)拖欠貸款最重要的是preddef2。4人工神經(jīng)網(wǎng)絡(luò)結(jié)果:人工神經(jīng)網(wǎng)絡(luò)結(jié)果是preddef2對(duì)能否拖欠貸款最重要,其次是變量preddef1,地址address。5四種模型效果評(píng)價(jià)CLEMENTINE提供了“分析節(jié)點(diǎn),以評(píng)價(jià)模型的預(yù)測(cè)效果。將分析節(jié)點(diǎn)添參與流,執(zhí)行得到評(píng)價(jià)結(jié)果如下:可以看出,準(zhǔn)確率最高的是馬爾科夫毯模型,在數(shù)據(jù)學(xué)習(xí)后,對(duì)現(xiàn)有數(shù)據(jù)中貸款的拖欠情況預(yù)測(cè)的正確率是86.29%,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度出境領(lǐng)隊(duì)安全防護(hù)服務(wù)合同4篇
- 二零二五年度企業(yè)員工加班工資計(jì)算與支付規(guī)范合同3篇
- 2025年度廚房設(shè)備更新?lián)Q代工程合同4篇
- 2025年度大理石臺(tái)面安裝與石材倉(cāng)儲(chǔ)物流服務(wù)合同3篇
- 2025年度教育培訓(xùn)門面租賃及課程合作合同4篇
- 2025年度地下綜合交通樞紐停車場(chǎng)承包合同4篇
- 2025年度鋁合金裝飾品定制生產(chǎn)合同模板4篇
- 2025年度金融行業(yè)銷售顧問(wèn)勞動(dòng)合同3篇
- 2025年古鎮(zhèn)游覽服務(wù)合同
- 2025年度門診部醫(yī)療設(shè)備采購(gòu)與安裝服務(wù)合同4篇
- 骨科手術(shù)后患者營(yíng)養(yǎng)情況及營(yíng)養(yǎng)不良的原因分析,骨傷科論文
- GB/T 24474.1-2020乘運(yùn)質(zhì)量測(cè)量第1部分:電梯
- GB/T 12684-2006工業(yè)硼化物分析方法
- 定崗定編定員實(shí)施方案(一)
- 高血壓患者用藥的注意事項(xiàng)講義課件
- 特種作業(yè)安全監(jiān)護(hù)人員培訓(xùn)課件
- (完整)第15章-合成生物學(xué)ppt
- 太平洋戰(zhàn)爭(zhēng)課件
- 封條模板A4打印版
- T∕CGCC 7-2017 焙烤食品用糖漿
- 貨代操作流程及規(guī)范
評(píng)論
0/150
提交評(píng)論