AI科技金融的最佳實(shí)踐_第1頁(yè)
AI科技金融的最佳實(shí)踐_第2頁(yè)
AI科技金融的最佳實(shí)踐_第3頁(yè)
AI科技金融的最佳實(shí)踐_第4頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、AI科技金融的最佳實(shí)踐機(jī)器學(xué)習(xí)專(zhuān)家數(shù)據(jù)場(chǎng)景需求驅(qū)動(dòng) 商業(yè)變現(xiàn)技術(shù)AI應(yīng)用三要素新金融業(yè)務(wù)面臨的風(fēng)控挑戰(zhàn)量大:人工無(wú)法大規(guī)模審批,成本高高價(jià)值數(shù)據(jù)少:大都無(wú)央行征信數(shù)據(jù)風(fēng)險(xiǎn)高:客群下沉,欺詐成本低數(shù)據(jù)使用難:海量非結(jié)構(gòu)化數(shù)據(jù)群體欺詐多:有組織、有規(guī)模進(jìn)攻半監(jiān)督學(xué)習(xí)解決冷啟動(dòng)對(duì)AI技術(shù)的需求數(shù)據(jù)太多數(shù)據(jù)太少LIME模型解釋器復(fù)雜集成模型解決維度災(zāi)難AI解決風(fēng)控挑戰(zhàn)SNA社交網(wǎng)絡(luò) 分析深度學(xué)習(xí)解決 特征提取場(chǎng)景數(shù)據(jù)互聯(lián)網(wǎng) 大數(shù)據(jù)融合打通特征工程建模信用評(píng)估場(chǎng)景 數(shù)據(jù)特征 工程建模信用 評(píng)估大量的人工特征工作卡或LR模型機(jī)器學(xué)習(xí) 模型自動(dòng) 提取特征歷叱 標(biāo)簽 樣本需時(shí)間積累Mapping 技術(shù)結(jié)合人工

2、標(biāo) 注的半監(jiān)督 學(xué)習(xí)技術(shù)人工 標(biāo)注+專(zhuān)家規(guī)則自適應(yīng)學(xué)習(xí)快 速吸收專(zhuān)家經(jīng) 驗(yàn)和反饋 傳統(tǒng)信用評(píng)估模型方法 傳統(tǒng)的評(píng)分 基于大規(guī)模的機(jī)器學(xué)習(xí)系統(tǒng)的聯(lián)合建模方法 先進(jìn)的ID互聯(lián)網(wǎng)級(jí)別的機(jī)器學(xué)習(xí)AI驅(qū)動(dòng)的信用貸業(yè)務(wù)電調(diào)App/系統(tǒng)反欺詐(個(gè)人/團(tuán)體風(fēng)險(xiǎn))合規(guī)檢查申請(qǐng)?jiān)u分放款拒絕評(píng)分高評(píng)分中評(píng)分低通過(guò)機(jī)器學(xué) 習(xí)模型 與算法API調(diào)用/傳輸數(shù)據(jù)公安戶(hù)籍 數(shù)據(jù)第三方學(xué) 歷數(shù)據(jù)App相關(guān) 數(shù)據(jù)手機(jī)設(shè)備 相關(guān)數(shù)據(jù)運(yùn)營(yíng)商數(shù)據(jù)互聯(lián)網(wǎng)行 為數(shù)據(jù)申請(qǐng)材料 圖片數(shù)據(jù)基于網(wǎng)絡(luò) 的反欺詐 模型申請(qǐng)?jiān)u分違約概率模型模型快速 自動(dòng)迭代/ 優(yōu)化規(guī)則模型連接數(shù)據(jù)個(gè)體風(fēng)險(xiǎn)識(shí)別連接個(gè)體群體風(fēng)險(xiǎn)識(shí)別個(gè)體風(fēng)險(xiǎn)到網(wǎng)絡(luò)全局風(fēng)險(xiǎn)的識(shí)別基于社會(huì)網(wǎng)絡(luò)

3、分析(SNA)算法分析方法的不同SNA拋開(kāi)獨(dú)立性假設(shè),通過(guò) 圖論方法,用中心度、介數(shù)、 聚集系數(shù)等指標(biāo)在欺詐專(zhuān)有 拓?fù)渚W(wǎng)絡(luò)上識(shí)別欺詐團(tuán)伙識(shí)別模式的不同欺詐網(wǎng)絡(luò)分析最重要的是分 析其與鄰近節(jié)點(diǎn)的關(guān)系,從 關(guān)系的角度把具有相同行為 的節(jié)點(diǎn)聚合在一起技術(shù)實(shí)現(xiàn)方案基于社會(huì)網(wǎng)絡(luò)分析的反欺詐風(fēng)險(xiǎn)識(shí)別欺詐 判斷反饋 優(yōu)化金融客戶(hù)信息及交易數(shù)據(jù)互聯(lián)網(wǎng)行為數(shù)據(jù)第三方數(shù)據(jù)欺詐預(yù)警反欺詐規(guī)則變量處理、聚合網(wǎng)絡(luò)構(gòu)建特征欺詐風(fēng)險(xiǎn)研判平臺(tái)社交網(wǎng)絡(luò)分析圖挖掘欺詐特征反欺詐模型基于申請(qǐng)網(wǎng)絡(luò)識(shí)別欺詐風(fēng)險(xiǎn)核心授信決策- 機(jī)器學(xué)習(xí)模型10特征 提取人工提取機(jī)器提取 基于機(jī)器學(xué)習(xí)的違約概率模型構(gòu)建 原始數(shù)據(jù)特征選擇/模型組 合模型訓(xùn)

4、練模型評(píng)估和 選擇樣本庫(kù) 風(fēng)控流程 申請(qǐng)?jiān)u分催收評(píng)分基于關(guān)系網(wǎng)絡(luò)的反欺詐反欺詐分類(lèi)樣本少:“冷啟動(dòng)”數(shù)據(jù)多:非結(jié)構(gòu)化數(shù)據(jù)特征提取數(shù)據(jù)使用難:高維、稀疏、低飽和樣本少-“冷啟動(dòng)”11主動(dòng)式學(xué)習(xí):專(zhuān)家提供樣本的標(biāo)記半監(jiān)督學(xué)習(xí):結(jié)合使用有標(biāo)記和無(wú)標(biāo)記樣本來(lái)提高單一使用有標(biāo)記樣本性能Online-learning:線(xiàn)上迭代數(shù)據(jù)多:所有數(shù)據(jù)都是風(fēng)險(xiǎn)數(shù)據(jù)App使用數(shù)據(jù)設(shè)備信息消費(fèi)記錄消費(fèi)地點(diǎn)消費(fèi)金額短信通話(huà)記錄對(duì)于風(fēng)險(xiǎn)的作用 獲取難度數(shù)據(jù)量覆蓋率 運(yùn)用難度征信消費(fèi)運(yùn)營(yíng)商社交行為其它機(jī)器提取特征深度學(xué)習(xí)深度學(xué)習(xí)提取特征 優(yōu)勢(shì):深層時(shí)序關(guān)系文本內(nèi)容深層含義超過(guò)人工定義 的深度時(shí)序數(shù)據(jù)RNN(LSTM)文本類(lèi)數(shù)

5、據(jù)詞嵌入+CNN圖像數(shù)據(jù)CNN稀疏屬性數(shù)據(jù)遷移學(xué)習(xí)通話(huà)記錄消費(fèi)記錄行為記錄電商交易記錄信用卡消費(fèi)記錄短信人臉文本特征提取網(wǎng)絡(luò)word2vector,domain adaptionTraining data清理好的文本數(shù)據(jù)詞嵌入模型Word2Index projection分類(lèi)器網(wǎng)絡(luò)大規(guī)模的 語(yǔ)料庫(kù)詞表達(dá)權(quán)重Pre-trainword2vecCNN中文分詞搜狗新聞 語(yǔ)料庫(kù)關(guān)鍵詞提取原始文本數(shù)據(jù)特征提取遷移學(xué)習(xí)機(jī)器生成特征對(duì)模型效果的明顯提升與專(zhuān)家人工特征融合深度學(xué)習(xí)特征專(zhuān)家人工特征Feature ImportanceScore0.0200.0150.0100.00500.02515 120 46

6、 rate 215 ca 97 raterate 2 114 85pa cit y9 entr 0city 1 opy77 out119 ot5he r0 rate 2110 in cnt3 60 in out 3 size shrt 20 billrate in4數(shù)據(jù)使用難先進(jìn)建模技術(shù)數(shù)據(jù)維度多弱變量數(shù)據(jù)稀疏、低飽和上千位特征變量大量特征是弱變量,無(wú)法 直接使用線(xiàn)性模型存在大量缺失值問(wèn)題機(jī)器學(xué)習(xí)建模機(jī)器提取特征+專(zhuān)家人工特征早期嘗試持續(xù)探索最佳實(shí)踐集成 機(jī)器 學(xué)習(xí) 模型全維 數(shù)據(jù)模型 層應(yīng)用層互聯(lián)網(wǎng)行為申請(qǐng)信息運(yùn)營(yíng)商 數(shù)據(jù)信用 報(bào)告全維數(shù)據(jù)人工加工特征GBDT全維數(shù)據(jù)機(jī)器生成特征冷啟動(dòng)不同應(yīng)

7、用反欺詐 識(shí)別違約概 率預(yù)測(cè)衍生 應(yīng)用風(fēng)險(xiǎn)Rule集成模型借貸消費(fèi)公開(kāi)互聯(lián)網(wǎng) 歷史能力信用GBDTDNNDNNDNNCNNRNN模型效果對(duì)比信用貸場(chǎng)景模型準(zhǔn)確率查對(duì)率最大KS值DNN0.410.700.32Bottleneck features+GBM0.420.650.28Logistic regression0.370.530.19Model evaluationInputlayerLayerBlock 1LayerBlock 2ClassifierNetworkBottleneckfeaturesOther Classifier(GBM)提升14%提升45%模型可解釋捕獲影響結(jié)果的關(guān)鍵變量Ensemble Black-box ModelsLIMELocal Interpretable Model- agnostic Explainer遷移學(xué)習(xí)CNNRNN(LSTM)詞嵌入模型機(jī)器學(xué)習(xí)引擎DNN集成模型數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論