金融智慧大腦開發(fā)平臺介紹_第1頁
金融智慧大腦開發(fā)平臺介紹_第2頁
金融智慧大腦開發(fā)平臺介紹_第3頁
金融智慧大腦開發(fā)平臺介紹_第4頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、金融智慧大腦開發(fā)平臺介紹Finance AI & Open Financial PlatformABCDE營銷、獲客及KYC資金與資產(chǎn)風控、合規(guī)及KYC運營科技中國銀行業(yè)痛點M01如何高效開展金融產(chǎn)品的宣傳MOR02小微企業(yè)客戶獲客成本高M03個人客戶精準低成本營銷M04運營有形網(wǎng)點成本高效益低AR01獲取高收益資產(chǎn)越來越難AR03實現(xiàn)小額高頻的普惠信貸業(yè)務(wù)A02農(nóng)業(yè)金融的低效益與高風險C01如何高效吸收低成本資金C02為大眾提供高效低價的財富管理服務(wù)O01繁瑣的支付與轉(zhuǎn)賬服務(wù)MOR02小微企業(yè)客戶經(jīng)營成本高O03個人金融服務(wù)的客服與消費者教育O04供應(yīng)鏈金融中對信息流和物流的可靠追蹤O05機

2、構(gòu)結(jié)算與清算領(lǐng)域的流程、時滯及成本O06信貸業(yè)務(wù)流程的繁瑣耗時O07海量業(yè)務(wù)資料的有效管理T01科技系統(tǒng)軟硬件投資巨大且擴展性差T02科技研發(fā)與創(chuàng)新效率低AR01獲取高收益資產(chǎn)越來越難MOR02小微企業(yè)客戶獲客與經(jīng)營成本高AR03實現(xiàn)小額高頻的普惠信貸業(yè)務(wù)R04個人金融服務(wù)中的反欺詐R05針對中小企業(yè)信貸的傳統(tǒng)風控手段乏力R06合規(guī)管理、反洗錢與客戶評估實現(xiàn)小額高頻的普惠信貸業(yè)務(wù)小微企業(yè)客戶獲客成本高個人金融服務(wù)中的反欺詐針對中小企業(yè)信貸的傳統(tǒng)風控手段乏力小額:額度在1萬500萬之間高頻:獲客便捷,自動化審批、流程簡便,隨借隨還。普惠信貸:不同客戶切分不同額度、期限、利率,同時是信用貸款供應(yīng)鏈

3、金融中對信息流和物流的可靠追蹤痛中之痛小微企業(yè):特征,無抵押、無財報,白戶,征信數(shù)據(jù)驗證困難獲客成本高:信息不對稱讓信息中介成為高利行業(yè),財務(wù)數(shù)據(jù),經(jīng)營信息獲取難。個人金融服務(wù):個人消費貸款、個人經(jīng)營貸,場景化問題,身份核驗問題,團伙欺詐問題,包裝欺詐問題。反欺詐:正向反欺詐、逆向反欺詐傳統(tǒng)風控:建模能力、算法、樣本、驗證、Y數(shù)據(jù),數(shù)據(jù)收集與驗真、人才ML風控:AI技術(shù),數(shù)據(jù)處理,樣本處理,組合算法,調(diào)參,人才供應(yīng)鏈金融:騙貸、資金挪用,應(yīng)付賬款、倉單質(zhì)押真實性,外生風險,內(nèi)生風險、主體風險、機會主義風險,上下游在資金、還款、信用、應(yīng)收賬款賬戶的控制信息流與物流可靠追蹤:區(qū)塊鏈技術(shù)性能問題,垂

4、直行業(yè)認識上,數(shù)據(jù)應(yīng)用:歷史交易數(shù)據(jù)、外部數(shù)據(jù)積累和挖掘,動態(tài)數(shù)據(jù)的監(jiān)控,交易真實性,質(zhì)押物監(jiān)控.信貸業(yè)務(wù)流程的繁瑣耗時業(yè)務(wù)流程:觸達客戶、申請、反欺詐、面簽、審批、盡調(diào)、放款、核算、貸后服務(wù)、監(jiān)控、催收、保全、處置、ABS等繁瑣耗時:貸前、貸中、貸后節(jié)點數(shù),風控模型參與度,反欺詐參與度,自動化流程、O2O流程,操作風險,進度工具智能化,道德風險等等這些痛點需要解決傳統(tǒng)銀行中的那些問題痛點細節(jié)痛點銀行業(yè)務(wù)需要解決能力支撐建議方案實現(xiàn)小額高頻的普惠信貸業(yè)務(wù)額度在1萬500萬之間信貸產(chǎn)品設(shè)計信貸流程優(yōu)化、科技能力、數(shù)字化風控、反欺詐,ROA,-產(chǎn)品-模型匹配獨立產(chǎn)品平臺,場景沙箱推演,ROA計算、

5、ML風控獲客便捷網(wǎng)點獲客轉(zhuǎn)型,O2O獲客轉(zhuǎn)型,線上獲客轉(zhuǎn)型客戶體驗,精準投放廣告、流程便捷降低漏損率,風控與客戶體驗平衡的AI計算場景沙箱,嵌入式AI精準獲客模型,智能線下獲客工具,自動化審批交叉驗證數(shù)據(jù)獲取技術(shù)、數(shù)據(jù)匹配技術(shù)、自動規(guī)則引擎、語音質(zhì)檢、圖像識別質(zhì)檢、風控引擎驅(qū)動的審批模型NLP、OCR、Image 理解技術(shù)、邊緣計算、單項數(shù)據(jù)授權(quán)、數(shù)據(jù)安全與隱私保護技術(shù)RPA、NLP進行數(shù)據(jù)處理和自動化審批,不適用爬蟲技術(shù)方式(接口接入技術(shù))開放銀行數(shù)據(jù)交換標準,雙向鑒權(quán)流程簡便貸前申請和查詢授權(quán)(征信、房產(chǎn)、資產(chǎn)、卡資金、第三方數(shù)據(jù))、申請資料簡單并可后臺接口查詢、秒批、ROI漏損率低,貸中

6、和貸后等流程簡便,產(chǎn)品設(shè)計必須的內(nèi)容。邊緣計算進行衛(wèi)星模型處理,產(chǎn)品設(shè)計能力,客戶體驗,漏損AI計算產(chǎn)品沙箱、AI驅(qū)動設(shè)計隨借隨還產(chǎn)品設(shè)計中額度、期限、利率問題,產(chǎn)品工廠靈活配置,客戶畫像客群分類器設(shè)計、產(chǎn)品設(shè)計、流程設(shè)計、產(chǎn)品工廠獨立化。產(chǎn)品工廠不同客戶切分不同額度、期限、利率ML、ML風控模型、數(shù)據(jù)安全、數(shù)據(jù)鑒權(quán)數(shù)字化 風控能力ML風控模型信用貸款零售信用產(chǎn)品-零售信用風險模型數(shù)字化風控能力ML風控模型考慮使用解決方案:產(chǎn)品工廠平臺(產(chǎn)品沙箱、產(chǎn)品工廠、ROA計算)、智能獲客平臺、風控建模、產(chǎn)品設(shè)計咨詢、開放銀行平臺銀行貸前能力銀行應(yīng)該具備Total Ability貸前:精準獲客能力貸前:

7、KYC貸前:反欺詐能力銀行貸中能力貸中:便捷開戶貸中:便捷放款銀行貸后能力貸前:信用風控建模貸后:D0低成本催收貸后:失聯(lián)修復(fù)貸后:貸后預(yù)警銀行運營能力信貸流程優(yōu)化產(chǎn)品設(shè)計ROA沙箱低成本貸前、中、后運營能力邊緣計算用于數(shù)據(jù)隱私保護與安全銀聯(lián)數(shù)據(jù)邊緣計算建模信用中國邊緣計算建模美團邊緣計算建模其他場景邊緣計算建模第三方數(shù)邊緣計算建模銀行歷史數(shù)據(jù)邊緣計算建模銀行方集成計算建模技術(shù)平臺支撐能力T01機器學(xué)習平臺 T02OCR T032D人臉識別 T043D人臉支付 T05 NLP T06類腦學(xué)習 T07邊緣計算 T08圖計算 T09RPA T010 大數(shù)據(jù)分析 T011 DW高效 T012 交易安

8、全 T013產(chǎn)品工廠 T014開放銀行 T015數(shù)據(jù)安全與隱私保護技術(shù)在傳統(tǒng)審核資料的基礎(chǔ)上,增加多渠道多維度的海量數(shù)據(jù),構(gòu)建風險模型網(wǎng)上消費第三方數(shù)據(jù)社交關(guān)系其它網(wǎng)絡(luò)行為信貸數(shù)據(jù)征信報告申請資料第三方數(shù)據(jù)信用行為交叉匹配網(wǎng)絡(luò)黑名單搜索引擎各類認證某知名機構(gòu)風險評分Y=f(X1,X2,Xn)f?必須要有YX處理數(shù)據(jù)01數(shù)據(jù)觀察02樣本選擇03補充樣本04模型評估08模型調(diào)參07特征工程06單變量分析05好壞樣本4:11、缺失值處理2、同質(zhì)化處理(拍腦袋90%作為臨界值進行刪除)3、特征賽選(過濾式、包裹式和嵌入式,F(xiàn)ICO監(jiān)督數(shù)據(jù)分箱、區(qū)分度評分、擬合與尺度化、IV值、皮爾森、卡分分箱等、挑戰(zhàn)

9、者)最終模型09最大難點風控建模傳統(tǒng)建模最大難點風控建模人才分類建議(以某家銀行建議為例)數(shù)據(jù)收集01申請數(shù)據(jù)征信報告支付數(shù)據(jù)稅務(wù)數(shù)據(jù)電信數(shù)據(jù)電力數(shù)據(jù)ERP數(shù)據(jù)財務(wù)數(shù)據(jù)第三方介入數(shù)據(jù)點擊模型數(shù)據(jù)交互場景數(shù)據(jù)數(shù)據(jù)分類器算法設(shè)計021、SVM+SKM+類腦計算初選2、Adaboost+Random Forest進行預(yù)測分類誤差3、GAN網(wǎng)絡(luò)自動模擬數(shù)據(jù)分類器4、類腦因果學(xué)習分類器算法AUC標定值DL數(shù)據(jù)觀察031、 randomforest Tree自動弱分類好壞樣本標注2、數(shù)據(jù)缺失掃描 3、樣本分布計算4、GAN重建樣本數(shù)據(jù)樣本選擇041、 GAN對抗大量樣本比對學(xué)習2、對抗補償函數(shù)選擇 3、學(xué)

10、習歷史數(shù)據(jù)補充(人工監(jiān)督,局域?qū)W習數(shù)據(jù))4、少量樣本邏輯規(guī)則(類腦邏輯)5、GAN生成樣本與正式樣本分類(建模數(shù)據(jù)集、測試數(shù)據(jù)集、自比對數(shù)據(jù)集)補充樣本051、 根據(jù)標注量按照4:1樣本補充,2、樣本量監(jiān)測最大難點風控建模無監(jiān)督學(xué)習建模單變量分析061、核心變量分析,參照FICO五類變量進行點單變量統(tǒng)計分析2、然后其他數(shù)據(jù)單變量統(tǒng)計分析3、輸出是否正態(tài)分布,長尾右偏分布、離散分布,使用SKM建立正態(tài)分布特征核4、組合衍生變量單變量統(tǒng)計分析DL特征工程071、系統(tǒng)數(shù)據(jù)掃描2、缺失值處理:刪除缺失值、統(tǒng)計量填充、特殊值填充、保留缺失值(預(yù)設(shè)缺失閥值90%)3、根據(jù)經(jīng)驗考慮缺失值是否補充判斷4、ET

11、L過程級大數(shù)據(jù)處理過程5、同質(zhì)化數(shù)據(jù)處理(深度學(xué)習同質(zhì)化數(shù)據(jù)區(qū)分度切片)6、無監(jiān)督數(shù)據(jù)分箱(等距、等頻和邏輯規(guī)則Police數(shù)據(jù)分箱)+卡分分箱7、IV值特征篩選-皮爾森關(guān)系數(shù)特征賽選-挑戰(zhàn)者-Ensemble learning-SKM+SVM+Ensemble learning+Random Forest+autoencoder(無標注特征)模型調(diào)參081、GBM模型調(diào)參 2、DNN學(xué)習GBM的min_ samples_split 、min_ samples_leaf的權(quán)重,ResNet學(xué)習max_ depth的深度,Loss函數(shù)定義權(quán)重回歸。3、ResNet對梯度回升逆運算,GAN對抗進行

12、逆操作預(yù)測,最大難點風控建模無監(jiān)督學(xué)習建模最大難點風控建模無監(jiān)督學(xué)習建模模型評估091、傳統(tǒng)Gini=2*AUC-1 設(shè)計預(yù)判值做線性相互計算2、使用KS值進行預(yù)測計算 進行模型區(qū)分度設(shè)定預(yù)設(shè)值計算3、互相關(guān)函數(shù)進行模型區(qū)分度(非線性)4、SKM驗證GINI與KS值偏差度GINI: 60% : 過高,需要謹慎的驗證模型KS: 75% : 過高,需要謹慎的驗證模型我通過SKM算法計算到模型在訓(xùn)練集上的Gini系數(shù)達到了0.56左右,K-S值也達到了0.44左右,對于信用評估模型來說,效果算是非常好的。另外從圖中可以看到,模型在訓(xùn)練集上的穩(wěn)定性非常好,5折交叉驗證的曲線非常接近。最大難點風控建模無

13、監(jiān)督學(xué)習建模接下來驗證模型在測試集上的表現(xiàn),驗證其泛化能力最大難點風控建模無監(jiān)督學(xué)習建模最終模型101、全樣本數(shù)據(jù)對模型重新擬合2、好壞樣本區(qū)分度多算法測算:閔可夫斯基距離、. 歐氏距離、 標準化歐氏距離、曼哈頓距離、切比雪夫距離、 馬氏距離、夾角相似距離、漢明距離、杰卡德距離 & 杰卡德相似系數(shù)、互相關(guān) & 相關(guān)距離、 信息熵類腦.編輯距離、SKM距離自動學(xué)習AUC指的是ROC曲線包圍形成的面積,而ROC曲線是由不同的TPR和FPR值形成的曲線。對于一個確定的模型,TPR和FPR都是閾值的函數(shù),當我們學(xué)習到一個閾值之后,TPR和FPR隨之確定。因此,如何學(xué)習閥值閾值才能達到最經(jīng)濟的結(jié)果,就是

14、一個非常重要的問題共線性檢查、模型穩(wěn)定性校驗、嚴格的缺失值處理GBM算法還是Adaboost+Random Forest對模型很重要。建議的傳統(tǒng)模型多方面數(shù)據(jù)的綜合及獨立應(yīng)用征信數(shù)據(jù),工行數(shù)據(jù)(穿透各個產(chǎn)品,如,信用卡,儲蓄,按揭), 第三方數(shù)據(jù) (電信,電力,會員,住址,教育,職稱,等) 分類 (Segmentation)結(jié)合工行高管經(jīng)驗和統(tǒng)計分析, 尋找最佳分類(人群特性,數(shù)據(jù)特征, 或產(chǎn)品需要等)以便獲得最準確的風險預(yù)估 設(shè)計更好的衍生變量通過業(yè)務(wù)知識,建模經(jīng)驗和數(shù)學(xué)計算, 構(gòu)造大量更強更好衍生變量比如,i)原生變量信用額度和借貸金額雖對風險有一點預(yù)估能力, 但是它倆的比率 (信用額度使

15、用率, 指百分之幾的信用額度已經(jīng)用掉了; ii)借貸額增長速度 (以今天的借貸額和六個月前的借貸額的比例。 評估多種回歸模型采用不同的變量輸入方式 (stepwise, forward and、和 backward)及對各種統(tǒng)計參數(shù)調(diào)整 密切跟蹤快速迭代定期檢測模型表現(xiàn)。 發(fā)現(xiàn)問題立即調(diào)整和重新建立模型建議的實施路徑A) 銀行需求的理解 1) 對產(chǎn)品的認識 2) 對目標人群的了解(銀行提出要求) 3) 對風控價格/成本的要求(風險承受度及利潤目標) 4) 工行可以提供的數(shù)據(jù)B) 建模的步驟數(shù)據(jù)收集及整理2. 數(shù)據(jù)分析3. 模型建立4. 模型評估及選擇5. 模型應(yīng)用及落地6. 模型表現(xiàn)跟蹤及反饋

16、7. 模型調(diào)整優(yōu)化及迭代“雙軌模型互補增強”: 同時建立兩套模型(傳統(tǒng)模型 vs 機器學(xué)習模型)。 以傳統(tǒng)模型為主導(dǎo) - 風險因子清晰客戶容易理解以機器學(xué)習模型為“挑戰(zhàn)者”- 識別傳統(tǒng)模型的漏洞和偏差兩者并用行業(yè)領(lǐng)先預(yù)測準確性客戶需求模型輸出的計算對接審批系統(tǒng)及自動化定期報告專人分析采集梳理及質(zhì)量檢測初步量化分析調(diào)整模型參數(shù)重新建立模型前端中臺運營后臺智能獲客平臺C01DSP平臺C02DMP平臺C03嵌入式智能獲客平臺C04金融超市C05兒童金融端綜合產(chǎn)品與風控方案平臺M01身份驗證平臺M02征信解析平臺M03反欺詐M04產(chǎn)品平臺M05場景平臺M06風控模型M07穿透資產(chǎn)工具運營平臺O01自動化審批O02智能盡調(diào)工具O03押品與保全O04智能催收O05貸后預(yù)警O06沙箱平臺F01開放銀行平臺綜合服務(wù)平臺(助貸、融擔、信保、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論