



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、大數(shù)據(jù)個人信用體系、模型及案例綜述摘要:近年來隨著金融科技的迅猛發(fā)展,個人信用體系在大數(shù)據(jù)及云計算技術(shù)發(fā)展背景下拓寬了邊界和內(nèi)涵,解決了傳統(tǒng)信用評級覆蓋不足的痛點并能有效輔助識別真實貸款需求及貸后風(fēng)險,本文對近年大數(shù)據(jù)個人信融體系及個人信用體系模型搭建和進(jìn)行了綜述并對實用案例進(jìn)行分析。關(guān)鍵詞:大數(shù)據(jù)個人信用體系建模近十年來,隨著移動互聯(lián)網(wǎng)和金融科技的迅猛發(fā)展,傳統(tǒng)的個人信用體系已經(jīng)不能滿足市場需求,由于我國的個人信用體系建設(shè)起步較晚,直接影響了我國金融市場的交易秩序。為了夯實金融行業(yè)發(fā)展的基礎(chǔ)推動我國市場經(jīng)濟(jì)健康發(fā)展,以大數(shù)據(jù)為基礎(chǔ)對個人信用體系進(jìn)行拓寬和優(yōu)化對我國征信行業(yè)的發(fā)展有著重要的意義
2、。一、大數(shù)據(jù)個人信用體系的構(gòu)建大數(shù)據(jù)不同于傳統(tǒng)數(shù)據(jù)主要體現(xiàn)在三個方面:一是體量大,體現(xiàn)在規(guī)模和傳輸量是流動速度大,數(shù)據(jù)實時或接近實時獲取和傳輸;三是種類多,數(shù)據(jù)結(jié)構(gòu)形式多樣。構(gòu)建個人信用體系的大數(shù)據(jù)來源有:一是個人產(chǎn)生的數(shù)據(jù),如社交網(wǎng)絡(luò)信息、產(chǎn)品評價、搜索記錄、購物喜好等;二是商業(yè)過程數(shù)據(jù),如物流數(shù)據(jù)、支付數(shù)據(jù)等,也有數(shù)據(jù)公司采集傳統(tǒng)商業(yè)數(shù)據(jù),如大型百貨公司客流量、大型游樂場客流量等數(shù)據(jù);三是來自GPS定位、車輛軌跡和個人穿戴設(shè)備的數(shù)據(jù)(廖理,2019)。大數(shù)據(jù)的發(fā)展為傳統(tǒng)信用評級機(jī)構(gòu)提供了更為先進(jìn)的數(shù)據(jù)采集和數(shù)據(jù)分析手段,有效地克服了傳統(tǒng)征信單值測度的局限性(Lin,2015),不僅大幅度提
3、高了評估結(jié)果的準(zhǔn)確性,還將非傳統(tǒng)信用指標(biāo)納入了評級體系,從而推動了普惠金融實踐(Packin&LevAretz,2016)。國內(nèi)研究者主要集中于研究大數(shù)據(jù)個人信用體系的構(gòu)建:蔡金鑫等(2018)等過改進(jìn)傳統(tǒng)的“5C信用評估法”,構(gòu)建基于大數(shù)據(jù)的個人信用評估指標(biāo)體系,為大數(shù)據(jù)征信的發(fā)展提供參考;王達(dá)山(2016)通過分析互聯(lián)網(wǎng)金融衍生的個人信用數(shù)據(jù),綜合傳統(tǒng)信用評價數(shù)據(jù),從個人身份、信用歷史、經(jīng)濟(jì)能力和社會信用屬性四個信用維度,提出了運用個人信用能力模型來對個人信用能力進(jìn)行評價;方匡南等(2018)提出了基于多源數(shù)據(jù)融合的個人信用模型,可以同時對多個數(shù)據(jù)集進(jìn)行建模和變量選擇,同時考慮了數(shù)據(jù)集間的
4、相似性和異質(zhì)性。所提出的整合模型在變量選擇和分類效果方面都具有明顯的優(yōu)勢。此外,將整合模型應(yīng)用于城市和農(nóng)村兩個數(shù)據(jù)集的個人信用評分中發(fā)現(xiàn),整合模型在實際應(yīng)用中也有很好的表現(xiàn)。已有研究針對基于大數(shù)據(jù)的個人信用體系提出了諸多創(chuàng)造性的觀點,更多的研究聚焦于深入探討如何應(yīng)用大數(shù)據(jù)建立個人信用評估模型。、大數(shù)據(jù)個人信用評估模型及方法袁章帥等(2019)將1GSO-BP協(xié)同集成學(xué)習(xí)算法應(yīng)用于社交網(wǎng)絡(luò)信用評價中,建立基于IGSO-BP協(xié)同集成學(xué)習(xí)算法的社交網(wǎng)絡(luò)信用評價模型。梁心怡(2019)通過統(tǒng)計分析,結(jié)合大學(xué)生網(wǎng)絡(luò)消費信貸的個人信用數(shù)據(jù),通過定性和定量分析建立適合大學(xué)生的個人信用評分模型。宋麗平等(20
5、15)針對P2P網(wǎng)絡(luò)借貸平臺的特點,確定個人信用風(fēng)險評估指標(biāo),并以平臺借款人個人信用等級作為預(yù)測輸出目標(biāo),創(chuàng)建BP神經(jīng)網(wǎng)絡(luò)模型,使貸款人和網(wǎng)貸平臺能夠更好地了解借款人的信用狀況。都紅雯等(2018)以微貸網(wǎng)為例,在該平臺原有信用風(fēng)險評估指標(biāo)基礎(chǔ)上,借鑒國外FICO信用評分方法和國內(nèi)芝麻信用評分方法,嘗試構(gòu)建適用于國內(nèi)P2P網(wǎng)貸平臺的信用評估指標(biāo)體系,用于評估借款者信用。并選取微貸網(wǎng)平臺網(wǎng)站6917個借款者的數(shù)據(jù)、采用SVM-Logistic組合模型、運用修正后的指標(biāo)體系進(jìn)行信用風(fēng)險評估,將測試結(jié)果與實際結(jié)果比較,優(yōu)化了信用風(fēng)險評估體系。謝陳昕(2019)對比分析了基于Logistic回歸、決策
6、樹、隨機(jī)森林、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)的個人信用風(fēng)險評估模型,并在此基礎(chǔ)上提出了采用4種機(jī)器學(xué)習(xí)算法綜合篩選重要變量再建立Logistic回歸模型的兩階段組合模型。應(yīng)用這一模型對“人人貸”平臺借款人數(shù)據(jù)進(jìn)行實證研究。結(jié)果表明:該模型相較于Logistic回歸模型有著更高的精確度,克服了數(shù)據(jù)維度及定性變量數(shù)量的限制,而且提高了單一機(jī)器學(xué)習(xí)算法的指標(biāo)解釋能力,說明基于機(jī)器學(xué)習(xí)算法的Logistic回歸模型對P2P網(wǎng)貸平臺的借款人信用風(fēng)險評估有更好的適應(yīng)性。陸健健等(2019)針對銀行客戶信用評估模型不健全不完善等問題,在對比隨機(jī)森林(RF)、GBD向XGBoost三種集成算法基礎(chǔ)上,提出基于XGBoo
7、st算法的金融客戶信用評估模型。依據(jù)計算得到的相關(guān)多元評價指標(biāo)對個人信用評估進(jìn)行對比研究,實證結(jié)果表明,建立在XGBoost集成算法上的個人信用評估模型性能最優(yōu),在準(zhǔn)確率指標(biāo)上比隨機(jī)森林(RF)高出6%比GBDTT法高0.8%。王磊(2018)建立信用個人信用評價指標(biāo)體系,禾用BP神經(jīng)網(wǎng)絡(luò)算法,建立了借款人個人信用評價模型,為了達(dá)到更好的效果,采用不同的激活函數(shù)及權(quán)值調(diào)整方法進(jìn)行模型優(yōu)化,最終建立基于擬牛頓算法的BP神經(jīng)網(wǎng)絡(luò)模型,能達(dá)到對用戶信命評級96.28%的準(zhǔn)確率。張潔琳(2018)通過對貝葉斯網(wǎng)絡(luò)進(jìn)行分析,以最小風(fēng)險決策準(zhǔn)則作為基本原則,在對用戶進(jìn)行信用評估時建立了一種全新的用戶信用評
8、估模型。在對數(shù)據(jù)進(jìn)行采集的過程中,通過交叉驗證的方式對數(shù)據(jù)進(jìn)行了驗證,最終檢測結(jié)果表明,在對用戶進(jìn)行信用評估的過程中基于最小風(fēng)險準(zhǔn)則的貝葉斯以及貝葉斯網(wǎng)絡(luò)分類模式可以有效的降低信用評估的風(fēng)險。許彩艷等(2019)根據(jù)某商業(yè)銀行提供的客戶歷史數(shù)據(jù),首先基于8萬條記錄,628個變量的原始數(shù)據(jù)進(jìn)行統(tǒng)計描述分析,篩選出有效數(shù)據(jù)集:其次利用Lasso估計,找到最優(yōu)調(diào)節(jié)參數(shù)lambda,根據(jù)lambda與變量數(shù)目對應(yīng)走勢圖,最終篩選出19個變量,最后建立Lasso-logistic模型,分析結(jié)果顯示:訓(xùn)練集預(yù)測準(zhǔn)確率為84.62%,測試集預(yù)測準(zhǔn)確率為78.80%,模型外推效果良好。芝麻信用是是螞蟻金服20
9、15年初推出的第三方征信機(jī)構(gòu),它是根據(jù)各不同種數(shù)據(jù)類型設(shè)計得出來的信用體系,通過阿里云計算、機(jī)器學(xué)習(xí)等技術(shù)手段來反映用戶的信用情況,已經(jīng)在消費分期、現(xiàn)金分期、租賃等場景便用。以國際主流個人信用評分模式作為參考,芝麻信用分從低到高共分為五級,由低到高代表著不同的信用等級。芝麻信用分?jǐn)?shù)越高則代表信用越高,相反則代表低信用。具體評分結(jié)果由五個維度共同決定,分別是:信用歷史、行為偏好、履約能力、身份特質(zhì)、人脈關(guān)系。利用大數(shù)據(jù)技術(shù),芝麻信用綜合考慮等五個維度信息,應(yīng)用了一種改進(jìn)的樹模型GBDT(GradientBoostingDecisionTree),深入挖掘特征之間的關(guān)聯(lián)性,衍生出具備較強(qiáng)信用預(yù)測能力的組合特征,并將該組合特征與原始特征一起使用邏輯回歸線性算法進(jìn)行訓(xùn)練,從而獲得一個具備可解釋性的準(zhǔn)確的線性預(yù)測模型。對個人用戶信息加工后得出最后評分結(jié)果。目前京東白條業(yè)務(wù)已面向全部用戶開放,用戶申請開通時京東會基于用戶消費行為數(shù)據(jù),應(yīng)用大數(shù)據(jù)建模技術(shù)建立量化模型,實時評估違約風(fēng)險和額度測算。京東白條可以得知白熱度信用評分主要基于用戶在京東商城注冊、瀏覽、下單、支付、配送、評價等的海量數(shù)據(jù),并結(jié)合用戶消費和還款情況,深度挖掘用戶身份特征和偏好,評估用戶的履行能力,進(jìn)而預(yù)測用戶的信用風(fēng)險水平。四、結(jié)語基于大數(shù)據(jù)的個人
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025《電視劇發(fā)行合同》
- 應(yīng)對低溫雨雪冰凍大風(fēng)天氣應(yīng)急救援工作措施
- 2025專業(yè)咨詢服務(wù)合同 咨詢服務(wù)合同范本
- 2025年長治從業(yè)資格證模擬考試題下載貨運
- 涵予serena連讀規(guī)則
- 海因利德法則
- 2025年朔州貨物運輸駕駛員從業(yè)資格考試系統(tǒng)
- 2024年七月智能電表內(nèi)置蓄電池防盜拆協(xié)議
- 2025年蘭州貨運從業(yè)資格證網(wǎng)上考試
- 蛋白質(zhì)的互補(bǔ)作用名詞解釋生物化學(xué)
- ABAQUS粘聚力模型(CohesiveModel)應(yīng)用小結(jié)
- 內(nèi)科醫(yī)生工作總結(jié)PPT課件
- 反滲透理論及要求
- 房屋建筑和市政基礎(chǔ)設(shè)施項目基本情況承諾(樣表)
- 智慧冷鏈產(chǎn)業(yè)園整體解決方案
- 供應(yīng)商產(chǎn)品及過程變更控制程序
- 《2022年上海市初中語文課程終結(jié)性評價指南》中規(guī)定的150個文言實詞
- 《鐵道概論鐵路車站》PPT課件
- TI-BQ40Z50-軟件(課堂PPT)
- 建設(shè)項目3000萬元以下估算投資額分檔收費標(biāo)準(zhǔn)
- 《禮儀培訓(xùn)》PPT課件
評論
0/150
提交評論