版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
機(jī)器學(xué)習(xí)自然語言處理視覺 導(dǎo)讀今天分享的主題是信貸場景用戶畫像構(gòu)建與應(yīng)用,將結(jié)合信貸場景的特殊性,深入討論如何建立一個(gè)服務(wù)于整個(gè)信貸業(yè)務(wù)場景的用戶畫像特征體系。今天的介紹會(huì)圍繞下面五點(diǎn)展開:1.信貸場景用戶畫像構(gòu)建方法2.信貸場景用戶畫像構(gòu)建實(shí)踐3.信貸場景用戶畫像應(yīng)用4.擴(kuò)展方向1.信貸用戶畫像業(yè)務(wù)目標(biāo)QiFU奇富科技xataFun.從互聯(lián)網(wǎng)信貸的業(yè)務(wù)視角理解畫像需求,精準(zhǔn)識(shí)別和理解潛在用戶,提供個(gè)性化的信貸產(chǎn)品和服務(wù),提高信貸風(fēng)險(xiǎn)決策準(zhǔn)確性與管理效率,降低不良貸款率,提升盈利能力,實(shí)現(xiàn)持續(xù)發(fā)展。服務(wù)服務(wù)安全合規(guī)規(guī)模風(fēng)險(xiǎn)利潤在核心業(yè)務(wù)場景中實(shí)現(xiàn)應(yīng)用,以實(shí)現(xiàn)閉環(huán)效果?!ぬ嵘龢I(yè)務(wù)指標(biāo):公司的核心目標(biāo)是盈利,因此需要在獲客、經(jīng)營、風(fēng)險(xiǎn)、催收等環(huán)節(jié)提·提升對(duì)自身用戶的認(rèn)知:借貸市場不斷變化,客群構(gòu)成和質(zhì)量都在變化,因此實(shí)時(shí)、準(zhǔn)·提升客戶滿意度:通過畫像構(gòu)建,提高客戶滿意度,增加客戶留存率?!し婪断到y(tǒng)和客戶風(fēng)險(xiǎn):通過畫像構(gòu)建的信息,有效防范潛在的系統(tǒng)性風(fēng)險(xiǎn)和客戶風(fēng)險(xiǎn)。·配合合規(guī)改造:確保業(yè)務(wù)在合規(guī)框架內(nèi)運(yùn)營,配合合規(guī)改造的需求。2.信貸用戶畫像做什么信貸用戶畫像做什么外部數(shù)據(jù)精準(zhǔn)化營銷精細(xì)化運(yùn)營精細(xì)化風(fēng)險(xiǎn)管理3.信貸用戶畫像構(gòu)建技術(shù)難點(diǎn)口數(shù)據(jù)收集和整合口隱私和安全保障口數(shù)據(jù)驗(yàn)證和精準(zhǔn)度評(píng)估□實(shí)時(shí)性和動(dòng)態(tài)性·隱私和安全的保障:由于涉及到用戶個(gè)人信息和隱私數(shù)據(jù),需要保障隱私和安全。數(shù)據(jù)獲取需要獲得完整、合規(guī)的授權(quán)鏈路,采用有效措施確保數(shù)據(jù)的安全和保密。敏感數(shù)據(jù)需按照規(guī)則進(jìn)行脫敏,避免泄密。·數(shù)據(jù)驗(yàn)證與精準(zhǔn)度評(píng)估:構(gòu)建用戶畫像后,需要進(jìn)行有效性驗(yàn)證,確保在實(shí)際業(yè)務(wù)中的準(zhǔn)確和可用性?;A(chǔ)畫像可以通過groundtruth和交叉驗(yàn)證進(jìn)行評(píng)估,而一些場景下可能需要采用問卷調(diào)研等方式進(jìn)行評(píng)估和驗(yàn)證?!?shí)時(shí)性和動(dòng)態(tài)性:有些畫像越穩(wěn)定越好,如廣告設(shè)備維度預(yù)測的性別,如果波動(dòng)很大,說明模型構(gòu)建得不夠好。有些畫像則越能反映用戶行為和情景的變化越好,如我們通過用戶埋點(diǎn)信息挖掘出來的需求畫像。這些畫像從數(shù)據(jù)獲取、數(shù)據(jù)處理到畫像生成都需要高效的數(shù)據(jù)實(shí)時(shí)處理和更新機(jī)制支撐。4.用戶畫像建模流程用戶畫像建模流程構(gòu)建閉環(huán)式用戶畫像構(gòu)建機(jī)制,運(yùn)用專業(yè)技術(shù)規(guī)范畫像構(gòu)建流程,提升用戶畫像建模效果(提升模型指標(biāo)、業(yè)務(wù)指標(biāo))數(shù)據(jù)畫像理解數(shù)據(jù)理解數(shù)據(jù)準(zhǔn)備建立模型畫像評(píng)估畫像發(fā)布一模型部署一模型監(jiān)控一線上測試一線上服務(wù)一模型部署一模型監(jiān)控一線上測試一線上服務(wù)一評(píng)價(jià)標(biāo)準(zhǔn)一技術(shù)指標(biāo)評(píng)估一業(yè)務(wù)指標(biāo)評(píng)估一技術(shù)指標(biāo)評(píng)估一業(yè)務(wù)指標(biāo)評(píng)估用戶畫像構(gòu)建的核心流程包括以下幾個(gè)步驟:·畫像理解:從算法和數(shù)據(jù)的角度定義畫像,清晰認(rèn)知畫像的價(jià)值。理解畫像的定義對(duì)于算法和數(shù)據(jù)的角度是至關(guān)重要的?!?shù)據(jù)了解與準(zhǔn)備:了解數(shù)據(jù)的采集方式,進(jìn)行數(shù)據(jù)探索分析,如可視化分析等。對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估,并進(jìn)行數(shù)據(jù)清洗、變換以及特征工程,以滿足模型的需求?!ぴu(píng)估:制定評(píng)估標(biāo)準(zhǔn),從技術(shù)指標(biāo)和業(yè)務(wù)指標(biāo)兩個(gè)維度對(duì)畫像進(jìn)行評(píng)估。評(píng)估合格后,將畫像或特征上線部署,并建立相應(yīng)的監(jiān)控和線上測試服務(wù)。·迭代與更新:畫像的構(gòu)建并非一次性完成,在需求變化、認(rèn)知深入以及新的有效數(shù)據(jù)源增加的時(shí)候,需要對(duì)畫像進(jìn)行升級(jí)。畫像的構(gòu)建過程是一個(gè)閉環(huán)迭代的循環(huán)。這一流程確保了畫像的質(zhì)量、實(shí)用性,并使其能夠適應(yīng)業(yè)務(wù)需求的不斷變化。信貸場景用戶畫像構(gòu)建實(shí)踐1.用戶核心畫像用戶核心畫像常房產(chǎn)負(fù)債/競品核心用戶畫像主要包括以下九類特征:小微身份:表示用戶是否為企業(yè)主、個(gè)體戶等。雖然在工商數(shù)據(jù)中無法直接查找相關(guān)信息,但他們?cè)谟脩粜袨?、質(zhì)量和需求等方面表明其與工商的小微身份相近。行業(yè)信息:可以基于國標(biāo)的行業(yè)分類,并從風(fēng)險(xiǎn)和需求角度重新優(yōu)化行業(yè)分類標(biāo)準(zhǔn)。采用規(guī)則和NLP算法進(jìn)行構(gòu)建的行業(yè)框架能更好地反映用戶的行業(yè)特點(diǎn)。學(xué)歷標(biāo)簽:包括??埔韵?、專科以上,本科以下、本科以上等分類。可能會(huì)細(xì)分專業(yè)、理工科等類別,甚至根據(jù)畢業(yè)學(xué)校的等級(jí)進(jìn)行分類,以提高對(duì)用戶風(fēng)險(xiǎn)的區(qū)分度。房產(chǎn)標(biāo)簽:包括是否擁有房產(chǎn)以及房產(chǎn)價(jià)值,并通過挖掘房產(chǎn)地理位置,關(guān)聯(lián)小區(qū)、周邊商圈、周邊POI分布、人流等信息。車產(chǎn)標(biāo)簽:通常來自第三方數(shù)據(jù),包括車輛的基本信息,如車輛的品牌、檔次、價(jià)值、年限、殘值等信息。收入標(biāo)簽:采用多種方式進(jìn)行建模,可以是回歸、多分類或單分類等,結(jié)合業(yè)務(wù)指標(biāo)評(píng)估收入分的穩(wěn)定性和可解釋性。負(fù)債信息:挖掘用戶在消金、小貸、消費(fèi)貸、銀行等機(jī)構(gòu)的負(fù)債信息,了解用戶的整體負(fù)債情況。競品信息:通過特征挖掘,獲取用戶在消金、小貸、消費(fèi)貸、銀行等領(lǐng)域的競品信息,幫助了解用戶的競品使用情況。2.用戶畫像體系策策略用戶畫像體系以業(yè)務(wù)需求為驅(qū)動(dòng),從信貸場景的策略應(yīng)用到畫像特征粒度,建立涵蓋核心畫像、基礎(chǔ)畫像和特征畫像三層的用戶畫像體系年齡年齡小微/泛小微身份設(shè)備偏好行業(yè)職業(yè)學(xué)歷房產(chǎn)車產(chǎn)興趣地域收入負(fù)債/競品多頭航旅消費(fèi)PreA質(zhì)量分基礎(chǔ)畫像PreA意向分完件意向分稅務(wù)特征企業(yè)經(jīng)營特征動(dòng)支意愿分人行征信競品解讀信用子分AP撞庫特征電銷行為特征電銷標(biāo)簽特征INR特征點(diǎn)擊登錄等埋點(diǎn)注冊(cè)完件授信動(dòng)支還款逾期催收調(diào)額調(diào)價(jià)關(guān)系網(wǎng)特征信息流廣告特征短信營銷特征APP偏好資方拒絕性別畫像的特征體系還包括基礎(chǔ)畫像和特征畫像兩類?;A(chǔ)畫像包含通用的年齡、性別、設(shè)備偏好、APP偏好,以及用戶的習(xí)慣、所屬地域,所屬地域可以衍生出許多屬性,比如出生地、手機(jī)和身份證所在地。除此之外還有航旅,比如坐飛機(jī)或者坐高鐵的習(xí)慣,以及Wifi接入,POl的信息等第三個(gè)層面就是特征畫像,其粒度更細(xì),涵蓋范圍更廣。它包括信息流廣告特征,主要是從RTA請(qǐng)求中抽取的特征,如不同媒體的請(qǐng)求、廣告位,請(qǐng)求的次數(shù)、時(shí)間分布、設(shè)備信息等等,都挖掘成設(shè)備廣告特征。此外,還有一些營銷類的特征,如電銷的營銷行為。還有埋點(diǎn)的特征,對(duì)于埋點(diǎn)特征,用戶通常已經(jīng)下載了APP,并且大部分已經(jīng)完成了注冊(cè),用戶再去登錄,一定與其需求或者關(guān)注點(diǎn)是強(qiáng)相關(guān)的,所以從中可以挖掘出很多特征。我們也會(huì)把業(yè)務(wù)中各個(gè)環(huán)節(jié)的累積行為數(shù)據(jù)挖掘成相關(guān)的特征,比如從注冊(cè)到授信、動(dòng)支、還款、逾期、催收等,還有調(diào)額調(diào)價(jià)這種業(yè)務(wù)的主動(dòng)行為,以及經(jīng)營行為帶來的用戶反饋,也建成相應(yīng)的特征主題表。除此之外,為了方便使用,在提供特征寬表給業(yè)務(wù)使用時(shí),往往也會(huì)結(jié)合具體業(yè)務(wù)側(cè)的應(yīng)用建立分場景的模型,如PreA質(zhì)量分、PreA意愿分、動(dòng)資意愿分、信用子分等。對(duì)小微企業(yè)主,挖掘企業(yè)相關(guān)的經(jīng)營類的特征,比如上下游供應(yīng)鏈、稅票等信息。除此之外,我們也會(huì)通過關(guān)系網(wǎng)的特征,去挖掘一些畫像標(biāo)簽,或者是一些特征字段。在常規(guī)數(shù)據(jù)源和手段之外,關(guān)系網(wǎng)往往能帶目標(biāo)3.信貸場景畫像構(gòu)建技術(shù)框架目標(biāo)4.多數(shù)據(jù)源融合多數(shù)據(jù)源融合從特征、模型子分或置信度三個(gè)維度融合在實(shí)際中,多數(shù)據(jù)源的融合通常采用三種主要方法:·特征層面融合:將不同數(shù)據(jù)源的特征整合在一起,形成一個(gè)寬特征,并建立單一模型。這是一種較為通用的方法。這種方式有一個(gè)問題,就是在引入新數(shù)據(jù)源的時(shí)候,需要將新模型應(yīng)用到所有的樣本上,難以平滑過度?!为?dú)建模再融合:不同數(shù)據(jù)源分別建模,然后使用多個(gè)模型進(jìn)行融合。例如,對(duì)外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)分別建模,然后將兩個(gè)分?jǐn)?shù)進(jìn)行回歸融合。這種方法可以降低不同數(shù)據(jù)語境之間的耦合,但也可能引起更新問題,類似于特征層面融合?!ぶ眯哦热诤希翰煌臄?shù)據(jù)源單獨(dú)建立模型,利用各自的模型分給畫像賦置信度,最后融合時(shí)取最高置信度的結(jié)果。對(duì)于實(shí)事類的數(shù)據(jù)樣本,我們可以把置信度賦予最高值。這種方式的優(yōu)點(diǎn)是易于向前兼容,但整體指標(biāo)會(huì)比前兩種略差。選擇合適的融合方法取決于具體業(yè)務(wù)場景、數(shù)據(jù)質(zhì)量和模型效果的要求。每種方法都有其優(yōu)點(diǎn)和缺點(diǎn),需要根據(jù)實(shí)際情況進(jìn)行權(quán)衡和選擇。5.畫像部署畫像部署畫像部署畫像部署將用戶畫像產(chǎn)出結(jié)果封裝以滿足業(yè)務(wù)系統(tǒng)在不同場景的使用需求用戶畫像特用戶畫像特征體系6.畫像效果及價(jià)值評(píng)估畫像效果及價(jià)值評(píng)估從模型技術(shù)指標(biāo)、整體準(zhǔn)召、業(yè)務(wù)指標(biāo)三個(gè)層面判斷效果和檢驗(yàn)價(jià)值7.畫像管理畫像管理標(biāo)準(zhǔn)規(guī)范標(biāo)準(zhǔn)規(guī)范→衍生邏輯、報(bào)告模板、命名規(guī)則、準(zhǔn)確性驗(yàn)證信息融合→多數(shù)據(jù)融合、不斷提升準(zhǔn)確率和覆蓋率版本管理→多版本并行、平滑切換、影響最小化監(jiān)控報(bào)警→早發(fā)現(xiàn)、早解決(執(zhí)行情況、數(shù)據(jù)穩(wěn)定性、業(yè)務(wù)指標(biāo))知識(shí)體系→清晰、全面(字段解釋、加工和挖掘方案)畫像服務(wù)→可視化、在線離線(生產(chǎn)、部署)、特征庫、自動(dòng)化建模、高效回溯·建立標(biāo)準(zhǔn)規(guī)范:制定邏輯衍生、評(píng)估報(bào)告、命名規(guī)則等標(biāo)準(zhǔn),確保評(píng)估報(bào)告完善,驗(yàn)證準(zhǔn)確性的標(biāo)準(zhǔn)得以實(shí)施。·口徑統(tǒng)一:實(shí)現(xiàn)核心畫像的橫向打通,統(tǒng)一口徑,確保新老畫像的一致性?!ば畔⑷诤希簭?qiáng)調(diào)多數(shù)據(jù)源融合,不斷提升畫像的準(zhǔn)確率和覆蓋率?!ぐ姹竟芾恚汗芾矶喟姹静⑿校瑢?shí)現(xiàn)平滑切換,最小化對(duì)系統(tǒng)的影響?!けO(jiān)控報(bào)警:提前發(fā)現(xiàn)問題,早期解決,包括執(zhí)行情況、數(shù)據(jù)穩(wěn)定性以及業(yè)務(wù)指標(biāo)等的監(jiān)·知識(shí)體系:建立清晰、全面的知識(shí)體系,包括字段解釋、加工和挖掘方案等?!ぎ嬒穹?wù):實(shí)現(xiàn)可視化管理,涵蓋在線離線生產(chǎn)和部署、特征庫的維護(hù)、自動(dòng)化建模以及高效回溯等功能。用戶畫像應(yīng)用從增長獲客、風(fēng)險(xiǎn)管理、客戶經(jīng)營等角度賦能信貸業(yè)務(wù)優(yōu)化反欺詐策略提升A卡性能優(yōu)化準(zhǔn)入策略提升目客群規(guī)模優(yōu)化額價(jià)策略降額xx億提升B卡性能精準(zhǔn)營銷促完/促動(dòng)/召回等提升C卡性能優(yōu)化催收策略精準(zhǔn)獲客降低獲客成本擴(kuò)展方向采用前沿算法技術(shù),如知識(shí)圖譜、圖計(jì)算、大語言模型等Q&AQ1:公司大模型相關(guān)在做的有哪些應(yīng)用的探索,效果怎么樣?A1:大模型已經(jīng)在催收、電銷等業(yè)務(wù)中得到明顯的應(yīng)用效果。A2:A卡(ApplicationScoreCard)是指貸前準(zhǔn)入環(huán)節(jié)的申請(qǐng)?jiān)u分卡,用于貸前審批階段對(duì)貸款申請(qǐng)人進(jìn)行風(fēng)險(xiǎn)評(píng)估;B卡(BehaviorScoreCard)用于貸中管理,利用借款人的還款及交易行為,結(jié)合其他數(shù)據(jù)預(yù)測借款人未來的還款能力和意愿,推測用戶是否會(huì)逾期。B卡通常又分調(diào)額B卡和交易B卡;C卡(BehaviorScoreCardi)用于貸后催收管理,在借款人當(dāng)前狀態(tài)未逾期的情況下,預(yù)測未來該筆貸款變?yōu)閴馁~的概率。A3:通常是一些結(jié)構(gòu)化的表。舉個(gè)例子,比如用戶有沒有車子,用0和1表示,另外我們會(huì)把標(biāo)簽的概率值或置信度也帶上。還會(huì)包含模型版本、更新時(shí)間、數(shù)據(jù)源。Q4:可以再深入介紹一下模型融合嗎?A4:同一個(gè)用戶不能在同一個(gè)標(biāo)簽下面有多個(gè)互相沖突的結(jié)果。比一個(gè)用戶有沒有車。可能在征信報(bào)告里看到他是有車貸的,那么大概率是有車的,還可能通過外部保險(xiǎn)數(shù)據(jù)中看到他有車險(xiǎn),還有可能會(huì)用內(nèi)部所有數(shù)據(jù)建模預(yù)測其有車沒車的概率,最終可能得到多個(gè)結(jié)果,而業(yè)務(wù)希望的是只有一個(gè)結(jié)果,才簡單好用,不會(huì)使策略過于復(fù)雜。這時(shí)就需要將結(jié)果融合成一個(gè),這里就是剛才提到的三種方法,三種方法各有優(yōu)劣,目前我們更多采用的是置信度融合的方法。Q5:可以介紹一下深度學(xué)習(xí)的主要應(yīng)用場景嗎?A5:深度學(xué)習(xí)的應(yīng)用場景,首先就是文中提到的ABC三個(gè)卡片,還有一個(gè)場景是挖掘行為序列模型。另外,自然語言類相關(guān)處理的模型也會(huì)用到深度學(xué)習(xí)的算法。我們不會(huì)純粹地為了使用前沿算法而去用,而是結(jié)合具體業(yè)務(wù)需求。Q6:如果樣本包含很多客群,分客群單獨(dú)建模效果會(huì)更好嗎?A6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2022-2023學(xué)年重慶市大足區(qū)小學(xué)三年級(jí)下冊(cè)數(shù)學(xué)期末試題及答案
- 白酒釀造課程設(shè)計(jì)
- 盒蓋兩腔結(jié)構(gòu)課程設(shè)計(jì)
- 2021-2022年廣東省廣州市荔灣區(qū)六年級(jí)上冊(cè)期末英語試卷及答案(教科版)
- Unit9IlikemusicthatIcandancetoSectionA(2a-2d)教學(xué)設(shè)計(jì)人教版九年級(jí)英語全冊(cè)
- Unit5Myfuturelesson27(重點(diǎn)詞匯句型課堂練習(xí))2024-2025學(xué)年冀教版八年級(jí)英語上冊(cè)
- WeleunitListeningandSpeaking教學(xué)設(shè)計(jì)-高中英語人教版
- Unit4Whenistheartshow?(教學(xué)設(shè)計(jì))-人教PEP版英語五年級(jí)下冊(cè)
- 2024年版總監(jiān)聘用合同補(bǔ)充條款明確合同版B版
- 2024年度代養(yǎng)收養(yǎng)入住雙方責(zé)任明確協(xié)議3篇
- 肺結(jié)核課件教學(xué)課件
- 八年級(jí)上冊(cè)物理全冊(cè)知識(shí)點(diǎn)總結(jié)(人教)
- 高考英語詞匯3500詞-亂序版
- 2024年廣告代理合同的廣告投放范圍與分成比例
- 2024年光伏發(fā)電項(xiàng)目融資貸款合同
- E英語教程(第二版)1教學(xué)課件Unit-3
- 高鐵乘務(wù)禮儀培訓(xùn)
- 2022年公務(wù)員多省聯(lián)考《申論》真題(陜西A卷)及答案解析
- 2024-2025學(xué)年上學(xué)期期中教育學(xué)業(yè)質(zhì)量監(jiān)測八年級(jí)生物學(xué)試卷
- 文化遺產(chǎn)與自然遺產(chǎn)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 反向開票政策解讀課件
評(píng)論
0/150
提交評(píng)論