版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
移動(dòng)搜索個(gè)性化演示文稿4/8/2023現(xiàn)在是1頁(yè)\一共有29頁(yè)\編輯于星期二4/8/2023(優(yōu)選)移動(dòng)搜索個(gè)性化現(xiàn)在是2頁(yè)\一共有29頁(yè)\編輯于星期二移動(dòng)搜索產(chǎn)品形態(tài)3現(xiàn)在是3頁(yè)\一共有29頁(yè)\編輯于星期二個(gè)性化搜索–挑戰(zhàn)大數(shù)據(jù),稀疏,長(zhǎng)尾,噪音淘寶上海量的商品,針對(duì)個(gè)體而言,發(fā)生行為的商品有限,稀疏度在百萬(wàn)分之一,甚至更低用戶行為模式的挖掘和利用網(wǎng)購(gòu)行為的復(fù)雜性如何準(zhǔn)確的描述用戶的興趣和特色,包括長(zhǎng)短期興趣等?Peoplechangeovertime冷啟動(dòng)
新用戶
新商品多樣性與精確性的兩難困境Interestingnessv.relevanceNeedSerendipity用戶界面與用戶體驗(yàn)個(gè)性化體驗(yàn)的可解釋性系統(tǒng)的挑戰(zhàn)性評(píng)估的挑戰(zhàn)性4現(xiàn)在是4頁(yè)\一共有29頁(yè)\編輯于星期二個(gè)性化搜索誤區(qū)千人千面并非意味著去追求單純個(gè)體的個(gè)性化體驗(yàn)個(gè)性化搜索是立足于提升整體用戶的個(gè)性化體驗(yàn)Personalization
!=customization勿忘行為建模的基本假設(shè)
hypothesis:
接受商品接受他得所有屬性過(guò)度個(gè)性化搜索場(chǎng)景的個(gè)性化:“topersonalizeornottopersonalize“Explore&Exploitation主觀性vs.客觀性“datadriven”購(gòu)物行為所表現(xiàn)的個(gè)性化特點(diǎn)!=用戶的物理個(gè)性化特征5現(xiàn)在是5頁(yè)\一共有29頁(yè)\編輯于星期二個(gè)性化技術(shù)的魅力6個(gè)性化技術(shù)機(jī)器學(xué)習(xí)計(jì)算經(jīng)濟(jì)學(xué)系統(tǒng)架構(gòu)大數(shù)據(jù)分析現(xiàn)在是6頁(yè)\一共有29頁(yè)\編輯于星期二目錄目錄1234個(gè)性化體系架構(gòu)Query/user意圖識(shí)別
個(gè)性化數(shù)據(jù)個(gè)性化模型6E&E5實(shí)時(shí)個(gè)性化7現(xiàn)在是7頁(yè)\一共有29頁(yè)\編輯于星期二鳥(niǎo)瞰個(gè)性化體系用戶query商品個(gè)性化數(shù)據(jù)+模型用戶關(guān)系數(shù)據(jù)商品關(guān)系數(shù)據(jù)用戶-商品關(guān)系數(shù)據(jù)海選層精排層(長(zhǎng)期個(gè)性化+實(shí)時(shí)個(gè)性化)Re-rank層Query/user意圖識(shí)別GraphSearch引擎?zhèn)€性化搜索結(jié)果展示8現(xiàn)在是8頁(yè)\一共有29頁(yè)\編輯于星期二個(gè)性化體系offline長(zhǎng)期個(gè)性化模型建模實(shí)時(shí)個(gè)性化模型建模基于session的用戶點(diǎn)擊行為序列建立的實(shí)時(shí)userprofile建模實(shí)時(shí)人群-商品轉(zhuǎn)化率預(yù)估建模分布式數(shù)據(jù)處理
&并行機(jī)器學(xué)習(xí)(ODPS)Pv日志成交日志點(diǎn)擊日志SyncProcessor基于hbase的HqueueAucProcessorUserProcessorHbase(歷史表)iStreamonyarnredis實(shí)時(shí)<人群-商品>反饋特征抽取、計(jì)算,ID化用戶實(shí)時(shí)profile預(yù)測(cè)器Nearline實(shí)時(shí)增量數(shù)據(jù)TT推送的實(shí)時(shí)日志RealtimeLearner在線學(xué)習(xí)模塊User-profile實(shí)時(shí)模型(性別,購(gòu)買力,品牌,店鋪,風(fēng)格。。)UPS商品引擎實(shí)時(shí)特征更新長(zhǎng)期個(gè)性化模型海選層Re-rank層精排層長(zhǎng)期個(gè)性化實(shí)時(shí)個(gè)性化onlineXW
YQuery意圖預(yù)測(cè)用戶引擎實(shí)時(shí)模型Nearline環(huán)節(jié)實(shí)時(shí)更新的模型更新商品端用戶行為累積特征模型更新實(shí)現(xiàn)用戶profile的實(shí)時(shí)更新輸出模型給
online輸出模型給nearline通過(guò)nearline實(shí)現(xiàn)Online計(jì)算模塊特征表現(xiàn)X
的變化9現(xiàn)在是9頁(yè)\一共有29頁(yè)\編輯于星期二個(gè)性化體系Offline離線模型訓(xùn)練數(shù)據(jù)收集,過(guò)濾,聚合,特征ID化利用batch-learning產(chǎn)出nearline環(huán)節(jié),online環(huán)節(jié)所需要的模型Near-line構(gòu)建于流式計(jì)算體系的實(shí)時(shí)日志解析,行為特征抽取,聚合實(shí)時(shí)用戶profile預(yù)測(cè),實(shí)時(shí)人群-商品累積行為特征計(jì)算,離散化處理更新在線排序計(jì)算依賴的實(shí)時(shí)字段,UPS中實(shí)時(shí)userprofile字段,引擎中的商品正排字段構(gòu)建基于mini-batch的在線學(xué)習(xí)模型,增強(qiáng)系統(tǒng)的適應(yīng)新數(shù)據(jù)的能力和explore能力實(shí)時(shí)反作弊Online各個(gè)排序維度模型的在線預(yù)測(cè)多個(gè)排序因素的在線融合EE策略10現(xiàn)在是10頁(yè)\一共有29頁(yè)\編輯于星期二移動(dòng)元素@個(gè)性化體系查詢意圖
時(shí)間,地點(diǎn),逛/搜
PullorPush用戶肖像移動(dòng)端特色數(shù)據(jù)
跨屏行為建模,實(shí)時(shí)肖像特征P(滿意|query,用戶,商品)實(shí)時(shí)個(gè)性化E&EPULLPUSH11現(xiàn)在是11頁(yè)\一共有29頁(yè)\編輯于星期二目錄目錄1234個(gè)性化體系架構(gòu)Query/user意圖識(shí)別
個(gè)性化數(shù)據(jù)個(gè)性化模型6E&E5實(shí)時(shí)個(gè)性化12現(xiàn)在是12頁(yè)\一共有29頁(yè)\編輯于星期二Query/User意圖識(shí)別User-context地點(diǎn)+時(shí)間13現(xiàn)在是13頁(yè)\一共有29頁(yè)\編輯于星期二Query/User意圖識(shí)別訓(xùn)練數(shù)據(jù)轉(zhuǎn)化型query瀏覽型queryQuery的個(gè)性化需求Query進(jìn)行個(gè)性化標(biāo)注地域性別購(gòu)買力年齡段。。。顯式:query包含個(gè)性化tag隱示:query不包含個(gè)性化tag連衣裙,大褲衩
電影票骷髏頭T恤情侶裝蕾絲正版海外購(gòu)官網(wǎng)高檔samsung三星galaxynotei92203g(gsm/wcdma)手機(jī)黑色彈力修身高腰小腳褲薄款eg.建立以query轉(zhuǎn)化率為目標(biāo);用戶session內(nèi)行為為特征的LR模型解決16%搜索意圖明確的
輪胎鐘點(diǎn)工移動(dòng)端的場(chǎng)景時(shí)間+地點(diǎn)+狀態(tài)14現(xiàn)在是14頁(yè)\一共有29頁(yè)\編輯于星期二Query的隱含個(gè)性化需求15現(xiàn)在是15頁(yè)\一共有29頁(yè)\編輯于星期二目錄目錄1234個(gè)性化體系架構(gòu)Query/user意圖識(shí)別
個(gè)性化數(shù)據(jù)個(gè)性化模型6E&E5實(shí)時(shí)個(gè)性化16現(xiàn)在是16頁(yè)\一共有29頁(yè)\編輯于星期二私有化/移動(dòng)化/社交化跨屏行為、實(shí)時(shí)用戶肖像手機(jī)類型網(wǎng)絡(luò)類型GPS(經(jīng)緯度)天氣場(chǎng)景(移動(dòng),家,辦公)17現(xiàn)在是17頁(yè)\一共有29頁(yè)\編輯于星期二用戶DNA@個(gè)性化體系人口統(tǒng)計(jì)學(xué)性別,年齡段,職業(yè),人生階段等行為偏好價(jià)格,店鋪,品牌等用戶DNA社會(huì)關(guān)系微博好友,手機(jī)通訊錄,轉(zhuǎn)賬等其他手機(jī)設(shè)備,網(wǎng)絡(luò)類型等場(chǎng)景(時(shí)間,地點(diǎn),狀態(tài)等)興趣偏好風(fēng)格,款式,愛(ài)吃,愛(ài)美,愛(ài)旅游等數(shù)據(jù)數(shù)億月活躍用戶數(shù)十億日均用戶行為次數(shù)數(shù)千億+用戶-商品關(guān)系鏈數(shù)百億+用戶-店鋪關(guān)系鏈數(shù)百億+用戶-用戶關(guān)系鏈千萬(wàn)
達(dá)人買家?guī)?8現(xiàn)在是18頁(yè)\一共有29頁(yè)\編輯于星期二實(shí)時(shí)用戶DNA@個(gè)性化體系行為4…………..N個(gè)采用滑窗方式抽取訓(xùn)練樣本,窗口內(nèi)的行為中前面n-1個(gè)提取特征,最后一個(gè)當(dāng)作目標(biāo)用戶48小時(shí)內(nèi)的行為序列N-1個(gè)行為序列個(gè)性化偏好先驗(yàn)概率行為類型最后一個(gè)針對(duì)每個(gè)個(gè)性化偏好提取是否點(diǎn)擊或成交該個(gè)性化偏好+LR模型行為5行為6行為7行為N行為1行為2行為3Pc端行為移動(dòng)端行為移動(dòng)首次pvNophysicalsessionboundary19現(xiàn)在是19頁(yè)\一共有29頁(yè)\編輯于星期二目錄目錄1234個(gè)性化體系架構(gòu)Query/user意圖識(shí)別
個(gè)性化數(shù)據(jù)個(gè)性化模型6E&E5實(shí)時(shí)個(gè)性化20現(xiàn)在是20頁(yè)\一共有29頁(yè)\編輯于星期二瀏覽和交互模式:自上而下的串行模型21現(xiàn)在是21頁(yè)\一共有29頁(yè)\編輯于星期二問(wèn)題定義@個(gè)性化模型個(gè)性化模型目標(biāo)是:如何考慮移動(dòng)場(chǎng)景下瀏覽和交互模式下產(chǎn)生的bias串行瀏覽模式下:有效點(diǎn)擊量化模型(UCM)有效pv量化模型(UBM)22現(xiàn)在是22頁(yè)\一共有29頁(yè)\編輯于星期二UBM&UCM有效曝光量化模型(UBM)參考:AUserBrowsingModeltoPredictSearchEngineClickDatafromPastObservations,GeorgesE.Dupret,BenjaminPiwowarski,SIGIR’08有效點(diǎn)擊量化模型(UCM)參考:Modelingdwelltimetopredictclick-levelsatisfaction,YounghoKim,AhmedHassan,RyenW.White,andImedZitouni,WSDM201423現(xiàn)在是23頁(yè)\一共有29頁(yè)\編輯于星期二結(jié)果分析@UBM&UCMDwellTime點(diǎn)擊轉(zhuǎn)化率UBM訓(xùn)練結(jié)果UCM訓(xùn)練結(jié)果24現(xiàn)在是24頁(yè)\一共有29頁(yè)\編輯于星期二個(gè)性化模型UBMUCM修正修正【0】:q下商品u的滿意度Usermodelqueryuser人口統(tǒng)計(jì)學(xué)標(biāo)簽購(gòu)物偏好用戶簇標(biāo)簽移動(dòng)設(shè)備相關(guān)場(chǎng)景相關(guān)商品類目標(biāo)簽商品標(biāo)簽賣家/店鋪商品ID匹配類歷史反饋類線性模型:L1-LR
非線性:GBM,DNN25現(xiàn)在是25頁(yè)\一共有29頁(yè)\編輯于星期二目錄目錄1234個(gè)性化體系架構(gòu)Query/user意圖識(shí)別
個(gè)性化數(shù)據(jù)個(gè)性化模型6E&E5實(shí)時(shí)個(gè)性化26現(xiàn)在是26頁(yè)\一共有29頁(yè)\編輯于星期二流量大,屏幕小行為特點(diǎn):碎片化,隨時(shí)隨地Pc點(diǎn)擊分布@day移動(dòng)點(diǎn)擊分布@day27現(xiàn)在是27頁(yè)\一共有29頁(yè)\編輯于星期二互聯(lián)網(wǎng)機(jī)器學(xué)習(xí)需要“上線”28引用:Tieyan
Liu阿里技術(shù)沙龍08/2013vs現(xiàn)在是28頁(yè)\一共有29頁(yè)\編輯于星期二實(shí)時(shí)計(jì)算@移動(dòng)搜索TT日志實(shí)時(shí)日志解析實(shí)時(shí)user-profile預(yù)測(cè)實(shí)時(shí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院護(hù)工保密協(xié)議書(shū)范本(3篇)
- 舞蹈新生班主題課程設(shè)計(jì)
- 藝術(shù)與設(shè)計(jì)課程設(shè)計(jì)案例
- 自然探索團(tuán)隊(duì)課程設(shè)計(jì)
- 簡(jiǎn)易課程設(shè)計(jì)
- 英語(yǔ)詞匯班課程設(shè)計(jì)
- 正太分布課程設(shè)計(jì)
- 綠色蟈蟈課程設(shè)計(jì)
- 財(cái)務(wù)制度匯編
- 《刑罰的體系與種類》課件
- 鄧州市龍理鄉(xiāng)第一初級(jí)中學(xué)-2025年春節(jié)寒假跨學(xué)科主題實(shí)踐作業(yè)模板【課件】
- 2024年中央經(jīng)濟(jì)工作會(huì)議精神解讀
- 2023-2024學(xué)年廣東省深圳市福田區(qū)八年級(jí)(上)期末歷史試卷
- 公司安全事故隱患內(nèi)部舉報(bào)、報(bào)告獎(jiǎng)勵(lì)制度
- 歷史常識(shí)單選題100道及答案解析
- 2024年陜西榆林市神木市公共服務(wù)輔助人員招聘775人歷年高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 福建省泉州市2023-2024學(xué)年高一上學(xué)期期末質(zhì)檢英語(yǔ)試題(解析版)
- GA 2139-2024警用防暴臂盾
- 2024年首都機(jī)場(chǎng)集團(tuán)招聘筆試參考題庫(kù)附帶答案詳解
- GB 6944-2012 危險(xiǎn)貨物分類和品名編號(hào)(高清版)
- 建筑制圖學(xué)習(xí)基礎(chǔ)實(shí)訓(xùn)報(bào)告
評(píng)論
0/150
提交評(píng)論