資源推薦系統(tǒng)_第1頁(yè)
資源推薦系統(tǒng)_第2頁(yè)
資源推薦系統(tǒng)_第3頁(yè)
資源推薦系統(tǒng)_第4頁(yè)
資源推薦系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

資源推薦系統(tǒng)第一頁(yè),共三十二頁(yè),編輯于2023年,星期三Outline選題的初衷什么是資源推薦系統(tǒng)我們的任務(wù)資源推薦系統(tǒng)的設(shè)計(jì)MainIdeasMainDataStructuresMainFrameAndAlgorithms關(guān)于RRSDemo第二頁(yè),共三十二頁(yè),編輯于2023年,星期三什么是資源推薦系統(tǒng)資源泛指網(wǎng)絡(luò)上存在的可共享的數(shù)字化信息資源推薦系統(tǒng)根據(jù)大量用戶(hù)對(duì)眾多資源訪(fǎng)問(wèn)(查詢(xún)和使用)的歷史記錄,分析用戶(hù)可能的興趣所在,提供資源推薦服務(wù),把用戶(hù)尚未訪(fǎng)問(wèn)、但可能喜歡的資源推薦給用戶(hù)。第三頁(yè),共三十二頁(yè),編輯于2023年,星期三資源推薦與資源共享用戶(hù)需求Q:我需要關(guān)于某方面的資源A:有我感興趣的東西嗎R:你看看這些東東,不錯(cuò)的可以先其想所想,達(dá)到較好的使用滿(mǎn)意度更有潛力的資源共享方式第四頁(yè),共三十二頁(yè),編輯于2023年,星期三推薦的方式用戶(hù)自定義的個(gè)性化資源把與用戶(hù)訪(fǎng)問(wèn)過(guò)的資源類(lèi)似的資源推薦給用戶(hù)把某些用戶(hù)訪(fǎng)問(wèn)的資源推薦給與他們興趣類(lèi)似的用戶(hù)第五頁(yè),共三十二頁(yè),編輯于2023年,星期三我們的任務(wù)構(gòu)造出資源推薦系統(tǒng)的框架,分析各個(gè)模塊的功能,給出實(shí)現(xiàn)的主要流程和細(xì)節(jié)。分析資源推薦中涉及的主要問(wèn)題,給出參考的算法。構(gòu)建一個(gè)模擬的應(yīng)用環(huán)境,在該環(huán)境中演示資源推薦系統(tǒng)的主要功能和算法。第六頁(yè),共三十二頁(yè),編輯于2023年,星期三MainIdeas.1資源推薦的前提Assumption:用戶(hù)的興趣是比較穩(wěn)定的用戶(hù)的興趣是比較穩(wěn)定的,隨時(shí)間變化的幅度是比較小的用戶(hù)的興趣是在不斷變化的,盡管幅度比較小用戶(hù)較近的對(duì)資源的訪(fǎng)問(wèn)能體現(xiàn)用戶(hù)當(dāng)前的興趣時(shí)間效應(yīng)Assumption:更新的資源具有更大的吸引力第七頁(yè),共三十二頁(yè),編輯于2023年,星期三MainIdeas.2如何發(fā)現(xiàn)用戶(hù)興趣?兩個(gè)假設(shè):如果一個(gè)用戶(hù)經(jīng)常訪(fǎng)問(wèn)某類(lèi)資源,那么他很可能喜歡該類(lèi)資源;如果一些用戶(hù)經(jīng)常訪(fǎng)問(wèn)類(lèi)似的資源,那么他們的興趣可能相同。第八頁(yè),共三十二頁(yè),編輯于2023年,星期三MainIdeas.3問(wèn)題:如何進(jìn)行推薦主要考慮的因素用戶(hù)對(duì)資源類(lèi)的偏好用戶(hù)之間的相似度時(shí)間效應(yīng):興趣的變化,資源的新穎用戶(hù)對(duì)推薦的配合程度第九頁(yè),共三十二頁(yè),編輯于2023年,星期三參考定義.1用戶(hù)的資源類(lèi)的偏好對(duì)某類(lèi)資源的訪(fǎng)問(wèn)數(shù)量的相對(duì)大小作為偏好的程度用戶(hù)之間的相似度當(dāng)前相似度定義為不對(duì)稱(chēng)性如果進(jìn)一步考慮時(shí)間的因素可以考慮形成Listof<資源id,Date>以dateFactor(Date)的和作為相似度第十頁(yè),共三十二頁(yè),編輯于2023年,星期三參考定義.2時(shí)間效應(yīng):興趣的變化,資源的新穎興趣保持性依時(shí)間而衰減衰減系數(shù)α,0<α<=1時(shí)間效應(yīng):資源的新穎資源吸引力以時(shí)間而衰減衰減系數(shù)β,0<β<=1用戶(hù)對(duì)推薦的配合程度用戶(hù)對(duì)推薦資源的訪(fǎng)問(wèn)情況第十一頁(yè),共三十二頁(yè),編輯于2023年,星期三主要數(shù)據(jù)結(jié)構(gòu).1用戶(hù)集合Users資源集合Resource系統(tǒng)訪(fǎng)問(wèn)日志UserAccessLogDisp:記錄從某個(gè)日期(系統(tǒng)定義)開(kāi)始用戶(hù)對(duì)資源的訪(fǎng)問(wèn)歷史推薦資源訪(fǎng)問(wèn)日志UserRecommendLogDisp:記錄在某個(gè)日期(用戶(hù)登錄)用戶(hù)對(duì)推薦資源的訪(fǎng)問(wèn)歷史用戶(hù)-用戶(hù)相似矩陣

User-Usercurrent-similaritymatrixDisp:記錄從當(dāng)前的日志計(jì)算出的用戶(hù)與用戶(hù)之間的相似程度用戶(hù)-用戶(hù)相似系數(shù)矩陣

User-Usersimilarity-confidencematrix(User-usersimilarity-indexmatrix)Disp:記錄基于整個(gè)訪(fǎng)問(wèn)歷史的用戶(hù)與用戶(hù)之間的相似性程度第十二頁(yè),共三十二頁(yè),編輯于2023年,星期三主要數(shù)據(jù)結(jié)構(gòu).2用戶(hù)推薦列表UserRecommendListDisp:要推薦給某個(gè)用戶(hù)資源列表當(dāng)前推薦列表SelectedRecommendListDisp:當(dāng)前一次推薦給用戶(hù)的資源列表用戶(hù)訪(fǎng)問(wèn)列表UserAccessListDisp:某個(gè)用戶(hù)對(duì)資源訪(fǎng)問(wèn)的歷史記錄(從某個(gè)日期開(kāi)始)推薦必要度向量UserrecommendneedityvectorDisp:描述對(duì)用戶(hù)進(jìn)行推薦的必要度用戶(hù)-資源類(lèi)系數(shù)矩陣User-resourceclassratematrixDisp:用戶(hù)對(duì)各個(gè)資源類(lèi)的偏好程度第十三頁(yè),共三十二頁(yè),編輯于2023年,星期三主要處理流程第十四頁(yè),共三十二頁(yè),編輯于2023年,星期三用戶(hù)登錄與訪(fǎng)問(wèn)資源操作用戶(hù)訪(fǎng)問(wèn)日志推薦資源訪(fǎng)問(wèn)日志用戶(hù)i的訪(fǎng)問(wèn)記錄分發(fā)整理生成用戶(hù)-用戶(hù)相似矩陣用戶(hù)-用戶(hù)相似系數(shù)矩陣更新用戶(hù)-資源類(lèi)偏好系數(shù)矩陣更新相似度的定義形成用戶(hù)推薦必要度向量更新相似系數(shù)更新策略第十五頁(yè),共三十二頁(yè),編輯于2023年,星期三用戶(hù)登錄與訪(fǎng)問(wèn)資源操作用戶(hù)訪(fǎng)問(wèn)日志推薦資源訪(fǎng)問(wèn)日志用戶(hù)i的訪(fǎng)問(wèn)記錄分發(fā)整理生成用戶(hù)-用戶(hù)相似矩陣用戶(hù)-用戶(hù)相似系數(shù)矩陣更新用戶(hù)-資源類(lèi)偏好系數(shù)矩陣更新相似度的定義形成用戶(hù)推薦必要度向量更新相似系數(shù)更新策略第十六頁(yè),共三十二頁(yè),編輯于2023年,星期三更新用戶(hù)推薦資源列表當(dāng)前推薦列表生成推薦策略推薦優(yōu)先級(jí)設(shè)定策略TopN用戶(hù)列表產(chǎn)生用戶(hù)登錄與訪(fǎng)問(wèn)資源操作用戶(hù)訪(fǎng)問(wèn)日志推薦資源訪(fǎng)問(wèn)日志用戶(hù)i的訪(fǎng)問(wèn)記錄分發(fā)整理生成用戶(hù)-用戶(hù)相似矩陣用戶(hù)-用戶(hù)相似系數(shù)矩陣更新用戶(hù)-資源類(lèi)偏好系數(shù)矩陣更新相似度的定義形成用戶(hù)推薦必要度向量更新相似系數(shù)更新策略用戶(hù)登錄與訪(fǎng)問(wèn)資源操作用戶(hù)訪(fǎng)問(wèn)日志推薦資源訪(fǎng)問(wèn)日志用戶(hù)i的訪(fǎng)問(wèn)記錄分發(fā)整理生成用戶(hù)-用戶(hù)相似矩陣用戶(hù)-用戶(hù)相似系數(shù)矩陣更新用戶(hù)-資源類(lèi)偏好系數(shù)矩陣更新相似度的定義形成用戶(hù)推薦必要度向量更新相似系數(shù)更新策略第十七頁(yè),共三十二頁(yè),編輯于2023年,星期三用戶(hù)登錄與訪(fǎng)問(wèn)資源操作用戶(hù)訪(fǎng)問(wèn)日志推薦資源訪(fǎng)問(wèn)日志用戶(hù)i的訪(fǎng)問(wèn)記錄分發(fā)整理生成更新用戶(hù)推薦資源列表當(dāng)前推薦列表用戶(hù)-用戶(hù)相似矩陣用戶(hù)-用戶(hù)相似系數(shù)矩陣生成更新用戶(hù)-資源類(lèi)偏好系數(shù)矩陣更新相似度的定義推薦策略相似系數(shù)更新策略形成用戶(hù)推薦必要度向量更新主要流程框架推薦優(yōu)先級(jí)設(shè)定策略TopN用戶(hù)列表產(chǎn)生第十八頁(yè),共三十二頁(yè),編輯于2023年,星期三Refresh機(jī)制[1]整理<用戶(hù)訪(fǎng)問(wèn)日志>[2]計(jì)算用戶(hù)兩兩的相似性[3]更新用戶(hù)-資源類(lèi)偏好系數(shù)矩陣[4]把當(dāng)前的相似性矩陣信息添加到相似性系數(shù)矩陣[5]可以形成每個(gè)用戶(hù)topN的列表第十九頁(yè),共三十二頁(yè),編輯于2023年,星期三相似性系數(shù)的更新更新信息來(lái)源一部分來(lái)自計(jì)算出來(lái)的當(dāng)前相似性矩陣一部分來(lái)自用戶(hù)對(duì)推薦列表的訪(fǎng)問(wèn)信息(可以考慮隱性的反饋)更新策略的制定,下面分別提供兩類(lèi)信息更新的參考方案第二十頁(yè),共三十二頁(yè),編輯于2023年,星期三SimIndex的更新-當(dāng)前相似性矩陣相似性系數(shù)體現(xiàn)的是用戶(hù)的長(zhǎng)期的相似性,是推薦的主要根據(jù),我們作以下的假設(shè):用戶(hù)的興趣是比較穩(wěn)定的,隨時(shí)間變化的幅度是比較小的用戶(hù)的興趣是在不斷變化的,盡管幅度比較小用戶(hù)較近的對(duì)資源的訪(fǎng)問(wèn)更能體現(xiàn)用戶(hù)的興趣這三條假設(shè)給策略的制定提供了一定的依據(jù)SimIndex=(1-a)*SimIndex+a*SimCurr0<a<=1a的大小表現(xiàn)的興趣變化的快慢程度,eg.a=0.2第二十一頁(yè),共三十二頁(yè),編輯于2023年,星期三SimIndex的更新-用戶(hù)對(duì)推薦列表的訪(fǎng)問(wèn)信息這部分主要在于對(duì)用戶(hù)行為的理解與把握上??梢远xpromote()和depress()兩個(gè)方法。參考算法如下:

if用戶(hù)未對(duì)推薦列表進(jìn)行訪(fǎng)問(wèn)

if用戶(hù)的推薦必要度比較高 對(duì)所有推薦進(jìn)行depress()

考慮降低用戶(hù)的推薦必要度

else

降低用戶(hù)的推薦必要度

else

對(duì)用戶(hù)訪(fǎng)問(wèn)的推薦進(jìn)行promote()

也可以考慮對(duì)用戶(hù)未訪(fǎng)問(wèn)的資源進(jìn)行depress()

提高用戶(hù)的推薦必要度第二十二頁(yè),共三十二頁(yè),編輯于2023年,星期三用戶(hù)-資源類(lèi)系數(shù)矩陣的更新表示某個(gè)用戶(hù)對(duì)各類(lèi)資源的不同偏好我們簡(jiǎn)單的以對(duì)某類(lèi)資源的訪(fǎng)問(wèn)數(shù)量的相對(duì)大小作為偏好的程度(當(dāng)然可以制定其他的策略)該矩陣的元素為A(useri,resourceclassj)=<訪(fǎng)問(wèn)j次數(shù),比例>只要在refresh時(shí),把用戶(hù)對(duì)各類(lèi)資源的訪(fǎng)問(wèn)次數(shù)添加到矩陣對(duì)應(yīng)的元素中,并重新計(jì)算比例即可。第二十三頁(yè),共三十二頁(yè),編輯于2023年,星期三推薦列表的生成策略有以下幾點(diǎn)考慮可以把優(yōu)先級(jí)topN的資源作為推薦的對(duì)象以?xún)?yōu)先級(jí)作為被推薦的概率的大小,進(jìn)行隨機(jī)的推薦考慮時(shí)間因素,歷史推薦表的資源的優(yōu)先級(jí)應(yīng)該隨時(shí)間降低第二十四頁(yè),共三十二頁(yè),編輯于2023年,星期三推薦列表的生成策略把歷史推薦列表的資源優(yōu)先級(jí)進(jìn)行重置比如乘上一個(gè)衰減系數(shù),去掉一些優(yōu)先級(jí)很低的資源添加新的推薦資源根據(jù)最近一次推薦時(shí)間,從最相似的N個(gè)用戶(hù)那里獲得資源,并置以相應(yīng)的優(yōu)先級(jí)優(yōu)先級(jí)的設(shè)置策略可以參考如下:priority(i)=與用戶(hù)j的相似度*所屬資源類(lèi)的Rate可以進(jìn)行一定的歸一化如果多個(gè)用戶(hù)訪(fǎng)問(wèn)了同一個(gè)資源,對(duì)值進(jìn)行累加第二十五頁(yè),共三十二頁(yè),編輯于2023年,星期三當(dāng)前推薦列表的生成參考推薦策略以資源優(yōu)先級(jí)的大小作為被加入當(dāng)前推薦序列的概率,并把該資源從推薦列表中刪除。形成M(eg.M=10)的當(dāng)前推薦序列第二十六頁(yè),共三十二頁(yè),編輯于2023年,星期三演示程序說(shuō)明RRSDemo第二十七頁(yè),共三十二頁(yè),編輯于2023年,星期三AboutRRSDemo模擬用戶(hù)在資源共享系統(tǒng)上的交互操作以隨機(jī)生成和人工干預(yù)結(jié)合的方式生成用戶(hù)相似系數(shù)矩陣(賦初值),并可以通過(guò)人工編寫(xiě)的用戶(hù)訪(fǎng)問(wèn)log進(jìn)行更新模擬推薦過(guò)程,根據(jù)用戶(hù)的訪(fǎng)問(wèn)記錄和相似系數(shù)進(jìn)行資源推薦,根據(jù)用戶(hù)對(duì)推薦資源的訪(fǎng)問(wèn)更新相似系數(shù)矩陣第二十八頁(yè),共三十二頁(yè),編輯于2023年,星期三RRSDemoDetails設(shè)置100users8resourceclasses1000resourcesperclass默認(rèn)User0,1,2iscommonininterestSoareUser3,4所有算法及策略都取文檔中參考的方案第二十九頁(yè),共三十二頁(yè),編輯于2023年,星期三模擬用戶(hù)交互操作行為用戶(hù)操作與程序行為[1]用戶(hù)登錄,記錄<用戶(hù)id>[6]根據(jù)<用戶(hù)id>產(chǎn)生對(duì)應(yīng)的<推薦列表>[2]用戶(hù)輸入<查詢(xún)?cè)~>[7]根據(jù)<查詢(xún)?cè)~>

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論