![個性化推薦系統(tǒng)中一種基于層次的任度計算模型[文檔資料]_第1頁](http://file.renrendoc.com/FileRoot1/2014-12/13/8fac9bf2-3cfa-4e82-83c5-b868b70ffd10/8fac9bf2-3cfa-4e82-83c5-b868b70ffd101.gif)
![個性化推薦系統(tǒng)中一種基于層次的任度計算模型[文檔資料]_第2頁](http://file.renrendoc.com/FileRoot1/2014-12/13/8fac9bf2-3cfa-4e82-83c5-b868b70ffd10/8fac9bf2-3cfa-4e82-83c5-b868b70ffd102.gif)
![個性化推薦系統(tǒng)中一種基于層次的任度計算模型[文檔資料]_第3頁](http://file.renrendoc.com/FileRoot1/2014-12/13/8fac9bf2-3cfa-4e82-83c5-b868b70ffd10/8fac9bf2-3cfa-4e82-83c5-b868b70ffd103.gif)
![個性化推薦系統(tǒng)中一種基于層次的任度計算模型[文檔資料]_第4頁](http://file.renrendoc.com/FileRoot1/2014-12/13/8fac9bf2-3cfa-4e82-83c5-b868b70ffd10/8fac9bf2-3cfa-4e82-83c5-b868b70ffd104.gif)
全文預(yù)覽已結(jié)束
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
個性化推薦系統(tǒng)中一種基于層次的任度計算模型 本文檔格式為 WORD,感謝你的閱讀。 引言:計算機(jī)系統(tǒng)中的信任問題長期以來都倍受國家、學(xué)術(shù)界和企業(yè)界的關(guān)注。本文參考社會學(xué)和心理學(xué)將人與人之間信任的產(chǎn)生來源分為三個方面:外部來源、交互來源和內(nèi)部來源,并提出一種層次化的信任度計算模型,該模型可以根據(jù)不同類型的用戶調(diào)整不同來源的信任在整個模型中所占的比例。最后,利用 Epinions 網(wǎng)站的相關(guān)數(shù)據(jù)對模型進(jìn)行了驗證。 本文參考社會學(xué)和心理學(xué)將人們之間 信任的產(chǎn)生來源分為三個方面:外部來源、交互來源和內(nèi)部信任,如圖 1.1所示。外部信任是由于當(dāng)前用戶在公共環(huán)境中的聲譽(yù)而使得其他用戶對其產(chǎn)生的信任,它是一種全局信任,獨(dú)立于單個用戶。交互信任是系統(tǒng)中用戶之間的交互所產(chǎn)生的信任關(guān)系,這是一種本地信任度。內(nèi)部信任,是由于兩個人之間內(nèi)在的相似性(如愛好等)產(chǎn)生的信任關(guān)系。 圖 1.1 分層信任模型示意圖 1 基于層次的信任度計算模型 本文提出基于層次的信任度計算模型如( 1.1)所,其中 Reputation 表示外部信任, InteractiveTrust 表示交互信任, Similarity 表示內(nèi)部信任。 a, b, c 是加權(quán)平均系數(shù),滿足 a+b+c=1。這三個系數(shù)分別應(yīng)對不同類型的用戶:冷啟動用戶、常規(guī)用戶,爭議用戶。 ( 1.1) 在本文接下來的篇幅中將詳細(xì)介紹三種信任的計算方法以及 a, b, c 三個參數(shù)對于不同用戶的取值情況。 1.1 外部信任 本文使用的 PageRank 算法來計算外部信任。 PageRank將指向一個網(wǎng)頁的鏈接看成是對于這個網(wǎng)頁的投票,本文將這種鏈接稱之為回指鏈接,而將一個網(wǎng)頁指向其他網(wǎng)頁的鏈接稱 之為外向鏈接。例如在圖 2.1 中,將用戶看作是網(wǎng)絡(luò)中的結(jié)點(diǎn),將用戶之間的信任關(guān)系看做他們之間的信任,對于用戶 A 來說,從其他用戶到用戶 A 的鏈接如( B-A)等都是用戶 A 的回指鏈接;而從用戶 A 到其他用戶的鏈接如( A-B)等都是用戶 A 的外向鏈接。 圖 2.1 信任網(wǎng)絡(luò)初始狀態(tài)示意圖 PageRank 在計算網(wǎng)頁排名的時候不單單考慮了網(wǎng)頁的回指鏈接的數(shù)量,更重要的是它還考慮了回指鏈接源網(wǎng)頁的價值。也就是說,一個高等級的頁面可以讓它所指向的低等級的頁面的等級提升。 PageRank 中,一個頁面的重要 性是由鏈向它的所有頁面的重要性經(jīng)過遞歸算法得到的,如等式( 2.2)所示是 RageRank 的數(shù)學(xué)表達(dá)式: ( 2.2) Reputation( u)表示用戶 u 的信譽(yù)度, Bu表示指向用戶 u 的所有用戶的集合, Nv 表示以用戶 v 為源用戶的所有鏈接的數(shù)目,也就是用戶 v 的外向鏈接數(shù)。 1.2 交互信任 本文使用 MoleTrust 來作為度量交互信任值的算法,之所以選擇 MoleTrust 有兩個原因: 1. 它具有省時高效的特點(diǎn); 2. 該算法對信任的計算是按照層次順序進(jìn)行的,這與我們的社交習(xí)慣 非常類似。接下來將詳細(xì)介紹 MoleTrust 的計算過程及其缺點(diǎn)以及對 MoleTrust 的改進(jìn)措施。 1.2.1 MoleTrust MoleTrust 的整個計算過程可以分為兩步完成: 1.從源節(jié)點(diǎn)出發(fā)遍歷整個信任網(wǎng)絡(luò),去除網(wǎng)絡(luò)中多余的信息和循環(huán)信任,構(gòu)造一個單向無循環(huán)的信任網(wǎng)絡(luò); 2.在第一步的基礎(chǔ)上,從源節(jié)點(diǎn)出發(fā)開始傳播信任值,計算當(dāng)前用戶對于網(wǎng)絡(luò)中其他用戶的信任。如 Step 1 和 Step 2 所示,是 MoleTrust的具體運(yùn)算過程: MoleTrust 的 Step 1 過程有一個非 常重要的參數(shù):trust_propagation_distance,該參數(shù)用來控制信任傳播的距離。圖 2.1 經(jīng)過 MoleTrust 的 Step 1 階段后得到圖 2.2所示信任網(wǎng)絡(luò)。將該信任網(wǎng)絡(luò)視為一個有向圖,在圖的第 0層是當(dāng)前用戶 A,第 1 層,為用戶 A 的直接朋友,以此類推。 圖 2.2 經(jīng) MoleTrust 的 Step 1 后的信任網(wǎng)絡(luò) 在 MoleTrust 的 Step 2 階段,同樣有一個非常重要的參數(shù): trust_threshold。只有信任值大于 trust_threshod的用戶才會被加入到信 任網(wǎng)絡(luò)中,該策略可以有效防止惡意用戶對于推薦系統(tǒng)的影響。 1.2.2 Modified MoleTrust MoleTrust 在計算信任值的過程中存在一個很大的漏洞,如 Tr( A, G) =7,但這和我們的直覺是相悖的,因為 G的上層用戶 C 的信任值只有 3。為了彌補(bǔ)上述漏洞,本文提出一種修正的 MoleTrust: Modified-MoleTrust。本文在在MoleTrust 的 Step 2 階段引入一個遞減因子 ,其計算方式如等式( 2.5)所示。 1.3 內(nèi)部信任 本文認(rèn)為用戶對 項目的評分是用戶內(nèi)部屬性的綜合體現(xiàn),所以本文選擇用戶對項目的評分矩陣來作為內(nèi)部信任的計算依據(jù)。有學(xué)者證明了在眾多衡量用戶相似性的指標(biāo)中,Person 相關(guān)系數(shù)的綜合表現(xiàn)最好,所以本文選擇 Person 相關(guān)系數(shù)作為內(nèi)部信任的衡量指標(biāo)。 Person 相關(guān)系數(shù)的取值范圍是 -1, 1,若 Person 相關(guān)系數(shù)的取值為正,則說明兩個用戶之間存在著相似性,反之當(dāng)其取為負(fù)時說明兩個人之間的興趣可能是相悖的。Person 相關(guān)系數(shù)的計算公式如等式( 2.6)所示。其中 n 表示用戶 A 和用戶 W 共同評分的項目數(shù), r( K, i)表示 用戶 K 對項目 i 的評分。 2 實驗結(jié)果說明 本文利用 Epinions 網(wǎng)站的數(shù)據(jù)和 Apache 的 Mahout 平臺對所提出的模型進(jìn)行了驗證。面對不同類型的用戶,對參數(shù)進(jìn)行調(diào)整后,該模型總能得到較為理想的推薦準(zhǔn)確度和覆蓋率,具體數(shù) 3 結(jié)束語 本文提出了一種基于層次的信任度計算模型,并做了相應(yīng)的實證研究,該模型能在很大程度上改善用戶的體驗。我們
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 車輛檢修現(xiàn)場管理制度
- 鐵路單位門崗管理制度
- 雨季隱患排查管理制度
- 公司配送貨管理制度
- 酒店疏散設(shè)施管理制度
- 雨季應(yīng)急物資管理制度
- 銷售企業(yè)收入管理制度
- 食品藥品培訓(xùn)管理制度
- 餐飲員工管理制度文案
- 防疫物資安檢管理制度
- 品牌牛仔褲委托加工合同
- 糜爛性胃炎的護(hù)理查房
- 醫(yī)院醫(yī)保季度分析報告總結(jié)
- 新生兒口腔運(yùn)動干預(yù)
- 《中國古代都城》課件
- 多維系統(tǒng)分析方法
- 人才招聘與獵頭服務(wù)行業(yè)的國際化發(fā)展
- 模擬政協(xié)培訓(xùn)課件
- 信息化系統(tǒng)項目初步驗收方案
- 長江師范學(xué)院《C語言程序設(shè)計》2019-2020學(xué)年期末考試試卷
- 長江師范學(xué)院《C語言程序設(shè)計》2021-2022學(xué)年期末試卷B
評論
0/150
提交評論