個(gè)性化推薦系統(tǒng)_第1頁(yè)
個(gè)性化推薦系統(tǒng)_第2頁(yè)
個(gè)性化推薦系統(tǒng)_第3頁(yè)
個(gè)性化推薦系統(tǒng)_第4頁(yè)
個(gè)性化推薦系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、個(gè)性化推薦系統(tǒng)軟件說(shuō)明書軟件背景隨著近年來(lái)互聯(lián)網(wǎng)的飛速發(fā)展,個(gè)性化推薦已成為各大主流網(wǎng)站的一項(xiàng)必不可少服務(wù)。 提供各類新聞的門戶網(wǎng)站是互聯(lián)網(wǎng)上的傳統(tǒng)服務(wù),但是與當(dāng)今蓬勃發(fā)展的電子商務(wù)網(wǎng)站相 比,新聞的個(gè)性化推薦服務(wù)水平仍存在較大差距。一個(gè)互聯(lián)網(wǎng)用戶可能不會(huì)在線購(gòu)物,但是 絕大部分的互聯(lián)網(wǎng)用戶都會(huì)在線閱讀新聞。因此資訊類網(wǎng)站的用戶覆蓋面更廣,如果能夠更 好的挖掘用戶的潛在興趣并進(jìn)行相應(yīng)的新聞推薦,就能夠產(chǎn)生更大的社會(huì)和經(jīng)濟(jì)價(jià)值。初步研究發(fā)現(xiàn),同一個(gè)用戶瀏覽的不同新聞的內(nèi)容之間會(huì)存在一定的相似性和關(guān)聯(lián),物理世 界完全不相關(guān)的用戶也有可能擁有類似的新聞瀏覽興趣。此外,用戶瀏覽新聞的興趣也會(huì)隨 著時(shí)間

2、變化,這給推薦系統(tǒng)帶來(lái)了新的機(jī)會(huì)和挑戰(zhàn)。因此,希望通過(guò)對(duì)帶有時(shí)間標(biāo)記的用戶 瀏覽行為和新聞文本內(nèi)容進(jìn)行分析,挖掘用戶的新聞瀏覽模式和變化規(guī)律,設(shè)計(jì)及時(shí)準(zhǔn)確的 推薦系統(tǒng)預(yù)測(cè)用戶未來(lái)可能感興趣的新聞。本軟件就是用來(lái)實(shí)現(xiàn)根據(jù)用戶數(shù)據(jù),分析用戶行為,為用戶進(jìn)行個(gè)性化推薦等功能.軟件環(huán)境運(yùn)行環(huán)境 Windows XP/7/8編譯環(huán)境VS2010運(yùn)行參數(shù)News_list:新聞列表News_times:x新聞閱讀次數(shù)Step_correlation:一步轉(zhuǎn)移數(shù)據(jù)User_list:用戶列表Train_data :原始數(shù)據(jù)附加數(shù)據(jù):用戶適應(yīng)度算法說(shuō)明人們常把事物的隨機(jī)變化過(guò)程稱作馬爾可夫過(guò)程。它具有無(wú)后效性

3、,即事物的將來(lái)呈 什么狀態(tài)、取什么值,僅與它現(xiàn)在的狀態(tài)和取值有關(guān),與它以前的狀態(tài)和取值無(wú)關(guān)。馬爾 可夫鏈則是事物在連續(xù)一段時(shí)期內(nèi)若干馬爾可夫過(guò)程的總稱,表明事物狀態(tài)由過(guò)去到現(xiàn)在、 由現(xiàn)在到將來(lái),一環(huán)接一環(huán),像一根鏈條。在預(yù)測(cè)領(lǐng)域,人們用其對(duì)預(yù)測(cè)對(duì)象各個(gè)狀態(tài) 的初始分布和各狀態(tài)間的轉(zhuǎn)移概率進(jìn)行研究,描述狀態(tài)的變化趨勢(shì),并由此來(lái)預(yù)測(cè)未來(lái)。 由于新聞網(wǎng)頁(yè)推薦方式的不同,可能導(dǎo)致鏈長(zhǎng)不同的馬爾科夫鏈的產(chǎn)生。其他不定因素諸如 用戶的瀏覽習(xí)慣也可能導(dǎo)致不同鏈長(zhǎng)的馬爾科夫鏈。本軟件使用了該思想,利用用戶最后的閱讀記錄來(lái)進(jìn)行推測(cè)。由于許多用戶的新聞閱讀 數(shù)目有限,直接限制了鏈長(zhǎng)的長(zhǎng)度,所以我們從三階馬爾科夫鏈

4、開始,作為嘗試,但嘗試后 發(fā)現(xiàn)效果并沒(méi)有提升,反而會(huì)出現(xiàn)因?yàn)闂l件過(guò)于苛刻而無(wú)法推薦的情況。最終我們采取了一步馬鏈的形式來(lái)作為推薦算法,流程圖如下:開始提取用戶閱讀的 最后一條新聞ID統(tǒng)計(jì)閱讀過(guò)該新聞的用戶的下一條新聞進(jìn)行投票選取票數(shù)最高的新聞票數(shù)最高的新聞多于一條或所有新聞票數(shù)均為0低于閾值篩選高于推薦此條結(jié)束其他算法算法流程圖使用說(shuō)明圖一:軟件初始界面打開軟件可以看到的初始界面,可以按功能分區(qū),執(zhí)行不同的功能.想要完成某項(xiàng)功能時(shí) 需要按要求依次點(diǎn)擊按鈕.圖二:選取文件點(diǎn)擊”選取文件”按鈕可以進(jìn)行選取文件操作,只有選取了文件才能接下來(lái)進(jìn)行讀取操作.用戶推薦系統(tǒng)必打開選擇文件生成結(jié)果請(qǐng)按賦讀取

5、newsji?讀取 userjist輸出結(jié)果讀取 news_times讀廓 step_correlatic讀取附加數(shù)挽 Projects Recommend Recommend 退出圖三:選擇文件首先要點(diǎn)擊選擇文件按鈕,彈出相應(yīng)的選擇界面,按照需求選擇文件,然后進(jìn)行讀取操作.圖四:選擇文件路徑顯示在選擇文件后,文件的路徑會(huì)被顯示在軟件上,以便核對(duì).圖五:讀取文件點(diǎn)擊文件路徑相應(yīng)讀取按鈕讀取文件信息,讀取結(jié)果顯示在右側(cè)列表中,可以看到讀取文 件所在路徑,讀取條數(shù),以及所用時(shí)間.圖六:讀取文件按照要求繼續(xù)讀取數(shù)據(jù)文件,每次讀取的結(jié)果都會(huì)相應(yīng)的顯示在右側(cè)的列表中,以便核對(duì), 防止出現(xiàn)錯(cuò)誤.圖七:讀取

6、文件繼續(xù)讀取第三個(gè)文件,此文件一般較大,請(qǐng)耐心等候.圖八:讀取文件繼續(xù)讀取,此文件時(shí)需要讀取的最后一個(gè)基本文件,讀取過(guò)后便開始計(jì)算,計(jì)算過(guò)程稍長(zhǎng), 請(qǐng)耐心等待.4用戶推薦系統(tǒng)選擇文件C:UsersAdministratorDocumentsVisual Studio 2010ProjectsRecommendRecommenduser list.txt生成結(jié)果讀取 newsjist生成step_correlation行為讀取news_times讀取step_correbtion讀取 userjist012345610歡迎使用本軟件請(qǐng)參照說(shuō)明使用成功打開 n e ws_list,路徑:C:U s

7、ersAd min istratorDocume ntsVisu a I S.讀電完成.共讀取6183記錄,耗時(shí)76ms成功打開 news_timesf 路徑:C:U sersAdmin istratorDocu mentsVisu.讀取完成.共讀取6183記錄,耗時(shí)179ms成功打開 step_corre latio n,路徑:C:U sersAd min istratorDocu me nts.讀取完成.共讀取10622515錄,耗時(shí)297000ms成功打開userjist,路徑:C:UsersAdministratorDocumentsVisual St.讀取完成.共讀取1。皿。記錄,耗

8、時(shí)539ms開始計(jì)苴計(jì)算完成共耗時(shí)38570s讀取附加數(shù)據(jù)輸出結(jié)果打開結(jié)果請(qǐng)按照次序依次迭擇、讀取文件退出rrr圖九:計(jì)算完成在讀取完成相關(guān)數(shù)據(jù)后,便可以開始計(jì)算.4用戶推薦豉迭擇文件生成結(jié)果讀取 newsjist讀取news_times讀取step_correlation讀取user成|計(jì)算完成C:UsersAdministratorDocumentsVisual Studio 2010ProjectsRecornrnendRecomrnendsum.txt生成step_correlation讀取附堿據(jù)II點(diǎn)擊按鈕輸出結(jié)果打開結(jié)果請(qǐng)按照次庠依次選擇、讀取文件退出序號(hào)行為歡迎使用本軟件請(qǐng)參照說(shuō)

9、明使用成功打開news list,路徑:C:UsefsAdministratofDocumentsVisual S.讀取完成.共讀取61B3記錄耗時(shí)76ms成功打開 news_time s,路徑:C:U sersAd min istratorDocu mentsVisu.讀取完成.共讀取6183記錄耗時(shí)179ms成功打開 st 叩Correlation,路徑:C:UsersAdministratorDocuments.讀取完成共讀取106225記錄,耗時(shí)297000ms成功打開use_list,路徑:C:UsersAdministratorDocumentsVisual St.讀取完成.共讀5

10、U0000記錄耗時(shí)539ms開始計(jì)算計(jì)算完成,共耗時(shí)38570s成功打開sum,路徑:C:UsersAdministratorDocumentsVisual Studio.讀取成功讀取結(jié)果rn圖十:讀取附加數(shù)據(jù)在計(jì)算完畢后,讀取附加數(shù)據(jù),用于過(guò)濾結(jié)果,調(diào)整輸出.用戶推薦故選擇文件-生成結(jié)果讀取news tet I讀取news_times生成step_correlation讀取step_correlation讀取 userjst |讀取附加數(shù)據(jù)I輸出結(jié)果點(diǎn)擊按鈕打開結(jié)果庠號(hào)I行為0歡迎使用本軟件,清參照說(shuō)明使用成功打開news_list,路徑:C:UsefsAdministratorDQCume

11、ntsVisiial S.讀耿完成.共讀取6183記錄,耗時(shí)76ms成功打開 n e ws_time s,路徑:C:U se rsAd min istrato rDocu mentsVisu.讀取完成.共讀取6183記錄,耗時(shí)179ms成功打開 step_correlationf 路徑:C:UsersAdministratorDocuments.讀取完成.共讀取106225記錄,耗時(shí)297000ms成功打開userjist,路徑:C:UsersAdministratorDocumentsVisual St.讀取完成.共讀取10000記錄,耗時(shí)539ms開始計(jì)算計(jì)算完成共耗時(shí)38570s成功打開sum,路徑:C:UsersAdministratorDocumentsVisual Studio.讀取.成功.正在輸出,路徑:c:out.csv輸出完成.顯示結(jié)果與輸出路徑請(qǐng)按照次序依次迭擇、讀取文件退出rn圖

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論