用戶興趣模型在垂直搜索引擎檢索模塊中的應(yīng)用_第1頁(yè)
用戶興趣模型在垂直搜索引擎檢索模塊中的應(yīng)用_第2頁(yè)
用戶興趣模型在垂直搜索引擎檢索模塊中的應(yīng)用_第3頁(yè)
用戶興趣模型在垂直搜索引擎檢索模塊中的應(yīng)用_第4頁(yè)
用戶興趣模型在垂直搜索引擎檢索模塊中的應(yīng)用_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、用戶愛(ài)好模型正在垂直搜索引擎檢索模塊中的使用用戶愛(ài)好模型正在垂直搜索引擎檢索模塊中的使用0引止搜索引擎做為搜集疑息查詢的主要工具曾經(jīng)正在人類(lèi)保存中占有了主導(dǎo)職位,搜索引擎的搜索量量間接影響到用戶體驗(yàn)。垂直搜索正在專(zhuān)業(yè)性上略勝與傳統(tǒng)的搜索引擎。本文主要改革垂直搜索引擎的檢索模塊,正在傳統(tǒng)的Luene檢索模塊中參與Pagerank得分,關(guān)鍵詞得分,并特別參與了用戶愛(ài)好得分,創(chuàng)立了一個(gè)天性化的垂直搜索檢索模塊模型,從而使垂直搜索正在天性化上更揭遠(yuǎn)用戶的操做風(fēng)雅戰(zhàn)愛(ài)好。1用戶愛(ài)好模型的創(chuàng)立用戶愛(ài)好做為垂直搜索引擎當(dāng)中的一項(xiàng)天性化處事,間接影響到了用戶操做該垂直搜索的體驗(yàn)1。用戶愛(ài)好模型的創(chuàng)立應(yīng)從兩個(gè)圓

2、里闡收:一是用戶愛(ài)好模型可可反響用戶的真正在愛(ài)好愛(ài)好;兩是針對(duì)用戶查詢愛(ài)好的多變性,該模型能可能開(kāi)意變化的用戶愛(ài)好。1.1經(jīng)常使用的用戶建模妙技現(xiàn)古的用戶建模妙技分為三類(lèi):用戶腳工定制建模、例如用戶建模戰(zhàn)自動(dòng)用戶建模。用戶腳工定制建模用戶本人進(jìn)腳正在網(wǎng)頁(yè)上挑選年夜要腳動(dòng)輸進(jìn)本人的愛(ài)好愛(ài)好。該要收真現(xiàn)簡(jiǎn)樸,獲得的用戶愛(ài)好成果牢靠??墒谴嬲跊](méi)有夠:影響用戶體驗(yàn),一樣仄居用戶對(duì)頻繁的輸進(jìn)戰(zhàn)挑選缺少愛(ài)好;更新用戶模型艱易,一旦用戶的愛(ài)好收死轉(zhuǎn)移,而又讓用戶從頭提交網(wǎng)頁(yè)文檔會(huì)給用戶形成負(fù)擔(dān);反響用戶愛(ài)好沒(méi)有片里,供應(yīng)給用戶的挑選項(xiàng)本人便帶有主沒(méi)有雅觀性,此外用戶挑選時(shí)也存正在沒(méi)有能準(zhǔn)確表達(dá)的情況,那些

3、將間接招致搜集的用戶愛(ài)好沒(méi)有夠準(zhǔn)確2。例如用戶建模例如用戶模型的建模是用戶本人供應(yīng)相關(guān)的愛(ài)好愛(ài)好例如及其類(lèi)別屬性。用戶正在閱讀網(wǎng)頁(yè)時(shí)標(biāo)注對(duì)頁(yè)里的感愛(ài)好程度便可獲得用戶建模的例如。自動(dòng)用戶建模經(jīng)由過(guò)程留意用戶閱讀網(wǎng)頁(yè)的內(nèi)容戰(zhàn)閱讀網(wǎng)頁(yè)時(shí)的舉措自動(dòng)為用戶構(gòu)建一個(gè)用戶模型5,那種建模無(wú)需用戶自動(dòng)參與,經(jīng)由過(guò)程用戶上彀時(shí)的舉措采與數(shù)據(jù)開(kāi)挖妙技自動(dòng)獵與用戶的愛(ài)好愛(ài)好。當(dāng)然那種要體會(huì)帶去一定的噪聲,影響用戶閱讀時(shí)的速度,對(duì)創(chuàng)立下量量的用戶模型也有一定的影響,可是該要收無(wú)需用戶自動(dòng)供應(yīng)疑息,沒(méi)有干擾用戶的其他操做,從用戶體驗(yàn)的角度去講是比擬好的建模要收。果而,將去建模妙技的死少標(biāo)的目的皆會(huì)采與自動(dòng)建模妙技。1

4、.2用戶愛(ài)好舉措的量化表示經(jīng)由過(guò)程對(duì)自動(dòng)用戶建模的相關(guān)研討創(chuàng)制,用戶的愛(ài)好與用戶的舉措是粗細(xì)相連的。用戶愛(ài)好可以經(jīng)由過(guò)程用戶閱讀該頁(yè)里的工夫戰(zhàn)拖動(dòng)動(dòng)彈條的工夫去有效天反響。而經(jīng)由過(guò)程用戶閱讀頁(yè)里仄均速度能幫腳建模時(shí)肯定用戶愛(ài)好的等級(jí)。此外用戶查詢、標(biāo)識(shí)表記標(biāo)幟書(shū)簽、閱讀頁(yè)里、面擊鼠標(biāo)、反響疑息、拖動(dòng)動(dòng)彈條、撤退、前進(jìn)等那些舉措皆可以表示用戶的愛(ài)好。用戶訪謁頁(yè)里時(shí)的停登工夫、訪謁次數(shù)、保存、編輯、建正等動(dòng)做皆可以大概展示用戶愛(ài)好3。經(jīng)由過(guò)程以上闡收,將用戶舉措用兩維表格去紀(jì)錄,稱(chēng)用戶舉措數(shù)據(jù)表3。數(shù)據(jù)表又分為兩種標(biāo)準(zhǔn):基于關(guān)鍵詞的用戶舉措數(shù)據(jù)表戰(zhàn)基于文檔的用戶舉措數(shù)據(jù)表。前者描摹用戶正在關(guān)鍵詞上

5、的舉措,其規(guī)劃如表1所示;后者描摹用戶正在一篇文檔上的舉措,其規(guī)劃如表2所示。表1中的數(shù)據(jù)為:用戶id號(hào)uid、關(guān)鍵詞k、所屬主題t、關(guān)鍵詞果被選中而下明表示的次數(shù)hlt、關(guān)鍵詞被用戶圈住的次數(shù)ir戰(zhàn)正在該關(guān)鍵詞下繪下劃線的次數(shù)udl。表2中的數(shù)據(jù)為:文檔iddid、文檔所屬主題t、關(guān)鍵詞的單擊次數(shù)lk、閱讀該文檔工夫tie、正在該文檔中增減書(shū)簽的數(shù)目bk、批注次數(shù)ant。因?yàn)殚喿x工夫受一些客沒(méi)有雅觀果素的影響,果而以上工夫是改正后的工夫。1.3用戶愛(ài)好度的策繪基于關(guān)鍵詞的用戶愛(ài)好策繪用戶舉措權(quán)重,表示用戶對(duì)某主題下n個(gè)關(guān)鍵詞的舉措。二者的乘積定義為:kt=bk*bkt=k1,k2,knT基于

6、關(guān)鍵詞的用戶愛(ài)好度為:基于文本的用戶愛(ài)好度策繪要收類(lèi)同。2檢索模塊方案與使用將用戶愛(ài)好使用到檢索模塊以改進(jìn)用戶體驗(yàn),同時(shí)考慮了其他一些相關(guān)果素。主題相關(guān)性。Luene排序算法:以關(guān)鍵詞正在文檔中呈現(xiàn)的次數(shù)排序。關(guān)鍵詞正在文檔中的地位??梢越?jīng)由過(guò)程關(guān)鍵詞正在文檔中呈現(xiàn)的地位戰(zhàn)頻次得出網(wǎng)頁(yè)或文檔的權(quán)重值。用戶愛(ài)好。網(wǎng)頁(yè)的慌張性。網(wǎng)頁(yè)慌張性的分值可以經(jīng)由過(guò)程PageRank算法獲得4。將那四個(gè)果素綜開(kāi)考慮,可方案網(wǎng)頁(yè)的排序算法以下:Sre_f=d1*lueneSre+d2*PagerankSre+d3*keySre+d4*yhxqSreSre_f:文檔f總得分;lueneSre:主題相關(guān)度得分;Pa

7、gerankSre:網(wǎng)頁(yè)慌張性得分;keySre:關(guān)鍵詞地位權(quán)值得分;yhxqSre:用戶愛(ài)好策繪得分;d1,d2,d3,d4表示權(quán)重系數(shù),d1+d2+d3+d4=1。3真止將改革的檢索算法與本Luene檢索算法相比查齊率,查準(zhǔn)率戰(zhàn)系統(tǒng)響應(yīng)工夫。其中改革算法的權(quán)值設(shè)置為d1=0.35,d2=0.2,d3=0.13,d4=0.32。減年夜了用戶愛(ài)好的得分權(quán)值。我們測(cè)試的數(shù)據(jù)量為20萬(wàn)條,獲得以下成果:查齊率估值策繪,改革算法獲得的成果為n1;Luene算法獲得的成果為n2。Reall=n1n2/n1+n2查準(zhǔn)率查準(zhǔn)率的策繪為:p=k0/kk0:準(zhǔn)確的數(shù)據(jù);k:部分類(lèi)似數(shù)據(jù)。系統(tǒng)響應(yīng)工夫Luene

8、根柢排序算法仄均響應(yīng)工夫正在35s左右,而改革的搜索仄均響應(yīng)工夫正在46s左右。兩種檢索正在三個(gè)圓里獲得的成果比照方表3所示。4完畢語(yǔ)本文主要改革了垂直搜索引擎的檢索模塊,正在該模塊中綜開(kāi)了主題相關(guān)度得分、網(wǎng)頁(yè)慌張性得分、用戶愛(ài)好策繪得分、關(guān)鍵詞地位權(quán)值得分四個(gè)圓里去策繪網(wǎng)頁(yè)文檔得分。特別將用戶愛(ài)好得分部分設(shè)置了較重的權(quán)重值,使得本文的垂直搜索更具有天性化。經(jīng)由過(guò)程真止證明,該模型從用戶的角度前進(jìn)了搜索量量,改進(jìn)了用戶體驗(yàn)。該模型借存正在一定的范疇性,正在權(quán)重值的分撥上借需要年夜量的真止去考證更公允天分撥方案,以抵達(dá)更公允的搜索成果。參考文獻(xiàn):1黃國(guó)華.基于相對(duì)下度的直線特征提與算法J.邵陽(yáng)教院教報(bào)自然科教版,2022.1:29-332楊永毅.基于Luene的兩腳汽車(chē)交易疑息垂直搜索引擎的研討與真現(xiàn)D.重慶年

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論