探秘社交相關(guān)性排序算法_第1頁(yè)
探秘社交相關(guān)性排序算法_第2頁(yè)
探秘社交相關(guān)性排序算法_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

探秘社交相關(guān)性排序算法

社交相關(guān)性排序(SocialRelevancyRank)即將誕生。屆時(shí),當(dāng)你搜索“活動(dòng)流”時(shí),所得的結(jié)果不會(huì)再按照時(shí)間順序排列,而是會(huì)根據(jù)每條信息與用戶的“社交圖譜(socialgraph)”之間的相關(guān)性來(lái)排列。也就是說(shuō),那些與你關(guān)系更為緊密的人將會(huì)排在前面。這種模式的流程如何?實(shí)際上,需要通過(guò)一個(gè)算法,就像谷歌的PageRank一樣。以好友為依據(jù)將你所關(guān)注的人排在搜索結(jié)果的前端是一種顯而易見(jiàn)的做法,但Twitter目前仍未采用?,F(xiàn)在,當(dāng)你在Twitter上搜索“Wilco”時(shí),所得的結(jié)果會(huì)按照時(shí)間先后排列。這種方式其實(shí)并沒(méi)有很好的體現(xiàn)“相關(guān)性”,因?yàn)樗阉鹘Y(jié)果中的多數(shù)信息都來(lái)自于陌生人。但如果所列信息來(lái)自于你所關(guān)注的人,那么搜索結(jié)果就將更為有用。Twitter目前并不支持這種模式,但FriendFeed卻已經(jīng)很好地采納了這一模式。FriendFeed會(huì)根據(jù)用戶的社交圖譜對(duì)搜索結(jié)果進(jìn)行過(guò)濾。對(duì)于FriendFeed而言,要做到這一點(diǎn)并不困難。一方面,它了解你所關(guān)注的人;另一方面,它會(huì)將高端feed搜索技術(shù)整合到了用戶的社交圖譜中。這種方式聽(tīng)起來(lái)很很棒,但也存在一個(gè)問(wèn)題。搜索“Wilco”時(shí),效果不錯(cuò),因?yàn)檫@支樂(lè)隊(duì)剛剛推出了新專輯,但是很多其他的關(guān)鍵詞卻無(wú)法返回任何結(jié)果。道理很簡(jiǎn)單,你在Facebook上的好友以及在Twitter上所關(guān)注的人不可能對(duì)你所感興趣的每個(gè)話題都發(fā)表評(píng)論。問(wèn)題在于數(shù)據(jù)稀疏,也就是缺乏可信賴的觀點(diǎn)。尋找更多數(shù)據(jù)來(lái)源很明顯,想要解決數(shù)據(jù)稀疏的問(wèn)題就需要更多的數(shù)據(jù)。解決方案之一就是整合其他可信賴的資源,比如拓寬社交圖譜。例如,搜索結(jié)果所列的內(nèi)容未必來(lái)自于你直接關(guān)注的人,它還會(huì)包含那些你關(guān)注的人所關(guān)注的其他人。在Facebook中,就是所謂的“好友的好友”。你或許會(huì)認(rèn)為,自己并不熟悉這些人的觀點(diǎn),因而并不信任他們,但“六度分隔理論”表明,人們的社交圈都很小,因此,這類內(nèi)容通常會(huì)擁有相同的價(jià)值。還有一種方法就是將興趣類似的人整合到一起,這也就是所謂的“興趣鄰居(tasteneighbors)”。這種方法在垂直社交網(wǎng)絡(luò)中非常普遍,例如Last.fm、Flixster和Goodreads等。這些網(wǎng)絡(luò)都能夠幫助你了解,除好友之外還有哪些人與你類似。然而,這種運(yùn)算成本較高,而且非常耗時(shí)。如果Twitter要完成類似的功能,就需要根據(jù)人們所發(fā)布的鏈接和Twitter信息的語(yǔ)義來(lái)判定。即使這一問(wèn)題非常棘手,但隨著時(shí)間的推移,應(yīng)該可以解決。群體因素除了使用社交圖譜的“第二度”和“興趣鄰居”外,社交相關(guān)性排序還可以為具有影響力的人賦予更高的權(quán)重。在缺乏任何其他衡量標(biāo)準(zhǔn)時(shí),那些擁有數(shù)十萬(wàn)名關(guān)注者的人有可能會(huì)比其他陌生人具備更高的相關(guān)性。使用關(guān)注者的數(shù)量來(lái)衡量剩余的“活動(dòng)流”是一種不錯(cuò)的方式。總之,將來(lái)自陌生人的無(wú)數(shù)信息機(jī)械地整合在一起并非上策。正如人們很少會(huì)查看谷歌搜索第一頁(yè)以后的內(nèi)容一樣,以時(shí)間順序排列的Twitter信息也將很快令人厭倦。社交相關(guān)性排序需要將群體的共同感受考慮進(jìn)來(lái),以此來(lái)提供一種過(guò)濾標(biāo)準(zhǔn),從未為你提供更多的結(jié)果。完美算法完美的算法并不存在,即使PageRank也不夠完美,但我們依然覺(jué)得它很有用。正如PageRank在互聯(lián)網(wǎng)中所起的作用一樣,假以時(shí)日,社交相關(guān)性排序也將幫助我們了解社交網(wǎng)絡(luò)中無(wú)窮無(wú)盡的“活動(dòng)流”的意義所在。這種排序?qū)?huì)對(duì)我們了解好友的方式產(chǎn)生深遠(yuǎn)的影響。假以時(shí)日,社交相關(guān)性排序還將改變通用網(wǎng)絡(luò)搜索。如今,通用網(wǎng)絡(luò)搜

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論