




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、目前主流搜索引擎存在的缺陷缺陷一:搜索引擎無法準(zhǔn)確的指向用戶需求。例如我們現(xiàn)在在百度中搜索“提高搜索準(zhǔn)確度”。1搜索引擎無法準(zhǔn)確的指向用戶需求。癥結(jié):從搜索的結(jié)果來看,和 從搜索者和搜索引擎開發(fā)者的兩個不同方面來顯示結(jié)果。這雖然考慮到了信息的全面性,但是無法很好的契合搜索者的需求,導(dǎo)致搜索的精確度和效率下降。2解決方法1. 信息分類 (適用于分類相對比較明顯的關(guān)鍵詞)將一個關(guān)鍵詞的對應(yīng)方面細(xì)分,并且將同一方面歸類整合,供搜索者選擇。舉例:如上面兩幅圖,如果當(dāng)我搜索完畢后,搜索引擎如果可以提升:若需要了解更多與提高精準(zhǔn)度技術(shù)相關(guān)資料,請點擊Link. 2. 提高引擎的聯(lián)想精準(zhǔn)度很明顯,同樣類型的
2、關(guān)鍵字,如果有聯(lián)想的引導(dǎo),分類可以更準(zhǔn)確地實現(xiàn)。那么這個就需要開發(fā)者,更好地進(jìn)行關(guān)鍵詞的抓取。3.改善網(wǎng)頁分類系統(tǒng):如對于關(guān)鍵字搜索結(jié)果網(wǎng)頁的智能處理,基于摘要的搜索結(jié)果聚類等等3目前主流搜索引擎存在的缺陷缺陷二:很多時候,在我們的搜索結(jié)果中會出現(xiàn)大量重復(fù)或極其類似的內(nèi)容,為用戶的篩選帶來不便癥結(jié):許多搜索引擎會用anchor text(鏈接源頭文字)作為搜索結(jié)果的主要依據(jù),anchor text對網(wǎng)頁的描述往往更為準(zhǔn)確簡潔,可是只抓取anchor text而不審查網(wǎng)頁內(nèi)容,會導(dǎo)致大量重復(fù)結(jié)果被顯示。4缺陷二解決方法在網(wǎng)頁標(biāo)題和內(nèi)容中抓取關(guān)鍵字,將重復(fù)度較高的內(nèi)容進(jìn)行結(jié)果折疊,可以讓用戶在盡量
3、少的頁面內(nèi)獲取盡量多的不同信息,同時在用戶有需要是也可以很快看到這些重復(fù)度高的信息。人人網(wǎng)中“查看類似新鮮事”可以看作是一種不錯的解決方案。點開查看另外五條新鮮事,則可以看到你不同好友分享的同一篇日志5目前主流搜索引擎存在的缺陷缺陷三:無法根據(jù)客戶個體需求定制獨特的搜索結(jié)果從Web1.0發(fā)展到Web2.0的時候,我們有個陣痛期?,F(xiàn)在,隨著互聯(lián)網(wǎng)大環(huán)境的改變,Web2.0已經(jīng)全面發(fā)展到了Web3.0,各種互聯(lián)網(wǎng)應(yīng)用又會面臨一個陣痛期,搜引擎也不能例外。此時,傳統(tǒng)搜索引擎的局限性便暴露出來,雖然滿足了用戶的通用搜索需求,但并不是為每個人所定制,現(xiàn)實中網(wǎng)絡(luò)用戶的使用習(xí)慣千差萬別,在搜索結(jié)果中反復(fù)篩選
4、已不可避免,而這或?qū)⑹窍乱淮阉饕驷绕鸩l(fā)展的方向。而且基于pagerank式的算法很容易帶來馬太效應(yīng),被提到越多的網(wǎng)站在結(jié)果顯示中越靠前,而搜索結(jié)果越靠前會導(dǎo)致網(wǎng)站被提到的次數(shù)越多,久而久之,一些符合用戶真正需求的結(jié)果卻被淹沒。6癥結(jié):傳統(tǒng)的搜索引擎“就事論事”,搜索就是搜索,沒有考慮搜索啟發(fā)的環(huán)境,只看到當(dāng)前的查詢串,很少考慮用戶的隱含意圖;沒有(或極少)引入“關(guān)系”數(shù)據(jù),也就沒有“群體智能”,不能利用文檔關(guān)系(對網(wǎng)頁進(jìn)行分類和聚類)和查詢關(guān)系。搜索引擎領(lǐng)域或?qū)⒁源藶槠鯔C(jī)迎來一場技術(shù)變革。而用戶也迫切需要一種更加智能、更個性、更精確的搜索引擎給他們帶來更加精彩的在線生活。以百度為例,用百度搜索某個問題,百科,知道等百度下屬網(wǎng)站通常會被它放在很前面,而一些非“親生”的網(wǎng)站會被放后,使得用戶必須翻好幾頁才能找到有用信息。7缺陷三解決方法1.用戶介入,個性化定制搜索結(jié)果用戶可以選擇不顯示百度百科,或優(yōu)先顯示維基百科等選項,可以對每一條搜索結(jié)果“頂”或“踩”,用戶的打分會對該站點的顯示優(yōu)先級產(chǎn)生影響。2.基于用戶搜索歷史優(yōu)先顯示符合用戶習(xí)慣的結(jié)果根據(jù)用戶以往的搜索歷史,了解用戶習(xí)慣,對結(jié)果重新排序。例如,該用戶
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 IEC 60923:2005+AMD1:2006 CSV FR-D Auxiliaries for lamps - Ballasts for discharge lamps (excluding tubular fluorescent lamps) - Performance requirements
- 【正版授權(quán)】 IEC 60669-1:1998+AMD1:1999 CSV FR-D Switches for household and similar fixed-electrical installations - Part 1: General requirements
- 生命生活教育主題班會
- 心內(nèi)科??谱o(hù)理質(zhì)量指標(biāo)
- 2025年會計人員工作方案演講稿
- 基于多媒體技術(shù)的信息展示與推廣
- 高校軍訓(xùn)2025年工作方案演講稿
- 樓梯鋼筋綁扎規(guī)范
- 年度工作報告與總結(jié)
- 2025年秋季學(xué)期幼兒園教學(xué)工作方案演講稿
- 《傳染病監(jiān)測》課件
- 2025年云南昆明市五華區(qū)科技產(chǎn)業(yè)園開發(fā)投資有限公司招聘筆試參考題庫附帶答案詳解
- 公司組織的架構(gòu)圖(原版)
- 遼寧沈陽地鐵有限公司所屬公司招聘筆試沖刺題2025
- 物業(yè)裝修現(xiàn)場巡查培訓(xùn)
- 福建省普通高中2023年學(xué)業(yè)水平合格性考試數(shù)學(xué)試題(原卷版)
- 測試部門整體規(guī)劃
- 法規(guī)解讀丨2024新版《突發(fā)事件應(yīng)對法》及其應(yīng)用案例
- GB 5908-2024阻火器
- 2025屆上海市浦東新區(qū)高考英語二模試卷含解析
評論
0/150
提交評論