![網(wǎng)絡(luò)搜索引擎的發(fā)展及使用技巧研究_第1頁](http://file4.renrendoc.com/view/1737cf15a03e494dbccb3bbddeace361/1737cf15a03e494dbccb3bbddeace3611.gif)
![網(wǎng)絡(luò)搜索引擎的發(fā)展及使用技巧研究_第2頁](http://file4.renrendoc.com/view/1737cf15a03e494dbccb3bbddeace361/1737cf15a03e494dbccb3bbddeace3612.gif)
![網(wǎng)絡(luò)搜索引擎的發(fā)展及使用技巧研究_第3頁](http://file4.renrendoc.com/view/1737cf15a03e494dbccb3bbddeace361/1737cf15a03e494dbccb3bbddeace3613.gif)
![網(wǎng)絡(luò)搜索引擎的發(fā)展及使用技巧研究_第4頁](http://file4.renrendoc.com/view/1737cf15a03e494dbccb3bbddeace361/1737cf15a03e494dbccb3bbddeace3614.gif)
![網(wǎng)絡(luò)搜索引擎的發(fā)展及使用技巧研究_第5頁](http://file4.renrendoc.com/view/1737cf15a03e494dbccb3bbddeace361/1737cf15a03e494dbccb3bbddeace3615.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、網(wǎng)絡(luò)搜索引擎的開展及使用技巧研究網(wǎng)絡(luò)搜索引擎的開展及使用技巧研究1搜索引擎技術(shù)開展史從搜索引擎所采取的技術(shù)來說,可以將搜索引擎技術(shù)的開展劃分為4個時代。1.1分類目錄的時代這個時代也可以稱為導(dǎo)航時代,Yah和國內(nèi)ha123是這個時代的代表。通過人工搜集整理,把屬于各個類別的高質(zhì)量網(wǎng)站或者網(wǎng)頁分門別類羅列,用戶可以根據(jù)分組目錄來查找高質(zhì)量的網(wǎng)站。這種方式是純?nèi)斯さ姆绞?,并未采取什本文由論文?lián)盟搜集整理么高深的技術(shù)手段。采取分類目錄的方式,一般被收錄的網(wǎng)站質(zhì)量都較高,但是這種方式可擴(kuò)展性不強(qiáng),絕大局部網(wǎng)站不能被收錄。1.2文本檢索的時代文本檢索的一代采用經(jīng)典的信息檢索模型,比方布爾模型、向量空間模
2、型或者概率模型,來計(jì)算用戶查詢關(guān)鍵詞和網(wǎng)頁文本內(nèi)容的相關(guān)程度。網(wǎng)頁之間有豐富的鏈接關(guān)系,而這一代搜索引擎并未使用這些信息。早期的很多搜索引擎比方AltaVista、Exite等大都采取這種形式。相比分類目錄,這種方式可以收錄大局部網(wǎng)頁,并可以按照網(wǎng)頁內(nèi)容和用戶查詢的匹配程度進(jìn)展排序。但是總體而言,搜索結(jié)果質(zhì)量不是很好。1.3鏈接分析的時代這一代的搜索引擎充分利用了網(wǎng)頁之間的鏈接關(guān)系,并深化挖掘和利用了網(wǎng)頁鏈接所代表的含義。通常而言,網(wǎng)頁鏈接代表了一種推薦關(guān)系,所以通過鏈接分析可以在海量內(nèi)容中找出重要的網(wǎng)頁。這種重要性本質(zhì)上是對網(wǎng)頁流行程度的一種衡量,因?yàn)楸煌扑]次數(shù)多的網(wǎng)頁其實(shí)代表了具有流行性。
3、搜索引擎通過結(jié)合網(wǎng)頁流行性和內(nèi)容相似性來改善搜索質(zhì)量。Ggle率先提出并使用PageRank鏈接分析技術(shù),并大獲成功,這同時引進(jìn)了學(xué)術(shù)界和其他商業(yè)搜索引擎的關(guān)注。后來學(xué)術(shù)界陸續(xù)提出了很多改良的鏈接分析算法。目前幾乎所有的商業(yè)搜索引擎都采取了鏈接分析技術(shù)。采用鏈接分析可以有效改善搜索結(jié)果質(zhì)量,但是這種搜索引擎并未考慮用戶的個性化要求,所以只要輸入的查詢懇求一樣,所有用戶都會獲得一樣的搜索結(jié)果。另外,很多網(wǎng)站擁有者為了獲得更高的搜索排名,針對鏈接分析算法提出了不少鏈接作弊方案,這樣導(dǎo)致搜索結(jié)果質(zhì)量變差。1.4用戶中心的時代目前的搜索引擎大都可以歸入這個時代,即以理解用戶需求為核心。不同用戶即使輸入
4、同一個查詢關(guān)鍵詞,但其目的也有可能不一樣。比方同樣輸入蘋果作為查詢詞,一個追捧不iPhne的時尚青年和一個果農(nóng)的目的會有相當(dāng)大的差距。即使是同一個用戶,輸入一樣的查詢詞,也會因?yàn)樗诘臅r間和場合不同,需求有所變化。而目前搜索引擎大都致力于解決如下問題:如何可以理解用戶發(fā)出的某個很短小的查詢詞背后包含的真正需求,所以這一代的搜索引擎稱之為以用戶為中心的一代。為了可以獲取用戶的真實(shí)需求,目前搜索引擎大都做了很多技術(shù)方面的嘗試。比方利用用戶發(fā)送查詢時的時間和地理位置信息,利用用戶過去發(fā)出的查詢詞及相應(yīng)的點(diǎn)擊記錄等歷史信息等技術(shù)手段,來試圖理解用戶此時此地的真正需求。2網(wǎng)絡(luò)搜索引擎的開展趨勢2.1個性
5、化搜索互聯(lián)網(wǎng)的開展已經(jīng)進(jìn)入了新的階段,即以用戶為中心的階段。如何通用用戶的網(wǎng)上行為建立用戶的個人模型,并基于此提供精準(zhǔn)的個性化效勞成為各種研究的重點(diǎn)。搜索引擎也不例外,個性化搜索即是為理解決這個問題而提出的技術(shù)領(lǐng)域。對于搜索引擎用戶來說,由于其個人興趣不同,即使是同一個查詢詞,也可能其搜索意圖迥異。如用用戶發(fā)出查詢Ajax,假如這個用戶是計(jì)算機(jī)工程人員,那么很有可能希望查找的是技術(shù)資料;而假如這個用戶是個球迷,那么很可能希望查找的是了阿賈克斯球隊(duì)的信息。所以即使是一樣的查詢詞,如何為不同的用戶提供個性化的搜索結(jié)果,成為衡量搜索引擎搜索質(zhì)量非常重要的標(biāo)準(zhǔn)。2.2社會化搜索隨著Faebk的逐日流行
6、,社交網(wǎng)絡(luò)平臺和相關(guān)應(yīng)用占據(jù)了互聯(lián)網(wǎng)的主流。社交網(wǎng)絡(luò)平臺強(qiáng)調(diào)用戶之間的聯(lián)絡(luò)和交互,這對傳統(tǒng)的搜索技術(shù)提出了新的挑戰(zhàn)。傳統(tǒng)搜索技術(shù)強(qiáng)調(diào)搜索結(jié)果和用戶需求的相關(guān)性,社會化搜索除了相關(guān)性外,還額外增加了一個維度,即搜索結(jié)果的可信賴性。對于某個查詢,相關(guān)的搜索結(jié)果可能成千上萬,但是假如是處于用戶社交網(wǎng)絡(luò)內(nèi)其他用戶發(fā)布的信息、點(diǎn)評的評論或者驗(yàn)證過的信息那么更可依賴,這是與用戶的心理親密相關(guān)的。社會化搜索即結(jié)合了這種相關(guān)性和可依賴性,為用戶提供更準(zhǔn)確、更值得信任的搜過結(jié)果。社會化搜索的本質(zhì)是信息過濾與推薦,即對用戶的疑問,社會化搜索系統(tǒng)推薦適宜的人來答復(fù)用戶疑問,或者通過社交關(guān)系過濾掉不可依賴內(nèi)容,推薦可
7、依賴內(nèi)容。根據(jù)其他用戶和提問者的關(guān)系,社會化搜索系統(tǒng)重點(diǎn)關(guān)注4類關(guān)系:直接有社交聯(lián)絡(luò)的成員,比方熟人或者朋友;有一樣興趣的成員;用戶所參加網(wǎng)絡(luò)社區(qū)的成員;領(lǐng)域?qū)<?。直接具有社交?lián)絡(luò)的成員對搜索者具有直接影響力,比方購物搜索時對產(chǎn)品品牌的評價;有一樣興趣的成員那么形成了有效的信息過濾者或者推薦者;搜索者所在社區(qū)的成員從本質(zhì)講也是有一樣興趣的成員,對于搜索者的問題可以開有效的信息過濾和推薦;而領(lǐng)域?qū)<夷敲磳栴}的解答具有權(quán)威性。通過結(jié)合或者分別使用以上4類社區(qū)成員的信息,社會化搜索系統(tǒng)可以給搜索者提供適宜的答復(fù)者或者值得依賴的信息。2.3實(shí)時搜索隨著Tittet、微博等微信息發(fā)布的個人媒體平臺逐步
8、興起,對搜索引擎的實(shí)時性要求日益進(jìn)步。微博平臺和傳統(tǒng)的信息平臺比方網(wǎng)頁、博客、新聞等相比,有其特殊性。其中一個突出的特點(diǎn)是時效性強(qiáng),越來越多突發(fā)事件的首次發(fā)布出現(xiàn)的微博平臺上,比方某地地震或者社會事件,這是有其必然性的。實(shí)時搜索與傳統(tǒng)的網(wǎng)頁搜索有很大差異。實(shí)時搜索的核心強(qiáng)調(diào)快,即用戶發(fā)布的信息可以第一時間被搜索引擎發(fā)現(xiàn)、索引并搜索到。傳統(tǒng)搜索引擎在實(shí)現(xiàn)機(jī)制上很難到達(dá)這一點(diǎn),所以實(shí)時搜索在搜索引擎的爬蟲、索引系統(tǒng)和搜索結(jié)果排序方面都有自己獨(dú)有的特點(diǎn)。在索引構(gòu)建方面,實(shí)時搜索要求第一時間對新發(fā)布的內(nèi)容進(jìn)展索引,即用戶發(fā)布那么信息可搜。這對傳統(tǒng)的索引機(jī)制提出了挑戰(zhàn),要求索引系統(tǒng)支持在建立索引的過程中
9、,也可以提供搜索效勞。在搜索結(jié)果排序方面,實(shí)時搜索也有其特點(diǎn),除了內(nèi)容相關(guān)性要求外,時間因素是搜索排序中首要的考慮因素,很多實(shí)時搜索系統(tǒng)默認(rèn)按時間順序排序,即最新發(fā)布的信息排在前列。對于一個完善的實(shí)時搜索排序算法來說,一般重點(diǎn)考慮以下4方面的因子:1內(nèi)容相關(guān)性:信息是否與用戶查詢主題相關(guān)。2時效性:發(fā)布時間越近的信息,其搜索排名應(yīng)該越靠前。3信息重要性:越重要或者越流行的信息排名應(yīng)該越靠前,作為重要性或者流行性的判斷指標(biāo)有很多,比方信息發(fā)布來源是否可靠微博中信息發(fā)布者的重要性、被轉(zhuǎn)發(fā)次數(shù)多少、被評論次數(shù)多少等都可以作為判斷指標(biāo)。4社交性:一般來說,微博平臺同時也是一個社交平臺,微博用戶的關(guān)注人
10、和被關(guān)注人表達(dá)了這種社交性。排序時,應(yīng)該將搜索結(jié)果的社交性表達(dá)出來,即用戶關(guān)注人發(fā)布的信息排名應(yīng)該靠前。2.4挪動搜索隨著智能的快速開展,基于等挪動設(shè)備的搜索日益流行。挪動設(shè)備對搜索應(yīng)用的需求與P等不同,主要源于其與P相比資源的有限性,比方的屏幕較小,可顯示區(qū)域不多;存儲和計(jì)算資源才能較弱;設(shè)備翻開網(wǎng)頁的速度較慢;輸入較為煩瑣等。所以針對挪動設(shè)備的搜索需要根據(jù)等挪動設(shè)備自身的特點(diǎn),開發(fā)合適其資源和設(shè)備的搜索應(yīng)用。使用搜索與P搜索一樣,由3個步驟組成:用戶輸入查詢,搜索引擎提供搜索結(jié)果信息,用戶點(diǎn)擊翻開感興趣的頁面??紤]到挪動設(shè)備的資源有限,在這3個步驟都要考慮如何增加用戶的體驗(yàn)。對于用戶輸入查
11、詢這一環(huán)節(jié)來說,因?yàn)檩斎腚y度比桌面設(shè)備大,不夠便捷,包括挪動設(shè)備中的中文輸入法由于資源所限,智能性缺乏,所以對于挪動搜索來說,如何讓用戶輸入更便捷是最主要的問題。由于挪動設(shè)備屏幕較小,如何在這么上的展示面積早讓用戶更快、更直接地找到答案至關(guān)重要。所以,挪動設(shè)備搜索對搜索的精度及搜索結(jié)果的展示方式要求更高。假如用戶在搜索結(jié)果的摘要區(qū)域無法獲得答案,就必須點(diǎn)擊網(wǎng)頁,查看頁面內(nèi)容,以搜索引擎目前的搜索精度來看,這步多多少少是難免的。既然如此,目的網(wǎng)頁往往內(nèi)容很多,包含導(dǎo)航欄、廣告欄、大量圖片等既消耗帶寬資源,又與用戶搜索內(nèi)容無關(guān)的信息,所以在這上步驟,挪動搜索的問題就轉(zhuǎn)化成了如何提供應(yīng)用戶頁面中最重
12、要、最相關(guān)的局部。搜索系統(tǒng)可以為用戶提供加工過的目的頁面,通過分析目的網(wǎng)頁的構(gòu)造,自動提取重要內(nèi)容,只將這局部內(nèi)容展示給用戶,有效增加用戶體驗(yàn)。3網(wǎng)絡(luò)搜索引擎的使用技巧21世紀(jì)是信息社會,由于Internet的廣泛應(yīng)用和開展,世界范圍內(nèi)的信息交流、信息資源共享成為現(xiàn)實(shí),網(wǎng)絡(luò)已成為人們進(jìn)展交流、獲取信息的重要途徑。但因特網(wǎng)上的信息內(nèi)容龐雜,缺乏統(tǒng)一的組織和管理,使用者只有掌握一定的搜索技巧,才能準(zhǔn)確、及時、有效地獲取自己所需的信息,實(shí)現(xiàn)網(wǎng)絡(luò)信息存在價值,進(jìn)步信息資源使用效率。3.1選擇適宜的搜索引擎不同的搜索引擎特點(diǎn)不同,優(yōu)勢不一,信息覆蓋范圍也有所差異,合理的方式應(yīng)該是根據(jù)檢索目的和詳細(xì)要求選
13、擇不同的搜索引擎。假如需要查找綜合性、概括性的主題概念,或是對檢索準(zhǔn)確度要求較高的課題,可以使用目錄式搜索引擎。假如需要檢索特定的信息,或是較為專、深、詳細(xì)或類屬不明確的課題,應(yīng)該用關(guān)鍵詞索引式搜索引擎。3.2適當(dāng)使用垂直搜索引擎一個搜索引擎很難搜集所有主題的網(wǎng)絡(luò)信息,很難將各主題都做得準(zhǔn)確而又專業(yè)。垂直搜索引擎是相對通用搜索引擎的信息量大、查詢不準(zhǔn)確、深度不夠等提出來的新的搜索引擎效勞形式,通過針對某一特定領(lǐng)域、某一特定人群或某一特定需求提供的有一定價值的信息和相關(guān)效勞。其特點(diǎn)就是專、精、深,且具有行業(yè)色彩,相比擬通用搜索引擎的海量信息無序化,垂直搜索引擎那么顯得更加專注、詳細(xì)和深化。比方股
14、票、天氣、新聞等類的搜索引擎,具有很高的針對性,用戶對查詢結(jié)果的滿意度較高。3.3使用元搜索引擎采用不同的搜索引擎,檢索效果的不同,在一個搜索引擎上找不到的信息卻可能在另一個搜索引擎上找到,每個單一搜索引擎的搜索范圍只能到達(dá)整個資源的3050%,查準(zhǔn)率不到50%。所以,用戶常常要切換多個搜索引擎進(jìn)展檢索,并要理解多個搜索引擎,這給用戶帶來了不便。元搜索引擎通過一個統(tǒng)一用戶界面幫助用戶在多個搜索引擎中選擇和利用一個或多個適宜的搜索引擎來實(shí)現(xiàn)檢索操作,并將檢索結(jié)果集中統(tǒng)一處理,以統(tǒng)一的格式提供應(yīng)用戶,是對分布于網(wǎng)絡(luò)的多種檢索工具的全局控制機(jī)制,查全率和查準(zhǔn)率都比擬高。3.4提煉準(zhǔn)確的搜索關(guān)鍵詞使用
15、搜索引擎進(jìn)展信息搜索,最重要的是關(guān)鍵詞的選擇,關(guān)鍵詞選擇得準(zhǔn)確與否直接影響到檢索效果的好壞。因此,用戶提供的關(guān)鍵詞必須能準(zhǔn)確表達(dá)自己的檢索意圖。盡量不要選擇常用詞匯進(jìn)展搜索,盡量不要使用自然語言,盡量使用多個頁不是一個關(guān)鍵詞。3.5使用限制指令限制指令把檢索限制在某些指定的字段內(nèi),限制了檢索詞在數(shù)據(jù)庫中出現(xiàn)的位置,以進(jìn)步檢索效果。如:使用site命令指定在某個特定的網(wǎng)站內(nèi)查找相關(guān)信息,使用inurl命令指定僅在網(wǎng)頁的url搜索,使用intitle命令指定僅在網(wǎng)頁的title中搜索,使用filetype命令指定搜索文件的特定類型,等等。3.6盡量使用高級搜索大多數(shù)搜索引擎都提供高級搜索功能,其選項(xiàng)在默認(rèn)值、靈敏性、定位準(zhǔn)確性等方面都優(yōu)于普通搜索功能。利用高級搜索中的選項(xiàng)限制可以有效且更加方便地控制檢索結(jié)果的范圍,可以省去用戶自行設(shè)定檢索式的費(fèi)事。搜索引擎提供的范圍限制類型大體有分類范圍、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度市政道路鋼筋施工分包合同
- 便利店?duì)I業(yè)員個人工作總結(jié)2024(9篇)
- 2025年電影產(chǎn)業(yè)收益分配策略協(xié)議
- 2025年臨時建筑項(xiàng)目施工合同樣本
- 2025年鑄幣及貴金屬制實(shí)驗(yàn)室用品項(xiàng)目申請報告模板
- 2025年聚苯硫醚(PPS)及合金項(xiàng)目規(guī)劃申請報告
- 2025年升級版?zhèn)€人代表授權(quán)合同
- 2025年小區(qū)護(hù)衛(wèi)服務(wù)合同范本
- 2025年醫(yī)療機(jī)構(gòu)衛(wèi)生用品清潔服務(wù)協(xié)議
- 2025年公民投票統(tǒng)一授權(quán)協(xié)議
- 中國氫內(nèi)燃機(jī)行業(yè)發(fā)展環(huán)境、市場運(yùn)行格局及前景研究報告-智研咨詢(2024版)
- 開學(xué)季初三沖刺中考開學(xué)第一課為夢想加油課件
- 《自然保護(hù)區(qū)劃分》課件
- 2025年普通卷釘項(xiàng)目可行性研究報告
- 2025年人教版英語五年級下冊教學(xué)進(jìn)度安排表
- 2025年建筑施工春節(jié)節(jié)后復(fù)工復(fù)產(chǎn)工作專項(xiàng)方案
- 2025延長石油(集團(tuán))限責(zé)任公司社會招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 《商用車預(yù)見性巡航系統(tǒng)技術(shù)規(guī)范》
- 玻璃電動平移門施工方案
- 春季安全開學(xué)第一課
- 陜鼓集團(tuán)招聘筆試題目
評論
0/150
提交評論