淺談互聯(lián)網(wǎng)信息檢索論文_第1頁
淺談互聯(lián)網(wǎng)信息檢索論文_第2頁
淺談互聯(lián)網(wǎng)信息檢索論文_第3頁
淺談互聯(lián)網(wǎng)信息檢索論文_第4頁
淺談互聯(lián)網(wǎng)信息檢索論文_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第頁共頁淺談互聯(lián)網(wǎng)信息檢索論文淺談互聯(lián)網(wǎng)信息檢索論文【摘要】:^p:通過分析^p互聯(lián)網(wǎng)的信息檢索特點(diǎn),提出針對不同檢索內(nèi)容的檢索策略,到達(dá)進(jìn)步信息檢索的有效性的根本目的?!娟P(guān)鍵詞】:^p:互聯(lián)網(wǎng);信息檢索;檢索策略信息是現(xiàn)代社會(huì)的珍貴資,隨著社會(huì)的開展進(jìn)步,信息的價(jià)值將不斷飚升。正如世界著名將來學(xué)家阿爾溫.托夫勒預(yù)言:"誰掌握了信息,控制了網(wǎng)絡(luò),誰就掌握了整個(gè)世界。"而互聯(lián)網(wǎng)和計(jì)算機(jī)的的開展使得信息檢索的軟硬件環(huán)境有了很大改善,人們越來越多的利用網(wǎng)絡(luò)信息資來滿足自身的信息需求,因此互聯(lián)網(wǎng)信息檢索日益開展成為信息檢索的主流。1、互聯(lián)網(wǎng)專題信息檢索的特點(diǎn)互聯(lián)網(wǎng)專題信息檢索是一種基于超文本方式的信息查詢工具,主要特點(diǎn)如下:〔1〕系統(tǒng)為分布式存在網(wǎng)絡(luò)信息檢索以節(jié)點(diǎn)為單位,節(jié)點(diǎn)間穿插相聯(lián),復(fù)雜的信息連接構(gòu)造可以按照不同的查詢條件鏈接節(jié)點(diǎn)信息。信息資在物理上分散在多個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)上,確保網(wǎng)絡(luò)節(jié)點(diǎn)互聯(lián)互通和快速可達(dá),是在分布的網(wǎng)絡(luò)環(huán)境中提供效勞的首要條件。〔2〕檢索用戶數(shù)量多信息資效勞對象是多用戶的,針對不同用戶開展不同的信息檢索效勞,首要是區(qū)分和管理檢索用戶的個(gè)性化信息需求,讓有效信息可以正確匯總到用戶面?!?〕海量的信息內(nèi)容互聯(lián)網(wǎng)信息眾多,數(shù)據(jù)量宏大,信息豐富,但是同時(shí)也標(biāo)志著無效數(shù)據(jù)成爆炸性增長,高效率的信息檢索方式和方法就成為沙里淘金的要素,此外由于極大的信息量,相應(yīng)的處理分析^p時(shí)間也將大大延長?!?〕信息檢索的非專業(yè)化互聯(lián)網(wǎng)環(huán)境下多數(shù)用戶不具有專業(yè)的信息檢索技能,雖然搜索引擎也支持邏輯組合,但是非專業(yè)用戶更加需求靈敏的問答式的信息檢索、個(gè)性化推送更更加便捷和智能的信息檢索效勞。2、互聯(lián)網(wǎng)專題信息檢索的策略2.1選定特定的主題,并確定【關(guān)鍵詞】:^p以陳述句或疑問句形式寫下你要檢索的主題,并確定【關(guān)鍵詞】:^p或詞組。把你認(rèn)為最重要的概念定為檢索【關(guān)鍵詞】:^p。注意檢索詞的同義詞、單復(fù)數(shù)、拼寫變異、單詞結(jié)尾的不同等。確定包涵檢索主題的較廣的類別,這對于應(yīng)用分類方法檢索信息很有用。選定可能包涵檢索主題的組織或機(jī)構(gòu)。應(yīng)用搜索引擎得到這個(gè)地址,然后閱讀或檢索這個(gè)網(wǎng)址。2.2選定合適的搜索引擎搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,在對信息進(jìn)展組織和處理后,為用戶提供檢索效勞的系統(tǒng)。它主要是用于檢索網(wǎng)站、網(wǎng)址、文獻(xiàn)信息等內(nèi)容。隨著網(wǎng)絡(luò)技術(shù)的開展各種搜索引擎層出不窮,目前被大家廣泛運(yùn)用的主要是幫助大家搜索表層信息,如Google、百度、雅虎等。而搜索引擎按檢索方式可分為目錄搜索引擎、全文搜索引擎和多元搜索引擎三種。檢索界面是否允許應(yīng)用布爾符、截詞、自然語言或僅能用單個(gè)詞檢索?檢索返回的結(jié)果僅僅是標(biāo)題和URL?還是包括整個(gè)網(wǎng)頁、局部網(wǎng)頁及或新聞?dòng)懻摻M地址?這些都是影響選擇搜索引擎的重要因素,引擎的大小、速度、幫助性能及檢索結(jié)果顯示的方式也將影響你的選擇。另外根據(jù)查詢信息類別不同可選用相應(yīng)類型的站點(diǎn),如查詢網(wǎng)址可選用HotBot,查詢?nèi)嗣x用WhoWhere?等。2.3選用適當(dāng)?shù)臋z索方法確定搜索引擎后,接下來就是詳細(xì)用哪種方法來施行檢索過程。下面推薦幾種不錯(cuò)的檢索方法,以便能成功地檢索出你所需的文檔。多元引擎檢索:是檢索信息的首選。它同時(shí)搜索幾個(gè)獨(dú)立的引擎,并把結(jié)果顯示在同一頁面上,是通過【關(guān)鍵詞】:^p和一些常用的運(yùn)算符完成檢索過程的。應(yīng)用多元引擎加快了檢索的全過程,且返回相對較少無關(guān)站點(diǎn)是其優(yōu)點(diǎn)。缺點(diǎn)是當(dāng)進(jìn)展復(fù)雜檢索時(shí)有時(shí)不能有效地執(zhí)行,可能產(chǎn)生一些奇怪的結(jié)果?!娟P(guān)鍵詞】:^p檢索:當(dāng)你要查找的一個(gè)特定信息或所用的引擎數(shù)據(jù)庫容量很大時(shí),應(yīng)用【關(guān)鍵詞】:^p查詢數(shù)據(jù)庫,可得到較滿意的結(jié)果。由于這類搜索引擎是應(yīng)用機(jī)器人〔即計(jì)算機(jī)程序〕時(shí)刻在網(wǎng)際中巡視,并取回符合條件的網(wǎng)頁存放在它的數(shù)據(jù)庫中,因此數(shù)據(jù)庫更新快,檢索的結(jié)果新。缺點(diǎn)是給數(shù)據(jù)庫中內(nèi)容所做的索引有時(shí)不準(zhǔn)確,常常給查找所需信息帶來困難。分類目錄檢索:適用于分類明確的信息查找。它是一種可供檢索和查詢的等級(jí)式主題目錄,以超文本鏈接的方式將不同學(xué)科、專業(yè)、行業(yè)和區(qū)域的信息按照分類或主題的方式組織起來。這些主題目錄一般在大類下面分成假設(shè)干小類,類目之間按等級(jí)系統(tǒng)排列,然后用人工的方法把搜集的網(wǎng)頁連接起來,用戶通過逐層____主題目錄,直到找出需要的信息為止。由于經(jīng)過了人工的挑選和系統(tǒng)組織,檢索的結(jié)果質(zhì)量較高,條理性較強(qiáng)。缺點(diǎn)是采集信息的速度遠(yuǎn)遠(yuǎn)跟不上網(wǎng)絡(luò)資增長的速度,數(shù)據(jù)庫往往較小,檢索到的文獻(xiàn)數(shù)有限。分類目錄加【關(guān)鍵詞】:^p結(jié)合檢索:當(dāng)你對終究用是分類檢索好還是【關(guān)鍵詞】:^p檢索好搖擺不定時(shí),應(yīng)用分類目錄加【關(guān)鍵詞】:^p結(jié)合檢索是你的最正確選擇。一般先找到所需信息所處的范圍較窄類別,再在該目錄下應(yīng)用【關(guān)鍵詞】:^p檢索。該方法的優(yōu)點(diǎn)是檢索范圍更窄,結(jié)果更準(zhǔn)確有效。但對于較難的檢索不易選擇合適的【關(guān)鍵詞】:^p是其缺點(diǎn)。2.4如何對待檢索結(jié)果有時(shí)檢索結(jié)果并不滿意,要么太多,要么太少或未能找到,遇到這些問題,你可試用下面的對策??芍婚喿x搜尋結(jié)果的前面幾條信息。因?yàn)榇蠖鄶?shù)搜索引擎都將最符合要求的網(wǎng)頁列在前面,雖然返回的搜索結(jié)果成千上萬,但經(jīng)常是需要的網(wǎng)頁地址就在最前面的一頁??s小搜索的范圍。當(dāng)返回的網(wǎng)頁太多,而需要的網(wǎng)頁不在最前面的幾頁時(shí),可通過改變【關(guān)鍵詞】:^p、改變搜索范圍、使用邏輯符AND及引號(hào)等方法縮小查詢范圍。找不到網(wǎng)頁的對策。首先檢查是否有拼寫錯(cuò)誤,接著看搜索【關(guān)鍵詞】:^p之間有沒有自相矛盾的地方,假如仍不能成功地搜索,可換一種搜索引擎,也許會(huì)得到你所期望的結(jié)果。因?yàn)槊總€(gè)搜索工具功能雖大體一樣,但檢索方式和擁有資料的側(cè)重點(diǎn)不同。假如用以上策略仍不能找到所需網(wǎng)頁,也不必太絕望。你可鏈接相近的網(wǎng)頁,也許能找到理想目的'地的鏈接,或直接與已搜索到的主頁管理者寫E-MAIL尋求幫助。2.5互聯(lián)網(wǎng)信息檢索的開展趨勢隨著互聯(lián)網(wǎng)的開展,網(wǎng)絡(luò)信息資迅速多樣化,并且在不停的開展更新,使得信息檢索系統(tǒng)更為豐富、全面和系統(tǒng)。網(wǎng)絡(luò)信息檢索的開展強(qiáng)調(diào)"以人為本"的理念。另外,多媒體信息檢索技術(shù)也已經(jīng)成為信息檢索研究的熱點(diǎn)。2.6網(wǎng)路信息檢索的開展趨勢信息檢索的多樣化,其詳細(xì)趨勢表現(xiàn)為:網(wǎng)絡(luò)檢索信息的形態(tài)多樣化,多媒體信息檢索開場普及,網(wǎng)上檢索工具開場向其他效勞范疇擴(kuò)展,以各種形式滿足群眾信息需求。信息檢索的可視化,一個(gè)可視化的信息檢索過程使得檢索更加有效,可以為用戶提供更豐富的信息。幫助用戶更好的掌握檢索信息的過程。信息檢索的智能化。智能化信息檢索是當(dāng)今的信息檢索技術(shù)研究的熱點(diǎn)問題之一,也是將來信息檢索的開展方向,可以使得用戶得到可以直接加以利用的信息,他是建立在一個(gè)或者多個(gè)專家系統(tǒng)根底上的信息檢索系統(tǒng)。信息檢索的個(gè)性化。個(gè)性化主要表達(dá)在兩個(gè)方面:一個(gè)是允許用戶的個(gè)性化定制檢索功能,另一個(gè)方面是利用推送技術(shù)主動(dòng)的向特定用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論