信息檢索論文_第1頁(yè)
信息檢索論文_第2頁(yè)
信息檢索論文_第3頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、網(wǎng)絡(luò)信息檢索時(shí)間:2021.03.01創(chuàng)作:歐陽(yáng)語(yǔ)摘要:本文通過(guò)對(duì)網(wǎng)絡(luò)信息檢索的基本原理、網(wǎng) 絡(luò)信息檢索的技術(shù)及工具、網(wǎng)絡(luò)信息檢索的現(xiàn)狀 等方面進(jìn)行分析研究,并對(duì)網(wǎng)絡(luò)信息檢索的發(fā)展 趨勢(shì)進(jìn)行了預(yù)測(cè),旨在尋找提高網(wǎng)絡(luò)信息檢索的 手段和方法的有效途徑,并最終提高網(wǎng)絡(luò)信息的 檢索效果,使得網(wǎng)絡(luò)信息資源得到充分有效地利 用。關(guān)鍵詞:信息檢索;網(wǎng)絡(luò)信息;信息引言進(jìn)入20世紀(jì)90年代以后,互聯(lián)網(wǎng)的發(fā)展風(fēng)起云甬, 人類(lèi)社會(huì)的信息化、網(wǎng)絡(luò)化進(jìn)程大大加快。與之相適應(yīng) 的信息檢索的交流平臺(tái)也迅速轉(zhuǎn)移到以WWW為核心 的網(wǎng)絡(luò)應(yīng)用環(huán)境中,信息檢索步入網(wǎng)絡(luò)化時(shí)代,網(wǎng)絡(luò)信息 檢索已基本取代了手工檢索。1信息檢索概述什麼是

2、信息?信息是消息,人們?cè)趯W(xué)習(xí)、工作、日 常生活中隨時(shí)隨地都在接受和利用信息;信息是資源, 它具有使用價(jià)值和價(jià)值;信息是財(cái)富,且是無(wú)價(jià)之財(cái) 富;信息是生產(chǎn)力要素,更是一種不可估量的促進(jìn)生產(chǎn) 力發(fā)展的新動(dòng)力。因此,人類(lèi)社會(huì)的發(fā)展,科技技術(shù)的 進(jìn)步,都離不開(kāi)信息資源的開(kāi)發(fā)和利用。而且,信息資 源的真實(shí)狀況及開(kāi)發(fā)利用程度,已經(jīng)成為衡量一個(gè)國(guó)家 經(jīng)濟(jì)、文化、科技以及綜合國(guó)力的重要指標(biāo)。我們?cè)鯓?快速的查找信息和有序的整理信息?信息檢索是最快的 途徑。信息檢索是指將信息按一走的方式組織和存儲(chǔ)起 來(lái),并根據(jù)信息用戶(hù)的信息需求查找所需信息的過(guò)程和 技術(shù)。人們獲取信息源的方式主要有:傳統(tǒng)的信息檢 索方法,通過(guò)人

3、工查詢(xún)?cè)趫D書(shū)館等提供文獻(xiàn)的機(jī)構(gòu)進(jìn)行 文獻(xiàn)的查詢(xún)和獲取活動(dòng);聯(lián)機(jī)信息檢索相對(duì)于前者來(lái) 說(shuō)具有實(shí)時(shí)性、完整性、共享性、廣泛性等優(yōu)點(diǎn);網(wǎng) 絡(luò)信息檢索是指通過(guò)網(wǎng)絡(luò)信息檢索工具檢索存在于Internet信息空間中各種類(lèi)型的網(wǎng)絡(luò)信息資源。2網(wǎng)絡(luò)信息檢索簡(jiǎn)介隨著信息技術(shù)的飛速發(fā)展,信息已成為全社會(huì)的重 要資源,對(duì)信息的占有程度及信息處理水平的先進(jìn)程度 已成為衡量一個(gè)國(guó)家或地區(qū)現(xiàn)代化程度的重要標(biāo)志,而 網(wǎng)絡(luò)上豐富的信息在更大程度上改變了人們的工作和生 活的方式。Internet是當(dāng)今世界上規(guī)模最大、覆蓋面最 廣、信息資源最豐富、發(fā)展最為迅速的信息網(wǎng)絡(luò),基于 Internet的網(wǎng)絡(luò)信息檢索的研究,無(wú)論對(duì)研究人員

4、還是T殳用戶(hù)來(lái)說(shuō),都有著很強(qiáng)的現(xiàn)實(shí)性和實(shí)用性。2.1網(wǎng)絡(luò)信息檢索走義網(wǎng)絡(luò)信息檢索是指通過(guò)網(wǎng)絡(luò)信息檢索工具檢索存在于Internet信息空間中各種類(lèi)型的網(wǎng)絡(luò)信息資源。2.2網(wǎng)絡(luò)信息檢索的原理網(wǎng)絡(luò)信息檢索工具是網(wǎng)絡(luò)信息檢索技術(shù)的實(shí)物體現(xiàn)。目前,常用的網(wǎng)絡(luò)信息檢索模型有布爾邏輯模型、 模糊邏輯模型和概率模型等幾種方式。 布爾邏輯模型這是一種簡(jiǎn)單而常用的嚴(yán)格 匹配模型。用戶(hù)可以根據(jù)檢索項(xiàng)在文檔中的布爾邏輯關(guān) 系提交查詢(xún),搜索工具根據(jù)事先建立的倒排文檔結(jié)構(gòu)確 定查詢(xún)結(jié)果。標(biāo)準(zhǔn)的布爾邏輯模型為二元邏輯,所搜索 的文檔要么與查詢(xún)相關(guān),要么與查詢(xún)無(wú)關(guān)。利用這種模 型進(jìn)行查詢(xún),其查詢(xún)結(jié)果一般沒(méi)有按照內(nèi)容的相關(guān)特

5、性 排序。 模糊邏輯模型它在查詢(xún)結(jié)果處理中引進(jìn)了 模糊邏輯比較,并且按照相關(guān)的優(yōu)先次序排列直詢(xún)結(jié) 果,這樣就可以克服布爾邏輯模型信息查詢(xún)結(jié)果的無(wú)序 性。 概率模型它是基于貝葉斯概率原理而提出 的,根據(jù)詞條、文檔間的內(nèi)在聯(lián)系,利用詞條間和詞條 與文檔間的概率相依性來(lái)進(jìn)行信息檢索。2.3網(wǎng)絡(luò)信息檢索的特點(diǎn) 信息檢索的范圍不斷拓寬; 信息檢索手段更加容易; 信息檢索的途徑更加靈活。2.4網(wǎng)絡(luò)信息檢索與傳統(tǒng)信息檢索的區(qū)別檢索方網(wǎng)絡(luò)信息檢索傳統(tǒng)信息檢索式比較方而檢索時(shí)間快慢檢索指標(biāo)查全率高查準(zhǔn)率高檢索費(fèi)用相對(duì)低相對(duì)髙(信息使用費(fèi)、服務(wù)費(fèi)、通訊費(fèi))信息內(nèi)容范囤數(shù)字化、多媒體信息紙制文獻(xiàn)信息檢索信息質(zhì)量查全

6、率高查準(zhǔn)率高3網(wǎng)絡(luò)信息檢索詳論3.1網(wǎng)絡(luò)信息檢索方式其檢索方式有:瀏覽器方式和搜索引擎方式。(I)瀏覽器方式只要能夠進(jìn)入html就能夠通過(guò)瀏覽器,利用HTTP協(xié)議提供的萬(wàn)維網(wǎng)服務(wù),瀏覽接觸頁(yè)和通過(guò)Web頁(yè)面提供的檢索方式訪問(wèn)數(shù)據(jù)庫(kù)。搜索引擎方式搜索引擎是internet提供公共信息檢索服務(wù)的Web站點(diǎn),它是以一走的技術(shù)和策略在internet中搜 集和發(fā)現(xiàn)網(wǎng)絡(luò)信息,并對(duì)網(wǎng)絡(luò)信息進(jìn)行理解、提取和處 理,建立數(shù)據(jù)庫(kù),同時(shí)以web形式提供一個(gè)檢索界 面,供用戶(hù)輸入檢索關(guān)鍵詞、詞組或短語(yǔ)等檢索項(xiàng),代 替用戶(hù)在數(shù)據(jù)庫(kù)中查找出與提問(wèn)相匹配的記錄,同時(shí)返 回結(jié)果且按相關(guān)度排序輸出,從而起到快速直找信息的 目

7、的。搜索引擎所處理的信息資源主要包括萬(wàn)維網(wǎng)服務(wù) 器上的信息,另外還包括電子郵件和新聞組信息。搜索 引擎服務(wù)的宗旨是為滿(mǎn)足用戶(hù)的信息需要,所以它是面 向用戶(hù)的,采用的方式是交互式的。3.2網(wǎng)絡(luò)信息檢索工具從20世紀(jì)80年代起人們就開(kāi)發(fā)了諸如Archive.WAIS、Veronica等檢索工具,從90年代中期起又出 現(xiàn)了檢索萬(wàn)維網(wǎng)絡(luò)信息資源的搜索引擎技術(shù),并以此構(gòu) 造檢索所有各類(lèi)網(wǎng)絡(luò)信息資源的集成化支撐體系。據(jù)統(tǒng) 計(jì),各種各樣的Internet網(wǎng)絡(luò)信息檢索工具已有數(shù)千個(gè),按這些工具的檢索機(jī)制、檢索內(nèi)容范圍,以及檢索 工具的數(shù)量、檢索資源類(lèi)型,可將它們劃分為以下各 類(lèi):(1) 按檢索機(jī)制劃分根據(jù)檢索

8、工具的數(shù)據(jù)檢索機(jī)制,可將檢索工具分為 檢索型、目錄型和混合型檢索工具。(2) 按檢索內(nèi)容劃分根據(jù)檢索工具的數(shù)據(jù)內(nèi)容,檢索工具可分為綜合 型、專(zhuān)題型和特殊檢索工具書(shū)。(3) 按包含檢索工具數(shù)量劃分根據(jù)檢索工具數(shù)量劃分,檢索工具可分為單獨(dú)型和 復(fù)合型檢索工具。(4)按檢索資源類(lèi)型劃分根據(jù)檢索工具針對(duì)的數(shù)據(jù)資源類(lèi)型,可將檢索工具 分為萬(wàn)維網(wǎng)檢索工具和非萬(wàn)維網(wǎng)檢索工具。33網(wǎng)絡(luò)信息檢索技巧目前常用的信息檢索方法有兩種:一種是利用搜索 引擎進(jìn)行關(guān)鍵詞、主題詞或自然語(yǔ)言檢索。最著名的搜 索引擎有 AltaVista. Excite. HotBot、Infoseek 等; 另一種是按主題分類(lèi)指南進(jìn)行檢索,如

9、Yahoo !就是按主題組織資源、逐次分類(lèi),供讀者按需查詞的;有的檢索 工具兩種方式可以隨時(shí)切換使甩如Info seek。相比之 下,前者信息的獲取太雜亂,魚(yú)龍混雜,精確度太低,需通 過(guò)多次篩選才能找到所需信息。而后者的信息組織系統(tǒng) 性較強(qiáng),精確度較高。但主要問(wèn)題在于獲取率較低且很難 反映信息之間的關(guān)聯(lián)性。由此可見(jiàn),兩種方法各有利弊, 讀者要根據(jù)檢索的目的來(lái)挑選和使用檢索工具,同時(shí)要學(xué) 習(xí)一些提高檢索效果的方法和技巧。檢索關(guān)鍵詞具體化;(2)運(yùn)用詞組檢索;巧用Boolean邏輯詞:AND、OR和NOT。4網(wǎng)絡(luò)信息檢索發(fā)展 4.1網(wǎng)絡(luò)信息檢索的現(xiàn)狀與發(fā)展1990年以前,網(wǎng)絡(luò)信息檢索的現(xiàn)狀與發(fā)展沒(méi)

10、有任 何人能夠檢索互聯(lián)網(wǎng)上的信息。應(yīng)該說(shuō),所有的網(wǎng)絡(luò)信 息檢索工具都是從1990年的Alan Emtage等人發(fā)明的 Archie開(kāi)始的,雖然它當(dāng)時(shí)只可以實(shí)現(xiàn)簡(jiǎn)單意義上的 FTP文件檢索。隨著World Wide Web的出現(xiàn)和發(fā) 展,基于網(wǎng)頁(yè)的信息檢索工具出現(xiàn)并迅速發(fā)展起來(lái)。 1995年基于網(wǎng)絡(luò)信息檢索工具本身的檢索工具元搜索 引擎由美國(guó)華盛頓大學(xué)的Eric Solberg等發(fā)明。伴隨著 網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)信息檢索工具也取得了十足的發(fā) 展。4.2影響網(wǎng)絡(luò)信息檢索質(zhì)量的因素(1) 搜索引擎在檢索的實(shí)現(xiàn)過(guò)程中存在一些尚未解決 的問(wèn)題,影響檢索效果(本身存在的問(wèn)題)。(2) 頁(yè)面的制很組織過(guò)程中

11、存在的欠缺會(huì)影響到被 檢索的信息質(zhì)量。(3) 檢索用戶(hù)與搜索引擎的交互過(guò)程中,由于交互的 背景不同,目的不同,會(huì)影響檢索效果。43網(wǎng)絡(luò)信息檢索工具展望從最早的網(wǎng)絡(luò)信息檢索工具(如Archie)算起,它們 作為一個(gè)整體只有不足十年的歷史,而基于萬(wàn)維網(wǎng)的檢 索工具(如Yahoo!和AltaVista),出現(xiàn)的時(shí)間則更晚。 可見(jiàn),網(wǎng)絡(luò)信息檢索工具尚處于發(fā)展高峰期。網(wǎng)絡(luò)信息檢索現(xiàn)今的主要問(wèn)題是查準(zhǔn)率太差。如 今,人們正通過(guò)一些硏究,設(shè)法使網(wǎng)絡(luò)信息檢索的空間 在不影響查全率這一前提下,提高直準(zhǔn)率,它們的未來(lái) 充滿(mǎn)希望。在網(wǎng)絡(luò)信息檢索環(huán)境中,檢索、瀏覽和獲取 這三個(gè)過(guò)程相互交融,自由轉(zhuǎn)換、合為一體,已展示

12、出 了信息檢索的新趨勢(shì),為充分地利用網(wǎng)絡(luò)信息資源創(chuàng)造 了條件。結(jié)語(yǔ)人類(lèi)已經(jīng)進(jìn)入了信息社會(huì),信息社會(huì)化與社會(huì)信息 化是當(dāng)今重要的時(shí)代特征。信息檢索作為傳遞、搜索信 息的手段發(fā)展愈來(lái)愈快。如果不懂得信息檢索,要在浩如煙海的各種信息中 尋找自己需要的信息,就如同大海撈針一般困難,掌握 了信息檢索的方法和技巧,就可以使信息的直詢(xún)過(guò)程更 有條理性、計(jì)劃性,避繁就簡(jiǎn),事半功倍。所以,我們 應(yīng)充分利用信息資源,避免重復(fù)勞動(dòng)??茖W(xué)硏究具有繼 承和創(chuàng)造兩重性,縱觀科學(xué)技術(shù)發(fā)展史,積累、繼承和 借鑒前人的研究成果是科技發(fā)展的重要前提O更新自身 知識(shí)積累,適應(yīng)社會(huì)發(fā)展需要。在信息社會(huì),人們需要 終生學(xué)習(xí),不斷更新知識(shí),才能適應(yīng)社會(huì)發(fā)展

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論