計(jì)算機(jī)信息檢索原理_第1頁(yè)
計(jì)算機(jī)信息檢索原理_第2頁(yè)
計(jì)算機(jī)信息檢索原理_第3頁(yè)
計(jì)算機(jī)信息檢索原理_第4頁(yè)
計(jì)算機(jī)信息檢索原理_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)算機(jī)檢索原理與檢索方法計(jì)算機(jī)檢索原理信息檢索原理信息檢索實(shí)質(zhì)上包括信息存貯和信息檢索兩個(gè)過(guò)程:信息存貯過(guò)程是依據(jù)檢索語(yǔ)言對(duì)原始信息進(jìn)行處理和標(biāo)引,形成信息特征標(biāo)識(shí),為檢索提供經(jīng)過(guò)整序的信息集合的過(guò)程。信息檢索是參照檢索語(yǔ)言體系對(duì)檢索課題進(jìn)行分析,形成檢索提問(wèn)標(biāo)識(shí),從信息集合中檢出相關(guān)文獻(xiàn)信息的過(guò)程。信息檢索原理原始信息信息分析、著錄和標(biāo)引信息檢索系統(tǒng)信息檢索原理圖檢索課題課題分析檢索語(yǔ)言檢索結(jié)果信息存貯信息檢索提問(wèn)標(biāo)識(shí)標(biāo)引標(biāo)識(shí)信息檢索的實(shí)質(zhì)

檢索提問(wèn)標(biāo)識(shí)與存貯在檢索系統(tǒng)中的標(biāo)引標(biāo)識(shí)進(jìn)行比較,兩者一致或信息標(biāo)引的標(biāo)識(shí)包含著檢索提問(wèn)標(biāo)識(shí),則具有該標(biāo)識(shí)的文獻(xiàn)信息就從檢索系統(tǒng)中輸出,輸出的文獻(xiàn)信息就是檢索命中的信息。檢索語(yǔ)言概念為了使檢索的過(guò)程,即信息的標(biāo)引標(biāo)識(shí)和檢索的提問(wèn)用語(yǔ)的對(duì)比進(jìn)行順利,兩者都需要用一定的語(yǔ)言來(lái)表達(dá)。這就是檢索語(yǔ)言。作用把信息的存貯和檢索聯(lián)系起來(lái),以保證檢索和存貯的一致性,使文獻(xiàn)的標(biāo)引者和檢索者取得共同理解,從而實(shí)現(xiàn)信息檢索。檢索語(yǔ)言的種類

--按描述文獻(xiàn)特征的不同劃分1描述文獻(xiàn)外表特征的檢索語(yǔ)言

如文章題名、作者姓名、語(yǔ)種、刊名等2描述文獻(xiàn)內(nèi)容特征的檢索語(yǔ)言

包括分類語(yǔ)言和主題語(yǔ)言。檢索語(yǔ)言的種類-按加工程度劃分1人工語(yǔ)言

主要有分類語(yǔ)言和主題語(yǔ)言2自然語(yǔ)言如關(guān)鍵詞分類語(yǔ)言類是許多具有共同屬性事物的集合。分類語(yǔ)言是以科學(xué)分類為基礎(chǔ),運(yùn)用概念劃分的方法,對(duì)人類知識(shí)進(jìn)行區(qū)分與類集。分類語(yǔ)言是用分類號(hào)來(lái)表達(dá)學(xué)科體系的各種概念,將各種概念按學(xué)科性質(zhì)進(jìn)行分類和系統(tǒng)排列。如“網(wǎng)絡(luò)瀏覽器”TP393.092常用的分類語(yǔ)言《中國(guó)圖書館圖書分類法》即中圖法是我國(guó)文獻(xiàn)分類標(biāo)引工作的國(guó)家標(biāo)準(zhǔn)《中國(guó)科學(xué)院圖書館圖書分類法》即科圖法《國(guó)際十進(jìn)分類法》主題語(yǔ)言主題語(yǔ)言是一種描述性語(yǔ)言,直接用語(yǔ)詞表達(dá)文獻(xiàn)的主題,這些語(yǔ)詞就是表達(dá)主題概念的標(biāo)識(shí)。將這些用作標(biāo)識(shí)的語(yǔ)詞按字順排列并使用參照系統(tǒng)來(lái)間接表達(dá)各種概念之間的關(guān)系的檢索語(yǔ)言就是主題語(yǔ)言。信息檢索的類型信息檢索的類型

—按檢索對(duì)象分①數(shù)值檢索

特征:以特定的數(shù)值為檢索對(duì)象。比如,查找某一統(tǒng)計(jì)數(shù)據(jù),某一數(shù)學(xué)公式,某一材料的成分、性能,某種元件的型號(hào)、參數(shù)等。解決方案:利用手冊(cè)、年鑒等參考工具書或數(shù)值型數(shù)據(jù)庫(kù)來(lái)檢索。

②事實(shí)檢索特征:以特定的事實(shí)為檢索對(duì)象。比如,查找名詞術(shù)語(yǔ)的解釋,了解某人或某機(jī)構(gòu)的簡(jiǎn)況,或考證某一事件發(fā)生的前因后果等。解決方案:利用辭典、百科全書、年鑒、名錄等參考工具書或事實(shí)型數(shù)據(jù)庫(kù)來(lái)檢索。③文獻(xiàn)檢索特征:以特定的文獻(xiàn)為檢索對(duì)象。比如,查找有關(guān)某一研究課題的一定年限內(nèi)的相關(guān)文獻(xiàn),或從事一項(xiàng)發(fā)明創(chuàng)造而需要文獻(xiàn)查新等。解決方案:利用文摘、題錄等各種手檢工具書或書目文獻(xiàn)型數(shù)據(jù)庫(kù)來(lái)檢索。信息檢索的類型

—按檢索手段分手工檢索計(jì)算機(jī)檢索--光盤檢索--聯(lián)機(jī)檢索--網(wǎng)絡(luò)檢索計(jì)算機(jī)檢索的條件硬件

計(jì)算機(jī)及存貯、打印設(shè)備軟件

信息系統(tǒng)(數(shù)據(jù)庫(kù))及檢索軟件通訊設(shè)備

網(wǎng)卡、網(wǎng)線等信息使用權(quán)

大型商業(yè)數(shù)據(jù)庫(kù)系統(tǒng)是有償使用的,有些學(xué)術(shù)團(tuán)體內(nèi)部的信息資源僅限其認(rèn)可的成員使用,需要簽訂協(xié)議獲得使用權(quán)數(shù)據(jù)庫(kù)及其類型數(shù)據(jù)庫(kù)是在計(jì)算機(jī)存貯設(shè)備上按一定方式存儲(chǔ)的相互關(guān)聯(lián)的數(shù)據(jù)集合。是信息檢索的重要資料來(lái)源。按照載體的不同,可分為

--聯(lián)機(jī)數(shù)據(jù)庫(kù)--光盤數(shù)據(jù)庫(kù)--網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)類型—按內(nèi)容和功能劃分書目型數(shù)據(jù)庫(kù)

以文檔的形式組織起來(lái),提供文獻(xiàn)的題錄、文摘等書目信息。全文型數(shù)據(jù)庫(kù)

存儲(chǔ)文獻(xiàn)全文或其中的主要部分的源數(shù)據(jù)庫(kù)。指南型數(shù)據(jù)庫(kù)

供查詢某一客體的基本信息或簡(jiǎn)況,包括名錄、傳記等數(shù)據(jù)庫(kù)。數(shù)值型數(shù)據(jù)庫(kù)

提供各類數(shù)值型數(shù)據(jù)圖象數(shù)據(jù)庫(kù)

以圖形、圖象為記錄單位數(shù)據(jù)庫(kù)類型—按收錄專業(yè)范圍劃分綜合性數(shù)據(jù)庫(kù)

收錄多個(gè)學(xué)科或?qū)I(yè)的信息資料。如中國(guó)期刊網(wǎng)專業(yè)性數(shù)據(jù)庫(kù)

收錄單一學(xué)科或?qū)I(yè)的信息資料。專題性數(shù)據(jù)庫(kù)收錄某一特定專題的信息資料數(shù)據(jù)庫(kù)的結(jié)構(gòu)—字段、記錄和文檔字段:文獻(xiàn)著錄的基本單元,反映文獻(xiàn)外部特征和內(nèi)容特征的每一項(xiàng)目,在數(shù)據(jù)庫(kù)中就稱為字段。如:題名、作者。基本字段:描述文獻(xiàn)的內(nèi)容特征。如:關(guān)鍵詞KW、題名TI、文摘AB、全文等輔助字段:描述文獻(xiàn)的外部特征。如:作者AU、刊名JN、出版時(shí)間PY、語(yǔ)種LA等記錄:

由若干不同字段組成的文獻(xiàn)單元,一條記錄在數(shù)據(jù)庫(kù)中代表一篇文獻(xiàn)。數(shù)據(jù)庫(kù)(文檔):

由若干數(shù)量的記錄構(gòu)成的數(shù)據(jù)的集合。大型的數(shù)據(jù)庫(kù)檢索系統(tǒng)中稱為文檔。中國(guó)期刊網(wǎng)字段示例可檢索字段

計(jì)算機(jī)信息檢索方法檢索流程1、分析課題的內(nèi)容◆明確需要查找那一方面的文獻(xiàn);◆對(duì)文獻(xiàn)的類型、時(shí)間、語(yǔ)種等要求;2、選定數(shù)據(jù)庫(kù)◆查明數(shù)據(jù)庫(kù)所覆蓋主題範(fàn)圍

◆查閱數(shù)據(jù)庫(kù)是否收錄適當(dāng)之文獻(xiàn)類型

◆查看數(shù)據(jù)庫(kù)之詳細(xì)介紹及說(shuō)明

◆請(qǐng)教你的圖書館員,要求介紹開始檢索之最佳數(shù)據(jù)庫(kù)

最好選擇幾個(gè)輔助或擴(kuò)充備用數(shù)據(jù)庫(kù)。3、確定檢索詞,編制檢索式選定檢索詞利用上下位詞或特有名詞及同義詞、近義詞、相關(guān)詞,查閱工具如專業(yè)詞典,字典,分類表等.編制檢索式使用邏輯算符(AND,OR,NOT)、截詞、位置算符,限制檢索條件至作者,刊物或年代.調(diào)整其他設(shè)定:選定檢索結(jié)果的顯示方式–日期,相關(guān)度等排序

4進(jìn)行檢索可利用數(shù)據(jù)庫(kù)提供的不同級(jí)別的檢索界面進(jìn)行檢索

--初級(jí)檢索--高級(jí)檢索5分析檢索結(jié)果調(diào)整檢索策略不滿意滿意不滿意–非目標(biāo)的結(jié)果

檢查檢索名詞的拼寫

增加檢索名詞的準(zhǔn)確性-查閱工具如詞表,字典,分類表及字彙表,刪除誤導(dǎo)的名詞審查被檢索的數(shù)據(jù)庫(kù)–查閱數(shù)據(jù)庫(kù)之說(shuō)明及期刊列表以確定是否覆蓋你所要的主題

→重新檢索

不滿意–

結(jié)果太多設(shè)限制條件至特定欄位及年代

增加檢索名詞的準(zhǔn)確性-查閱工具如詞表,字典,分類表及字彙表增加檢索策略的準(zhǔn)確性–增加使用

ANDs;減少使用

ORs

→重新檢索

不滿意–

結(jié)果太少檢查檢索名詞的併字

增加檢索名詞的普遍性-查閱工具如詞表,字典,分類表及字彙表擴(kuò)闊檢索策略–減少使用ANDs;使用Ors於同義字及替代拼字上

增加被檢索的數(shù)據(jù)庫(kù)–確定其他數(shù)據(jù)庫(kù)是否覆蓋你所要的主題

→重新檢索

滿意是否已全獲取所需?打印、Email或存盤需否取得題錄錄相關(guān)的全文?

連接全文工具或通過(guò)全文服務(wù)6跟進(jìn)檢索

◆查看適當(dāng)?shù)念}錄以查找其他有關(guān)的文獻(xiàn)及檢索方式

◆查看名詞索引從而定出與己找得的文章相關(guān)的額外檢索名詞

◆進(jìn)行作者檢索以找出其合著者◆查看文章參考目錄以找出相關(guān)文章(追溯法)計(jì)算機(jī)檢索常用算符1、布爾邏輯運(yùn)算符常用的邏輯運(yùn)算有三種:與、或、非。

邏輯與:機(jī)檢的輸入符號(hào)為“*”或“and”。如:A*B邏輯或:機(jī)檢輸入符號(hào)為“+”或“or”。如:A+B邏輯非:機(jī)檢的輸入符號(hào)為“-”或“not”,如:A-B“與”算符andAND*“與”算符用于描述概念間的交叉關(guān)系和限定關(guān)系。含義:檢出文獻(xiàn)中必須同時(shí)包含被其連接的所有詞或詞組。作用:縮小檢索范圍,提高查準(zhǔn)率。例如:concretedamsandarchdamspowerplantsanddesign“或”算符orOR+“或”算符可描述概念間的并列關(guān)系和相關(guān)關(guān)系,用來(lái)組配同義詞或相關(guān)詞等。含義:檢出文獻(xiàn)中包含有被其連接的任意一個(gè)詞或詞組。作用:擴(kuò)大檢索范圍,提高查全率。例如:damsorhydraulicstructureCADorcomputeraideddesign“非”算符notNOT-“非”算符用于描述概念間的排斥關(guān)系和特殊限定關(guān)系。含義:檢出文獻(xiàn)中必須包含這個(gè)算符前的詞,必須不含這個(gè)算符后的詞。作用:縮小檢索范圍,提高查準(zhǔn)率。例如:energynotnuclear2、截詞符(?或*)也叫通配符或字符替代符,利用其保留檢索詞中的相同部分,允許檢索詞有一定范圍的變化,提高文獻(xiàn)的查全率。

如:comput*(computer、computerscomputing)dam*(dam,dams)3、位置算符

又稱為鄰近度算符。文獻(xiàn)中詞語(yǔ)的相對(duì)次序或位置不同,所表達(dá)的含義可能有所不同,而同樣一個(gè)檢索式中詞語(yǔ)的相對(duì)次序不同,其表達(dá)的檢索意圖也不一樣。位置算符的作用是對(duì)用作檢索詞的詞組或短語(yǔ)中的各個(gè)單詞之間的相對(duì)位置進(jìn)行描述。常用的有(W)算符、(ADJ)算符、(N)算符等。如steel(w)pipe表示steelpipe

而不是pipesteel又如computer(n)application

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論