版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
計算機檢索原理與檢索方法計算機檢索原理信息檢索原理信息檢索實質(zhì)上包括信息存貯和信息檢索兩個過程:信息存貯過程是依據(jù)檢索語言對原始信息進行處理和標引,形成信息特征標識,為檢索提供經(jīng)過整序的信息集合的過程。信息檢索是參照檢索語言體系對檢索課題進行分析,形成檢索提問標識,從信息集合中檢出相關(guān)文獻信息的過程。信息檢索原理原始信息信息分析、著錄和標引信息檢索系統(tǒng)信息檢索原理圖檢索課題課題分析檢索語言檢索結(jié)果信息存貯信息檢索提問標識標引標識信息檢索的實質(zhì)
檢索提問標識與存貯在檢索系統(tǒng)中的標引標識進行比較,兩者一致或信息標引的標識包含著檢索提問標識,則具有該標識的文獻信息就從檢索系統(tǒng)中輸出,輸出的文獻信息就是檢索命中的信息。檢索語言概念為了使檢索的過程,即信息的標引標識和檢索的提問用語的對比進行順利,兩者都需要用一定的語言來表達。這就是檢索語言。作用把信息的存貯和檢索聯(lián)系起來,以保證檢索和存貯的一致性,使文獻的標引者和檢索者取得共同理解,從而實現(xiàn)信息檢索。檢索語言的種類
--按描述文獻特征的不同劃分1描述文獻外表特征的檢索語言
如文章題名、作者姓名、語種、刊名等2描述文獻內(nèi)容特征的檢索語言
包括分類語言和主題語言。檢索語言的種類-按加工程度劃分1人工語言
主要有分類語言和主題語言2自然語言如關(guān)鍵詞分類語言類是許多具有共同屬性事物的集合。分類語言是以科學分類為基礎(chǔ),運用概念劃分的方法,對人類知識進行區(qū)分與類集。分類語言是用分類號來表達學科體系的各種概念,將各種概念按學科性質(zhì)進行分類和系統(tǒng)排列。如“網(wǎng)絡瀏覽器”TP393.092常用的分類語言《中國圖書館圖書分類法》即中圖法是我國文獻分類標引工作的國家標準《中國科學院圖書館圖書分類法》即科圖法《國際十進分類法》主題語言主題語言是一種描述性語言,直接用語詞表達文獻的主題,這些語詞就是表達主題概念的標識。將這些用作標識的語詞按字順排列并使用參照系統(tǒng)來間接表達各種概念之間的關(guān)系的檢索語言就是主題語言。信息檢索的類型信息檢索的類型
—按檢索對象分①數(shù)值檢索
特征:以特定的數(shù)值為檢索對象。比如,查找某一統(tǒng)計數(shù)據(jù),某一數(shù)學公式,某一材料的成分、性能,某種元件的型號、參數(shù)等。解決方案:利用手冊、年鑒等參考工具書或數(shù)值型數(shù)據(jù)庫來檢索。
②事實檢索特征:以特定的事實為檢索對象。比如,查找名詞術(shù)語的解釋,了解某人或某機構(gòu)的簡況,或考證某一事件發(fā)生的前因后果等。解決方案:利用辭典、百科全書、年鑒、名錄等參考工具書或事實型數(shù)據(jù)庫來檢索。③文獻檢索特征:以特定的文獻為檢索對象。比如,查找有關(guān)某一研究課題的一定年限內(nèi)的相關(guān)文獻,或從事一項發(fā)明創(chuàng)造而需要文獻查新等。解決方案:利用文摘、題錄等各種手檢工具書或書目文獻型數(shù)據(jù)庫來檢索。信息檢索的類型
—按檢索手段分手工檢索計算機檢索--光盤檢索--聯(lián)機檢索--網(wǎng)絡檢索計算機檢索的條件硬件
計算機及存貯、打印設備軟件
信息系統(tǒng)(數(shù)據(jù)庫)及檢索軟件通訊設備
網(wǎng)卡、網(wǎng)線等信息使用權(quán)
大型商業(yè)數(shù)據(jù)庫系統(tǒng)是有償使用的,有些學術(shù)團體內(nèi)部的信息資源僅限其認可的成員使用,需要簽訂協(xié)議獲得使用權(quán)數(shù)據(jù)庫及其類型數(shù)據(jù)庫是在計算機存貯設備上按一定方式存儲的相互關(guān)聯(lián)的數(shù)據(jù)集合。是信息檢索的重要資料來源。按照載體的不同,可分為
--聯(lián)機數(shù)據(jù)庫--光盤數(shù)據(jù)庫--網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)庫類型—按內(nèi)容和功能劃分書目型數(shù)據(jù)庫
以文檔的形式組織起來,提供文獻的題錄、文摘等書目信息。全文型數(shù)據(jù)庫
存儲文獻全文或其中的主要部分的源數(shù)據(jù)庫。指南型數(shù)據(jù)庫
供查詢某一客體的基本信息或簡況,包括名錄、傳記等數(shù)據(jù)庫。數(shù)值型數(shù)據(jù)庫
提供各類數(shù)值型數(shù)據(jù)圖象數(shù)據(jù)庫
以圖形、圖象為記錄單位數(shù)據(jù)庫類型—按收錄專業(yè)范圍劃分綜合性數(shù)據(jù)庫
收錄多個學科或?qū)I(yè)的信息資料。如中國期刊網(wǎng)專業(yè)性數(shù)據(jù)庫
收錄單一學科或?qū)I(yè)的信息資料。專題性數(shù)據(jù)庫收錄某一特定專題的信息資料數(shù)據(jù)庫的結(jié)構(gòu)—字段、記錄和文檔字段:文獻著錄的基本單元,反映文獻外部特征和內(nèi)容特征的每一項目,在數(shù)據(jù)庫中就稱為字段。如:題名、作者?;咀侄危好枋鑫墨I的內(nèi)容特征。如:關(guān)鍵詞KW、題名TI、文摘AB、全文等輔助字段:描述文獻的外部特征。如:作者AU、刊名JN、出版時間PY、語種LA等記錄:
由若干不同字段組成的文獻單元,一條記錄在數(shù)據(jù)庫中代表一篇文獻。數(shù)據(jù)庫(文檔):
由若干數(shù)量的記錄構(gòu)成的數(shù)據(jù)的集合。大型的數(shù)據(jù)庫檢索系統(tǒng)中稱為文檔。中國期刊網(wǎng)字段示例可檢索字段
計算機信息檢索方法檢索流程1、分析課題的內(nèi)容◆明確需要查找那一方面的文獻;◆對文獻的類型、時間、語種等要求;2、選定數(shù)據(jù)庫◆查明數(shù)據(jù)庫所覆蓋主題範圍
◆查閱數(shù)據(jù)庫是否收錄適當之文獻類型
◆查看數(shù)據(jù)庫之詳細介紹及說明
◆請教你的圖書館員,要求介紹開始檢索之最佳數(shù)據(jù)庫
最好選擇幾個輔助或擴充備用數(shù)據(jù)庫。3、確定檢索詞,編制檢索式選定檢索詞利用上下位詞或特有名詞及同義詞、近義詞、相關(guān)詞,查閱工具如專業(yè)詞典,字典,分類表等.編制檢索式使用邏輯算符(AND,OR,NOT)、截詞、位置算符,限制檢索條件至作者,刊物或年代.調(diào)整其他設定:選定檢索結(jié)果的顯示方式–日期,相關(guān)度等排序
4進行檢索可利用數(shù)據(jù)庫提供的不同級別的檢索界面進行檢索
--初級檢索--高級檢索5分析檢索結(jié)果調(diào)整檢索策略不滿意滿意不滿意–非目標的結(jié)果
檢查檢索名詞的拼寫
增加檢索名詞的準確性-查閱工具如詞表,字典,分類表及字彙表,刪除誤導的名詞審查被檢索的數(shù)據(jù)庫–查閱數(shù)據(jù)庫之說明及期刊列表以確定是否覆蓋你所要的主題
→重新檢索
不滿意–
結(jié)果太多設限制條件至特定欄位及年代
增加檢索名詞的準確性-查閱工具如詞表,字典,分類表及字彙表增加檢索策略的準確性–增加使用
ANDs;減少使用
ORs
→重新檢索
不滿意–
結(jié)果太少檢查檢索名詞的併字
增加檢索名詞的普遍性-查閱工具如詞表,字典,分類表及字彙表擴闊檢索策略–減少使用ANDs;使用Ors於同義字及替代拼字上
增加被檢索的數(shù)據(jù)庫–確定其他數(shù)據(jù)庫是否覆蓋你所要的主題
→重新檢索
滿意是否已全獲取所需?打印、Email或存盤需否取得題錄錄相關(guān)的全文?
連接全文工具或通過全文服務6跟進檢索
◆查看適當?shù)念}錄以查找其他有關(guān)的文獻及檢索方式
◆查看名詞索引從而定出與己找得的文章相關(guān)的額外檢索名詞
◆進行作者檢索以找出其合著者◆查看文章參考目錄以找出相關(guān)文章(追溯法)計算機檢索常用算符1、布爾邏輯運算符常用的邏輯運算有三種:與、或、非。
邏輯與:機檢的輸入符號為“*”或“and”。如:A*B邏輯或:機檢輸入符號為“+”或“or”。如:A+B邏輯非:機檢的輸入符號為“-”或“not”,如:A-B“與”算符andAND*“與”算符用于描述概念間的交叉關(guān)系和限定關(guān)系。含義:檢出文獻中必須同時包含被其連接的所有詞或詞組。作用:縮小檢索范圍,提高查準率。例如:concretedamsandarchdamspowerplantsanddesign“或”算符orOR+“或”算符可描述概念間的并列關(guān)系和相關(guān)關(guān)系,用來組配同義詞或相關(guān)詞等。含義:檢出文獻中包含有被其連接的任意一個詞或詞組。作用:擴大檢索范圍,提高查全率。例如:damsorhydraulicstructureCADorcomputeraideddesign“非”算符notNOT-“非”算符用于描述概念間的排斥關(guān)系和特殊限定關(guān)系。含義:檢出文獻中必須包含這個算符前的詞,必須不含這個算符后的詞。作用:縮小檢索范圍,提高查準率。例如:energynotnuclear2、截詞符(?或*)也叫通配符或字符替代符,利用其保留檢索詞中的相同部分,允許檢索詞有一定范圍的變化,提高文獻的查全率。
如:comput*(computer、computerscomputing)dam*(dam,dams)3、位置算符
又稱為鄰近度算符。文獻中詞語的相對次序或位置不同,所表達的含義可能有所不同,而同樣一個檢索式中詞語的相對次序不同,其表達的檢索意圖也不一樣。位置算符的作用是對用作檢索詞的詞組或短語中的各個單詞之間的相對位置進行描述。常用的有(W)算符、(ADJ)算符、(N)算符等。如steel(w)pipe表示steelpipe
而不是pipesteel又如computer(n)application
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025中國移動黑龍江公司校園招聘高頻重點提升(共500題)附帶答案詳解
- 商務、清洗服務行業(yè)相關(guān)投資計劃提議
- 2025中國電建集團武漢重工裝備限公司招聘14人高頻重點提升(共500題)附帶答案詳解
- 2025中國電信湖北神農(nóng)架林區(qū)招聘7人高頻重點提升(共500題)附帶答案詳解
- 2025中國建筑股份限公司海拓工程分公司校園招聘高頻重點提升(共500題)附帶答案詳解
- 2025中國華西企業(yè)限公司招聘221人高頻重點提升(共500題)附帶答案詳解
- 2025中共中山市委黨校第六期招聘高層次人才9人(2025年)高頻重點提升(共500題)附帶答案詳解
- 2025下半年陜西延安市事業(yè)單位招聘工作人員385人高頻重點提升(共500題)附帶答案詳解
- 2025下半年山東高速基礎(chǔ)設施建設限公司社會招聘6人高頻重點提升(共500題)附帶答案詳解
- 2025上海徐匯市場監(jiān)督管理局招聘派遣制工作人員15人歷年高頻重點提升(共500題)附帶答案詳解
- 220kv升壓站質(zhì)量評估報告
- 4-72系列風機使用說明書
- 運籌學課程設計
- 花鍵跨棒距的計算
- 國家開放大學《C語言程序設計》形考任務1-4參考答案
- 北京市海淀區(qū)2021-2022學年七年級上學期期末考試語文試卷(word版含答案)
- (完整版)會計準則(全文)
- 低濃度顆粒物的測定重量法方法驗證報告
- 百家姓全文拼音版A4打印
- 日本簽證在職證明
- IPC標準解析學習課程
評論
0/150
提交評論