版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
信息檢索與應(yīng)用根底知識信息檢索與應(yīng)用根底知識信息檢索與應(yīng)用根底知識內(nèi)容提要第一頁,共41頁。內(nèi)容提要第二頁,共41頁。信息的定義信息:是客觀事物存在的方式或運動狀態(tài),以及關(guān)于客觀
存在方式或運動狀態(tài)的陳述。知識:知識是人們對客觀事物存在和運動規(guī)律的認(rèn)識。文獻:任何人類的知識用文字、圖形、符號、聲頻、視頻
的手段記錄下來的東西。統(tǒng)統(tǒng)可稱為文獻。
文獻也可稱為固化在一定載體上的知識。第三頁,共41頁。信息、文獻、知識之間的聯(lián)系第四頁,共41頁。第五頁,共41頁。信息檢索的定義信息檢索〔InformationRetrieval〕廣義:將信息按一定的方式組織和存儲起來,并根據(jù)用戶的需要找出有關(guān)信息的過程和技術(shù)。全稱“信息存儲與檢索〞〔InformationStorageandRetrieval〕。狹義:從信息集合中找出所需要的信息的過程。又相當(dāng)于“信息查尋〞〔InformationSearch〕。第六頁,共41頁。第七頁,共41頁。信息級別第八頁,共41頁。一次信息二次信息三次信息知識產(chǎn)生記錄檔案學(xué)位論文標(biāo)準(zhǔn)科技報告專利說明書會議論文期刊論文專著目錄索引文摘傳播信息利用述評綜述詞典年鑒手冊百科全書第九頁,共41頁。內(nèi)容提要第十頁,共41頁。信息檢索語言的定義信息檢索語言:是應(yīng)文獻信息的加工、存貯和檢索的共同需要而編制的專門語言,它是表達(dá)一系列概括文獻信息內(nèi)容和檢索課題內(nèi)容的概念及其相互關(guān)系的一種概念標(biāo)識系統(tǒng)。是一種人工語言。有分類檢索語言和主題檢索語言兩種。第十一頁,共41頁。分類檢索語言〔以?中圖法?為例〕中圖法五個部類:馬克思主義、列寧思想、毛澤東思想;哲學(xué);社會科學(xué);自然科學(xué);綜合性圖書。22個大類〔一級類目〕采用字母與數(shù)字相結(jié)合的方式編制第十二頁,共41頁。建議總結(jié)Proposals?中圖法?第十三頁,共41頁。主題檢索語言主題檢索語言:關(guān)鍵詞檢索語言和標(biāo)題詞檢索語言。關(guān)鍵詞檢索語言:關(guān)鍵詞是指那些出現(xiàn)在文獻的標(biāo)題〔篇名、章節(jié)名〕以及摘要、正文中,對表征文獻主題內(nèi)容具有實質(zhì)檢索意義的詞,亦即對提醒和描述主題內(nèi)容來說是重要的、帶關(guān)鍵性的可以作為檢索“入口〞的那些詞。標(biāo)題詞檢索語言:標(biāo)題詞是指表征文獻內(nèi)容特征的、經(jīng)過標(biāo)準(zhǔn)化了的名詞術(shù)語〔包括詞組和短語〕。標(biāo)題詞語言是先組式檢索語言,組配固定,不易混亂,標(biāo)題詞表是標(biāo)題詞及其使用規(guī)那么的匯編,是一部標(biāo)題詞詞典。第十四頁,共41頁。內(nèi)容提要第十五頁,共41頁。信息檢索工具信息檢索工具是根據(jù)某種信息需要而按照一定的規(guī)那么組織編制的工具或系統(tǒng)。傳統(tǒng)的信息檢索工具如字典、百科全書、文摘、書目、索引等,現(xiàn)在流行的檢索工具如數(shù)據(jù)庫、搜索引擎、專業(yè)性網(wǎng)站等。具備的4個條件:1.對所收錄信息的各種特征要有詳細(xì)的描述;2.每條描述記錄都標(biāo)明有可供檢索用的標(biāo)識;3.全部描述記錄科學(xué)地組織成一個有機的整體;4.具有多種必要的檢索手段。第十六頁,共41頁。信息檢索工具的分類按著錄信息特征分第十七頁,共41頁。目錄型檢索工具一切可供檢索使用的目錄均可稱為目錄型檢索工具。它主要報道信息的外表特征,著錄具體出版事宜及其收藏信息。常見的目錄按其收錄范圍可以分為國家目錄、聯(lián)合目錄、館藏目錄;按報道的范圍分為綜合性目錄和專題性目錄。第十八頁,共41頁。索引型檢索工具將信息的外部特征或內(nèi)部特征(例如題名、著者、主題、分類等)用各種檢索語言進展描述,并將它們按照一定的方法組織起來,用戶根據(jù)查處的線索可以進一步查找原始信息內(nèi)容的工具。索引與目錄的區(qū)別在于它不僅能提醒信息的外部特征,還能提醒信息的內(nèi)部特征。常見的索引有主題索引、分類索引和關(guān)鍵詞索引。第十九頁,共41頁。文摘型檢索工具文摘一般由題錄和內(nèi)容摘要兩局部組成,它在描述信息外部特征的根底上,還增加有提醒內(nèi)容特征的摘要局部,是系統(tǒng)地報道、積累和檢索信息的主要檢索工具,也是傳統(tǒng)檢索工具的核心。按文摘的目的和用途劃分,它可以分為報道性文摘、指示性文摘、報道—指示性文摘和評論性文摘。第二十頁,共41頁。數(shù)據(jù)庫數(shù)據(jù)庫包括目錄、索引、文摘、搜索引擎等工具的內(nèi)容,但是由于其組織的特殊性,也可以認(rèn)為是一種檢索工具。第二十一頁,共41頁。參考工具書參考工具書是分析和著錄大量具體而常用的科學(xué)數(shù)據(jù)庫與事實以備查用的各種常用工具書的總稱。其中包括字典、詞典、年鑒、百科全書、指南、手冊、名錄等。第二十二頁,共41頁。搜索引擎將網(wǎng)絡(luò)信息分門別類地組織起來,通過搜索網(wǎng)址的方式來實現(xiàn)信息檢索的工具就是搜索引擎。它是一種網(wǎng)絡(luò)檢索工具,檢索到的既可以是一般的信息線索,也可以是原始信息全文,既可以是一般的文本信息,也可以是多媒體信息。第二十三頁,共41頁。信息檢索工具的分類按收錄范圍分第二十四頁,共41頁。綜合性檢索工具收錄的學(xué)科范圍較廣,涉及的信息種類和語種也比較多。例如,美國的?工程索引??Ei?第二十五頁,共41頁。專業(yè)性檢索工具收錄的學(xué)科范圍比較窄,僅限于報道某學(xué)科或?qū)I(yè)的信息,但收錄該學(xué)科信息的類型比較全。例如,美國的化學(xué)學(xué)會電子期刊數(shù)據(jù)庫——ACS第二十六頁,共41頁。單一性檢索工具指收錄的文獻類型比較單一,文獻的著錄格式也標(biāo)準(zhǔn)、標(biāo)準(zhǔn)。例如?中國專利公報?,就是典型的單一性檢索工具,它僅僅收錄單一的文獻類型——專利文獻,著錄格式簡單標(biāo)準(zhǔn),易于查找。第二十七頁,共41頁。內(nèi)容提要第二十八頁,共41頁。信息檢索途徑第二十九頁,共41頁。內(nèi)部特征途徑分類途徑:按學(xué)科分類體系來檢索文獻。主題途徑:通過反映文獻資料內(nèi)容的主題詞來檢索文獻。第三十頁,共41頁。外部特征途徑題名途徑:題名包括書名、刊名等。著者途徑:從著者、編者、譯者、專利權(quán)人的姓名或機關(guān)團體名稱字順進展檢索的途徑統(tǒng)稱為著者途徑。引文途徑:文獻所附參考文獻或引用文獻,是文獻的外表特征之一。利用這種引文而編制的索引系統(tǒng),稱為引文索引系統(tǒng),它提供從被引論文去檢索引用論文的一種途徑,稱為引文途徑。序號途徑:有些文獻有特定的序號,如專利號、報告號、合同號、標(biāo)準(zhǔn)號、國際標(biāo)準(zhǔn)書號和刊號等。文獻序號對于識別一定的文獻,具有明確、簡短、唯一性特點。依此編成的各種序號索引可以提供按序號自身順序檢索文獻信息的途徑。代碼途徑:利用事物的某種代碼編成的索引,如分子式索引、環(huán)系索引等,可以從特定代碼順序進展檢索。第三十一頁,共41頁。內(nèi)容提要第三十二頁,共41頁。信息檢索技術(shù)布爾邏輯檢索技術(shù):指利用布爾邏輯運算符連接各個檢索詞,然后由計算機進展相應(yīng)邏輯運算,以找出所需信息的方法。截詞檢索技術(shù):截詞是指在檢索詞的適宜位置進展截斷,然后使用截詞符進展處理,這樣既可節(jié)省輸入的字符數(shù)目,又可到達(dá)較高的查全率。第三十三頁,共41頁。布爾邏輯檢索技術(shù)邏輯與“AND〞和“*〞用"AND"和"*"表示??捎脕肀硎酒渌B接的兩個檢索項的穿插局部,也即交集局部。如果用AND連接檢索詞A和檢索詞B,那么檢索式為:AANDB(或A*B):表示讓系統(tǒng)檢索同時包含檢索詞A和檢索詞B的信息集合C。第三十四頁,共41頁。布爾邏輯檢索技術(shù)邏輯或“OR〞和“+〞用"OR"或"+"表示。用于連接并列關(guān)系的檢索詞。用OR連接檢索詞A和檢索詞B,那么檢索式為:AORB或(A+B)。表示讓系統(tǒng)查找含有檢索詞A、B之一,或同時包括檢索詞A和檢索詞B的信息。第三十五頁,共41頁。布爾邏輯檢索技術(shù)邏輯非“NOT〞和“–〞用"NOT"或"-"號表示。用于連接排除關(guān)系的檢索詞,即排除不需要的和影響檢索結(jié)果的概念。用NOT連接檢索詞A和檢索詞B,檢索式為:ANOTB(或A-B)。表示檢索含有檢索詞A而不含檢索詞B的信息,即將包含檢索詞B的信息集合排除掉。第三十六頁,共41頁。截詞檢索技術(shù)截詞算符在不同的系統(tǒng)中有不同的表達(dá)形式,需要說明的是不同的系統(tǒng)所用的截詞符也不同,常用的有?、$、*等。分為有限截詞〔即一個截詞符只代表一個字符〕和無限截詞〔一個截詞符可代表多個字符〕。第三十七頁,共41頁。截詞檢索技術(shù)—無限截詞舉例前截斷:前方一致。如:?computer表示minicomputer,microcomputer等。中截斷:中間一致。如?comput?表示minicomputer,microcomputers等后截斷:前方一致。如:comput?表示computer,computers,computing等第三十八頁,共41頁。短語檢索技術(shù)短語檢索又叫“準(zhǔn)確檢索〞,用雙引號“〞表示,要求檢索出來的表現(xiàn)形式和輸入的表現(xiàn)形式完全一致。一般在以下情況下使用:1、機構(gòu)名稱
2、人名
3、地名
4、專業(yè)名稱第三十九頁,共4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年滬教版八年級生物上冊階段測試試卷含答案
- 2025年滬教新版八年級地理上冊月考試卷
- 二零二五版毛石擋土墻施工期風(fēng)險評估與應(yīng)急預(yù)案合同4篇
- 2025年中圖版七年級地理下冊月考試卷
- 2025年華東師大版四年級數(shù)學(xué)上冊階段測試試卷含答案
- 2025年人教版PEP二年級英語上冊階段測試試卷
- 2025年浙教版九年級化學(xué)下冊階段測試試卷含答案
- 2025年人教新起點七年級地理下冊階段測試試卷含答案
- 二零二五年度美發(fā)店環(huán)保材料股份投資合同4篇
- 2025年度拆除工程合同(含竣工交付與驗收)4篇
- 中國華能集團公司風(fēng)力發(fā)電場運行導(dǎo)則(馬晉輝20231.1.13)
- 中考語文非連續(xù)性文本閱讀10篇專項練習(xí)及答案
- 2022-2023學(xué)年度六年級數(shù)學(xué)(上冊)寒假作業(yè)【每日一練】
- 法人不承擔(dān)責(zé)任協(xié)議書(3篇)
- 電工工具報價單
- 反歧視程序文件
- 油氣藏類型、典型的相圖特征和識別實例
- 流體靜力學(xué)課件
- 顧客忠誠度論文
- 實驗室安全檢查自查表
- 證券公司績效考核管理辦法
評論
0/150
提交評論