版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、檔案信息檢索講堂錄精簡版復(fù)習說明考試重點如檔案分類表、主題詞表、計算機檢索、搜索引擎、檢索工具等。步驟、方法、原則之類的簡答題。四角號碼,15個字/15分。分類法和主題詞的應(yīng)用題。課件為主,教材為輔。目錄一、基本術(shù)語二、類型簡述三、原則簡述四、步驟概述五、檢索工具六、檢索方法七、檔案信息計算機檢索八、聯(lián)機檢索系統(tǒng)九、常用網(wǎng)絡(luò)檢索工具十、中國檔案分類法介紹(P22)十一、中國檔案主題詞表的結(jié)構(gòu)和使用(P30)十二、其他知識點一、基本術(shù)語正規(guī)文獻:指公開出版的文獻,如圖書、期刊、報紙、政府出版物。政府出版物,又稱官方出版物。由政府機構(gòu)出版或編輯,并由其所指定的出版商出版的文獻,如報告、公告、國家統(tǒng)
2、計資料、地圖、機關(guān)指南等。非正規(guī)文獻:又稱內(nèi)部文獻,限制流通的文獻,國外也稱“灰色信息”,指不公開出版,通過正規(guī)渠道難以獲得的有重要價值的文獻。如會議文獻,學位論文,檔案文獻等。信息檢索:是將信息按照一定方式存儲起來后,用科學的方法,利用檢索工具為用戶檢索、揭示和傳遞信息的過程。一般有信息整序和信息檢索兩部分構(gòu)成。檢索語言:它是依據(jù)一定的規(guī)則對自然語言進行規(guī)范,將其編織成表,專門用于各種較為規(guī)范的文獻和數(shù)字化的文獻信息存儲和檢索,并提供信息標引的語言系統(tǒng)。分類檢索語言:將表示各種知識領(lǐng)域的類目按照知識分類原理進行系統(tǒng)排列并以數(shù)字、字母等符號作為標志的檢索語言,也稱分類法。分類檢索語言的具體表現(xiàn)
3、形式是分類表。主題詞:表達文獻主題概念的詞叫主題詞。我國圖書情報界通常把主題詞也成作“敘詞”,廣義的主題詞有時也包括關(guān)鍵詞。(是將自然語言中的名詞術(shù)語經(jīng)過規(guī)范化處理后直接作為文獻標志的檢索語言,因此又稱“主題檢索語言”)關(guān)鍵詞:從文獻題名、文摘和正文中抽出,不做規(guī)范化或只作少量規(guī)范化處理,具有實際意義的詞語。主題法:它是將自然語言中的名詞術(shù)語經(jīng)過規(guī)范化后直接作為文獻標志的檢索語言(詞匯),也稱“主題檢索語言”。(就是以自然語言詞匯為基礎(chǔ),以規(guī)范化的主題詞作為檢索標志的文獻標引與檢索方法。)款目主題詞:指列于標目位置的主題詞,依照首字音序、音調(diào),結(jié)合漢字字形筆畫排列,首字相同者依第二字音序、調(diào)序
4、、字形筆畫排列,以此類推。非漢字字符起首的主題詞,一律排在漢語拼音音序之前。范疇號:是款目主題詞的范疇分類類目代號,標識在款目主題詞的右側(cè)。借助范疇號可以在范疇索引中查詢與該主題詞同屬一類的有關(guān)主題詞。詞間關(guān)系:又稱參照系統(tǒng),是用來說明與款目主題詞發(fā)生關(guān)系的一些詞,其中包括等同關(guān)系、屬分關(guān)系、相關(guān)關(guān)系等。范疇索引:亦稱分類索引,即將全部主題詞按范疇號分成若干大小類目排列編制而成,與住標間由“范疇號”加以聯(lián)系。詞族索引:也稱族系索引,等級索引,它是將主表中具有分屬關(guān)系,相關(guān)關(guān)系的正式主題詞按其本質(zhì)屬性展開顯示的一種詞族關(guān)系。檔案著錄:是在編制檔案檢索工具時對檔案內(nèi)容和形式及各種特征加以分析、選擇
5、和記錄的過程。檔案標引:是在檔案著錄工作中對檔案的內(nèi)容和主題進行分析和選擇,通過概念轉(zhuǎn)換賦予其規(guī)范化的檢索語言的過程。其中,賦予著錄檔案分類號的過程稱為分類標引,賦予著錄檔案主題詞的過程稱為主題標引。查全率:衡量滿足需求的全面程度,通過檢出的有關(guān)問題檔案數(shù)量與關(guān)于該問題在同一保存地點(或數(shù)據(jù)庫中)的全部保存數(shù)量的百分比來計算。查準率:衡量滿足需求的準確程度,通過檢出的有關(guān)內(nèi)容準確的檔案數(shù)量衡量與關(guān)于該問題檢出的全部檔案數(shù)量的百分比來計算。電子文件著錄:是對電子文件在形成過程中以及形成后所具有的各種特征的準確描述和記錄。元數(shù)據(jù):是描述電子文件內(nèi)容、結(jié)構(gòu)、背景信息機整個管理流程,又能夠被計算機一網(wǎng)
6、絡(luò)系統(tǒng)自動辨別、分解、提取和分析歸納的數(shù)據(jù)。檔案信息計算機檢索:人們在計算機或計算機檢索網(wǎng)絡(luò)的終端機上,使用特定的檢索指令、檢索詞和檢索策略,從計算機檢索系統(tǒng)的數(shù)據(jù)庫中檢出所需的信息,繼而再由終端設(shè)備顯示的過程。21.檔案信息:即檔案中記載的內(nèi)容,它是社會組織或個人在以往社會實踐活動中直接形成的。具有清晰、明確含義、被固定在各種載體上的原始記錄。22整序:指按照檔案信息的來源、學科分類、主題詞或其他方式對檔案信息進行組織排序,形成檢索工具或檢索系統(tǒng)的過程。一般包括實體整序和內(nèi)容整序。23檢索:根據(jù)用戶需要,利用檢索工具或檢索系統(tǒng),從經(jīng)過整序的信息集合中查出所需信息的過程,也是完成信息傳遞的過程
7、。24物理和智能格式:這是電子文件不同于紙質(zhì)文件的特殊著錄項目。物理格式是指決定文件外觀的相關(guān)內(nèi)容,如字體、顏色、語種、插入符、數(shù)字簽字、時間等;智能格式是指決定文件形成過程以及管理背景的相關(guān)內(nèi)容,如文本類型、圖例、圖像、格式、文件各部分內(nèi)容排列順序、注釋等25檢索效率:是指在檢索工程中,依據(jù)用戶需求檢出結(jié)果的全面性和準確性的程序,它是衡量檔案檢索系統(tǒng)以及每一個檢索過程質(zhì)量高低最基本指標,它通過“查全率”和“查準率”反映出來。二、類型簡述檔案信息類型(P4)按檔案信息形成時間:歷史檔案信息和現(xiàn)行檔案信息。按檔案信息形成屬性:公務(wù)檔案信息和私人檔案信息。按檔案信息發(fā)揮作用:行政管理檔案信息、科技
8、檔案信息和專門檔案信息。按新中國成立前后時間:中華人民共和國成立后的檔案、革命歷史檔案、舊政權(quán)檔案。按檔案不同載體劃分:紙質(zhì)檔案、縮微檔案、視聽檔案、電子檔案等。信息檢索的類型四種類型:事實性檢索;專題性檢索;導向性檢索;綜合性檢索。事實性檢索包含數(shù)值數(shù)據(jù)檢索和非數(shù)值數(shù)據(jù)檢索。數(shù)值檢索:具有數(shù)量性質(zhì),并且以數(shù)值形式表示的量化信息的檢索。非數(shù)值數(shù)據(jù)檢索:對事實、概念、思想等信息的檢索。專題性檢索要求提供專題信息資料,根據(jù)特定的研究課題檢索所需的文獻。導向性檢索也稱“指引性”檢索,向用戶指引信息檢索的方向,如文獻藏所有關(guān)專家,服務(wù)機構(gòu)等,如檔案館指南。綜合性檢索一般包括政策咨詢和管理咨詢。政策咨詢
9、:為國家和地區(qū)的戰(zhàn)略性發(fā)展提供綜合研究資料和系統(tǒng)設(shè)計方案。管理咨詢:為有關(guān)部門或機構(gòu)提供管理信息,協(xié)助制定工作方案,提高管理水平。以上四中檢索類型中,事實性檢索和專題性檢索是檔案檢索的主體。檢索語言類型不同的檢索對象可以采用不同的檢索語言,如檢索文獻實體和檢索文獻內(nèi)容,有不同的檢索語言。檔案信息檢索中主要有全宗檢索語言、分類檢索語言(分類法)和主題檢索語言(主題法)專題信息檢索、人物檢索等。不同檔案檢索語言的檢索對象不同:全宗檢索的主要對象是檔案實體;分類法主要按照學科分類和邏輯聯(lián)系進行檔案信息檢索;主題法主要針對檔案信息的主題內(nèi)容進行檢索;人物檢索以人名為檢索入口。檔案著錄類型可分為案卷級,
10、即含一組案卷;和文件級,即含一組文件。案卷級的特點:以案卷為單位著錄成條目,數(shù)量較少,工作量較小,但不能具體揭示每一份文件的內(nèi)容和特征,檢索效果較差。文件級的特點:一份文件著錄一個條目,數(shù)量大,花費時間多,不易保管(手工)。但存儲的信息豐富,能揭示每份文件或幾份有關(guān)聯(lián)的文件的內(nèi)容和形式特征,具有較高的查全率和查準率,是今后計算機存儲和檢索的主要選擇。檢索工具的類型按體例分:目錄、索引、指南、文摘、匯編等;按組成形式分:書本式、卡片式;按載體形式分:紙質(zhì)載體、膠片縮微攝影、磁性載體(機讀式);按功能分:提供檢索線索工具、提供檔案全文工具;按檢索信息深度分:綜合介紹型工具、內(nèi)容查找型工具。三、原則
11、簡述中檔法編制原則分類法體系的建立,類目的設(shè)置和序列先后都力求做到具有思想性、科學性、邏輯性和實用性,充分反應(yīng)我國檔案的特點,適應(yīng)檔案利用的需要;分類法的體系和基本類目的設(shè)置,依照我國檔案的形成方式,以不同歷史時期的國家機構(gòu)、社會組織從事社會實踐活動的職能分工為基礎(chǔ),結(jié)合檔案內(nèi)容記述和反映事物屬性關(guān)系,采取從總到分,從一般到具體的邏輯體系了(圖書分類是按照學科屬性)分類法能夠包容各個歷史時期、各項社會會動所形成的各類檔案,力求保持基本類目的穩(wěn)定性,既能適用于現(xiàn)有的檔案分類需要,又能為今后檔案種類的增加和內(nèi)容的變化留有余地;分類法的類目名稱和標志符號力求準確、規(guī)范、簡明、易懂、好記,便于掌握和使
12、用。中國檔案主題詞表選詞原則和范圍選詞原則力求思想性、科學性和實用性的統(tǒng)一。 選用的主題詞符合漢語的結(jié)構(gòu)特點,詞形簡煉,概念明確,詞義簡單。選用的主題詞能夠反映綜合性檔案館和機關(guān)檔案室收藏檔案內(nèi)容的主題概念,在標引和檢索中具有實用價值和一定的使用頻率。選詞范圍時間范圍:主要選取20世紀初以來各類檔案中出現(xiàn)的詞語。內(nèi)容范圍:主要選擇反映黨、政府機關(guān)各項管理工作內(nèi)容的名詞。包括:黨政公文中經(jīng)常涉及到的政治活動、科學研究、生產(chǎn)技術(shù)、經(jīng)濟建設(shè)等方面的名詞術(shù)語,以及反映新事物概念的專用名詞。也選取一些專有詞或詞組,如民族、宗教、知名人士、職務(wù)、節(jié)日節(jié)令、科學名稱、文藝作品的泛稱(如古典小說、滬
13、劇、農(nóng)民畫等)電子文件著錄的基本原則P70(1)維護真實性原則真實性是檔案得以存在和受到保存的基本前提。電子文件的真實性是指文件內(nèi)容、結(jié)構(gòu)和背景信息經(jīng)過傳輸、遷移等處理后,直至轉(zhuǎn)化成電子檔案時與形成時的原始狀態(tài)應(yīng)保持一致。對電子文件進行著錄時,應(yīng)充分保證每一個著錄項所指向的內(nèi)容都是文件內(nèi)容真實反映。(2)保持完整性原則電子文件的完整性包括兩方面含義:一是文件數(shù)量要齊全,即作為記錄社會真實活動的,且具有有機聯(lián)系的電子文件及其他形式的相關(guān)文件數(shù)量要齊全;二是每一份電子文件的內(nèi)容、結(jié)構(gòu)和背景信息等基本構(gòu)成要素要完整,沒有缺損。(3)可讀性原則P71電子文件的可讀性是指文件經(jīng)過存儲、傳輸、壓縮、加密、
14、媒體轉(zhuǎn)換、遷移等處理后,能夠以人可以識讀、可以理解的方式輸出,并保持其內(nèi)容的真實性。(4)堅持前端控制原則前端控制是現(xiàn)代文件、檔案管理理念的重要內(nèi)容,它以文件生命周期理論為基礎(chǔ),把文件從形成到永久保存或銷毀的不同階段看做一個完整的過程。在這個過程中,文件的形成是前端,處理、鑒定、整理、編目等具體工作是中端,永久保存或銷毀是末端。四、步驟概述分類標引的步驟P56研讀中檔法 認真研讀中檔法是進行檔案分類標引的第一步,所有分類的標引結(jié)果都應(yīng)在中檔法中找到相對應(yīng)的類目,因此,標引人員在標引工作開始時, 首先應(yīng)全面系統(tǒng)地研讀中檔法的編制說明、主表、附表,了解該法的編制目
15、的、適用范圍、分類原則,全面熟悉該法的體系結(jié)構(gòu)、標識符號、類目注釋的具體內(nèi)容,辨清各類目上位類、同位類、下位類的關(guān)系,理解分類理論在實際應(yīng)用中的具體體現(xiàn),深入透徹掌握其使用方法。分析題名 文件和案卷的題名,是責任者或立卷人對檔案內(nèi)容的概括,在題名準確反映檔案的中心內(nèi)容的情況下,利用題名進行分類標引是最簡單和最常用的方法。還應(yīng)瀏覽正文,瀏覽正文就是通過分析題名不能確定檔案的確切內(nèi)容和類別時,應(yīng)瀏覽文件、案卷的正文。重點閱讀文頭、文尾、段落題名,了解作者的撰寫目的和意圖,從而確定檔案內(nèi)容論述或涉及的主題。分析檔案其他內(nèi)容 如立檔單位的性質(zhì)、職能和任務(wù)等,通過分析題名
16、、瀏覽正文、參考文件版頭和案卷封面。判定類別 進行內(nèi)容分析后,須確定對文件、案卷所論述的事物中,哪些內(nèi)容應(yīng)予以標引,能為利用者提供檢索途徑。然后根據(jù)內(nèi)容性質(zhì),到中檔法中查找其所屬的類目。標引分類號 就是用中檔法中的類號來表達檔案內(nèi)容的標引過程,也就是將判定的類別賦予分類標識。給予分類號,應(yīng)根據(jù)文件、案卷內(nèi)容的屬性、內(nèi)容多寡、起草意圖、利用對象檢索需求等特點,采用恰當?shù)姆绞胶头椒?,準確、一致、適度地標引出來。審校 審校是分類標引的最后一道程序,是確保標引質(zhì)量的最后關(guān)口。審校內(nèi)容包括檢查驗證檔案的內(nèi)容是否得到全面的分析,內(nèi)容判定是否準確、恰當,辨類是否準確
17、,同類檔案是否歸類一致,標引的類號是否充分、完整、準確,書寫是否正確無誤。審校程序分為自校、互校和總校。檔案主題標引的程序和方法1)閱讀檔案原件,了解主題內(nèi)容;2)分析主題,選定主題概念,主題類型可以有多主題和單主題;3)主題歸納、選定需要解釋和表達的主題;4)查表選詞,進行主題概念的轉(zhuǎn)換;5)校對審查,從思想性、專指性、規(guī)范性等方面所選主題詞進行審查,保證標引質(zhì)量。檢索步驟(一般分為六個步驟)P86檢索受理。接受用戶提出的檔案信息檢索要求。分析待檢檔案信息。1)分析待檢檔案類型:文獻類、事實類、人物檢索、機構(gòu)檢索、數(shù)據(jù)檢索和非數(shù)據(jù)檢索;2)分析待檢課題的學科性質(zhì)及相關(guān)知識;3)分析待檢課題對
18、檢索人員的要求(專業(yè)性要求);4)分析待檢標志,即那些標志可以作為檢索的入口,待檢檔案已知什么,還需要了解什么,并確定它們之間的關(guān)系;提煉檢索詞。即選擇檢索詞。如一般包括分類號、人物、時間、事實、地點、主題詞等??刹捎弥苯犹崛》ê烷g接概括法:1)直接提取法。直接從待檢檔案信息中選取檢索詞,如主題詞或關(guān)鍵詞;2)間接概括法。選用一個能概括待檢檔案信息主題的詞作為檢索詞。制定檢索策略。即確定檢索原則,確定檢索順序。1)檢索原則:盡可能利用各種檢索工具,由簡到繁、由易到難、由近到遠、由少到多。2)檢索順序:利用檢索工具順序四先四后:先查線索性的,后查資料性的;先查目錄、索引類,再查內(nèi)容概括類。檢索工
19、具如文摘、綜述、年鑒等;先查專科性的,后查綜合性的;先查常見的,后查罕見的;先查本地的,后查外地的。直接檢索文獻原文三先三后:先查概括的,后查專深的;先查現(xiàn)代的,后查歷史的;先查國內(nèi)的,后查國外的。實施檢索。根據(jù)已確定的檢索方案和檢索順序,以提煉出的檢索詞為目標,借助各種檢索工具實行檢索文獻的過程對檢索結(jié)果的處理。一般檢索結(jié)果有兩種:檔案信息的線索或檔案文獻本身。P891)檢索結(jié)果是線索時(非全文檢索)一般是利用目錄、索引等檢索工具完成的,應(yīng)完成以下工作:準確登記檔案線索的各項標志,一般包括:數(shù)據(jù)庫名、目錄名、索引名、全宗名、檔案標題、責任者和數(shù)據(jù)庫名等。2)檢出結(jié)果是文獻本身(載體)時一般是
20、利用數(shù)據(jù)庫、全文檢索、檔案匯編、資料性工具書等完成,應(yīng)著錄完成以下幾項工作:檔案出處(收藏者、檔號)、內(nèi)容摘要、摘錄人、摘錄時間、檔案責任者(形成者)、數(shù)據(jù)庫名和建庫時間、主題詞、分類號等。 統(tǒng)計當案檢索工作的效率指標檢索效率是指在檢索工程中,依據(jù)用戶需求檢出結(jié)果的全面性和準確性的程序,它是衡量檔案檢索系統(tǒng)以及每一個檢索過程質(zhì)量高低最基本指標,它通過“查全率”和“查準率”反映出來。檢索途徑:利用檔案信息檢索項完成檢索。一般包括:責任者、全宗名、主題詞、關(guān)鍵詞、文件標題、摘要、形成時間、序號(發(fā)文號、登記號)、文種、目錄、檔號等。當利用檔案數(shù)據(jù)庫進行
21、計算機檢索時,以上所有各項統(tǒng)稱“檢索項”所有檢索項都通過檔案外形特征和檔案內(nèi)容特征顯現(xiàn)出來:檔案外形特征 文件或案卷上記載的顯而易見的標志和特點,一般包括:責任者(形成者、全宗名)、序號、收發(fā)機關(guān)、形成時間、密級、保管期限、檔號等。其中,責任者途徑和序號是常用的方法。責任者途徑:責任者是指對文獻內(nèi)容負責的個人或團體:機構(gòu)名、機構(gòu)負責人名、編者、校點者、注釋者、譯者等。注意區(qū)分:一名多人、一人多名、筆名、室名等別稱。主要檢索工具:全總目錄、機構(gòu)目錄、人名索引、機構(gòu)名索引等。序號途徑:根據(jù)檔案文獻的序號特征來查找信息的途徑。檔案序號主要包括:期刊號、文件號(發(fā)文字號)、文件登
22、記號、標準號等。常用檢索工具:號碼目錄、號碼索引。序號方法使用的檢索號和檢索對象是一一對應(yīng)的,故多用于對檔案實體的檢索和查找。內(nèi)容特征 依據(jù)檔案信息所描述的內(nèi)容,涉及的事物所屬主題進行檢索。題名途徑:以文獻的名稱(全宗名、文件標題、文種)為線索查找檔案信息。題名途徑常用的檢索工具有:全總目錄、案卷目錄、卷內(nèi)文件目錄等。分類語言途徑:根據(jù)文獻所屬的學科體系來檢索信息,從古至今都是常用的檢索方法之一。常用檢索工具:檔案分類表。 主題語言途徑:以表達文獻主題的內(nèi)容的主題詞及其派生出的關(guān)鍵詞為標志的檢索信息的途徑。主要檢索工具:中國檔案主題詞表。 其他途徑:時間途徑、地區(qū)
23、途徑、文摘、資料匯編等。五、檢索工具第一類:目錄式工具1全宗文件目錄P96(最常用)以全宗為對象,將全宗內(nèi)全部文件(永久和長期)的內(nèi)容和形式特征記錄在卡片上,按照內(nèi)容所反映的問題加以系統(tǒng)化而組織成的目錄。一般多采用卡片式編制,它是檔案館,特別是機關(guān)檔案室最常用的一種檢索工具。全宗文件目錄設(shè)置的著錄項一般有:全宗名、文件題名(標題)、責任者(作者)、文件編號、文件形成時間、附注、主題詞、內(nèi)容摘要、分類號、檔號等。2全總目錄P91它是以全宗或全宗內(nèi)的某一部分案卷為對象編制而成的一種檢索工具,以案卷為檢索單位。 一般設(shè)有:案卷號、案卷題名、起止時間、保管期限等。3卷內(nèi)文件目錄以每一個案卷內(nèi)
24、的所有文件問對象編制而成的檢索目錄,據(jù)此可以查找到卷內(nèi)的每一份文件。 一般設(shè)置的檢索項有:案卷名、卷內(nèi)文件順序號(件號)、文件標題、責任人、主題詞或關(guān)鍵詞、分類號、頁號等。4重要文件目錄P96是一種揭示檔案館(室)中全宗內(nèi)重要文件內(nèi)容和成分的檢索工具。一般設(shè)有:分類號、主題詞、文件題名、責任者、文件形成時間、檔號等。5分類目錄P97是依據(jù)檔案分類表,將檔案館(室)中全部檔案材料按照分類標識進行分門別類形成的特殊檢索目錄,是檔案館(室)的一種綜合性、主導性檢索工具,在檔案檢索體系中占有非常重要的地位。主要特點是:超越了全宗的界限,系統(tǒng)性強,問題集中,便于按照時間問題檢索信息,比較符合人
25、們的檢索習慣。6主題檢索目錄P97依據(jù)檔案主題詞表,按照主題標識編排而成德一種檢索工具,一般以卡片的形式編制。其主要特點是:(1)問題集中:不受全宗、類別、知識門類、學科領(lǐng)域、分類體系的限制,把同一主題的檔案材料集中,能向利用者提供某一主題的全部檔案材料(2)內(nèi)容具體:將每份文件的內(nèi)容用幾個具體的主題詞揭示出來,包括比較次要的內(nèi)容揭示出來,存儲的信息將較大,減少漏檢率和誤檢率。(3)編制靈活:主題卡片按字順排列,可以隨時對主題詞進行增補、刪除、改動,有利于計算機著錄和檢索。(4)使用方便:以規(guī)范化的詞或詞組來揭示文件或案卷的主題,很容易查找。常用的主題卡片的結(jié)構(gòu):檔案著錄規(guī)則中推薦的主題著錄格
26、式;“條目著錄格式”(一份文件或一組案卷)如表6-6(P97);集中著錄,將主題詞相同的若干份文件或案卷著錄在一張卡片上。7專題卡片目錄P97按照特定專題(問題),以一定次序編排而成的檢索工具。特點:以專門題目為對象,把同一問題的文件條目組織在一起,可以是一個全宗內(nèi)有關(guān)某一專題的檔案材料,也可以不受全宗的限制,把全館(室)有關(guān)某一專題的檔案集中在一起,具有問題集中、內(nèi)容全面、針對性強、材料系統(tǒng)、專深等優(yōu)勢。一般著錄項目有:專題名稱、類(項、目)、文件題目(標題)、責任者、文件編號、時間、主題詞、檔號、附注等。8人名卡片目錄P98將檔案館(室)所藏檔案材料中涉及到的人名及簡要情況著錄下來,按照人
27、名進行查找的檢索工具。著錄項目:一般有兩部分組成:個人的自然情況:姓名、性別、出生年月、民族、籍貫、文化程度、簡歷等。指引部分:材料出處的檔號、備注等。常用人名檢索目錄體例:1)綜合性人名卡片目錄:以檔案館(室)的若干全宗或全部檔案為對象,按單份文件所涉及到的人名進行著錄。2)專題人名卡片目錄:以館(室)藏檔案中涉及某一專題的有關(guān)人名進行著錄。9聯(lián)合目錄P92選定兩個以上檔案館的全部或部分館藏編制而成的目錄。其作用:(1)將分散在各地的某種類型的檔案材料著錄下來,從目錄上連成載體,實現(xiàn)資源共享;(2)有利于建立全國和地區(qū)性的檔案目錄中心,實現(xiàn)館際協(xié)作和情報交流;(3)能進一步推動檔案著錄標準化
28、,為實現(xiàn)檔案檢索自動化、網(wǎng)絡(luò)化創(chuàng)造條件。聯(lián)合目錄的種類:(1)從檔案類型上分:明清檔案、民國檔案、革命歷史檔案等聯(lián)合目錄;(2)從內(nèi)容上分:綜合性、專題性聯(lián)合目錄;(3)從語種上分:中文、外文等;(4)從地域上分:全國性、地區(qū)性聯(lián)合目錄。編制形式:(1)一館為主,其余補充。先由收藏該類檔案最多的館編出一套目錄,再分送到有關(guān)檔案館進行較對補充,最后由牽頭的館匯總。(2)各館分編,一館匯總。在統(tǒng)一著錄格式和要求的前提下,各館分編,再由一個館匯總和較對補充。(3)各館分編,集中較對。各館分編,再由檔案行政機關(guān)或與專業(yè)主管機關(guān)組織專門力量集中校對和匯總補充。第二類:指南和索引式工具檔案館指南P99以文
29、章敘述的方式全面、概要地介紹檔案館保存檔案情況的一種工具書。檔案館指南的結(jié)構(gòu):(1)目錄;(2)序言;(3)檔案全宗介紹:這是指南的主體部分,也稱“全宗指南”,一般分為逐個介紹和綜合介紹;(4)館藏資料概況:對館藏檔案有關(guān)的館藏材料進行介紹(5)附錄:一般包括檢索工具分冊、規(guī)章制度、其他輔助工具,如工具書等。全宗介紹的主要內(nèi)容:以文章敘述的形式介紹某以全宗檔案內(nèi)容和成分及其價值,一般包括:1)立檔單位和全宗歷史概況。一般包括:全宗名稱、存在的時間、工作職責任務(wù)、案卷數(shù)量等;2)全宗檔案內(nèi)容和成分介紹。一般包括:文件作者(來源、種類)、制成材料、可靠程度、時間和價值等。全宗介紹要分類排列:一般可
30、根據(jù)歷史時期、全宗性質(zhì)、機關(guān)隸屬關(guān)系、重要程度等特點安排。新中國時期形成的檔案全宗一般采用以下方法排列:1)性質(zhì)相同的全宗,按時間排列;2)有隸屬關(guān)系的全宗,先將該類全宗集中,再按先上級后下級排列;3)要區(qū)別重要程度的全宗,黨政首腦機關(guān)和綜合性機關(guān)在前,一般機構(gòu)在后;4)按全宗的性質(zhì)分類別排列,如醫(yī)院、學校、工廠等。全宗介紹的作用:幫助利用者研究全宗歷史;為查找全宗檔案提供線索;有利于從全宗的角度研究某個專題;幫助檔案工作者掌握全宗檔案的構(gòu)成情況。專題指南P99按一定的題目,以文章敘述的形式,綜合介紹檔案館中保存的有關(guān)該題目的一種工具書,又稱“專題介紹”。編制方法和作用:一般以專題目錄為基礎(chǔ)介
31、紹某一專題的綜合情況,不受全宗的限制,便于利用者從全面的角度了解有關(guān)該專題檔案的內(nèi)容。一般由序言、檔案材料內(nèi)容介紹和附錄三部分組成,在介紹中一般只列出檔案材料涉及的全宗名稱和類目,不指出每條材料的具體出處,因此檢索功能不如專題卡片目錄強。人名索引P100列出檔案中所涉及的人物并指明出處的檢索工具。編制方法:將檔案內(nèi)容中涉及的人名摘要出來,按照某種方法加以排列。結(jié)構(gòu)組成:人名和檔號。形式:一般采用卡片形式,有簡單和詳細兩種。(1)簡單人名索引:人名(字、號、曾用名、別名、筆名、藝名、代號、綽號、尊號、謚號等)材料出處的檔號;(2)詳細人名索引:一般包括兩部分。1)第一部分:人名(同上)、性別、出
32、生年月、死亡日期、民族、職業(yè)、工作單位、籍貫、文化程度、職務(wù)、政治面貌、簡歷、檔案內(nèi)容提要等。2)第二部分:指引部分,包括材料出處的檔號、備考等。人名卡片一般按照姓氏筆畫、四角號碼、漢語拼音字母順序等方法分類排列。文號索引P93-94列出所藏檔案的文號,并將文號與檔號相對應(yīng),是按文號檢索檔案的檢索工具。一般采用表格的編制形式,又稱“文號檔案對照表”。作用:對于從文號角度提出的檢索要求,只有利用文號索引才能查出。尤其對于發(fā)文較多的領(lǐng)導機關(guān)、專業(yè)主管機關(guān)和有關(guān)全宗,這種檢索工具尤為重要。編制方法:一般按年度、發(fā)文機關(guān)分別編制,即將同一年度、同一發(fā)文機關(guān)的文件編一張表,然后將所有的表裝訂成冊。格式有
33、:號碼對應(yīng)試和位置對應(yīng)試。(具體樣式詳見P93-94)六、檢索方法排檢法含義:一種用人工檢索語言編排檢索工具的方法。編排與檢索密不可分,只有進行科學的編排,才能完成檢索。排檢法三大類:字順法、類序法和自然順序法。(一)字順法P101-106字順法是根據(jù)漢字的字形、字音等特征編排工具書條目的方法。根據(jù)漢字的形體構(gòu)造歸納分類,再按照一定順序編排條目的方法稱為形序法;根據(jù)漢字字音順序排檢漢字的方法稱為音序法。11形序法(三種)根據(jù)漢字的形體構(gòu)造歸納分類,常用的形序法有三種:部首法、筆畫筆形法、號碼法。部首法根據(jù)漢字部首編排和檢索漢字的方法,又稱為“部首檢字法”。部首檢字法是一種常用的漢字查字法,廣泛
34、應(yīng)用于工具書編纂、漢字信息處理及其他領(lǐng)域的漢字檢索。優(yōu)點:通過部首將數(shù)量龐大的漢字相對集中,符合漢字的結(jié)構(gòu)特點,便于集中查詢。缺點:如部首判斷不準,筆畫數(shù)不正確,檢索就比較困難。筆畫筆形法根據(jù)漢字的筆畫多少和筆形順序排列和檢索的方法,是筆畫法和筆形法的結(jié)合。筆畫法:根據(jù)漢字筆畫數(shù)多少編排和檢索漢字的方法,由少到多排列。筆形法:根據(jù)漢字的筆畫形狀(橫、豎、撇、點、折)和書寫順序編排檢索漢字的方法,又叫“筆順法”。筆畫筆形法的編排順序:按照漢字筆畫數(shù)從少到多排。筆畫數(shù)相同的字按起筆到末筆各筆形“橫、豎、撇、點、折”順序排列。以上各項相同時,按照漢字在國家標準漢字編碼字符集中的編碼值從小到大排列。難
35、點:檢索時要注意數(shù)準筆畫數(shù),搞清筆形和書寫順序。四角號碼法四角號碼法的基本原理是將漢字的筆形分為10種,分別用。0一9這10個數(shù)字表示,每個字按左上、右上、左下、右下(4個號)四角筆形取碼,再按號碼大小排列漢字。四角號碼筆形代碼口訣:橫一豎二三點捺,叉四插五方框六。七角八八九是小,點下一橫變零頭。 四角號碼編排順序:根據(jù)中華人民共和國國家標準·文字條目通用排序規(guī)則(GBT1341892)的規(guī)定,四角號碼按照以下順序編排:(1)按四角號碼大小排,由小到大。(2)四角號碼相同者再按照附號排。(3)以上兩項都相同者,再按照橫筆數(shù)排,由少到多。(4)以上三項都相同者,再按照整字總筆
36、畫數(shù)排,由少到多。(5)以上幾項都相同者,再按照起筆至末筆各筆筆形,按“橫、豎、撇、點、折”次序排列。(6)以上各項都相同者,按漢字在國家標準漢字編碼字符集中的編碼值從小到大排列。12音序法(三種)利用漢字的發(fā)音進行排序的方法就叫做音序法。音序法包括三種:聲韻法、注音字母法和拼音字母法?,F(xiàn)在使用最多的是拼音字母法。聲韻法 古代按照平、上、去、人四聲和韻部編排檢索漢字的方法。常用工具書一般不采用聲韻法進行編排,不懂古音的人可以先利用詞源、漢語大詞典等標注有古音的工具書,查出字的古音,再去查用聲韻法編排的工具書。注音字母法注音字母法是按照漢字注音字母順序編排檢索漢字的方法。注
37、音字母又名“國音字母”,是中國第一套法定的漢字形式的拼音字母。拼音字母法 按照漢語拼音方案字母表的順序編排檢索漢字的方法。2類序法將排檢對象按照事物性質(zhì)、學科體系或主題內(nèi)容編排檢索的方法。事物性質(zhì)排列法將文獻按照同一類事物性質(zhì)歸類集中編排的方法。如古代的政書、類書,現(xiàn)代的手冊、指南、年鑒等。這種方法便于集中性質(zhì)相同或相近的文獻資料,便于以類相聚,按類檢索。但如對待檢對象的劃類不準確,檢索時便會出現(xiàn)誤差。學科體系排列法學科體系排列法是按照文獻的學科系統(tǒng)分類排列的方法,具體做法就是用等級列舉的方法層層依次展開各學科的類目。在古代常用的圖書分類法有六分法、四分法、五
38、分法等,到了現(xiàn)代這些方法主要用于對古籍圖書的分類,對現(xiàn)代圖書的分類從20世紀50年代開始大都按照中國圖書館分類法的分類標準,而以學科體系排列檔案的方法主要體現(xiàn)在以中國檔案主題詞表為標準的檔案主題分類法中。3自然順序法 根據(jù)事物發(fā)生、發(fā)展的時間或事物所處的地理位置編排文獻的方法。包括時序法和地序法兩種。時序法:按照時間順序編排檔案文獻的方法。如歷史紀年表、大事年表、年譜等。這種排檢方法線索清晰,檢索方便,檢索者只要依年月日順序就可順利查到所需資料。地序法:按照檔案文獻內(nèi)容所涉及的地理位置或行政區(qū)劃進行編排檢索的方法。如地圖集、地理沿革表、名勝詞典、方志目錄、旅游指南等。七、
39、檔案信息計算機檢索計算機檢索檔案信息的基本原理和前提條件1定義P73:人們在計算機或計算機檢索網(wǎng)絡(luò)的終端機上,使用特定的檢索指令、檢索詞和檢索策略,從計算機檢索系統(tǒng)的數(shù)據(jù)庫中檢出所需的信息,繼而再由終端設(shè)備顯示的過程。2基本原理P180:檢索人員將能表達其信息需求的檢索式提交給檢索系統(tǒng),系統(tǒng)自動將檢索式與系統(tǒng)中的信息對比,當信息特征標識及其邏輯組配關(guān)系與檢索式相一致,即為檢索的內(nèi)容,其過程如圖(P201)所示。3前提條件P200:檔案信息必須進行計算機存儲,即建立數(shù)據(jù)庫。在此過程中,相應(yīng)的系統(tǒng)對收集到的檔案信息按內(nèi)容進行概念分析和標引,賦予特征標志,并按特定編排方法進行編排,形成有序的、具有可
40、檢索性特征的檔案數(shù)據(jù)庫。檔案信息計算機檢索的前期準備工作P201審閱檔案內(nèi)容,確定輸入內(nèi)容,為計算機檢索劃出一定范圍,符合以下條件的檔案可以首先開展計算機檢索工作:(1)保管基礎(chǔ)條件較好且有一定數(shù)量積累的檔案,如內(nèi)容整理較為完備,案卷標題、文件標題等較為規(guī)范以及其他整理內(nèi)容符合標準化要求的檔案。 (2)具備了較為完備的手工檢索工具的檔案。 (3)具有重要歷史價值的檔案。 (4)具有重要文物價值和藝術(shù)價值的檔案。 (5)使用頻率較高的檔案。 (6)前期管理條件較好的電子檔案,等等。完成檔
41、案信息的著錄工作:一般包括案卷級著錄和文件級著錄將相關(guān)檔案信息輸入計算機紙質(zhì)檔案信息的輸入 目前對紙質(zhì)檔案的著錄主要采用兩種方式,一是利用著錄軟件和原有手工檢索工具,將各著錄項和檔案內(nèi)容輸入計算機;二是利用電子掃描技術(shù)直接對檔案信息全文進行掃描后再登錄各著錄項,完成檔案信息的計算機輸入工作。電子檔案 對于前期形成條件較好的電子文件可以直接利用電子檢索目錄進行檢索;對前期背景條件有欠缺的電子文件,在補足前期背景材料后可以進行計算機檢索。檔案信息計算機檢索的主要方法1關(guān)鍵詞或主題詞法此法是一種常用方法,一般人都能使用。但此方法檢索到的信息范圍較廣,針對性
42、不強。2布爾邏輯檢索技術(shù)P195是建立的最早的理論,也是檢索技術(shù)中運用最廣泛的檢索技術(shù)。它通常對布爾邏輯運算符進行組配,形成檢索式,用以表達用戶的檢索需求,并通過一定的算法和手段進行檢索。但要求檢索人員熟悉檢索式的表達方法,專業(yè)性較強。布爾邏輯運算符有以下三種。AND:邏輯與 是一種交叉概念或限定關(guān)系的組配,可縮小檢索范圍,提高查準率。一般可使用“*”或“&”來表示。其檢索式為:“A AND B”或“A*B”或“A&B”,表示檢索結(jié)果應(yīng)同時含有檢索詞A和B的文獻信息。如“檔案館*數(shù)字化”或“檔案館AND數(shù)字化”。OR:邏輯或
43、0; 是一種用于并列關(guān)系的組配,可以擴大檢索范圍提高查全率。一般可使用用“OR”或“+”表示。表示檢索結(jié)果含有檢索詞A或者B,或同時有A和B的文獻信息。檢索式寫作:“A OR B”或“A+B”,NOT:邏輯非 “邏輯非”用“NOT”或“一”表示,檢索式寫作“A NOT B”或“AB”,是一種用于排除關(guān)系的組配,表示檢索含有檢索詞A而不含檢索詞B的文獻信息。使用“邏輯非”可以排除不希望出現(xiàn)的概念,提高查準率。常用于主題概念去除某段年份的文獻、某個語種或去除某種類型(會議、期刊)的文獻等情況。布爾邏輯運算順序
44、; 當多個布爾邏輯運算符在一個檢索式中出現(xiàn)時,它們的運算“級別”是不同的。大部分數(shù)據(jù)庫是這樣規(guī)定的:“一”優(yōu)先級最高,“*”次之,“+”最低。在有括號的情況下,先執(zhí)行括號內(nèi)的邏輯運算;在多層括號時,先執(zhí)行最內(nèi)層括號中的運算。用這些邏輯運算符將檢索詞組配構(gòu)成檢索式,計算機將根據(jù)提問式與系統(tǒng)中的記錄進行匹配,當兩者相符時則命中,并自動輸出該文獻記錄。(即NOT、AND、OR)。3鄰接檢索技術(shù)P197利用一定的專門符號,來表示兩個檢索詞在檢索結(jié)果中出現(xiàn)的位置,避免了布爾邏輯檢索中無法區(qū)分“邏輯與”鏈接起來的兩個概念的關(guān)聯(lián)程度。鄰接檢索技術(shù)又稱為“詞位檢索法”,共包括其中常用的方
45、法。有間斷無序鄰接 鄰接符號nN,檢索式為A(nN)B,表示它關(guān)聯(lián)的兩個概念A(yù)、B之間可以插入On個其他詞匯,且兩個概念前后順序不定(順序可以顛倒),其中,n代表可以插入的詞的個數(shù)。當n=0時,檢索式可直接寫作:A(N)B。例如“檔案館(2N)數(shù)字化”表示在“檔案館”和“數(shù)字化”兩個詞中間(順序可以顛倒)不含有其他詞(n=O)或包含有1個詞(n=1)或兩個詞(n=2)的所有組合都符合檢索的標準。有間斷有序鄰接 鄰接符號nw,檢索式為A(nw)B,表示它關(guān)聯(lián)的兩個概念A(yù)、B間可以插入on個其他詞匯,但兩個概念前后順序固定,不可改變,其中n代表最多可以插
46、入詞的個數(shù)。當n=0時,檢索式可以直接寫作:A(W)B,它們之間除可以有空格或標點外,不能有其他檢索詞(包括單詞、字母或代碼)。同字段鄰接 鄰接符號F,要求被連接的檢索詞出現(xiàn)在同一字段(Field)中,詞序可變,字段類型可用后綴符限定。例如:“market?(F)informationDE,TI”說明“market?”和“information”兩個詞必須同時出現(xiàn)在敘詞字段或題名字段中。同句鄰接 鄰接符號S,表示被連接的檢索詞出現(xiàn)在同一子字段(Subfield)或同一自然句(Sentence)中,兩個詞之間可夾若干詞,其先后順序不受限制。同文鄰接
47、160; 鄰接符號C,它是Citation的縮寫,表示所連接的兩個詞在一篇文獻的記錄中查找,只要這兩個詞同時出現(xiàn)在該記錄中,詞序不分先后,也不分字段,中間插入詞的個數(shù)不限。同標引鄰接 鄰接符號L,是Link的縮寫,它要求所連接的兩個檢索詞同時出現(xiàn)在標引詞字段中,而且具有詞表規(guī)定的等級關(guān)系。因此,這個運算符只使用于有正式詞表,且表中詞具有等級關(guān)系的數(shù)據(jù)庫。同自然段鄰接 鄰接符號P,是Paragraph的縮寫,檢索式為A(P)B,表示它所關(guān)聯(lián)的兩個概念必須在同一自然段中出現(xiàn)。4字段檢索P197 是一種對待檢詞在數(shù)據(jù)記錄中出
48、現(xiàn)的字段范圍進行限定的檢索方法字段是數(shù)據(jù)庫記錄中的基本單位,是數(shù)據(jù)庫的基本著錄款目。它包括兩部分:一是基本字段,即反映文獻內(nèi)容特征的主要字段;二是輔助字段,即反映文獻外部特征的次要字段。字段檢索式有兩種:基本字段限定檢索詞檢索式。格式為:檢索詞字段代碼,如“檔案信息TI”(TI為題名字段代碼),表示查找題名字段中含有“檔案信息”的文獻。輔助字段時要用字段前綴檢索式。即在字段代碼放在檢索次的前面,中間用“=”隔開,如“JN=WallStreet”(JN為期刊字段代碼),表示查找發(fā)表在WallStreet期刊上的文獻。5截詞檢索所謂截詞檢索,就是指用給定的詞干做檢索詞,檢索與含有該詞干的全部檢索詞
49、相關(guān)的文獻。它可以起到擴大檢索范圍、提高查全率、節(jié)省檢索時問等作用,對西文文獻尤為重要。截詞檢索首先要對檢索詞進行截斷,根據(jù)截斷的位置不同,分為后截斷、前截斷、中截斷、復(fù)合截斷;根據(jù)截斷的數(shù)量不同,分為有限截詞(即一個截詞符只代表一個字符)和無限截詞(一個截詞符可代表多個字符)。不同的系統(tǒng)所用的截詞符也不同,常用的有“?”、“、”、“$”、“*”等。有限截斷,允許截去有限個字符,截幾個字符就加幾個“?”,空一格后加一個“?”表示截詞符。如:“stud?”可檢出:study、studies、studied、studing,其詞尾可有03個字母。無限截斷,允許截去無限個字符,又稱開放式截斷。如:“
50、Compute?”的檢索結(jié)果包括compute、computers、computered、computering、computerization后截斷(右截斷),是將截詞符放在一個字符串的右方,滿足截詞符左方所有字符的記錄都為命中記錄。例如:“heal*”,則前4個字符為“heal”的所有詞都滿足條件,系統(tǒng)可檢出含有“health”、“healthy”等詞匯的文獻。前截斷(左截斷),是將截詞符放在一個字符串的左方,滿足截詞符右方所有字符的記錄都為命中記錄。如:“?graduate”可檢出含有“postgraduate”、“undergraduate”等檢索詞的文獻。中截斷,是將截詞符放在一個字
51、符串的中間,滿足截詞符兩側(cè)所有字符的記錄都為命中記錄。這種方法對于解決英美不同拼法、不規(guī)則的單復(fù)數(shù)變化很有用。如:“m?n”可檢出“man”、“men”等檢索詞的文獻。復(fù)合截斷,又稱前后截斷,是將前截斷和后截斷結(jié)合使用,即中問一致檢索。如:“?migrat?”可檢出含有“migrate”、“immigrate”、“emigrate”、“migrant”、“immigrant”、“emigrant”等檢索詞的文獻。八、聯(lián)機檢索系統(tǒng)聯(lián)機檢索系統(tǒng)就是供用戶或信息檢索人員利用終端設(shè)備,經(jīng)過通信線路(電話線、衛(wèi)星通信線路、通信網(wǎng)絡(luò)、信號轉(zhuǎn)換設(shè)備等)與主機檢索系統(tǒng)相連,運用特定的檢索指令進行人機對話,以獲
52、取所需信息的系統(tǒng)。聯(lián)機檢索系統(tǒng)的構(gòu)成 一個完整的聯(lián)機檢索系統(tǒng)通常包括檢索終端、通信網(wǎng)絡(luò)和聯(lián)機檢索中心三個部分。使用聯(lián)機檢索需注意:合理選擇數(shù)據(jù)庫:根據(jù)數(shù)據(jù)庫收錄的范圍及特點、數(shù)據(jù)庫的標引和詞表特征、數(shù)據(jù)庫的收錄時間及更新周期、檢索費用等決定。準確選擇檢索詞:將提問的的主題概念轉(zhuǎn)變成為能與系統(tǒng)相匹配的檢索詞,一般從所選數(shù)據(jù)庫的敘詞表中(一般在數(shù)據(jù)庫中附有)或其他主題詞表中選擇檢索詞。合理構(gòu)造表達式:利用已選定的邏輯運算符、位置符等,將選擇好的詞組配起來。九、常用網(wǎng)絡(luò)檢索工具(一)網(wǎng)絡(luò)搜索引擎分類搜索引擎按搜索方式不同,可分為:目錄式搜索引擎、機器人搜索引擎和元搜索引擎等。(1)目錄式搜
53、索引擎一般可稱為網(wǎng)路目錄、分類式搜索引擎、主題指南等。它是將收集的網(wǎng)絡(luò)信息按某種分類法進行加工整理,建立以分類查詢和分類導航為主的搜索引擎,以人工方式或半自動化方式收集信息,由專業(yè)人員對信息進行分析后形成信息摘要,并將信息置于事先確定的分類框中。信息大多面向網(wǎng)站,提供目錄瀏覽和直接檢索服務(wù)。(2)機器人搜索引擎由一個稱為蜘蛛的機器人程序以某種策略自動在互聯(lián)網(wǎng)中搜索和發(fā)現(xiàn)信息,由索引器為收集到的信息建立索引,檢索器根據(jù)用戶的查詢檢索索引庫,并將查詢結(jié)果返回用戶。服務(wù)方式:面向網(wǎng)頁的全文檢索服務(wù)。(3)元搜索引擎這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請求同時向多個搜索引擎提交,將返回的結(jié)果進
54、行重復(fù)排除,重新排序等處理后,作為自己的結(jié)果返回給用戶。代表:webcrawler(網(wǎng)頁爬行者)、信息超市。(二)常用的搜索引擎舉例目錄式搜索引擎代表:1Yahoo(P290)Yahoo是世界上最著名的目錄索引,是搜索引擎的開山鼻祖之一。使用注意事項有:(1)雅虎只支持“邏輯與(AND)和邏輯非(NOT)”,不支持“邏輯或(OR)。(2)檢索式中可以使用引號,使檢索結(jié)果中用戶輸入的關(guān)鍵詞始終是一個完整的詞組不被分開。2搜狐創(chuàng)立于1998年,是中國首家分類查詢搜索引擎。它采用人工分類技術(shù)對搜集的地點進行分類,并在目錄下建立目錄樹體系,形成獨具特色的分層目錄系統(tǒng)。目前搜狐已從中國首家大型分類查詢搜
55、索引擎,發(fā)展成為用戶喜愛的綜合門戶網(wǎng)站,有分類檢索和關(guān)鍵詞檢索兩種檢索途徑。說明:搜狐中文檢索系統(tǒng)支持布爾邏輯檢索,用戶可以通過布爾邏輯關(guān)系構(gòu)造邏輯關(guān)系,構(gòu)造邏輯檢索式實現(xiàn)精確檢索。搜狐支持的運算符號有:、&、/、()、空格。使用“&和空格”:指定輸入的檢索詞必須在檢索結(jié)果中,即邏輯與的關(guān)系。如用戶一次輸入多個檢索詞,則系統(tǒng)默認為邏輯與檢索。使用“”:限定某個檢索詞必須不出現(xiàn)在檢索結(jié)果中。使用“/”:表示“/”兩邊的查詢串中至少有一個出現(xiàn)在檢索結(jié)果中。使用“()”:表示括號內(nèi)的表達式是一個完整單元。機器人搜索引擎1Google(谷歌)谷歌成立于1997年,已發(fā)展成為目前規(guī)模最大
56、的搜索引擎,并向Yahoo等其它目錄索引和搜索引擎提供后臺網(wǎng)頁查詢服務(wù)。目前,谷歌每天處理的搜索請求次數(shù)已達幾億次,而這一數(shù)字還在不斷的增加。 谷歌數(shù)據(jù)庫存有30億個web文件,屬于全文搜索引擎。谷歌允許以多種語言進行搜索,提供了多大30余種語言選擇,包括英語、主要歐洲語言、日語、中文簡繁字、韓語等。同時還可以在40多個國別專屬引擎中進行選擇。說明:谷歌支持布爾邏輯檢索,用“AND”表示邏輯與關(guān)系,但在查詢時不需加入“AND”,因為谷歌會在關(guān)鍵詞之間自動添加“AND”。谷歌提供符號檢索,用戶全部查詢條件的網(wǎng)頁。如果想逐步縮小范圍,只需鍵入更多的關(guān)鍵詞。谷歌支持“”功能,用以有目的的刪除某些無關(guān)
57、的網(wǎng)頁,但減號之前必須留一空格。需要注意的是:谷歌不支持“OR”搜索,所以,谷歌無法接受如“包含詞語A,或者包含詞語B”的網(wǎng)頁。2百度baidu百度公司于1999年成立于美國硅谷,創(chuàng)建者是李彥宏和徐勇。2000年1月,百度公司在中國成立全資子公司百度網(wǎng)絡(luò)技術(shù)(北京)有限公司百度起名源于“眾里尋他千百度”和突破“事做到九十九就是做到頭”的西方說法,百度就是要力爭做到一百度,做到最好的極致。說明:百度搜索,支持任意的關(guān)鍵詞檢索。輸入的查詢內(nèi)容可以是詞語、多個詞語或一句話。百度搜索引擎嚴謹認真,要求一字不差。百度支持布爾邏輯檢索,支持通配符的使用,但在使用“與”時不需要使用“AND”或“+”這樣的通
58、配符,只需在輸入的多個檢索詞間用空格隔開。(5)搜索不區(qū)分大小寫字母,并提供繁簡查詢和轉(zhuǎn)換。(6)百度設(shè)有一些高級檢索功能,可以更直觀的在檢索框中輸入檢索范圍限定,包括時間、地區(qū)、關(guān)鍵詞、位置等,所有限定一次到位。3.搜狗搜狗公司推出的全新獨立域名的專業(yè)搜索網(wǎng)站,以計算機與用戶在互動的提示下進行搜索問主要特征。互動式搜索:在搜索過程中,當用戶輸入一個檢索詞時,搜索引擎根據(jù)檢索要求,迅速智能化展開多組相關(guān)主題提示,通過給予多個主題的檢索提示,逐層縮小檢索范圍,引導用戶快速準確的定位自己所關(guān)注的內(nèi)容,幫助公民快速找到相關(guān)搜索結(jié)果和所需信息。這種互動的方法可大幅度提高檢索相關(guān)度。說明:(1)有分類檢索和關(guān)鍵詞檢索兩種途徑。(2)支持布爾邏輯檢索,默認邏輯與的關(guān)系,即在檢索幾個先關(guān)的概念時,不需要在關(guān)鍵詞之間加“AND”或“+”,只需要在關(guān)鍵詞之間輸入空格即可。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度綠色餐飲采購標準合同3篇
- 二零二五年度冷鏈物流倉儲管理服務(wù)合同2篇
- 2025年度苗木種植基地土地租賃合同樣本(含品牌授權(quán))
- 2025年度飛行員勞動合同(含飛行業(yè)績獎勵)4篇
- 中醫(yī)師專屬2024聘用協(xié)議模板版B版
- 個性化全新承諾協(xié)議文檔(2024版)版B版
- 二零二五年度出租車公司股權(quán)置換及運營權(quán)轉(zhuǎn)讓協(xié)議3篇
- 2025年度個人商鋪租賃稅費代繳及財務(wù)結(jié)算合同4篇
- 二零二五年度農(nóng)民合作社加盟社員入社合同范本
- 個人寵物寄養(yǎng)服務(wù)2024年度合同
- 皮膚內(nèi)科過敏反應(yīng)病例分析
- 電影《獅子王》的視聽語言解析
- 妊娠合并低鉀血癥護理查房
- 煤礦反三違培訓課件
- 向流程設(shè)計要效率
- 2024年中國航空發(fā)動機集團招聘筆試參考題庫含答案解析
- 當代中外公司治理典型案例剖析(中科院研究生課件)
- 動力管道設(shè)計手冊-第2版
- 2022年重慶市中考物理試卷A卷(附答案)
- Python繪圖庫Turtle詳解(含豐富示例)
- 煤礦機電設(shè)備檢修技術(shù)規(guī)范完整版
評論
0/150
提交評論