版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1計(jì)算機(jī)文獻(xiàn)信息檢索計(jì)算機(jī)文獻(xiàn)信息檢索 概論概論陳路平老師主講陳路平老師主講(授課新版授課新版3)2016.2.05 2計(jì)算機(jī)文獻(xiàn)信息檢索發(fā)展簡介計(jì)算機(jī)文獻(xiàn)信息檢索發(fā)展簡介 計(jì)算機(jī)文獻(xiàn)信息檢索計(jì)算機(jī)文獻(xiàn)信息檢索始于始于50年代,年代,1954年美國年美國海軍武器實(shí)驗(yàn)所(海軍武器實(shí)驗(yàn)所(NOTS)使用)使用IBM701型電子型電子管計(jì)算機(jī)建成了管計(jì)算機(jī)建成了世界上第一個(gè)世界上第一個(gè)信息檢索系統(tǒng),信息檢索系統(tǒng), 利用利用IBM701型電子管計(jì)算機(jī)把文獻(xiàn)號(hào)碼和型電子管計(jì)算機(jī)把文獻(xiàn)號(hào)碼和少量索引詞存貯在計(jì)算機(jī)中,少量索引詞存貯在計(jì)算機(jī)中,(1).檢索結(jié)果檢索結(jié)果是是文獻(xiàn)號(hào)碼,后在文獻(xiàn)號(hào)碼,后在1958
2、年經(jīng)過改進(jìn),年經(jīng)過改進(jìn),(2).檢索結(jié)果檢索結(jié)果可以是可以是文摘、題錄文摘、題錄和和作者等項(xiàng)目。作者等項(xiàng)目。3從從20世紀(jì)世紀(jì)50年代初計(jì)算機(jī)文獻(xiàn)信息檢索經(jīng)歷了年代初計(jì)算機(jī)文獻(xiàn)信息檢索經(jīng)歷了 以下以下四個(gè)四個(gè)階段階段。1.實(shí)驗(yàn)研究階段實(shí)驗(yàn)研究階段 (1950-1954年年)2.脫機(jī)檢索階段脫機(jī)檢索階段 (1954-1964年)年)3.聯(lián)機(jī)檢索階段聯(lián)機(jī)檢索階段 (1965-1972年年4.國際網(wǎng)絡(luò)檢索階段(國際網(wǎng)絡(luò)檢索階段(1973年年-至今)至今) (一)(一)實(shí)驗(yàn)研究階段(實(shí)驗(yàn)研究階段(1950-1954年)年) 這段時(shí)期圖書情報(bào)界利用計(jì)算機(jī)進(jìn)行編制索引、這段時(shí)期圖書情報(bào)界利用計(jì)算機(jī)進(jìn)行編制
3、索引、自動(dòng)分類等研究,其自動(dòng)分類等研究,其目的目的是使圖書館工作自動(dòng)化。是使圖書館工作自動(dòng)化。4(二)(二)脫機(jī)檢索階段脫機(jī)檢索階段(1954-1964年)年) 這一階段通過計(jì)算機(jī)這一階段通過計(jì)算機(jī)貯存貯存二次文獻(xiàn)二次文獻(xiàn)和和收錄文獻(xiàn)的范收錄文獻(xiàn)的范圍越來越廣,如書目索引圍越來越廣,如書目索引和和累計(jì)索引等數(shù)據(jù)庫,用戶可累計(jì)索引等數(shù)據(jù)庫,用戶可以對已存入計(jì)算機(jī)中以對已存入計(jì)算機(jī)中文獻(xiàn)信息文獻(xiàn)信息進(jìn)行進(jìn)行定題檢索定題檢索和和回溯檢索回溯檢索 當(dāng)時(shí)這種定題檢索當(dāng)時(shí)這種定題檢索和和回溯檢索為回溯檢索為脫機(jī)檢索脫機(jī)檢索也稱為也稱為批批處理檢索。處理檢索。 特點(diǎn)特點(diǎn):只能由:只能由專業(yè)人員專業(yè)人員 操作
4、操作 缺點(diǎn)缺點(diǎn):(1)檢索人員為了節(jié)約費(fèi)用,每隔二至三檢索人員為了節(jié)約費(fèi)用,每隔二至三周才做一次檢索,用戶不能及時(shí)拿到檢索結(jié)果。周才做一次檢索,用戶不能及時(shí)拿到檢索結(jié)果。 (2)批處理檢索是一種封閉式檢索,用戶批處理檢索是一種封閉式檢索,用戶與檢索人員之間無任何反饋信息,并無法和計(jì)算機(jī)對話。與檢索人員之間無任何反饋信息,并無法和計(jì)算機(jī)對話。專業(yè)人員專業(yè)人員5 (三(三)聯(lián)機(jī)檢索階段)聯(lián)機(jī)檢索階段(1965-1972年)年) 這一階段,由于第三代集成電路計(jì)算機(jī)這一階段,由于第三代集成電路計(jì)算機(jī) 的產(chǎn)生與發(fā)展和高的產(chǎn)生與發(fā)展和高密度大容量貯存器密度大容量貯存器-硬磁盤硬磁盤及及磁盤機(jī)磁盤機(jī)的出現(xiàn),
5、再加上數(shù)字通訊的出現(xiàn),再加上數(shù)字通訊技術(shù)的發(fā)展和分組交換公用數(shù)據(jù)通信網(wǎng)的普及,使得情報(bào)檢索技術(shù)的發(fā)展和分組交換公用數(shù)據(jù)通信網(wǎng)的普及,使得情報(bào)檢索從脫機(jī)、批處理階段從脫機(jī)、批處理階段進(jìn)入進(jìn)入聯(lián)機(jī)檢索階段。聯(lián)機(jī)檢索階段。 與與脫機(jī)檢索階段相脫機(jī)檢索階段相比較比較,聯(lián)機(jī)檢索階段,聯(lián)機(jī)檢索階段具有具有以下以下特征特征: (1)采用大、中型計(jì)算機(jī),文獻(xiàn)檢索)采用大、中型計(jì)算機(jī),文獻(xiàn)檢索 實(shí)行分時(shí)實(shí)行分時(shí) 處理,人機(jī)可直接對處理,人機(jī)可直接對話,能及時(shí)得到檢索結(jié)果話,能及時(shí)得到檢索結(jié)果; (2)終端用戶可以檢索)終端用戶可以檢索到到多個(gè)文獻(xiàn)數(shù)據(jù)庫多個(gè)文獻(xiàn)數(shù)據(jù)庫; (3)雖然在該階段出現(xiàn)了計(jì)算機(jī)網(wǎng)絡(luò),但規(guī)模
6、不夠大,大多是集中式)雖然在該階段出現(xiàn)了計(jì)算機(jī)網(wǎng)絡(luò),但規(guī)模不夠大,大多是集中式的,聯(lián)機(jī)檢索的,聯(lián)機(jī)檢索受到受到地區(qū)的限制。地區(qū)的限制。 6(四)四)國際網(wǎng)絡(luò)檢索階段國際網(wǎng)絡(luò)檢索階段(1973年年-至今)至今) 隨著空間技術(shù)隨著空間技術(shù)和和遠(yuǎn)程通信技術(shù)的發(fā)展,計(jì)算機(jī)文獻(xiàn)信息檢遠(yuǎn)程通信技術(shù)的發(fā)展,計(jì)算機(jī)文獻(xiàn)信息檢索進(jìn)入了新階段,由于衛(wèi)星通訊技術(shù)索進(jìn)入了新階段,由于衛(wèi)星通訊技術(shù)和和光纖通訊技術(shù)的實(shí)用化,光纖通訊技術(shù)的實(shí)用化,使得計(jì)算機(jī)文獻(xiàn)檢索沖破時(shí)間和空間的限制,為快速全面地獲使得計(jì)算機(jī)文獻(xiàn)檢索沖破時(shí)間和空間的限制,為快速全面地獲取全球性科技文獻(xiàn)信息資料提供了非常方便的條件,從而極大取全球性科技文獻(xiàn)
7、信息資料提供了非常方便的條件,從而極大地提高了文獻(xiàn)資料的可獲得性和利用價(jià)值,實(shí)現(xiàn)文獻(xiàn)資料共享地提高了文獻(xiàn)資料的可獲得性和利用價(jià)值,實(shí)現(xiàn)文獻(xiàn)資料共享性。性。 國際網(wǎng)絡(luò)檢索階段具有以下國際網(wǎng)絡(luò)檢索階段具有以下特點(diǎn)特點(diǎn): (1)最顯著特征是網(wǎng)絡(luò)性質(zhì)不再是集中式的,而是分布網(wǎng)絡(luò)結(jié)構(gòu);)最顯著特征是網(wǎng)絡(luò)性質(zhì)不再是集中式的,而是分布網(wǎng)絡(luò)結(jié)構(gòu); (2)實(shí)現(xiàn)了真正意義上的資源共享,任何一個(gè)終端上的用戶都可檢索)實(shí)現(xiàn)了真正意義上的資源共享,任何一個(gè)終端上的用戶都可檢索到網(wǎng)絡(luò)中的任何一個(gè)數(shù)據(jù)庫,提高了文獻(xiàn)信息的利用率;到網(wǎng)絡(luò)中的任何一個(gè)數(shù)據(jù)庫,提高了文獻(xiàn)信息的利用率; (3)計(jì)算機(jī)儲(chǔ)存容量的不斷增大,使得文獻(xiàn)信息
8、存貯量增多,能節(jié)約)計(jì)算機(jī)儲(chǔ)存容量的不斷增大,使得文獻(xiàn)信息存貯量增多,能節(jié)約資金投資。資金投資。 7 信息高速公路信息高速公路 20世紀(jì)世紀(jì)50年代,美國建成了遍布全國的高速公路網(wǎng),對加年代,美國建成了遍布全國的高速公路網(wǎng),對加速美國商品、勞務(wù)人員流通發(fā)揮了極其巨大的作用,推動(dòng)了美速美國商品、勞務(wù)人員流通發(fā)揮了極其巨大的作用,推動(dòng)了美國和周邊國家的經(jīng)濟(jì)發(fā)展,至今高速公路網(wǎng)仍是美國現(xiàn)代經(jīng)濟(jì)國和周邊國家的經(jīng)濟(jì)發(fā)展,至今高速公路網(wǎng)仍是美國現(xiàn)代經(jīng)濟(jì)的基礎(chǔ)。的基礎(chǔ)。1993年克林頓就任美國總統(tǒng)后,提出建立年克林頓就任美國總統(tǒng)后,提出建立“國家信息國家信息基礎(chǔ)設(shè)施(基礎(chǔ)設(shè)施(National Inform
9、ation Infrasture)計(jì)劃)計(jì)劃”, 簡稱簡稱NII。其計(jì)劃歸納為三點(diǎn)其計(jì)劃歸納為三點(diǎn): (1)鋪設(shè)覆蓋美國的光纖網(wǎng)絡(luò)。鋪設(shè)覆蓋美國的光纖網(wǎng)絡(luò)。 (2)用光纖網(wǎng)絡(luò)連接所有的通信系統(tǒng)、計(jì)算機(jī)資料庫和電用光纖網(wǎng)絡(luò)連接所有的通信系統(tǒng)、計(jì)算機(jī)資料庫和電信消費(fèi)設(shè)施。信消費(fèi)設(shè)施。 (3)讓光纖網(wǎng)絡(luò)能傳輸視頻、音頻、數(shù)字、圖象等多媒體讓光纖網(wǎng)絡(luò)能傳輸視頻、音頻、數(shù)字、圖象等多媒體信息。信息。 信息高速公路信息高速公路主要主要由:由:通信網(wǎng)絡(luò)、通信設(shè)備通信網(wǎng)絡(luò)、通信設(shè)備和和通信資源通信資源三部分組成。三部分組成。 通信網(wǎng)絡(luò)通信網(wǎng)絡(luò)和和通信設(shè)備通信設(shè)備構(gòu)成構(gòu)成寬廣平坦的路面寬廣平坦的路面,信息資源,
10、信息資源就是公路上行駛的車輛就是公路上行駛的車輛,三者構(gòu)成一個(gè)有機(jī)的整體三者構(gòu)成一個(gè)有機(jī)的整體。8信息高速公路主要由信息高速公路主要由(三部分組成三部分組成)1.通信網(wǎng)絡(luò)、通信網(wǎng)絡(luò)、2.通信設(shè)備、通信設(shè)備、3.通信資源、通信資源、 通信網(wǎng)絡(luò)通信網(wǎng)絡(luò) 和和 通信設(shè)備通信設(shè)備 -構(gòu)成寬廣平坦的路面,構(gòu)成寬廣平坦的路面, 信息資源就是公路上行駛的車輛,信息資源就是公路上行駛的車輛, 三者構(gòu)成一個(gè)有機(jī)的整體三者構(gòu)成一個(gè)有機(jī)的整體。 信息高速公路將對社會(huì)經(jīng)濟(jì),人們的工作和社會(huì)模式以及信息高速公路將對社會(huì)經(jīng)濟(jì),人們的工作和社會(huì)模式以及教育、科研等產(chǎn)生深遠(yuǎn)的影響教育、科研等產(chǎn)生深遠(yuǎn)的影響。9計(jì)算機(jī)檢索基礎(chǔ)計(jì)
11、算機(jī)檢索基礎(chǔ)一、計(jì)算機(jī)文獻(xiàn)信息檢索的定義計(jì)算機(jī)文獻(xiàn)信息檢索的定義 計(jì)算機(jī)文獻(xiàn)信息檢索計(jì)算機(jī)文獻(xiàn)信息檢索: 就是利用計(jì)算機(jī)對信息的存貯和檢索。 或者說,利用計(jì)算機(jī)對信息和數(shù)據(jù)的高速處理能力來存貯數(shù)據(jù),并從中查找、取出數(shù)據(jù)這樣一個(gè)過程。 存貯檢索檢索與10(1)信息信息的的存貯過程存貯過程: 就是將大量分散的文獻(xiàn)資料進(jìn)行收集、整理、評價(jià)、選擇、標(biāo)引、編寫文摘、著錄等,直到輸入計(jì)算機(jī),建立起計(jì)算機(jī)可以閱讀和分析處理的數(shù)據(jù)庫的過程。 (2)信息信息的的檢索過程檢索過程: 就是將用戶提出的查詢要求,賦予一定的檢索標(biāo)識(shí),按照一定的要求輸入 到計(jì)算機(jī)中,由計(jì)算機(jī)系統(tǒng)對其進(jìn)行處理,并與已存貯在計(jì)算機(jī)中的信息進(jìn)
12、行運(yùn)算、匹配,最后將檢索結(jié)果按用戶要求輸出。11 文獻(xiàn)收集文獻(xiàn)收集文獻(xiàn)加工文獻(xiàn)加工 文獻(xiàn)輸入文獻(xiàn)輸入數(shù)據(jù)庫數(shù)據(jù)庫計(jì)算機(jī)文獻(xiàn)信息檢索系統(tǒng)計(jì)算機(jī)文獻(xiàn)信息檢索系統(tǒng)檢檢索索結(jié)結(jié)果果提問文獻(xiàn)提問文獻(xiàn)提問輸入提問輸入提問表述提問表述用戶查詢用戶查詢示意圖示意圖存存 貯貯 檢索檢索12二、計(jì)算機(jī)文獻(xiàn)信息檢索系統(tǒng)的構(gòu)計(jì)算機(jī)文獻(xiàn)信息檢索系統(tǒng)的構(gòu)成成 計(jì)算機(jī)文獻(xiàn)信息檢索系統(tǒng)計(jì)算機(jī)文獻(xiàn)信息檢索系統(tǒng)主要由主要由:計(jì)算機(jī)硬件,軟件,數(shù)據(jù)庫:計(jì)算機(jī)硬件,軟件,數(shù)據(jù)庫構(gòu)成構(gòu)成。 (一)(一)硬件硬件 計(jì)算機(jī)計(jì)算機(jī)硬件硬件是指進(jìn)行信息輸入、輸出、存貯、運(yùn)算和傳遞是指進(jìn)行信息輸入、輸出、存貯、運(yùn)算和傳遞的實(shí)體(包括以計(jì)算機(jī)為中
13、心的一系列機(jī)器設(shè)備),它可以的實(shí)體(包括以計(jì)算機(jī)為中心的一系列機(jī)器設(shè)備),它可以是大、中、小型計(jì)算機(jī),也可以是微機(jī)、打印機(jī)及電源設(shè)備是大、中、小型計(jì)算機(jī),也可以是微機(jī)、打印機(jī)及電源設(shè)備和通信設(shè)備及網(wǎng)絡(luò)系統(tǒng)等,其中影響檢索系統(tǒng)功能的是和通信設(shè)備及網(wǎng)絡(luò)系統(tǒng)等,其中影響檢索系統(tǒng)功能的是CPU的運(yùn)算速度,內(nèi)外存容量。的運(yùn)算速度,內(nèi)外存容量。 (二)(二)軟件軟件 計(jì)算機(jī)計(jì)算機(jī)軟件軟件又叫計(jì)算機(jī)程序,是指控制計(jì)算機(jī)進(jìn)行各種作又叫計(jì)算機(jī)程序,是指控制計(jì)算機(jī)進(jìn)行各種作業(yè)的一系列指令和進(jìn)行業(yè)的一系列指令和進(jìn)行“人機(jī)對話人機(jī)對話”及各種數(shù)據(jù)的存貯和傳及各種數(shù)據(jù)的存貯和傳輸?shù)妮數(shù)摹胺g翻譯”規(guī)則。計(jì)算機(jī)軟件包括系
14、統(tǒng)軟件和應(yīng)用系統(tǒng)軟規(guī)則。計(jì)算機(jī)軟件包括系統(tǒng)軟件和應(yīng)用系統(tǒng)軟件等。件等。 13(三)電子信息源電子信息源 1、數(shù)據(jù)庫(數(shù)據(jù)庫(Database)- 重點(diǎn)掌握重點(diǎn)掌握 (1)數(shù)據(jù)庫的定義數(shù)據(jù)庫的定義 數(shù)據(jù)庫數(shù)據(jù)庫: 是一種計(jì)算機(jī)能夠閱讀并處理的文字型是一種計(jì)算機(jī)能夠閱讀并處理的文字型或或數(shù)字型數(shù)據(jù)數(shù)字型數(shù)據(jù)的的集合體集合體。 或者說或者說: 數(shù)據(jù)庫是以特定的組織方式將相互關(guān)聯(lián)的數(shù)據(jù)集合、數(shù)據(jù)庫是以特定的組織方式將相互關(guān)聯(lián)的數(shù)據(jù)集合、存貯的總匯存貯的總匯。 計(jì)算機(jī)文獻(xiàn)信息檢索系統(tǒng)數(shù)據(jù)庫數(shù)據(jù)庫是一定專業(yè)范圍內(nèi)信息記錄及其索引的集合體。 一個(gè)一個(gè) 數(shù)據(jù)庫數(shù)據(jù)庫 相當(dāng)于相當(dāng)于 一種一種 書本式書本式 手工
15、檢索手工檢索工具工具。 數(shù)據(jù)庫記錄字段14文獻(xiàn)數(shù)據(jù)庫結(jié)構(gòu)文獻(xiàn)數(shù)據(jù)庫結(jié)構(gòu):存取號(hào) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .標(biāo)題著者刊名 卷期 頁碼 出版年 類型 文種 主題詞 文摘010001010002010003Han qdMa dlHan jsEngEngChina 腫瘤基因心血管neoplasm cancer tumor carcinoma15計(jì)算機(jī)檢索原理計(jì)算機(jī)檢索原理順排文檔順排文檔:數(shù)據(jù)庫中全部記錄按一定順序排列而成的文獻(xiàn)記錄集合。順排文檔順排文檔(Sequential File)是大量記錄)
16、是大量記錄(Records)的集合,的集合,按文獻(xiàn)紀(jì)錄按文獻(xiàn)紀(jì)錄入編的存取入編的存取號(hào)號(hào)從小從小到到大依次排列大依次排列的的目錄式文檔。目錄式文檔。它相當(dāng)于它相當(dāng)于印刷型手工檢索工具的正文題錄印刷型手工檢索工具的正文題錄或或文摘部分。文摘部分。16倒排文檔倒排文檔:將數(shù)據(jù)庫中記錄的全部文獻(xiàn)特征特征標(biāo)識(shí)按一 定順序排列而成的文獻(xiàn)記錄集合。倒排文檔倒排文檔(Inverted File) 是是從從順排文檔記錄中順排文檔記錄中抽出抽出的的每一個(gè)每一個(gè)文獻(xiàn)特征文獻(xiàn)特征的標(biāo)識(shí)的標(biāo)識(shí)作為作為存貯單元,存貯單元,并按某種順序排列并按某種順序排列(字順、分類號(hào)、(字順、分類號(hào)、序號(hào))排列,同時(shí)在每一個(gè)標(biāo)識(shí)后面注
17、明相應(yīng)的文獻(xiàn)序號(hào))排列,同時(shí)在每一個(gè)標(biāo)識(shí)后面注明相應(yīng)的文獻(xiàn)紀(jì)錄存取號(hào)。紀(jì)錄存取號(hào)。不同類型的標(biāo)識(shí)可形成不同的倒排文檔,不同類型的標(biāo)識(shí)可形成不同的倒排文檔,-如如著者著者倒排文檔倒排文檔(即著者索引)、(即著者索引)、 主題主題倒排文檔倒排文檔(即主題索引)等等。(即主題索引)等等。17倒排文檔:倒排文檔:著者倒排文檔著者文種主題詞010001010002Ma dlHan jsEngEngChina腫瘤心血管基因Han qd存取號(hào)010003 . . . . . . . . . . . . . . . . . . 010001010002存取號(hào)010003010001010002存取號(hào)01000
18、3主題主題詞倒排文檔文種文種倒排文檔18 數(shù)據(jù)庫是計(jì)算機(jī)信息檢索系統(tǒng)中的重要組成部分?jǐn)?shù)據(jù)庫是計(jì)算機(jī)信息檢索系統(tǒng)中的重要組成部分,是信息源,是檢索的是信息源,是檢索的對象。對象。 (2)數(shù)據(jù)庫的結(jié)構(gòu)數(shù)據(jù)庫的結(jié)構(gòu):(文檔文檔.、字段字段、) 數(shù)據(jù)庫數(shù)據(jù)庫由由1至至數(shù)個(gè)數(shù)個(gè)文檔文檔構(gòu)成,構(gòu)成,文檔文檔(File)是由存貯在磁)是由存貯在磁帶、磁盤或光盤等帶、磁盤或光盤等載體上載體上的一條條記錄組成。的一條條記錄組成。 就就書目數(shù)據(jù)庫書目數(shù)據(jù)庫而言,一條文獻(xiàn)記錄(而言,一條文獻(xiàn)記錄(Record)就是一篇)就是一篇文章,一本書或一種雜志文章,一本書或一種雜志 的的 描述體。描述體。 構(gòu)成構(gòu)成記錄記錄的
19、的基本基本單位單位為為字段字段。 記錄由一系列記錄由一系列字段字段組成,組成,如如主題詞、文摘、著者等。主題詞、文摘、著者等。 紀(jì)錄紀(jì)錄( Records )是數(shù)據(jù)庫中一個(gè)完整的信息單元,由)是數(shù)據(jù)庫中一個(gè)完整的信息單元,由一系列字段一系列字段(Fields)構(gòu)成。)構(gòu)成。-相當(dāng)于手檢工具的題錄相當(dāng)于手檢工具的題錄或或文摘文摘。 構(gòu)成記錄的基本單位為字段。構(gòu)成記錄的基本單位為字段。19字段字段(Field)是數(shù)據(jù)庫的基本元件)是數(shù)據(jù)庫的基本元件, 也叫數(shù)據(jù)元也叫數(shù)據(jù)元(Data Element)。)。 字段字段的實(shí)體就是文獻(xiàn)著錄中的的實(shí)體就是文獻(xiàn)著錄中的“項(xiàng)項(xiàng)”,它反映一條記錄,它反映一條記錄
20、中中各著錄項(xiàng)的屬性,各著錄項(xiàng)的屬性,如如:著者著者項(xiàng)項(xiàng)、篇名、篇名項(xiàng)項(xiàng)、出處、出處項(xiàng)項(xiàng)等。等。有些字段有些字段還被分為還被分為-幾個(gè)幾個(gè)子字段子字段(Subfield),), 如如來源(來源(Source)字段,)字段,被劃分被劃分為為刊名,出版年、頁碼刊名,出版年、頁碼等等子字段。子字段。子字段子字段: 刊名,出版年、頁碼等刊名,出版年、頁碼等為為子字段。子字段。20字段字段(Fields) 是著錄文獻(xiàn)各項(xiàng)的名稱及其內(nèi)容,是著錄文獻(xiàn)各項(xiàng)的名稱及其內(nèi)容,是描述文獻(xiàn)內(nèi)容外特征的各項(xiàng)標(biāo)識(shí)內(nèi)容。是描述文獻(xiàn)內(nèi)容外特征的各項(xiàng)標(biāo)識(shí)內(nèi)容。字段字段 相當(dāng)于題錄相當(dāng)于題錄或或文摘中的各項(xiàng)目名稱文摘中的各項(xiàng)目名稱
21、, 如如: 題名題名(TI)、)、著者著者(AU )、地址地址(AD)、出處出處(SO)、主題詞主題詞(MESH主要主題詞主要主題詞(MMH,MJMH)、 關(guān)鍵詞關(guān)鍵詞(KW)、特征詞、特征詞(TG)、 出版年出版年(PY)、語種語種(LA)、摘要(摘要(AB)等等。等等。CBMDISC光盤檢索光盤檢索(CBMLARS的使用的使用)標(biāo)識(shí)符標(biāo)識(shí)符字段名稱字段名稱 注釋注釋 屬性屬性AA 著者文摘著者文摘AB 文摘文摘 AD 地址地址 (第一著者地址第一著者地址)AD1 國省市名國省市名 (第一著者省市名第一著者省市名)AF 原文出處原文出處 (譯文原文出處譯文原文出處)AU 著者著者CA 索取號(hào)
22、索取號(hào) (醫(yī)情所會(huì)議、匯編內(nèi)部編碼醫(yī)情所會(huì)議、匯編內(nèi)部編碼)CN 國內(nèi)代碼國內(nèi)代碼 (國內(nèi)期刊代碼國內(nèi)期刊代碼) 22標(biāo)識(shí)符標(biāo)識(shí)符字段名稱字段名稱 注釋注釋 屬性屬性CL 分類號(hào)分類號(hào)CT 特征詞特征詞 FS 資助類別資助類別ID 資助編號(hào)資助編號(hào)IS ISSN (國際期刊代碼國際期刊代碼)JC 內(nèi)部代碼內(nèi)部代碼 (醫(yī)情所期刊內(nèi)部代碼醫(yī)情所期刊內(nèi)部代碼)LA 語種語種 (缺省值為中文缺省值為中文)MA 會(huì)議地點(diǎn)會(huì)議地點(diǎn)MH 主題詞主題詞標(biāo)識(shí)符標(biāo)識(shí)符字段名稱字段名稱 注釋注釋 屬屬性性(MMH) MMH (主要概念主題詞主要概念主題詞)NI 團(tuán)體著者團(tuán)體著者PA 分冊分冊PG 頁碼頁碼IP 期期
23、PP 出版地出版地 (期刊出版地期刊出版地)PY 出版年出版年P(guān)T 文獻(xiàn)類型文獻(xiàn)類型24標(biāo)識(shí)符標(biāo)識(shí)符字段名稱字段名稱 注釋注釋 屬性屬性RF 參文數(shù)參文數(shù) (參考文獻(xiàn)數(shù)參考文獻(xiàn)數(shù))(SO) 出處出處 (復(fù)合字段復(fù)合字段:TA,PY,VI,IP,PG)SU 增刊增刊TA 期刊名稱期刊名稱 TI 中文題目中文題目 TT 英文題目英文題目TW 關(guān)鍵詞關(guān)鍵詞 VI 卷卷UI 流水號(hào)流水號(hào)25 標(biāo)識(shí)符標(biāo)識(shí)符 字段名稱字段名稱 屬性屬性 TI Title(篇名) AU Author(著者) AD Address of Author(著者通訊地址) SO Source(文獻(xiàn)來源) PY Publicatio
24、n Year(出版年) * LA Language(文獻(xiàn)語種) * CP Country of Publication(出版國家) * AB Abstract(摘要) 26 XREC Record Features(記錄特征記錄特征) * MESH Medical Subject Headings(醫(yī)學(xué)主題詞醫(yī)學(xué)主題詞) MIME Minor MeSH Headings(次要次要MeSH詞詞) MJME Major MeSH Headings(主要主要MeSH詞詞) SH Subheadings(副主題詞副主題詞) * PS Personal Name as Subject(人名作為主題詞人名
25、作為主題詞) CN Contract or Grant Numbers(合同號(hào)或資助號(hào)合同號(hào)或資助號(hào)) RN CAS Registry Number(化學(xué)物質(zhì)登記號(hào)或酶號(hào)化學(xué)物質(zhì)登記號(hào)或酶號(hào))27 標(biāo)識(shí)符標(biāo)識(shí)符 字段名稱字段名稱 屬性屬性 NM Name of Substance(物質(zhì)名稱物質(zhì)名稱) IS International Standard Serial Number (國際標(biāo)準(zhǔn)刊號(hào)國際標(biāo)準(zhǔn)刊號(hào)) * TG Checktags(特征詞特征詞) * AN Accession Number(存取號(hào)存取號(hào)) * UD Update code(更新代碼更新代碼) * SI Secondary
26、 Source Identifier(第二文獻(xiàn)來源標(biāo)識(shí)第二文獻(xiàn)來源標(biāo)識(shí)) SB Subset(MEDLINE子集子集) * CM Comments(評論評論) GS Gene Symbol(基因符號(hào)基因符號(hào)) PT Publication Type(出版類型出版類型) *帶帶*號(hào)為限制性字段,其它為號(hào)為限制性字段,其它為“基本字段或默認(rèn)字段基本字段或默認(rèn)字段”28= (等于等于) PY=1992 (小于小于) PY ( 大于大于) PY1992 出版年出版年1992= (小于等于小于等于) PY=1984 出版年出版年= (大于等于大于等于) PY=1992 出版年出版年=1992 (指定范圍
27、指定范圍) PY=1990-1992 出版年出版年=1990-199229限制檢索限制檢索: 全部字段全部字段: 腫瘤腫瘤 in all 限定符限定符 in 和和 = 的使用:的使用: in 可用于可用于全部字段全部字段 = 只能用于只能用于某些字段某些字段30計(jì)算機(jī)檢索的基本知識(shí)計(jì)算機(jī)檢索的基本知識(shí)數(shù)據(jù)庫數(shù)據(jù)庫記錄與字段記錄與字段數(shù)據(jù)庫類型數(shù)據(jù)庫類型31基本知識(shí)基本知識(shí):數(shù)據(jù)庫數(shù)據(jù)庫l存儲(chǔ)在計(jì)算機(jī)相關(guān)設(shè)備的數(shù)據(jù)集合。存儲(chǔ)在計(jì)算機(jī)相關(guān)設(shè)備的數(shù)據(jù)集合。l設(shè)備:磁帶、磁盤(硬盤、軟盤)、設(shè)備:磁帶、磁盤(硬盤、軟盤)、光盤等。光盤等。32數(shù)據(jù)庫結(jié)構(gòu)數(shù)據(jù)庫結(jié)構(gòu)l記錄:構(gòu)成數(shù)據(jù)庫的信息單元記錄:構(gòu)成數(shù)
28、據(jù)庫的信息單元l字段:一條記錄字段:一條記錄中中各個(gè)數(shù)據(jù)項(xiàng)。各個(gè)數(shù)據(jù)項(xiàng)。標(biāo)題:標(biāo)題:作者:作者:地址:地址:文摘:文摘:各個(gè)字段各個(gè)字段33 (3)數(shù)據(jù)庫的分類數(shù)據(jù)庫的分類 據(jù)統(tǒng)計(jì),目前世界上有近萬種數(shù)據(jù)庫。數(shù)據(jù)一般依存貯對象區(qū)分為:據(jù)統(tǒng)計(jì),目前世界上有近萬種數(shù)據(jù)庫。數(shù)據(jù)一般依存貯對象區(qū)分為: 數(shù)值型數(shù)據(jù)庫、事實(shí)型數(shù)據(jù)庫、文獻(xiàn)型數(shù)據(jù)庫。數(shù)值型數(shù)據(jù)庫、事實(shí)型數(shù)據(jù)庫、文獻(xiàn)型數(shù)據(jù)庫。 (A)數(shù)值型數(shù)據(jù)庫數(shù)值型數(shù)據(jù)庫: 是以數(shù)值為主要內(nèi)容的數(shù)據(jù)庫是以數(shù)值為主要內(nèi)容的數(shù)據(jù)庫,除存貯各類數(shù)值外,還存貯運(yùn)算公式,規(guī)劃(如貨幣兌換算)等。金融、證券系統(tǒng)數(shù)據(jù)庫大多屬于此類。 (B)事實(shí)型數(shù)據(jù)庫事實(shí)型數(shù)據(jù)庫: 是
29、指既有數(shù)字又有文字的數(shù)據(jù)庫是指既有數(shù)字又有文字的數(shù)據(jù)庫,如人口數(shù)據(jù)庫、名錄數(shù)據(jù)庫、自然資源數(shù)據(jù)庫,社會(huì)調(diào)查數(shù)據(jù)庫等,總是以特定的事實(shí)或數(shù)字回答用戶的查詢。 (C)文獻(xiàn)型數(shù)據(jù)庫文獻(xiàn)型數(shù)據(jù)庫: 是指以各類型文獻(xiàn)為內(nèi)容的數(shù)據(jù)庫是指以各類型文獻(xiàn)為內(nèi)容的數(shù)據(jù)庫,包括最為常見的二次文獻(xiàn)數(shù)據(jù)庫,如書目、索引、文摘等。隨著計(jì)算機(jī)技術(shù)進(jìn)步,全文數(shù)據(jù)庫、超文本型數(shù)據(jù)庫等不斷出現(xiàn)新型數(shù)據(jù)庫。如中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫、中藥藥典數(shù)據(jù)庫、法律數(shù)據(jù)庫、人民日報(bào)數(shù)據(jù)庫、MEDLINE數(shù)據(jù)庫等等。 34實(shí)例說明實(shí)例說明:1).書目檢索書目檢索,例如例如“有關(guān)海底隧道有些什么文有關(guān)海底隧道有些什么文獻(xiàn)?獻(xiàn)?”(見文獻(xiàn)檢索見文獻(xiàn)檢
30、索); 2).事實(shí)檢索事實(shí)檢索,例如例如“世界最長的海底隧道是哪一世界最長的海底隧道是哪一條?條?”; 3).數(shù)值檢索數(shù)值檢索,例如,例如“某海底隧道有多長?某海底隧道有多長?”;4).文獻(xiàn)全文檢索文獻(xiàn)全文檢索,所檢索出來的是有關(guān)文獻(xiàn)的全文,所檢索出來的是有關(guān)文獻(xiàn)的全文,可能回答可能回答-例如例如“某文獻(xiàn)某文獻(xiàn)全文中全文中有哪些句子提到了海有哪些句子提到了海底隧道?底隧道?”的問題。的問題。35由于數(shù)據(jù)庫內(nèi)信息存在形態(tài)不同和物理存放位置不同,數(shù)據(jù)庫還可分為:層次型數(shù)據(jù)庫、網(wǎng)狀型數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫或分為集中型數(shù)據(jù)庫系統(tǒng)和分布式數(shù)據(jù)庫系統(tǒng)。 (4)數(shù)據(jù)庫的發(fā)展趨勢數(shù)據(jù)庫的發(fā)展趨勢 a)數(shù)據(jù)庫與In
31、ternet結(jié)合,即數(shù)據(jù)庫上網(wǎng)運(yùn)行; b)將相關(guān)數(shù)據(jù)庫集合在一起,組成數(shù)據(jù)倉庫(Data Warehouse); c)隨著全球信息高速公路的發(fā)展,聯(lián)機(jī)數(shù)據(jù)庫將占據(jù)數(shù)據(jù)庫媒體的統(tǒng)治地位,光盤數(shù)據(jù)庫數(shù)量將逐漸減少。 (四)網(wǎng)絡(luò)電子信息源網(wǎng)絡(luò)電子信息源 由于Internet的發(fā)展,傳統(tǒng)的聯(lián)機(jī)網(wǎng)絡(luò)的局限性顯得越來越明顯,以致目前世界上許多的聯(lián)機(jī)系統(tǒng)如American Online,DIALOG,STN等都上了網(wǎng)絡(luò),成為Internet網(wǎng)絡(luò)的一部分。、網(wǎng)絡(luò)電子信息源的特點(diǎn)有網(wǎng)絡(luò)電子信息源的特點(diǎn)有:()以網(wǎng)絡(luò)為傳播媒體;36 ()以多媒體為內(nèi)容特征;()傳播方式具有多樣性,交互性。2、網(wǎng)絡(luò)電子信息源的類型
32、分為:網(wǎng)絡(luò)電子信息源的類型分為: a)聯(lián)機(jī)數(shù)據(jù)庫;聯(lián)機(jī)數(shù)據(jù)庫; b)聯(lián)機(jī)館藏目錄庫;聯(lián)機(jī)館藏目錄庫; c)電子圖書;電子圖書; d)電子期刊;電子期刊; e)電子報(bào)紙;電子報(bào)紙; f)軟件與娛樂游戲類;軟件與娛樂游戲類; g)教育培訓(xùn)類;教育培訓(xùn)類; h)動(dòng)態(tài)性信息類。動(dòng)態(tài)性信息類。37計(jì)算機(jī)檢索文獻(xiàn)信息的步驟與方法計(jì)算機(jī)檢索文獻(xiàn)信息的步驟與方法計(jì)算機(jī)檢索和手工檢索的目的一致,所使用的檢索計(jì)算機(jī)檢索和手工檢索的目的一致,所使用的檢索工具的內(nèi)容一致,兩者之間的區(qū)別僅僅由于文獻(xiàn)信息載工具的內(nèi)容一致,兩者之間的區(qū)別僅僅由于文獻(xiàn)信息載體的不同而引起的一些操作方法上的不同。體的不同而引起的一些操作方法上
33、的不同。計(jì)算機(jī)檢索文獻(xiàn)信息步驟如下:計(jì)算機(jī)檢索文獻(xiàn)信息步驟如下:一、一、分析檢索課題,明確檢索要求分析檢索課題,明確檢索要求二、二、選擇數(shù)據(jù)庫選擇數(shù)據(jù)庫 三、制定檢索策略制定檢索策略38目前全世界有近萬種數(shù)據(jù)庫,目前全世界有近萬種數(shù)據(jù)庫,選擇數(shù)據(jù)庫時(shí)應(yīng)選擇數(shù)據(jù)庫時(shí)應(yīng)注意以下幾點(diǎn):以下幾點(diǎn): 、數(shù)據(jù)庫收錄的文獻(xiàn)內(nèi)容;、數(shù)據(jù)庫收錄的文獻(xiàn)內(nèi)容;、數(shù)據(jù)庫收錄文獻(xiàn)的出版類型;、數(shù)據(jù)庫收錄文獻(xiàn)的出版類型;、是否能索取到原文;、是否能索取到原文;、數(shù)據(jù)庫的收費(fèi)標(biāo)準(zhǔn);、數(shù)據(jù)庫的收費(fèi)標(biāo)準(zhǔn);、數(shù)據(jù)庫中收錄文獻(xiàn)的時(shí)間范圍;、數(shù)據(jù)庫中收錄文獻(xiàn)的時(shí)間范圍;、數(shù)據(jù)庫的更新情況。、數(shù)據(jù)庫的更新情況。39 制定檢索策略制定檢
34、索策略包括包括: 選擇選擇檢索詞檢索詞、確定確定檢索詞檢索詞之間之間的邏輯、位置的邏輯、位置關(guān)系關(guān)系。 制定檢索策略的制定檢索策略的兩個(gè)兩個(gè)重要概念是重要概念是: 查準(zhǔn)率查準(zhǔn)率,查全率查全率。 (1)申請科研項(xiàng)目)申請科研項(xiàng)目或或鑒定科研成果檢索文獻(xiàn),要求有較高的鑒定科研成果檢索文獻(xiàn),要求有較高的查全率查全率; (2)搶救一個(gè)危重病、疑難病作特殊治療方案需檢索文獻(xiàn)時(shí),)搶救一個(gè)危重病、疑難病作特殊治療方案需檢索文獻(xiàn)時(shí),要求有較高的要求有較高的查準(zhǔn)率查準(zhǔn)率。 40檢索效率檢索效率,張琪玉教授在張琪玉教授在情報(bào)語言學(xué)基礎(chǔ)情報(bào)語言學(xué)基礎(chǔ)一書中,一書中,概括概括為為“全、準(zhǔn)、快、便、省全、準(zhǔn)、快、便、
35、省”五五個(gè)字,個(gè)字,“全全”指指檢全率檢全率,“準(zhǔn)準(zhǔn)”指指檢準(zhǔn)率檢準(zhǔn)率,“快快”指檢索速度快,指檢索速度快,“便便”指檢索方便性,指檢索方便性,“省省”指檢索成本與效益。指檢索成本與效益。其主要是其主要是全全和和準(zhǔn)準(zhǔn)。檢全率檢全率和和檢準(zhǔn)率可用下列檢準(zhǔn)率可用下列公式公式表示:表示:4142與與檢全率檢全率對應(yīng)的是對應(yīng)的是漏檢率漏檢率,即未被檢出的相關(guān)文獻(xiàn),即未被檢出的相關(guān)文獻(xiàn)數(shù)與檢索系統(tǒng)中相關(guān)文獻(xiàn)總數(shù)的百分比數(shù)與檢索系統(tǒng)中相關(guān)文獻(xiàn)總數(shù)的百分比;與與檢準(zhǔn)率檢準(zhǔn)率對應(yīng)的是對應(yīng)的是誤檢率誤檢率,即指那些帶出的無關(guān)文,即指那些帶出的無關(guān)文獻(xiàn)與檢出文獻(xiàn)總數(shù)的百分比。獻(xiàn)與檢出文獻(xiàn)總數(shù)的百分比。檢全率檢全率
36、和和漏檢率漏檢率、檢準(zhǔn)率、檢準(zhǔn)率和和誤檢率誤檢率分別是分別是同一問題同一問題的的兩個(gè)相對兩個(gè)相對的概念。的概念。43一一、分類索引分類索引 產(chǎn)生產(chǎn)生 漏檢漏檢 和和 誤檢誤檢 的原因的原因1 、 檢索范圍檢索范圍大于大于檢索要求檢索要求 例如例如:要檢索的只是要檢索的只是“關(guān)于肺原性心臟病關(guān)于肺原性心臟病”的文獻(xiàn),的文獻(xiàn),其實(shí)其實(shí)只要查只要查“R541.5肺原性心臟病肺原性心臟病”就可以了,就可以了,但讀者往往翻遍所有但讀者往往翻遍所有“R54心臟、血管(循環(huán)系)疾病心臟、血管(循環(huán)系)疾病”或或“R541心臟疾病心臟疾病”,浪費(fèi)了時(shí)間,增加了誤檢。,浪費(fèi)了時(shí)間,增加了誤檢?!瓣P(guān)于肺原性心臟病
37、關(guān)于肺原性心臟病” R 541.5三三級類目級類目-查找就可以了查找就可以了 R54為二級類目為二級類目442、 檢索范圍檢索范圍小于小于檢索要求檢索要求 例如例如 要檢索要檢索:“關(guān)于腎疾病關(guān)于腎疾病”的文獻(xiàn),應(yīng)當(dāng)查的文獻(xiàn),應(yīng)當(dāng)查“R692【腎疾病】【腎疾病】”、“R527.1【腎結(jié)核】【腎結(jié)核】”、“R737.11【腎、腎盂腫瘤】【腎、腎盂腫瘤】”等類目,如等類目,如包括包括小兒腎疾病,還需查小兒腎疾病,還需查“R726.92【小兒腎疾病】【小兒腎疾病】”?!癛726.92【小兒腎疾病】【小兒腎疾病】”如果只查了如果只查了R692及其及其下位類下位類,就會(huì)產(chǎn)生漏檢。,就會(huì)產(chǎn)生漏檢。需查需查
38、:四個(gè)類目:四個(gè)類目 R692 ; R527.1 ; R737.11; R726.92 ;四類目都四類目都需要查到需要查到453 、檢索范圍與實(shí)際文獻(xiàn)需要不符檢索范圍與實(shí)際文獻(xiàn)需要不符,產(chǎn)生漏檢和誤檢,產(chǎn)生漏檢和誤檢. 如如檢索檢索: “糖尿病糖尿病 并發(fā)并發(fā)青光眼青光眼” 的文獻(xiàn),的文獻(xiàn),誤到誤到 “R775.3繼發(fā)性青光眼繼發(fā)性青光眼” -類目下查找,結(jié)果產(chǎn)生類目下查找,結(jié)果產(chǎn)生-漏檢?漏檢?應(yīng)到應(yīng)到 “R587.1糖尿病糖尿病”和和 “R587.2糖尿病性昏迷及其他糖尿病性昏迷及其他并發(fā)癥并發(fā)癥”這兩個(gè)專這兩個(gè)專類類中查找才是恰如其分的。中查找才是恰如其分的。 (參閱張琪玉:(參閱張琪玉
39、:分類目錄產(chǎn)生漏檢和誤檢的原因分類目錄產(chǎn)生漏檢和誤檢的原因, 刊載于刊載于圖書情報(bào)知識(shí)圖書情報(bào)知識(shí)1980年第一期)。)。463 、檢索范圍檢索范圍與與實(shí)際文獻(xiàn)需要不符實(shí)際文獻(xiàn)需要不符,產(chǎn)生漏檢和誤檢,產(chǎn)生漏檢和誤檢.糖尿病糖尿病 并發(fā)并發(fā) 青光眼青光眼R775.3繼發(fā)性青光眼繼發(fā)性青光眼”類目下查找類目下查找,結(jié)果產(chǎn)生漏檢,結(jié)果產(chǎn)生漏檢R587.1R587.2糖尿病糖尿病糖尿病性昏迷糖尿病性昏迷及其他及其他并發(fā)癥并發(fā)癥47一、一、主題索引主題索引 產(chǎn)生產(chǎn)生 漏檢漏檢 和和 誤檢誤檢 的原因的原因1 、 檢索范圍大于檢索要求檢索范圍大于檢索要求 如要如要查閱查閱: “腭裂的外科手術(shù)腭裂的外科手
40、術(shù)”文獻(xiàn),文獻(xiàn), 只要檢索只要檢索 “腭裂腭裂/外科手術(shù)外科手術(shù)”(CLEFT PALATE / SURGERY)就可以了,就可以了,檢索者卻檢索者卻沒有組配沒有組配,用,用“腭裂腭裂”查找,甚至用查找,甚至用“外科外科手手術(shù)術(shù)”,“口腔口腔”(SURGERY,ORAL)來檢索,檢索來檢索,檢索出出不不少少無關(guān)文獻(xiàn),無關(guān)文獻(xiàn),增加了增加了誤檢。誤檢。482 、 檢索范圍小于檢索要求檢索范圍小于檢索要求 如要查如要查:“關(guān)于血壓關(guān)于血壓”的文獻(xiàn),的文獻(xiàn),只檢索了只檢索了“血壓血壓”(BLOOD PRESSURE)這一主題,而這一主題,而未未檢索檢索-“高血壓高血壓”(HYPERTENSION)和
41、和“低血壓低血壓”(HYPOTENSION)這兩個(gè)主題,這兩個(gè)主題, 而而產(chǎn)生產(chǎn)生漏檢。漏檢。493 、 檢索范圍檢索范圍與與檢索需要不符檢索需要不符 如要查幽門梗阻的文獻(xiàn),詞表中沒有這個(gè)詞,如要查幽門梗阻的文獻(xiàn),詞表中沒有這個(gè)詞,靠靠題題標(biāo)引為標(biāo)引為“幽門狹窄幽門狹窄”,結(jié)果,結(jié)果 一無所獲一無所獲 或或 收效收效 甚微。甚微。其實(shí)其實(shí)詞表詞表中有中有“胃出口梗阻胃出口梗阻”, 由于未查到由于未查到專指詞專指詞使漏檢增加。使漏檢增加。504、 不適當(dāng)?shù)乩貌紶栠壿嫳磉_(dá)式不適當(dāng)?shù)乩貌紶栠壿嫳磉_(dá)式 邏輯(邏輯(AND)用的太多,使檢索范圍縮小,使檢全)用的太多,使檢索范圍縮小,使檢全率降低;率
42、降低;邏輯或(邏輯或(OR)用的太多,必然查出一些不相關(guān)文獻(xiàn),)用的太多,必然查出一些不相關(guān)文獻(xiàn),導(dǎo)致檢準(zhǔn)率降低;導(dǎo)致檢準(zhǔn)率降低;邏輯非(邏輯非(NOT)用的越多,檢全率越低。)用的越多,檢全率越低。515 、 截詞檢索截詞檢索 截詞檢索可擴(kuò)大檢索的網(wǎng)羅度(即標(biāo)引深度),截詞檢索可擴(kuò)大檢索的網(wǎng)羅度(即標(biāo)引深度),提高提高檢全率,但檢準(zhǔn)率檢全率,但檢準(zhǔn)率下降下降,因此,切忌將詞干截得,因此,切忌將詞干截得過短。過短。人們總希望有參考價(jià)值的文獻(xiàn)全部被檢出,被檢出的人們總希望有參考價(jià)值的文獻(xiàn)全部被檢出,被檢出的文獻(xiàn)都是有參考價(jià)值的,即檢全率是文獻(xiàn)都是有參考價(jià)值的,即檢全率是100%,檢準(zhǔn)率,檢準(zhǔn)率也
43、為也為100%。但實(shí)際上,不僅不可能達(dá)到這種理想的檢索效率,甚但實(shí)際上,不僅不可能達(dá)到這種理想的檢索效率,甚至要達(dá)到較高的檢索效率也不是很容易的。至要達(dá)到較高的檢索效率也不是很容易的。 52(一)(一)選擇檢索詞選擇檢索詞 注意使用規(guī)范化的醫(yī)學(xué)術(shù)語并能計(jì)算機(jī)識(shí)別。注意使用規(guī)范化的醫(yī)學(xué)術(shù)語并能計(jì)算機(jī)識(shí)別。(二)(二)選擇布爾邏輯運(yùn)算符選擇布爾邏輯運(yùn)算符 運(yùn)算符在計(jì)算機(jī)檢索中起著十分重要的作用它能用運(yùn)算符在計(jì)算機(jī)檢索中起著十分重要的作用它能用來組合檢索詞,構(gòu)成檢索語句,達(dá)到擴(kuò)大或縮小檢索來組合檢索詞,構(gòu)成檢索語句,達(dá)到擴(kuò)大或縮小檢索范圍,提高檢索效果的目的。范圍,提高檢索效果的目的。 該算符由英國
44、數(shù)學(xué)家喬治該算符由英國數(shù)學(xué)家喬治布爾提出,布爾提出, 也稱作布爾算符。也稱作布爾算符。 布爾邏輯符有布爾邏輯符有三三種:種: (1)邏輯乘(用)邏輯乘(用“AND”或或“”表示)表示) (2)邏輯加(用)邏輯加(用“OR”或或“+”表示)表示) (3)邏輯非(用)邏輯非(用“NOT”或或“-”表示表示53541、AND邏輯乘,通常也用邏輯乘,通常也用“”表示表示。 AND是是:具有概念交叉關(guān)系和限定關(guān)系的一種組配。具有概念交叉關(guān)系和限定關(guān)系的一種組配。 檢出文獻(xiàn)檢出文獻(xiàn)-需同時(shí)含有兩個(gè)或多個(gè)檢索詞。需同時(shí)含有兩個(gè)或多個(gè)檢索詞。 特點(diǎn)特點(diǎn):常用來縮小檢索范圍,常用來縮小檢索范圍,提高提高查準(zhǔn)率查
45、準(zhǔn)率。 例如:檢索式例如:檢索式Viruses AND Infection 邏輯與邏輯與 檢出的文獻(xiàn)檢出的文獻(xiàn) 特點(diǎn)特點(diǎn)是,凡是,凡 在同一篇文獻(xiàn)中在同一篇文獻(xiàn)中包括包括 有病毒有病毒同時(shí)也同時(shí)也包括包括傳染這兩個(gè)概念的文獻(xiàn)為命中文獻(xiàn)。傳染這兩個(gè)概念的文獻(xiàn)為命中文獻(xiàn)。邏輯乘示意圖邏輯乘示意圖55 例如:檢索由例如:檢索由 流行性感冒流行性感冒 引起引起 咳嗽咳嗽 的有關(guān)文獻(xiàn)的有關(guān)文獻(xiàn) 邏輯與邏輯與檢出的文獻(xiàn)特點(diǎn)是,凡在同一篇文獻(xiàn)中(用檢出的文獻(xiàn)特點(diǎn)是,凡在同一篇文獻(xiàn)中(用邏輯與邏輯與“AND”聯(lián)接),聯(lián)接),包括包括有流行性感冒有流行性感冒同時(shí)同時(shí)也包括也包括咳嗽這兩個(gè)概念的文獻(xiàn)為命中文獻(xiàn)咳嗽
46、這兩個(gè)概念的文獻(xiàn)為命中文獻(xiàn),下面兩圓的相重下面兩圓的相重疊部分為命中文獻(xiàn):疊部分為命中文獻(xiàn): 邏輯乘示意圖邏輯乘示意圖56簡例:邏輯運(yùn)算簡例:邏輯運(yùn)算 AND糖尿病的飲食治療糖尿病的飲食治療糖尿病糖尿病飲食治療飲食治療572、OR 邏輯和,通常用邏輯和,通常用“+”表示表示。 OR 是具有概念并列關(guān)系的一種組配是具有概念并列關(guān)系的一種組配。 檢出文獻(xiàn)可同時(shí)或只含其中任何一個(gè)檢索詞。 特點(diǎn)特點(diǎn):常用來擴(kuò)大檢索范圍,提高查全率常用來擴(kuò)大檢索范圍,提高查全率。 例如例如:檢索式檢索式Hepatitis A OR Hepatitis B 用這一檢索式可檢索出所有有關(guān)肝炎用這一檢索式可檢索出所有有關(guān)肝炎
47、A的文獻(xiàn)和所有有的文獻(xiàn)和所有有關(guān)肝炎關(guān)肝炎B的文獻(xiàn)的文獻(xiàn)。邏輯和(或)示意圖邏輯和(或)示意圖58 2、OR 邏輯和,通常用邏輯和,通常用“+”表示表示。 例如:檢索有關(guān)例如:檢索有關(guān)“流行性感冒流行性感冒或者或者咳嗽咳嗽”的一些文章,的一些文章,用邏輯或(也叫邏輯和)聯(lián)接。用邏輯或(也叫邏輯和)聯(lián)接。可檢索出可檢索出所有所有有關(guān)有關(guān)流行性感冒流行性感冒的文獻(xiàn)和的文獻(xiàn)和所有所有有關(guān)有關(guān)咳嗽的文獻(xiàn)咳嗽的文獻(xiàn),即兩圓非重疊部分的文獻(xiàn)。即兩圓非重疊部分的文獻(xiàn)。還可以檢索出那些還可以檢索出那些涉及涉及流行性感冒,流行性感冒,又涉及又涉及咳嗽的文獻(xiàn),即圖咳嗽的文獻(xiàn),即圖中兩圓相重疊部分的文獻(xiàn)。中兩圓相重
48、疊部分的文獻(xiàn)。邏輯和(或)示意圖邏輯和(或)示意圖59簡例:邏輯運(yùn)算簡例:邏輯運(yùn)算 ORl微量元素微量元素 與與 克山病克山病 的關(guān)系的關(guān)系A(chǔ)BC603、NOT 邏輯非邏輯非也叫也叫邏輯差,通常用邏輯差,通常用“-”或或“”表示表示。 “NOT”具有具有不不包含包含某種概念關(guān)系某種概念關(guān)系的一種的一種組配。組配。 或者說用于表達(dá)概念的排斥關(guān)系。從檢出文獻(xiàn)中剔除部分文獻(xiàn)。或者說用于表達(dá)概念的排斥關(guān)系。從檢出文獻(xiàn)中剔除部分文獻(xiàn)。特點(diǎn)特點(diǎn):一般用來縮小檢索范圍,增強(qiáng)專指性:一般用來縮小檢索范圍,增強(qiáng)專指性。例如:檢索式例如:檢索式Diarrhea NOT Vomiting這種檢索式可將文獻(xiàn)中排除即含
49、這種檢索式可將文獻(xiàn)中排除即含 腹瀉腹瀉 與與 嘔吐嘔吐 的文獻(xiàn),的文獻(xiàn), 檢出只帶檢出只帶-腹瀉文獻(xiàn)腹瀉文獻(xiàn)邏輯非示意圖邏輯非示意圖排斥排斥 2、3、需要、需要1文獻(xiàn)文獻(xiàn)61 3、NOT 邏輯非邏輯非也叫邏輯差也叫邏輯差,通常用,通常用“-”或或“”表示表示。例如:流行性感冒例如:流行性感冒; 流行性感冒引起咳嗽癥狀流行性感冒引起咳嗽癥狀; 咳嗽癥狀咳嗽癥狀要檢索有關(guān)要檢索有關(guān)不帶有不帶有咳嗽的流行性感冒的文獻(xiàn),用邏輯非咳嗽的流行性感冒的文獻(xiàn),用邏輯非“NOT”聯(lián)接,聯(lián)接,檢索檢索或或可將所有不帶有咳嗽的流行性感冒的文獻(xiàn)檢索出可將所有不帶有咳嗽的流行性感冒的文獻(xiàn)檢索出來來。但是在用但是在用邏輯
50、非邏輯非檢索時(shí),需要注意邏輯非還能把那些檢索時(shí),需要注意邏輯非還能把那些既論既論流流行性感冒行性感冒又論又論咳嗽的文獻(xiàn)咳嗽的文獻(xiàn) 排斥掉。排斥掉。邏輯非示意圖邏輯非示意圖62簡例:簡例:邏輯運(yùn)算邏輯運(yùn)算 NOTl非病毒性肝炎(非病毒性肝炎(除除 病毒性肝炎病毒性肝炎 之外之外 的其它的其它 肝炎)肝炎)A NOT BA:各種肝炎:各種肝炎 B:病毒性肝炎:病毒性肝炎63布爾邏輯檢索(布爾邏輯檢索(Boolean searching) 布爾邏輯運(yùn)算符主要有三種:布爾邏輯運(yùn)算符主要有三種:表達(dá)方式布爾邏輯運(yùn)算符表達(dá)方式布爾邏輯運(yùn)算符邏輯邏輯“與與”(AND)、)、 - 邏輯與(并且)、邏輯與(并且
51、)、“*”星星號(hào);號(hào); 邏輯邏輯“或或” (OR)、)、 -邏輯或(或者)、邏輯或(或者)、“+”號(hào);號(hào);邏輯邏輯“非非”(NOT)、)、- 邏輯非(不包含)邏輯非(不包含) 、“-”減減號(hào)號(hào)布爾邏輯運(yùn)算符的運(yùn)算次序:布爾邏輯運(yùn)算符的運(yùn)算次序:(刮號(hào))(刮號(hào))NOTANDOR 重點(diǎn)記憶重點(diǎn)記憶64(三)(三)選擇位置運(yùn)算符選擇位置運(yùn)算符 (1)“NEAR” 兩個(gè)兩個(gè)詞在同一個(gè)句子中出現(xiàn)詞在同一個(gè)句子中出現(xiàn); near表示表示:檢索詞存在于同一句子中,詞序可以顛倒。檢索詞存在于同一句子中,詞序可以顛倒。 例如:例如:information NEAR retrieval NEAR后后加正整數(shù)加正整
52、數(shù) 表示表示檢索詞之間檢索詞之間最多允許最多允許插入幾個(gè)詞。插入幾個(gè)詞。 例如:例如:acute NEAR 2 infarction 表示兩詞之間最多表示兩詞之間最多允許允許插插入一個(gè)其他單詞,可檢出入一個(gè)其他單詞,可檢出acute myocardial infarction。 NEAR3 NEAR4 表示檢索詞之間表示檢索詞之間最多允許最多允許插入插入3個(gè)單詞或個(gè)單詞或4個(gè)單詞,以此類推。個(gè)單詞,以此類推。65位置算符位置算符near: 檢索式檢索式:A near B表示表示:檢索詞檢索詞A和檢索詞和檢索詞B不僅同時(shí)出現(xiàn)在一條字段里,還要同時(shí)出現(xiàn)不僅同時(shí)出現(xiàn)在一條字段里,還要同時(shí)出現(xiàn)在一個(gè)句
53、子里。在一個(gè)句子里。 Near n表示表示0n-1個(gè)間隔。個(gè)間隔。66同句檢索同句檢索 nearnear同句檢索:同句檢索:即在兩個(gè)詞之間用即在兩個(gè)詞之間用nearnear的一種檢索的一種檢索技術(shù)。技術(shù)。同句相鄰詞檢索同句相鄰詞檢索:用用 near near 加加數(shù)字?jǐn)?shù)字, 把兩個(gè)詞連起來,如把兩個(gè)詞連起來,如 Diagnosis Diagnosis nearnear 3 3 virus,virus,就是凡在同一字段中有就是凡在同一字段中有DiagnosisDiagnosis與與virusvirus之間相隔之間相隔3 3個(gè)個(gè)詞以內(nèi)的文獻(xiàn)即為命中文獻(xiàn)詞以內(nèi)的文獻(xiàn)即為命中文獻(xiàn)。如如diagnosi
54、s of HB Virus infectiondiagnosis of HB Virus infection67(2)“WITH” with表示表示: 連接兩個(gè)詞檢索,凡是在同一記錄的連接兩個(gè)詞檢索,凡是在同一記錄的同一字段中出現(xiàn)兩個(gè)詞;同一字段中出現(xiàn)兩個(gè)詞;表示表示 檢索詞存在于檢索詞存在于同一同一字段字段,如如篇名、摘要等,篇名、摘要等,詞詞序可顛倒序可顛倒,檢索詞之間的位置要求,檢索詞之間的位置要求 比比 “near” 寬寬。 例如:例如:women WITH hepatoma 用用with連接兩個(gè)詞檢索,連接兩個(gè)詞檢索,其檢索結(jié)果為其檢索結(jié)果為:凡是在:凡是在同一記錄的同一字段中出現(xiàn)這
55、兩個(gè)檢索詞的文獻(xiàn),同一記錄的同一字段中出現(xiàn)這兩個(gè)檢索詞的文獻(xiàn),都都算是命中算是命中文獻(xiàn),且不論這兩個(gè)詞次序如何。文獻(xiàn),且不論這兩個(gè)詞次序如何。68位置算符with: 檢索式:A with B 表示表示:檢索詞A和檢索詞B不僅同時(shí)出現(xiàn)在一條記錄中,還要同時(shí)出現(xiàn)在一個(gè)字段里。69同字段檢索同字段檢索with同字段檢索同字段檢索:即在兩個(gè)詞之間用即在兩個(gè)詞之間用with的一的一種檢索技術(shù)。種檢索技術(shù)。凡文獻(xiàn)中,只要所要求的兩個(gè)詞在同一句凡文獻(xiàn)中,只要所要求的兩個(gè)詞在同一句子中即為命中文獻(xiàn)子中即為命中文獻(xiàn),如,如G with H。只要只要G和和 H 在同一句中即可檢出。在同一句中即可檢出。如如coug
56、h (咳嗽咳嗽) with asthms (哮喘哮喘)。70vNear、 with 指定兩個(gè)檢索詞之間的位置指定兩個(gè)檢索詞之間的位置With的含義:的含義:兩個(gè)檢索詞在同一字段中出現(xiàn)。兩個(gè)檢索詞在同一字段中出現(xiàn)。With的用法:檢索詞的用法:檢索詞A with 檢索詞檢索詞BNear的含義:的含義:兩個(gè)檢索詞不僅在同一字段中出現(xiàn)。兩個(gè)檢索詞不僅在同一字段中出現(xiàn)。 而且而且可限定可限定兩個(gè)詞之間的間隔距離。兩個(gè)詞之間的間隔距離。71v是一種指定檢索詞在某一字段中出現(xiàn)的限定是一種指定檢索詞在某一字段中出現(xiàn)的限定v性檢索。性檢索。vin 是一種包含(相似)關(guān)系。是一種包含(相似)關(guān)系。v= 為精確的
57、比較。為精確的比較。in 的用法:的用法: 檢索詞檢索詞 in 字段名稱字段名稱= 的用法:的用法: 字段名稱字段名稱=檢索詞檢索詞特別提示特別提示:需要注意的是在特定的數(shù)據(jù)庫中,需要注意的是在特定的數(shù)據(jù)庫中,哪些字段可以運(yùn)用哪些字段可以運(yùn)用=,哪些只能用,哪些只能用in。721 包含檢索包含檢索 (in)檢索詞包含于檢索字符串中,檢索詞包含于檢索字符串中,如如: 檢索作者檢索作者馬智,馬智,可可檢索檢索出出作者為馬智、馬智明、馬智慧等的文獻(xiàn)。作者為馬智、馬智明、馬智慧等的文獻(xiàn)。2 精確檢索精確檢索(=)檢索詞檢索詞與與檢索字符串檢索字符串 完全完全 相等,相等,如如:檢索作者馬檢索作者馬智,
58、智,僅僅檢索出作者為馬智的文獻(xiàn),而不會(huì)將作者名中含有馬智檢索出作者為馬智的文獻(xiàn),而不會(huì)將作者名中含有馬智片段的文獻(xiàn)代出。片段的文獻(xiàn)代出。3 所有字段均可進(jìn)行包含檢索,所有字段均可進(jìn)行包含檢索,精確檢索精確檢索僅限于作者、作者、期刊、卷、期、期刊、卷、期、ISSN、出版地、主題詞、特征詞、關(guān)鍵詞、出版地、主題詞、特征詞、關(guān)鍵詞、人名主題、分類號(hào)字段。人名主題、分類號(hào)字段。73(3)“in” 指定在某個(gè)字段進(jìn)行檢索指定在某個(gè)字段進(jìn)行檢索;指定指定-字段檢索符字段檢索符 用用“in”指定指定-在某個(gè)字段進(jìn)行檢索。這種在某個(gè)字段進(jìn)行檢索。這種檢索可節(jié)約系統(tǒng)在其他字段的搜索時(shí)間,檢索的檢索可節(jié)約系統(tǒng)在其
59、他字段的搜索時(shí)間,檢索的結(jié)果比較精確結(jié)果比較精確。檢域限定檢索檢域限定檢索或或稱稱=限定字段檢索限定字段檢索是指檢索詞限定出現(xiàn)在某一特定字段者,為命中文獻(xiàn)。就是是指檢索詞限定出現(xiàn)在某一特定字段者,為命中文獻(xiàn)。就是在檢索詞之后用限定符號(hào)在檢索詞之后用限定符號(hào) inin,再加字段簡稱。,再加字段簡稱。如如arrhythmia in TI,就是在題名中,就是在題名中arrhythmia(心律不齊心律不齊)的的文獻(xiàn)即為命中文獻(xiàn)。文獻(xiàn)即為命中文獻(xiàn)??上薅z索的字段有可限定檢索的字段有TI、AU、 CP、 LA 、SO、 AD、 MeSH、 MMH,等。等。限定字段檢索限定字段檢索是一種縮小檢索范圍的檢索
60、技術(shù),而且是一種縮小檢索范圍的檢索技術(shù),而且使檢檢出的文獻(xiàn)非常準(zhǔn)確、切題。出的文獻(xiàn)非常準(zhǔn)確、切題。74常用的常用的限制性字段限制性字段1.篇名:chemistry in ti2.文摘:cancer in ab3.出版年:2000 in py4.出版類型或文獻(xiàn)類型:review in pt,pt=editorial5.作者:han-j-s in au6.通訊地址:beijing in ad75( 四)四)運(yùn)算符的排列次序運(yùn)算符的排列次序 在實(shí)際檢索工作中,有時(shí)為了表達(dá)各種邏輯位在實(shí)際檢索工作中,有時(shí)為了表達(dá)各種邏輯位置關(guān)系,在一個(gè)檢索式中很可能要使用多種運(yùn)算符。置關(guān)系,在一個(gè)檢索式中很可能要使用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度車輛過戶轉(zhuǎn)讓及駕駛培訓(xùn)合作協(xié)議
- 2025年度股權(quán)回購協(xié)議版:跨境電商平臺(tái)股權(quán)回購及國際市場拓展合同
- 二零二五年度石材開采與生態(tài)保護(hù)合作協(xié)議
- 二零二五年度智能車庫轉(zhuǎn)讓及維護(hù)服務(wù)合同
- 2025年度船舶船員勞動(dòng)合同及船舶航行環(huán)境保護(hù)合同
- 2025年度智能家居裝修房子合同
- 初中浙教版初一數(shù)學(xué)試卷
- 供暖檢查井拆除施工方案
- 瑜伽吊繩施工方案
- 2025年常州租賃合同押金管理規(guī)范范本4篇
- 2024-2030年中國海泡石產(chǎn)業(yè)運(yùn)行形勢及投資規(guī)模研究報(bào)告
- 動(dòng)物醫(yī)學(xué)類專業(yè)生涯發(fā)展展示
- 2024年同等學(xué)力申碩英語考試真題
- 消除“艾梅乙”醫(yī)療歧視-從我做起
- 非遺文化走進(jìn)數(shù)字展廳+大數(shù)據(jù)與互聯(lián)網(wǎng)系創(chuàng)業(yè)計(jì)劃書
- 2024山西省文化旅游投資控股集團(tuán)有限公司招聘筆試參考題庫附帶答案詳解
- 科普知識(shí)進(jìn)社區(qū)活動(dòng)總結(jié)與反思
- 加油站廉潔培訓(xùn)課件
- 現(xiàn)金日記賬模板(帶公式)
- 消化內(nèi)科??票O(jiān)測指標(biāo)匯總分析
- 混凝土結(jié)構(gòu)工程施工質(zhì)量驗(yàn)收規(guī)范
評論
0/150
提交評論