《信息檢索與利用》PPT課件.ppt_第1頁
《信息檢索與利用》PPT課件.ppt_第2頁
《信息檢索與利用》PPT課件.ppt_第3頁
《信息檢索與利用》PPT課件.ppt_第4頁
《信息檢索與利用》PPT課件.ppt_第5頁
已閱讀5頁,還剩91頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、15:25,1,15:25,2,信息檢索與利用 主講:陳清文 Email: Tele:83642478,15:25,3,聯(lián)合國教科文組織對大學(xué)生能力提出的“四會”,& learn to be 學(xué)會做人 & learn to do 學(xué)會做事 & learn to be with others學(xué)會與人相處 & learn to how to learn 學(xué)會如何學(xué)習(xí) 最重要的是:“學(xué)會如何學(xué)習(xí)的能力” ,15:25,4,為什么要學(xué)習(xí)文獻(xiàn)檢索?,文獻(xiàn)資源日益龐大 非科技文獻(xiàn),每10年甚至78年翻一番 科技文獻(xiàn),尤其是尖端科學(xué)的文獻(xiàn)增加速度更快,如,原子能文獻(xiàn)每23 年就翻一番,且倍增周期逐年縮短 據(jù)

2、估計目前每年出版的各種類型的科技文獻(xiàn)有1000多萬篇 出版速度加快 據(jù)國外報導(dǎo),2006年全世界出版 科技文獻(xiàn)2000印張/秒 4-5種新書/小時 新增3種刊物/小時 載體形式多樣化,文獻(xiàn)檢索需要解決的問題,我們被信息的海洋包圍著, 但是確被知識餓死了!,15:25,6,這門課的目的(Purpose)是: 面對日益增長的文獻(xiàn)資源,如何通過一種有效的方法,以最少的時間與精力來獲取自己所要的信息 這就是文獻(xiàn)檢索所要解決的問題。,15:25,7,學(xué)會了文獻(xiàn)檢索有什么好處?,對于科技人員: 文獻(xiàn)檢索是科技人員必備的基本技能 文獻(xiàn)檢索是科學(xué)研究的先期工作,15:25,8,一個科研人員的時間分配表,寫報告

3、 10%,15:25,9,學(xué)會了文獻(xiàn)檢索有什么好處?,對于一般大眾 文獻(xiàn)檢索是知識更新的手段 通過文獻(xiàn)檢索獲取學(xué)術(shù)動態(tài) 通過文獻(xiàn)檢索尋找未知問題的答案 是能力的培養(yǎng) 提高自學(xué)的能力 文獻(xiàn)檢索課的一個重要目標(biāo)就是培養(yǎng)學(xué)生的信息意識,15:25,10,怎樣學(xué)好文獻(xiàn)檢索課,陸游 冬夜讀書示子律 古人學(xué)問無遺力,少壯功夫老始成。 紙上得來終覺淺,絕知此事要躬行。 這是陸游的一首教子詩,名字叫冬夜讀書示子律,作于寧宗莊元五年(公元1199年)底。詩人就知識的獲取,從兩方面談了自己的看法:一是要花氣力,一是“要躬行”。詩中表達(dá)的思想不僅是冬夜讀書的體會,更是詩人勤奮學(xué)習(xí)的經(jīng)驗(yàn)總結(jié)。,15:25,11,文獻(xiàn)

4、檢索課教學(xué)大綱,醫(yī)學(xué)文獻(xiàn)檢索與論文寫作教學(xué)大綱 大綱說明 課程編號:7125001 課程性質(zhì):專業(yè)模塊課 適用專業(yè):生物醫(yī)學(xué)專業(yè) 先修課程: 專業(yè)基礎(chǔ)課、英語、計算機(jī)與網(wǎng)絡(luò)應(yīng)用基礎(chǔ) 學(xué) 分:2 學(xué) 時:32(講課20學(xué)時,上機(jī)12學(xué)時) 課程的性質(zhì)、任務(wù)及地位: 文獻(xiàn)檢索與利用課是為大學(xué)生開設(shè)的一門重要公共基礎(chǔ)課。通過本課程的教學(xué),逐步培養(yǎng)大學(xué)生良好的信息素養(yǎng),增強(qiáng)大學(xué)生的信息意識和掌握現(xiàn)代化信息檢索與利用的技能,提高開發(fā)和利用信息資源的能力,增強(qiáng)自學(xué)能力、獨(dú)立研究能力和創(chuàng)新能力。,15:25,12,文獻(xiàn)檢索課教學(xué)大綱,教學(xué)目的與要求: 通過本課程的學(xué)習(xí),使學(xué)生了解文獻(xiàn)信息與文獻(xiàn)信息檢索的基本

5、知識,熟悉各類型信息資源的分布與流變規(guī)律以及信息媒體的特點(diǎn)、類型與用途。學(xué)會常用信息檢索系統(tǒng)的使用方法,重點(diǎn)掌握計算機(jī)信息檢索的基本概念和檢索技術(shù),熟練掌握各種中、外文數(shù)據(jù)庫、網(wǎng)絡(luò)檢索工具以及其他網(wǎng)絡(luò)信息資源的檢索與利用。為將來進(jìn)一步學(xué)習(xí)、工作或教學(xué)、科研打下堅實(shí)基礎(chǔ)。 本課程是一門實(shí)踐性很強(qiáng)的科學(xué)方法課,教學(xué)必須理論聯(lián)系實(shí)際,實(shí)踐環(huán)節(jié)的安排尤為重要,建議采用多媒體或網(wǎng)絡(luò)演示教學(xué),并安排相應(yīng)課時的實(shí)習(xí)。其基本的教學(xué)要求是精講文獻(xiàn)信息的獲取技巧,特別是網(wǎng)絡(luò)信息獲取技巧,教學(xué)中在注意對基本概念介紹的同時,重在對檢索系統(tǒng)操作方法、操作步驟的介紹,要使學(xué)生能從檢索實(shí)例中掌握對具體檢索系統(tǒng)的使用,并進(jìn)行

6、模擬練習(xí),善于根據(jù)自己感興趣的學(xué)科或研究課題進(jìn)行實(shí)際操作。增強(qiáng)廣大學(xué)生的情報意識,培養(yǎng)他們的信息獲取能力和獨(dú)立研究的能力。,15:25,13,文獻(xiàn)檢索課教學(xué)安排,課時分配表: 序列內(nèi)容 學(xué) 時 上機(jī) 1第一章文獻(xiàn)檢索基礎(chǔ)知識 2 2第二章計算機(jī)文獻(xiàn)檢索 2 3第三章常用中文數(shù)據(jù)庫 4 4學(xué)時 4第四章常用國外全文數(shù)據(jù)庫4 4學(xué)時 5第五章常用國外文摘數(shù)據(jù)庫2 6第六章事實(shí)、專利與標(biāo)準(zhǔn)文獻(xiàn)數(shù)據(jù)庫2 7第七章網(wǎng)絡(luò)信息資源檢索與利用2 2學(xué)時 8第八章學(xué)術(shù)論文撰寫與投稿2 9 綜合實(shí)習(xí)報告 2學(xué)時 10 總計 20學(xué)時 12學(xué)時,15:25,14,文獻(xiàn)檢索課考核要求,考核與成績評定: 考勤(10)

7、實(shí)習(xí)和作業(yè)(30) 綜合實(shí)習(xí)報告(60) 三者相結(jié)合。,15:25,15,教材,1.醫(yī)學(xué)信息檢索與利用 夏知平主編, 復(fù)旦大學(xué)出版社, 2007年出版,15:25,16,教學(xué)參考書,1. 醫(yī)學(xué)信息檢索與利用 陳界等主編:中國科技出版社,第二版2003年; 2. 新編醫(yī)學(xué)文獻(xiàn)檢索 郭繼軍主編,人民衛(wèi)生出版社,2004年; 3. 生物醫(yī)學(xué)信息檢索與利用, 王秀平主編:科技文獻(xiàn)出版社,2004年; 4. 醫(yī)學(xué)文獻(xiàn)檢索, 方平主編,人民衛(wèi)生出版社,2003年 4.信息檢索 焦玉英,符紹宏,何紹華主編,武漢大學(xué)出版社, 2001. 5.實(shí)用生物醫(yī)學(xué)信息檢索 謝志秐主編,復(fù)旦大學(xué)出版社,2004.,15:

8、25,17,一、基本概念,信息 情報 知識 文獻(xiàn),15:25,18,信息(Information),信息是客觀事物存在的方式或運(yùn)動狀態(tài),以及關(guān)于客觀事物存在方式或運(yùn)動狀態(tài)的陳述。 情報與文獻(xiàn)工作詞匯、基本術(shù)語對信息的定義:物質(zhì)存在的一種形式、形態(tài)或運(yùn)動狀態(tài),也是事物的一種普遍屬性,一般指數(shù)據(jù)、消息中所包含的意義。信息論創(chuàng)始人申農(nóng)認(rèn)為:信息是用來消除不確定性的東西,15:25,19,信息,信息,最初的含義是指音信和消息,南唐李中暮春懷故人詩“夢斷美人沉信息,目穿長路倚樓臺”及宋代陳亮梅花詩“欲傳春信息,不怕雪埋藏”中的信息就是這個概念。隨著社會的進(jìn)步和科技的發(fā)展,信息遠(yuǎn)遠(yuǎn)超出了原先的含義 ,是指

9、通過各種手段傳遞的一切符號,它已經(jīng)成為我們使用頻率最高的詞匯之一。,15:25,20,信息無處不在,無時不有,無人不用,冰消雪融、草木發(fā)芽,這是自然帶給我們季節(jié)變換的信息; 新聞報道、商品廣告,這是社會帶給我們的信息; 鬧鐘的鈴聲把我們從睡夢中叫醒,這是生活中的信息。 我們無時無刻地與信息有聯(lián)系。 生活充滿了信息。聽課、看書讀報、看電視、聽廣播、我們接受信息,同時我們點(diǎn)頭、擺手、跺腳、摸鼻子、說、唱等,一舉一動都在發(fā)出或傳遞信息。人與人間傳遞信息可通過:肢體語言、口頭語言、書面語言等。,15:25,21,信息的特征,(1)客觀性 地震,海嘯,花草樹林的發(fā)芽、生長和枯萎,廣播電視、網(wǎng)絡(luò)的新聞、廣

10、告等等發(fā)出的信息,不管你知道不知道,感知不感知,它都是客觀存在。只要有物質(zhì)存在,就有信息的存在。 因此,信息是客觀存在的,不以人們的意志為轉(zhuǎn)移的。它是現(xiàn)實(shí)世界中各種事物運(yùn)動與狀態(tài)的反映,它可以被人們所感知、處理、存儲和使用。它的客觀性還表現(xiàn)在反映客觀世界變化的信息包含在各種物質(zhì)之中。,15:25,22,(2)時效性,朝鮮戰(zhàn)爭與蘭德咨詢公司故事 在美國出兵朝鮮之前,美政府曾請美國著名的咨詢機(jī)構(gòu)蘭德公司做一預(yù)測:如果美國出兵中國會不會出兵?蘭德公司請了大批資深專家,從中共歷史、軍力、國際關(guān)系、甚至中共領(lǐng)袖性格等各方面做了精深的分析,最后得出結(jié)論是:“中國將出兵朝鮮” 。其主題詞只有7個字,要價15

11、0萬美元。美國國防部認(rèn)為是敲詐,不予理睬,在自認(rèn)為中共不敢出兵的假設(shè)下,冒險出兵,結(jié)果“在錯誤的時間,在錯誤的地點(diǎn),與錯誤的敵人進(jìn)行了一場錯誤的戰(zhàn)爭”。 一直到前些年,美國政府檢討當(dāng)年決策錯誤時,向蘭德公司付了一大筆款,表示對科學(xué)預(yù)測的重新估價與信服。很明顯,如果美國政府當(dāng)年尊重科學(xué)預(yù)測,相信中共會出兵,他是決不敢冒這個險的,那朝鮮歷史將重新改寫,抗美援朝也就不存在了。 由上例可以看出信息是具有較強(qiáng)時效性的。 客觀事物總是不斷地發(fā)展變化,因而信息也會發(fā)展變化,如果信息不能適時地反映事物存在的方式和運(yùn)動狀態(tài),那么,這一信息就失去其效用。,15:25,23,(3)傳遞性,大慶油田產(chǎn)量失密事件 19

12、60年王進(jìn)喜被冠之以“鐵人”的稱號以后,國內(nèi)的各大報紙對他都有了相關(guān)的報道。誰想到被狡猾的日本人嗅出蛛絲馬跡,竟從中了解了大慶油田開采的一些情況。日本人發(fā)現(xiàn),王進(jìn)喜原來的工作地點(diǎn)是甘肅玉門油田,1959年10月參加國慶觀禮后他就銷聲匿跡了,由此推斷大慶開發(fā)時間應(yīng)該為1959年9月; 1966年7月,中國畫報曾刊載王鐵人頭戴厚厚瓜皮帽的照片,憑著對中國地理的熟知,日本人很快就推斷出王進(jìn)喜的工作地應(yīng)該在零下30度的東北地區(qū); 還根據(jù)其他相關(guān)信息,測算出了油田與北京的距離,斷定油田應(yīng)在哈爾濱與齊齊哈爾之間; 10月份,人民中國也刊登出宣傳王進(jìn)喜的文章,在其中透出一個“馬家窯”的地理信息,日本人便由此

13、推出大慶在安達(dá)車站附近。 據(jù)稱,日本人通過精細(xì)、準(zhǔn)確的情報對大慶油田進(jìn)行了成功調(diào)查,后來幾乎壟斷了我國石油設(shè)備進(jìn)口市場。,15:25,24,從上例中可以看出,大慶油田的信息是刊載在人民畫報等這些公開發(fā)行的報刊雜志上的,而日本人正是利用這些公開的報紙、雜志分析中我國大慶油田的產(chǎn)量和設(shè)備需求,獲取了最高的經(jīng)濟(jì)利益。 在本例中,大慶石油信息從國內(nèi)報刊雜志社這一信息的發(fā)源地通過人民畫報等報刊雜志這些載體,傳到了日本人的手里,經(jīng)過他們的分析、處理后,加以運(yùn)用,獲取了高額的經(jīng)濟(jì)利益。 信息的傳遞性是指任何信息只有從信源出發(fā),經(jīng)過信息載體傳遞才能被信宿接受并進(jìn)行處理和運(yùn)用。也就是說,信息可以在時間上或空間上

14、從一點(diǎn)移動到另一點(diǎn),可以通過語言、動作、文字、通信、電子計算機(jī)等各種渠道和媒介傳播。,15:25,25,(4)共享性,英國劇作家蕭伯納說:你我是朋友,各拿一個蘋果,彼此交換,交換后仍然是各有一個蘋果。倘若你有一種思想,彼此交流思想,那么我們每個人就有兩種思想了。,同一內(nèi)容的信息可以在同一時間或不同時間里被多個信息用戶使用。 一條信息被用戶吸收和利用并不影響信息的本身和被其他用戶的反復(fù)使用,各用戶分享的份額也不會因?yàn)榉窒淼娜说亩嗌俣苡绊憽?正如蕭伯納所舉的“蘋果與思想”的例子,蘋果交換以后雙方仍然各自僅有一個蘋果,但信息交換以后雙方都有了兩種信息。信息共享性是推動社會交流的原動力。,15:25

15、,26,(5)中介性,人們看柳樹發(fā)芽,就知道春天來了,看到天上烏云滾滾,就知道要下雨了,這就是這些自然世界發(fā)出的信息。 信息是介于物質(zhì)世界和精神世界之間的過渡狀態(tài)的東西,是人們認(rèn)識事物、感知世界的不可缺少的中間環(huán)節(jié)。它貫穿于認(rèn)知活動的始終,認(rèn)知過程本身就是一個以信息為中介的信息運(yùn)動過程。 人類認(rèn)識世界和改造世界的過程,是一個不斷從客觀世界獲得信息,并對信息進(jìn)行加工處理,形成新的認(rèn)知結(jié)構(gòu),然后通過實(shí)踐活動反作用于客觀世界的過程。,15:25,27,情報(Information 2 ),情報是人們?yōu)橐欢康亩鸭挠惺褂脙r值的知識或信息。 “是被有目的利用的、活化的知識與信息”。 情報有如下幾點(diǎn)屬

16、性: (1)知識性與信息性:情報要具有實(shí)質(zhì)性的內(nèi)容-知識與信息,沒有知識信息內(nèi)容的情報是不存在的。 (2)實(shí)用性:人們利用情報是為了獲取實(shí)際效益或解決特定的問題。對沒有使用價值的知識和信息,人們不會產(chǎn)生客觀需要的動機(jī)。只有當(dāng)知識信息與人們的客觀需要聯(lián)系起來,才能活化形成情報。 (3)傳遞性:只有在傳遞、交流、運(yùn)動過程中活化了的知識與信息才能成為情報。它是情報的本質(zhì)特征,情報傳遞效果直接影響其使用。 (4)時效性:特定的情報只有在合適的時間內(nèi)傳遞和利用才會產(chǎn)生更大的效用。過時的情報就會成為失效情報。 (5)針對性:情報是針對特定用戶、特定需求提供的有使用價值的知識與信息,具有很強(qiáng)的針對性。,15

17、:25,28,知識,知識是人們對客觀事物存在和運(yùn)動規(guī)律的認(rèn)識。 知識是建立在信息的基礎(chǔ)上經(jīng)過加工而形成的。,15:25,29,人類社會中的信息,知識改變命運(yùn), 信息改變生活! 信息對于人類來說,它和空氣、水、食物等一樣,都是不可缺少的,而且在某種意義上講,還顯得更為重要。 在人類社會發(fā)展中,特別是在步入信息社會的今天,信息在社會發(fā)展中的作用越來越大,可以說,誰占有了信息,誰在收集、加工、處理和利用信息方面領(lǐng)先一步,誰就能在競爭中獲得優(yōu)勢。,15:25,30,文獻(xiàn),記錄有知識的一切載體。 三要素: 1.知識:文獻(xiàn)的實(shí)質(zhì)內(nèi)容。 2.載體:文獻(xiàn)的外在形式。 3.記錄:將兩者聯(lián)系起來的手段。 醫(yī)學(xué)文獻(xiàn)

18、:記錄有醫(yī)學(xué)知識的一切載體。,15:25,31,1. 文獻(xiàn)信息資源的構(gòu)成 (3)按文獻(xiàn)信息的加工程度劃分 零次文獻(xiàn) 是指未以公開形式進(jìn)入社會流通使用的實(shí)驗(yàn)記錄、會議記錄、內(nèi)部檔案、論文草稿、設(shè)計草稿等。具有信息內(nèi)容新穎、不公開交流、難以獲得、不成熟、不定型的特點(diǎn)。,15:25,32,1. 文獻(xiàn)信息資源的構(gòu)成 (3)按文獻(xiàn)信息的加工程度劃分 一次文獻(xiàn) 是指作者以本人生產(chǎn)與科研工作成果為依 據(jù),創(chuàng)作、撰寫而形成的文獻(xiàn)。如期刊論文、科技報告、會議論文、專利說明書及各種專著等等。一次文獻(xiàn)的特點(diǎn)在于內(nèi)容新穎、翔實(shí)、具體,一般說它是文獻(xiàn)信息檢索的終極目標(biāo)。,15:25,33,1. 文獻(xiàn)信息資源的構(gòu)成 (3

19、)按文獻(xiàn)信息的加工程度劃分 二次文獻(xiàn) 是指對一次文獻(xiàn)信息進(jìn)行加工、提煉、濃縮,而形成的工具性文獻(xiàn)。它主要包括各種書目、題錄和文摘(數(shù)據(jù)庫)。二次文獻(xiàn)是人們對一次文獻(xiàn)進(jìn)行有效的管理、控制和利用的工具,它提供了一次文獻(xiàn)的概略及線索。,15:25,34,1. 文獻(xiàn)信息資源的構(gòu)成 (3)按文獻(xiàn)信息的加工程度劃分 三次文獻(xiàn) 是根據(jù)特定的要求指對一次文獻(xiàn)和二次文獻(xiàn)的內(nèi)容進(jìn)行綜合分析、系統(tǒng)整理、高度濃縮后形成的文獻(xiàn)。如各種詞典、百科全書、年鑒、指南數(shù)據(jù)庫等等。三次文獻(xiàn)提供各種事實(shí)與數(shù)據(jù)。,15:25,35,15:25,36,信息與文獻(xiàn)、情報、知識的關(guān)系,信息與文獻(xiàn)、情報、知識的關(guān)系 信息 知識 情報 文獻(xiàn),

20、知識,情報,信息,文獻(xiàn),15:25,37,四、檢索語言,檢索語言是文獻(xiàn)中用來描述文獻(xiàn)外表特征和內(nèi)容特征和表達(dá)情報提問內(nèi)容的一種專門人工語言,又稱情報語言、標(biāo)引語言、索引語言等。,15:25,38,檢索語言的分類,分類檢索語言 主題檢索語言 符號檢索語言,15:25,39,分類檢索語言,體系分類法:以科學(xué)分類為基礎(chǔ),結(jié)合文獻(xiàn)的特點(diǎn),采用概念邏輯分類的原理,層層劃分,構(gòu)成具有上下類、同位類的概念等級體系。 用分類號來表達(dá)各種概念。,15:25,40,中國圖書館分類法簡表,A馬列、毛澤東思想 B哲學(xué) C社會科學(xué)總論 D政治、法律 E軍事 F經(jīng)濟(jì) G文教、科學(xué)、體育 H語言、文字 I文學(xué) J藝術(shù) K歷

21、史、地理,N自然科學(xué)總論 O數(shù)學(xué)、物理、化學(xué) P天文學(xué)、地球科學(xué) Q生物科學(xué) R醫(yī)藥、衛(wèi)生 S農(nóng)業(yè)科學(xué) T工業(yè)科學(xué) U交通運(yùn)輸 V航空、航天 X環(huán)境科學(xué) Z綜合性圖書,15:25,41,R醫(yī)藥、衛(wèi)生,R1 預(yù)防醫(yī)學(xué)、衛(wèi)生學(xué) R2中國醫(yī)學(xué) R3基礎(chǔ)醫(yī)學(xué) R4臨床醫(yī)學(xué) R5內(nèi)科學(xué)- R6外科學(xué) R71婦產(chǎn)科學(xué) . R8特種醫(yī)學(xué) R9藥學(xué),R51傳染病 R52結(jié)核病 R53寄生蟲病 R54心臟、血管疾病 R55血液及淋巴系疾病 R56呼吸系及胸部疾病 R57消化系及腹部疾病 R58內(nèi)分泌腺疾病及代謝病 R59全身性疾病,15:25,42,體系分類法的優(yōu)缺點(diǎn),優(yōu)點(diǎn):系統(tǒng)性強(qiáng),族性檢索,便于按學(xué)科、專業(yè)

22、直接檢索比較廣泛的課題。查全率較高。 缺點(diǎn):缺乏專指性,查準(zhǔn)率不高,不能滿足專深課題以及新興學(xué)科、交叉學(xué)科和邊緣學(xué)科知識的檢索。,15:25,43,主題檢索語言,以文獻(xiàn)的主題內(nèi)容為依據(jù),用詞語作為概念標(biāo)識,并按一定的順序排列而成的一種檢索語言。 優(yōu)點(diǎn):直接性、專指性強(qiáng),比較適合專深課題的檢索。,15:25,44,主題詞,經(jīng)過規(guī)范化處理的具有實(shí)質(zhì)性意義的詞或詞組。 “ 規(guī)范”:是對一個概念的同義詞、近義詞和拼法變異詞適當(dāng)歸并,采用參照系統(tǒng),并有主題詞的范疇表和樹狀結(jié)構(gòu)。形成專門的主題詞表。,15:25,45,主題詞表,國內(nèi)醫(yī)學(xué)檢索工具使用: 中國中醫(yī)藥學(xué)主題詞表、醫(yī)學(xué)主題詞注釋字順表。 國外醫(yī)學(xué)

23、檢索工具: Medical Subject Headings ,( MeSH,醫(yī)學(xué)主題詞表) 。,15:25,46,主題詞的特點(diǎn),(1) 規(guī)范錯綜復(fù)雜的名詞概念,對同義詞、近義詞、多義詞 進(jìn)行規(guī)范和控制 ,使標(biāo)引人員與檢索人員在檢索時有共同語言。 (2) 主題詞具有主題集中、學(xué)科分散的特點(diǎn),故能提高文獻(xiàn)檢索的查全率和查準(zhǔn)率。,15:25,47,關(guān)鍵詞,未經(jīng)嚴(yán)格規(guī)范化處理的檢索詞或詞組(自然語言)。通常是從文獻(xiàn)的題目、摘要、正文中選取出來。標(biāo)引出的關(guān)鍵詞在文獻(xiàn)中起關(guān)鍵性作用,通常是由名詞、形容詞等實(shí)質(zhì)性詞構(gòu)成。,15:25,48,關(guān)鍵詞的特點(diǎn),優(yōu)點(diǎn):可不用主題詞表,自由選詞,不受限制。 缺點(diǎn):同

24、一主題的文獻(xiàn)可能分散在不同的詞下,可能造成漏檢。要提高查全率,就必須分別檢索同一主題的同義詞和近義詞等。,15:25,49,4. 常用文獻(xiàn)檢索途徑及方法 常用檢索方法 (1) 追溯法 利用已經(jīng)掌握的文獻(xiàn)中所列舉的參考文獻(xiàn), 根據(jù)其所提供的線索追蹤、溯源及查找更多相關(guān)文獻(xiàn)的方法。,15:25,50,4. 常用文獻(xiàn)檢索途徑及方法 常用檢索方法 (2) 工具法 利用文獻(xiàn)檢索系統(tǒng)(工具),根據(jù)已經(jīng)掌握的相關(guān)線索(如書名、刊名、篇名、作者姓名、主題詞、分類號等等),進(jìn)行系統(tǒng)而全面的文獻(xiàn)檢索的方法。,15:25,51,常用檢索方法常用文獻(xiàn)檢索途途徑及方法 (3) 循環(huán)法 采用追溯法與工具法交替進(jìn)行的方式進(jìn)

25、行相關(guān)的文獻(xiàn)信息檢索的方法。,15:25,52,五、文獻(xiàn)檢索途徑,是檢索工具提供的檢索入口。通常檢索工具都編有索引,如分類索引、主題索引、作者索引、代碼索引、引文索引等,一種索引就是相應(yīng)的檢索途徑。 計算機(jī)檢索提供的途徑幾乎包括文獻(xiàn)所有的外部特征和內(nèi)容特征,如標(biāo)題、作者、作者單位、出處、文摘、關(guān)鍵詞、主題詞、分類號、ISSN等。,15:25,53,分類途徑,分類途徑:根據(jù)擬檢文獻(xiàn)的學(xué)科性質(zhì),利用分類目錄,從分類的角度進(jìn)行的文獻(xiàn)的檢索。分類法:中圖法、科圖法等 在手工檢索工具中使用較多,關(guān)鍵在于對分類法的熟悉和理解。,15:25,54,主題途徑,主題詞途徑:利用主題索引或主題詞字段檢索。關(guān)鍵在于

26、主題詞的選取和確定。 關(guān)鍵詞途徑:利用關(guān)鍵詞索引和關(guān)鍵詞字段檢索。選詞比較自由,但注意漏檢率較高。,15:25,55,著者途徑,按照著者的姓和名的漢語拼音順序或外文字母順序 ,利用著者索引或著者字段檢索。 注意姓名的縮寫形式,一般姓是全稱,名為縮寫的首字母。 區(qū)別同名同姓的著者,利用單位名稱、地址或研究課題的不同加以區(qū)分。,15:25,56,二、計算機(jī)文獻(xiàn)檢索,1. 文獻(xiàn)信息數(shù)據(jù)庫 2. 計算機(jī)信息檢索基礎(chǔ) 3. 檢索效果評價及其優(yōu)化,15:25,57,1. 文獻(xiàn)信息數(shù)據(jù)庫 文獻(xiàn)是記錄一切人類知識信息的載體。 (文獻(xiàn)情報術(shù)語國際標(biāo)準(zhǔn)(ISO/DIS5217) 數(shù)據(jù)庫是結(jié)構(gòu)化的數(shù)據(jù)集合,至少由一

27、種文檔組成并能夠滿足某種特定目的或特定數(shù)據(jù)處理系統(tǒng)需要的數(shù)據(jù)集合 。 當(dāng)數(shù)據(jù)庫記錄的對象為文獻(xiàn)信息時,就稱為文獻(xiàn)信息數(shù)據(jù)庫 。,15:25,58,文獻(xiàn)信息數(shù)據(jù)庫的結(jié)構(gòu) 一個數(shù)據(jù)庫通常由一個主文檔(Master File)和若干個索引文檔或稱倒排文檔(Inverted File)組成。 文檔是具有某種特征的全部記錄的集合。 記錄是構(gòu)成文檔的基本單元,由各種反映文獻(xiàn)特征的字段組成。如一篇論文、一件專利、一本圖書、一個標(biāo)準(zhǔn)的相關(guān)信息都能夠成為文擋中的一條記錄。 字段是記錄的基本組成元素。一條記錄的常見字段通常包含題名字段、著者字段、主題詞字段、文獻(xiàn)出處字段(如刊名等)多種字段。,15:25,59,文

28、獻(xiàn)信息數(shù)據(jù)庫的評價標(biāo)準(zhǔn) 收錄內(nèi)容范圍系統(tǒng)準(zhǔn)確。 揭示文獻(xiàn)詳略完備詳細(xì)。 更新速度快慢及時快速。 檢索字段多寡途徑豐富。 檢索功能強(qiáng)弱高效完善。 用戶使用方便易學(xué)易用。 維護(hù)服務(wù)質(zhì)量及時維護(hù)。,15:25,60,2. 計算機(jī)信息檢索基礎(chǔ) 計算機(jī)信息檢索 指利用計算機(jī)及相關(guān)軟件和通信設(shè)施,對本地計算機(jī)、遠(yuǎn)程服務(wù)器及網(wǎng)上信息進(jìn)行檢索的過程或活動。 隨著信息技術(shù)的快速發(fā)展及對各種文獻(xiàn)信息的數(shù)字化處理,計算機(jī)文獻(xiàn)信息檢索已經(jīng)成為文獻(xiàn)信息檢索的主要手段。,15:25,61,計算機(jī)信息檢索發(fā)展過程 脫機(jī)檢索階段(50年代中期到60年代中期) 聯(lián)機(jī)檢索階段(60年代中期到70年代中期) 光盤數(shù)據(jù)庫檢索階段(7

29、0年代中期到80年代末) 網(wǎng)絡(luò)化檢索階段(90初年代至今),15:25,62,計算機(jī)信息檢索發(fā)展過程,15:25,63,計算機(jī)檢索的原理,狹義:信息檢索是指從任何信息集合中查出所需信息的活動、過程和方法。 廣義:信息檢索還包括信息存儲,兩者又往往合并稱為“信息存儲與檢索” 信息檢索的全過程包括存儲和檢索兩個過程。 二、信息檢索的本質(zhì) 是信息用戶的需求和信息集合的比較 與選擇,即匹配(match)的過程。用戶根 據(jù)檢索需求,對一定的信息集合采用一 定的技術(shù)手段,根據(jù)一定的線索與準(zhǔn)則 找出相關(guān)的信息。,15:25,64,計算機(jī)文獻(xiàn)檢索的原理,15:25,65,計算機(jī)檢索的一般步驟 (1)分析檢索課

30、題,明確檢索要求 (2)選擇適當(dāng)檢索系統(tǒng)(數(shù)據(jù)庫) (3)確定檢索途徑及檢索詞 (4)構(gòu)建檢索提問式 (5)上機(jī)檢索并調(diào)整檢索策略 (6)輸出檢索結(jié)果,15:25,66,計算機(jī)檢索的步驟,(1). 了解檢索課題. 分析課題的目的和范圍,明確課題要解決的實(shí)質(zhì)性問題。 具體須明確:課題所涉及的學(xué)科范圍,年代范圍,文獻(xiàn)類型,出版類型,文獻(xiàn)信息的語種。 (2).選擇檢索工具:根據(jù)檢索課題的主題及學(xué)科范圍選擇對口的檢索工具(數(shù)據(jù)庫)。 檢索工具選擇標(biāo)準(zhǔn):專業(yè)對口,檢索途徑多,收錄范圍廣。 (3).確定檢索途徑和檢索策略:根據(jù)課題已知條件和檢索工具中有什么檢索途徑,如主題途徑,分子式途徑,分類號途徑等,確

31、定檢索途徑; 檢索策略指檢索前制定的概念組配即用邏輯運(yùn)算符構(gòu)造提問表達(dá)式和在檢索時執(zhí)行檢索順序的方案。,15:25,67,計算機(jī)檢索的步驟,(4). 實(shí)施檢索: 在選擇的數(shù)據(jù)庫進(jìn)行檢索。并對檢出文獻(xiàn)進(jìn)行相關(guān)性分析、評價;必要時對檢索詞或檢索式進(jìn)行修改,直至檢出結(jié)果符合要求; (5). 獲取原始文獻(xiàn)信息: 根據(jù)文摘出處獲取原文信息,刊名縮寫還原為全稱,查本館書目檢索系統(tǒng)或其它館書目檢索系統(tǒng),判斷原文所在地獲取原文,15:25,68,計算機(jī)檢索基本技術(shù) 布爾邏輯檢索技術(shù) 布爾檢索技術(shù)是指利用布爾運(yùn)算符連接各個檢索詞,然后由計算機(jī)進(jìn)行相應(yīng)邏輯運(yùn)算,以檢索出所需信息的方法。常用算符及含義: AND (

32、*)表示由該符號連接的檢索式的運(yùn)算結(jié)果為邏輯與。 OR (+)表示由該符號連接的檢索式的運(yùn)算結(jié)果為邏輯或。 NOT (-)表示由該符號連接的檢索式的運(yùn)算結(jié)果為邏輯非。,15:25,69,2、邏輯與(邏輯乘)(*、AND),邏輯與 AND運(yùn)算符,用來組配不同檢索概念。其含義是檢出的記錄必須同時含有所共有的檢索詞 檢索時,數(shù)據(jù)庫中同時含有檢索詞A和檢索詞B的文獻(xiàn)才是命中文獻(xiàn)。,A*B,15:25,70,組配方式:A*B或者A and B,表示檢索必須同時含有A、B兩詞的文章。 作用:增加限制條件,即增加檢索的專指性, 以縮小提問范圍,減少文獻(xiàn)輸出量,提高查準(zhǔn)率。 在實(shí)際檢索中,不同概念組面之間及同

33、一組面內(nèi)的不同含義的詞之間通常使用AND算符。用AND表示它所連接的兩個檢索詞必須同時出現(xiàn)在結(jié)果中才滿足檢索條件,例如檢索式computer and law就要檢索結(jié)果中必須同時包含computer 和law。檢索式A AND B所表達(dá)的復(fù)合概念相當(dāng)于包含檢索詞A的結(jié)果集與包含檢索詞B的結(jié)果集的重合部分,如圖中兩個圓交叉部分,15:25,71,1、邏輯或(邏輯和)(+、OR ),A+B,15:25,72,作用:放寬提問范圍,增加檢索結(jié)果,起擴(kuò)檢作用,提高查全率。,邏輯或 組配方式:A OR B或者AB,表示檢索含有A詞,或含有B詞,或同時包含A、B兩詞的文章。,15:25,73,3、邏輯非(、

34、NOT),數(shù)據(jù)庫中凡含有檢索詞A而不要檢索詞B的文獻(xiàn),為命中文獻(xiàn)。 邏輯非NOT運(yùn)算符,是排除含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的檢索詞,但不能同時含有其后的詞。,AB,15:25,74,邏輯非 組配方式:AB,表示檢索出含有A詞而不含有B 詞的文章。 作用:邏輯非用于排除不希望出現(xiàn)的檢索詞,它和“*”的作用相似,能夠縮小命中文獻(xiàn)范圍,增強(qiáng)檢索的準(zhǔn)確性。,3、邏輯非(、NOT),15:25,75,*截詞檢索技術(shù) 截詞檢索是為擴(kuò)大檢索范圍與增加檢索結(jié)果而采用的一種檢索技術(shù)。 常見的截詞符號及含義: “*”可代表多個字符 “?”代表單個的字符 一個“n?”或者“n?”代表0個到

35、9個額外的字符 。,15:25,76,截詞檢索,所謂截詞檢索指在檢索式中用專門符號(截詞符號)表示檢索詞的某一部分允許有一定的詞形變化,結(jié)果中只要包含其中任意一個就滿足檢索要求。 主要是提高查全率,不同的數(shù)據(jù)庫和搜索引擎有不同的截字符,截詞符一般用“?”或“*”表示,15:25,77,截詞檢索的方式,按截詞位置可分為前截詞、后截詞、前后截詞和中間截詞 截斷字符數(shù)的不同,可分為有限截斷和無限截斷,15:25,78,截詞位置分,右截詞,又稱后截詞、前方一致。允許檢索詞尾有若干變化。例如comput*將檢索出computer 、computing、computerised、computerized、

36、computerization等結(jié)果。 中間截詞,又稱中間一致。允許檢索詞中間有若干變化。例如wom*n,檢索到woman、women的結(jié)果。英美的不同拼法,defen*e可同時檢出defence和defense的結(jié)果。 左截詞,又稱前截詞、后方一致,允許檢索詞前有若干變化,例如*physics就可檢索到physics、astrophysics、biophysics、chemophysics、geophysics等詞的結(jié)果。 *Computer可檢索computer、minicomputer、microcomputer等結(jié)果。,15:25,79,截詞位置分,前后截詞:詞干的前后各有一個截詞符,

37、允許檢索詞的前端和尾部各有若干變化形式。如*computer*可檢索computer、computers、computerize、computerized、computerization、minicomputer、minicomputers、microcomputer、microcomputers等結(jié)果。,15:25,80,截斷字符數(shù)的不同分,無限截斷:在檢索詞的詞干前后,加一個“*”,表示在此位置上可能出現(xiàn)的字符數(shù)量不受限制,可查找詞干相同的所有詞。按截詞符的位置分為前截詞、后截詞和前后截詞,如前述所舉例子。 有限截斷:在檢索詞的詞干前后,加幾個“?”,表示在此位置上最多允許出現(xiàn)的字符數(shù)。兩

38、個“?”之間空一格,即“? ?”,表示該位置允許出現(xiàn)01個字符,在空格前每增加一個“?”,表示增加一個字符,“? ?”表示該位置允許出現(xiàn)02個字符,依此類推。按截詞符的位置同樣分為前截詞、后截詞和前后截詞。如computer? ?可檢出computer和computers的信息,computer? ?可檢出computer、computers、computerize的信息。,15:25,81,截詞舉例,符號:*,? 前截斷:*magnetic magnetic, electro-magnetic, electromagnetic, thermo-magnetic, 后截斷:librar* li

39、brary, libraries, librarian, 中截斷:organi?ation organization, organisation 無限截斷:不限制被截斷的字符數(shù)量, 例如輸入educat*,可以檢索educator,educators,educated,educating,education,educational,等等。 有限截斷:限制被截斷的字符數(shù)量, 例如輸入educat?,表示被截斷的字符只有兩個,可以檢索educator,educated兩個詞。,15:25,82,*位置檢索技術(shù) 位置檢索可要求檢索詞以用戶所規(guī)定的相對位置出現(xiàn)。常用的位置算符及含義: (W)算符(WITH) 表示兩個檢索詞緊挨著,詞序不能顛倒, 中間不得插入其他詞、字母或代碼,但允許有空格或標(biāo)點(diǎn)符號,也可用()表示。 (n W)算符(n WORD) 表示兩個檢索詞中間可插入n個詞,但它們之間的順序不可顛倒。,15:25,83,*位置檢索技術(shù) (N)算符(NEAR) 表示兩個檢索詞必須相連,不得插入其他詞,但詞序可以顛倒。 (n N)算符(n NEAR) 表示兩個檢索詞中間可以插入n個詞,且詞序可以顛倒。,15:25,84,*位置檢索技術(shù) (F)算符(FIELD)表示兩個檢索詞必須同時出現(xiàn)在同一個字段內(nèi),但兩詞的詞序和中間插入的詞數(shù)不限。 (S)算符(SUBFIELD

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論