




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
信息檢索信息工程學(xué)院
田永曉E-mail:
信息檢索基礎(chǔ)-管理版
事后查明,早在十多年前,就有人研究出來(lái)了,方法非常簡(jiǎn)單,只需在甲醇中加入2%的水即可,檢索這篇文獻(xiàn)的時(shí)間是10多分鐘。一個(gè)小故事美國(guó)在實(shí)施“阿波羅登月計(jì)劃”中,對(duì)阿波羅飛船的燃料箱進(jìn)行壓力實(shí)驗(yàn)時(shí),發(fā)現(xiàn)甲醇會(huì)引起鈦應(yīng)力腐蝕,為此付出了數(shù)百萬(wàn)美元來(lái)研究解決這一問(wèn)題。2信息檢索基礎(chǔ)-管理版信息檢索的概念廣義的信息檢索是指將信息按一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)用戶的需要找到有關(guān)信息的過(guò)程和技術(shù);狹義的信息檢索是指從信息集合中找到所需信息的過(guò)程。3信息檢索基礎(chǔ)-管理版通過(guò)本課程使大家掌握信息檢索的基礎(chǔ)知識(shí),熟練掌握檢索技能,能夠靈活運(yùn)用檢索工具(如光盤數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)數(shù)據(jù)庫(kù))進(jìn)行文獻(xiàn)、數(shù)據(jù)、事實(shí)等信息的檢索,并能對(duì)檢索系統(tǒng)進(jìn)行評(píng)價(jià)和優(yōu)選。4信息檢索基礎(chǔ)-管理版第一章概論5信息檢索基礎(chǔ)-管理版
1.掌握信息檢索的概念2.掌握信息、知識(shí)、文獻(xiàn)的基本概念
3.掌握信息素質(zhì)、信息意識(shí)、信息能力、信息道德的基本概念
4.熟悉文獻(xiàn)的不同劃分類型5.掌握零、一、二、三次文獻(xiàn)的概念本章要求6信息檢索基礎(chǔ)-管理版信息、情報(bào)、知識(shí)、文獻(xiàn)第一節(jié)信息、信息社會(huì)與信息素質(zhì)信息檢索基礎(chǔ)-管理版一、信息(information)
英文information(信息)一詞源于拉丁文“Informatio”,是指一種陳述或一種解釋、理解等。《辭?!分袑⑿畔⒍x為音信、消息。《現(xiàn)代漢語(yǔ)詞典》的解釋是:對(duì)信息接受者來(lái)說(shuō)事先不知道的報(bào)道。8信息檢索基礎(chǔ)-管理版
香農(nóng)(1948)(美國(guó)數(shù)學(xué)家、信息論創(chuàng)始人)
香農(nóng)認(rèn)為,信息是通信的內(nèi)容,是“用來(lái)消除未來(lái)的某種不確定性的東西”,信息的多少反映了消除了的不確定性的大小。
不確定性:對(duì)客觀事物的不了解、不肯定。9信息檢索基礎(chǔ)-管理版
維納(1950)(美國(guó)數(shù)學(xué)家、控制論創(chuàng)始人)
維納(N.Wiener)將人與外部環(huán)境交換信息的過(guò)程看成是一種廣義的通信過(guò)程,認(rèn)為信息是人們?cè)谶m應(yīng)客觀世界的過(guò)程中與客觀世界進(jìn)行交換的內(nèi)容的名稱,是人與外部世界的中介。
“信息既不是物質(zhì),又不是能量,信息就是信息”。10信息檢索基礎(chǔ)-管理版
具有廣泛影響的定義
信息是事物存在方式、運(yùn)動(dòng)狀態(tài)及其特征的反映,是事物發(fā)出的信號(hào)、消息。
信息具有共享性、存儲(chǔ)性和傳遞性、價(jià)值性、時(shí)效性。11信息檢索基礎(chǔ)-管理版二、情報(bào)(information)《辭源》:“定敵情如何,而報(bào)于上官者”為情報(bào)?!掇o?!罚骸皯?zhàn)時(shí)關(guān)于敵情之報(bào)告,曰情報(bào)?!?/p>
情報(bào)是指運(yùn)用一定的形式,傳遞給用戶,并產(chǎn)生效益的知識(shí)或信息。
三個(gè)屬性:知識(shí)性、傳遞性、效用性。12信息檢索基礎(chǔ)-管理版三、知識(shí)(knowledge)《漢語(yǔ)詞典》中解釋為:人們?cè)诟脑焓澜绲膶?shí)踐中所獲得的認(rèn)識(shí)和經(jīng)驗(yàn)的總和。知識(shí)
是人類對(duì)自然界、人類社會(huì)中各種現(xiàn)象、規(guī)律的信息反映進(jìn)行思維分析,加工提煉,經(jīng)過(guò)系統(tǒng)化、理論化的結(jié)果。因此,知識(shí)是優(yōu)化、理論化的信息集合。13信息檢索基礎(chǔ)-管理版四、文獻(xiàn)(document)
是指記錄有知識(shí)的一切載體。也就是說(shuō)用文字、圖形、符號(hào)、聲頻、視頻等手段記錄下來(lái)的人類知識(shí)都可以稱之為文獻(xiàn)。
四個(gè)要素:
知識(shí)
載體
文字、圖形、符號(hào)、視頻、聲頻④記錄14信息檢索基礎(chǔ)-管理版信息、知識(shí)、情報(bào)、文獻(xiàn)四者的關(guān)系
認(rèn)識(shí)激活
信息知識(shí)情報(bào)
檢索記錄
文獻(xiàn)15信息檢索基礎(chǔ)-管理版信息素質(zhì)(informationliteracy)
是指判斷何時(shí)、何地需要信息,并有效的定位、獲取、評(píng)價(jià)和利用信息的一系列能力的總和。包括:計(jì)算機(jī)素養(yǎng)、因特網(wǎng)素養(yǎng)、媒體素養(yǎng)、圖書館素養(yǎng)、批判性思考的能力。信息素質(zhì)16信息檢索基礎(chǔ)-管理版
信息素質(zhì)主要體現(xiàn)在:信息意識(shí):是個(gè)體對(duì)信息重要性認(rèn)識(shí)程度和對(duì)信息是否具有特殊的、敏銳的感受力和持久的注意力,即對(duì)信息的捕捉、分析、判斷和吸收的敏感性。信息能力:是對(duì)信息的搜集獲取能力、分析鑒別能力和綜合利用能力。信息道德:個(gè)體在信息的獲取、使用、制造、傳播過(guò)程中應(yīng)遵守的倫理規(guī)范。17信息檢索基礎(chǔ)-管理版第二節(jié)文獻(xiàn)的類型一、按文獻(xiàn)載體劃分手寫型文獻(xiàn)(HandWritingDocument)人工書寫或抄寫而成的文獻(xiàn)。例如,寫在竹簡(jiǎn)、帛或紙張上的古代文獻(xiàn)、書法作品、原始記錄等。印刷型文獻(xiàn)(PrintedDocument)指以紙張為載體,通過(guò)膠印、鉛印、油印等手段形成的紙質(zhì)出版物。如書、刊等。18信息檢索基礎(chǔ)-管理版縮微型文獻(xiàn)(MicroFormDocument)
以感光材料為載體,以照相為記錄手段把文獻(xiàn)縮小形成的復(fù)制文獻(xiàn),如縮微平片、縮微膠卷。缺點(diǎn)是使用時(shí)要借助縮微閱讀器,使用不方便。視聽(tīng)型文獻(xiàn)(Audio-visualDocument)
又稱聲像型,載體是感光材料或磁性材料,如錄像帶、錄音帶、科技電影、幻燈片等。電子型文獻(xiàn)(ElectronicDocument)
是指以數(shù)字化技術(shù)將文獻(xiàn)存儲(chǔ)在光、磁載體上,通過(guò)計(jì)算機(jī)或網(wǎng)絡(luò)進(jìn)行閱讀的文獻(xiàn)。例如,數(shù)據(jù)庫(kù)文獻(xiàn)和網(wǎng)絡(luò)文獻(xiàn)信息。19信息檢索基礎(chǔ)-管理版二、按文獻(xiàn)的加工程度劃分零次文獻(xiàn)
是指未公開(kāi)出版的實(shí)驗(yàn)記錄、原始錄音(像)、書信、手稿、口頭交流的信息或?qū)嵨锏?。一次文獻(xiàn)
是指作者直接以自己的工作、科研、社會(huì)活動(dòng)等實(shí)踐經(jīng)驗(yàn)為依據(jù)而撰寫,并公開(kāi)發(fā)行進(jìn)入社會(huì)流通的專著、學(xué)術(shù)論文、專利說(shuō)明書、科技報(bào)告等。20信息檢索基礎(chǔ)-管理版二次文獻(xiàn)是根據(jù)一次文獻(xiàn)外表或內(nèi)容特征按照一定的規(guī)則和方法進(jìn)行整理、加工、濃縮,按一定順序編排形成的有序化文獻(xiàn)。如各種目錄、索引、文摘和各種書目型數(shù)據(jù)庫(kù)。三次文獻(xiàn)
是為了一定的目的和需求,對(duì)大量一次文獻(xiàn)信息中的有關(guān)內(nèi)容進(jìn)行綜合、分析、提煉、重新組合而形成的再生性文獻(xiàn)。如專題評(píng)述、綜述、百科全書、參考工具書等。21信息檢索基礎(chǔ)-管理版三、按文獻(xiàn)出版形式劃分圖書(Book)期刊(Journal)特種文獻(xiàn)(SpecialDocument)
①科技報(bào)告②專利文獻(xiàn)③會(huì)議文獻(xiàn)④學(xué)位論文⑤政府出版物⑥標(biāo)準(zhǔn)文獻(xiàn)⑦技術(shù)檔案⑧產(chǎn)品資料等22信息檢索基礎(chǔ)-管理版第二章信息檢索基礎(chǔ)23信息檢索基礎(chǔ)-管理版本章要求1.理解信息檢索的基本原理;
2.理解分類語(yǔ)言和主題語(yǔ)言;3.掌握各種檢索途徑的利用及其區(qū)別;4.掌握信息檢索的基本步驟;5.理解并掌握查全率、查準(zhǔn)率的概念與利用24信息檢索基礎(chǔ)-管理版第一節(jié)信息檢索系統(tǒng)及檢索語(yǔ)言一、信息檢索系統(tǒng)是根據(jù)特定的信息需求而建立起來(lái)的一種有關(guān)信息搜集、加工、存儲(chǔ)和檢索的服務(wù)系統(tǒng)??煞譃槭止z索系統(tǒng)計(jì)算機(jī)檢索系統(tǒng)25信息檢索基礎(chǔ)-管理版
二、信息檢索的原理是將描述特定用戶所需信息的提問(wèn)特征,與信息存儲(chǔ)的檢索標(biāo)識(shí)進(jìn)行異同的比較,從中找出與提問(wèn)特征一致或基本一致的信息。本質(zhì)是用戶的信息需求與存儲(chǔ)在信息集合中的信息進(jìn)行比較和選擇,即匹配的過(guò)程。26信息檢索基礎(chǔ)-管理版文獻(xiàn)的信息內(nèi)容主題概念檢索者的信息需要信息檢索語(yǔ)言
標(biāo)識(shí)檢索系統(tǒng)檢索結(jié)果主題分析主題分析標(biāo)引標(biāo)引輸入檢索輸出信息存貯信息檢索主題概念
標(biāo)識(shí)27信息檢索基礎(chǔ)-管理版三、檢索語(yǔ)言
是檢索信息所使用的語(yǔ)言。是信息檢索系統(tǒng)存儲(chǔ)和檢索信息時(shí)共同使用的一種約定性語(yǔ)言,以達(dá)到信息存儲(chǔ)和檢索的一致性,提高檢索效率。又稱標(biāo)引語(yǔ)言、索引語(yǔ)言、概念標(biāo)識(shí)系統(tǒng)等。28信息檢索基礎(chǔ)-管理版我國(guó)古代第一部成型的圖書分類法是西漢劉向、劉歆父子編制的《七略》。西晉,荀勖(xu)創(chuàng)立了四部分類法,即甲、乙、丙、丁四大部。從隋唐起,圖書的四部分類法已經(jīng)基本定型?;始覉D書館及秘書省、翰林院等重要典藏圖書之所,都是按照經(jīng)、史、子、集分四庫(kù)貯藏圖書的,名為"四庫(kù)書"。輯略六藝略諸子略詩(shī)賦略兵書略數(shù)術(shù)略方技略1.分類語(yǔ)言29信息檢索基礎(chǔ)-管理版分類語(yǔ)言是建立在科學(xué)分類的基礎(chǔ)上,運(yùn)用概念劃分與概括的方法,進(jìn)行層層劃分,每次劃分,就產(chǎn)生若干類目。逐級(jí)劃分,就產(chǎn)生了不同級(jí)別的類目,這些類目層層隸屬,形成一個(gè)嚴(yán)格有序的等級(jí)體系。常用分類號(hào)或分類詞表示。30信息檢索基礎(chǔ)-管理版馬克思主義、列寧主義、毛澤東思想、鄧小平理論A馬克思主義、列寧主義、毛澤東思想、鄧小平理論哲學(xué)、宗教B哲學(xué)、宗教社會(huì)科學(xué)C社會(huì)科學(xué)總論D政治、法律E軍事F經(jīng)濟(jì)G文化、科學(xué)、教育、體育H語(yǔ)言、文字I文學(xué)J藝術(shù)K歷史、地理自然科學(xué)N自然科學(xué)總論O數(shù)理科學(xué)和化學(xué)P天文學(xué)、地球科學(xué)Q生物科學(xué)R醫(yī)藥、衛(wèi)生S農(nóng)業(yè)科學(xué)T工業(yè)技術(shù)U交通運(yùn)輸V航空、航天X環(huán)境科學(xué)、安全科學(xué)綜合性圖書Z綜合性圖書中圖法體系結(jié)構(gòu)31信息檢索基礎(chǔ)-管理版C社會(huì)科學(xué)總論C0社會(huì)科學(xué)理論與方法論1社會(huì)科學(xué)現(xiàn)狀及發(fā)展2社會(huì)科學(xué)機(jī)構(gòu)、團(tuán)體、會(huì)議3社會(huì)科學(xué)研究方法4社會(huì)科學(xué)教育與普及5社會(huì)科學(xué)叢書、文集、連續(xù)性出版物6社會(huì)科學(xué)參考工具書[7]社會(huì)科學(xué)文獻(xiàn)檢索工具書
C8統(tǒng)計(jì)學(xué)91社會(huì)學(xué)92人口學(xué)93管理學(xué)[94]系統(tǒng)科學(xué)95民族學(xué)96人才學(xué)
97勞動(dòng)科學(xué)32信息檢索基礎(chǔ)-管理版C970勞動(dòng)科學(xué)基礎(chǔ)理論C971勞動(dòng)經(jīng)濟(jì)學(xué)C972勞動(dòng)法學(xué)C973勞動(dòng)關(guān)系學(xué)C974勞動(dòng)管理學(xué)C975職業(yè)培訓(xùn)C97勞動(dòng)科學(xué)33信息檢索基礎(chǔ)-管理版
優(yōu)勢(shì):類目體系展開(kāi)比較系統(tǒng),便于從學(xué)科門類出發(fā),進(jìn)行族性檢索。將概念逐級(jí)劃分,具有等級(jí)結(jié)構(gòu),便于擴(kuò)大和縮小檢索范圍。以分類號(hào)作為檢索標(biāo)識(shí),不存在文種限制。標(biāo)記簡(jiǎn)明,適用于分類排架,也可用于組織分類檢索工具。34信息檢索基礎(chǔ)-管理版不足:
不能充分揭示信息資源中大量存在的細(xì)小專深主題。分類表中的類目不能隨時(shí)更改,因而不能及時(shí)反映新的科學(xué)技術(shù)。按照直線序列設(shè)置類目,對(duì)邊緣學(xué)科課題只能標(biāo)引在一門學(xué)科的類目之下,檢索時(shí)可能漏檢。大型類表一般篇幅較大,對(duì)類表管理的要求較高。35信息檢索基礎(chǔ)-管理版2.主題語(yǔ)言是用自然語(yǔ)言中具有高度概括性的名詞、名詞性詞組描述事物概念,用參照系統(tǒng)等表達(dá)概念之間的相互關(guān)系的一種檢索語(yǔ)言。特點(diǎn):直觀性強(qiáng),專指度高。根據(jù)抽詞原則、編制方法及使用規(guī)則不同,可分為標(biāo)題詞語(yǔ)言、元詞語(yǔ)言、敘詞語(yǔ)言、關(guān)鍵詞語(yǔ)言。36信息檢索基礎(chǔ)-管理版(1)敘詞語(yǔ)言所謂敘詞,是指從自然語(yǔ)言中優(yōu)選出來(lái)并經(jīng)過(guò)規(guī)范化處理的術(shù)語(yǔ),又稱主題詞。敘詞語(yǔ)言是采用表示單元概念的規(guī)范化詞語(yǔ)的組合來(lái)對(duì)信息主題或內(nèi)容進(jìn)行描述的標(biāo)識(shí)系統(tǒng)。特點(diǎn):專指性、直觀性、多維檢索等。如《漢語(yǔ)主題詞表》(1980出版)37信息檢索基礎(chǔ)-管理版(2)關(guān)鍵詞語(yǔ)言是指從記錄信息的文獻(xiàn)題名、摘要和正文中提取出來(lái)的具有實(shí)際意義、能夠表達(dá)信息主題內(nèi)容的、未經(jīng)規(guī)范化的自然語(yǔ)言。特點(diǎn):
①一般不建立關(guān)鍵詞表,通常使用禁用詞表來(lái)淘汰不具有檢索意義的詞。②在標(biāo)引階段只進(jìn)行少量控制或不作控制,尤其適用于電子計(jì)算機(jī)處理和自動(dòng)標(biāo)引,能及時(shí)反映新事物概念。
③在檢索階段通過(guò)對(duì)同義控制和相關(guān)詞推薦等方式提供幫助。缺點(diǎn):檢索質(zhì)量難以保證。38信息檢索基礎(chǔ)-管理版1.分類檢索
根據(jù)文獻(xiàn)內(nèi)容在學(xué)科分類體系中的位置作為文獻(xiàn)信息的檢索途徑,它的檢索標(biāo)識(shí)是分類號(hào),是一種族性檢索。
我國(guó)按《中國(guó)圖書館分類法》進(jìn)行分類。如,C社會(huì)科學(xué)總論,C93管理學(xué),C933領(lǐng)導(dǎo)學(xué),C933.1領(lǐng)導(dǎo)體制2.2.3信息檢索途徑39信息檢索基礎(chǔ)-管理版2.關(guān)鍵詞途徑關(guān)鍵詞:來(lái)自于文獻(xiàn)的標(biāo)題、文摘或正文,是一種沒(méi)有規(guī)范化的自然語(yǔ)言。如:詞匯的簡(jiǎn)稱(CEO、MIS),生活常用語(yǔ)(打擺子、拉肚子)。特點(diǎn):沒(méi)有嚴(yán)格的語(yǔ)法規(guī)范,個(gè)人使用的愛(ài)好不同自由詞選擇不同(非典、非典型性肺炎、SARS、嚴(yán)重急性呼吸系統(tǒng)綜合癥等)缺點(diǎn):若要查出所有的相關(guān)文獻(xiàn),需要把各種可能的用詞都列出來(lái)分別查詢。40信息檢索基礎(chǔ)-管理版3.主題途徑
主題詞:是以自然語(yǔ)言為基礎(chǔ),以概念組配為基本原理,并經(jīng)過(guò)規(guī)范化處理,表達(dá)主題的最小概念單元,作為信息存儲(chǔ)和檢索依據(jù)的一種檢索語(yǔ)言。
特點(diǎn):詞義、詞類、詞形規(guī)范保證詞語(yǔ)與概念的唯一對(duì)應(yīng)關(guān)系,具有專指性。41信息檢索基礎(chǔ)-管理版
檢索舉例:冠心病的治療自由詞冠心病冠狀動(dòng)脈疾病冠狀動(dòng)脈粥樣硬化性心臟病冠狀動(dòng)脈心臟病冠狀動(dòng)脈疾病主題詞文獻(xiàn)治療治療42信息檢索基礎(chǔ)-管理版4.著者檢索用文獻(xiàn)的著者、編者、譯者的姓名或機(jī)構(gòu)團(tuán)體名稱編制而成的索引。按著者姓名字順編排書寫格式姓前(全稱)、名后(縮寫,即用首字母)
如:WillianHenryHarrison
→HarrisonWH
RenShuMin→RenSM43信息檢索基礎(chǔ)-管理版5.機(jī)構(gòu)檢索以機(jī)構(gòu)名稱為檢索詞,來(lái)查該機(jī)構(gòu)學(xué)者發(fā)表的文獻(xiàn)。(排除同名同姓)6.題名檢索按書名、刊名或文章篇名的字順進(jìn)行檢索。檢索限定刊物上發(fā)表的文獻(xiàn)。7.號(hào)碼途徑利用文獻(xiàn)代碼、序號(hào)編排成的號(hào)碼索引檢索文獻(xiàn)。如ISBN、ISSN等。8、引文檢索是以被引用文獻(xiàn)為檢索起點(diǎn)來(lái)查找引用文獻(xiàn)的過(guò)程。44信息檢索基礎(chǔ)-管理版2.3.1檢索步驟1.分析檢索課題,明確目的和要求用戶的檢索需求大致分為3類:新:及時(shí)獲得最新的內(nèi)容,對(duì)查全沒(méi)有過(guò)高要求。準(zhǔn):要解決研究中的具體問(wèn)題,要求檢出的文獻(xiàn)有針對(duì)性,對(duì)查準(zhǔn)要求較高。全:要全面了解某一特定領(lǐng)域的發(fā)生、發(fā)展和現(xiàn)狀,是一種回溯性檢索,對(duì)查全有較高要求。2.3信息檢索步驟及檢索效果評(píng)價(jià)信息檢索基礎(chǔ)-管理版2.選擇合適的檢索工具
根據(jù)課題的學(xué)科專業(yè)范圍、主題內(nèi)容,選擇合適的數(shù)據(jù)庫(kù)。3.選擇檢索途徑,確定檢索標(biāo)識(shí)。確定檢索途徑,根據(jù)數(shù)據(jù)庫(kù)的詞表,把主題內(nèi)容轉(zhuǎn)換成檢索系統(tǒng)采用的檢索標(biāo)識(shí)和檢索詞。4.查找文獻(xiàn)線索。
5.瀏覽檢索結(jié)果,獲取原始文獻(xiàn)。46信息檢索基礎(chǔ)-管理版
索取原文的方法:(1)檢索網(wǎng)上全文數(shù)據(jù)庫(kù)(2)利用網(wǎng)上出版社、雜志(3)利用圖書館館藏目錄(館藏聯(lián)合目錄)(4)利用“網(wǎng)上全文傳遞服務(wù)”(5)向著者索取47信息檢索基礎(chǔ)-管理版2.3.2檢索效果評(píng)價(jià)檢索要領(lǐng)是為實(shí)現(xiàn)檢索結(jié)果的全和準(zhǔn):因?yàn)闄z索結(jié)果主要通過(guò)查全率、查準(zhǔn)率兩個(gè)指標(biāo)來(lái)進(jìn)行評(píng)價(jià)。查全率:系統(tǒng)進(jìn)行檢索時(shí),檢出的相關(guān)文獻(xiàn)量與系統(tǒng)文獻(xiàn)庫(kù)中相關(guān)文獻(xiàn)總量的比率。
查準(zhǔn)率:系統(tǒng)中檢出的相關(guān)文獻(xiàn)量與檢出的文獻(xiàn)總量的比率。48信息檢索基礎(chǔ)-管理版思考:如某數(shù)據(jù)庫(kù)中共有探討“企業(yè)管理”的相關(guān)文章1000篇,而你在這個(gè)數(shù)據(jù)庫(kù)中只檢索出900篇,而且其檢索出的結(jié)果中還有100篇是不相關(guān)的,那么你這次檢索的查全率和查準(zhǔn)率各是多少?查全率80%查準(zhǔn)率88.9%49信息檢索基礎(chǔ)-管理版第三章計(jì)算機(jī)信息檢索概述50信息檢索基礎(chǔ)-管理版本章要求1.理解并掌握文檔、記錄和字段之間的關(guān)系;
2.熟悉數(shù)據(jù)庫(kù)的不同劃分類型3.理解并掌握布爾邏輯算符、截詞符、字段限定符的含義與使用方法;4.熟悉位置算符的概念;5.理解并掌握提高查全率、查準(zhǔn)率的各種方法51信息檢索基礎(chǔ)-管理版3.1.3數(shù)據(jù)庫(kù)(P24)數(shù)據(jù)庫(kù)的定義
計(jì)算機(jī)把大量相關(guān)的數(shù)據(jù)項(xiàng)有機(jī)地集中起來(lái)存放在數(shù)據(jù)文件中,構(gòu)成一個(gè)存放數(shù)據(jù)的整體,即數(shù)據(jù)庫(kù)。52信息檢索基礎(chǔ)-管理版字段1字段2字段3記錄1記錄2記錄3文檔1文檔2文檔3數(shù)據(jù)庫(kù)一、數(shù)據(jù)庫(kù)結(jié)構(gòu)53信息檢索基礎(chǔ)-管理版記錄與字段
記錄(Record)是構(gòu)成數(shù)據(jù)庫(kù)的信息單元,每條記錄都描述了一原始信息的外表和內(nèi)容特征。
字段(Field)是記錄的下級(jí)數(shù)據(jù)單位,用來(lái)描述實(shí)體的某一屬性。54信息檢索基礎(chǔ)-管理版記錄與字段55信息檢索基礎(chǔ)-管理版順序文檔(Sequentialfile)以文獻(xiàn)記錄作為信息存儲(chǔ)單元,按文獻(xiàn)記錄入藏的存取號(hào)從小到大順序排列而形成的目錄式文檔,由于它存儲(chǔ)有關(guān)于每篇文獻(xiàn)的最完整信息,所以通常又把它稱為主文檔(MasterFile),相當(dāng)于印刷型檢索工具的正文部分。倒排文檔(Invertedfile)就是把記錄中一切可檢字段或?qū)傩灾党槌?按某種順序重新加以組織后所得到的一種文檔.倒排檔從主文檔中派生出來(lái),所以,又叫做輔助文檔.56信息檢索基礎(chǔ)-管理版二、數(shù)據(jù)庫(kù)類型(按內(nèi)容分型)(一)書目數(shù)據(jù)庫(kù)(BibliographicDatabases)
:存儲(chǔ)文摘、題錄、目錄等書目數(shù)據(jù)的一類數(shù)據(jù)庫(kù),又稱為二次文獻(xiàn)數(shù)據(jù)庫(kù)。(二)事實(shí)數(shù)據(jù)庫(kù)(NumericDatabases)
:存儲(chǔ)描述人物、機(jī)構(gòu)、事物的等非文獻(xiàn)信息源的數(shù)據(jù)庫(kù)。(三)數(shù)值數(shù)據(jù)庫(kù)(FactDatabases):為用戶提供能夠直接使用的數(shù)值類信息,無(wú)需再追查原文。57信息檢索基礎(chǔ)-管理版(四)全文數(shù)據(jù)庫(kù)(FullTextDatabases)
:存儲(chǔ)文獻(xiàn)全文或節(jié)選其中主要部分的數(shù)據(jù)庫(kù)??梢灾苯荧@取原始資料。(五)圖像數(shù)據(jù)庫(kù)(ImageDatabases):以圖像為信息主體,配有文字解釋。58信息檢索基礎(chǔ)-管理版3.4計(jì)算機(jī)檢索基本技術(shù)與檢索策略(P36)檢索式是檢索策略的邏輯表達(dá)式,也稱檢索提問(wèn)式。是指計(jì)算機(jī)信息檢索中用來(lái)表達(dá)用戶檢索提問(wèn)的邏輯表達(dá)式,由檢索詞和各種布爾邏輯算符、位置算符以及系統(tǒng)規(guī)定的其他組配連接符號(hào)組成59信息檢索基礎(chǔ)-管理版
一、運(yùn)算符
又稱邏輯算符,是表達(dá)檢索詞之間邏輯關(guān)系和限制關(guān)系的運(yùn)算符號(hào),是復(fù)合檢索式不可缺少的構(gòu)件。60信息檢索基礎(chǔ)-管理版(一)布爾算符
1.“and”
稱為邏輯“與”,文字表示為“and”,符號(hào)表示為“*”。檢索詞A與檢索詞B用and組配,提問(wèn)式可寫為:
AandB或者A*B
表示:檢索結(jié)果中每條記錄必須同時(shí)含有A和B檢索詞,增強(qiáng)檢索的專指性,縮小檢索范圍,提高了查準(zhǔn)率。61信息檢索基礎(chǔ)-管理版舉例:邏輯運(yùn)算AND組織沖突的管理組織沖突AND管理62信息檢索基礎(chǔ)-管理版
2.“or”
稱為邏輯“或”,文字表示為“or”,用符號(hào)表示為“+”。檢索詞A與B用or組配,提問(wèn)式可寫為:
AorB或者A+B
表示:包含檢索詞A的文獻(xiàn)或包含檢索詞B的文獻(xiàn)或同時(shí)包含檢索詞A和檢索詞B的文獻(xiàn)均為命中文獻(xiàn),邏輯“或”擴(kuò)大了檢索范圍,提高查全率。63信息檢索基礎(chǔ)-管理版舉例:邏輯運(yùn)算OR低保OR最低生活保障64信息檢索基礎(chǔ)-管理版3.“not”
稱為邏輯“非”,用文字表示為“not”,用符號(hào)表示為“-”。檢索詞A與檢索詞B用not組配,提問(wèn)式可寫為:
AnotB或者A–B
表示:檢索結(jié)果中每條記錄必須包含檢索詞A,但不包含檢索詞B。排除了不希望出現(xiàn)的檢索詞,縮小了檢索范圍,提高查準(zhǔn)率。65信息檢索基礎(chǔ)-管理版舉例:邏輯運(yùn)算NOT氣功氣功NOT
通氣功能66信息檢索基礎(chǔ)-管理版1、一般性檢索有關(guān)甲型H1N1流感的文獻(xiàn)檢索式:甲型H1N1流感檢索式:豬流感OR甲型H1N1流感OR甲流2、全面檢索有關(guān)甲型H1N1流感的文獻(xiàn)67信息檢索基礎(chǔ)-管理版3、一般性檢索甲型H1N1流感的傳播途徑的文獻(xiàn)檢索式:甲型H1N1流感AND傳播途徑4、全面檢索有關(guān)甲型H1N1流感的傳播途徑的文獻(xiàn)檢索式:傳播途徑AND
(豬流感OR甲型H1N1流感OR甲流)
68信息檢索基礎(chǔ)-管理版(二)截詞符
“*”
和“?”
截詞檢索:用截詞符號(hào)“?”、“*”加在檢索詞的前后或中間,以檢索一組概念相關(guān)或同一詞根的詞。其中“?”代表有限截?cái)?,即一個(gè)“?”代表一個(gè)字符?!?”代表無(wú)限截?cái)?,一個(gè)“*”可代表多個(gè)字符。69信息檢索基礎(chǔ)-管理版后截?cái)啵瑢⒔卦~符號(hào)放在一個(gè)字符串的右方。例如:librar*library,libraries,librarian,…
涉及到詞的單復(fù)數(shù)、作者、年代、同根詞等方面的檢索時(shí),選用后截?cái)嗉夹g(shù)。前截?cái)?,將截詞符號(hào)放在一個(gè)字符串的左方。例如:*sighted,可查到farsighted與nearsighted。
前截?cái)嘀粰z索后綴相同的一類詞,常用于檢索化學(xué)化工文獻(xiàn)與復(fù)合詞較多的文獻(xiàn)。70信息檢索基礎(chǔ)-管理版(三)位置算符near
、
with位置算符:表示所連接的各個(gè)檢索詞之間位置關(guān)系的符號(hào),在不同的系統(tǒng)中往往以不同的符號(hào)表示。常用的位置算符有near
、
with等。near算符
表示此算符兩側(cè)的檢索詞出現(xiàn)在同一句子中。
Anear
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年山西衛(wèi)生健康職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2025年安徽汽車職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2025年寧夏警官職業(yè)學(xué)院高職單招(數(shù)學(xué))歷年真題考點(diǎn)含答案解析
- 2025年天津渤海職業(yè)技術(shù)學(xué)院高職單招語(yǔ)文2019-2024歷年真題考點(diǎn)試卷含答案解析
- 2025年天府新區(qū)航空旅游職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年常考版參考題庫(kù)含答案解析
- 教師說(shuō)課內(nèi)容展示
- 《教學(xué)工作匯報(bào)與總結(jié)》
- 護(hù)理學(xué)婦產(chǎn)科護(hù)理學(xué)
- 設(shè)備安裝合同質(zhì)保協(xié)議
- 胸椎骨折術(shù)后護(hù)理措施
- 育嬰行業(yè)前景及就業(yè)前景
- 2024年美容師考試?yán)碚摶仡櫾囶}及答案
- 老舊城市燃?xì)夤艿栏赂脑旃こ淘O(shè)計(jì)方案
- 中醫(yī)經(jīng)典臨證思維與實(shí)踐知到課后答案智慧樹(shù)章節(jié)測(cè)試答案2025年春浙江中醫(yī)藥大學(xué)
- 動(dòng)火和受限空間作業(yè)監(jiān)護(hù)人考試題有答案
- (正式版)HGT 6313-2024 化工園區(qū)智慧化評(píng)價(jià)導(dǎo)則
- 康復(fù)醫(yī)學(xué)科髖關(guān)節(jié)Harris-、膝關(guān)節(jié)HSS評(píng)分表
- 小學(xué)數(shù)學(xué)問(wèn)題解決(吳正憲)
- 第五節(jié) 胡靜-常用正頜外科手術(shù)
- 礦井開(kāi)拓方案比較
- DB23-黑龍江省建設(shè)工程施工操作技術(shù)規(guī)程-城鎮(zhèn)道路工程.doc
評(píng)論
0/150
提交評(píng)論