文獻(xiàn)信息檢索課件 第一講:文獻(xiàn)信息檢索基礎(chǔ)理論_第1頁(yè)
文獻(xiàn)信息檢索課件 第一講:文獻(xiàn)信息檢索基礎(chǔ)理論_第2頁(yè)
文獻(xiàn)信息檢索課件 第一講:文獻(xiàn)信息檢索基礎(chǔ)理論_第3頁(yè)
文獻(xiàn)信息檢索課件 第一講:文獻(xiàn)信息檢索基礎(chǔ)理論_第4頁(yè)
文獻(xiàn)信息檢索課件 第一講:文獻(xiàn)信息檢索基礎(chǔ)理論_第5頁(yè)
已閱讀5頁(yè),還剩180頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1/12/202311/12/20232南通大學(xué)圖書館信息檢索教研室文獻(xiàn)信息檢索1/12/20233第一講文獻(xiàn)信息檢索根底1.1信息、知識(shí)、情報(bào)、文獻(xiàn)1.2信息資源1.3信息檢索的定義與類型1.4信息檢索原理1.5信息檢索語(yǔ)言★〔本章重點(diǎn)、難點(diǎn)〕1.6信息檢索途徑1.7計(jì)算機(jī)檢索技術(shù)★〔本章重點(diǎn)、難點(diǎn)〕1.8計(jì)算機(jī)信息檢索的要素1.9信息檢索方法1.10信息檢索策略〔信息檢索步驟〕1.11信息檢索效果評(píng)價(jià)1/12/202341.1信息、知識(shí)、情報(bào)、文獻(xiàn)1.1.1信息

1.信息的定義:信息是人類社會(huì)中表征事物之間聯(lián)系的消息、情報(bào)、指令、數(shù)據(jù)或信號(hào),并以文字、圖像、圖形、語(yǔ)言、聲音等多種形式出現(xiàn)。2.信息的特性◆傳遞性:信息借助于一定的物質(zhì)載體可以進(jìn)行傳遞。1/12/20235◆時(shí)效性:指信息發(fā)出、接收到利用的時(shí)間間隔及其效率,也包括信息本身更新的速度。時(shí)效性是信息的重要特點(diǎn)。如果傳遞很慢,那么再有用的信息常常也會(huì)失去其應(yīng)有的價(jià)值,比方新聞、預(yù)告等。◆共享性:在信息的擴(kuò)散和用戶分享信息的過(guò)程中,信息載體本身的信息量并不因此過(guò)程而減少,各用戶分享的信息份額也不因分享的人的多少而受影響。◆客觀性:信息是客觀存在的,信息的產(chǎn)生源于物質(zhì),信息產(chǎn)生后又必須依附于物1/12/20236質(zhì)。就世界整體而言,信息的根源是物質(zhì)世界,信息是物質(zhì)的根本屬性,由于物質(zhì)是客觀存在的,所以信息的存在也是不以人們的意志為轉(zhuǎn)移的?!艨蓴U(kuò)散性:指信息通過(guò)各種渠道、媒介進(jìn)行傳播,它的擴(kuò)散是沒(méi)有窮盡的。◆可擴(kuò)充性:人們對(duì)世界的認(rèn)識(shí)是無(wú)限的,信息資源的擴(kuò)充與積累也是無(wú)限的?!艨商娲裕盒畔⒌奈镔|(zhì)載體形態(tài)是可以互相轉(zhuǎn)移變換的。1/12/202371.1.2知識(shí)1.知識(shí)的定義知識(shí)〔Knowledge〕是人們對(duì)客觀事物的存在和運(yùn)動(dòng)規(guī)律的認(rèn)識(shí),是人類在改造客觀世界的實(shí)踐中積累起來(lái)的認(rèn)識(shí)和經(jīng)驗(yàn)的總和。2.知識(shí)的類型1〕隱性知識(shí)顯性知識(shí)2〕世界經(jīng)合組織的分類:Know–whatKnow–whyKnow–howKnow–who1/12/202381.1.3情報(bào)根本屬性:傳遞性、效用性、知識(shí)性1.1.4文獻(xiàn)1.文獻(xiàn)的定義文獻(xiàn)一詞在我國(guó)最早見(jiàn)于?論語(yǔ)·八佾〔yì〕?。宋代朱熹解釋為“文,典籍也;獻(xiàn),賢也。〞即記載和掌握知識(shí)的書籍和有學(xué)問(wèn)的人即是“文〞和“獻(xiàn)〞。元代中后期:從兼指典籍和賢人變?yōu)槠傅浼?。明代以后:指有參考價(jià)值的重要的典籍。1/12/20239?中華人民共和國(guó)標(biāo)準(zhǔn)·文獻(xiàn)著錄總那么?:文獻(xiàn)是記錄有知識(shí)的一切載體。2.構(gòu)成文獻(xiàn)的四個(gè)要素:文獻(xiàn)具有四重含義:知識(shí)是文獻(xiàn)的實(shí)質(zhì)內(nèi)容,載體是文獻(xiàn)的外在形式,符號(hào)、文字、聲音等是人體感覺(jué)信息的媒介,記錄是把知識(shí)存附在載體上形成文獻(xiàn)的手段。由此得出文獻(xiàn)的四個(gè)要素:內(nèi)容、物質(zhì)載體、符號(hào)系統(tǒng)和記錄方式1/12/2023103.文獻(xiàn)信息的類型〔1〕根據(jù)文獻(xiàn)的記錄方式〔或稱載體形態(tài)〕,大致可以分為:①書寫型文獻(xiàn):甲骨文獻(xiàn)、泥版文獻(xiàn)、繪畫、書法作品等②印刷型文獻(xiàn):圖書、期刊、特種文獻(xiàn)、小冊(cè)子③縮微型文獻(xiàn):縮微膠片、縮微膠卷、縮微卡片④聲像型文獻(xiàn):照片、錄音帶、錄像帶、影視片⑤電子型文獻(xiàn):數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)文獻(xiàn)、印刷型文獻(xiàn)的數(shù)字化

1/12/202311〔2〕按編纂體例和出版形式劃分:文獻(xiàn)可分為十類主要文獻(xiàn):①圖書②期刊③學(xué)位論文④會(huì)議文獻(xiàn)⑤專利文獻(xiàn)⑥標(biāo)準(zhǔn)文獻(xiàn)⑦檔案文獻(xiàn)⑧政府出版物⑨科技報(bào)告⑩產(chǎn)品樣本等。一般將圖書、期刊作為普通文獻(xiàn),其余八種文獻(xiàn)稱為特種文獻(xiàn)。1/12/202312國(guó)際標(biāo)準(zhǔn)書號(hào)/ISBN簡(jiǎn)介國(guó)際標(biāo)準(zhǔn)書號(hào)英文全稱為InternationalStandardBookNumber,簡(jiǎn)稱ISBN。原國(guó)際標(biāo)準(zhǔn)書號(hào)由十位數(shù)字組成。被三條短橫線分為具有不同含義的四段〔組號(hào)、出版者號(hào)、書序號(hào)、校驗(yàn)碼〕。由2007年1月1日起,國(guó)際標(biāo)準(zhǔn)書號(hào)由10位增至13位數(shù)字,即在現(xiàn)有的10位書號(hào)前面加上“978〞及重新計(jì)算稽核號(hào),以轉(zhuǎn)換為新的13位格式。例如:ISBN978-7-5019-5191-8,轉(zhuǎn)換后的13位書號(hào)與國(guó)際貨品編碼〔EAN-13〕相同。1/12/202313新的ISBN由13位數(shù)字組成,可分為5局部:第一局部為前綴號(hào),由國(guó)際EAN提供3位數(shù)字。第二局部為地域號(hào)〔國(guó)家、地區(qū)、語(yǔ)言區(qū)〕,又叫組號(hào)(GroupIdentifier),最短的是一位數(shù)字,最長(zhǎng)的達(dá)五位數(shù)字,大體上兼顧文種、國(guó)別和地區(qū)。把全世界自愿申請(qǐng)參加國(guó)際標(biāo)準(zhǔn)書號(hào)體系的國(guó)家和地區(qū),劃分成假設(shè)干地區(qū),各有固定的編碼:1/12/202314

▲0、1代表英語(yǔ)區(qū):使用這兩個(gè)代碼的國(guó)家有:澳大利亞、加拿大、愛(ài)爾蘭、新西蘭、波多黎各、南非、英國(guó)、美國(guó)、津巴布韋等;

▲2代表法語(yǔ)區(qū):法國(guó)、盧森堡以及比利時(shí)、加拿大和瑞士的法語(yǔ)區(qū)使用該代碼;

▲3代表德語(yǔ)區(qū):德國(guó)、奧地利和瑞士德語(yǔ)區(qū)使用該代碼;

▲4代表日語(yǔ)區(qū):它是日本出版物的代碼;

▲5代表俄語(yǔ)區(qū);

▲7代表漢語(yǔ)區(qū):是中國(guó)出版物使用的代碼;

▲印度等為8;

▲88代表意大利語(yǔ)區(qū);

▲東南亞地區(qū)為9。1/12/202315第三局部是出版社代碼(PublisherIdentifier),由其隸屬的國(guó)家或地區(qū)ISBN中心分配,允許取值范圍為2-5位數(shù)字。第四局部是書序號(hào)(TitleIdentifier),由出版社自己給出,且每個(gè)出版社的書序號(hào)是定長(zhǎng)的。最短的一位,最長(zhǎng)的六位。第五局部即第十三位數(shù)字,是電子計(jì)算機(jī)的校驗(yàn)碼〔CheckDigit〕。固定一位,起止號(hào)為0-10,10由X代替。1/12/202316★校驗(yàn)碼的使用:用1分別乘ISBN的前12位中的奇數(shù)位,用3乘以偶數(shù)位,成績(jī)之和以10為模,用10減去此模,即可得到校驗(yàn)位的值,其值范圍應(yīng)該為0-9。假設(shè)?行為金融學(xué)?這本書的ISBN號(hào)為:978-7-309-04547-5,其13位ISBN號(hào)碼前15位(包含‘-’符號(hào)〕是:978-7-309-04547;位置為123-4-567-89(10)(11)(12)計(jì)算加權(quán)和S:S=9×1+7×3+8×1+7×3+3×1+0×3+9×1+0×3+4×1+5×3+4×1+7×3=115;計(jì)算S÷10的余數(shù)M:M=115mod10=5;計(jì)算10-M的差N:N=10-5=5(如果10-M的值為10那么校驗(yàn)碼取0)所以,這本書的13位ISBN的校驗(yàn)碼是5。1/12/2023171/12/202318國(guó)際標(biāo)準(zhǔn)連續(xù)出版物編號(hào)/ISSN簡(jiǎn)介ISSN是InternationalStandardSerialNumber的簡(jiǎn)稱,由設(shè)在法國(guó)巴黎的國(guó)際ISDS〔國(guó)際連續(xù)出版物數(shù)據(jù)系統(tǒng)〕中心為在該系統(tǒng)登記的連續(xù)出版物分配的號(hào)碼。采用ISSN編碼系統(tǒng)的出版物有:期刊、會(huì)議錄等。

國(guó)際標(biāo)準(zhǔn)連續(xù)出版物編號(hào)由以“ISSN〞為前綴的8位數(shù)字〔兩段4位數(shù)字,中間以一連字符“—〞相接〕組成。如ISSN1001-6651?為新華文摘?的刊號(hào),其中前7位數(shù)字為順序號(hào),最后一位是校驗(yàn)位。1/12/2023191975年起建立世界性的連續(xù)出版物標(biāo)準(zhǔn)書目數(shù)據(jù)庫(kù),目前已有近200個(gè)國(guó)家和地區(qū)出版的65萬(wàn)種期刊〔包括已??摹车怯浫霂?kù),成為國(guó)際上最權(quán)威的期刊書目數(shù)據(jù)網(wǎng)絡(luò)系統(tǒng)。我國(guó)于1985年建立了ISSN中國(guó)分中心〔設(shè)在北京圖書館〕,負(fù)責(zé)中國(guó)期刊ISSN號(hào)的分配與管理,目前已有近5000種中文期刊分配了ISSN號(hào)并進(jìn)入了國(guó)際ISSN數(shù)據(jù)系統(tǒng)。ISSN通常都印在期刊的封面或版權(quán)頁(yè)上。報(bào)刊司有關(guān)官員介紹說(shuō),國(guó)內(nèi)正式期刊的刊號(hào)是由國(guó)際標(biāo)準(zhǔn)刊號(hào)〔ISSN〕和國(guó)內(nèi)統(tǒng)一刊號(hào)〔CN〕兩局部組成,“CN〞是中國(guó)國(guó)別代碼,1/12/202320只有ISSN國(guó)際刊號(hào)而無(wú)國(guó)內(nèi)統(tǒng)一刊號(hào)的期刊在國(guó)內(nèi)被視為非法出版物。

★CN刊號(hào)標(biāo)準(zhǔn)格式是:CNXX-XXXX,如CN11-43,其中前兩位是各省〔區(qū)、市〕區(qū)號(hào)。而印有“CN〔HK〕〞或“CNXXX〔HK〕/R〞的依然不是合法的國(guó)內(nèi)統(tǒng)一刊號(hào)。

例如?大學(xué)圖書館學(xué)報(bào)?:ISSN1002-1027,CN11-2952/G2★ISBN和ISSN有什么區(qū)別?

ISBN為是國(guó)際標(biāo)準(zhǔn)書號(hào)的意思。ISSN是國(guó)際標(biāo)準(zhǔn)刊號(hào)的意思。ISBN和ISSN的根本區(qū)別在于對(duì)象不同。前者是發(fā)給書籍出版商;后者是發(fā)給刊物出版商。1/12/202321核心期刊核心期刊——某學(xué)科〔或某領(lǐng)域〕的核心期刊,是指那些發(fā)表該學(xué)科〔或該領(lǐng)域〕論文較多、使用率〔含被引率、摘轉(zhuǎn)率和流通率〕較高、學(xué)術(shù)影響較大的期刊。國(guó)內(nèi)的核心刊目錄有北大版的,南大CSSCI版的。國(guó)際上SCI、EI等權(quán)威檢索工具所收錄期刊為重要的期刊。1/12/202322〔3〕按照是否出版,文獻(xiàn)可以劃分為正式出版物、非正式出版物。〔4〕按文獻(xiàn)的加工程度可以分為零次、一次、二次、三次文獻(xiàn)。文獻(xiàn)的加工是指對(duì)文獻(xiàn)進(jìn)行整理,使其處于可利用狀態(tài)的工作。按文獻(xiàn)的加工程度可將文獻(xiàn)分為:①零次文獻(xiàn)〔指未經(jīng)刊載或未進(jìn)入社會(huì)交流的最原始的文獻(xiàn)〕,如實(shí)驗(yàn)記錄、文章草稿、私人日記、筆記、書信、設(shè)計(jì)草圖、內(nèi)部報(bào)告等。1/12/202323②一次文獻(xiàn)〔指作者以生產(chǎn)或科研成果為根本素材而創(chuàng)作或撰寫并發(fā)表的文獻(xiàn),習(xí)慣稱之為原始文獻(xiàn)〕,如:專著、報(bào)紙、期刊論文、專利文獻(xiàn)、會(huì)議論文、學(xué)位論文、技術(shù)標(biāo)準(zhǔn)、報(bào)告等。③二次文獻(xiàn)〔又稱檢索性文獻(xiàn)〕,如:書目、索引、文摘、題錄、搜索引擎等屬于二次文獻(xiàn)。④三次文獻(xiàn)〔又稱參考性文獻(xiàn)〕,又分為綜述研究類和參考工具類兩種類型。如:綜述、專題述評(píng)、學(xué)科年度總結(jié)、數(shù)據(jù)手冊(cè)、百科全書等參考工具書都是三次文獻(xiàn)。1/12/202324★從一次文獻(xiàn)到二次文獻(xiàn)、三次文獻(xiàn),是知識(shí)與信息從無(wú)序到有序的結(jié)構(gòu)化、系統(tǒng)化的過(guò)程。零次文獻(xiàn)是一次文獻(xiàn)的素材;一次文獻(xiàn)是文獻(xiàn)的根本形式,是檢索的對(duì)象;二次文獻(xiàn)是對(duì)一次文獻(xiàn)的加工處理,是檢索一次文獻(xiàn)的工具;三次文獻(xiàn)那么是對(duì)一次文獻(xiàn)與二次文獻(xiàn)分析研究的成果?!?〕按照內(nèi)容的公開程度,文獻(xiàn)可以劃分為:白色文獻(xiàn)、灰色文獻(xiàn)和黑色文獻(xiàn)。1/12/202325書目題錄索引文摘詞典名錄指南手冊(cè)年鑒百科全書綜述評(píng)述進(jìn)展報(bào)告論文叢集二次文獻(xiàn)原始文獻(xiàn)(一次文獻(xiàn))三次文獻(xiàn)文獻(xiàn)整理重組、濃縮圖文獻(xiàn)結(jié)構(gòu)示意圖原始文獻(xiàn)(一次文獻(xiàn))1/12/202326文獻(xiàn)信息資源類型一次文獻(xiàn)二次文獻(xiàn)三次文獻(xiàn)零次文獻(xiàn)白色文獻(xiàn)灰色文獻(xiàn)黑色文獻(xiàn)圖書期刊論文報(bào)紙會(huì)議文獻(xiàn)學(xué)位論文專利文獻(xiàn)標(biāo)準(zhǔn)文獻(xiàn)科技報(bào)告技術(shù)檔案政府出版物產(chǎn)品樣本文獻(xiàn)信息按加工程度分按出版形式分按內(nèi)容公開程度分按載體形式分書寫型印刷型縮微型聲像型電子型1/12/202327信息、知識(shí)、情報(bào)、文獻(xiàn)之間的關(guān)系文獻(xiàn)情報(bào)信息知識(shí)ABCD1/12/202328信息、知識(shí)與文獻(xiàn)傳遞運(yùn)用后事物運(yùn)動(dòng)

知識(shí)新的信息信息產(chǎn)生人腦有序化用于實(shí)踐文獻(xiàn)記錄在載體上1/12/2023291.2信息資源〔InformationResources〕1.信息資源的概念信息資源是指以文字、圖形、圖像、聲音、動(dòng)畫和視像等形式儲(chǔ)存在一定的載體上并可供利用的信息。包括信息內(nèi)容以及與信息內(nèi)容相關(guān)的信息技術(shù)、信息設(shè)施、信息人員等。2.信息資源的類型信息資源的劃分標(biāo)準(zhǔn)是多種多樣的:首先,按信息資源的開發(fā)程度或存在狀態(tài)可分為潛在的信息資源和現(xiàn)實(shí)的信息資源兩大類。1/12/202330現(xiàn)實(shí)的信息資源依據(jù)其載體可劃分為文獻(xiàn)信息資源和非文獻(xiàn)信息資源:非文獻(xiàn)信息資源主要包括:口語(yǔ)信息資源體語(yǔ)信息資源實(shí)物信息資源★網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源是通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)可利用的信息資源的總和,是以數(shù)字化形式存儲(chǔ)于網(wǎng)絡(luò)節(jié)點(diǎn)中的、借助網(wǎng)絡(luò)進(jìn)行傳播和利用的信息產(chǎn)品和信息系統(tǒng)的集合體。1/12/202331網(wǎng)絡(luò)信息資源的類型:①按信息表現(xiàn)形式分有電子出版物和非電子出版物信息資源②按信息的媒體形式分為文本信息資源、超文本信息資源、多媒體信息資源和超媒體信息資源③按網(wǎng)絡(luò)信息資源加工層次,可以分為網(wǎng)絡(luò)資源指南和搜索引擎、聯(lián)機(jī)館藏目錄、數(shù)據(jù)庫(kù)信息資源、電子出版物、網(wǎng)上參考工具和其他動(dòng)態(tài)信息1/12/202332④按照采用的不同的網(wǎng)絡(luò)協(xié)議來(lái)劃分,可以分為基于超文本傳輸協(xié)議〔HTTP〕的信息資源、基于文本傳輸協(xié)議〔FTP〕的信息資源、基于遠(yuǎn)程登錄〔Telnet〕的信息資源、新聞組〔Usenet/Newsgroups〕資源和電子郵件〔E-mail〕信息資源信息資源的其他劃分標(biāo)準(zhǔn):①按加工程度劃分:零次、一次、二次、三次信息資源②按信息載體的類型劃分:紙質(zhì)信息資源、非紙質(zhì)信息資源1/12/2023333.信息資源的特點(diǎn)無(wú)限性無(wú)形性時(shí)效性增值性共享性1/12/2023341.3信息檢索的定義與類型要求了解信息檢索定義的廣義與狹義之分,并了解信息檢索不同類型的區(qū)別。1.信息檢索的定義廣義的信息檢索:包括信息的存儲(chǔ)和信息的檢索,往往又稱為“信息存儲(chǔ)與檢索〞〔InformationStorageandRetrieval〕。狹義的信息檢索:是指信息的有序化識(shí)別和查找的過(guò)程,即人們根據(jù)特定的信息需求,采取科學(xué)的方法,應(yīng)用專門的工具,從浩瀚的信息海洋中迅速、準(zhǔn)確地獲取所需信息的過(guò)程〔InformationRetrieval〕。1/12/2023352.信息檢索的類型◆按信息檢索的對(duì)象劃分:(1)文獻(xiàn)檢索〔DocumentRetrieval〕:從大量的文獻(xiàn)集合中查找出特定需要的相關(guān)文獻(xiàn)的過(guò)程。即以文獻(xiàn)為對(duì)象的一種檢索活動(dòng)。但凡查找某個(gè)題目的有關(guān)文獻(xiàn)以及答復(fù)這些文獻(xiàn)的情況、出處、收藏地點(diǎn)等等,均屬于文獻(xiàn)檢索的范疇。典型的提問(wèn)式:有關(guān)于“如何平衡人際關(guān)系〞的書嗎?我到哪里可以找到?關(guān)于我們所學(xué)專業(yè)的學(xué)生就業(yè)情況有哪些文獻(xiàn)報(bào)道?1/12/202336(2)數(shù)據(jù)檢索:以數(shù)據(jù)為檢索對(duì)象,是一種確定性檢索。(3)事實(shí)檢索:利用特定的參考工具書或事實(shí)性數(shù)據(jù)庫(kù)查找出能夠直接答復(fù)某一提問(wèn)的事實(shí)的過(guò)程?!镂墨I(xiàn)檢索既不同于數(shù)據(jù)檢索能確切地答復(fù)檢索對(duì)象的有關(guān)“量〞的數(shù)據(jù)或數(shù)據(jù)范圍,也不能如事實(shí)檢索簡(jiǎn)單地答復(fù)質(zhì)的方面的事實(shí)提問(wèn),它是一種相關(guān)性的檢索,帶有很大的不確定性,是這三種檢索形式中,使用最廣、效果最大、最重要的一種。注意:要求能說(shuō)出這三種類型的區(qū)別1/12/202337◆按信息檢索的手段劃分:手工檢索計(jì)算機(jī)檢索:聯(lián)機(jī)檢索、光盤檢索、網(wǎng)絡(luò)檢索◆按信息組織的方式劃分:(1)目錄檢索(2)題錄檢索題錄是指文獻(xiàn)的根本信息,包括題名、作者、關(guān)鍵詞、作者機(jī)構(gòu)、文獻(xiàn)來(lái)源等。選擇保存題錄是指當(dāng)獲得檢索結(jié)果后,如需要將檢索結(jié)果的目錄保存以供他用時(shí),可在檢索結(jié)果的簡(jiǎn)單頁(yè)面上選擇條目進(jìn)行保存。1/12/2023381/12/202339(3)文摘檢索(4)全文檢索(5)超文本檢索

超文本是一種電子文檔,其中的文字包含有可以鏈接到其他字段或者文檔的超文本鏈接,允許從當(dāng)前閱讀位置直接切換到超文本鏈接所指向的文字。通常使用超文本標(biāo)記語(yǔ)言(HyperTextMarkupLanguage,簡(jiǎn)稱HTML)書寫。大多數(shù)網(wǎng)頁(yè)都屬于超文本。1/12/202340

(6)超媒體檢索:對(duì)超文本檢索的補(bǔ)充。超媒體不僅可以包含文字而且還可以包含圖形、圖像、動(dòng)畫、聲音和電視片斷,這些媒體之間也是用超級(jí)鏈接組織的,而且它們之間的鏈接也是錯(cuò)綜復(fù)雜的。

1/12/2023411/12/2023421/12/2023431.4信息檢索原理信息存儲(chǔ)文獻(xiàn)信息內(nèi)容信息特征信息檢索用戶信息需求分析信息特征標(biāo)引標(biāo)引信息檢索語(yǔ)言輸入

輸入信息檢索系統(tǒng)輸出檢索結(jié)果提問(wèn)標(biāo)識(shí)

檢索標(biāo)識(shí)分析1/12/202344存儲(chǔ)過(guò)程檢索過(guò)程

信息處理人員原始信息信息分析、著錄和標(biāo)引

用戶

檢索課題

檢索工具

檢索結(jié)果

課題分析檢索語(yǔ)言信息檢索原理1/12/2023451.5信息檢索語(yǔ)言★〔本章重點(diǎn)、難點(diǎn)〕1.定義:為建立信息檢索系統(tǒng)而創(chuàng)立的專門用來(lái)描述信息特征〔內(nèi)容特征或外表特征〕和表達(dá)檢索提問(wèn)的一種人工語(yǔ)言,又稱為信息存儲(chǔ)與檢索語(yǔ)言、標(biāo)引語(yǔ)言、索引語(yǔ)言等。2.類型:◆根據(jù)描述信息的特征劃分:描述信息內(nèi)容特征的語(yǔ)言:分類、主題語(yǔ)言、代碼語(yǔ)言。描述信息外表特征的語(yǔ)言:篇名、著者名稱、號(hào)碼、機(jī)構(gòu)名稱和引文等。重點(diǎn):主題檢索語(yǔ)言和分類檢索語(yǔ)言1/12/202346◆按檢索詞的標(biāo)準(zhǔn)化程度和組配程序劃分:受控語(yǔ)言、非受控語(yǔ)言〔也即標(biāo)準(zhǔn)化語(yǔ)言和非標(biāo)準(zhǔn)化語(yǔ)言〕◆按其標(biāo)識(shí)的組合使用方法,可以劃分為:先組式語(yǔ)言〔如分類語(yǔ)言〕、后組式語(yǔ)言〔如單元詞語(yǔ)言〕1/12/202347分類檢索語(yǔ)言分類檢索語(yǔ)言是一種按學(xué)科體系或事物性質(zhì)來(lái)進(jìn)行歸類標(biāo)引的檢索語(yǔ)言。一般是用分類號(hào)和相應(yīng)的分類款目來(lái)表達(dá)各種主題概念。信息檢索中常用的分類檢索語(yǔ)言是等級(jí)體系分類語(yǔ)言〔簡(jiǎn)稱分類法〕。如:?中國(guó)圖書館分類法?〔簡(jiǎn)稱?中圖法?〕、?中國(guó)科學(xué)院圖書館圖書分類法?〔簡(jiǎn)稱?科圖法?〕、?美國(guó)國(guó)會(huì)圖書館分類法?〔LC〕、?杜威十進(jìn)制分類法?〔DDC〕等都是分類檢索語(yǔ)言。分類檢索語(yǔ)言的具體表現(xiàn)形式主要由分類表、輔助表和使用說(shuō)明三個(gè)局部組成。1/12/202348分類法是按信息資源內(nèi)容的學(xué)科知識(shí)屬性或者事物性質(zhì)分門別類系統(tǒng)地標(biāo)識(shí)和組織信息資源,一般用分類號(hào)來(lái)表達(dá)文獻(xiàn)主題概念的方法。分類法的目的就是編制或建立一個(gè)知識(shí)地圖、一個(gè)知識(shí)樹,既囊括人類的全部知識(shí)領(lǐng)域,又分門別類地進(jìn)行聚類、疏理和組織,使人們可以從知識(shí)的整體結(jié)構(gòu)或其中的一個(gè)知識(shí)結(jié)點(diǎn)入口層層深入,檢索到相關(guān)的知識(shí)、信息、文獻(xiàn)。1/12/202349分類法的根本特征:◆對(duì)知識(shí)進(jìn)行邏輯、系統(tǒng)的組織,因此又稱為系統(tǒng)分類法。◆把知識(shí)分門別類地進(jìn)行等級(jí)排列,因此又稱為等級(jí)分類法?!舭阎R(shí)詳細(xì)地羅列、展開,因此又稱為列舉分類法或枚舉分類法。1/12/202350分類檢索語(yǔ)言的特點(diǎn)

〔1〕分類法符合人們認(rèn)識(shí)事物的規(guī)律和處理事物的習(xí)慣。〔2〕由于分類法是按學(xué)科、專業(yè)集中文獻(xiàn),能系統(tǒng)地揭示文獻(xiàn)內(nèi)容特征,因此能夠?qū)崿F(xiàn)族性檢索,獲得較高的查全率?!?〕便于組織圖書資料的排架?!?〕分類檢索語(yǔ)言是一種先組式語(yǔ)言,不能隨時(shí)修改補(bǔ)充。因此,當(dāng)新興學(xué)科和邊緣學(xué)科一旦出現(xiàn),往往會(huì)排到意想不到的類目下,造成檢索上的困難。1/12/202351分類檢索語(yǔ)言的類型1、我國(guó)古代的四局部類法?四庫(kù)全書??四庫(kù)全書總目?1/12/2023521/12/2023532、當(dāng)代的學(xué)科體系分類法體系分類法中用于表示一類事物的概念稱為“類名〞,代表類名的標(biāo)識(shí)符號(hào)稱為“類號(hào)〞。3、事物性質(zhì)分類法1/12/202354?中國(guó)圖書館分類法??中國(guó)圖書館分類法?〔簡(jiǎn)稱?中圖法?〕廣為全國(guó)公共圖書館和信息研究所等機(jī)構(gòu)采用,是我國(guó)通用的綜合性圖書資料分類法。?中圖法?中的標(biāo)記符號(hào)采用漢語(yǔ)拼音字母與阿拉伯?dāng)?shù)字相結(jié)合的混合制號(hào)碼,用一個(gè)字母表示一個(gè)大類,以下的各級(jí)類目用數(shù)字或字母加數(shù)字表示,如H315。1/12/202355根本大類A馬克思主義、列寧主義、毛澤東思想、鄧小平理論B哲學(xué)、宗教C~K社會(huì)科學(xué)C社會(huì)科學(xué)總論D政治、法律E軍事F經(jīng)濟(jì)G文化、科學(xué)、教育、體育H語(yǔ)言、文字1/12/202356

I文學(xué)J藝術(shù)K歷史、地理

N~X自然科學(xué)N自然科學(xué)總論O數(shù)理科學(xué)和化學(xué)P天文學(xué)、地球科學(xué)Q生物科學(xué)R醫(yī)藥、衛(wèi)生1/12/202357S農(nóng)業(yè)科學(xué)T工業(yè)技術(shù)U交通運(yùn)輸V航空、航天X環(huán)境科學(xué)、平安科學(xué)Z綜合性圖書1/12/202358?中國(guó)圖書館分類法?共有5大部類,22個(gè)大類,它是以學(xué)科分類為根底,結(jié)合信息內(nèi)容特征的一種直接表達(dá)知識(shí)分類概念的檢索語(yǔ)言。它的語(yǔ)言即是類名或分類號(hào),如Z227中國(guó)大百科全書。1/12/202359K歷史、地理K81傳記K810傳記研究與編寫K811世界人物傳記K82中國(guó)人物傳記K825人物傳記:按學(xué)科分K825.1哲學(xué)、社會(huì)科學(xué)K825.3經(jīng)濟(jì)K825.34金融、保險(xiǎn)K826.1自然科學(xué)、工程技術(shù)K833∕837各國(guó)人物傳記1/12/202360索書號(hào)索書號(hào)是圖書館賦予每一種館藏圖書的號(hào)碼。這種號(hào)碼具有一定結(jié)構(gòu)并帶有特定的意義。在館藏系統(tǒng)中,每種索書號(hào)是唯一的,可借以準(zhǔn)確地確定館藏圖書在書架上的排列位置,是讀者查找圖書非常必要的代碼信息。由兩局部組成:分類號(hào)/書次號(hào)。如:?信息檢索與利用教程?的索書號(hào)為,?吼叫山莊?的索書號(hào)為。1/12/2023611/12/202362索書號(hào)的第一局部是根據(jù)圖書的學(xué)科主題所取用的分類號(hào)碼。使同一學(xué)科主題的圖書得以比較集中地排列在書架上,起到方便讀者查找的作用。索書號(hào)的第二局部是按照?qǐng)D書作者姓名所編排的著者號(hào)碼,或者是按照?qǐng)D書進(jìn)入館藏時(shí)間的先后順序,或者按書名編寫的書名號(hào),用于進(jìn)一步區(qū)分同一分類號(hào)的圖書。1/12/202363其他分類法?科圖法?:?中國(guó)科學(xué)院圖書館圖書分類法?于1958年出版,目前,在中國(guó)科學(xué)院系統(tǒng)和局部高等院校,以?科圖法?為工具,采用?科圖法?類分、標(biāo)引信息資料。?人大法?:?中國(guó)人民大學(xué)圖書館圖書分類法?于1953年出版,五六十年代使用廣泛,現(xiàn)在,仍有一局部圖書館和信息資料機(jī)構(gòu)使用這一分類法。國(guó)外主要分類法:?杜威十進(jìn)制分類法??國(guó)際十進(jìn)分類法??美國(guó)國(guó)會(huì)圖書館圖書分類法??冒號(hào)分類法?1/12/202364分類語(yǔ)言的優(yōu)缺點(diǎn)優(yōu)點(diǎn):分類法是一種表達(dá)知識(shí)分類等級(jí)概念的標(biāo)識(shí)系統(tǒng),具有按學(xué)科或?qū)I(yè)集中、系統(tǒng)揭示文獻(xiàn)信息內(nèi)容的功能,用分類方法檢索文獻(xiàn)具有較高的查全率。分類法將概念逐級(jí)劃分,具有等級(jí)結(jié)構(gòu),便于擴(kuò)大和縮小檢索范圍。分類法既能用于組織檢索工具和檢索系統(tǒng),又能用來(lái)組織圖書資料的分類和排架。用分類號(hào)檢索,可以不受語(yǔ)種的限制缺點(diǎn):間接性。分類法用分類號(hào)作為檢索標(biāo)識(shí),不能直接表達(dá)概念。分類法不能經(jīng)常修訂,因而不能及時(shí)反映新的科學(xué)技術(shù)主題。分類法的類目不可能詳盡無(wú)余地列舉一切事物概念,遇到檢索主題狹窄的課題,可能難以找到相應(yīng)的類目,查準(zhǔn)率不高。1/12/202365主題檢索語(yǔ)言★主題是指文獻(xiàn)論述和研究的具體對(duì)象或事物、問(wèn)題。主題檢索語(yǔ)言又稱主題法,它是以表達(dá)文獻(xiàn)信息主題內(nèi)容特征的詞語(yǔ)作為標(biāo)識(shí),以主題詞匯概念為根底,經(jīng)標(biāo)準(zhǔn)化處理形成的檢索語(yǔ)言。由于主題詞匯表達(dá)概念準(zhǔn)確,主題途徑是檢索信息的主要途徑。主題檢索語(yǔ)言的具體表現(xiàn)形式是主題詞表和主題索引。

1/12/202366主題檢索語(yǔ)言按照主題的性質(zhì)不同,又可分為:關(guān)鍵詞語(yǔ)言、標(biāo)題詞語(yǔ)言、敘詞語(yǔ)言和單元詞語(yǔ)言。

標(biāo)題詞檢索語(yǔ)言單元詞檢索語(yǔ)言人工語(yǔ)言敘詞檢索語(yǔ)言關(guān)鍵詞檢索語(yǔ)言自然語(yǔ)言1/12/202367主題詞〔即敘詞〕與關(guān)鍵詞的區(qū)別:

主題詞是一些以概念為根底的,標(biāo)準(zhǔn)化的,具有組配性能,并可顯示詞間語(yǔ)義關(guān)系的詞和詞組。主題詞是標(biāo)準(zhǔn)化的檢索語(yǔ)言,它對(duì)文獻(xiàn)中出現(xiàn)的同義詞、近義詞、多義詞以及同一概念的不同書寫形式等進(jìn)行嚴(yán)格的控制和標(biāo)準(zhǔn),使每個(gè)主題詞都含義明確,以便準(zhǔn)確檢索防止誤檢、漏檢。主題詞表是對(duì)主題詞進(jìn)行標(biāo)準(zhǔn)化處理的依據(jù),是文獻(xiàn)處理者和檢索者共同參照的依據(jù)1/12/202368◆關(guān)鍵詞(Keyword),是指出現(xiàn)在文獻(xiàn)中,對(duì)表征文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的自由語(yǔ)詞,它不受詞表控制,可自由進(jìn)行組配,對(duì)揭示和描述文獻(xiàn)主題內(nèi)容起著關(guān)鍵性作用的語(yǔ)詞。◆關(guān)鍵詞是屬于自然語(yǔ)言的范疇,未經(jīng)標(biāo)準(zhǔn)化處理,也不受主題詞表的控制。如:對(duì)于“計(jì)算機(jī)〞這一概念可有“電腦〞、“PC機(jī)〞、“微機(jī)〞等不同形式的表達(dá)。

1/12/202369◆主題詞與關(guān)鍵詞最大的區(qū)別就是主題詞經(jīng)過(guò)了標(biāo)準(zhǔn)化處理。◆同時(shí)其區(qū)別還在于主題詞是概念,關(guān)鍵詞是特定的詞匯?!舸送猓P(guān)鍵詞〔keyword〕僅用于檢索,說(shuō)明論文中值得關(guān)注的詞匯。主題詞需要借助于主題詞庫(kù)或主題詞表來(lái)使用。寫論文擬用的主題詞要到主題詞庫(kù)中檢索,不可自創(chuàng)。1/12/202370難點(diǎn):如何確定課題的關(guān)鍵詞A.分析、提取課題的概念,如“關(guān)于中國(guó)唐詩(shī)的韻律研究〞,“小學(xué)六年級(jí)關(guān)于時(shí)間的名人名言〞B.尋找同一事物的學(xué)名和俗名等,如漢語(yǔ)與中文C.尋找同一事物的簡(jiǎn)稱、全稱、音譯和意譯等,如日本語(yǔ)與日語(yǔ)D.擴(kuò)充同義詞匯,如課題:“外商投資管理〞1/12/202371E.尋找同一事物名稱的反義詞,如廉潔與腐敗F.尋找不同的詞形,如單復(fù)數(shù)、不同詞性、英美語(yǔ)的不同形式,如draw與drawing,stock和shareG.上位概念擴(kuò)展法,如繼承法與民法、詞法與語(yǔ)法H.下位概念擴(kuò)展法,如課題:“西部環(huán)境保護(hù)法規(guī)〞I.隱含概念擴(kuò)展法,如“外資管理〞的“管理〞隱含著“法規(guī)〞等具體的管理方法1/12/202372主題語(yǔ)言的優(yōu)缺點(diǎn)優(yōu)點(diǎn)不必知道學(xué)科門類,只需使用關(guān)鍵性詞匯進(jìn)行標(biāo)引。簡(jiǎn)單直接,不像分類語(yǔ)言需要轉(zhuǎn)換為分類號(hào)。能形成專指度高的檢索標(biāo)識(shí),查準(zhǔn)率高。主題詞在詞表中按照字順排列,沒(méi)有等級(jí)性,便于增刪、修改。標(biāo)準(zhǔn)化主題語(yǔ)言有一套較完整的參照系統(tǒng),能顯示詞間關(guān)系,可供擴(kuò)檢和縮檢用。缺點(diǎn)分散文獻(xiàn)學(xué)科體系。詞表收錄有限,很多概念在詞表中沒(méi)有反映。表達(dá)概念的受限,詞匯轉(zhuǎn)換的失真,標(biāo)引、檢索前處理量大且難以到達(dá)統(tǒng)一。查全率低。1/12/202373掌握主題語(yǔ)言、分類檢索語(yǔ)言的優(yōu)缺點(diǎn)了解分類語(yǔ)言與主題語(yǔ)言的異同點(diǎn):相同點(diǎn):1〕揭示和檢索的對(duì)象都是各種類型的文獻(xiàn)信息。2〕都是從文獻(xiàn)信息的內(nèi)容途徑進(jìn)行揭示和檢索。3〕都是文獻(xiàn)信息機(jī)構(gòu)廣泛使用的文獻(xiàn)信息整序法。不同點(diǎn):1〕揭示對(duì)象屬性不同—學(xué)科知識(shí)屬性,主題概念2〕使用標(biāo)識(shí)不同—分類號(hào),主題詞或關(guān)鍵詞3〕排列方式不同—按大小排列,按字順排列4〕檢索效果不同—族性檢索,特性檢索5〕用途不同—用于排架,用于檢索1/12/202374

1/12/2023751.6信息檢索途徑與文獻(xiàn)的外表特征相關(guān)的途徑:題名、責(zé)任者、機(jī)構(gòu)名稱、序號(hào)、來(lái)源、時(shí)間途徑等。與文獻(xiàn)的內(nèi)容特征相關(guān)的途徑:分類途徑、主題途徑及代碼途徑等。如中國(guó)知網(wǎng)?中國(guó)期刊全文數(shù)據(jù)庫(kù)?的檢索途徑有:關(guān)鍵詞、刊名、作者、第一作者、機(jī)構(gòu)、題名、文摘、分類號(hào)、任意字段。分類途徑:按知識(shí)的學(xué)科分類體系檢索文獻(xiàn),即按照文獻(xiàn)信息所屬學(xué)科〔專業(yè)〕類別進(jìn)行檢索的途徑。例如:利用分類途徑實(shí)現(xiàn)信息查詢的情況如下:1/12/202376利用中國(guó)圖書館分類法〔第四版〕查詢:///1/12/2023771/12/2023781/12/202379H3常用外國(guó)語(yǔ)

H31英語(yǔ)

非標(biāo)準(zhǔn)英語(yǔ)

英語(yǔ)水平考試

世界

中國(guó)

各國(guó)

英語(yǔ)開展史

H311語(yǔ)音

朗誦法、演講術(shù)

H312文字

1/12/202380H313語(yǔ)義、詞匯、詞義

根本詞匯

同義詞、多義詞、反義詞

熟語(yǔ)、俗語(yǔ)

外來(lái)語(yǔ)

略語(yǔ)

詞源H314語(yǔ)法

構(gòu)詞法

詞類

句法H315寫作、修辭

翻譯H316詞典H317方言

1/12/202381H319語(yǔ)文教學(xué)

教學(xué)改革

教學(xué)方案、教學(xué)大綱

教學(xué)法

讀物

習(xí)題、試題

會(huì)話

H32/37各種常用外國(guó)語(yǔ)

H32法語(yǔ)

H33德語(yǔ)

H34西班牙語(yǔ)

H35俄語(yǔ)

H36日語(yǔ)

H37阿拉伯語(yǔ)

H4/95其他外國(guó)語(yǔ)1/12/202382F23會(huì)計(jì)

F230會(huì)計(jì)學(xué)

會(huì)計(jì)數(shù)學(xué)

F231會(huì)計(jì)簿記方法

資產(chǎn)負(fù)債表

復(fù)式記賬和賬戶

會(huì)計(jì)憑證和財(cái)產(chǎn)清查

帳簿和記帳技術(shù)

會(huì)計(jì)報(bào)表

會(huì)計(jì)檢查和監(jiān)督

F232會(huì)計(jì)設(shè)備

F233會(huì)計(jì)工作組織與制度

F234各種會(huì)計(jì)和簿記

社會(huì)會(huì)計(jì)

本錢會(huì)計(jì)

管理會(huì)計(jì)

財(cái)務(wù)會(huì)計(jì)

國(guó)際會(huì)計(jì)

1/12/202383F235各部門會(huì)計(jì)和簿記

[F235.1]國(guó)家機(jī)關(guān)會(huì)計(jì)(政府會(huì)計(jì))、預(yù)算會(huì)計(jì)

[F235.19]企業(yè)會(huì)計(jì)

[F235.2]金融、保險(xiǎn)業(yè)會(huì)計(jì)

[F235.3]根本建設(shè)、物資、施工企業(yè)會(huì)計(jì)

[F235.4]農(nóng)業(yè)會(huì)計(jì)

[F235.5]工業(yè)會(huì)計(jì)

[F235.6]交通運(yùn)輸業(yè)會(huì)計(jì)

[F235.69]旅游業(yè)會(huì)計(jì)

[F235.7]郵電業(yè)會(huì)計(jì)

[F235.8]商業(yè)會(huì)計(jì)、外貿(mào)會(huì)計(jì)

[F235.91]房地產(chǎn)開發(fā)企業(yè)會(huì)計(jì)

[F235.92]文化、電影、新聞出版企業(yè)會(huì)計(jì)

[F235.99]其他1/12/202384本館書目查詢利用分類號(hào)查詢1/12/2023851/12/2023861/12/202387事物性質(zhì)分類法1/12/202388主題詞途徑:按照文獻(xiàn)的主題內(nèi)容,利用主題詞表和主題索引檢索文獻(xiàn)。關(guān)鍵詞途徑:注意同義詞、近義詞、多義詞容易造成檢索結(jié)果的歧義和誤差。著者途徑:利用著者索引進(jìn)行檢索,要準(zhǔn)確書寫著者姓名檢索標(biāo)識(shí):著者姓名常見(jiàn)限制字段:au著者姓名的轉(zhuǎn)換:姓在前,名首字母在后。JasonSmithSmithJHenryG.WilliamWilliamHGClinton,JaffersonB.ClintonJB陳玉剛〔YuGangChen〕Chenyg1/12/202389題名途徑:即篇名途徑。序號(hào)途徑:利用報(bào)告號(hào)、專利號(hào)、標(biāo)準(zhǔn)號(hào)等,如國(guó)際標(biāo)準(zhǔn)書號(hào)/ISBN,國(guó)際標(biāo)準(zhǔn)連續(xù)出版物號(hào)/ISSN。其他檢索途徑〔如利用化學(xué)分子式索引、生物體索引、藥品名稱索引的途徑〕。1/12/202390確定檢索途徑時(shí)應(yīng)注意的問(wèn)題:1、充分利用文獻(xiàn)檢索工具的外表特征線索;2、從課題檢索的要求選擇文獻(xiàn)檢索途徑。3、從檢索工具編制的具體情況選擇文獻(xiàn)檢索途徑。4、族性檢索以選用分類途徑較好,而特性檢索那么以選用主題途徑為佳。1/12/202391檢索標(biāo)識(shí):即檢索詞,是指能表達(dá)檢索課題主題概念和信息需求的名詞術(shù)語(yǔ)、分類號(hào)、名稱及代碼等的總稱,包括主題詞、關(guān)鍵詞、名稱、分類號(hào)、分子式、專利號(hào)及各種號(hào)碼等?!锼c檢索途徑相對(duì)應(yīng),是檢索途徑的具體化。1/12/2023921.7計(jì)算機(jī)檢索技術(shù)★〔本章重點(diǎn)、難點(diǎn)〕布爾邏輯檢索技術(shù)位置邏輯檢索技術(shù)截詞檢索技術(shù)短語(yǔ)或詞組檢索限制檢索技術(shù)精確與模糊檢索加權(quán)檢索1/12/2023931.布爾邏輯檢索技術(shù)利用布爾邏輯運(yùn)算符進(jìn)行檢索詞或代碼的邏輯組配,是現(xiàn)代信息檢索系統(tǒng)中最常用的一種方法。常用的布爾邏輯運(yùn)算符有三種,分別是邏輯或“OR〔+〕〞、邏輯與“AND〔*〕〞、邏輯非“NOT〔-〕〞。用這些邏輯運(yùn)算符將檢索詞組配構(gòu)成檢索提問(wèn)式,計(jì)算機(jī)將根據(jù)提問(wèn)式與系統(tǒng)中的記錄進(jìn)行匹配,當(dāng)兩者相符時(shí)那么命中,并1/12/202394自動(dòng)輸出該文獻(xiàn)記錄。布爾邏輯得名于GeorgeBoole,他是CollegeCork大學(xué)的英國(guó)數(shù)學(xué)家,他在十九世紀(jì)中葉首次定義了邏輯的代數(shù)系統(tǒng)。現(xiàn)在,布爾邏輯在電子學(xué)、計(jì)算機(jī)硬件和軟件中有很多應(yīng)用。

利用布爾邏輯算符進(jìn)行檢索詞的邏輯組配,是常用的一種檢索技術(shù)。在計(jì)算機(jī)檢索中,按照所研究課題的要求,雖然已選定檢索詞,但是這些單項(xiàng)檢索詞,尚不能準(zhǔn)確地表達(dá)用戶對(duì)課題提問(wèn)的語(yǔ)法要求。這時(shí)利用布爾邏輯運(yùn)算符進(jìn)邏輯組配,構(gòu)造布爾邏輯檢索式才能滿足要求。1/12/202395綠色區(qū)為所求集合

A

ANDORB

A

OROR

B

AORNOTB

AND1/12/202396邏輯與〔and〕-“*〞、“&〞、空格如:ColorANDTelevision邏輯或〔or〕-“+〞、“︱〞、OR如:SensorORDetector邏輯非〔not〕-“-〞、“!〞如:EnergyNOTNuclear運(yùn)算順序:NOT,AND,OR.布爾邏輯優(yōu)先算符〔〕如:(AORB)AND(CORD)括號(hào)、NOT、AND、OR1/12/202397邏輯與:用“并且〞、“and〞或“*〞表示ABCC=

Aand

BA局部表示在關(guān)鍵詞中含有“通信〞的文獻(xiàn);B局部表示含有“加密〞的文獻(xiàn);C〔陰影〕局部那么表示在關(guān)鍵詞中同時(shí)含有“通信〞和“加密〞的文獻(xiàn)。1/12/202398邏輯或:用“或者〞、“or〞或“+〞表示ABCC=

Aor

BA局部表示在關(guān)鍵詞中含有“通信〞的文獻(xiàn);B局部表示含有“加密〞的文獻(xiàn);C〔陰影〕局部那么表示在關(guān)鍵詞中含有“通信〞或者含有“加密〞的文獻(xiàn)。1/12/202399邏輯非:用“不包含〞、“not〞或“-〞表示ABCC=AnotBA局部表示在關(guān)鍵詞中含有“通信〞的文獻(xiàn);B局部表示含有“加密〞的文獻(xiàn);C〔陰影〕局部那么表示在關(guān)鍵詞中只含有“通信〞而不含有“加密〞的文獻(xiàn)。1/12/2023100邏輯運(yùn)算的運(yùn)算次序在數(shù)據(jù)庫(kù)檢索中,通常有兩種運(yùn)算次序:按邏輯運(yùn)算符的優(yōu)先級(jí)執(zhí)行:notandor例:通信or通訊and加密:(通信or通訊)and加密按先后次序順序執(zhí)行通信or通訊and加密:其運(yùn)算效果同于:〔通信or通訊〕and加密1/12/2023101難點(diǎn):主題概念分析什么是主題概念的分析?主題概念的分析即對(duì)檢索課題進(jìn)行分析,分析出課題涉及的事物名稱,尤其是所包含的主題概念,這個(gè)過(guò)程又叫提煉主題詞或是關(guān)鍵詞。1/12/2023102查找吸煙與肺癌的關(guān)系的文獻(xiàn)關(guān)鍵詞=吸煙關(guān)鍵詞=肺癌and關(guān)鍵詞=〔吸煙OR抽煙〕AND關(guān)鍵詞=〔肺癌OR肺部腫瘤OR肺腫瘤〕主題概念的分析1---抽取檢索詞1/12/2023103主題概念的分析2---同義詞分析查找有關(guān)計(jì)算機(jī)輔助設(shè)計(jì)的文章計(jì)算機(jī)輔助設(shè)計(jì)輔助設(shè)計(jì)CADCAD技術(shù)CAD系統(tǒng)1/12/2023104主題概念的分析3---使用不同位類的概念詞垃圾的處理回收利用掩埋填埋廢棄物同義詞下位類詞1/12/2023105主題概念的分析3or關(guān)鍵詞=回收關(guān)鍵詞=利用關(guān)鍵詞=填埋關(guān)鍵詞=掩埋關(guān)鍵詞=垃圾關(guān)鍵詞=廢棄物andor1/12/2023106主題概念的分析3檢索表達(dá)式:關(guān)鍵詞=〔垃圾or廢棄物〕and〔回收or利用or填埋or掩埋〕關(guān)鍵詞=〔垃圾or廢棄物〕and〔處理or回收or利用〕1/12/2023107主題概念的分析4全息

防偽技術(shù)在包裝方面的運(yùn)用關(guān)鍵詞=全息關(guān)鍵詞=包裝and檢索表達(dá)式:關(guān)鍵詞=全息and包裝1/12/2023108思考:1、檢索南通大學(xué)張三和李四合作撰寫的關(guān)于信息素養(yǎng)的文章。2、檢索出吳凡以外的老師發(fā)表在?南通大學(xué)學(xué)報(bào)?上的文章。3、唐宋詩(shī)詞研究4、檢索吳文或李旭撰寫的關(guān)于計(jì)算機(jī)等級(jí)考試研究的文章。字段代碼:T=題名,K=關(guān)鍵詞,J=刊名,A=作者,S=機(jī)構(gòu),C=分類號(hào)1/12/20231091/12/2023110主題概念分析小貼士排除比較泛指、檢索意義不大的概念。少用外延十分寬廣的概念。有些檢索概念已經(jīng)表達(dá)在所使用的數(shù)據(jù)庫(kù)中,這些概念也應(yīng)該予以排除。1/12/20231112.截詞檢索技術(shù)

截詞檢索技術(shù)是預(yù)防漏檢提高查全率的一種常用檢索技術(shù)。截詞是指在檢索詞的適宜位置進(jìn)行截?cái)啵缓笫褂媒卦~符進(jìn)行處理,可節(jié)省輸入的字符,又可到達(dá)較高的查全率。尤其在西文檢索系統(tǒng)中,使用截詞符處理自由詞,對(duì)提高查全率的效果非常顯著。截詞檢索就是用截?cái)嗟脑~的一個(gè)局部進(jìn)行的檢索,并認(rèn)為凡滿足這個(gè)詞局部中的所有字符〔串〕的文獻(xiàn),都為命中的文獻(xiàn)。不同的系統(tǒng)所用的截詞符也不同,常用的有?、$、*等。1/12/2023112▲按所截?cái)嗟淖址麛?shù),分為:有限截詞:即一個(gè)截詞符只代表一個(gè)字符。無(wú)限截詞:一個(gè)截詞符可代表多個(gè)字符。有限截詞Book?->BookORBooks……朱秀?->朱秀林OR朱秀青OR朱秀云……無(wú)限截詞Book*->BookORBooksORBookingORBooked……1/12/2023113▲按截?cái)嗟奈恢脕?lái)分,截詞可有后截詞、前截詞、前后截詞、中間截詞、任意匹配等類型。在截詞檢索技術(shù)中,比較常用的是后截詞和中間截詞。下面以無(wú)限截詞舉例說(shuō)明:1〕后截詞,前方一致。如:comput*表示computer,computers,computing等。2〕前截詞,前方一致。如:*computer表示minicomputer,microcomputers等。

1/12/20231143〕前后截詞,中間一致。如*comput*表示minicomputer,microcomputers等。4〕中間截詞,前后一致。如defen*e可同時(shí)檢出defence和defense;又如organi?ation可檢索organization、organisation。5〕任意匹配,模糊檢索。

1/12/20231153.位置邏輯檢索技術(shù)

位置邏輯檢索技術(shù)是以數(shù)據(jù)庫(kù)原始記錄中的檢索詞之間的特定位置關(guān)系為對(duì)象的運(yùn)算,又稱全文檢索。它是一種可以不依賴敘詞表而直接使用自由詞進(jìn)行檢索的一種技術(shù)。這種檢索技術(shù)增強(qiáng)了選詞的靈活性,采用具有限定檢索詞之間位置關(guān)系功能的位置邏輯符進(jìn)行組配運(yùn)算,可彌補(bǔ)布爾邏輯檢索技術(shù)只是定性規(guī)定參加運(yùn)算的檢索詞在檢索中的出現(xiàn)規(guī)律滿足檢索邏輯即為命中結(jié)果,不考慮檢索詞詞間關(guān)系是否符合需求,而易造成誤檢的缺乏。1/12/2023116在不同的檢索系統(tǒng)中,位置邏輯算符的種類和表達(dá)形式不完全相同,使用位置邏輯檢索技術(shù)時(shí),應(yīng)注意所利用的檢索系統(tǒng)的使用規(guī)那么。在位置邏輯符中,常用的位置邏輯算符有〔W〕與〔nW〕、〔N〕與〔nN〕、〔S〕、〔F〕等。1/12/2023117以Dialog系統(tǒng)為例介紹幾種常用的位置算符:①〔N〕——〔NEAR〕:表示在此算符兩側(cè)的檢索詞必須相連,不得插入其它詞,但詞序可以顛倒。如:chemistry〔N〕physics,表示含有短語(yǔ)chemistryphysics或者physicschemistry的文獻(xiàn)信息都可命中。②〔nN〕——〔nNEAR〕:表示在此算符兩側(cè)的檢索詞之間最多可以插入n〔n=123...〕個(gè)詞,且詞序可以顛倒。如:economic〔2n〕recovery,表示economicrecovery或recoveryoftheeconomic等文獻(xiàn)信息都可命中。1/12/2023118③〔W〕——〔WITH〕:表示該算符兩側(cè)的檢索詞之間不得有其他任何的字或詞,而且檢索詞順序不能顛倒,但允許有空格或標(biāo)點(diǎn)符號(hào)。也可用〔〕表示。如檢索式:American〔〕Literature,可以用來(lái)檢索有關(guān)AmericanLiterature的文獻(xiàn)信息。④〔nW〕——〔nWord〕:表示算符兩側(cè)的檢索詞之間最多可以插入n〔n=123...〕個(gè)詞,但檢索詞順序不能顛倒。如:knowledge〔1w〕economic,表示含有短語(yǔ)knowledgeeconomy或者knowledge-basedeconomy的文獻(xiàn)信息都可命中。1/12/2023119⑤〔F〕——〔FIELD〕:表示在此算符兩側(cè)的檢索詞必須同時(shí)出現(xiàn)在同一字段內(nèi),如篇名字段、文摘字段、敘詞字段等,但兩詞的詞序和中間插入的詞數(shù)不限。如:economic〔F〕knowledge,一篇標(biāo)題為“theEconomicImpactofKnowledge-Based〞的文獻(xiàn)記錄為命中文獻(xiàn),因?yàn)樗惴麅蓚?cè)的檢索詞在同一標(biāo)題字段中。⑥〔S〕——〔SUBFIELD〕:表示在此算符兩側(cè)的檢索詞必須出現(xiàn)在同一個(gè)子字段中,如關(guān)鍵詞字段中的一個(gè)關(guān)鍵詞就是一個(gè)子字段。但兩詞的詞序和中間插入的詞數(shù)不限。它比〔F〕的限制更嚴(yán)。⑦〔L〕算符〔LINK〕:表示兩個(gè)檢索詞之間存在附屬關(guān)系或限制關(guān)系。如果其中一個(gè)為一級(jí)主題詞,另一個(gè)就為二級(jí)主題詞。如control〔L〕stability。1/12/20231204.限定檢索技術(shù)使用截詞檢索,簡(jiǎn)化了布爾邏輯檢索中的邏輯“或〞功能,但并沒(méi)有改善布爾邏輯檢索的性質(zhì)。使用位置邏輯檢索,只能限制檢索詞之間的相對(duì)位置,不能完全確定檢索詞在數(shù)據(jù)庫(kù)記錄中出現(xiàn)的字段位置,特別在使用自由詞進(jìn)行全文檢索時(shí),需要用字段限制查找的范圍。常用的字段代碼有標(biāo)題〔TI〕、文摘〔AB〕、敘詞或受控詞〔DE或CT〕、標(biāo)識(shí)詞或自由詞〔ID或UT〕、作者〔AU〕、語(yǔ)種〔LA〕、刊名〔JN〕、文獻(xiàn)類型〔DT〕、年代〔PY〕等。這些限制符在不同的系統(tǒng)有不同的表達(dá)形式和使用規(guī)那么,在進(jìn)行字段限制檢索時(shí),應(yīng)參閱系統(tǒng)及有關(guān)數(shù)據(jù)庫(kù)的的使用說(shuō)明,防止產(chǎn)生檢索誤差。1/12/20231211/12/20231225.短語(yǔ)或詞組檢索詞組短語(yǔ)檢索:命中記錄包含與所輸入的檢索詞完全一致的詞組或短語(yǔ)??墒褂秒p引號(hào)〔“〞〕進(jìn)行詞組檢索。如“foreigntrade〞、“計(jì)算機(jī)世界〞、“數(shù)字圖書館〞利用雙引號(hào)查詢完全符合關(guān)鍵字串的網(wǎng)站。例如:輸入“中國(guó)女足〞找出包含“中國(guó)女足〞的網(wǎng)站,而不會(huì)找出包含“中國(guó)男足〞的網(wǎng)站。1/12/20231231/12/20231246.精確與模糊檢索1/12/20231251.8計(jì)算機(jī)信息檢索的要素計(jì)算機(jī)硬件計(jì)算機(jī)軟件:由系統(tǒng)維護(hù)軟件和檢索軟件構(gòu)成。文獻(xiàn)信息數(shù)據(jù)庫(kù)(database)▲數(shù)據(jù)庫(kù)的概念:根據(jù)ISO/DIS5127號(hào)標(biāo)準(zhǔn),數(shù)據(jù)庫(kù)的定義為:至少由一種文檔組成,并能滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的一種數(shù)據(jù)集合。1/12/2023126▲數(shù)據(jù)庫(kù)的類型從內(nèi)容上分:文獻(xiàn)數(shù)據(jù)庫(kù):〔1〕書目數(shù)據(jù)庫(kù)〔2〕全文數(shù)據(jù)庫(kù)非文獻(xiàn)數(shù)據(jù)庫(kù):〔1〕事實(shí)數(shù)據(jù)庫(kù)〔2〕概念數(shù)據(jù)庫(kù)〔3〕數(shù)值數(shù)據(jù)庫(kù)〔4〕圖像數(shù)據(jù)庫(kù)1/12/2023127按國(guó)際上通用的分類方法,可劃分為:〔1〕參考數(shù)據(jù)庫(kù)〔也稱二次文獻(xiàn)數(shù)據(jù)庫(kù)〕①書目數(shù)據(jù)庫(kù)②指南數(shù)據(jù)庫(kù)〔2〕源數(shù)據(jù)庫(kù)①數(shù)值數(shù)據(jù)庫(kù)②事實(shí)型數(shù)據(jù)庫(kù)③全文數(shù)據(jù)庫(kù):電子期刊、電子圖書、學(xué)位論文、會(huì)議論文等④術(shù)語(yǔ)數(shù)據(jù)庫(kù)⑤圖像數(shù)據(jù)庫(kù)⑥混合型數(shù)據(jù)庫(kù)1/12/2023128▲數(shù)據(jù)庫(kù)的結(jié)構(gòu)

為了能對(duì)數(shù)據(jù)進(jìn)行有效的處理,需要將數(shù)據(jù)有序地組織起來(lái)。數(shù)據(jù)的組織一般由文檔(file)、記錄(record)、字段(field)這三個(gè)自上而下的有三個(gè)必要的層次構(gòu)成:數(shù)據(jù)庫(kù)由文檔構(gòu)成。文檔由記錄構(gòu)成。記錄由字段構(gòu)成。1/12/2023129數(shù)據(jù)庫(kù)的組織--文檔結(jié)構(gòu)〔file〕文檔〔file〕是指數(shù)據(jù)庫(kù)中假設(shè)干記錄的集合。一個(gè)數(shù)據(jù)庫(kù)通常應(yīng)包括:順排文檔倒排文檔順排文檔是數(shù)據(jù)庫(kù)的主體,又稱主文檔,它按每條記錄的順序號(hào)大小排列。倒排文檔在一個(gè)數(shù)據(jù)庫(kù)中可以有假設(shè)干個(gè),如主題詞索引、刊名索引、著者索引等,按索引詞的字順排列。1/12/2023130文檔結(jié)構(gòu)--順排文檔文檔的根本單位是記錄。分散的、雜亂無(wú)章的記錄不能被計(jì)算機(jī)檢索。必須對(duì)這些記錄進(jìn)行合理的組織。建立幾個(gè)相關(guān)文檔,構(gòu)成相應(yīng)的數(shù)據(jù)庫(kù)。順排文檔是一個(gè)文獻(xiàn)記錄的集合,按存取號(hào)的大小排列而成。其結(jié)構(gòu)如下圖:1/12/2023131…順排文檔示意圖1/12/2023132不能進(jìn)行有選擇性的查找:記錄之間的關(guān)系為順序排列,只能實(shí)現(xiàn)順序查找,如:要查找含有“軟件〞這一主題的文獻(xiàn),計(jì)算機(jī)必須將整個(gè)文檔從頭到尾地掃描一遍,才能找出所有含有該主題的文獻(xiàn)。用順排文檔直接查找很不經(jīng)濟(jì)。為此,需要建立一種按記錄的特征標(biāo)識(shí)〔如敘詞、自由詞、著者名、機(jī)構(gòu)名、出版年等等〕的字順排列的文檔,這種文檔稱為倒排文檔或索引文檔。文檔結(jié)構(gòu)--順排文檔1/12/2023133順排文檔舉例〔主文檔〕順序號(hào)姓名年齡性別班級(jí)1胡林20男2009級(jí)計(jì)算機(jī)1班2李玟21女2009級(jí)計(jì)算機(jī)2班3曹青21男2009級(jí)計(jì)算機(jī)2班4王玉20女2009級(jí)計(jì)算機(jī)1班1/12/2023134文檔結(jié)構(gòu)--倒排文檔按檢索標(biāo)識(shí)列出具有同一屬性的所有記錄。將檢索標(biāo)識(shí)〔如主題詞、著者等〕放在最前面。含有此標(biāo)識(shí)的全部記錄的存取號(hào)列在其后。將檢索標(biāo)識(shí)集中起來(lái)按字順排列,構(gòu)成各種倒排文檔。1/12/2023135倒排文檔舉例〔班級(jí)索引〕班級(jí)順序號(hào)2009級(jí)計(jì)算機(jī)1班12009級(jí)計(jì)算機(jī)1班42009級(jí)計(jì)算機(jī)2班22009級(jí)計(jì)算機(jī)2班31/12/2023136記錄與某一數(shù)據(jù)處理對(duì)象有關(guān)的一切數(shù)據(jù)項(xiàng)構(gòu)成了該對(duì)象的一條記錄。記錄是文獻(xiàn)數(shù)據(jù)庫(kù)的信息單元。如在如期刊論文數(shù)據(jù)庫(kù)中,一條記錄代表一篇論文。1/12/20231371/12/2023138字段〔數(shù)據(jù)項(xiàng)〕是組成數(shù)據(jù)庫(kù)的最小根本單位,是構(gòu)成記錄的數(shù)據(jù)項(xiàng)。它的作用是描述一個(gè)數(shù)據(jù)處理對(duì)象的某些屬性。如書目型的數(shù)據(jù)庫(kù),字段可為文獻(xiàn)的篇名,作者,作者單位,刊名等。大局部的字段可提供檢索途徑。1/12/2023139數(shù)據(jù)庫(kù)檢索原理檢索時(shí),計(jì)算機(jī)按檢索詞先在指定的倒排文檔中找到相匹配的索引詞,再根據(jù)索引詞后的記錄順序號(hào)到主文檔中調(diào)出記錄。期刊論文等文獻(xiàn)數(shù)據(jù)庫(kù)同理1/12/2023140用戶輸入檢索需求分析轉(zhuǎn)換處理需求數(shù)據(jù)庫(kù)概念詞典控制詞表信息源篩選錄入分類索引文檔預(yù)處理匹配檢索結(jié)果1/12/2023141檢索舉例請(qǐng)檢索畢業(yè)學(xué)校為南通大學(xué)的人員資料。第一步:利用以“畢業(yè)學(xué)校〞字段為索引的倒排文檔找到所有南通大學(xué)所對(duì)應(yīng)的順序號(hào)。

畢業(yè)學(xué)校順序號(hào)南通大學(xué)1南通大學(xué)4南京大學(xué)2蘇州大學(xué)31/12/2023142第二步:根據(jù)上述倒排文檔中的序號(hào)到主文檔中調(diào)出相應(yīng)記錄。順序號(hào)姓名年齡性別畢業(yè)學(xué)校1李林25男南通大學(xué)2董娜27女南京大學(xué)3孫高24男蘇州大學(xué)4陳旭30女南通大學(xué)1/12/2023143第三步:結(jié)果顯示順序號(hào)姓名年齡性別畢業(yè)學(xué)校1李林25男南通大學(xué)4陳旭30女南通大學(xué)1/12/20231441.9信息檢索方法信息檢索的方法可分為如下五種:(1)工具法又稱常規(guī)法(直接法)。它又分為順查法、逆查法和抽查法。a.順查法:在規(guī)定的起始年代范圍內(nèi)按照時(shí)間的順序,由遠(yuǎn)及近地利用檢索系統(tǒng)逐年進(jìn)行文獻(xiàn)信息檢索。這種方法能收集到某一課題的系統(tǒng)文獻(xiàn),它適用于較大課題的文獻(xiàn)檢索。例如,某課題的起始年代1/12/2023145,現(xiàn)在需要了解其開展的全過(guò)程,就可以用順查法從最初的年代開始,逐漸向近期查找。b.逆查法,又稱倒查法。利用檢索工具,由近及遠(yuǎn),從新到舊,逆著時(shí)間的順序,進(jìn)行文獻(xiàn)檢索的方法。此法的重點(diǎn)是放在近期文獻(xiàn)上。使用這種方法可以最快地獲得最新資料。c.抽查法:針對(duì)課題處于興旺開展的假設(shè)干年,或者針對(duì)工程的特點(diǎn),選擇有關(guān)該工程的文獻(xiàn)信息最可能出現(xiàn)或最多出現(xiàn)的時(shí)間段,利用檢索工具進(jìn)行重點(diǎn)檢索的方法。1/12/2023146〔2〕引文法追溯法:是指不利用一般的檢索工具,而是利用已經(jīng)掌握的文獻(xiàn)末尾所列的參考文獻(xiàn),逐一地追溯查找“引文〞的一種最簡(jiǎn)便的擴(kuò)大信息來(lái)源的方法。它還可以從查到的“引文〞中再追溯查找“引文〞,像滾雪球一樣,依據(jù)文獻(xiàn)間的引用關(guān)系,獲得越來(lái)越多的內(nèi)容相關(guān)文獻(xiàn)。1/12/2023147追溯法—原始文獻(xiàn)1/12/20231481/12/2023149引文索引法:利用引文索引,從被引論文開始查找引用它的全部論文的情況,可得到與同一主題相關(guān)的一批文獻(xiàn)。★引文索引〔CitationIndex)是一種以文獻(xiàn)之間的引證關(guān)系為根底編制的、供人們從被引證文獻(xiàn)角度檢索引證文獻(xiàn)的索引,又稱“引證索引〞。▲引文法的概念來(lái)源于人們的著述活動(dòng)。文獻(xiàn)的作者為了給自己的著作提供某種佐證、前例或背景材料,一般都要參考引用前人或同代人的著作,以便讀者了解該文吸取或采用了何人在何處提出的概念、理論、材料和方法。這是著作界普遍存在的一種“參考習(xí)慣〞。1/12/2023150引文檢索:

“經(jīng)濟(jì)學(xué)者李強(qiáng)論文的引用文獻(xiàn)〞1/12/20231511/12/2023152〔3〕循環(huán)法:又稱綜合法、交替法。是將工具法〔常用法〕和追溯法交替使用的一種綜合文獻(xiàn)檢索方法。〔4〕二次檢索法〔進(jìn)階檢索〕例如,檢索有關(guān)“我國(guó)高等教育現(xiàn)狀〞的文章〔5〕瀏覽法:也叫直接檢索法,瀏覽新近期刊查閱最新內(nèi)容或在網(wǎng)上任意瀏覽信息。1/12/20231531.10信息檢索策略〔信息檢索步驟〕什么是檢索策略〔RetrievalStrategy〕?檢索步驟的科學(xué)安排稱為檢索策略。它是為實(shí)現(xiàn)檢索目標(biāo)而制定的全盤方案或方案。制定檢索策略的主要目的就是要提高其查全率和查準(zhǔn)率。廣義上是指為實(shí)現(xiàn)檢索目的而制訂的全盤方案和方案;狹義上是指檢索式。檢索式是用來(lái)表達(dá)用戶提問(wèn)的邏輯表達(dá)式,是檢索策略的綜合表達(dá)。1/12/2023154分析研究課題、制定檢索策略確定檢索方法、利用檢索工具〔數(shù)據(jù)庫(kù)〕選擇檢索途徑、查找文獻(xiàn)線索評(píng)價(jià)檢索結(jié)果、索取原始文獻(xiàn)1/12/2023155具體分析如下:①分析課題②選擇檢索工具或者檢索系統(tǒng)③選擇檢索方式④構(gòu)造檢索策略⑤索取原始文獻(xiàn)信息1/12/2023156①分析課題

分析課題,是實(shí)施檢索中最重要的一步,也是檢索效率上下或成敗的關(guān)鍵。在課題分析中,要注意如下三點(diǎn):a、弄清課題研究的目的性和重要性,明確課題所屬的學(xué)科范圍;b、掌握與課題有關(guān)的專業(yè)知識(shí);c、明確課題的檢索范圍和要求,檢索范圍包括學(xué)科范圍和年代范圍等;檢索要求那么指對(duì)文獻(xiàn)水平、類型、語(yǔ)種等方面的要求。1/12/2023157

②選擇檢索工具或者檢索系統(tǒng)

選擇檢索工具或者檢索系統(tǒng),它們的選擇是否恰當(dāng),將直接影響檢索質(zhì)量。應(yīng)根據(jù)已確定的檢索范圍和要求來(lái)選擇檢索工具或者檢索系統(tǒng)。一般來(lái)說(shuō),應(yīng)從本單位、本地區(qū)現(xiàn)有的檢索工具或系統(tǒng)的實(shí)際出發(fā),選擇專業(yè)對(duì)口、質(zhì)量高的檢索工具或者檢索系統(tǒng)。而檢索工具或者檢索系統(tǒng)的質(zhì)量主要由以下指標(biāo)來(lái)確定:文獻(xiàn)的收錄量,文獻(xiàn)的摘錄和標(biāo)引質(zhì)量,文獻(xiàn)報(bào)道的時(shí)效,使用的難易程度等。在選擇檢索工具或系統(tǒng)時(shí)一般先選擇綜合性,然后選擇專業(yè)性的加以補(bǔ)充。在語(yǔ)種方面應(yīng)先考慮選用中文的檢索工具或系統(tǒng),然后再考慮英文語(yǔ)種,最后使用其他語(yǔ)種的。

1/12/2023158③選擇檢索方式

檢索工具或系統(tǒng)的檢索方式具體到不同的庫(kù)就有不同的類型,一般有分類檢索、初級(jí)檢索、高級(jí)檢索及其它形式的檢索。分類檢索也被稱為瀏覽〔Brows〕,初級(jí)檢索也被稱為傳統(tǒng)檢索、根本檢索、一般檢索〔GeneralSearch〕和快速檢索〔QuickSearch〕等,高級(jí)檢索(AdvancedSearch)也被稱為專家檢索〔ExpertSearch〕等,其它檢索就包括一些辭典式檢索、和專業(yè)結(jié)合緊密的檢索等。如果檢索目標(biāo)不很明確,或者只是通過(guò)對(duì)按學(xué)科進(jìn)行分類的大量資料進(jìn)行閱讀,就可以選擇分類檢索即瀏覽〔Brows〕。如果想對(duì)某一主題的資料進(jìn)行快速的查找,就可以選擇初級(jí)檢索。如果進(jìn)行較深的專業(yè)性查找,就可以選擇高級(jí)檢索。1/12/2023159④構(gòu)造檢索策略

構(gòu)造檢索策略包含三方面內(nèi)容:選擇檢索途徑、確定檢索詞、利用檢索技術(shù)。

選擇檢索途徑:在利用檢索工具或檢索系統(tǒng)查找信息時(shí),要確定檢索的入口,即通過(guò)哪種檢索途徑來(lái)查找文獻(xiàn)的線索。常用的檢索途徑有分類檢索途徑、主題檢索途徑、著者檢索途徑、序號(hào)檢索途徑及??仆緩健?/p>

1/12/2023160分類途徑是按照學(xué)科分類體系和事物性質(zhì)作為檢索標(biāo)識(shí)來(lái)檢索信息的一種途徑。主題途徑是以代表文獻(xiàn)內(nèi)容實(shí)質(zhì)的,經(jīng)過(guò)標(biāo)準(zhǔn)化的名詞或詞組作檢索標(biāo)識(shí)一種途徑。著者途徑是根據(jù)著者姓名來(lái)查找該著者發(fā)表的信息的一種途徑。號(hào)碼檢索途徑是以文獻(xiàn)信息特有的編號(hào)特征,并按編號(hào)順序編排和檢索信息的途徑。1/12/2023161專科途徑是根據(jù)學(xué)科特點(diǎn)特別設(shè)置的便于??菩詸z索的一種途徑?!话阏f(shuō),如果對(duì)要檢索文獻(xiàn)信息的專業(yè)學(xué)科分類比較明確,常使用分類途徑;假設(shè)對(duì)所查專業(yè)學(xué)科分類不了解或涉及多個(gè)學(xué)科,那么多使用主題途徑;在著者的名稱的情況下,著者途徑是最正確的選擇;假設(shè)文獻(xiàn)信息的序號(hào),包括專利號(hào)、ISBN號(hào)、ISSN號(hào)、登記號(hào)等,那么選擇序號(hào)途徑。1/12/2023162確定檢索詞:檢索詞可以是一個(gè)單元詞,表達(dá)一個(gè)單一概念;也可以是一個(gè)或多個(gè)詞組,表達(dá)多個(gè)概念。檢索詞可以由檢索用戶提出,也可以在數(shù)據(jù)庫(kù)中的受控詞表〔主題詞表、分類表等〕中選擇,在人工檢索語(yǔ)言和自然檢索語(yǔ)言并用的數(shù)據(jù)庫(kù)中,最好先瀏覽一下主題詞表、敘詞表和分類表,二者并用,以保證查全查準(zhǔn)。1/12/2023163選詞分析概念是

對(duì)課題進(jìn)行主題概念的分析,并用一定的概念詞來(lái)表達(dá)這些主題內(nèi)容,同時(shí)明確概念與概念之間的邏輯關(guān)系。概念的表達(dá)要確切;找出核心的概念組面;找出隱含的重要概念;明確概念組面之間的交叉關(guān)系。一個(gè)檢索課題往往涉及多個(gè)概念,選擇檢索詞時(shí)首先要將檢索課題涉及的所有概念別離出來(lái),并針對(duì)每一個(gè)概念選擇盡可能多的檢索詞。1/12/2023164如“吸煙與心臟病的關(guān)系〞,可表達(dá)為connectionbetweensmoking

andheartdisease

,通過(guò)分析發(fā)現(xiàn),其中只有smoking和heartdisease兩個(gè)概念詞,而“connectionbetween〞那么不屬于概念詞。同義詞或相關(guān)詞:與smoking相關(guān)的詞有:smoker,smokers,tobacco等;heartdisease的同義詞那么有cardiopathy,hearttrouble,heartattack。將這些相關(guān)詞記錄下來(lái),用于構(gòu)造檢索式:1/12/2023165

概念1:smoking,smokers,tobacco

概念2:cardiopathy,heartdisease,hearttrouble,heartattack提取隱含概念:有些課題的實(shí)質(zhì)性內(nèi)容往往很難從課題名稱上反映出來(lái),需要從中提取隱含的重要概念。例:“智力測(cè)試〞,隱含著“能力測(cè)試〞、“態(tài)度測(cè)試〞、“創(chuàng)造力測(cè)試〞等概念。選定檢索詞的方法1、利用上下位詞或特有名詞及同義詞、近義詞、相關(guān)詞,查閱工具如專業(yè)詞表、詞典、字典、分類表等。1/12/20231662、根據(jù)詞表或數(shù)據(jù)庫(kù)中的索引選詞;3、從專業(yè)詞典、百科全書等參考工具中選詞;選詞原那么:要考慮滿足兩個(gè)要求:√一是課題檢索要求;√二是數(shù)據(jù)庫(kù)輸入詞要求。①選擇標(biāo)準(zhǔn)詞;②盡量使用代碼;③注意選用國(guó)外慣用的技術(shù)術(shù)語(yǔ);④防止使用低頻詞或高頻詞;⑤同義詞盡量選全。利用檢索技術(shù):用布爾邏輯檢索技術(shù)、位置邏輯

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論