信息檢索技術(shù)基礎(chǔ)知識講義課件_第1頁
信息檢索技術(shù)基礎(chǔ)知識講義課件_第2頁
信息檢索技術(shù)基礎(chǔ)知識講義課件_第3頁
信息檢索技術(shù)基礎(chǔ)知識講義課件_第4頁
信息檢索技術(shù)基礎(chǔ)知識講義課件_第5頁
已閱讀5頁,還剩187頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

信息檢索技術(shù)基礎(chǔ)信息檢索與利用1信息檢索與利用1主要內(nèi)容2.1信息檢索語言2.2信息檢索技術(shù)2.3檢索效果評價2.4檢索詞的確定2.5信息檢索策略及策略式2.6信息檢索步驟2.7科技查新2主要內(nèi)容2檢索語言:在信息的存儲和檢索過程中,為使信息在用戶和系統(tǒng)間有效傳遞,各種檢索工具使用專門的語言體系來描述信息的內(nèi)部特征和外部特征,同時要求用戶依此構(gòu)造檢索提問式來進(jìn)行信息檢索,這種專門的語言體系成為檢索語言。2.1信息檢索語言3檢索語言:在信息的存儲和檢索過程中,為使信息在用戶和系統(tǒng)間有檢索語言描述文獻(xiàn)內(nèi)容特征分類語言主題語言描述文獻(xiàn)外表特征題名(書名、刊名、篇名)著者出版事項(xiàng)代碼/序號關(guān)鍵詞語言敘詞語言標(biāo)題詞語言2.1信息檢索語言單元詞語言4檢索描述文獻(xiàn)分類語言主題語言描述文獻(xiàn)題名(書名、刊名、篇名)主題語言(內(nèi)容特征)按照主題性質(zhì)的不同可分為:標(biāo)題詞單元詞敘詞關(guān)鍵詞2.1信息檢索語言5主題語言(內(nèi)容特征)2.1信息檢索語言5標(biāo)題詞語言:是表征文獻(xiàn)內(nèi)容特征的、經(jīng)過規(guī)范化處理的名詞術(shù)語(包括詞和短語)。例如:飛機(jī):plane、airplane、aeroplaneaircraft用aircraft來表示所有“飛機(jī)”概念,以此作為規(guī)范詞.使用aircraft一詞的檢索結(jié)果將包括全部有飛機(jī)概念的文獻(xiàn).單元詞:指從信息內(nèi)容中抽出的最基本的詞匯。關(guān)鍵詞語言:關(guān)鍵詞是從文題、文摘或正文中抽出,具有實(shí)質(zhì)意義,能夠代表文獻(xiàn)內(nèi)容主題的名詞術(shù)語。關(guān)鍵詞可直接用于文獻(xiàn)標(biāo)引。2.1信息檢索語言6標(biāo)題詞語言:是表征文獻(xiàn)內(nèi)容特征的、經(jīng)過規(guī)范化處理的名詞術(shù)語(敘詞語言敘詞:指從信息的內(nèi)容中抽出的、能概括表達(dá)信息內(nèi)容基本概念的名詞或術(shù)語,它是經(jīng)規(guī)范化處理的自然語言詞匯。敘詞受敘詞表控制,有組配功能。通常使用的敘詞表有:國內(nèi)《漢語主題詞表》,英國《科學(xué)文摘》使用的《INSPECThesaurus》,美國《工程索引》使用的《EiThesaurus》等。

運(yùn)輸飛機(jī)設(shè)計運(yùn)輸飛機(jī)設(shè)計運(yùn)輸飛機(jī)飛機(jī)設(shè)計7敘詞語言敘詞:指從信息的內(nèi)容中抽出的、能概括表達(dá)信息內(nèi)容基EI(Thesaurus)8EI(Thesaurus)8作用檢索詞用來組織信息(信息工作者)對文獻(xiàn)信息內(nèi)容進(jìn)行標(biāo)引;對內(nèi)容相同或相關(guān)的信息加以集中或揭示其相關(guān)性;對信息進(jìn)行系統(tǒng)化、有序化;檢索詞用于檢索(檢索用戶)進(jìn)行主題檢索進(jìn)行分類檢索進(jìn)行外表特征檢索檢索詞是信息資源組織與檢索者檢索提問的橋梁,在數(shù)據(jù)庫中,對應(yīng)為檢索點(diǎn)、檢索入口2.1信息檢索語言9作用2.1信息檢索語言9對文獻(xiàn)信息內(nèi)容進(jìn)行標(biāo)引特征1特征2特征3特征4特征5特征n10對文獻(xiàn)信息內(nèi)容進(jìn)行標(biāo)引特征1特征2特征3特征4特征5特征n1字段名數(shù)據(jù)庫中文獻(xiàn)的記錄方式11字段名數(shù)據(jù)庫中文獻(xiàn)的記錄方式112.2.1布爾邏輯2.2.2截詞檢索2.2.3限制檢索2.2.4位置邏輯2.2.5檢索策略式2.2信息檢索技術(shù)122.2.1布爾邏輯2.2信息檢索技術(shù)12在進(jìn)行信息檢索時,檢索項(xiàng)之間概念有相交關(guān)系、同義關(guān)系或相關(guān)關(guān)系,這時采用布爾邏輯進(jìn)行檢索項(xiàng)之間的邏輯組配。用“與”(AND)、“或”(OR)、“非”(NOT)來表達(dá)。2.2.1布爾邏輯檢索13在進(jìn)行信息檢索時,檢索項(xiàng)之間概念有相交關(guān)系、同義關(guān)系或相關(guān)關(guān)布爾邏輯檢索:在進(jìn)行信息檢索時,檢索項(xiàng)之間概念有相交關(guān)系、同義關(guān)系或相關(guān)關(guān)系,這時采用布爾邏輯進(jìn)行檢索項(xiàng)之間的邏輯組配。

布爾邏輯算符有三種:邏輯與、邏輯或、邏輯非用“與”(AND)、“或”(OR)、“非”(NOT)來表達(dá)。2.2.1布爾邏輯14布爾邏輯檢索:在進(jìn)行信息檢索時,檢索項(xiàng)之間概念有相交關(guān)系、同邏輯“與”在計算機(jī)信息檢索時,“與”用于表示概念的交叉、限定關(guān)系邏輯符號:and、﹡、還可用空格表示表達(dá)形式:AandB、A*B、或AB具有縮小檢索范圍和提高專指性的功能。例:computerandcontrol(SCI)computer*control(Dialog)computercontrol(Google)

AB15邏輯“與”在計算機(jī)信息檢索時,“與”用于表示概念的交叉、限定邏輯或邏輯“或”算符,用來表示概念的并列、平行、等同關(guān)系代表符號:“or”、“+”表達(dá)形式:AORB或A+B具有擴(kuò)大檢索范圍,減少漏檢的功能。例:AIRPLANEORAIRCRAFT(Google)

或AIRPLANE+AIRCRAFTAB16邏輯或邏輯“或”算符,用來表示概念的并列、平行、等同關(guān)系A(chǔ)B邏輯“非”算符,是具有概念包含關(guān)系的一種組配,可以從原檢索范圍中排除某一內(nèi)容。表達(dá)形式:AnotB、A-B具有縮小命中范圍,提高查準(zhǔn)率,增強(qiáng)檢索的專指性,減少輸出量的作用。

例:Energynotnuclear邏輯非AB17邏輯“非”算符,是具有概念包含關(guān)系的一種組配,可以從原檢索范布爾邏輯檢索技術(shù)邏輯或(OR):擴(kuò)大檢索范圍,有利于提高查全率。邏輯與(AND):縮小檢索范圍,有利于提高查準(zhǔn)率。邏輯非(NOT):縮小檢索范圍,有利于提高查準(zhǔn)率。ABAB邏輯與A*B

邏輯或A+B邏輯非A-BAB18布爾邏輯檢索技術(shù)邏輯或(OR):擴(kuò)大檢索范圍,有利于提運(yùn)用“布爾算符”的注意事項(xiàng):

布爾邏輯運(yùn)算符運(yùn)算順序?yàn)椋?/p>

not→and→or運(yùn)算符遵循數(shù)學(xué)運(yùn)算法則;

(a)括號優(yōu)先;(AorB)andCnotD

(b)在檢索式中只有and或or前后的檢索標(biāo)識可以交換;

(c)檢索式中有not時前后檢索詞不能交換。

備注:()必須在半角和英文狀態(tài)下輸入

2.2.1布爾邏輯19運(yùn)用“布爾算符”的注意事項(xiàng):2.2.1布爾邏輯19布爾邏輯檢索表達(dá)式的特點(diǎn)布爾檢索表達(dá)式式目前信息檢索系統(tǒng)中使用最多的一種方法。優(yōu)點(diǎn):表現(xiàn)直觀清晰,方便擴(kuò)檢和縮檢。易于計算機(jī)實(shí)現(xiàn)。缺點(diǎn):沒有反映文獻(xiàn)內(nèi)容(或信息需求)所涉及的多個概念的相對重要性。沒有反應(yīng)概念之間的內(nèi)在語義關(guān)系。20布爾邏輯檢索表達(dá)式的特點(diǎn)布爾檢索表達(dá)式式目前信息檢索系統(tǒng)中使寫出下圖的布爾邏輯檢索式21寫出下圖的布爾邏輯檢索式21截詞(truncation):是指檢索者將檢索詞在認(rèn)為比較合適的地方截斷,也稱模糊檢索,又稱詞干檢索法截詞檢索,用截斷的詞的一個局部進(jìn)行的檢索即利用檢索詞的詞干加上截詞符號去數(shù)據(jù)庫中進(jìn)行檢索。(模糊檢索)截詞符號:一般為“?”或

“*”。各種檢索系統(tǒng)有不同規(guī)定,沒有統(tǒng)一標(biāo)準(zhǔn)。截詞符具有“OR”運(yùn)算符的功能,能夠擴(kuò)大檢索范圍,而且減少了輸入檢索詞的時間,節(jié)約了機(jī)時。2.2.2截詞檢索22截詞(truncation):是指檢索者將檢索詞在認(rèn)為比較合截詞的分類按位置分類:前截詞中間截詞后截詞按取代數(shù)量分:有限截詞無限截詞

23截詞的分類按位置分類:前截詞23后截詞,也稱前方一致。它是將截詞符放在一串字符的后面,用以表示以相同字符串開頭,而結(jié)尾不同的所有詞。詞尾的有限截斷相同字符串后可能變化一個字符時,則在其后使用一個“?”,常用來表示檢索詞的單復(fù)數(shù)變化。例如用system?可以查出sytem和systems的文獻(xiàn)。相同字符串后可能變化兩個以上字符時,則在其后連續(xù)使用若干個“?”代替可能變化的字符。例如,??表示兩個字符,???表示三個字符,以此類推如表示九十年代;199?如表示20世紀(jì):19??后截詞24后截詞,也稱前方一致。它是將截詞符放在一串字符的后面,用以表詞尾的無限截斷相同字符串后可能變化任何字符串時,則在其后使用一個“?”或“*”。這種方法可以查找出含有相同字符串的所有檢索詞。例如,comput*可查出compute,computer,computing,computation,computerisation等如physic*可檢出:physical,physic,physicalism

physician,physicists,physicochenistry,physics等.即相當(dāng)于為上述各檢索詞的邏輯OR運(yùn)算后截詞25詞尾的無限截斷后截詞25中間截詞:可變化的字符出現(xiàn)在單詞的中間位置。例如:“woman”和“women”,可用“wom?n”代替;“defence”和“defense”可用“defen?e”代替。查找英美不同拼法最有效中間截詞26中間截詞:可變化的字符出現(xiàn)在單詞的中間位置。中間截詞26前截斷:將截詞符號放在一個字符串的左方是后方一致的檢索。

例如:*physics可檢physics、astrophysics

、biophysics……..

*Chem*

可檢chemical,electrochemic,chemistry,thermochemistry……..很少使用前截斷27前截斷:將截詞符號放在一個字符串的左方是后方一致的檢索。*——EiVillage,WebofScience,Elsevier,EBSCOJane‘s航空數(shù)據(jù)庫?——PQDD,INSPEC,Dialog截詞28*——EiVillage,WebofScience限制檢索是限定檢索詞出現(xiàn)在數(shù)據(jù)庫記錄中某一字段范圍的一種檢索技術(shù)。檢索時,系統(tǒng)只對指定字段進(jìn)行匹配運(yùn)算,提高了效率和查準(zhǔn)率?;緳z索字段標(biāo)題、文摘、敘詞、自由標(biāo)引詞

Title、abstract、descriptor、identifier輔助檢索字段作者、刊名、語種、年代、專利號等

author、journal、language、publicationyear、patentnumber2.2.3限制檢索29限制檢索是限定檢索詞出現(xiàn)在數(shù)據(jù)庫記錄中某一字段范圍的一種檢索字段檢索常用代碼30字段檢索常用代碼30目前各個檢索系統(tǒng)所設(shè)立的字段是各不相同的,即同一字段,也可能采用不同的字段代碼表示。如題名字段Ei中,用highwaytransport*withinTI來表示;OCLCFirstsearch中,用TI:highwaytransport*來表示。在進(jìn)行字段檢索時,應(yīng)先看一下該數(shù)據(jù)庫的使用指南。例:EiCPXWeb網(wǎng)絡(luò)版數(shù)據(jù)庫主要字段的字段代碼如下:

CVEi敘詞表受控語

TI題名AB文摘AU著者姓

AF著者機(jī)構(gòu)名稱ST連續(xù)出版物名稱PN出版時間注意31目前各個檢索系統(tǒng)所設(shè)立的字段是各不相同的,即同一例:檢索2005年以后在《情報學(xué)報》上發(fā)表的有關(guān)信息價值計算方法的文獻(xiàn)限定范圍:2005以后;《情報學(xué)報》檢索詞:信息價值、計算時間上的限定,有“=”、“>”、“<”、“>=”、“<=”。例如:PY>=2004表示檢索2004年以來(包括2004)發(fā)表的文獻(xiàn)。檢索式:(年>=2005)*(刊名=情報學(xué)報)*(主題=信息價值*計算)32例:檢索2005年以后在《情報學(xué)報》上發(fā)表的有關(guān)信息價值計算33333434Searchwithinaspecificfieldusing"wn"{testbed}wnALLAND{atmnetworks}wnTI

(windowwnTIANDsapphirewnTI)ORSakamoto,K*wnAU

35Searchwithinaspecificfield利用位置算符來表示檢索詞之間的位置關(guān)系,以實(shí)現(xiàn)位置邏輯檢索功能。特征這是一種可以不依賴主題詞表而直接使用自由詞進(jìn)行檢索的技術(shù)方法??杀磉_(dá)復(fù)合內(nèi)容屬于提高專指度的方法引入位置算符的目的是增加檢索式的靈活性,表達(dá)復(fù)雜專深的概念,從而提高檢索的專指度,彌補(bǔ)布爾邏輯算符難以表達(dá)某些復(fù)雜提問的不足。2.2.4位置邏輯36利用位置算符來表示檢索詞之間的位置關(guān)系,以實(shí)現(xiàn)位置邏輯檢索功分類:記錄級檢索:要求檢索詞在同一記錄中有L字段級檢索:要求檢索詞在同一字段中,有

F子字段或自然句級檢索:要求檢索詞出現(xiàn)在同一子字段或同一自然句中,有S,詞位置檢索:要求詞之間相互位置滿足某些條件,有

W,NW,N.nN

等2.2.4位置邏輯37分類:2.2.4位置邏輯37(W)表示該算符兩側(cè)的檢索詞相鄰,且兩者之間只允許只有一個空格或標(biāo)點(diǎn)符號,不允許有任何字母或詞,順序不能顛倒。(W)也可以簡寫為()。例如:Aircraft()design可檢索出含有Aircraftdesign的文獻(xiàn)記錄。Computer()aided()design可檢索出含有Computeraideddesign的文獻(xiàn)記錄(Dialog為例)(1)(W)—With38(W)表示該算符兩側(cè)的檢索詞相鄰,且兩者之間只允許只有一個空(nW)表示在此算符兩側(cè)的檢索詞之間最多允許間隔n個詞(實(shí)詞或虛詞),且兩者的相對位置不能顛倒。例如:laser(1w)printer可檢出含有l(wèi)aserprinter和lasercolorprinter的文獻(xiàn)記錄Computer(1w)animation可檢出Computerassistedanimation(Dialog為例)(2)(nW)—nWords(W),(1W),(nW)39(nW)表示在此算符兩側(cè)的檢索詞之間最多允許間隔n個詞(實(shí)Wn如:W8——EBSCO

例:taxW8reformADJ——Elsevier兩詞按指定順序排列,相當(dāng)于短語例:remoteADJeducationPRE/n——PQDD例:militaryPRE/1weapons常見的另外的表達(dá)形式40常見的另外的表達(dá)形式40(N)表示該算符兩側(cè)的檢索詞相鄰,但兩者的相對位置可以顛倒。例如:computer(N)network可檢出含有computernetwork、networkcomputer形式的文獻(xiàn)記錄。例ECONOMI*(1NEAR)RECOVER*可包含多重組合和含義(Dialog為例)(3)(N)—Near41(N)表示該算符兩側(cè)的檢索詞相鄰,但兩者的相對位置可以顛倒。(nN)表示此算符兩側(cè)的檢索詞之間允許間隔最多n個詞,且兩者的順序可以顛倒。例如computer(2N)system可檢出含有computersystem,computercodesystem,computeraideddesignsystem,systemusingmoderncomputer等形式的文獻(xiàn)記錄。(4)(nN)—nNear(N),(1N),(nN)42(nN)表示此算符兩側(cè)的檢索詞之間允許間隔最多n個詞,且兩Nn例:

taxN5reform

(EBSCO)

NEAR[N]例:remoteNEAR[5]ducation(Elsevier)W/n例:intelligentW/10buildingsPQDD常見的另外的表達(dá)形式43Nn例:taxN5reform(EBSCO)鄰接符號F(field),表示其兩側(cè)的檢索詞必須是在文獻(xiàn)記錄的同一字段中,而它們在該字段中的相對次序不限。檢索式為A(F)B。例如:computer(F)control,只要這兩個詞在一個字段同時出現(xiàn)就算命中。例如:water()pollution(F)control表示在同一個字段中(如篇名、文摘、敘詞等)同時含有waterpollution和control的文獻(xiàn)記錄均可檢索出來。(5)(F)—Field44鄰接符號F(field),表示其兩側(cè)的檢索詞必須是在文鄰接符號S(sentence),表示其兩側(cè)的檢索詞必須是在文獻(xiàn)記錄的同一子字段中,用(S)連接的兩個詞都出現(xiàn)在同一個子字段中詞序不限。檢索式為A(S)B,(S)在文摘字段中,一個句子就是一個子字段,用句號或豆號結(jié)束。例如computer()control(s)system可檢出文摘中含有“Thispaperisconcernedwithanapplicationofthecomputercontroltechniqueinaintelligentsystemfortestinginnerwallsofpipes.”這樣一句話的文獻(xiàn)記錄。(6)S-sentence45鄰接符號S(sentence),表示其兩側(cè)的檢索詞必須是2.2.4位置邏輯檢索精確度排序(W)(nW)(N)(nN)(S)(F)高低462.2.4位置邏輯檢索精確度排序(W)(nW)(N)(nNL表示所連接的兩個詞之間有一定叢屬關(guān)系,后者修飾、限定前者,兩者為主從關(guān)系。如主題表中的主題詞和副主題就具有叢屬關(guān)系。在EI,MEDLINE中使用如:SOLAR(L)ENERGY系統(tǒng)會自動到敘詞字段查找和太陽能相關(guān)的文獻(xiàn)。(7)L-link47L表示所連接的兩個詞之間有一定叢屬關(guān)系,后者修飾、限定前者,檢索執(zhí)行的優(yōu)先順序括號中的檢索詞高

W,N,或L,F,NOTANDOR低48檢索執(zhí)行的優(yōu)先順序括號中的檢索詞信息檢索效果是評價一個信息檢索系統(tǒng)性能優(yōu)劣的質(zhì)量標(biāo)準(zhǔn),它始終貫穿信息存儲和檢索的全過程。衡量信息檢索效率的指標(biāo):查全率、查準(zhǔn)率、漏檢率、誤檢率。理想的檢索效果是查全率和查準(zhǔn)率同時達(dá)到100%。但事實(shí)上很難達(dá)到全部檢出和全部檢準(zhǔn)的要求,而只能達(dá)到某個百分比。2.3檢索效果評價49信息檢索效果是評價一個信息檢索系統(tǒng)性能優(yōu)劣的質(zhì)量標(biāo)準(zhǔn),它始終查全率:檢索結(jié)果中相關(guān)記錄數(shù)與數(shù)據(jù)庫中總的相關(guān)記錄數(shù)的比值即檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫中存在的合乎該需要的所有文獻(xiàn)的比例。查全率高說明有用的東西都被你檢中了,但對于數(shù)量巨大的數(shù)據(jù)庫而言,要達(dá)到100%的查全率是不可能的,在網(wǎng)絡(luò)條件下尤其如此。查全率=檢索出相關(guān)文獻(xiàn)總數(shù)系統(tǒng)中的相關(guān)文獻(xiàn)總數(shù)X100%2.3檢索效果評價50查全率:檢索結(jié)果中相關(guān)記錄數(shù)與數(shù)據(jù)庫中總的相關(guān)記錄數(shù)的比值查查準(zhǔn)率:檢索結(jié)果中相關(guān)記錄數(shù)與檢索結(jié)果總數(shù)的比值查全率和查準(zhǔn)率之間存在近似于互逆關(guān)系在查全與查準(zhǔn)兩個方面一般難以兩全,為了獲得很多有用的東西(達(dá)到高的查全率),需要較少的限制檢索條件,但這樣檢出的無用的東西就會很多(查準(zhǔn)率不高),反之亦然。在計算機(jī)檢索中,一般認(rèn)為查準(zhǔn)率為60—70%、查全率為40—60%是較為理想的。查準(zhǔn)率=檢索出相關(guān)文獻(xiàn)總數(shù)檢出文獻(xiàn)總數(shù)X100%2.3檢索效果評價51查準(zhǔn)率:檢索結(jié)果中相關(guān)記錄數(shù)與檢索結(jié)果總數(shù)的比值查準(zhǔn)率=檢索

擴(kuò)檢方法:1)準(zhǔn)確把握檢索對象及目的,選擇合適的數(shù)據(jù)庫。2)降低檢索詞或分類號的專指度,可選上位詞和相關(guān)詞加入其中。3)調(diào)整檢索式的網(wǎng)羅度,刪除不重要的概念面。4)更多地采用學(xué)科分類途徑來擴(kuò)大檢索范圍。5)減少邏輯“與”及邏輯“非”的使用。6)增加邏輯“或”及截詞檢索技術(shù)的使用。7)采用“全文檢索”。8)不限定檢索對象的文獻(xiàn)類型、時間段、文種等。提高查全率的主要方法52擴(kuò)檢方法:提高查全率的主要方法52

縮檢方法1)準(zhǔn)確把握檢索對象及目的,選擇合適的數(shù)據(jù)庫。2)提高檢索詞或分類號的專指度。3)更多地采用專用名詞及特性檢索的途徑。4)選擇邏輯“與”及邏輯“非”的使用。5)減少或不采用邏輯“或”及截詞檢索技術(shù)的使用。6)限定檢索詞出現(xiàn)的字段及在段落、文句中的位置。7)不選“全文檢索”.8)限定檢索對象的文獻(xiàn)類型、時間段、文種及其它特征。提高查準(zhǔn)率的主要方法53縮檢方法提高查準(zhǔn)率的主要方法532.4檢索詞的確定必須明確所需信息涉及的主題范疇選擇合適的主題詞注意關(guān)鍵詞與標(biāo)題詞、敘詞的區(qū)別注意關(guān)鍵詞中的同義詞、近義詞的選擇注意用數(shù)據(jù)庫自帶的詞表選擇合適的檢索詞注意檢索詞的上下位概念詞的選擇注意選擇已輸入的檢索詞的相關(guān)復(fù)合檢索詞注意有些數(shù)據(jù)庫有禁用詞:the、about、on等等542.4檢索詞的確定必須明確所需信息涉及的主題范疇54專業(yè)技術(shù)詞典詞表利用數(shù)據(jù)庫自帶的詞表利用搜索引擎選擇2.4檢索詞的確定55專業(yè)技術(shù)詞典2.4檢索詞的確定55利用搜索引擎選擇檢索詞搜索引擎是關(guān)鍵字、詞、詞組、復(fù)合詞組的檢索搜索引擎能檢索各種語言的信息,特別是中英文檢索可以利用搜索引擎對已檢索的內(nèi)容進(jìn)行字詞的選擇,特別是英文詞的選擇當(dāng)有些數(shù)據(jù)庫(SCI、ScienceDirect)沒有檢索詞表可以選擇,搜索引擎對詞的選擇將是主要可參考的途徑2.4檢索詞的確定56利用搜索引擎選擇檢索詞2.4檢索詞的確定56課題:大型船舶運(yùn)輸安全的風(fēng)險評估方法與決策技術(shù)檢索前對課題檢索詞分析:船舶運(yùn)輸、船舶maritimetransportation,Vessel,ship,boat危險可操作性分析、危險與可操作性分析HazardandOperabilityAnalysis,HAZOP評估、評價Evaluate,evaluation,assess,assessment,assessing,appraisal,estimate安全評估、風(fēng)險評估SafetyAssessment,safetyevaluation,RiskAssessment、hazardassessment,exposurerating、……利用搜索引擎選擇檢索詞57課題:大型船舶運(yùn)輸安全的風(fēng)險評估方法與決策技術(shù)利用搜索引擎選用搜索引擎查看可以利用的檢索詞,發(fā)現(xiàn)除了“船舶運(yùn)輸”外,還可以用“海上運(yùn)輸”。而英文詞方面,有maritimetransport、maritimetransportation兩種

利用搜索引擎選擇檢索詞58用搜索引擎查看可以利用的檢索詞,發(fā)現(xiàn)除了“船舶運(yùn)輸”外,還可此處檢索所得詞是:危險與可操作性分析結(jié)論:前后兩次檢索說明“危險與可操作性分析”、“危險可操作性分析”都可以是檢索的對象59此處檢索所得詞是:危險與可操作性分析59利用數(shù)據(jù)庫功能選擇檢索詞利用數(shù)據(jù)庫查看這些詞的可靠性(是否常用、規(guī)范,有無其他用法)利用CNKI數(shù)據(jù)庫查看所選詞的其他相關(guān)詞并利用利用維普數(shù)據(jù)庫查看同義詞利用外文數(shù)據(jù)庫功能查看、選擇檢索詞(CSA、EI、Ebsco)60利用數(shù)據(jù)庫功能選擇檢索詞利用數(shù)據(jù)庫查看這些詞的可靠性(是否常中國學(xué)術(shù)期刊網(wǎng)61中國學(xué)術(shù)期刊網(wǎng)6162626363利用維普數(shù)據(jù)庫的同義詞庫,可以查詢出有關(guān)檢索詞的同義、近義詞。在檢索中,這些同義詞與近義詞都要用來檢索,才不至于“漏檢”由于清華同方、萬方數(shù)據(jù)庫中沒有同義詞查看功能,因此要充分利用維普數(shù)據(jù)庫這一功能,將查看到的詞用于其他數(shù)據(jù)庫檢索中。64利用維普數(shù)據(jù)庫的同義詞庫,可以查詢出有關(guān)檢索詞的同義、近義詞6565666667676868在EI數(shù)據(jù)庫的“受控詞匯”索引中,選擇合適的、規(guī)范化的檢索詞。使用時,只要在上方對話框中輸入自身的檢索詞,查對一下數(shù)據(jù)庫合適的、受控的檢索詞。用“受控詞匯”檢索,更能檢索到符合內(nèi)容的信息69在EI數(shù)據(jù)庫的“受控詞匯”索引中,選擇合適的、規(guī)范化的檢索詞詞表最合適的檢索詞查看詞表詞序?yàn)g覽相關(guān)性檢索詞的查看70詞表最合適的檢索詞查看詞表詞序?yàn)g覽相關(guān)性檢索詞的查看702.5檢索策略及檢索策略式檢索策略式:它將各種檢索點(diǎn)用邏輯算符、位置算符、截詞符等組配符連接起來,形成完整的檢索概念和檢索順序。檢索策略,即在分析檢索課題內(nèi)容實(shí)質(zhì)基礎(chǔ)上,選擇檢索系統(tǒng)、檢索途徑、確定檢索詞及其相互間的邏輯關(guān)系等的信息檢索方案。關(guān)鍵:構(gòu)造能夠確切表達(dá)信息需求的檢索式。

712.5檢索策略及檢索策略式檢索策略式:它將各種檢索點(diǎn)用邏輯課題1:查找有關(guān)面包添加劑方面的文獻(xiàn)資料可有兩種檢索途徑分類途徑:分類號主題途徑:主題詞檢索字段及檢索標(biāo)識:分類號字段:TS202.3(食品添加劑)、TS213.21(面包類)題名、文摘、關(guān)鍵詞字段:面包、添加劑72課題1:查找有關(guān)面包添加劑方面的文獻(xiàn)資料可有兩種檢索途分類檢索表達(dá)式:分類號:(TS202.3*TS213.21)主題檢索表達(dá)式:題名:(面包*添加劑)題名或關(guān)鍵詞:(面包*添加劑)分類、主題組配檢索表達(dá)式:分類號:(TS202.3)*題名:(面包)分類號:(TS202.3)+主題:(添加劑))*題名:(面包)主題:中國知網(wǎng)數(shù)據(jù)庫中的一個組合字段,表示在題名、關(guān)鍵詞和文摘三個字段中進(jìn)行檢索73分類檢索表達(dá)式:73課題2:“論企業(yè)生產(chǎn)線的優(yōu)化”企業(yè)*生產(chǎn)線*優(yōu)化

(企業(yè)+工廠)*(生產(chǎn)線+流水線)*(優(yōu)化+計算機(jī)控制+在線控制+智能控制)74課題2:“論企業(yè)生產(chǎn)線的優(yōu)化”企業(yè)*生產(chǎn)線*優(yōu)化(1)選詞切分、刪除例:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用研究切分:神經(jīng)網(wǎng)絡(luò)、在、旋轉(zhuǎn)機(jī)械、故障診斷、中、的、應(yīng)用、研究刪除:在中的應(yīng)用研究最終:神經(jīng)網(wǎng)絡(luò)、旋轉(zhuǎn)機(jī)械、故障診斷替換將表達(dá)不清晰、概念不明確的詞替換掉如:酸洗費(fèi)液的處理處理:“回收”、“再生”提取概念例如:公司勞動獎勵、職工培訓(xùn)和養(yǎng)老保險制度管理的理論和實(shí)踐"公司","勞動獎勵","職工培訓(xùn)","養(yǎng)老保險","制度","管理“勞動力資源管理:勞動獎勵、職工培訓(xùn)和養(yǎng)老保險最終:“勞動力資源”,“管理”2.5檢索策略式751)選詞替換提取概念2.5檢索策略式752)擴(kuò)展補(bǔ)充進(jìn)行同義詞、近義詞、上位詞、相關(guān)詞等的擴(kuò)充中英文同義、近義詞上位詞、相關(guān)詞

-神經(jīng)網(wǎng)絡(luò):上位詞:人工智能

-故障診斷:相關(guān)詞:故障定位、故障檢測上位詞:容錯技術(shù)2.5檢索策略式762)擴(kuò)展補(bǔ)充上位詞、相關(guān)詞2.5檢索策略式762)擴(kuò)展補(bǔ)充截詞方法當(dāng)某些檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(多數(shù)英語單詞的單復(fù)數(shù)變化和英美不同拼寫形式),可以采用截詞方法擴(kuò)展檢索詞。在詞干后使用截詞符。2.5檢索策略式772)擴(kuò)展補(bǔ)充2.5檢索策略式773)組合把檢索詞用組配符連接起來,組合成檢索式例:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用研究(神經(jīng)網(wǎng)絡(luò)or人工智能)and(旋轉(zhuǎn)機(jī)械)and(故障診斷or故障定位or故障檢測or容錯技術(shù))2.5檢索策略式783)組合2.5檢索策略式78制定檢索式時要注意:

主要檢索詞放在最前面,并且限制在基本索引字段里。正確使用各種算符。檢索式應(yīng)簡單不復(fù)雜。2.5檢索策略式79制定檢索式時要注意:2.5檢索策略式79例:亞音速飛機(jī)在飛行控制方面的研究檢索詞:亞音速、飛機(jī)、飛行控制

檢索式:摘要=(亞音速*飛機(jī)+亞音速飛機(jī))*飛行控制外文檢索詞:subsonicvelocity;aircraft(s)、airplane(s);subsonicaircraft(s);flightcontrol檢索式:AB=((subsonic()velocity)*(aircraft??+airplane??)

+(subsonic()aircraft??))*(flight()control)2.5檢索策略式80例:亞音速飛機(jī)在飛行控制方面的研究檢索詞:亞音速、飛機(jī)、飛總結(jié):提高查準(zhǔn)率從以下幾個方面著手檢索結(jié)果多時采用“AND”縮小檢索范圍檢索下位詞時不使用上位詞使用“NOT”

將不需要的檢索標(biāo)識排除將“AND”改為更精確的狹隘的位置符使用限定符限定檢索標(biāo)識所在字段81總結(jié):提高查準(zhǔn)率從以下幾個方面著手檢索結(jié)果多時采用“AND”練習(xí)1寫出下列課題的中文檢索式:

2005年后在《信號處理》上發(fā)表的有關(guān)雷達(dá)抗干擾檢測方面的文獻(xiàn)2描述下列檢索式的含義:工作單位=(南京航空航天大學(xué)OR北京航空航天大學(xué))AND關(guān)鍵詞=(無人機(jī)OR無人駕駛飛機(jī))82練習(xí)1寫出下列課題的中文檢索式:82練習(xí)1寫出下列課題的中文檢索式:

2005年后在《信號處理》上發(fā)表的有關(guān)雷達(dá)抗干擾檢測方面的文獻(xiàn)摘要=(雷達(dá)AND抗干擾)AND刊名=信號處理AND出版年>=2005

83練習(xí)1寫出下列課題的中文檢索式:83練習(xí)2描述下列檢索式的含義:工作單位=(南京航空航天大學(xué)OR北京航空航天大學(xué))AND關(guān)鍵詞=(無人機(jī)OR無人駕駛飛機(jī))含義:南京航空航天大學(xué)和北京航空航天大學(xué)發(fā)表的有關(guān)無人機(jī)研究的文獻(xiàn)84練習(xí)2描述下列檢索式的含義:84分析課題選擇檢索系統(tǒng)確定檢索途徑確定檢索方法整理檢索結(jié)果獲取原始文獻(xiàn)。2.6信息檢索步驟85分析課題2.6信息檢索步驟85分析課題明確檢索目的:

1)需要關(guān)于某一課題的系統(tǒng)詳盡的信息(博碩士論文、申請課題、科技查新)

2)課題最新信息(跟蹤課題)

3)了解一些片段信息,解決一些具體問題課題涉及的學(xué)科范疇明確課題的主題或主要內(nèi)容主題內(nèi)容的科學(xué)屬性,在整個科學(xué)體系中的位置?86分析課題明確檢索目的:86分析課題的方法

老課題首選手冊、百科全書、專著等三次文獻(xiàn)。有高度、深度和廣度,對該領(lǐng)域的研究有一種全局的了解和把握,同時可以對背景知識和相關(guān)名詞術(shù)語作全面的了解。

新穎課題直接由學(xué)術(shù)數(shù)據(jù)庫、網(wǎng)上資源,作為檢索起點(diǎn)。課題屬理論探討性質(zhì)——側(cè)重查學(xué)術(shù)會議錄、學(xué)會刊物、大學(xué)學(xué)報、學(xué)術(shù)性期刊。課題屬尖端技術(shù)——側(cè)重查科技報告課題屬工藝革新、發(fā)明創(chuàng)造——側(cè)重查專利文獻(xiàn)課題屬定型產(chǎn)品的設(shè)計、生產(chǎn)造型——側(cè)重查技術(shù)標(biāo)準(zhǔn)、產(chǎn)品樣本87分析課題的方法老課題首選手冊、百科全書、專著等三次文獻(xiàn)。8選擇檢索系統(tǒng)——聯(lián)機(jī)檢索系統(tǒng):多個數(shù)據(jù)庫同時檢索,Dialog——搜索引擎:google、scirus——學(xué)術(shù)數(shù)據(jù)庫88選擇檢索系統(tǒng)——聯(lián)機(jī)檢索系統(tǒng):多個數(shù)據(jù)庫同時檢索,Dialo確定檢索途徑、檢索方法檢索途徑外部特征:題目(Title)、

作者(Author)

作者單位、

摘要(Abstract)、

關(guān)鍵詞(KeyWord)、正文(Text)、

參考文獻(xiàn)內(nèi)容特征:分類途徑、主題途徑檢索方法常規(guī)法:順查法、倒查法、抽查法引文法:追溯法、索引法、綜合法89確定檢索途徑、檢索方法檢索途徑89

檢索策略輸入檢索系統(tǒng)后,系統(tǒng)響應(yīng)的檢索結(jié)果有時不一定能滿足課題檢索的要求,例如:或者檢出的篇數(shù)過多,而且不相關(guān)文獻(xiàn)所占比例很大,或者檢出的文獻(xiàn)數(shù)量太少,有時甚至為零,這時就需要調(diào)整檢索策略。

整理檢索結(jié)果,調(diào)整檢索策略90檢索策略輸入檢索系統(tǒng)后,系統(tǒng)響文獻(xiàn)檢索的步驟分析課題選擇檢索系統(tǒng)確定檢索途徑確定檢索方法整理檢索結(jié)果獲取原始文獻(xiàn)根據(jù)調(diào)整檢索策略后的檢索結(jié)果,適當(dāng)調(diào)整課題方向91文獻(xiàn)檢索的步驟分析課題根據(jù)調(diào)整檢索策略后的檢索結(jié)2.7科技查新定義科技查新是以文獻(xiàn)檢索為基礎(chǔ),以手工檢索和計算機(jī)檢索為手段,采用綜合分析對比的方法,為科研項(xiàng)目的立項(xiàng)、鑒定、申報成果等科研活動提供事實(shí)依據(jù)的一種信息服務(wù)方式。科技查新的性質(zhì)A.查新是對項(xiàng)目的新穎性作出結(jié)論B.查新有別于文獻(xiàn)檢索C.查新有別于專家評審922.7科技查新定義92進(jìn)行什么工作需要查新?

立項(xiàng)查新成果鑒定查新技術(shù)開發(fā)查新技術(shù)轉(zhuǎn)讓查新專利申請查新專利糾紛查新談判、銷售、關(guān)鍵技術(shù)查新標(biāo)準(zhǔn)資料等查新93進(jìn)行什么工作需要查新?立項(xiàng)查新93查新步驟94查新步驟94查得的相關(guān)文獻(xiàn)進(jìn)行對比分析

文獻(xiàn)中的研究與查新人的研究異同之處,查新人的研究是否國內(nèi)無相同或相似研究報道,是否國際上無相關(guān)研究報道.最終從查得結(jié)果作出國內(nèi)或國際領(lǐng)先,具有新穎性的結(jié)論.95查得的相關(guān)文獻(xiàn)進(jìn)行對比分析95上機(jī)作業(yè):用戶名:jiansuo02密碼:jiansuo0296上機(jī)作業(yè):96信息檢索技術(shù)基礎(chǔ)信息檢索與利用97信息檢索與利用1主要內(nèi)容2.1信息檢索語言2.2信息檢索技術(shù)2.3檢索效果評價2.4檢索詞的確定2.5信息檢索策略及策略式2.6信息檢索步驟2.7科技查新98主要內(nèi)容2檢索語言:在信息的存儲和檢索過程中,為使信息在用戶和系統(tǒng)間有效傳遞,各種檢索工具使用專門的語言體系來描述信息的內(nèi)部特征和外部特征,同時要求用戶依此構(gòu)造檢索提問式來進(jìn)行信息檢索,這種專門的語言體系成為檢索語言。2.1信息檢索語言99檢索語言:在信息的存儲和檢索過程中,為使信息在用戶和系統(tǒng)間有檢索語言描述文獻(xiàn)內(nèi)容特征分類語言主題語言描述文獻(xiàn)外表特征題名(書名、刊名、篇名)著者出版事項(xiàng)代碼/序號關(guān)鍵詞語言敘詞語言標(biāo)題詞語言2.1信息檢索語言單元詞語言100檢索描述文獻(xiàn)分類語言主題語言描述文獻(xiàn)題名(書名、刊名、篇名)主題語言(內(nèi)容特征)按照主題性質(zhì)的不同可分為:標(biāo)題詞單元詞敘詞關(guān)鍵詞2.1信息檢索語言101主題語言(內(nèi)容特征)2.1信息檢索語言5標(biāo)題詞語言:是表征文獻(xiàn)內(nèi)容特征的、經(jīng)過規(guī)范化處理的名詞術(shù)語(包括詞和短語)。例如:飛機(jī):plane、airplane、aeroplaneaircraft用aircraft來表示所有“飛機(jī)”概念,以此作為規(guī)范詞.使用aircraft一詞的檢索結(jié)果將包括全部有飛機(jī)概念的文獻(xiàn).單元詞:指從信息內(nèi)容中抽出的最基本的詞匯。關(guān)鍵詞語言:關(guān)鍵詞是從文題、文摘或正文中抽出,具有實(shí)質(zhì)意義,能夠代表文獻(xiàn)內(nèi)容主題的名詞術(shù)語。關(guān)鍵詞可直接用于文獻(xiàn)標(biāo)引。2.1信息檢索語言102標(biāo)題詞語言:是表征文獻(xiàn)內(nèi)容特征的、經(jīng)過規(guī)范化處理的名詞術(shù)語(敘詞語言敘詞:指從信息的內(nèi)容中抽出的、能概括表達(dá)信息內(nèi)容基本概念的名詞或術(shù)語,它是經(jīng)規(guī)范化處理的自然語言詞匯。敘詞受敘詞表控制,有組配功能。通常使用的敘詞表有:國內(nèi)《漢語主題詞表》,英國《科學(xué)文摘》使用的《INSPECThesaurus》,美國《工程索引》使用的《EiThesaurus》等。

運(yùn)輸飛機(jī)設(shè)計運(yùn)輸飛機(jī)設(shè)計運(yùn)輸飛機(jī)飛機(jī)設(shè)計103敘詞語言敘詞:指從信息的內(nèi)容中抽出的、能概括表達(dá)信息內(nèi)容基EI(Thesaurus)104EI(Thesaurus)8作用檢索詞用來組織信息(信息工作者)對文獻(xiàn)信息內(nèi)容進(jìn)行標(biāo)引;對內(nèi)容相同或相關(guān)的信息加以集中或揭示其相關(guān)性;對信息進(jìn)行系統(tǒng)化、有序化;檢索詞用于檢索(檢索用戶)進(jìn)行主題檢索進(jìn)行分類檢索進(jìn)行外表特征檢索檢索詞是信息資源組織與檢索者檢索提問的橋梁,在數(shù)據(jù)庫中,對應(yīng)為檢索點(diǎn)、檢索入口2.1信息檢索語言105作用2.1信息檢索語言9對文獻(xiàn)信息內(nèi)容進(jìn)行標(biāo)引特征1特征2特征3特征4特征5特征n106對文獻(xiàn)信息內(nèi)容進(jìn)行標(biāo)引特征1特征2特征3特征4特征5特征n1字段名數(shù)據(jù)庫中文獻(xiàn)的記錄方式107字段名數(shù)據(jù)庫中文獻(xiàn)的記錄方式112.2.1布爾邏輯2.2.2截詞檢索2.2.3限制檢索2.2.4位置邏輯2.2.5檢索策略式2.2信息檢索技術(shù)1082.2.1布爾邏輯2.2信息檢索技術(shù)12在進(jìn)行信息檢索時,檢索項(xiàng)之間概念有相交關(guān)系、同義關(guān)系或相關(guān)關(guān)系,這時采用布爾邏輯進(jìn)行檢索項(xiàng)之間的邏輯組配。用“與”(AND)、“或”(OR)、“非”(NOT)來表達(dá)。2.2.1布爾邏輯檢索109在進(jìn)行信息檢索時,檢索項(xiàng)之間概念有相交關(guān)系、同義關(guān)系或相關(guān)關(guān)布爾邏輯檢索:在進(jìn)行信息檢索時,檢索項(xiàng)之間概念有相交關(guān)系、同義關(guān)系或相關(guān)關(guān)系,這時采用布爾邏輯進(jìn)行檢索項(xiàng)之間的邏輯組配。

布爾邏輯算符有三種:邏輯與、邏輯或、邏輯非用“與”(AND)、“或”(OR)、“非”(NOT)來表達(dá)。2.2.1布爾邏輯110布爾邏輯檢索:在進(jìn)行信息檢索時,檢索項(xiàng)之間概念有相交關(guān)系、同邏輯“與”在計算機(jī)信息檢索時,“與”用于表示概念的交叉、限定關(guān)系邏輯符號:and、﹡、還可用空格表示表達(dá)形式:AandB、A*B、或AB具有縮小檢索范圍和提高專指性的功能。例:computerandcontrol(SCI)computer*control(Dialog)computercontrol(Google)

AB111邏輯“與”在計算機(jī)信息檢索時,“與”用于表示概念的交叉、限定邏輯或邏輯“或”算符,用來表示概念的并列、平行、等同關(guān)系代表符號:“or”、“+”表達(dá)形式:AORB或A+B具有擴(kuò)大檢索范圍,減少漏檢的功能。例:AIRPLANEORAIRCRAFT(Google)

或AIRPLANE+AIRCRAFTAB112邏輯或邏輯“或”算符,用來表示概念的并列、平行、等同關(guān)系A(chǔ)B邏輯“非”算符,是具有概念包含關(guān)系的一種組配,可以從原檢索范圍中排除某一內(nèi)容。表達(dá)形式:AnotB、A-B具有縮小命中范圍,提高查準(zhǔn)率,增強(qiáng)檢索的專指性,減少輸出量的作用。

例:Energynotnuclear邏輯非AB113邏輯“非”算符,是具有概念包含關(guān)系的一種組配,可以從原檢索范布爾邏輯檢索技術(shù)邏輯或(OR):擴(kuò)大檢索范圍,有利于提高查全率。邏輯與(AND):縮小檢索范圍,有利于提高查準(zhǔn)率。邏輯非(NOT):縮小檢索范圍,有利于提高查準(zhǔn)率。ABAB邏輯與A*B

邏輯或A+B邏輯非A-BAB114布爾邏輯檢索技術(shù)邏輯或(OR):擴(kuò)大檢索范圍,有利于提運(yùn)用“布爾算符”的注意事項(xiàng):

布爾邏輯運(yùn)算符運(yùn)算順序?yàn)椋?/p>

not→and→or運(yùn)算符遵循數(shù)學(xué)運(yùn)算法則;

(a)括號優(yōu)先;(AorB)andCnotD

(b)在檢索式中只有and或or前后的檢索標(biāo)識可以交換;

(c)檢索式中有not時前后檢索詞不能交換。

備注:()必須在半角和英文狀態(tài)下輸入

2.2.1布爾邏輯115運(yùn)用“布爾算符”的注意事項(xiàng):2.2.1布爾邏輯19布爾邏輯檢索表達(dá)式的特點(diǎn)布爾檢索表達(dá)式式目前信息檢索系統(tǒng)中使用最多的一種方法。優(yōu)點(diǎn):表現(xiàn)直觀清晰,方便擴(kuò)檢和縮檢。易于計算機(jī)實(shí)現(xiàn)。缺點(diǎn):沒有反映文獻(xiàn)內(nèi)容(或信息需求)所涉及的多個概念的相對重要性。沒有反應(yīng)概念之間的內(nèi)在語義關(guān)系。116布爾邏輯檢索表達(dá)式的特點(diǎn)布爾檢索表達(dá)式式目前信息檢索系統(tǒng)中使寫出下圖的布爾邏輯檢索式117寫出下圖的布爾邏輯檢索式21截詞(truncation):是指檢索者將檢索詞在認(rèn)為比較合適的地方截斷,也稱模糊檢索,又稱詞干檢索法截詞檢索,用截斷的詞的一個局部進(jìn)行的檢索即利用檢索詞的詞干加上截詞符號去數(shù)據(jù)庫中進(jìn)行檢索。(模糊檢索)截詞符號:一般為“?”或

“*”。各種檢索系統(tǒng)有不同規(guī)定,沒有統(tǒng)一標(biāo)準(zhǔn)。截詞符具有“OR”運(yùn)算符的功能,能夠擴(kuò)大檢索范圍,而且減少了輸入檢索詞的時間,節(jié)約了機(jī)時。2.2.2截詞檢索118截詞(truncation):是指檢索者將檢索詞在認(rèn)為比較合截詞的分類按位置分類:前截詞中間截詞后截詞按取代數(shù)量分:有限截詞無限截詞

119截詞的分類按位置分類:前截詞23后截詞,也稱前方一致。它是將截詞符放在一串字符的后面,用以表示以相同字符串開頭,而結(jié)尾不同的所有詞。詞尾的有限截斷相同字符串后可能變化一個字符時,則在其后使用一個“?”,常用來表示檢索詞的單復(fù)數(shù)變化。例如用system?可以查出sytem和systems的文獻(xiàn)。相同字符串后可能變化兩個以上字符時,則在其后連續(xù)使用若干個“?”代替可能變化的字符。例如,??表示兩個字符,???表示三個字符,以此類推如表示九十年代;199?如表示20世紀(jì):19??后截詞120后截詞,也稱前方一致。它是將截詞符放在一串字符的后面,用以表詞尾的無限截斷相同字符串后可能變化任何字符串時,則在其后使用一個“?”或“*”。這種方法可以查找出含有相同字符串的所有檢索詞。例如,comput*可查出compute,computer,computing,computation,computerisation等如physic*可檢出:physical,physic,physicalism

physician,physicists,physicochenistry,physics等.即相當(dāng)于為上述各檢索詞的邏輯OR運(yùn)算后截詞121詞尾的無限截斷后截詞25中間截詞:可變化的字符出現(xiàn)在單詞的中間位置。例如:“woman”和“women”,可用“wom?n”代替;“defence”和“defense”可用“defen?e”代替。查找英美不同拼法最有效中間截詞122中間截詞:可變化的字符出現(xiàn)在單詞的中間位置。中間截詞26前截斷:將截詞符號放在一個字符串的左方是后方一致的檢索。

例如:*physics可檢physics、astrophysics

、biophysics……..

*Chem*

可檢chemical,electrochemic,chemistry,thermochemistry……..很少使用前截斷123前截斷:將截詞符號放在一個字符串的左方是后方一致的檢索。*——EiVillage,WebofScience,Elsevier,EBSCOJane‘s航空數(shù)據(jù)庫?——PQDD,INSPEC,Dialog截詞124*——EiVillage,WebofScience限制檢索是限定檢索詞出現(xiàn)在數(shù)據(jù)庫記錄中某一字段范圍的一種檢索技術(shù)。檢索時,系統(tǒng)只對指定字段進(jìn)行匹配運(yùn)算,提高了效率和查準(zhǔn)率。基本檢索字段標(biāo)題、文摘、敘詞、自由標(biāo)引詞

Title、abstract、descriptor、identifier輔助檢索字段作者、刊名、語種、年代、專利號等

author、journal、language、publicationyear、patentnumber2.2.3限制檢索125限制檢索是限定檢索詞出現(xiàn)在數(shù)據(jù)庫記錄中某一字段范圍的一種檢索字段檢索常用代碼126字段檢索常用代碼30目前各個檢索系統(tǒng)所設(shè)立的字段是各不相同的,即同一字段,也可能采用不同的字段代碼表示。如題名字段Ei中,用highwaytransport*withinTI來表示;OCLCFirstsearch中,用TI:highwaytransport*來表示。在進(jìn)行字段檢索時,應(yīng)先看一下該數(shù)據(jù)庫的使用指南。例:EiCPXWeb網(wǎng)絡(luò)版數(shù)據(jù)庫主要字段的字段代碼如下:

CVEi敘詞表受控語

TI題名AB文摘AU著者姓

AF著者機(jī)構(gòu)名稱ST連續(xù)出版物名稱PN出版時間注意127目前各個檢索系統(tǒng)所設(shè)立的字段是各不相同的,即同一例:檢索2005年以后在《情報學(xué)報》上發(fā)表的有關(guān)信息價值計算方法的文獻(xiàn)限定范圍:2005以后;《情報學(xué)報》檢索詞:信息價值、計算時間上的限定,有“=”、“>”、“<”、“>=”、“<=”。例如:PY>=2004表示檢索2004年以來(包括2004)發(fā)表的文獻(xiàn)。檢索式:(年>=2005)*(刊名=情報學(xué)報)*(主題=信息價值*計算)128例:檢索2005年以后在《情報學(xué)報》上發(fā)表的有關(guān)信息價值計算1293313034Searchwithinaspecificfieldusing"wn"{testbed}wnALLAND{atmnetworks}wnTI

(windowwnTIANDsapphirewnTI)ORSakamoto,K*wnAU

131Searchwithinaspecificfield利用位置算符來表示檢索詞之間的位置關(guān)系,以實(shí)現(xiàn)位置邏輯檢索功能。特征這是一種可以不依賴主題詞表而直接使用自由詞進(jìn)行檢索的技術(shù)方法??杀磉_(dá)復(fù)合內(nèi)容屬于提高專指度的方法引入位置算符的目的是增加檢索式的靈活性,表達(dá)復(fù)雜專深的概念,從而提高檢索的專指度,彌補(bǔ)布爾邏輯算符難以表達(dá)某些復(fù)雜提問的不足。2.2.4位置邏輯132利用位置算符來表示檢索詞之間的位置關(guān)系,以實(shí)現(xiàn)位置邏輯檢索功分類:記錄級檢索:要求檢索詞在同一記錄中有L字段級檢索:要求檢索詞在同一字段中,有

F子字段或自然句級檢索:要求檢索詞出現(xiàn)在同一子字段或同一自然句中,有S,詞位置檢索:要求詞之間相互位置滿足某些條件,有

W,NW,N.nN

等2.2.4位置邏輯133分類:2.2.4位置邏輯37(W)表示該算符兩側(cè)的檢索詞相鄰,且兩者之間只允許只有一個空格或標(biāo)點(diǎn)符號,不允許有任何字母或詞,順序不能顛倒。(W)也可以簡寫為()。例如:Aircraft()design可檢索出含有Aircraftdesign的文獻(xiàn)記錄。Computer()aided()design可檢索出含有Computeraideddesign的文獻(xiàn)記錄(Dialog為例)(1)(W)—With134(W)表示該算符兩側(cè)的檢索詞相鄰,且兩者之間只允許只有一個空(nW)表示在此算符兩側(cè)的檢索詞之間最多允許間隔n個詞(實(shí)詞或虛詞),且兩者的相對位置不能顛倒。例如:laser(1w)printer可檢出含有l(wèi)aserprinter和lasercolorprinter的文獻(xiàn)記錄Computer(1w)animation可檢出Computerassistedanimation(Dialog為例)(2)(nW)—nWords(W),(1W),(nW)135(nW)表示在此算符兩側(cè)的檢索詞之間最多允許間隔n個詞(實(shí)Wn如:W8——EBSCO

例:taxW8reformADJ——Elsevier兩詞按指定順序排列,相當(dāng)于短語例:remoteADJeducationPRE/n——PQDD例:militaryPRE/1weapons常見的另外的表達(dá)形式136常見的另外的表達(dá)形式40(N)表示該算符兩側(cè)的檢索詞相鄰,但兩者的相對位置可以顛倒。例如:computer(N)network可檢出含有computernetwork、networkcomputer形式的文獻(xiàn)記錄。例ECONOMI*(1NEAR)RECOVER*可包含多重組合和含義(Dialog為例)(3)(N)—Near137(N)表示該算符兩側(cè)的檢索詞相鄰,但兩者的相對位置可以顛倒。(nN)表示此算符兩側(cè)的檢索詞之間允許間隔最多n個詞,且兩者的順序可以顛倒。例如computer(2N)system可檢出含有computersystem,computercodesystem,computeraideddesignsystem,systemusingmoderncomputer等形式的文獻(xiàn)記錄。(4)(nN)—nNear(N),(1N),(nN)138(nN)表示此算符兩側(cè)的檢索詞之間允許間隔最多n個詞,且兩Nn例:

taxN5reform

(EBSCO)

NEAR[N]例:remoteNEAR[5]ducation(Elsevier)W/n例:intelligentW/10buildingsPQDD常見的另外的表達(dá)形式139Nn例:taxN5reform(EBSCO)鄰接符號F(field),表示其兩側(cè)的檢索詞必須是在文獻(xiàn)記錄的同一字段中,而它們在該字段中的相對次序不限。檢索式為A(F)B。例如:computer(F)control,只要這兩個詞在一個字段同時出現(xiàn)就算命中。例如:water()pollution(F)control表示在同一個字段中(如篇名、文摘、敘詞等)同時含有waterpollution和control的文獻(xiàn)記錄均可檢索出來。(5)(F)—Field140鄰接符號F(field),表示其兩側(cè)的檢索詞必須是在文鄰接符號S(sentence),表示其兩側(cè)的檢索詞必須是在文獻(xiàn)記錄的同一子字段中,用(S)連接的兩個詞都出現(xiàn)在同一個子字段中詞序不限。檢索式為A(S)B,(S)在文摘字段中,一個句子就是一個子字段,用句號或豆號結(jié)束。例如computer()control(s)system可檢出文摘中含有“Thispaperisconcernedwithanapplicationofthecomputercontroltechniqueinaintelligentsystemfortestinginnerwallsofpipes.”這樣一句話的文獻(xiàn)記錄。(6)S-sentence141鄰接符號S(sentence),表示其兩側(cè)的檢索詞必須是2.2.4位置邏輯檢索精確度排序(W)(nW)(N)(nN)(S)(F)高低1422.2.4位置邏輯檢索精確度排序(W)(nW)(N)(nNL表示所連接的兩個詞之間有一定叢屬關(guān)系,后者修飾、限定前者,兩者為主從關(guān)系。如主題表中的主題詞和副主題就具有叢屬關(guān)系。在EI,MEDLINE中使用如:SOLAR(L)ENERGY系統(tǒng)會自動到敘詞字段查找和太陽能相關(guān)的文獻(xiàn)。(7)L-link143L表示所連接的兩個詞之間有一定叢屬關(guān)系,后者修飾、限定前者,檢索執(zhí)行的優(yōu)先順序括號中的檢索詞高

W,N,或L,F,NOTANDOR低144檢索執(zhí)行的優(yōu)先順序括號中的檢索詞信息檢索效果是評價一個信息檢索系統(tǒng)性能優(yōu)劣的質(zhì)量標(biāo)準(zhǔn),它始終貫穿信息存儲和檢索的全過程。衡量信息檢索效率的指標(biāo):查全率、查準(zhǔn)率、漏檢率、誤檢率。理想的檢索效果是查全率和查準(zhǔn)率同時達(dá)到100%。但事實(shí)上很難達(dá)到全部檢出和全部檢準(zhǔn)的要求,而只能達(dá)到某個百分比。2.3檢索效果評價145信息檢索效果是評價一個信息檢索系統(tǒng)性能優(yōu)劣的質(zhì)量標(biāo)準(zhǔn),它始終查全率:檢索結(jié)果中相關(guān)記錄數(shù)與數(shù)據(jù)庫中總的相關(guān)記錄數(shù)的比值即檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫中存在的合乎該需要的所有文獻(xiàn)的比例。查全率高說明有用的東西都被你檢中了,但對于數(shù)量巨大的數(shù)據(jù)庫而言,要達(dá)到100%的查全率是不可能的,在網(wǎng)絡(luò)條件下尤其如此。查全率=檢索出相關(guān)文獻(xiàn)總數(shù)系統(tǒng)中的相關(guān)文獻(xiàn)總數(shù)X100%2.3檢索效果評價146查全率:檢索結(jié)果中相關(guān)記錄數(shù)與數(shù)據(jù)庫中總的相關(guān)記錄數(shù)的比值查查準(zhǔn)率:檢索結(jié)果中相關(guān)記錄數(shù)與檢索結(jié)果總數(shù)的比值查全率和查準(zhǔn)率之間存在近似于互逆關(guān)系在查全與查準(zhǔn)兩個方面一般難以兩全,為了獲得很多有用的東西(達(dá)到高的查全率),需要較少的限制檢索條件,但這樣檢出的無用的東西就會很多(查準(zhǔn)率不高),反之亦然。在計算機(jī)檢索中,一般認(rèn)為查準(zhǔn)率為60—70%、查全率為40—60%是較為理想的。查準(zhǔn)率=檢索出相關(guān)文獻(xiàn)總數(shù)檢出文獻(xiàn)總數(shù)X100%2.3檢索效果評價147查準(zhǔn)率:檢索結(jié)果中相關(guān)記錄數(shù)與檢索結(jié)果總數(shù)的比值查準(zhǔn)率=檢索

擴(kuò)檢方法:1)準(zhǔn)確把握檢索對象及目的,選擇合適的數(shù)據(jù)庫。2)降低檢索詞或分類號的專指度,可選上位詞和相關(guān)詞加入其中。3)調(diào)整檢索式的網(wǎng)羅度,刪除不重要的概念面。4)更多地采用學(xué)科分類途徑來擴(kuò)大檢索范圍。5)減少邏輯“與”及邏輯“非”的使用。6)增加邏輯“或”及截詞檢索技術(shù)的使用。7)采用“全文檢索”。8)不限定檢索對象的文獻(xiàn)類型、時間段、文種等。提高查全率的主要方法148擴(kuò)檢方法:提高查全率的主要方法52

縮檢方法1)準(zhǔn)確把握檢索對象及目的,選擇合適的數(shù)據(jù)庫。2)提高檢索詞或分類號的專指度。3)更多地采用專用名詞及特性檢索的途徑。4)選擇邏輯“與”及邏輯“非”的使用。5)減少或不采用邏輯“或”及截詞檢索技術(shù)的使用。6)限定檢索詞出現(xiàn)的字段及在段落、文句中的位置。7)不選“全文檢索”.8)限定檢索對象的文獻(xiàn)類型、時間段、文種及其它特征。提高查準(zhǔn)率的主要方法149縮檢方法提高查準(zhǔn)率的主要方法532.4檢索詞的確定必須明確所需信息涉及的主題范疇選擇合適的主題詞注意關(guān)鍵詞與標(biāo)題詞、敘詞的區(qū)別注意關(guān)鍵詞中的同義詞、近義詞的選擇注意用數(shù)據(jù)庫自帶的詞表選擇合適的檢索詞注意檢索詞的上下位概念詞的選擇注意選擇已輸入的檢索詞的相關(guān)復(fù)合檢索詞注意有些數(shù)據(jù)庫有禁用詞:the、about、on等等1502.4檢索詞的確定必須明確所需信息涉及的主題范疇54專業(yè)技術(shù)詞典詞表利用數(shù)據(jù)庫自帶的詞表利用搜索引擎選擇2.4檢索詞的確定151專業(yè)技術(shù)詞典2.4檢索詞的確定55利用搜索引擎選擇檢索詞搜索引擎是關(guān)鍵字、詞、詞組、復(fù)合詞組的檢索搜索引擎能檢索各種語言的信息,特別是中英文檢索可以利用搜索引擎對已檢索的內(nèi)容進(jìn)行字詞的選擇,特別是英文詞的選擇當(dāng)有些數(shù)據(jù)庫(SCI、ScienceDirect)沒有檢索詞表可以選擇,搜索引擎對詞的選擇將是主要可參考的途徑2.4檢索詞的確定152利用搜索引擎選擇檢索詞2.4檢索詞的確定56課題:大型船舶運(yùn)輸安全的風(fēng)險評估方法與決策技術(shù)檢索前對課題檢索詞分析:船舶運(yùn)輸、船舶maritimetransportation,Vessel,ship,boat危險可操作性分析、危險與可操作性分析HazardandOperabilityAnalysis,HAZOP評估、評價Evaluate,evaluation,assess,assessment,assessing,appraisal,estimate安全評估、風(fēng)險評估SafetyAssessment,safetyevaluation,RiskAssessment、hazardassessment,exposurerating、……利用搜索引擎選擇檢索詞153課題:大型船舶運(yùn)輸安全的風(fēng)險評估方法與決策技術(shù)利用搜索引擎選用搜索引擎查看可以利用的檢索詞,發(fā)現(xiàn)除了“船舶運(yùn)輸”外,還可以用“海上運(yùn)輸”。而英文詞方面,有maritimetransport、maritimetransportation兩種

利用搜索引擎選擇檢索詞154用搜索引擎查看可以利用的檢索詞,發(fā)現(xiàn)除了“船舶運(yùn)輸”外,還可此處檢索所得詞是:危險與可操作性分析結(jié)論:前后兩次檢索說明“危險與可操作性分析”、“危險可操作性分析”都可以是檢索的對象155此處檢索所得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論