信息檢索復習資料_第1頁
信息檢索復習資料_第2頁
信息檢索復習資料_第3頁
信息檢索復習資料_第4頁
信息檢索復習資料_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

科學信息檢索與應用第一章緒論1.情報檢索與科學研究關(guān)系2.個體研究階段,世界上最早出現(xiàn)的手工檢索工具:答:1821年瑞士出版的《物理科學進展年報》1830年德國創(chuàng)辦的文摘雜志《藥學總覽》3.社會化階段,研制大型檢索工具:答:美國1884年創(chuàng)辦了《工程索引》(EI)美國1907年創(chuàng)辦了《化學文摘》(CA)美國1926年創(chuàng)辦了《生物學文摘》(BA)英國1896年創(chuàng)辦了《科學文摘》(SA)4.自動化階段,產(chǎn)生新的檢索理論:答:1951年Taube,M提出:單元詞組配法1958年Citron,J提出:輪排索引1958年Luhn,H提出:定題服務(SDI)二戰(zhàn)期間…案例:曼哈頓工程-阿波羅計劃5.科技文獻概念答:記錄在載體上的科技知識,包括科技事實、數(shù)據(jù)、理論方法、構(gòu)思和假設等。(文獻/科技文獻)6.文獻信息源,按文獻載體形式劃分:答:印刷型文獻:指印刷術(shù)發(fā)明之后,以紙張為存儲載體,通過油印、鉛印、膠印、靜電復印等手段,將文字固化在紙張上所形成的文獻??s微型文獻:又稱為縮微復制品文獻,它是以感光材料為載體,以印刷型文獻為母本,采用光學攝影技術(shù),將文獻的體積濃縮而固化到載體上。機讀型文獻:機讀型文獻的全稱為計算機閱讀型,是以磁性材料為存儲載體,以穿孔、打字或光學字符識別裝置為記錄手段而形成的文獻。聲像型文獻:又稱為視聽型文獻,它是以磁性材料或感光材料為載體,借助特定的機械設備直接記錄聲音信息和圖像信息所形成的文獻。7.文獻信息源,按文獻的出版形式劃分:答:科技圖書(ScienceandTechnicalBook)科學期刊(ScienceandTechnicalJournal)科技報告(ScienceandTechnicalReport)專利文獻(PatentDocument)會議文獻(ConferencePaper)學位論文(DegreeThesis)標準文獻(StandardLiterature)政府出版物(GovernmentDocument)產(chǎn)品樣本(ProductStylebook)技術(shù)檔案(TechnicalFiles)8.文獻信息源,按文獻的產(chǎn)生、加工、用途劃分為:答:一次文獻,又稱原始文獻。以本人的研究成果為基本素材創(chuàng)作而成的文獻。二次文獻,將分散的一次文獻進行選擇、加工、整理之后所得到的產(chǎn)物,是為了便于管理和利用一次文獻而編制的檢索工具。三次文獻,利用二次文獻查閱大量一次文獻,并將其進行綜合、分析、研究而編寫出來的文獻。9.文獻壽命縮短半衰期:貝納爾(Bernal,J.D)提出半衰期:某學科現(xiàn)時尚在利用的全部文獻中較新的一半,是在多長一段時間內(nèi)(X年)發(fā)表的。經(jīng)過X年,某學科領(lǐng)域其一半文獻的利用價值已逐漸衰減。例如:生物科學文獻的半衰期是3年,也就是說,現(xiàn)時仍在利用的生物科學文獻的50%,其出版年齡不超過3年。換句話說,上述生物學文獻的半衰期(一半老化的時間)是3年。表1.各類科技文獻使用壽命文獻類型使用壽命文獻類型使用壽命科技圖書10-20年科技期刊3-5年科技報告10年標準文獻5年學位論文5-7年產(chǎn)品樣本3-5年平均使用壽命為5-6年表2.不同學科文獻半衰期學科半衰期學科半衰期學科半衰期數(shù)學10.5地理學16.0生物、醫(yī)學3.0物理學4.6化工4.8生理學7.2化學8.1冶金工程3.9植物學10.0天文學4.7機械工程5.2農(nóng)林科學5.9如,檢索有關(guān)“汽輪機葉片制造”方面的文獻A-汽輪機B-葉片C-制造檢索式:AandBandC;AandB;BandC3.位置算符檢索法又稱鄰接算符(adjacentoperators),適用于兩個檢索詞以指定間隔距離或者指定的順序出現(xiàn)的場合。跟and運算符類似,但比and運算符功能更具體。例如:查找“細菌對染料破壞”方面的文獻常用位置運算符有(w)(n)(s)(f)(1)(W)(詞間位置算符,含義為With)詞序不能顛倒,兩詞之間不允許插入其它詞,但允許有空格。例如:Economy(W)Mathematics4.截詞(Truncation)檢索法截詞有多種用途:(1)詞尾截斷可得到該單詞所提及的所有詞語(單數(shù)和復數(shù))(2)詞間切斷或通配符:可找到該單詞的所有變化形式或不同拼法。?=一個字符*=一個或多個字符例如:檢索單復數(shù)和不同拼法等詞語注意:截詞檢索時,不可截的太短,否則會檢出無關(guān)概念。如,Com*5.檢索限定字段限定包括TI、AB、DE、AU;時間范圍限定PY;分類限定CC;語種限定LA;文獻類型DT……等字段限定也是調(diào)整檢索策略的一種重要手段。多數(shù)檢索系統(tǒng)對不指定字段的檢索詞通常在所有字段(allfield)中進行檢索。如果想指定在文獻的題目等特定字段中檢索,就需要使用字段限制。字段限制適用于在已有一定數(shù)量輸出記錄的基礎上,通過指定字段的方法,減少輸出篇數(shù),提高檢索的查準率。例如:TeaandBreeding/TIAU=Zhou,GZ6.布爾邏輯檢索式編寫(1)邏輯運算符使用方法布爾邏輯檢索式是檢索策略的邏輯表達式,其表達形式實際上是上述各步驟結(jié)果的綜合體現(xiàn),即使用合適的邏輯算符和位置算符,將各檢索詞進行組配,使之確切地表達課題的主題概念,符合檢索的需求。例1:查找分別單獨論述微型汽車發(fā)動機和摩托車發(fā)動機的文獻,并要求排除那些同時論述這二個主題的文獻”。A-微型汽車B-摩托車C-發(fā)動機檢索式:(AandCorBandC)not(AandBandC)(AandCorBandC)not(AandB)例2:查找論述太陽能或者風能的文獻,但不要其中又論及水能的文獻。A-太陽能B-風能C-水能檢索式:(AorB)notC例3:電視中暴力行為對兒童的影響。A-電視B-暴力行為C-兒童。檢索式:AandBandC例4:檢索有關(guān)利用殺蟲劑控制蚜蟲方面的文獻。A-insecticdeB-aphidesC-control檢索式:AandBandCAandB提問:哪個是最佳檢索式?例5:查找三氧化二砷與空氣污染方面的文獻。A-三氧化二砷(As)B-空氣C-污染檢索式:(ArsenictrioxideorAs)andairandpollutionArsenictrioxideorAsandairpollutionArsenictrioxideorAs提問:在上述三個檢索式中,哪個為最佳或最合理檢索式?為什么?7.編寫邏輯檢索式一般原則答:用and連接檢索詞,將出現(xiàn)頻率不高的詞放在and的左邊。用or連接檢索詞,將出現(xiàn)頻率高的詞放在or的左邊。當用and和or兩種算符,并且連續(xù)使用多個or算符,or應放在and的左邊(or部分用括號)。8.鮑納·查爾斯(C.Bourne)檢索策略答:最專指面優(yōu)先策略(下位類或同類)積木型概念組策略(ORAND)引文珠型增長策略(單篇文獻多篇文獻)逐次分餾策略(上位類下位類)見示例:最專指面優(yōu)先策略(提高查準率)例如:果蔬農(nóng)藥殘留量的檢測與分析(水果or蔬菜)and農(nóng)藥殘留量and檢測and分析(2)(水果or蔬菜)and農(nóng)藥?(4110)(水果or蔬菜)and農(nóng)藥殘留量and檢測(38)(水果or蔬菜)and農(nóng)藥?and檢測and分析(60)積木型概念組策略(提高查全率)例如:檢索氮磷鉀對煙草產(chǎn)量和品質(zhì)的影響S1(NorPorK)S2(NitrogenorPhosphateorPotassium)S3(TobaccoorNicotiana)S4(QualityorYield)(S1orS2)andS3andS4引文珠型增長策略(擴大檢索范圍)例如:檢索分子標記在植物育種中的應用植物and分子標記and育種相關(guān)詞:抗病育種抗病基因遺傳標記基因工程基因圖譜基因表達…逐次分餾策略(縮小檢索范圍)例如,檢索農(nóng)作物病蟲害控制方面的文獻作物and病蟲害(998)稻瘟病and控制(49)小麥and銹病and防治(300多篇)玉米and螟蟲and防治(13)編寫邏輯檢索式小結(jié):使用and算符越多,限制條件就越多,查準率較高;使用or算符越多,連接的相關(guān)詞就越多,查全率也就越高;使用not算符去掉不相關(guān)的概念,可提高查準率。在檢索式中不要連續(xù)使用多個and算符,以免限制過嚴而漏檢文獻,甚至查不到文獻。9.位置算符使用方法例如:查找聚磷酸氨的制備方法方面的文獻Ammonium(S)polyphosphateand(manufasyureorpreparation)152篇Ammonium(S)polyphosphate(S)(manufasyureorpreparation)17篇Ammonium(S)polyphosphoricacid(S)(manufasyureorpreparation)4篇Polyphosphoric(L)Ammonium(S)(manufasyureorpreparation)1篇Ammonium(S)polyphosph?(S)(manufasyureorpreparation)38篇10.制定檢索策略檢索策略由檢索標識和檢索運算符(與、或、非、截斷符、位置符、括弧等)組合而成。制定檢索策略分初級檢索、高級檢索、專業(yè)檢索三種類型。如,中國期刊全文數(shù)據(jù)庫(CNKI)檢索類型1.分析各個檢索詞之間的位置關(guān)系和邏輯組配關(guān)系。2.分析檢索詞應該限定在哪個字段中檢索(是在所有基本索引中檢索還是限定在分類、主題、自由詞、文摘還是其他輔助索引字段中檢索)。實例分析:(1)課題分析:直接從項目名稱中確定檢索概念例如:檢索“聚乙烯的合成”文獻主要概念:聚乙烯、合成檢索式:聚乙烯and合成polyethyleneandSynthesis(2)課題分析:找出隱含概念例如:檢索“灌溉用的橡塑多孔管”文獻Rubber-PlasticPorousPipeForIrrigation隱含概念:橡膠、塑料主要概念:橡膠、塑料、多孔管、灌溉檢索式:(橡膠or塑料or橡塑)and多孔管and灌溉(3)課題分析:泛指概念具體化例如:檢索“唐山綜合防災的研究”文獻主要概念:城市、地震、洪水、火災、決策支持系統(tǒng)、專家系統(tǒng)檢索式:城市and(地震or洪水or火災)and(決策支持系統(tǒng)or專家系統(tǒng))(4)課題分析:排除重復無關(guān)的概念,避免漏檢例如:檢索“河豚毒素的液相色譜分析”文獻主要概念:河豚毒素、液相色譜、分析由于液相色譜本身就是一種分析方法,因此將“分析”這一概念排除。檢索式:河豚毒素and液相色譜11.調(diào)整檢索策略每一次檢索之后都要對檢索結(jié)果進行檢查和評價,如果與需求不符就要修改和調(diào)整檢索策略,重新進行檢索。(1)輸出篇數(shù)過多時,原因主要有以下幾點:①對檢索詞限制條件過寬。包括字段限制,時間限制,分類限制等。②主題概念太少或具有多義性導致誤檢。③對所選的檢索詞截詞截得過短。(2)輸出篇數(shù)過少時,原因可能有以下幾點:①對檢索詞限制條件過窄。②選用了不規(guī)范的主題詞作為檢索詞,或者同義詞沒有充分考慮。例如,沒有使用學名“馬鈴薯”而使用了俗名“土豆”會造成漏檢。③上位概念或下位概念沒有完整運用。例如,“燃料”是上位概念,下位概念可以有“煤”、“油”、“煤氣”、“天然氣”等,這些概念在檢索“燃料”時都應該加以考慮。本章思考題1.計算機檢索的基本方法有哪些?答:(1)布爾邏輯算符檢索法邏輯與(and或*)邏輯或(or或+)邏輯非(not或-)(2)位置算符檢索法常用位置運算符有(w)(n)(s)(f)(1)(W)(詞間位置算符,含義為With)(3)截詞(Truncation)檢索法(4)檢索限定2.根據(jù)自己的專業(yè)或研究方向,擬定一個合理的布爾邏輯檢索式(提問式)。第三章中外數(shù)據(jù)庫檢索方法1.中國知網(wǎng)(CNKI)文獻總量:5656萬篇,其中自然科學文獻為2441萬篇,社會科學文獻為2540萬篇,國際學術(shù)文獻為344萬篇。文獻類型:有學術(shù)期刊、碩博學位論文、工具書、會議論文、年鑒、專著、專利文獻、標準文獻、科技報告和研究成果。2.庫間引文鏈接通過引文數(shù)據(jù)庫的檢索,引證文獻、參考文獻、同類文獻成功鏈接,同時,實現(xiàn)了《中國期刊全文數(shù)據(jù)庫》和《中國優(yōu)秀博碩士學位論文全文數(shù)據(jù)庫》之間的互引用鏈接,即期刊庫如果引用了學位論文庫的文章,期刊庫檢索結(jié)果中會將學位論文庫的該篇文章作為參考文獻提供鏈接,并可點擊鏈接查看文章題錄,進而獲取原文,構(gòu)建了庫間的知識網(wǎng)絡。本章思考題1.中國知網(wǎng)平臺有哪些作用?答:(1)跨庫檢索《中國期刊全文數(shù)據(jù)庫》;《中國優(yōu)秀博碩士論文全文數(shù)據(jù)庫》;《中國重要會議論文全文數(shù)據(jù)庫》;《中國重要報紙全文數(shù)據(jù)庫》;《中國圖書全文數(shù)據(jù)庫》;《中國引文數(shù)據(jù)庫》等CNKI系列源數(shù)據(jù)庫實現(xiàn)了統(tǒng)一跨庫檢索,用戶能夠在一個界面下完成以上所有數(shù)據(jù)庫的檢索。(2)庫間引文鏈接通過引文數(shù)據(jù)庫的檢索,引證文獻、參考文獻、同類文獻成功鏈接,同時,實現(xiàn)了《中國期刊全文數(shù)據(jù)庫》和《中國優(yōu)秀博碩士學位論文全文數(shù)據(jù)庫》之間的互引用鏈接,即期刊庫如果引用了學位論文庫的文章,期刊庫檢索結(jié)果中會將學位論文庫的該篇文章作為參考文獻提供鏈接,并可點擊鏈接查看文章題錄,進而獲取原文,構(gòu)建了庫間的知識網(wǎng)絡。(3)知識網(wǎng)絡系統(tǒng)通過文獻之間、知識元之間、分類導航之間的交叉鏈接,構(gòu)建起節(jié)點豐富、交織縱橫的知識網(wǎng)絡系統(tǒng)。文獻之間的鏈接包括引證文獻、參考文獻、同類文獻等,知識元鏈接包括作者、機構(gòu)、刊名、關(guān)鍵詞、相關(guān)作者群、相關(guān)研究機構(gòu)、相關(guān)關(guān)鍵詞等,同時,還可方便查看其他相關(guān)類別下的文獻。(4)知識元鏈接包括作者、機構(gòu)、刊名、關(guān)鍵詞以及相關(guān)作者、相關(guān)機構(gòu)、相關(guān)關(guān)鍵詞等設置鏈接,通過這些鏈接可檢索知識網(wǎng)絡中心配制的數(shù)據(jù)庫的相應字段,獲取檢索結(jié)果。(5)引文鏈接包括引證文獻和參考文獻鏈接。引文鏈接成功率接近100%。引文鏈接功能,除了可以構(gòu)建相關(guān)的知識網(wǎng)絡外,還可用于個人、機構(gòu)、論文、期刊等方面的計量與評價。(6)相似文獻鏈接即同類文獻鏈接?;谙嗨茩z索技術(shù),實時運算,提供內(nèi)容相關(guān)的相似文獻鏈接。特點:鏈接成功率約100%;可實現(xiàn)內(nèi)容相似的文獻間鏈接;還可實現(xiàn)跨學科關(guān)聯(lián),如不同主題,使用相似方法或技術(shù)的文獻。中國知網(wǎng)(CNKI)檢索平臺作用分析:可擴檢相關(guān)文獻數(shù)量掌握相關(guān)研究機構(gòu)掌握相關(guān)文獻作者研究情況了解作者文獻被引證情況通過期刊導航了解期刊出版狀況及選刊投稿2.檢索學位論文、科技報告、專利文獻等特種文獻應選擇哪些數(shù)據(jù)庫?第五章ISIWebofKnowledge進展與應用1.WebofScience簡介答:ISI(InstituteforScientificInformation)美國科學情報研究所SCI(ScienceCitationIndex)科學引文索引JCR(Journal

Citation

Reports)期刊引用報告三大引文數(shù)據(jù)庫:—ScienceCitationIndexintroducedin1963—SocialSciencesCitationIndexintroducedin1973—Arts&HumanitiesCitationIndexintroducedin19782.引文(Citation)概念答:在文獻甲中提到或描述了文獻乙,并以文后參考書目或腳注的形式列出了文獻乙的出處,其目的在于指出信息的來源、提供某一觀點的依據(jù)、借鑒陳述某一事件等。引文通常也稱為被引文獻或參考文獻,引證文獻通常也稱為來源文獻。3.H-index(h指數(shù)):答:是美國加州大學物理學家喬治·赫希(Jorge

E.Hirsch)提出的,h代表高引用次數(shù)(highcitations),h指數(shù)已經(jīng)被公認為比平均引用率更科學的指標。所謂h指數(shù),是指一個人有n篇論文分別被引用了至少n次。赫希認為h指數(shù)能夠比較準確反映一個人的學術(shù)成就。一個人的h指數(shù)越高,則表明他的論文影響力越大,與其它統(tǒng)計方法不同的是,要確定一個人的h指數(shù)相當容易,只要到SCI網(wǎng)站,查出某個人發(fā)表的所有SCI論文,讓其按被引次數(shù)從高到低排列,往下核對,直到某篇論文的序號大于或等于論文被引次數(shù),那個序號就是h指數(shù)。4.多層次的限定與精確的檢索作用答:發(fā)現(xiàn)某研究領(lǐng)域的隱含的發(fā)展趨勢:把握學科領(lǐng)域的最新動態(tài)了解某特定課題在不同學科的分布情況獲取某學科領(lǐng)域核心研究人員信息5.影響因子(ImpactFactor)答:指某期刊前兩年發(fā)表的論文在統(tǒng)計當年的被引用次數(shù)與該期刊在前兩年內(nèi)發(fā)表的論文總數(shù)之比。又稱作2年影響因子(IF2)。影響因子這一評價期刊的重要指標是SCI創(chuàng)始人尤金,加菲爾德(EugeneGarfield)1972年提出的,這是一個國際上通行的傳統(tǒng)期刊評價指標。通常影響因子越大,它的學術(shù)影響力和作用也越大。具體算法為:影響因子=該刊前兩年發(fā)表論文在統(tǒng)計當年被引用的總次數(shù)/該刊前兩年發(fā)表論文總數(shù)6.WebofScience檢索方法和途徑答:(1)布爾邏輯算符檢索(2)近似檢索(3)截詞檢索(4)檢索途徑7.近似檢索(ExactSearch)詞組檢索如果希望精確地檢索某個短語,應將其放置在引號內(nèi)。范例:“stemcell”SameSame算符連接的關(guān)鍵詞必須在同一句話內(nèi),但關(guān)鍵字前后順序不限。在關(guān)鍵詞字段檢索時,利用“SAME”連接符得到的檢索結(jié)果是同一個短語中的出現(xiàn)檢索詞的記錄。范例:stemSAMEcell本章思考題1.什么是引文?利用引文有哪些作用和意義。2.“same”運算符在數(shù)據(jù)庫中如何使用?第六章碩士論文寫作與選刊投稿1.學位論文基本結(jié)構(gòu)答:前置部分:封面、題名頁、目次頁、中英文摘要、關(guān)鍵詞主體部分:引言、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論