文獻(xiàn)信息檢索與科技論文寫作PPT課件_第1頁
文獻(xiàn)信息檢索與科技論文寫作PPT課件_第2頁
文獻(xiàn)信息檢索與科技論文寫作PPT課件_第3頁
文獻(xiàn)信息檢索與科技論文寫作PPT課件_第4頁
文獻(xiàn)信息檢索與科技論文寫作PPT課件_第5頁
已閱讀5頁,還剩386頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2020/5/18,1,文獻(xiàn)信息檢索與科技論文寫作,2020/5/18,2,2科技論文的基本內(nèi)容,2.1標(biāo)題及層次標(biāo)題2.2署名及作者單位2.3摘要2.4關(guān)鍵詞2.5中圖分類號2.6前(引)言(概述)2.7正文2.8結(jié)論和建議2.9致謝2.10參考文獻(xiàn)2.11附錄、注釋,2020/5/18,3,2.1標(biāo)題及層次標(biāo)題,標(biāo)題,又稱文題、題目、總標(biāo)題(以區(qū)別層次標(biāo)題),是論文的總綱,是能反映論文最重要的特定內(nèi)容的最恰當(dāng)、最簡明的詞語的邏輯組合。,2020/5/18,4,2.1.1標(biāo)題的一般要求,準(zhǔn)確得體標(biāo)題應(yīng)準(zhǔn)確表達(dá)論文的中心內(nèi)容,恰如其分地反映論文涉及的范圍和深度,不應(yīng)使用籠統(tǒng)、泛指性很強(qiáng)的詞語和華而不實(shí)的辭藻。常見的問題:題目過大過于一般化,不能充分反映論文內(nèi)容的特點(diǎn)(題目過大必然一般化。應(yīng)盡量反映論文的特點(diǎn),如新理論、新方(算)法、新設(shè)備、新工藝等。人為拔高:慎用“機(jī)理、規(guī)律”等。,2020/5/18,5,1)題目過大*計(jì)算機(jī)應(yīng)用*計(jì)算機(jī)在工程中的應(yīng)用*計(jì)算機(jī)在橋梁工程中的應(yīng)用*計(jì)算機(jī)在橋梁設(shè)計(jì)中的應(yīng)用*計(jì)算機(jī)在鐵路橋梁設(shè)計(jì)中的應(yīng)用*AutoCAD在鐵路橋梁設(shè)計(jì)中的應(yīng)用*AutoCAD在鐵路橋梁設(shè)計(jì)中的應(yīng)用,2020/5/18,6,2)簡短精練GB771387規(guī)定,題名“一般不超過20字”。一般情況下,這是上限,在準(zhǔn)確反映“最主要的特定內(nèi)容”的前提下,字?jǐn)?shù)越少越好。的研究“的研究”可刪除分析研究“分析”與“研究”重復(fù)刪除不必要的“的”必要時(shí)可加副標(biāo)題(英文論文和社科類論文較常見),但應(yīng)避免濫用。例:(I)理論分析(II)試驗(yàn)研究(III)應(yīng)用實(shí)例,2020/5/18,7,3)便于檢索題名中應(yīng)有盡量多的關(guān)鍵詞。這與題名應(yīng)避免籠統(tǒng)和空泛是相輔相成的。4)容易認(rèn)讀避免使用非公知公用的略縮語、縮寫、符號、代號等。,2020/5/18,8,2.1.2標(biāo)題的文字要求,在文字表達(dá)上,題目比正文的要求更高,需更加仔細(xì)推敲,使其符合現(xiàn)代漢語的語法、修辭和邏輯規(guī)則,避免語病和歧義。研究新方法新方法研究(用偏正結(jié)構(gòu),不用動(dòng)賓結(jié)構(gòu)。但中心動(dòng)詞有狀語時(shí)可用動(dòng)賓結(jié)構(gòu),如:用研究)拱壩的應(yīng)力特點(diǎn)和分布規(guī)律拱壩應(yīng)力的特點(diǎn)和分布規(guī)律例,2020/5/18,9,2.1.3層次標(biāo)題,格式:用阿拉伯?dāng)?shù)字連續(xù)編碼,不同層次的2個(gè)數(shù)字之間用下圓點(diǎn)隔開,末位數(shù)字后不加任何符號。0前(引)言(“0”和“前言”等往往不寫出)11.11.21.2.11.2.21.323,2020/5/18,10,不同層次的問題不能用相同層次標(biāo)題,同一層次的問題應(yīng)用相同層次的標(biāo)題。(此類問題較常見)例:的研制概述1理論分析2的研制(一級標(biāo)題與總標(biāo)題重復(fù))3結(jié)論也有層次標(biāo)題之間互相混淆的情況,2020/5/18,11,避免將層次標(biāo)題與要點(diǎn)混淆(一般用帶括號的編號或字母等表示要點(diǎn))。層次標(biāo)題必須按要求格式編寫。要點(diǎn)可單獨(dú)占行,也可與下文接排。層次標(biāo)題不應(yīng)過細(xì)。很多情況下可去掉,或改成要點(diǎn)。同一級層次標(biāo)題盡量采用排比。一級標(biāo)題難以做到,二級及以下級別標(biāo)題應(yīng)盡量做到。結(jié)構(gòu)相同或相似意義相關(guān)語氣一致,2020/5/18,12,3署名及作者單位,論文署名只限于直接參與課題研究、論文撰寫,能對內(nèi)容負(fù)責(zé),并對論文具有答辯能力的人員。作者單位需盡量詳細(xì)(不能用簡稱、縮寫等),大學(xué)應(yīng)寫出院(系、所),英文翻譯應(yīng)準(zhǔn)確、統(tǒng)一。各單位應(yīng)重視本單位名稱的統(tǒng)一英(外)文譯名。(SouthwestJiaotongUniversitySWJTU)有的期刊要求提供作者簡介、照片。,2020/5/18,13,摘要是對論文內(nèi)容不加注釋和評論的簡要陳述。作用:使讀者盡快了解論文的主要內(nèi)容,補(bǔ)充題目的不足。為科技信息檢索機(jī)構(gòu)提供方便。,4摘要,2020/5/18,14,分類報(bào)道性摘要:提供論文中全部創(chuàng)新內(nèi)容和盡可能多的定量或定性的信息。學(xué)術(shù)性期刊一般采用此類摘要。一般200300字。英文摘要可適當(dāng)詳細(xì)一些。一般包括研究工作的“目的、方法、結(jié)果和結(jié)論?!敝甘拘哉汉喴榻B研究的目的和方法等。50100字。報(bào)道-指示性摘要:介于上述2者之間。重要的部分按報(bào)道性摘要寫,其它部分按指示性摘要寫。100200字。,2020/5/18,15,摘要的寫作要求用第三人稱:不用我(們)、筆者等作主語。一般也不用“作者”。一般不用“本文”:“本文研究(對進(jìn)行了試驗(yàn),認(rèn)為,提出)了”邏輯上不通?!氨疚慕榻B(報(bào)道)”,邏輯上沒問題,但不必要。簡短精練,明確具體,準(zhǔn)確反映論文主要內(nèi)容(重要內(nèi)容不漏掉,也不超出論文內(nèi)容)。不應(yīng)出現(xiàn)類似課題鑒定的自我評價(jià),如“具有意義”、“填補(bǔ)了空白”,等。采用規(guī)范術(shù)語,一般不用數(shù)學(xué)公式和化學(xué)結(jié)構(gòu)式。除非要反駁某篇論文(觀點(diǎn)),一般不出現(xiàn)參考文獻(xiàn)。不應(yīng)簡單重復(fù)標(biāo)題內(nèi)容,也不應(yīng)羅列層次標(biāo)題。,2020/5/18,16,5關(guān)鍵詞,為滿足文獻(xiàn)標(biāo)引或檢索的需要從論文中選出的詞或詞組。盡量選用主題詞,也可用自由詞。主題詞是經(jīng)過規(guī)范化的詞,如漢語主題詞表中收錄的詞,國內(nèi)期刊以此為主。自由詞則是還未規(guī)范化的詞(未收入主題詞表)。數(shù)量為38個(gè)。*由于主題詞的選取比較復(fù)雜,一般編輯需根據(jù)作者提供的關(guān)鍵詞進(jìn)行加工。因此作者最好能根據(jù)漢語主題詞表查出主題詞,必要時(shí)可稍多,供編輯參考。,2020/5/18,17,6中圖分類號,根據(jù)中國圖書資料分類法(圖書館、各院系資料室和學(xué)報(bào)編輯部有)。由于涉及的學(xué)科比較復(fù)雜,作者最好能提供準(zhǔn)確定分類號。,2020/5/18,18,7前(引)言(概論、概述),一般可包括如下內(nèi)容:研究或論文寫作的目的和背景。理論依據(jù)、試驗(yàn)或研究方法。預(yù)期的結(jié)果以及本研究成果的地位、作用和意義。*1)和2)兩點(diǎn)類似于“綜述”,應(yīng)對相關(guān)的研究前沿進(jìn)行評述,以說明作者開展的研究的必要性。,2020/5/18,19,前言的寫作要求:言簡意賅,突出重點(diǎn)。開門見山,不饒圈子。尊重科學(xué),不落俗套?!跋抻跁r(shí)間和水平”、“不足之處在所難免”,等都是不負(fù)責(zé)任的說法,而不是客套。如實(shí)評述,避免吹噓自己的或貶低別人的成果。*前言雖然不是最重要的部分,但一定要特別重視。,2020/5/18,20,7正文,提出論點(diǎn),通過論據(jù)(事實(shí)或數(shù)據(jù)、已有的理論等)對論點(diǎn)加以論證。常見的論證方法:舉例用具體事實(shí)(包括數(shù)據(jù))證明論點(diǎn)。屬歸納推理。事理引伸用已知的道理為論據(jù)證明論點(diǎn)。屬演繹推理。類比將A事物與B事物對比,以B事物的正確與否證明A事物的正確與否。屬類比推理。,2020/5/18,21,反證如數(shù)學(xué)上的反證法。屬演繹推理。對比將截然相反的情況作對比,形成鮮明的對照,從而證實(shí)(明)一種事物的存在或正確。屬類比推理。因果互證通過事理分析,揭示論點(diǎn)與論據(jù)之間的因果關(guān)系,以證明論點(diǎn)的正確性。屬歸納推理。歸謬法先假定某論點(diǎn)正確,然后以此為前提,導(dǎo)出一個(gè)顯然荒謬的結(jié)論,從而證明假定的論點(diǎn)是錯(cuò)的。此方法只適用于駁論。屬演繹反駁推理。,2020/5/18,22,常見的問題:主題不明確。加入無關(guān)的內(nèi)容。*學(xué)位論文要能反映作者的工作,但在期刊上發(fā)表的論文則不能這樣寫。過多引用、重復(fù)已有的成果,沖淡了作者本人的工作。*在研究生的論文中較多,往往由于作者缺乏自信,或研究工作還沒有實(shí)質(zhì)性的成果。過多采用承上啟下的句子。一般來講,此類句子是沒有必要的?!跋旅嬗懻摗睕]有按規(guī)范標(biāo)注參考文獻(xiàn),使讀者難以分清哪些是作者的工作,哪些是引用的成果。,2020/5/18,23,8結(jié)論(和建議)(結(jié)束語),一般可包括如下內(nèi)容:本研究成果得出了什么規(guī)律性的東西,解決了什么問題,提出了什么理論。對前人的有關(guān)本問題的看法作了哪些檢驗(yàn),哪些與本研究結(jié)果一致,哪些不一致,作者作了哪些修正、補(bǔ)充、發(fā)展或否定。本文所報(bào)道的研究的不足之處或遺留問題。*1)是必需的,2)和3)視論文具體內(nèi)容可有可無;有的論文不能得出明確結(jié)論,也可沒有結(jié)論而只進(jìn)行討論。,2020/5/18,24,結(jié)論的寫作要求概括準(zhǔn)確,措詞嚴(yán)謹(jǐn)。避免使用“可能”、“大概”等模能兩可的詞。明確具體,簡短精練。結(jié)論有相對獨(dú)立性,專業(yè)讀者和情報(bào)人員可只看摘要和(或)結(jié)論就能對論文有大致的了解。結(jié)論中不再作討論?!巴ㄟ^,得出如下結(jié)論”及類似的行文都應(yīng)刪除。不作自我評價(jià)。但對研究成果應(yīng)用的范圍可給出說明(但必須是經(jīng)過論證的)。,2020/5/18,25,9致謝,對研究工作和論文寫作給予指導(dǎo)、幫助,或提出過建議等的相關(guān)的人或機(jī)構(gòu)表示謝意。不是必須的項(xiàng)目,2020/5/18,26,10參考文獻(xiàn),參考文獻(xiàn)著錄的目的和作用反映作者的科學(xué)態(tài)度和論文具有廣泛的科學(xué)依據(jù),也反映出論文的起點(diǎn)和深度。區(qū)別作者本人的成果和已有的成果。尊重他人成果,免除抄襲、剽竊嫌疑。索引作用。便于讀者對有關(guān)問題有更深入的了解。節(jié)省論文篇幅。科技情報(bào)人員進(jìn)行研究和文獻(xiàn)計(jì)量學(xué)研究。,2020/5/18,27,參考文獻(xiàn)著錄的原則只著錄最必要、最新的文獻(xiàn)。只著錄公開發(fā)表的文獻(xiàn)。必須按有關(guān)標(biāo)準(zhǔn),采用規(guī)范的著錄格式。*作者應(yīng)保證著錄項(xiàng)目齊全(格式可由編輯統(tǒng)一處理)。*我國科技期刊采用“順序編碼制”。國外有的期刊采用“著者-出版年”制。*按文獻(xiàn)在正文(含前言)中出現(xiàn)的順序編碼,編碼的數(shù)字置于方括號內(nèi)。需讀出的編碼按正常行文編排,不讀出的編碼用上標(biāo)。,2020/5/18,28,11附錄和注釋,一般有關(guān)的注釋、說明都在正文中解決了,因此沒有此2項(xiàng)。如認(rèn)為必須采用,最好與編輯部協(xié)商。,2020/5/18,29,教學(xué)目的,文獻(xiàn)檢索課程是培養(yǎng)學(xué)生的情報(bào)意識,掌握用手工方式和計(jì)算機(jī)方式從文獻(xiàn)中獲取知識和情報(bào)的一門科學(xué)方法課,是提高學(xué)生自學(xué)能力和獨(dú)立研究問題能力的工具課。,2020/5/18,30,教學(xué)要求,本課程的任務(wù)是使學(xué)生了解本專業(yè)及相關(guān)專業(yè)文獻(xiàn)的基本知識,學(xué)會常用手工檢索工具、計(jì)算機(jī)檢索工具的使用方法,懂得如何獲得與利用文獻(xiàn)情報(bào),增強(qiáng)自學(xué)能力和研究能力。初步掌握科技論文的寫作。,2020/5/18,31,教學(xué)參考資料,1陳雅芝等編著,信息檢索,清華大學(xué)出版社,2006年1月2王細(xì)榮,韓玲,張勤編著,文獻(xiàn)信息檢索與論文寫作,上海交通大學(xué)出版社,2006年8月3章云蘭,萬躍華,舒炎祥編著,數(shù)字資源檢索教程,科學(xué)出版社,2006年7月4張海濤等編著,信息檢索,機(jī)械工業(yè)出版社,2006年8月5Internet,2020/5/18,32,學(xué)科領(lǐng)域,信息檢索同時(shí)被情報(bào)科學(xué)領(lǐng)域和計(jì)算機(jī)科學(xué)領(lǐng)域所使用。,信息檢索,2020/5/18,33,內(nèi)容提要原理篇,第一講信息檢索概述第二講信息檢索模型第三講信息檢索系統(tǒng)的結(jié)構(gòu)與評價(jià)第四講文本操作技術(shù)第五講搜索引擎第六講Web檢索技術(shù),2020/5/18,34,內(nèi)容提要應(yīng)用篇,第七講圖書及其檢索第八講學(xué)術(shù)、學(xué)位論文及其檢索第九講會議文獻(xiàn)、科技報(bào)告及其檢索第十講專利及其檢索第十一講三大檢索刊物及其檢索第十二講中國綜合數(shù)據(jù)庫及其檢索第十三講網(wǎng)絡(luò)信息及其檢索第十四、十五講信息檢索實(shí)訓(xùn)第十六講信息檢索的現(xiàn)狀與未來,2020/5/18,35,內(nèi)容提要原理篇,第一講信息檢索概述學(xué)科領(lǐng)域信息檢索的概念信息檢索的意義信息檢索的基本流程信息檢索的基本方法信息檢索的關(guān)鍵技術(shù)信息檢索的應(yīng)用領(lǐng)域,2020/5/18,36,與信息檢索相關(guān)的學(xué)科(1/3),信息檢索是一門多學(xué)科交叉的應(yīng)用技術(shù)學(xué)科。,自然語言處理:自然語言處理是利用計(jì)算機(jī)技術(shù)處理語言信息的科學(xué),其目標(biāo)是讓計(jì)算機(jī)能夠“理解”人類的語言自然語言。對于信息檢索來說,僅僅停留在處理表層文本信息是遠(yuǎn)遠(yuǎn)不夠的,字符層面的匹配與相似度計(jì)算并不能幫助計(jì)算機(jī)理解待檢索文本的“含義”,也不能深入理解用戶的檢索意圖,檢索出的結(jié)果非常有可能偏離用戶的需求。要提高檢索系統(tǒng)自身的智能化水平,以及檢索系統(tǒng)人機(jī)交互界面的自然度,就需要不斷地將自然語言處理結(jié)合到文本信息檢索中來。,分布式計(jì)算:面對巨大的文本數(shù)據(jù)、大量的檢索請求和用戶對于檢索時(shí)間的苛刻要求,信息檢索的效率成為一個(gè)亟待解決的問題,依靠單臺計(jì)算機(jī)不可能完成這樣的任務(wù),必須依靠分布式信息檢索技術(shù)才能解決。事實(shí)上,幾乎所有實(shí)用的大型搜索系統(tǒng)都采用了分布式的體系結(jié)構(gòu)來解決信息檢索中的效率問題。,2020/5/18,37,與信息檢索相關(guān)的學(xué)科(2/3),數(shù)據(jù)庫:數(shù)據(jù)庫和信息檢索儼然一對姐妹。與信息檢索不同,數(shù)據(jù)庫的處理對象是結(jié)構(gòu)化信息。數(shù)據(jù)庫技術(shù)已經(jīng)有比較完備的理論基礎(chǔ),而信息檢索技術(shù)的經(jīng)驗(yàn)性比較強(qiáng),理論基礎(chǔ)相對薄弱,需要進(jìn)一步借鑒數(shù)據(jù)庫中的一些成熟理論。信息檢索中的信息抽取技術(shù)旨在把非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),以數(shù)據(jù)庫形式存放,這樣,一些信息檢索問題就可以轉(zhuǎn)化為數(shù)據(jù)庫查詢問題了。,數(shù)據(jù)挖掘:數(shù)據(jù)挖掘一般是針對數(shù)據(jù)庫進(jìn)行的,借鑒到信息檢索中就成為文本挖掘。面向非結(jié)構(gòu)化數(shù)據(jù)的文本挖掘,將幫助用戶對Internet上龐雜的信息進(jìn)行綜合分析,找出這些信息背后所蘊(yùn)含的規(guī)律和趨勢,找出事情的本質(zhì),提升搜索技術(shù)的內(nèi)涵。此外,對用戶日志進(jìn)行數(shù)據(jù)挖掘能夠從總體上觀察分析用戶的行為,也能夠針對每個(gè)個(gè)體用戶的需求提供個(gè)性化服務(wù)。,2020/5/18,38,與信息檢索相關(guān)的學(xué)科(3/3),情報(bào)學(xué):情報(bào)學(xué)是研究情報(bào)的產(chǎn)生、傳遞、利用規(guī)律和用現(xiàn)代化信息技術(shù)與手段,使情報(bào)流通過程、情報(bào)系統(tǒng)保持最佳效能狀態(tài)的一門科學(xué)。它幫助人們充分利用信息技術(shù)和手段,提高情報(bào)產(chǎn)生、加工、存儲、流通、利用的效率。信息檢索和情報(bào)學(xué)有緊密的歷史淵源,情報(bào)學(xué)的理論對信息檢索系統(tǒng)的設(shè)計(jì)仍有指導(dǎo)意義。,社會學(xué):社會學(xué)研究社會發(fā)展中的現(xiàn)象和規(guī)律。隨著搜索引擎技術(shù)的使用越來越廣泛,社會學(xué)家通過對眾多用戶使用搜索引擎的行為(比如瀏覽了哪些網(wǎng)頁,輸入了哪些查詢詞等)進(jìn)行分析和統(tǒng)計(jì)來研究社會心理和行為的狀態(tài)和趨勢,比如時(shí)尚流行、語言變化、使用習(xí)慣等。,2020/5/18,39,39,內(nèi)容提要,第一講信息檢索概述學(xué)科領(lǐng)域信息檢索的概念信息檢索的意義信息檢索的基本流程信息檢索的基本方法信息檢索的關(guān)鍵技術(shù)信息檢索的應(yīng)用領(lǐng)域,原理篇,2020/5/18,40,第一章信息檢索原理,第一節(jié)信息與信息源第二節(jié)信息檢索原理第三節(jié)檢索工具第四節(jié)信息檢索的方法與程序,2020/5/18,41,第一節(jié)信息與信息源,一、信息概述,信息的含義文獻(xiàn)的定義:以各種技術(shù)手段,把一定的信息內(nèi)容記錄到一定的載體上形成的存儲型傳遞媒介。“文獻(xiàn)”一詞出自于“論語。最初,“文”與“獻(xiàn)”是兩個(gè)詞,“文”,指有關(guān)典章制度的文字資料;“獻(xiàn)”,指多聞熟悉掌故的人。后來融合為一,泛指有史料價(jià)值的文章和圖書。信息的特征,二、信息源,信息的載體形式信息的級別信息級別示意圖信息的出版形式,Return,2020/5/18,42,普遍認(rèn)同的一個(gè)定義信息普遍存在于自然界、人類社會和思維領(lǐng)域中,它是客觀世界中各種事物變化和特征的反映,是客觀事物之間相互作用和聯(lián)系的表征,是客觀事物經(jīng)過感知或認(rèn)識后的再現(xiàn)。信息的特性可識別性。信息是可以識別的,識別又可分為直接認(rèn)別和間接識別,直接認(rèn)別是指通過感官的識別,間接識別是指通過各種測試手段的識別。不同的信息源有不同的識別方法??纱鎯π?。信息是可以通過各種方法存儲的??蓴U(kuò)充性。信息隨著時(shí)間的變化,將不斷擴(kuò)充??蓧嚎s性。人們對信息進(jìn)行加工、整理、概括、歸納就可使之精練,從而濃縮。可傳遞性。信息的可傳遞性是信息的本質(zhì)特征??赊D(zhuǎn)換性。信息可以由一種形態(tài)轉(zhuǎn)換成另一種形態(tài)。特定范圍有效性。信息在特定的范圍內(nèi)是有效的,否則是無效的。,什么是信息,2020/5/18,43,2020/5/18,44,信息資源的類型(2/2),按信息內(nèi)容的保密程度劃分有公開信息源、半公開信息源和非公開信息源。按信息內(nèi)容的應(yīng)用范圍劃分分為科技信息源、經(jīng)濟(jì)信息源、管理信息源及生活信息源。按載體形式劃分印刷型(以紙張為介質(zhì),以鉛印、油印、膠印、復(fù)印等手段記錄信息的載體)、縮微型(以感光材料為介質(zhì),以縮微照相為手段記錄信息的載體)、機(jī)讀型(以磁性材料為載體,通過編碼和程序設(shè)計(jì),由計(jì)算機(jī)輸入和輸出的信息)、聲像型(以電磁材料為載體,借助特殊設(shè)備,直接將聲音和圖像等信息記錄下來的一種動(dòng)態(tài)信息),2020/5/18,45,信息資源的類型(2/2),按信息傳輸形式劃分網(wǎng)絡(luò)信息源(各種網(wǎng)絡(luò)上的信息集合),非網(wǎng)絡(luò)信息源(不用通信設(shè)施就能獲得的信息集合),2020/5/18,46,一、信息檢索的含義二、信息檢索原理信息檢索原理圖三、信息檢索類型,以檢索內(nèi)容劃分以信息存儲和檢索的方式和技術(shù)劃分,四、信息檢索的意義,Return,第二節(jié)信息檢索原理,2020/5/18,47,2020/5/18,48,信息檢索的概念(1/6),信息檢索(InformationRetrieval,IR)是指信息按一定的方式組織起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程和技術(shù)。狹義的信息檢索就是信息檢索過程的后半部分,即從信息集合中找出所需要的信息的過程,也就是我們常說的信息查尋(InformationSearch或InformationSeek)。,2020/5/18,49,信息檢索的概念(1/6),IR不僅僅是查詢,IR系統(tǒng)也不僅僅是搜索引擎。例1:返回與信息檢索相關(guān)的網(wǎng)頁搜索引擎(SearchEngine,SE)例2:毛主席的生日是哪天?問答系統(tǒng)(QuestionAnswering,QA)例3:返回聯(lián)想PC的型號、配置、價(jià)格等信息信息抽取(InformationExtraction,IE)例4:訂閱有關(guān)NBA的新聞信息過濾(InformationFiltering)、信息推薦(InformationRecommending),2020/5/18,50,信息檢索的概念(2/6),也可以這樣說,狹義的IR通常是指InformationSearch,而廣義的IR包含非常多的內(nèi)容(SE,QA,IE,)。用戶需求(UserNeed,UN):用戶需要獲得的信息嚴(yán)格地說,UN只存在于用戶的內(nèi)心,但是通常用文本來描述,如查找與2010世界杯相關(guān)的新聞,有時(shí)也稱為主題(Topic)UN提交給檢索系統(tǒng)時(shí),稱為查詢式(Query)。如2010世界杯,對同一個(gè)UN,不同人不同時(shí)候可以構(gòu)造出不同的Query上述需求還可表示成2010世界杯新聞Query在IR系統(tǒng)中往往還有內(nèi)部表示,2020/5/18,51,信息檢索的概念(3/6),文檔(Document):檢索的對象可以是文本,也可以是圖像、視頻、語音等多媒體文檔,textretrieval/imageretrieval/videoretrieval/speechretrieval/multimediaretrieval可以是無格式、半格式、有格式的文檔集合(Collection):所有待檢索的文檔構(gòu)成的集合也稱為Repository,Corpus,2020/5/18,52,信息檢索的概念(4/6),相關(guān)(relevant、相關(guān)度relevance)相關(guān)取決于用戶的判斷,是一個(gè)主觀概念不同用戶做出的判斷很難保證一致即使是同一用戶在不同時(shí)期、不同環(huán)境下做出的判斷也不盡相同,2020/5/18,53,信息檢索的概念(5/6),定義“相關(guān)性”的兩個(gè)角度系統(tǒng)角度:系統(tǒng)輸出結(jié)果,用戶是信息的接受者。這種理解置用戶于被動(dòng)的地位,基于這種理解,研究的重心落在系統(tǒng)本身。主題相關(guān)性:檢索系統(tǒng)檢出的文檔的主題即核心內(nèi)容與用戶的信息需求相匹配。系統(tǒng)角度相關(guān)并不和用戶脫節(jié)。系統(tǒng)角度定義的相關(guān)簡單可以計(jì)算。用戶角度:觀察用戶對檢索結(jié)果的反應(yīng),是系統(tǒng)輸出向用戶需求的投射。相關(guān)性被認(rèn)為是用戶方面的屬性。用戶角度定義的相關(guān)目前仍然難以計(jì)算?,F(xiàn)代信息檢索研究中仍然主要采用系統(tǒng)角度定義的主題相關(guān)性概念,當(dāng)然也強(qiáng)調(diào)考慮用戶的認(rèn)知因素。,2020/5/18,54,信息檢索的概念(6/6),形式上說,信息檢索中的相關(guān)度是一個(gè)函數(shù)R,輸入是查詢Q、文檔D和文檔集合C,返回的是一個(gè)實(shí)數(shù)值R=f(Q,D,C)信息檢索就是給定一個(gè)查詢Q,從文檔集合C中計(jì)算每篇文檔D與Q的相關(guān)度并排序(Ranking)。相關(guān)度通常只有相對意義,對一個(gè)Q,不同文檔的相關(guān)度可以比較,而對于不同的Q的相關(guān)度不便比較,2020/5/18,55,信息檢索的概念(6/6),相關(guān)度的輸入信息可以更多,比如用戶的背景信息、用戶的查詢歷史等等現(xiàn)代信息檢索中相關(guān)度不是唯一度量,還有重要度、權(quán)威度、新穎度等度量。或者說這些因子都影響“相關(guān)度”。Google中據(jù)說用了上百種排名因子,2020/5/18,56,信息檢索的研究范圍,信息檢索作為一門學(xué)科,有它自己的研究范圍和對象,也有自己的理論、方法和技術(shù)。信息檢索的研究范圍包括一切與信息存儲與檢索有關(guān)的系統(tǒng)、過程、理論和方法。一切可供存儲和檢索利用的信息類型,如文獻(xiàn)、數(shù)據(jù)、事實(shí)、知識、聲音、圖形等;各種信息檢索系統(tǒng)及其運(yùn)行過程,如信息采集、標(biāo)引、組織、存貯、處理、匹配、傳送等各種過程中使用的方法;以及在信息檢索實(shí)踐和研究的基礎(chǔ)上形成的各種理論和假設(shè),均包括在這個(gè)范圍內(nèi)。信息類型側(cè)重于文本。,2020/5/18,57,信息檢索的研究對象(1/3),信息檢索理論主要包括檢索語言與標(biāo)引理論、信息檢索的數(shù)學(xué)模型、知識表示理論、相關(guān)性理論等。信息檢索系統(tǒng)它是實(shí)現(xiàn)信息檢索的物質(zhì)基礎(chǔ),是現(xiàn)實(shí)的研究對象,主要研究它的結(jié)構(gòu)、功能、演變,它的設(shè)計(jì)開發(fā)技術(shù)、管理維護(hù)技術(shù)和評價(jià)技術(shù),還研究它與其他信息系統(tǒng)乃至整個(gè)外部世界的關(guān)系。其中,數(shù)據(jù)庫是信息檢索系統(tǒng)的核心部分之一。數(shù)據(jù)庫的建造和維護(hù)是一類非常重要的信息技術(shù)。數(shù)據(jù)庫的質(zhì)量直接影響信息檢索系統(tǒng)的功能和效率。,2020/5/18,58,信息檢索的研究對象(2/3),計(jì)算機(jī)信息檢索它涉及到許多計(jì)算機(jī)設(shè)備、軟件技術(shù)、存儲技術(shù)、檢索技術(shù)、系統(tǒng)管理和經(jīng)營知識、市場營銷技術(shù)等,是一門綜合性很強(qiáng)的技術(shù)。檢索策略與方法它是用戶從信息檢索系統(tǒng)中獲取有關(guān)信息所必需的。好的檢索策略是檢索成功的必要前提,計(jì)算機(jī)的應(yīng)用為檢索策略和方法的發(fā)展提供了有力的支持。,2020/5/18,59,信息檢索的研究對象(2/3),檢索策略與方法近30年來,涌現(xiàn)了許多新穎而有效的檢索技術(shù)和方法,如布爾檢索、位置檢索、截詞檢索、加權(quán)檢索、聚類檢索、全文檢索、超文本檢索、超媒體檢索、智能檢索、知識檢索等。人們利用、研究、評價(jià)和完善現(xiàn)有的各種檢索策略和方法,研究開發(fā)新的更有效的策略和方法。,2020/5/18,60,信息檢索的研究對象(3/3),用戶研究與培訓(xùn)用戶是信息檢索系統(tǒng)的生命,無論是系統(tǒng)的研制開發(fā)、管理維護(hù)、功能和服務(wù)的擴(kuò)展,還是系統(tǒng)評價(jià),都離不開用戶研究工作。用戶培訓(xùn)是用戶研究的繼續(xù),是與用戶建立緊密聯(lián)系和發(fā)展新用戶的一種非常有效的措施。,2020/5/18,61,第一章文獻(xiàn)信息源,1文獻(xiàn)的特點(diǎn)2文獻(xiàn)的類型3文獻(xiàn)信息服務(wù)系統(tǒng),高洪民,2020/5/18,62,大家的風(fēng)采,李政道教授曾經(jīng)在一次科學(xué)演講的開場白中這樣說道:“到昨天晚上11點(diǎn)30分為止,世界物理學(xué)前沿的發(fā)展情況是這樣的:”。借助現(xiàn)代信息技術(shù),我們也可以做到這一點(diǎn)。,2020/5/18,63,63,內(nèi)容提要,第一講信息檢索概述學(xué)科領(lǐng)域信息檢索的概念信息檢索的意義信息檢索的基本流程信息檢索的基本方法信息檢索的關(guān)鍵技術(shù)信息檢索的應(yīng)用領(lǐng)域,原理篇,2020/5/18,64,信息的表現(xiàn)形式,大多數(shù)信息都是文本形式的,沒有預(yù)先定義的格式。有人統(tǒng)計(jì)認(rèn)為80%的信息是非結(jié)構(gòu)化的什么是“非結(jié)構(gòu)化信息”呢?一篇新聞是一條非結(jié)構(gòu)化信息,新聞中會出現(xiàn)一些人名、地名、機(jī)構(gòu)名稱等實(shí)體,以及這些實(shí)體之間的關(guān)系(比如某人是某地區(qū)某機(jī)關(guān)的負(fù)責(zé)人),還有這些實(shí)體相關(guān)的事件(比如某人訪問了某地)。但是這些人、事、物、關(guān)系和事件并不像關(guān)系數(shù)據(jù)庫的二維表中存放的信息那樣,被精確地分割并嚴(yán)格地存放在合適的字段或記錄中。這種在現(xiàn)實(shí)世界中自然存在的模糊而帶有歧義且沒有經(jīng)過規(guī)格化的信息被稱為“非結(jié)構(gòu)化的”信息。非結(jié)構(gòu)化信息的類型:文本信息(網(wǎng)頁,郵件,博客,論壇上的帖子,聊天記錄,短信等)及圖像、圖形、語音、視頻等多媒體信息。,2020/5/18,65,網(wǎng)絡(luò)信息的發(fā)展趨勢,大量的數(shù)據(jù)(非結(jié)構(gòu)化)向IR技術(shù)提出挑戰(zhàn)以前認(rèn)為幾百兆的數(shù)據(jù)就是大數(shù)據(jù)集,現(xiàn)在一個(gè)單獨(dú)的數(shù)據(jù)庫就能夠處理10-50G以上的數(shù)據(jù),全球網(wǎng)頁服務(wù)器數(shù)(1996.12010.4),2020/5/18,66,中國互聯(lián)網(wǎng)發(fā)展趨勢(1/3),截至2010年6月,總體網(wǎng)民規(guī)模達(dá)到4.2億,突破了4億關(guān)口。,2020/5/18,67,中國互聯(lián)網(wǎng)發(fā)展趨勢(2/3),自2002年1.6億個(gè)網(wǎng)頁開始,中國的網(wǎng)頁規(guī)模一直保持高速增長,2009年網(wǎng)頁數(shù)達(dá)到336億個(gè)。,2020/5/18,68,中國互聯(lián)網(wǎng)發(fā)展趨勢(3/3),中國分類域名數(shù)(截止2010年7月),2020/5/18,69,信息過載,“全世界每年產(chǎn)生1到2EB信息,相當(dāng)于地球上每個(gè)人大概產(chǎn)生250MB信息。其中紙質(zhì)信息僅占所有信息的0.03%.”(Lyman能夠識別多種類型與格式的潛在信息源;知道獲取信息的費(fèi)用以及產(chǎn)生的效益;具備對所需信息內(nèi)容與范圍進(jìn)行重新評價(jià)的能力。標(biāo)準(zhǔn)2,高效地獲取所需信息。具體指標(biāo)包括:選擇合適的調(diào)查方法或信息檢索系統(tǒng),以獲取所需信息;構(gòu)建與實(shí)施有效的檢索策略;利用聯(lián)機(jī)檢索終端或親自使用一組方法檢索所需信息;必要時(shí)改進(jìn)檢索策略;獲取、記錄、管理信息與信息源。,2020/5/18,79,標(biāo)準(zhǔn)3,能客觀、審慎地評估信息與信息源,并將其納入信息庫與評價(jià)系統(tǒng)。具體指標(biāo)包括:具有從獲取信息中提煉信息主題的能力;為評估信息與信息源形成最初的標(biāo)準(zhǔn);復(fù)合主題概念以形成新的概念;能通過對新舊的知識的比較而確定信息的增加值;能確定新的知識對個(gè)人價(jià)值體系的影響,并使其融合于個(gè)人的價(jià)值體系中;能通過與個(gè)人、領(lǐng)域?qū)<壹捌渌藛T的交流,對信息的理解與解釋的有效性加以判斷;決定是否有必要修訂初始的查詢。標(biāo)準(zhǔn)4,個(gè)人或作為群體的一員能有效地利用信息以完成特定的任務(wù)。具體指標(biāo)包括:能夠利用各種可獲得的信息以完成計(jì)劃,以及產(chǎn)生特定的信息產(chǎn)品或成果;修訂產(chǎn)生信息產(chǎn)品或成果的過程;有效地將信息產(chǎn)品、成果與他人交流。,2020/5/18,80,標(biāo)準(zhǔn)5,理解有關(guān)信息使用的經(jīng)濟(jì)、法律以及社會因素,獲取與使用信息要符合道德與法律規(guī)范。具體指標(biāo)包括:了解信息與信息技術(shù)使用的相關(guān)法律、道德倫理以及社會經(jīng)濟(jì)問題;在存取、使用信息資源時(shí)能夠遵守法律、法規(guī)、信息資源提供的規(guī)定以及約定俗成的一些規(guī)則;對引用的成果表示致謝。以上的信息素質(zhì)評價(jià)標(biāo)準(zhǔn),涵蓋了信息意識、信息能力與信息道德三個(gè)方面的內(nèi)容,有較強(qiáng)的可操作性,可以作為我們進(jìn)行研究生信息素質(zhì)教育的參考和借鑒。,2020/5/18,81,本課程學(xué)習(xí)目的,培養(yǎng)和強(qiáng)化學(xué)生的信息素養(yǎng),即信息意識、信息技能和信息道德。八個(gè)方面的信息能力(1)運(yùn)用信息工具的能力(2)獲取信息工具的能力(3)處理信息的能力(4)創(chuàng)造信息的能力(5)表達(dá)信息的能力(6)發(fā)揮信息作用的能力(7)信息協(xié)作意識與能力(8)信息免疫能力,2020/5/18,82,課程學(xué)習(xí)內(nèi)容文獻(xiàn)和信息檢索基礎(chǔ)知識計(jì)算機(jī)信息檢索知識中外文網(wǎng)絡(luò)數(shù)據(jù)庫的使用因特網(wǎng)上信息資源特征及檢索利用特種文獻(xiàn)數(shù)據(jù)庫的檢索利用工具書的使用原始文獻(xiàn)的獲取文獻(xiàn)信息綜合利用與論文寫作。,2020/5/18,83,參考書:1.徐慶寧等.信息檢索與利用.上海:華東理工大學(xué)出版社,2006,2020/5/18,84,2020/5/18,85,3.符紹宏等.因特網(wǎng)信息資源檢索與利用.北京:清華大學(xué)出版社,2002,2020/5/18,86,2020/5/18,87,成績評定辦法:1.上課考勤占10%2.檢索作業(yè)占40%3.檢索報(bào)告和文獻(xiàn)綜述占50%,實(shí)習(xí)課:自行解決圖書館,教室,宿舍,2020/5/18,88,第一章信息檢索緒論,第一節(jié)信息素質(zhì)與信息利用第二節(jié)基本概念第三節(jié)信息資源的類型和特點(diǎn)第四節(jié)信息資源評價(jià),2020/5/18,89,第一節(jié)信息素質(zhì)與信息利用,一、信息素質(zhì)二、信息檢索與利用教學(xué)內(nèi)容三、信息素質(zhì)、信息檢索與利用的意義,2020/5/18,90,一、信息素質(zhì),關(guān)于信息素質(zhì)的研究是從20世紀(jì)70年代開始的,對信息素質(zhì)的認(rèn)識經(jīng)歷了一個(gè)漸進(jìn)的過程,信息素質(zhì)可以概括為個(gè)體在現(xiàn)實(shí)需求的驅(qū)動(dòng)下,能有效地發(fā)現(xiàn)、獲取、評價(jià)和利用信息。它包含四個(gè)層面的含義:第一,用戶有一定的信息需求,即在某個(gè)時(shí)候需要了解某方面信息。第二,掌握了主要的信息源和信息工具的知識及技能。第三,能夠分析評價(jià)選擇相關(guān)信息。第四,利用信息的目的是為了有效地解決具體問題。信息素質(zhì)主要表現(xiàn)為信息理論素養(yǎng)和信息的實(shí)踐能力,包括信息意識、信息知識、信息能力和信息道德等內(nèi)容。,2020/5/18,91,(一)信息意識,所謂信息意識,簡單地說,是人們利用信息系統(tǒng)獲取所需信息的內(nèi)在動(dòng)因,具體表現(xiàn)為對信息的敏感性、選擇能力和消化吸收能力。有無信息意識決定著人們捕捉、判斷和利用信息的自覺程度。而信息意識的強(qiáng)烈與否對能否挖掘出有價(jià)值的信息、對文獻(xiàn)獲取能力的提高起著關(guān)鍵的作用。同樣重要的信息,有的人善于抓住,有的人卻漠然視之。這是由于各人的信息意識強(qiáng)弱不同。信息技能的掌握在很大程度上取決于信息意識的提高。,2020/5/18,92,(二)信息知識,是關(guān)于信息的特點(diǎn)、性質(zhì)、運(yùn)動(dòng)規(guī)律、信息方法與技術(shù)、信息系統(tǒng)的有關(guān)知識。其中信息方法是指如何以信息的觀點(diǎn)來分析和解決人們在工作和生活中遇到的問題的方法,把無序而良莠不齊的信息轉(zhuǎn)化為有效信息加以利用,創(chuàng)造出新的價(jià)值。信息技術(shù)是關(guān)于信息提取、檢測、處理、轉(zhuǎn)換、傳遞、控制等技術(shù),如計(jì)算機(jī)技術(shù)、數(shù)據(jù)庫技術(shù)、通信技術(shù)、網(wǎng)絡(luò)技術(shù)等。,2020/5/18,93,(三)信息能力,大學(xué)期間,信息能力具體表現(xiàn)為以下6種能力:明確任務(wù)(TaskDefinition):了解問題的癥結(jié),確定所需信息和目的,分清任務(wù)的輕重緩急;信息查詢策略(InformationSeekingStrategies):了解各種信息源,能夠作出評價(jià)并確定優(yōu)先查找的次序;查找和檢索(LocationandAccess):確定信息藏址,從信息源中找出信息;信息利用(UseofInformation):能夠讀懂(或聽懂、理解)查出的信息,了解信息在滿足需求中的特定價(jià)值;信息綜合(Synthesis):能夠組織信息,提供信息產(chǎn)品(論文、報(bào)告等);信息評價(jià)(Evaluation):評價(jià)查找結(jié)果和解決問題的過程(效率)。,2020/5/18,94,(四)信息道德,是指在信息活動(dòng)中調(diào)節(jié)和控制信息生產(chǎn)者、信息服務(wù)者、信息利用者及其相互關(guān)系、倫理道德和行為規(guī)范的總和。具體有遵守國家有關(guān)信息的法律法規(guī)、不制作不傳播不利用違反國家政策的信息和不健康信息、不制作不傳播虛假信息、不侵犯知識產(chǎn)權(quán)、不利用信息技術(shù)謀取不正當(dāng)利益和從事違法活動(dòng)等。在日趨繁雜的信息環(huán)境中,自覺而良好的信息道德,是信息素質(zhì)中不可忽略的一部分。在信息素質(zhì)四個(gè)方面的內(nèi)容中,信息意識是前提,信息知識是基礎(chǔ),信息能力是核心,信息道德是準(zhǔn)則,它們的有機(jī)結(jié)合構(gòu)成信息素質(zhì)整體。,2020/5/18,95,二、信息檢索與利用課的教學(xué)內(nèi)容,信息檢索與利用是大學(xué)生信息素質(zhì)教育課程體系中一門最重要基礎(chǔ)課,它圍繞相關(guān)信息的科學(xué)查詢及利用這個(gè)核心,介紹信息檢索與利用的基本概念、基本理論和基本方法、并結(jié)合各學(xué)科的實(shí)際問題講解和剖析了檢索、分析、評價(jià)和利用。通過學(xué)習(xí)能使學(xué)生具備最基本的信息素質(zhì)。,2020/5/18,96,三、信息素質(zhì)、信息檢索與利用的意義,世界上的文獻(xiàn)信息已經(jīng)匯集成一個(gè)巨大的知識寶庫,其數(shù)量龐大、增長迅速、類型繁多、文種多樣、新陳代謝頻繁。信息檢索是幫助人們打開知識寶庫的鑰匙,是開發(fā)人類智力資源的有效手段。面對人類浩瀚的知識海洋,只有具有良好的信息素質(zhì),才能迅速而全面地獲得所需的信息,并通過各種處理而有效地利用信息。切實(shí)地掌握并有效地利用各種信息資源,不但可以更新知識、開拓視野、啟迪思維、激發(fā)創(chuàng)造力,而且可以增強(qiáng)競爭力,提高各種效益。,2020/5/18,97,1信息素質(zhì)與綜合素質(zhì)的關(guān)系信息素質(zhì)是綜合素質(zhì)的重要組成因素,二者相輔相成,良好的信息素質(zhì)可以極大地提高綜合素質(zhì),而良好的綜合素質(zhì)也直接影響信息素質(zhì)的提高。,2020/5/18,98,2信息素質(zhì)與學(xué)習(xí)、創(chuàng)新能力沒有知識就不能創(chuàng)新這是大家的共識。而人們的知識一方面來自自己對客觀世界的觀察與認(rèn)識,另一方面則來自對其他個(gè)體(包括前人)的吸收與繼承。人們的知識創(chuàng)新與技術(shù)創(chuàng)新需要大量的有關(guān)信息。今天的世界并不缺乏創(chuàng)新所需的信息,而在于知識的存貯過于龐大和無序,信息存貯的無序化以及過多的老化信息和偽信息加劇了“信息污染”的程度。今天的社會沒有良好的信息素質(zhì)是很難全面、系統(tǒng)、及時(shí)地掌握創(chuàng)新所需的信息的??梢赃@樣的認(rèn)為,信息素質(zhì)是學(xué)習(xí)、創(chuàng)新能力的重要因素,良好的學(xué)習(xí)、創(chuàng)新能力依賴于優(yōu)秀的信息素質(zhì)。,2020/5/18,99,3.信息利用與事業(yè)進(jìn)步,信息是生命、是財(cái)富、是力量、是事業(yè)核心競爭力的重要組成因素。具體體現(xiàn)在以下幾個(gè)方面:1不斷更新知識,增強(qiáng)生存能力2節(jié)省時(shí)間,提高效率3避免重復(fù)研究和勞動(dòng)、防止浪費(fèi)。4幫助制定高明謀略5有助于人們占領(lǐng)科技制高點(diǎn)。,2020/5/18,100,第二節(jié)基本概念,一、信息二、知識三、情報(bào)四、文獻(xiàn)五、信息資源,2020/5/18,101,2020/5/18,102,2020/5/18,103,2020/5/18,104,十大文獻(xiàn)信息資源科技圖書科技期刊特種文獻(xiàn)(科技報(bào)告政府出版物會議文獻(xiàn)標(biāo)準(zhǔn)文獻(xiàn)專利文獻(xiàn)科技檔案學(xué)位論文產(chǎn)品樣本),本章學(xué)習(xí)要點(diǎn):信息檢索一四十,2020/5/18,105,一、信息,信息,最初的含義是指音信和消息,南唐李中暮春懷故人詩“夢斷美人沉信息,目穿長路倚樓臺”及宋代陳亮梅花詩“欲傳春信息,不怕雪埋藏”中的信息就是這個(gè)概念。隨著社會的進(jìn)步和科技的發(fā)展,信息遠(yuǎn)遠(yuǎn)超出了原先的含義,是指通過各種手段傳遞的一切符號,它已經(jīng)成為我們使用頻率最高的詞匯之一。,2020/5/18,106,信息(information)一詞在日常生活中,常被人們理解為以口頭、書面或其他方式傳遞的消息。就信息的基本內(nèi)涵來講,信息是自然界、人類社會以及思維活動(dòng)中普遍存在的現(xiàn)象,是一切事物的存在方式和運(yùn)動(dòng)狀態(tài)的表達(dá)。信息不是物質(zhì)本身,而是物質(zhì)的一種基本屬性。信息與客觀事物一樣,無處不在,無時(shí)不在。該課所指的信息,是指經(jīng)過采集、處理、記錄并以可檢索的形式存儲的數(shù)據(jù),屬于信息資源管理學(xué)范疇對信息的描述。人類認(rèn)識世界的過程,實(shí)際上就是不斷從外界獲取信息、加工信息和傳遞信息的過程。在當(dāng)今信息社會中,競爭性信息已成為企業(yè)的第四競爭力。,2020/5/18,107,信息概述,2020/5/18,108,信息的結(jié)構(gòu),精煉的知識,記錄下來的知識,對信息的理解與認(rèn)識,有組織的數(shù)據(jù),信息的原材料,智慧,文獻(xiàn),知識,信息,數(shù)據(jù),客觀事物本身的運(yùn)動(dòng),2020/5/18,109,信息,數(shù)據(jù),客觀事物的運(yùn)動(dòng),客觀事物的運(yùn)動(dòng),2020/5/18,110,信息、知識與文獻(xiàn),數(shù)據(jù):是對客觀事物本身運(yùn)動(dòng)的記錄,是信息的原材料。信息:是有組織的數(shù)據(jù),是對數(shù)據(jù)整理提煉出來的消息,是知識得以形成和傳播的中介,而不是知識本身。知識:是對信息的理解與認(rèn)識。知識是經(jīng)過精心研究、領(lǐng)會后的有用信息,是人類對信息加工處理后的產(chǎn)物。獲得知識有賴于獲得信息;,2020/5/18,111,信息、知識與文獻(xiàn),傳遞運(yùn)用后,2020/5/18,112,二、知識,知識(knowledge)是人類社會實(shí)踐的總結(jié),是人類通過信息對自然界、人類社會以及思維方式與運(yùn)動(dòng)規(guī)律的認(rèn)識和掌握,是人腦通過思維重新組合的系統(tǒng)化的信息集合。信息通過人腦的接收、選擇、整理和提煉等過程,形成各種各樣的知識。知識的產(chǎn)生離不開信息和信息傳遞,它是信息的一個(gè)重要組成部分。,2020/5/18,113,第一節(jié)四次文獻(xiàn)和十大文獻(xiàn)信息源,2020/5/18,114,2020/5/18,115,2020/5/18,116,2020/5/18,117,2020/5/18,118,1.信息、知識、情報(bào)和文獻(xiàn)的關(guān)系;2.科技文獻(xiàn)的分類(加工深度,補(bǔ)充:出版形式,符號如ISBN);,2020/5/18,119,信息是事物屬性的再現(xiàn)。信息不是事物本身,而是由事物發(fā)出的消息、指令、數(shù)據(jù)等所包及的內(nèi)容。,2020/5/18,120,普遍性多樣性時(shí)效性傳遞性共享性,2020/5/18,121,情報(bào)是指人們在一定時(shí)間內(nèi)為一定目的而傳遞的有使用價(jià)值的知識或信息。,2020/5/18,122,文獻(xiàn)是記錄有知識的一切載體。,知識,載體,記錄,文獻(xiàn)基本要素,2020/5/18,123,信息是產(chǎn)生知識的基礎(chǔ),知識是信息核心,情報(bào)是被激活的知識,知識記錄在一定形式的載體上即為文獻(xiàn)。,2020/5/18,124,2020/5/18,125,2020/5/18,126,2020/5/18,127,2020/5/18,128,2020/5/18,129,2020/5/18,130,2020/5/18,131,2020/5/18,132,2020/5/18,133,2020/5/18,134,2020/5/18,135,2020/5/18,136,2020/5/18,137,2020/5/18,138,2020/5/18,139,2020/5/18,140,2020/5/18,141,2020/5/18,142,2020/5/18,143,2020/5/18,144,2020/5/18,145,2020/5/18,146,2020/5/18,147,2020/5/18,148,2020/5/18,149,零次文獻(xiàn)按對文獻(xiàn)一次文獻(xiàn)信息內(nèi)容二次文獻(xiàn)加工深淺三次文獻(xiàn)科技圖書按文獻(xiàn)的科技期刊出版形式特種文獻(xiàn)劃分,四次文獻(xiàn),十大文獻(xiàn)信息源,2020/5/18,150,文獻(xiàn)信息,零次文獻(xiàn):普通網(wǎng)頁,電子郵件等一次文獻(xiàn):正式在期刊上發(fā)表的論文等二次文獻(xiàn):數(shù)據(jù)庫中的題錄、目錄等三次文獻(xiàn):文獻(xiàn)綜述、進(jìn)展報(bào)告等,2020/5/18,151,2020/5/18,152,2020/5/18,153,2020/5/18,154,零次文獻(xiàn),指未經(jīng)公開發(fā)表或未交流的文獻(xiàn)。如實(shí)驗(yàn)記錄、文章草稿、私人日記、筆記、書信、設(shè)計(jì)草圖、內(nèi)部報(bào)告、技術(shù)檔案等。,2020/5/18,155,2020/5/18,156,2020/5/18,157,零次文獻(xiàn)的特點(diǎn),數(shù)量多,內(nèi)容新,更具有啟發(fā)性;信息反饋迅速、及時(shí)、準(zhǔn)確;具有高度選擇性和針對性;有限性和不可靠性,要特別提防虛假信息。例如:清華女生朱令的鉈中毒病因確診,就是應(yīng)用零次文獻(xiàn)成功的范例。,2020/5/18,158,2020/5/18,159,(2)一次文獻(xiàn)(PrimaryDocument),2020/5/18,160,2020/5/18,161,2020/5/18,162,2020/5/18,163,2020/5/18,164,2020/5/18,165,一次文獻(xiàn)的特點(diǎn),內(nèi)容比較具體、豐富,具有新穎性、創(chuàng)造性、系統(tǒng)性等特點(diǎn);經(jīng)過權(quán)威機(jī)構(gòu)篩選,科學(xué)性基本有保證;可以回溯檢索,不像新聞那樣有時(shí)效性;由于數(shù)量巨大,往往檢索困難。一般都是首先檢索二次文獻(xiàn)后,再去查閱一次文獻(xiàn)。另外網(wǎng)上一次文獻(xiàn)資源相對較少。,2020/5/18,166,確定一篇文獻(xiàn)是否為一次文獻(xiàn),應(yīng)根據(jù)文獻(xiàn)的內(nèi)容,而不是其形式。如,在科技期刊上發(fā)表的論文,很有可能是三次文獻(xiàn)。一次文獻(xiàn)是文獻(xiàn)的主體,是最基本的情報(bào)源,是文獻(xiàn)檢索最終查找的對象。,一次文獻(xiàn)(Primarydocument),2020/5/18,167,2020/5/18,168,2020/5/18,169,(3)二次文獻(xiàn)(SecondaryDocument),2020/5/18,170,2020/5/18,171,2020/5/18,172,什么是目錄?,目錄是指對產(chǎn)品或圖書的簡要介紹。當(dāng)然,也可以是對一本書內(nèi)容的簡要描述。世界上第一個(gè)目錄誕生于15世紀(jì)的歐洲,是一個(gè)關(guān)于書籍的目錄。在美國,本富蘭克林(BenFranklin)于1744年印制了美國第一份目錄,其中列出了數(shù)百本圖書。,2020/5/18,173,什么是題錄?,題錄是二次文獻(xiàn)中的一種,通俗地說,是指文獻(xiàn)工作者對大量的原始文獻(xiàn)的題名、作者及刊登(發(fā)表)的處所進(jìn)行著錄,并有序排列供人們了解查找原始文獻(xiàn)的一種工具。實(shí)際上,題錄就是計(jì)算機(jī)數(shù)據(jù)庫中的一條條記錄。,2020/5/18,174,按中圖法著錄的圖書在版編目,2020/5/18,175,2020/5/18,176,清華庫中的期刊論文題錄格式,2020/5/18,177,什么是索引?,索引是將圖書、報(bào)刊等文獻(xiàn)資料中具有檢索意義的信息,如字詞、語句、主題、人名、地名、物名、書名、篇名、名詞術(shù)語、引用文獻(xiàn)名等,分類摘錄,標(biāo)明出處,頁碼,并按照一定次序加以編排,指引讀者據(jù)此查尋原始文獻(xiàn)的檢索工具。索引的印刷型載體是一本書或期刊,電子型載體則是索引數(shù)據(jù)庫。搜索引擎之所以能實(shí)現(xiàn)快速檢索,就是靠索引數(shù)據(jù)庫的支持。,2020/5/18,178,清華庫中關(guān)于Flash的索引,2020/5/18,179,清華庫中某篇文獻(xiàn)的題錄,2020/5/18,180,什么是文摘?,文摘(abstract),又分為報(bào)道性文摘、指示性文摘、報(bào)道指示性文摘、評述性文摘、模塊式文摘、專用文摘等幾種,它是指對一份文獻(xiàn)(或稱一個(gè)文獻(xiàn)單元)的內(nèi)容所做的簡略、準(zhǔn)確的描述。這種二次文獻(xiàn)意義上的文摘,是索引形式的發(fā)展。,2020/5/18,181,清華庫中某篇文獻(xiàn)的文摘,2020/5/18,182,該文獻(xiàn)的原文?次文獻(xiàn),2020/5/18,183,二次文獻(xiàn)的特點(diǎn),具有濃縮性、匯集性、有序性等特點(diǎn),檢索方便,網(wǎng)上二次文獻(xiàn)資源豐富;除網(wǎng)上圖書館目錄可以免費(fèi)獲取外,大型國際聯(lián)機(jī)數(shù)據(jù)庫的檢索一般均須付費(fèi);受加工和出版周期的影響,一般二次文獻(xiàn)比一次文獻(xiàn)要晚幾個(gè)月甚至一年。,2020/5/18,184,2020/5/18,185,三次文獻(xiàn)(Tertiarydocument),利用二次文獻(xiàn)系統(tǒng)地檢索出一批有關(guān)的文獻(xiàn),對其內(nèi)容進(jìn)行比較分析,綜合述評而編撰的文獻(xiàn)。,2020/5/18,186,2020/5/18,187,2020/5/18,188,2020/5/18,189,2020/5/18,190,2020/5/18,191,2020/5/18,192,按文獻(xiàn)的加工深度分,二次文獻(xiàn),一次文獻(xiàn),三次文獻(xiàn),零次文獻(xiàn),2020/5/18,193,一次文獻(xiàn)是檢索的對象(目標(biāo))二次文獻(xiàn)是檢索的工具(手段)三次文獻(xiàn)是情報(bào)研究的成果(檢索目標(biāo)+檢索手段),從檢索的角度來看:,2020/5/18,194,一次文獻(xiàn)是對知識的第一次加工(創(chuàng)造性)二次文獻(xiàn)是對知識的第二次加工(有序化)三次文獻(xiàn)是對知識的再加工(有序化+創(chuàng)造性),從知識加工角度來看:,2020/5/18,195,零次文獻(xiàn)按對文獻(xiàn)一次文獻(xiàn)信息內(nèi)容二次文獻(xiàn)加工深淺三次文獻(xiàn)科技圖書按文獻(xiàn)的科技期刊出版形式特種文獻(xiàn)劃分,四次文獻(xiàn),十大文獻(xiàn)信息源,2020/5/1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論