信息資源管理 課件 第5、6章 信息組織、信息分析_第1頁
信息資源管理 課件 第5、6章 信息組織、信息分析_第2頁
信息資源管理 課件 第5、6章 信息組織、信息分析_第3頁
信息資源管理 課件 第5、6章 信息組織、信息分析_第4頁
信息資源管理 課件 第5、6章 信息組織、信息分析_第5頁
已閱讀5頁,還剩163頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第五章信息組織《信息資源管理》目錄content2知識(shí)組織0505信息組織概述0101信息資源組織的前沿與發(fā)展0606文獻(xiàn)資源信息組織0202信息描述與組織方法0303網(wǎng)絡(luò)資源信息組織04045.1信息組織概述3信息組織概念014

信息組織:即信息序化或信息整序,是指在借助科學(xué)的規(guī)則、方法或技術(shù)描述和揭示信息的外部特征和內(nèi)部特征的基礎(chǔ)上,按照既定的參數(shù)、序列或公式對信息進(jìn)行排列,實(shí)現(xiàn)無序信息流向有序信息流的轉(zhuǎn)換。信息描述:信息特征的揭示;【描述】信息組織:特征關(guān)聯(lián)與組織邏輯;【科學(xué)的規(guī)則和方法】

信息檢索:用戶信息需求與信息描述匹配;【選擇】

信息利用:信息獲取、信息理解與信息使用。【充分利用】信息組織對象025

圖書、期刊、檔案與報(bào)刊等文獻(xiàn)信息資源電子記錄、數(shù)據(jù)庫等信息資源網(wǎng)絡(luò)信息資源語義化與知識(shí)化的信息資源哪些信息需要組織?——有用的信息資源UGC、機(jī)器生成數(shù)據(jù)等新興信息資源信息組織步驟036信息組織的步驟信息選擇信息分析信息描述與揭示信息存儲(chǔ)從已經(jīng)采集到的無序化信息集合中篩選出有用信息遵循特定的邏輯關(guān)系,從語義、語法、語用等不同層面細(xì)化、挖掘、加工被選擇的有用信息的外部特征以及內(nèi)部特征,最終進(jìn)行整理歸類根據(jù)信息組織和檢索的需求,對信息資源的形式表征、物質(zhì)形態(tài)等外部特征,主題內(nèi)容、觀點(diǎn)內(nèi)容等內(nèi)容特征進(jìn)行細(xì)化描述、全面記錄的活動(dòng)對經(jīng)過描述與揭示后的信息按照一定的格式與順序進(jìn)行科學(xué)有序的存放、保管于特定的載體中,以便查找、定位和檢索信息的過程5.2文獻(xiàn)資源信息組織7文獻(xiàn)編目的歷史緣起0181841年大英博物院圖書館的館長Panizzi帶領(lǐng)專門委員會(huì)經(jīng)過幾年努力,正式出版了《大英博物院印本圖書著錄規(guī)則》,即著名的《91rules》,被稱為世界編目史上的“大憲章”,是世界編目史上的開端。從分類目錄到著者字順目錄:讀者習(xí)慣、檢索功能、分類錯(cuò)誤與編目任務(wù)的困難性;如果作者有重名,或者作者很多作品,或者讀者需要確定目錄中的主題?——帶主題索引的著者字順目錄(indexofmatters)從16到91:1841年7月出版《Theninety-onerules》;查檢式目錄與描述性目錄之辯;書目單元(bibliographicunit)與文獻(xiàn)單元(literacyunit)AnthonyPanizzi(1797-1879)文獻(xiàn)編目的思想改革0291876年美國編目學(xué)家Cutter與《印刷本字典式目錄規(guī)則》圖書館編目三原則:使一個(gè)讀者能通過一定途徑去找到一本書:A.作者B.題名C.主題。通過一定途徑呈現(xiàn)圖書館的總體資源特征:A.一個(gè)特定的作者的書有哪些?B.一個(gè)特定主題的書有哪些?C.一個(gè)特定體裁的書有哪些?在選擇一本書時(shí)提供幫助:A.當(dāng)從版本選擇時(shí);B.當(dāng)從體裁或論題等其它特征選擇時(shí)。CharlesAmmiCutter(1837-1903)文獻(xiàn)編目的思想改革0210奧斯本的《編目的危機(jī)》(1)盛行條文主義(legalistic)、完美主義(perfectionism)和書目主義(bibliographicalcataloging)三種編目之風(fēng),編目規(guī)則過于復(fù)雜,款目重復(fù)。(2)國會(huì)圖書館的待編書籍大量積壓,形成了編目規(guī)則越來越細(xì),書籍積壓越來越嚴(yán)重。AndrewDelbridgeOsborn1902-1997實(shí)用主義(pragmatic)編目原則:簡化編目規(guī)則,充分尊重編目員的判斷力和處理問題的能力,靈活地運(yùn)用規(guī)則;針對不同的圖書館類型,制定不同的編目標(biāo)準(zhǔn);編目規(guī)則應(yīng)該盡量少且簡單,盡量體現(xiàn)一些通用規(guī)則①。①GallaghurHM.Dr.Osborn’s1941“TheCrisisinCataloguing”[J].CataloguingandClassificationQuarterly,1991(3/4):3-33.文獻(xiàn)編目的思想改革0211柳別斯基(Lubetzky)《編目規(guī)則與原則》①該報(bào)告是西方近現(xiàn)代編目史上最重要理論著作之一,對制定規(guī)范化的編目條例具有積極深遠(yuǎn)的指導(dǎo)意義,同時(shí)也促成了1961年巴黎國際編目原則會(huì)議的召開。文獻(xiàn)組織兩原則:易于確定特定出版物的館藏位置。目錄應(yīng)該能夠集中和顯示圖書館收藏的同一作品的相關(guān)版本和同一著者的不同作品。①LubetzkyS.Cataloguingrulesandprinciples:acritiqueoftheA.L.A.rulesforentryandaproposeddesignfortheirrevision[M].Washington:ProcessingDepartment,LibraryofCongress,1953.SeymourLubetzky(1898-2003)文獻(xiàn)編目的類型0312自動(dòng)化編目從20世紀(jì)60年代開始,圖書館領(lǐng)域開始借助計(jì)算機(jī)自動(dòng)加工和管理文獻(xiàn)目錄,機(jī)讀目錄便是自動(dòng)化編目的產(chǎn)物。機(jī)讀目錄中影響最大的是MARC(MachineReadableCatalogue),中文翻譯為“機(jī)器可讀目錄”,是一種以特定字段結(jié)構(gòu)存儲(chǔ)在計(jì)算機(jī)等機(jī)器載體上的、可以被計(jì)算機(jī)識(shí)別與閱讀的目錄。作為一種數(shù)據(jù)格式標(biāo)準(zhǔn),MARC定義的字段數(shù)量多、可檢索、可共享、可復(fù)用,具有強(qiáng)大的擴(kuò)充修改功能,充分展現(xiàn)了書目數(shù)據(jù)在描述文獻(xiàn)形式特征及內(nèi)容特征、檢索信息等方面的作用。因此,MARC是一種非常高效的編目方式。此后,多種基于MARC的機(jī)讀目錄形式相繼被開發(fā),并被廣泛應(yīng)用于當(dāng)前的文獻(xiàn)目錄控制。文獻(xiàn)編目的類型0313機(jī)讀目錄發(fā)展史1965年,美國國會(huì)圖書館開始研制業(yè)務(wù)工作采用電子計(jì)算機(jī)的可能性。1966年4月,美國國會(huì)圖書館設(shè)計(jì)出世界上第一個(gè)機(jī)讀目錄格式MARCI。1969年美國開始向全國發(fā)行MARCII格式書目磁帶,最初稱為LCMARC,1983年改為稱為US-MARC,即美國機(jī)器目錄。1991年,美國圖書館協(xié)會(huì)接受格式一體化建議,對USMARC進(jìn)行一體化。1998年至2000年,一體化的USMARC更名為MARC21。文獻(xiàn)編目的類型0314聯(lián)合編目聯(lián)合編目指各個(gè)文獻(xiàn)信息機(jī)構(gòu)出于自愿,通過相關(guān)協(xié)議建立書目信息交換關(guān)系,并在遵循統(tǒng)一的編目條例與工作規(guī)程的基礎(chǔ)上,分擔(dān)編目任務(wù)、共享編目成果的編目方式聯(lián)合編目是一項(xiàng)長期的工作,需要各級各類圖書館的廣泛支持聯(lián)合編目能夠打破空間壁壘,實(shí)現(xiàn)資源一體化,具有降低編目成本,提高編目質(zhì)量,避免重復(fù)建設(shè),推進(jìn)共建共享等優(yōu)勢典型的聯(lián)合編目項(xiàng)目有聯(lián)機(jī)公共目錄檢索系統(tǒng)(OnlinePublicAccessCatalog,OPAC)、聯(lián)機(jī)計(jì)算機(jī)圖書館中心(OnlineComputerLibraryCenter,OCLC)的WorldCat和UNIMARC(IMP)等等文獻(xiàn)編目的類型0315中國機(jī)讀目錄(ChinaMachineReadableCatalogue,CNMARC)共有10個(gè)字段區(qū)間,每個(gè)區(qū)間有若干個(gè)字段,每個(gè)字段用三位數(shù)字表示:①標(biāo)識(shí)塊(0--)——標(biāo)識(shí)記錄和作品的標(biāo)識(shí)號②編碼信息塊(1--)——描述作品各方面特征的定長數(shù)據(jù)元素③著錄塊(2--)——《文獻(xiàn)著錄總則》規(guī)定的除附注項(xiàng)和標(biāo)準(zhǔn)號以外的全部著錄項(xiàng)④附注塊(3--)——對作品的文字說明⑤連接款目塊(4--)——以數(shù)字和文字形式表示與其他作品記錄標(biāo)準(zhǔn)連接關(guān)系的字段⑥相關(guān)題名塊(5--)——可以作為檢索點(diǎn)的其他作品題名信息項(xiàng)⑦主題分析塊(6--)——主要包括學(xué)科名稱主題項(xiàng)與中圖法分類號項(xiàng)⑧責(zé)任者塊(7--)——與作品責(zé)任相關(guān)的個(gè)人及團(tuán)體名稱字段⑨國際使用塊(8--)——主要包括記錄承擔(dān)記錄責(zé)任的機(jī)構(gòu)標(biāo)識(shí)⑩國內(nèi)使用塊(9--)——主要包括供國內(nèi)文獻(xiàn)情報(bào)機(jī)構(gòu)記錄館藏信息的字段①①吳丹,蔡衛(wèi)萍,梁少博,等.信息描述實(shí)驗(yàn)教程[M].武漢:武漢大學(xué)出版社,2016:224.文獻(xiàn)目錄的類型0416清單目錄形式亦稱為財(cái)產(chǎn)清單形式。清單目錄主要具有以下3個(gè)特征:第一,大多是粗略分類下的不規(guī)范著錄;第二,大多由個(gè)人以手工方式編寫,零散且缺乏標(biāo)準(zhǔn)。第三,款目排序不利于讀者檢索。查檢目錄形式相較于清單目錄,查檢目錄具有一定的著錄規(guī)則。首先,為了達(dá)到查檢目的,該形式的目錄新增了文獻(xiàn)的存放位置等相關(guān)描述信息。其次,目錄組織與排架順序保持一致,便于查找到特定文獻(xiàn)。最后,為了提高查檢速度,著錄內(nèi)容通常比較簡略。文獻(xiàn)控制目錄形式目錄學(xué)主張以文獻(xiàn)控制為歸宿,書目信息是文獻(xiàn)控制的重要方式。相對于浩瀚的人類知識(shí),圖書館的存儲(chǔ)空間是有限的。而文獻(xiàn)目錄不僅能夠揭示特定文獻(xiàn)的知識(shí)特征,而且能夠反應(yīng)當(dāng)時(shí)知識(shí)領(lǐng)域的全貌。5.3信息描述與組織方法17信息組織的理論基礎(chǔ)0118語言學(xué)語言是人類最重要的信息交換符號系統(tǒng),是信息的載體,由詞匯和語法構(gòu)成。在信息利用的過程中,需要建立基于詞匯和語法的語言符號系統(tǒng),并根據(jù)信息的內(nèi)在知識(shí)邏輯和表意結(jié)構(gòu),將零散、混雜的信息組織成有序、優(yōu)化的整體邏輯學(xué)信息組織不僅要明確地表達(dá)每一個(gè)信息單元,而且還要揭示不同信息單元之間的邏輯關(guān)系。所以信息組織工作必然要用到邏輯學(xué)的一些方法,其組織過程必須符合邏輯思維規(guī)律。術(shù)語學(xué)術(shù)語是一種指稱概念的規(guī)范化符號,情報(bào)語言學(xué)的基本任務(wù)為建立不同主題概念的術(shù)語或標(biāo)識(shí)體系,即術(shù)語整理。通過規(guī)范化、統(tǒng)一化、標(biāo)準(zhǔn)化的術(shù)語整理,能夠更好地建立概念之間的關(guān)系。信息組織的基本原則0219基本原則客觀性系統(tǒng)性實(shí)用性該原則強(qiáng)調(diào)信息特征的描述和揭示工作必須客觀而準(zhǔn)確。首先應(yīng)優(yōu)先選擇具有客觀依據(jù)的數(shù)據(jù)來源;其次,在信息加工和組織過程中,既不能破壞信息本身的涵義,也不能隨意添加不準(zhǔn)確的思想和觀點(diǎn),必須確保信息的完整性、全面性和準(zhǔn)確性。此外還強(qiáng)調(diào)信息組織的時(shí)效性和環(huán)境一致性。該原則體現(xiàn)了信息組織工作的整體性、關(guān)聯(lián)性與一致性。首先,要求信息組織工作考慮各個(gè)環(huán)節(jié)的共性需求,整體把握信息資源的核心特征。其次,要求考慮不同領(lǐng)域、層次、需求的內(nèi)在聯(lián)系和轉(zhuǎn)化規(guī)則,能同時(shí)揭示信息資源的共性和個(gè)性特征。另外,還要求形成跨領(lǐng)域、多機(jī)構(gòu)統(tǒng)一規(guī)范的信息組織標(biāo)準(zhǔn)和規(guī)則體系。必須充分考慮用戶的真實(shí)信息需求以及獲取信息的成本和收益,最大限度地方便用戶的信息選擇和利用。此外,在海量信息環(huán)境下,信息組織的相關(guān)性、時(shí)效性、可用性等實(shí)用性原則備受重視,甚至超越了精準(zhǔn)性、嚴(yán)密性等信息組織的設(shè)計(jì)原則,“以用戶為中心”的信息組織理念和方法體系逐漸突顯。信息組織的基本方法0320信息組織的基本方法主要包括分類法、主題法以及分類主題一體化方法三種類型。分類法分類是按照性質(zhì)、特征、用途等對事物進(jìn)行區(qū)分和聚類,并遵循一定次序組織聚類結(jié)果的過程,是一種系統(tǒng)認(rèn)知事物的方法?;诖?,分類法是一種依照內(nèi)容特征對信息資源進(jìn)行系統(tǒng)分類、揭示和組織的方法。排序工具一般采用特定的標(biāo)記符號,如數(shù)字、字母等通用性符號。因此,分類語言是一種不受語言、國別影響的世界性通用信息組織方法。分類法的不足表現(xiàn)為直觀性較差,需要掌握一定的專業(yè)知識(shí)才能理解分類號的內(nèi)涵,普通用戶在使用上將存在一定困難。從構(gòu)建方法來看,主要有等級列舉式分類法和分面組配式分類法兩類分類方法。信息組織的基本方法0321等級列舉式分類法是指將所有類目組成一個(gè)等級系統(tǒng)的分類方法。該分類方法通過賦予具體信息加工對象一個(gè)主要分類號來確定其內(nèi)容歸屬。例如,《杜威十進(jìn)制分類法》(DeweyDecimalClassification,DDC)和《美國國會(huì)圖書館分類法》(LibraryofCongressClassification,LCC)等均是典型的等級列舉式分類法。以學(xué)科分類方法為基礎(chǔ),強(qiáng)調(diào)系統(tǒng)化的知識(shí)組織,便于用戶按學(xué)科或?qū)I(yè)等分類邏輯進(jìn)行系統(tǒng)化信息檢索通常采用阿拉伯?dāng)?shù)字或拉丁字母作為標(biāo)記符號,具有國際通用性,適用范圍較廣典型特征從邏輯方法來看,等級列舉式分類法體系比較嚴(yán)密,組織效率較高既可用于編排檢索工具,亦可用于管理書目文獻(xiàn),適用性廣周文駿.圖書館學(xué)百科全書[M].北京:中國大百科全書出版社,1993:76.信息組織的基本方法0322等級列舉式分類法-DDC由美國圖書館學(xué)家麥維爾·杜威于1876年創(chuàng)立,迄今已有140余年使用歷史,是目前世界上流行最廣,影響最大的一部分類法,于2011年更新到第23版。DDC開創(chuàng)了文獻(xiàn)分類法的新紀(jì)元,是西方現(xiàn)代文獻(xiàn)分類法發(fā)展史上一個(gè)重要里程碑。在編制上,DDC采用通俗簡明的阿拉伯?dāng)?shù)字,從000、100、200到900將知識(shí)標(biāo)識(shí)為10個(gè)基本大類,然后根據(jù)小數(shù)值的大小依次排列,以標(biāo)識(shí)等級列舉式類目體系。分類號大部分采用十進(jìn)制層累標(biāo)記制,數(shù)字以三位為基礎(chǔ),不足三位則用“0”補(bǔ)齊,三位數(shù)字后用小數(shù)點(diǎn)隔開。OCLC.杜威十進(jìn)分類法.[EB/OL].[2021-08-28]./en/dewey/webdewey.html.信息組織的基本方法0323等級列舉式分類法-DDC特點(diǎn)體系完備,結(jié)構(gòu)嚴(yán)謹(jǐn),類目詳盡,層次清晰,便于理解,被世界上大多數(shù)公共圖書館廣泛采用。采用嚴(yán)格的層累標(biāo)記制度,類號之間等級分明,便于開展標(biāo)識(shí)工作。開創(chuàng)了仿分、復(fù)分等分類方法,極大地改進(jìn)了分類體系。率先為分類表編制了詳細(xì)索引,提供了一種簡便快捷的字順檢索途徑。DDC由OCLC組織管理,通過定期修訂,持續(xù)更新,增強(qiáng)了該分類法的適用性和權(quán)威性周文駿.圖書館學(xué)百科全書[M].北京:中國大百科全書出版社,1993:76.信息組織的基本方法0324分面組配式分類法強(qiáng)調(diào)類目之間完全采用同一種分面結(jié)構(gòu),該分類方法將文獻(xiàn)內(nèi)容拆分為多個(gè)因素,在分面中尋找相應(yīng)的類號,并按照一定次序?qū)⑦@些類號排列,最終組配成一個(gè)完整的分類號。分面結(jié)構(gòu)能夠揭示事物的不同屬性,世界通用的分面組配式分類法有《國際十進(jìn)分類法》(UniversalDecimalClassification,UDC)、《冒號分類法》(ColonClassification,CC)等等。分類類目相對較少,能通過組配一些通用類目來表達(dá)眾多概念主題。所以在針對復(fù)雜概念或復(fù)雜對象的分類標(biāo)引中,分類組配式分類法要優(yōu)于等級列舉式分類法可以自由設(shè)定標(biāo)引、檢索范圍,提供多種文獻(xiàn)檢索途徑,以及比較精確的組配檢索方式。在檢索性能和效率兩個(gè)方面均優(yōu)于等級列舉式分類法典型特征采用分段標(biāo)記制度,便于增補(bǔ)與修訂分類表。相較于等級列舉式分類工具,使用分面組配式分類工具檢索更加靈活適用于分類目錄組織以及分類檢索系統(tǒng)構(gòu)建,應(yīng)用范圍廣闊周文駿.圖書館學(xué)百科全書[M].北京:中國大百科全書出版社,1993:76.信息組織的基本方法0325分面組配式分類法-CC由著名的印度圖書館學(xué)家阮岡納贊(S.R.Ranganathan)于1933年提出。因?yàn)榈谝话媸状问褂妹疤栕鳛榉置孢B接符號而得名①。在編制形式上,該分類法按不同分類標(biāo)準(zhǔn),在基本類下列出多組單獨(dú)概念,形成若干分面。在文獻(xiàn)分類時(shí),根據(jù)文獻(xiàn)主題選擇相應(yīng)的分面概念,而后按預(yù)先規(guī)定的分面排列次序?qū)⒋矸置娓拍畹臉?biāo)記符號組配成目標(biāo)文獻(xiàn)的分類號。相對于等級列舉式分類法而言,冒號分類法可以更加靈活地揭示目標(biāo)標(biāo)引對象的特征,及時(shí)地反映新學(xué)科和新主題,適應(yīng)了當(dāng)前對信息細(xì)密度、全方位、多角度揭示的需要。①馬張華.信息組織(第三版)[M].北京:清華大學(xué)出版社,2008:131.信息組織的基本方法0326主題法根據(jù)信息對象的主題特征,直接以與主題內(nèi)容相關(guān)的詞語為信息檢索標(biāo)識(shí),以詞語的字順為主要檢索路徑,并通過參照系統(tǒng)揭示詞語之間關(guān)系的信息組織方法。主題法也是一種從信息的內(nèi)容角度來標(biāo)引和組織信息資源的方法典型特征:第一,以事物、問題、現(xiàn)象等特定主題為中心來集中信息資源。第二,直接以詞語為信息資源的檢索標(biāo)識(shí),更加具有直觀性。第三,以字順為主要檢索途徑。第四,通常借助詳盡的參照系統(tǒng)揭示主題詞之間的關(guān)系。主題法的類型較多,常用的有標(biāo)題詞法、單元詞法、敘詞法和關(guān)鍵詞法等。信息組織的基本方法0327標(biāo)題詞法標(biāo)題詞是一種經(jīng)過規(guī)范化處理,對文獻(xiàn)內(nèi)容以及事物名稱或特征的規(guī)范化表達(dá)。標(biāo)題詞法是一種以標(biāo)題詞作為主題標(biāo)識(shí),以詞表預(yù)先確定的組配方式來標(biāo)引和組織的方法。通過語義參照揭示各標(biāo)題詞之間的語義關(guān)系,主要包括單純參照和相關(guān)參照:單純參照反映正式標(biāo)題詞與非正式標(biāo)題詞之間的同義關(guān)系;相關(guān)參照反映兩個(gè)正式標(biāo)題詞之間的等級或相關(guān)關(guān)系。信息組織的基本方法0328單元詞法單元詞(Uniterm)是指用于標(biāo)引信息資源主題的最基本、最小語言單元,是信息組織的最小表意單元,也是一種受控規(guī)范語言。最早出現(xiàn)的后組式主題語言,其最基本的特點(diǎn)就是概念組配,即提供了一種分解和組配復(fù)雜主題概念的方法。優(yōu)點(diǎn):具有極大的靈活性,提供了更加多樣的檢索入口缺點(diǎn):容易導(dǎo)致錯(cuò)誤組配,誤檢率比較高,實(shí)用性不高信息組織的基本方法0329敘詞法敘詞,亦稱為主題詞,指一類以基本概念為基礎(chǔ),表達(dá)文獻(xiàn)主題內(nèi)容的規(guī)范化詞語或詞組。敘詞法就是通過精選自然語言詞語的概念組配來表達(dá)主題的一種方法。優(yōu)點(diǎn):直接以規(guī)范化的敘詞作為標(biāo)識(shí)符號,具有直觀性直接基于文獻(xiàn)研究的對象和問題為選詞,并通過敘詞組配來描述主題,具有專指性面對不斷出現(xiàn)的新事物、新概念、新材料和新研究,敘詞法都能隨時(shí)增刪和修改,來適應(yīng)新概念的表達(dá),適用性強(qiáng)敘詞主要以字順排列,便于檢索①①嚴(yán)怡民,馬費(fèi)成,馬大川.情報(bào)學(xué)基礎(chǔ)[M].武漢:武漢大學(xué)出版社,1987:150-151.信息組織的基本方法0330關(guān)鍵詞法關(guān)鍵詞指那些出現(xiàn)在文獻(xiàn)的重要位置,并對描述文獻(xiàn)的主題內(nèi)容具有實(shí)質(zhì)意義的詞語共有兩種形式:包含題內(nèi)關(guān)鍵詞索引、題外關(guān)鍵詞索引、雙重關(guān)鍵詞索引等在內(nèi)的帶上下文的關(guān)鍵詞索引包含單純關(guān)鍵詞索引、詞對式關(guān)鍵詞索引和簡單關(guān)鍵詞索引等在內(nèi)的不帶上下文的關(guān)鍵詞索引優(yōu)點(diǎn):不受詞表控制,快捷簡便,適于用計(jì)算機(jī)組織和檢索文獻(xiàn)信息缺點(diǎn):基本不做或者極少做規(guī)范化處理,漏檢率和誤檢率較高信息組織的基本方法0331分類主題一體化方法分類法和主題法各有優(yōu)劣。分類法系統(tǒng)性強(qiáng),適用于族性特征的標(biāo)引和組織。而主題法直觀明確,適用于特性特征的標(biāo)引和組織。人們在信息資源的利用過程中,既有族性檢索需求,也有特性揭示目標(biāo)。因此。產(chǎn)生了兩種方法互為滲透的分類主題一體化詞表。例如:巴希特(C.Barhgat)于1969年編制的《教育檢索詞表》以及由中國編制的《中國分類主題詞表》等等。信息組織的基本方法0332延伸閱讀:《中圖法》①《中國圖書館分類法》(簡稱《中圖法》)是我國圖書館及情報(bào)單位普遍使用的文獻(xiàn)分類法,是典型的等級列舉式分類法。按照學(xué)科或知識(shí)領(lǐng)域范圍,《中圖法》共有A-Z22個(gè)基本大類,其類目主要是按照科學(xué)知識(shí)的邏輯系統(tǒng)進(jìn)行劃分和排列,重視類目之間的內(nèi)在聯(lián)系,貫徹從總到分、從一般到具體、從簡單到復(fù)雜、從理論到實(shí)踐的劃分原則,具有層層隸屬、逐級展開的邏輯等級體系。①中國圖書館分類法[EB/OL].[2021-08-28]./.5.4網(wǎng)絡(luò)資源信息組織33網(wǎng)絡(luò)信息組織的環(huán)境0134相對于傳統(tǒng)的信息資源,網(wǎng)絡(luò)信息資源的“質(zhì)”和“量”發(fā)生了巨大的變化。數(shù)據(jù)的數(shù)量與種類激增,數(shù)據(jù)加工的精度面臨巨大的挑戰(zhàn)與傳統(tǒng)文獻(xiàn)管理環(huán)境相比,網(wǎng)絡(luò)信息資源管理環(huán)境下的用戶需求也發(fā)生了很大的變化,由此對信息組織方法的透明度與易用性提出更高要求在網(wǎng)絡(luò)信息資源管理環(huán)境下,信息組織對象逐漸從多樣化文本發(fā)展到數(shù)據(jù)、知識(shí)層面。信息組織方法層面,傳統(tǒng)的信息組織方法亟需通過改進(jìn)以適應(yīng)新環(huán)境,創(chuàng)新應(yīng)用以元數(shù)據(jù)為代表的網(wǎng)絡(luò)信息組織方法也至關(guān)重要傳統(tǒng)網(wǎng)絡(luò)資源組織方法0235優(yōu)勢系統(tǒng)性強(qiáng)有利于組織非文本信息檢索范圍易于調(diào)控通用性好類目劃分標(biāo)準(zhǔn)不恰當(dāng)部分類目劃分邏輯性差類名不規(guī)范類目注釋缺乏不利于類目層級較深的信息資源的獲取劣勢分類法組織網(wǎng)絡(luò)信息資源傳統(tǒng)網(wǎng)絡(luò)資源組織方法0236主題法組織網(wǎng)絡(luò)信息資源應(yīng)用采用敘詞表、標(biāo)題表等現(xiàn)有詞表組織網(wǎng)絡(luò)信息資源廣泛采用關(guān)鍵詞法,加速處理海量信息資源弊端缺乏統(tǒng)一的標(biāo)準(zhǔn)和轉(zhuǎn)換機(jī)制,關(guān)鍵詞的使用不便于數(shù)據(jù)交換和網(wǎng)絡(luò)檢索通用性較差,不利于直接用于檢索,需要用戶結(jié)合情景進(jìn)行主觀判斷,誤檢率大幅增加海量信息環(huán)境使得檢索反饋結(jié)果多,容易形成大量無效信息,浪費(fèi)用戶的信息獲取時(shí)間元數(shù)據(jù)0337定義結(jié)構(gòu)性數(shù)據(jù)(structureddata),是關(guān)于數(shù)據(jù)的數(shù)據(jù)、描述數(shù)據(jù)的數(shù)據(jù)。目前,通行的元數(shù)據(jù)格式采用三層結(jié)構(gòu)的方式加以定義:內(nèi)容結(jié)構(gòu)對該元數(shù)據(jù)的構(gòu)成元素及其定義標(biāo)準(zhǔn)進(jìn)行描述;句法結(jié)構(gòu)定義元數(shù)據(jù)整體結(jié)構(gòu)以及如何描述這種結(jié)構(gòu);語義結(jié)構(gòu)定義元數(shù)據(jù)元素的具體描述方法。元數(shù)據(jù)0338描述作用定位作用評估作用搜尋作用選擇作用通過描述目標(biāo)信息對象的內(nèi)容、特征、屬性和位置等,奠定存取和利用目標(biāo)信息對象的基礎(chǔ)元數(shù)據(jù)包含網(wǎng)絡(luò)信息資源位置方面的信息,因此可以通過URL、DOI或其他相關(guān)標(biāo)識(shí)符來確定資源的具體位置,以進(jìn)一步檢索發(fā)現(xiàn)網(wǎng)絡(luò)環(huán)境中隱藏的信息對象元數(shù)據(jù)中關(guān)于信息對象的基本屬性,可幫助用戶更易理解與認(rèn)識(shí)信息對象,參照相關(guān)準(zhǔn)則可對信息資源的價(jià)值進(jìn)行必要的評估,作為用戶存取利用的參考元數(shù)據(jù)提供了信息搜尋的基礎(chǔ)。通過元數(shù)據(jù),可以進(jìn)一步抽取并組織信息對象中的重要信息,能夠進(jìn)一步提高檢索的精準(zhǔn)度根據(jù)元數(shù)據(jù)所提供的名稱、內(nèi)容、年代、格式等描述信息,用戶能在了解信息內(nèi)容和特征的基礎(chǔ)上,選擇適用的信息資源作用①①陳耀盛.網(wǎng)絡(luò)信息組織[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2004:27.元數(shù)據(jù)0339類型表中為國內(nèi)外應(yīng)用較為廣泛、較有影響力的8種元數(shù)據(jù)規(guī)范,分別為DC(都柏林核心元數(shù)據(jù))、MARC(機(jī)讀編目格式標(biāo)準(zhǔn))、VRA(視覺資料核心類目)、CDWA(藝術(shù)作品)、EAD(編碼檔案描述)、FGDC(地理空間元數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn))、GILS(政府信息定位服務(wù))以及TEI(電子文本編碼與交換)。元數(shù)據(jù)0340XMLExtensionMarkupLanguage,是用于網(wǎng)絡(luò)環(huán)境下網(wǎng)頁設(shè)計(jì)和數(shù)據(jù)交換、管理的新技術(shù),用結(jié)構(gòu)化的辦法處理過去認(rèn)為難以處理的非結(jié)構(gòu)化的信息,是國際標(biāo)準(zhǔn)SGML的一個(gè)子集XML的重點(diǎn)在于管理信息內(nèi)容,包括超文本鏈接,全面支持ISO/IEC10646(即UNICODE)大字符集,包括CJK漢字和世界上其它各種文字,功能大大超過HTML。元數(shù)據(jù)0341XML特點(diǎn)可拓展性。用戶可以根據(jù)實(shí)際需要產(chǎn)生個(gè)性化的、可擴(kuò)展的標(biāo)志集,在核心功能集的基礎(chǔ)上增加樣式、鏈接及參照能力。可分析性。XML具有自描述性、自解釋性,具有功能強(qiáng)大、靈活高效的表達(dá)方法,不僅能夠被人理解,還能被機(jī)器理解,具有較高的效率和良好的可重用性。簡單性。XML具有相對簡單的核心語法集和嚴(yán)格的定義,人和機(jī)器都可以快速理解并應(yīng)用,創(chuàng)建自己的DTD以滿足實(shí)際需要。開放性。XML標(biāo)準(zhǔn)自身在Web上是完全開放的,XML文檔也是開放的。元數(shù)據(jù)0342RDF資源描述框架(FrameworkforDescribingResources)是一種用于描述Web上資源的通用數(shù)據(jù)模型,是基于語義網(wǎng)表示語義信息的基礎(chǔ),可被計(jì)算機(jī)閱讀和理解。一個(gè)RDF陳述是一個(gè)關(guān)于“資源-屬性-屬性值”的三元組,使用“主體-謂詞(屬性)-客體(或?qū)傩灾担钡男问奖磉_(dá)。RDF的兩大關(guān)鍵技術(shù)是URI和XML。元數(shù)據(jù)0343RDF特點(diǎn)易控制。RDF具有簡單的描述框架,較易控制,尤其是數(shù)據(jù)量很大的時(shí)候,可提高資源檢索和管理的效率,從而真正發(fā)揮元數(shù)據(jù)的功用。易擴(kuò)展。詞匯集和資源描述是分開的,可以嵌入各種類型的元數(shù)據(jù)。包容性。任何人都可以在RDF中定義詞匯集,并根據(jù)需要使用多種詞匯集來描述資源??山粨Q性。本身使用XML語法,很容易實(shí)現(xiàn)網(wǎng)絡(luò)資源交換;統(tǒng)一的RDFSchema定義了描述詞匯集的規(guī)則,可在不同詞匯集間指定元數(shù)據(jù)關(guān)系,實(shí)現(xiàn)語義層次上的數(shù)據(jù)交換易綜合。資源的屬性是資源,屬性值可以是資源,關(guān)于資源的陳述也可以是資源,都可以使用Schema來描述。DC元數(shù)據(jù)集及其應(yīng)用0444DC元數(shù)據(jù)集DC元素集是一個(gè)國際化元數(shù)據(jù)解決方案,定義了一個(gè)所有網(wǎng)絡(luò)資源都應(yīng)該遵循的通用核心標(biāo)準(zhǔn)。標(biāo)識(shí)中文翻譯解釋Title題名賦予資源的名稱。Creator創(chuàng)建者創(chuàng)建資源內(nèi)容的主要責(zé)任者。Subject主題資源內(nèi)容的主題描述。Description描述資源內(nèi)容的解釋。Publisher出版者使資源成為可獲得的責(zé)任實(shí)體。Contributor其他責(zé)任者資源生存期中做出貢獻(xiàn)的其他實(shí)體,除制作者/創(chuàng)作者之外的其他撰稿人和貢獻(xiàn)者,如插圖繪制者、編輯等。Date日期資源生存周期中的一些事件的相關(guān)時(shí)間Type類型資源所屬的類別,包括種類、體裁、作品級別等描述性術(shù)語。Format格式資源的物理或數(shù)字表現(xiàn),可包括媒體類型或資源容量,可用于限定資源顯示或操作所需要的軟件、硬件或其他設(shè)備,容量表示數(shù)據(jù)所占的空間大小等。Identifier標(biāo)識(shí)符資源的唯一標(biāo)識(shí),如URI(統(tǒng)一資源標(biāo)識(shí)符)、URL(統(tǒng)一資源定位符)、DoI(數(shù)字對象標(biāo)識(shí)符)、ISBN(國際標(biāo)準(zhǔn)書號)、ISSN(國際標(biāo)準(zhǔn)刊號)等。Language語種描述資源知識(shí)內(nèi)容的語種Source來源對當(dāng)前資源來源的參照。Relation關(guān)聯(lián)與其他資源的索引關(guān)系,用標(biāo)識(shí)系統(tǒng)來標(biāo)引參考的相關(guān)資源。Coverage覆蓋范圍資源應(yīng)用的范圍,包括空間位置(地名或地理坐標(biāo))、時(shí)代(年代、Et期或日期范圍)或權(quán)限范圍。Rights權(quán)限使用資源的權(quán)限信息,它包括知識(shí)產(chǎn)權(quán)、著作權(quán)和各種擁有權(quán)。如果沒有此項(xiàng),則表明放棄上述權(quán)力。DC元數(shù)據(jù)集及其應(yīng)用0445DC特點(diǎn)簡易性。DC很簡單,只包含15個(gè)元素。通用性。DC并不針對某個(gè)特定的學(xué)科或領(lǐng)域,而是支持對任何內(nèi)容的資源進(jìn)行描述,使得跨學(xué)科的語義互操作成為可能。兼容性。DC內(nèi)嵌在HTML語言中實(shí)現(xiàn)網(wǎng)絡(luò)資源的描述,而HTML已經(jīng)成為在各個(gè)瀏覽器中都支持的通用語言,因此都柏林核心集具有較好的兼容性??蓴U(kuò)展性。由于DC只有15個(gè)元素,難以描述所有的資源,為了更好地滿足不同學(xué)科、不同領(lǐng)域的數(shù)據(jù)描述需求,都柏林核心集提供了一種能夠擴(kuò)展描述的方法,即限定詞的使用:模式體系(Scheme)、語言種類(lang)、類型(type)。模塊化。在W3C主持下,基于DC開發(fā)出的RDF允許在一定的語法、句法和結(jié)構(gòu)中進(jìn)行元數(shù)據(jù)之間的交互操作,為結(jié)構(gòu)化的元數(shù)據(jù)進(jìn)行編碼、交換和再運(yùn)用提供了一個(gè)模塊化的基礎(chǔ)結(jié)構(gòu)①。①孫建軍,柯青,陳曉玲,等.信息資源管理概論[M].南京:東南大學(xué)出版社,2008:130.DC元數(shù)據(jù)集及其應(yīng)用0446DC設(shè)計(jì)原則內(nèi)在本質(zhì)原則:只描述內(nèi)在的、本質(zhì)的特征,而不描述附加特性。易擴(kuò)展原則:DC允許用戶根據(jù)特定目的、以特定規(guī)范的方式增加所需的著錄信息,并且元數(shù)據(jù)及其使用也并非一成不變,也需要保持向后兼容的能力。語法獨(dú)立原則:元數(shù)據(jù)尚在發(fā)展變化之中,特定的語法會(huì)限制核心集的發(fā)展,因此DC采取靈活、獨(dú)立的語法規(guī)則。無必須項(xiàng)原則:DC中所有數(shù)據(jù)項(xiàng)都不是必須要有的,這種可選擇性可以鼓勵(lì)非專業(yè)人士參與著錄和使用,也減輕了著錄者的負(fù)擔(dān)。可重復(fù)原則:DC進(jìn)一步簡化了著錄規(guī)則,所有數(shù)據(jù)項(xiàng)均可重復(fù),也不區(qū)分作者排名??尚揎椩瓌t:為了增強(qiáng)著錄項(xiàng)的自我解釋性,允許使用附加限定語來進(jìn)一步修飾①。①孫建軍,柯青,陳曉玲,等.信息資源管理概論[M].南京:東南大學(xué)出版社,2008:130.DC元數(shù)據(jù)集及其應(yīng)用0447DC應(yīng)用實(shí)例①抗日戰(zhàn)爭與近代中日關(guān)系文獻(xiàn)數(shù)據(jù)平臺(tái)[EB/OL].[2021-12-28]./#/.以抗日戰(zhàn)爭與近代中日關(guān)系文獻(xiàn)數(shù)據(jù)平臺(tái)①中的音頻資源為例,使用XML語言結(jié)合RDF工具定義的通用三元組(資源-屬性-屬性值)對其屬性以及對應(yīng)的屬性值進(jìn)行描述,如圖所示,該音頻資源共有12個(gè)屬性元素。5.5知識(shí)組織48知識(shí)組織的概念0149“知識(shí)組織”這一概念始見于美國圖書館學(xué)家布利斯(H.E.Bliss)于1929年出版的專著①,而后依托于圖書館學(xué)、情報(bào)學(xué)在分類系統(tǒng)和敘詞表上的研究進(jìn)一步發(fā)展。知識(shí)組織是一種揭示知識(shí)單元、挖掘知識(shí)關(guān)聯(lián)的過程或行為。兩種代表性觀點(diǎn):以布魯克斯(B.C.Brookes)為代表的情報(bào)學(xué)家,認(rèn)為知識(shí)是文獻(xiàn)所蘊(yùn)含的內(nèi)容單元,是區(qū)別于“文獻(xiàn)”的更加精細(xì)化的內(nèi)容單元,所以知識(shí)組織主要是找出知識(shí)單元之間的相互影響和聯(lián)系,展示知識(shí)的有機(jī)結(jié)構(gòu)。以計(jì)算機(jī)科學(xué)中的知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD)與知識(shí)組織系統(tǒng)(KnowledgeOrganizationSystem,KOS)為代表,以建立一系列面向知識(shí)客體的知識(shí)關(guān)聯(lián)機(jī)制和組織方法為目標(biāo),典型的技術(shù)方法有本體、語義網(wǎng)以及知識(shí)圖譜等。①蔣永福.圖書館與知識(shí)組織——從知識(shí)組織的角度理解圖書館學(xué)[J].中國圖書館學(xué)報(bào),1999(5):19-23.知識(shí)組織的類型0250以知識(shí)單元為基礎(chǔ)的知識(shí)組織方式在該方式中,知識(shí)組織的目標(biāo)對象是經(jīng)專家精心評價(jià)、篩選、提取和測試后獲得的有用知識(shí)。因此,可以認(rèn)為知識(shí)組織是情報(bào)組織與分析的核心要素。以知識(shí)單元為基礎(chǔ)進(jìn)行知識(shí)組織,就是通過抽取和組織知識(shí)單元或知識(shí)單元集合中的知識(shí)因子,建立具有一定關(guān)聯(lián)的知識(shí)體系,典型的方式是“知識(shí)地圖”。另外,有專家提出了“知識(shí)空間”概念,即將知識(shí)概念表達(dá)成知識(shí)空間中的特定形式向量,并通過向量之間的矢量運(yùn)算來揭示知識(shí)概念間的關(guān)聯(lián)關(guān)系與強(qiáng)度。以知識(shí)關(guān)聯(lián)為基礎(chǔ)的知識(shí)組織方式該方式是通過歸納與綜合知識(shí)單元,形成更高層次的知識(shí)產(chǎn)品。比如,從原始研究文獻(xiàn)到文獻(xiàn)綜述;從基礎(chǔ)關(guān)聯(lián)發(fā)現(xiàn)到專家智能推理。總之,通過精煉知識(shí)內(nèi)容,建立一個(gè)相對于傳統(tǒng)信息組織而言,更加全面、概括能力更強(qiáng)的多維領(lǐng)域知識(shí)網(wǎng)狀結(jié)構(gòu),進(jìn)而形成相應(yīng)的知識(shí)推理機(jī)制、高階分析結(jié)論或者特定問題的決策響應(yīng)機(jī)制。知識(shí)組織的方法0351知識(shí)表示知識(shí)表示是指把知識(shí)客體中的知識(shí)因子和知識(shí)關(guān)聯(lián)表示出來,便于用戶識(shí)別和理解知識(shí)。知識(shí)表示是知識(shí)組織的基礎(chǔ)與前提,有主觀、客觀知識(shí)表示兩種方法。主觀知識(shí)表示主要是通過模擬研究人腦的知識(shí)表示機(jī)制,進(jìn)而在數(shù)據(jù)或計(jì)算環(huán)境中模擬專家的知識(shí)關(guān)聯(lián)和決策判斷過程。常見方法有邏輯表示、規(guī)則表示、語義網(wǎng)絡(luò)表示、框架表示,等等。客觀知識(shí)表示主要是抽取文獻(xiàn)單元或其他信息資源中蘊(yùn)含的知識(shí)單元,并識(shí)別知識(shí)單元之間的相互關(guān)系。其實(shí)質(zhì)是對相關(guān)文獻(xiàn)或信息資源的內(nèi)容加工,所以借助分類標(biāo)引或主題標(biāo)引等內(nèi)容揭示方法和組織工具,能夠?qū)崿F(xiàn)客觀知識(shí)表示。知識(shí)組織的方法0352知識(shí)轉(zhuǎn)述亦稱為知識(shí)重組,主要是通過重新組合知識(shí)客體結(jié)構(gòu),對分散的知識(shí)進(jìn)行加工整序,形成精煉的知識(shí)情報(bào),便于用戶更好地理解、吸收或評價(jià)知識(shí)。從工作機(jī)制上看,知識(shí)重組主要包括知識(shí)因子以及知識(shí)關(guān)聯(lián)重組。知識(shí)因子重組主要是將知識(shí)客體中的知識(shí)因子抽出,并在形式上對其進(jìn)行歸納、選擇、整理或排列,圍繞結(jié)構(gòu)進(jìn)行知識(shí)整序或濃縮,使之具備知識(shí)索引或指引的功能。知識(shí)關(guān)聯(lián)重組是指在特定知識(shí)領(lǐng)域構(gòu)建新的知識(shí)關(guān)聯(lián),改變知識(shí)因子之間的原有聯(lián)系,提供新知識(shí)或者關(guān)于原知識(shí)的評價(jià)性或解釋性知識(shí)。知識(shí)組織的方法0353知識(shí)聚合知識(shí)聚合是指借助一定方法凝聚知識(shí)單元,以形成多維度、多層級且相互關(guān)聯(lián)的知識(shí)體系。知識(shí)聚合主要包括四大類方法:一是基于情報(bào)檢索語言已有的知識(shí)組織體系或關(guān)聯(lián)關(guān)系完成知識(shí)聚合;二是基于知識(shí)網(wǎng)絡(luò)所揭示的潛在關(guān)系實(shí)現(xiàn)知識(shí)聚合,如知識(shí)發(fā)生網(wǎng)絡(luò)、知識(shí)共現(xiàn)網(wǎng)絡(luò)或知識(shí)語義網(wǎng)絡(luò)的應(yīng)用;三是借助本體、關(guān)聯(lián)數(shù)據(jù)等語義網(wǎng)技術(shù)實(shí)現(xiàn)知識(shí)聚合;四是基于特定主題或領(lǐng)域的外部屬性完成知識(shí)聚合。知識(shí)組織的方法0354知識(shí)發(fā)現(xiàn)亦稱為知識(shí)挖掘,主要是根據(jù)不同的需求,于各種信息中獲取知識(shí)的過程。知識(shí)發(fā)現(xiàn)是一種直接從原始數(shù)據(jù)中提煉出有效的、新穎的、潛在的、有用的知識(shí)的方法。按照知識(shí)類型,典型的知識(shí)發(fā)現(xiàn)方法有關(guān)聯(lián)規(guī)則、特征挖掘、分類、聚類、趨勢分析、偏差分析、文本挖掘等方法。隨著大數(shù)據(jù)技術(shù)和機(jī)器學(xué)習(xí)算法的日益成熟,知識(shí)發(fā)現(xiàn)甚至?xí)缭街R(shí)組織的邏輯體系,以理解用戶需求或提供問題答案,比如深度神經(jīng)網(wǎng)絡(luò)算法。知識(shí)組織的應(yīng)用0455基于知識(shí)組織技術(shù)的特色資源關(guān)聯(lián)數(shù)據(jù)模型以元數(shù)據(jù)為基礎(chǔ),需先對采集到的數(shù)據(jù)資源進(jìn)行語義化描述,而后采用本體、關(guān)聯(lián)數(shù)據(jù)技術(shù)進(jìn)行知識(shí)組織,以實(shí)現(xiàn)多源異構(gòu)數(shù)據(jù)之間的共享互聯(lián)。如圖所示,該關(guān)聯(lián)數(shù)據(jù)模型共有五個(gè)層次。主要工作為專題數(shù)據(jù)庫基本數(shù)據(jù)資源實(shí)體及其屬性的采集與清洗基于數(shù)據(jù)采集層采集并清洗的數(shù)據(jù),選用合適的元數(shù)據(jù)規(guī)范描述各類資源實(shí)體的屬性特征,并借助資源描述框架(RDF)工具呈現(xiàn)資源實(shí)體的語義內(nèi)容在元數(shù)據(jù)語義描述的基礎(chǔ)上,選擇適用的本體構(gòu)建方法構(gòu)建目標(biāo)資源本體,以實(shí)現(xiàn)各類元數(shù)據(jù)的語義互操作主要工作為發(fā)布關(guān)聯(lián)數(shù)據(jù)并為用戶提供瀏覽、檢索、共享等服務(wù)根據(jù)關(guān)聯(lián)數(shù)據(jù)的標(biāo)準(zhǔn)對上述元數(shù)據(jù)本體進(jìn)行關(guān)聯(lián),形成一個(gè)資源聚合網(wǎng)絡(luò),以揭示資源實(shí)體間的隱性關(guān)系5.6信息資源組織的前沿與發(fā)展5657在Web2.0時(shí)代,網(wǎng)絡(luò)信息資源體現(xiàn)出強(qiáng)烈的去中心化特征。信息資源質(zhì)量參差不齊,相關(guān)信息資源分布離散,信息資源組織的客觀性原則迎來了巨大挑戰(zhàn)。Web2.0用戶創(chuàng)造內(nèi)容(UserGeneratedContent,UGC)與互動(dòng)參與模式為信息組織拓展了新方向,提供了新理念。一方面,用戶可以通過標(biāo)記、關(guān)注、評論和推送,提供一定的揭示信息資源內(nèi)涵的途徑;另一方面,用戶越來越關(guān)注信息資源的實(shí)用性和可用性,因而出現(xiàn)了并非嚴(yán)格用于知識(shí)控制而主要偏向于相關(guān)性發(fā)現(xiàn)的實(shí)用信息組織方法。標(biāo)簽0158標(biāo)簽(Tag)亦稱為社會(huì)化標(biāo)簽,指用戶群體自發(fā)地為資源內(nèi)容添加的個(gè)性化標(biāo)注,目的是為了更好地顯示和突出搜尋的重點(diǎn)關(guān)鍵詞或者詞條,以便更好的管理個(gè)人信息或指引用戶瀏覽和索引。標(biāo)簽可以看作是一種關(guān)鍵詞標(biāo)記,但不等同于一般的關(guān)鍵詞標(biāo)引。標(biāo)簽的標(biāo)注可以基于上下文、事實(shí)、文章內(nèi)容、用戶的使用目的及主觀感受。因而,標(biāo)簽并非都是出現(xiàn)在文章中的關(guān)鍵詞。在方法層面,標(biāo)簽法是一種自下向上的信息標(biāo)引和組織方法,基于大量的標(biāo)簽集以及語義關(guān)系,能夠有效揭示信息特征、發(fā)現(xiàn)知識(shí)。在組織過程層面,標(biāo)簽也是一種準(zhǔn)確、靈活、開放的網(wǎng)絡(luò)信息分類與組織方法。在生成方式層面,標(biāo)簽主要有三種類型:用戶主動(dòng)添加的標(biāo)簽、系統(tǒng)推薦并經(jīng)用戶確認(rèn)的標(biāo)簽、系統(tǒng)自動(dòng)添加的標(biāo)簽。標(biāo)簽0159特征:標(biāo)注質(zhì)量受資源類型、認(rèn)知風(fēng)格、認(rèn)知難度、個(gè)人習(xí)慣以及系統(tǒng)推薦質(zhì)量等多種因素的影響標(biāo)簽的長度絕大部分都比較短,一般在2~4詞之間,絕大部分是詞語,少量是短語和句子標(biāo)簽的頻次分布符合冪率分布,內(nèi)容上比較平衡,沒有明顯的等級結(jié)構(gòu)優(yōu)勢:能夠反映用戶的情感、評價(jià)等主觀感受能夠揭示傳統(tǒng)信息資源組織方法難以揭示的心力和情緒層面的特征能反應(yīng)用戶在社交網(wǎng)絡(luò)中的興趣相似度等潛在信息工序簡單易用、標(biāo)注自由度大缺點(diǎn):標(biāo)注對象選擇隨意,標(biāo)注者能力參差不齊,標(biāo)注詞匯不規(guī)范,詞間關(guān)系缺乏組織,不能表達(dá)復(fù)雜概念等標(biāo)簽0160延伸閱讀:Flickr①Flickr成立于2004年,是雅虎旗下的著名圖片分享網(wǎng)站。其重要特點(diǎn)就是基于社會(huì)網(wǎng)絡(luò)人際關(guān)系的拓展與內(nèi)容的組織。Flickr功能強(qiáng)大,不局限于簡單的圖片服務(wù),還提供聯(lián)系人服務(wù)、組群服務(wù)等。展示、收集和線上存儲(chǔ)圖片是Flickr界面的主要部分。該網(wǎng)站允許用戶給照片貼上標(biāo)簽,成為“照片集”,或者將同一標(biāo)題下的照片匯集起來,并作為幻燈片展示它們或嵌入到其他網(wǎng)站①,是Web2.0應(yīng)用方式的典型案例。①何塞·范·戴克,趙文丹.互聯(lián)文化社交媒體批判史[M].北京:中國傳媒大學(xué)出版社,2018:86.大眾分類法0261Folksonomy=Folks+Taxonomy是指大眾自發(fā)參與的分類方法,也是由社會(huì)化標(biāo)簽服務(wù)中最具特色的自定義標(biāo)簽功能衍生而來。Folksonomy的大眾化、自由化和社會(huì)化的特征,使其適用于組織和管理網(wǎng)絡(luò)信息資源,尤其適用于組織和管理用戶生產(chǎn)的各類信息資源。從定義來看,F(xiàn)olksonomy一般由網(wǎng)絡(luò)信息資源用戶自發(fā)為某類信息定義一組標(biāo)簽來進(jìn)行描述,最終選用使用頻次較高的標(biāo)簽作為該類信息的類名。與傳統(tǒng)的分類方法相比,F(xiàn)olksonomy是借助于用戶的群體智慧,而非信息組織加工者的專業(yè)知識(shí),來揭示信息資源的特征。大眾分類法0262用戶可以根據(jù)個(gè)人使用習(xí)慣,以自定義的自由詞標(biāo)注和分類網(wǎng)絡(luò)數(shù)字資源對象典型特征自由靈活動(dòng)態(tài)更新共建共享用戶對內(nèi)容進(jìn)行標(biāo)注后,其他人可以立刻觀察到這些標(biāo)簽,如果認(rèn)為標(biāo)簽不合適,可以增加新的標(biāo)簽隨著人們使用不同的標(biāo)簽來標(biāo)識(shí)特定的內(nèi)容的信息,被使用最多的標(biāo)簽作為這條信息的特征,會(huì)被優(yōu)先使用或推薦,而一些使用頻率低的標(biāo)簽則會(huì)逐漸“淡出”大眾分類法0263缺點(diǎn):缺乏層次性一種平面的分類方式,很難使用它來揭示復(fù)雜的關(guān)系表達(dá)概念的模糊性缺乏語義精確性缺乏同義詞控制詞的多義性問題用戶標(biāo)簽五花八門,加重系統(tǒng)負(fù)擔(dān),降低分類準(zhǔn)確性大眾分類法0264延伸閱讀:豆瓣讀書豆瓣網(wǎng)創(chuàng)建于2005年3月,網(wǎng)站提供書影音、同城、小組、東西、市集等功能,是集品味系統(tǒng)(讀書、電影、音樂)、表達(dá)系統(tǒng)(我讀、我看、我聽)和社交系統(tǒng)(同城、小組、友鄰)于一體的創(chuàng)新網(wǎng)絡(luò)服務(wù),是一個(gè)獨(dú)具特色的Web2.0網(wǎng)站。網(wǎng)站的標(biāo)簽使用大眾分類法,信息用戶可以通過檢索標(biāo)簽來獲取自己需要的圖書、電影、小組等信息,也可以為圖書等添加內(nèi)置標(biāo)簽或自定義標(biāo)簽。信息自組織0365在社會(huì)化標(biāo)簽、維基知識(shí)百科這樣的開放性知識(shí)組織系統(tǒng)中,雖然從個(gè)體上看都可能存在惡意的低質(zhì)量信息。但在海量用戶長期參與條件下,最終這些信息資源的標(biāo)注精度,或者是知識(shí)質(zhì)量會(huì)達(dá)到與專業(yè)人員加工相當(dāng)?shù)乃?,這種現(xiàn)象就是開放信息系統(tǒng)中的自組織現(xiàn)象。信息自組織的驅(qū)動(dòng)力宏觀層面信息自組織的外驅(qū)動(dòng)力是信息系統(tǒng)存在的外部競爭,內(nèi)驅(qū)動(dòng)力是信息系統(tǒng)本身進(jìn)化的要求微觀層面信息自組織的外驅(qū)動(dòng)力包括技術(shù)性驅(qū)動(dòng)力和社會(huì)性驅(qū)動(dòng)力,即信息技術(shù)和信息用戶的創(chuàng)造意識(shí)和參與意識(shí),其內(nèi)驅(qū)動(dòng)力則是信息系統(tǒng)各子系統(tǒng)之間及其內(nèi)部元素之間的相互作用①。①彭寧波.信息自組織的產(chǎn)生、形成和發(fā)展探析[J].圖書館學(xué)研究,2010(7):10-13..信息自組織0366維基百科由吉米·多納爾·威爾士和拉里·桑格在2001年1月15日成立,是一個(gè)基于Wiki技術(shù)的全球性協(xié)作計(jì)劃,同時(shí)也是一本跨越語言的網(wǎng)絡(luò)百科全書。案例:維基百科作為一種支持面向社群協(xié)作式寫作的超文本系統(tǒng)和輔助工具,用戶對維基百科的內(nèi)容具有很大的權(quán)利,可以閱讀、下載、創(chuàng)建和修改文本,自由開放度很高。維基百科允許任何第三方不受限制的復(fù)制、修改及再發(fā)布材料的任何部分或全部。但最終,維基百科并沒有因?yàn)橛脩舻男薷臋?quán)限過大,或者部分參與者的知識(shí)水平太低而降低知識(shí)條目的編輯水平。截至2020年,文章數(shù)量突破600萬篇,中文維基百科的條目數(shù)超過了113萬條。信息自組織0367維基百科的的編輯守則和對詞條的審核機(jī)制案例:維基百科信息自組織0368案例:微博信息組織方式大眾標(biāo)注微博用戶可以通過大眾標(biāo)注方式揭示并與他人共享信息。內(nèi)容聚合微博用戶通過內(nèi)容聚合方式動(dòng)態(tài)聚集相關(guān)主題的信息。內(nèi)容聚合是博客站點(diǎn)之間共享信息內(nèi)容的一種簡易方式,是基于XML規(guī)范的應(yīng)用。引用通告微博用戶可以通過引用通告方式推送并聚集關(guān)于同一主題的討論信息。內(nèi)容挖掘微博用戶可以通過挖掘(即鏈接、評論)評論和推介信息。語義數(shù)據(jù)管理0469網(wǎng)絡(luò)數(shù)據(jù)資源通過技術(shù)處理積淀為大規(guī)模數(shù)據(jù)集,其中的知識(shí)信息具有多元異構(gòu)、狀態(tài)頻繁演化等特點(diǎn),對以知識(shí)復(fù)用、發(fā)現(xiàn)和增值為核心的知識(shí)服務(wù)提出了新的挑戰(zhàn),而語義數(shù)據(jù)建模、知識(shí)表示和知識(shí)服務(wù)計(jì)算則是大數(shù)據(jù)環(huán)境下信息組織發(fā)展的核心方向。語義數(shù)據(jù)管理0470圍繞知識(shí)需求特點(diǎn)進(jìn)行語義數(shù)據(jù)組織是知識(shí)組織有效計(jì)算的前提,其本質(zhì)即為語義數(shù)據(jù)建模。設(shè)計(jì)合理適用的語義數(shù)據(jù)模型是知識(shí)組織過程中的首要步驟,使語義數(shù)據(jù)建模不僅能反映上層知識(shí)服務(wù)準(zhǔn)則,更能保持語義數(shù)據(jù)與知識(shí)信息結(jié)構(gòu)的一致性,保障知識(shí)組織工作能夠直接轉(zhuǎn)化輸出組織管理語義數(shù)據(jù)。同時(shí),非結(jié)構(gòu)化數(shù)據(jù)的語義表達(dá),語義模式中的知識(shí)演化大規(guī)模數(shù)據(jù)的語義分析是語義數(shù)據(jù)建模需要深入考慮的問題。語義數(shù)據(jù)建模語義數(shù)據(jù)管理0471知識(shí)組織的另一核心問題便是知識(shí)表示,即運(yùn)用計(jì)算機(jī)可識(shí)別的符號、以特定形式描述知識(shí)。傳統(tǒng)的知識(shí)表示主要采用本體、語義網(wǎng)絡(luò)、產(chǎn)生式系統(tǒng)、一階謂詞邏輯等表示方法來揭示事實(shí)性知識(shí)與知識(shí)規(guī)則。而在大規(guī)模數(shù)據(jù)涌現(xiàn)的情境下,知識(shí)組織的特點(diǎn)與目標(biāo)也正在發(fā)生改變。因此,需要優(yōu)化改進(jìn)傳統(tǒng)的知識(shí)表示方法,以保證事實(shí)性知識(shí)與知識(shí)規(guī)則描述與表示的有效性和自然性。除此以外,分類知識(shí)表示、時(shí)空知識(shí)表示、決策知識(shí)表示以及演化知識(shí)表示等均是大數(shù)據(jù)環(huán)境下知識(shí)表示的重要課題。知識(shí)表示語義數(shù)據(jù)管理0472基于領(lǐng)域本體知識(shí)語義數(shù)據(jù)表現(xiàn),知識(shí)查詢、知識(shí)搜索和知識(shí)發(fā)現(xiàn)逐漸成為知識(shí)服務(wù)計(jì)算的代表性工作內(nèi)容。底層知識(shí)服務(wù)計(jì)算框架是知識(shí)發(fā)現(xiàn)、知識(shí)重用以及知識(shí)增值的前提與支撐,同時(shí)知識(shí)服務(wù)的高效計(jì)算則是知識(shí)組織的根本目標(biāo)與歸宿。相較于以往任務(wù)導(dǎo)向型的語義信息處理工作,如信息搜索、信息抽取、語義理解等,標(biāo)準(zhǔn)化、平臺(tái)化將成為基于大規(guī)模數(shù)據(jù)集的知識(shí)服務(wù)計(jì)算的發(fā)展方向,而這一過程亟需更扎實(shí)縝密的計(jì)算理論和更成熟完善的實(shí)踐方法指引與支撐。同時(shí),語義計(jì)算范式、知識(shí)服務(wù)計(jì)算表現(xiàn)、知識(shí)集成與融合、知識(shí)主動(dòng)演化等是知識(shí)服務(wù)計(jì)算需要重點(diǎn)關(guān)注的問題。知識(shí)服務(wù)計(jì)算思考題73簡述文獻(xiàn)資源信息組織的常用方法。請結(jié)合實(shí)例,簡述分類法及其在網(wǎng)絡(luò)信息資源組織中的應(yīng)用。請結(jié)合實(shí)例,簡述主題法及其在網(wǎng)絡(luò)信息資源組織中的應(yīng)用。簡述元數(shù)據(jù)及其相關(guān)應(yīng)用。簡述知識(shí)組織的典型方法。請闡述新環(huán)境下信息資源組織的發(fā)展。第六章

信息分析《信息資源管理》目錄content75信息分析概述0101信息分析基本方法0202大數(shù)據(jù)分析法0303情報(bào)關(guān)切下的分析與應(yīng)用04046.1信息分析概述76長尾理論的提出01美國施樂公司于二十世紀(jì)中后期首次推出辦公用復(fù)印機(jī),壟斷世界復(fù)印機(jī)市場。隨著佳能等日本企業(yè)進(jìn)入復(fù)印機(jī)市場后,行業(yè)市場競爭加劇,施樂公司因忽略了全球性的信息分析,未能及時(shí)調(diào)整經(jīng)營戰(zhàn)略,被迫陷入被動(dòng)地位,其全球市場份額由82%下降到35%。當(dāng)施樂公司對日本公司的產(chǎn)品和價(jià)格進(jìn)行分析時(shí)發(fā)現(xiàn),日本佳能公司復(fù)印機(jī)的銷售價(jià)格與本公司成本價(jià)格一致,且并非采用低價(jià)傾銷策略。此外,其質(zhì)量也并不遜色。77案例:美國施樂公司重奪市場份額施樂.加強(qiáng)對競爭對手分析,反敗為勝[EB/OL].[2021-08-26]./auto/db/detail.aspx?db=998001&rid=38長尾理論的提出01通過對日本公司的產(chǎn)品進(jìn)行細(xì)致的信息分析比對,施樂公司發(fā)現(xiàn)對手公司在產(chǎn)品導(dǎo)入時(shí)長和所消耗的人力上都只有本公司的一半,且設(shè)備安裝時(shí)間僅為本公司的三分之一,這便是日本公司成本大幅降低的關(guān)鍵原因。為提升市場競爭力,爭奪市場份額,施樂公司加強(qiáng)對對手公司的信息搜集、處理和分析工作,還成立了專門的競爭情報(bào)研究部門,并展開了全球性的、全國性的和地區(qū)性的競爭信息分析和研究工作。在制定長期戰(zhàn)略計(jì)劃的同時(shí),利用遍布美國的37個(gè)銷售網(wǎng)點(diǎn)來收集市場信息,建立相應(yīng)的顧客信息數(shù)據(jù)庫。此外,施樂公司還專門剖析對手企業(yè)的專利技術(shù)和秘密技術(shù)等,從而了解對手公司降低產(chǎn)品成本,提升產(chǎn)品質(zhì)量的制造原理和使用方法。最終,施樂公司奪回了其原有的市場份額。78案例:美國施樂公司重奪市場份額施樂.加強(qiáng)對競爭對手分析,反敗為勝[EB/OL].[2021-08-26].

/auto/db/detail.aspx?db=998001&rid=38長尾理論的提出01為達(dá)到擴(kuò)大市場份額的目的,美國施樂公司綜合運(yùn)用定性及定量化的信息分析方法來提升市場競爭力,在制定長期戰(zhàn)略計(jì)劃的同時(shí),還根據(jù)市場環(huán)境及時(shí)調(diào)整戰(zhàn)略決策,以達(dá)到信息分析的最優(yōu)效果。通過上述案例可以發(fā)現(xiàn),信息分析在企業(yè)提升市場競爭力、降低生產(chǎn)成本、搶占市場份額的過程中發(fā)揮了關(guān)鍵作用。只有依靠事實(shí)數(shù)據(jù),基于科學(xué)的方法對對手企業(yè)進(jìn)行詳細(xì)的剖析,才能做到知己知彼,百戰(zhàn)不殆。79案例:美國施樂公司重奪市場份額信息分析的概念、類型、特征及作用01科研領(lǐng)域:信息分析是運(yùn)用科學(xué)的理論、方法和手段,在搜集、加工和整理海量信息的同時(shí),把握客觀事物發(fā)展運(yùn)動(dòng)的規(guī)律[1]。信息分析是以社會(huì)用戶的特定需求為依托,采用定量及定性分析方法對文獻(xiàn)信息進(jìn)行收集、整理、鑒別、評價(jià)、分析和綜合,從而形成新的信息產(chǎn)品增益,服務(wù)于具有科研性質(zhì)的智能活動(dòng)的決策[2]。軍事領(lǐng)域:又稱“情報(bào)分析”,軍事情報(bào)分析是通過對軍事情報(bào)特性、工作規(guī)律和指導(dǎo)規(guī)律進(jìn)行研究和概括,對軍事情報(bào)工作實(shí)踐進(jìn)行思考、分析和總結(jié),從而更好的服務(wù)于國防政策制定、指揮作戰(zhàn)的戰(zhàn)略決策的過程[3]。80[1]查先進(jìn).信息分析與預(yù)測[M].武漢:武漢大學(xué)出版社,2000:2.[2]朱慶華.信息分析:基礎(chǔ)、方法及應(yīng)用[M].北京:科學(xué)出版社,2004:4.[3]高金虎.軍事情報(bào)學(xué)研究現(xiàn)狀與發(fā)展前瞻[J].情報(bào)學(xué)報(bào),2018,37(5):477-485信息分析的概念、類型、特征及作用01政治領(lǐng)域:政治信息分析指國家機(jī)關(guān)、團(tuán)體組織和個(gè)人在法律和道德允許的界限內(nèi)對與競爭對手及環(huán)境相關(guān)的信息進(jìn)行收集、分析、總結(jié)和概括,以實(shí)現(xiàn)維護(hù)國家和民族利益,提升綜合國力和國家核心競爭力的目的[1]。經(jīng)濟(jì)領(lǐng)域:經(jīng)濟(jì)信息分析指通過對經(jīng)濟(jì)事物過去和現(xiàn)在狀態(tài)的數(shù)據(jù)和資料信息進(jìn)行深加工,認(rèn)識(shí)和總結(jié)經(jīng)濟(jì)事物發(fā)展的特定規(guī)律,基于科學(xué)的理論方法對其發(fā)展?fàn)顟B(tài)進(jìn)行分析預(yù)測,以期為經(jīng)濟(jì)發(fā)展提供決策依據(jù)[2]。81[1]唐超.國家競爭情報(bào)系統(tǒng)構(gòu)架的基礎(chǔ)性理論框架研究[D].天津:天津師范大學(xué),2008:22.[2]滕佳東.經(jīng)濟(jì)信息管理與分析教程[M].北京:經(jīng)濟(jì)科學(xué)出版社,2001:59.信息分析的概念、類型、特征及作用01參考不同學(xué)者對信息分析概念的界定,信息分析的定義包含3個(gè)部分:結(jié)合研究分析方法。以用戶需求為基礎(chǔ)進(jìn)行數(shù)據(jù)的處理,這里的用戶需求不僅僅局限于科技領(lǐng)域,還包括政治、經(jīng)濟(jì)、軍事等諸多領(lǐng)域。將數(shù)據(jù)處理結(jié)果進(jìn)行深加工以實(shí)現(xiàn)信息增益,從而為不同用戶群體的戰(zhàn)略發(fā)展決策提供支持。82信息分析的概念、類型、特征及作用01大數(shù)據(jù)及人工智能等技術(shù)為信息分析的發(fā)展帶來了機(jī)遇和挑戰(zhàn),而信息分析概念的界定也逐漸模糊化。數(shù)據(jù)分析(DataAnalysis)、信息分析(InformationAnalysis)和情報(bào)分析(IntelligenceAnalysis)常常被認(rèn)為是相同的概念。在很多情境下,信息分析是一種廣義上的理解,其在延伸情報(bào)分析思想的基礎(chǔ)上,以數(shù)據(jù)分析為基礎(chǔ),不斷吸納和融合其他學(xué)科的理論方法,進(jìn)一步加深了學(xué)科間的融合。綜合來看,對信息分析的理解可以從信息鏈的廣義視角作出闡釋,因?yàn)閺谋举|(zhì)上看,信息分析及信息鏈要素上的各種分析都具有相通性或相關(guān)性,在特定情境下則顯示出差異。83信息分析的類型、特點(diǎn)和作用01信息分析的類型:按分析方法劃分?;诜椒ㄐ再|(zhì),信息分析的方法可以劃歸為定性分析方法、定量分析方法以及定性與定量相結(jié)合的方法。按所屬領(lǐng)域劃分。按照信息所屬的不同領(lǐng)域,可將信息分析分為政治信息分析、經(jīng)濟(jì)信息分析、科技信息分析、軍事信息分析和社會(huì)信息分析等。按分析內(nèi)容劃分。按照不同的信息分析內(nèi)容,可將信息分析劃分為評價(jià)信息分析、比較信息分析、跟蹤信息分析和預(yù)測信息分析等。84信息分析的類型、特點(diǎn)和作用01信息分析的特點(diǎn):主體性和針對性。信息分析的主體性和針對性體現(xiàn)在兩方面:一方面,信息分析為特定組織的行為活動(dòng)提供服務(wù)。另一方面,信息分析是以用戶需求為導(dǎo)向,其總是針對特定事物開展,以達(dá)到為生產(chǎn)、決策及科研活動(dòng)服務(wù)的目的。系統(tǒng)性和綜合性。信息分析的系統(tǒng)性體現(xiàn)在信息分析的各個(gè)過程中,包括信息分析中系統(tǒng)化的數(shù)據(jù)采集與處理、信息分析程序及方法的結(jié)構(gòu)化以及信息分析理論、方法和知識(shí)的系統(tǒng)化應(yīng)用。信息分析的綜合性則體現(xiàn)在其對不同來源、不同格式數(shù)據(jù)的整合、定量及定性分析方法的綜合應(yīng)用以及政治、經(jīng)濟(jì)、科技等諸多領(lǐng)域的綜合考量。科學(xué)性和創(chuàng)造性。信息分析是科學(xué)技術(shù)發(fā)展的產(chǎn)物。因此,信息分析工作建立在科學(xué)理論和方法論基礎(chǔ)上,具有科學(xué)研究活動(dòng)的一般特性。此外,信息分析工作在認(rèn)識(shí)事物特性的同時(shí),也致力于挖掘事物發(fā)展的規(guī)律。這個(gè)過程依靠研究人員知識(shí)積淀、敏銳的洞察力和準(zhǔn)確的判斷力,產(chǎn)生新的智力勞動(dòng)成果,因此,信息分析具有創(chuàng)造性。85信息分析的類型、特點(diǎn)和作用01信息分析的作用:為科學(xué)決策服務(wù)。在科學(xué)決策的每一個(gè)環(huán)節(jié),信息分析都扮演著重要的角色,信息分析工作也因此受到各級各類管理者和決策者的重視。為研發(fā)活動(dòng)服務(wù)??萍蓟顒?dòng)以研發(fā)的形式表征。隨著科學(xué)和技術(shù)的發(fā)展,研發(fā)活動(dòng)也日益成為企業(yè)、部門、產(chǎn)業(yè)和國家競爭力的體現(xiàn)。信息分析的功能能夠產(chǎn)生研發(fā)活動(dòng)所需的有序信息資源,這些經(jīng)過深加工的信息資源對科學(xué)研究具有重要的借鑒、啟迪和推動(dòng)作用。為開拓市場服務(wù)。信息分析的預(yù)測和反饋功能支撐其為開拓市場服務(wù),具體體現(xiàn)在結(jié)合內(nèi)部和外部信息資源,幫助用戶識(shí)別市場機(jī)會(huì)、把握方向,精準(zhǔn)突破新的市場,等等。86信息分析的流程02(1)確定分析問題滿足政策制定需要滿足科研項(xiàng)目需求滿足大型工程項(xiàng)目需求滿足產(chǎn)品開發(fā)需求(2)研究計(jì)劃制定問題概述調(diào)查大綱研究方法人員分工完成時(shí)間和實(shí)施步驟預(yù)計(jì)成果形式87(3)信息采集、整理、評估和分析文獻(xiàn)信息采集非文獻(xiàn)信息采集信息形式整理信息內(nèi)容整理(4)報(bào)告撰寫主題確定材料選擇結(jié)構(gòu)設(shè)計(jì)提綱擬定撰寫初稿修改報(bào)告信息分析的發(fā)展趨勢0388分析內(nèi)容的多元化。從決策主體的角度來看,信息分析不僅面向政府和企業(yè)的決策需求,針對個(gè)人的咨詢服務(wù)也逐步興起。從服務(wù)內(nèi)容的角度來看,當(dāng)前信息分析的服務(wù)內(nèi)容已經(jīng)囊括了經(jīng)濟(jì)、政治、社會(huì)、國防等諸多領(lǐng)域乃至細(xì)分領(lǐng)域。因此需要相關(guān)工作者構(gòu)建從多維度、多領(lǐng)域視角開展信息分析研究的觀念和思維。技術(shù)手段的現(xiàn)代化。在大數(shù)據(jù)與智能化環(huán)境下,數(shù)據(jù)資源、算力算法不斷發(fā)展,各種形式的數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)等智能化信息分析軟件得以開發(fā)和利用,從多個(gè)方面提升了信息收集、存儲(chǔ)、分析和處理的能力,從而使得過去信息分析不能研究的問題或者難以研究的問題在技術(shù)賦能下變得可能。信息分析的發(fā)展趨勢0389分析結(jié)果的市場化。信息分析的成果是體現(xiàn)信息分析人員智慧的勞動(dòng)產(chǎn)品。將信息分析的結(jié)果商品化、將信息分析業(yè)務(wù)的經(jīng)營產(chǎn)業(yè)化,是適應(yīng)市場經(jīng)濟(jì)大環(huán)境的必然趨勢。交流協(xié)作的多樣化。信息分析交流與合作的多樣化主要體現(xiàn)在服務(wù)范圍及交流協(xié)作的多樣化。一方面,引入和推進(jìn)與國際接軌的行業(yè)準(zhǔn)則和規(guī)范,建立國際范圍內(nèi)認(rèn)可的工作流程,是實(shí)現(xiàn)信息服務(wù)范圍國際化的關(guān)鍵。另一方面,加強(qiáng)各國對信息分析結(jié)果的交流與協(xié)作,監(jiān)測信息分析的發(fā)展趨勢,了解國際上關(guān)于科技、經(jīng)濟(jì)發(fā)展的動(dòng)向,對推進(jìn)信息分析的多樣化也至關(guān)重要。6.2信息分析基本方法90推理法0191推理法是信息分析的基本邏輯學(xué)方法,推理法是從已知的信息和知識(shí)中推導(dǎo)未知的信息和知識(shí),并獲得新的認(rèn)識(shí)和判斷的邏輯思維方法,其反映了事物之間的內(nèi)在聯(lián)系和發(fā)展趨勢,從而實(shí)現(xiàn)信息分析的預(yù)測功能。推理都是由前提、推理過程和結(jié)論三個(gè)要素組成。一個(gè)正確的推理既要內(nèi)容真實(shí)又要形式正確。推理法0192歸納推理在一個(gè)平面內(nèi),直角三角形內(nèi)角和是180度;銳角三角形內(nèi)角和是180度;鈍角三角形內(nèi)角和是180度。而直角三角形、銳角三角形和鈍角三角形包含了全部三角形。因此,平面內(nèi)所有三角形的內(nèi)角和都是180度。個(gè)別一般推理法0193歸納推理所謂歸納推理就是以有關(guān)某類思維對象個(gè)別或部分個(gè)體的知識(shí)為前提,從中推出關(guān)于該類思維對象全體的一般性知識(shí)的結(jié)論的推理。歸納推理的類型按照其發(fā)展的不同階段可以分為古典和現(xiàn)代兩種。根據(jù)前提中所考察的事物對象的范圍不同,古典歸納邏輯把歸納推理分為完全歸納推理和不完全歸納推理。歸納推理完全歸納推理不完全歸納推理簡單枚舉歸納推理科學(xué)歸納推理推理法0194

推理法0195

推理法0196

推理法0197演繹推理演繹推理是由普通性的前提推出特殊性結(jié)論的推理。按照推理的前提是簡單判斷還是復(fù)合判斷,演繹推理又分為:簡單判斷的推理——三段論等;復(fù)合判斷的推理——假言推理、選言推理等。一般個(gè)別推理法0198

推理法0199演繹推理假言推理:基于一個(gè)假言判斷的前提,推出其前件和后件,并通過肯定其后件或前件來論證原有假言判斷結(jié)論正確性的推理方法。假言判斷是斷定事物之間條件關(guān)系的判斷。假言推理分為充分條件假言推理、必要條件假言推理和充分必要條件假言推理。例如:

如果他是作案人,那他一定有作案時(shí)間,現(xiàn)已查明,他沒有作案時(shí)間;所以,他一定不是作案人。推理法01100演繹推理選言推理:以至少一個(gè)選言判斷為前提,并根據(jù)選言判斷中“各選言支”之間的關(guān)系進(jìn)行推演的推理方式。假言推理分為相容的選言推理和不相容的選言推理。相容的選言推理:

大前提:老舍是畫家或作家;小前提:老舍不是畫家;結(jié)論:老舍是作家不相容的選言推理:

大前提:電動(dòng)汽車要么屬于機(jī)動(dòng)車,要么屬于非機(jī)動(dòng)車小前提:國家規(guī)定,電動(dòng)車按機(jī)動(dòng)車管理結(jié)論:電動(dòng)車不屬于非機(jī)動(dòng)車分析與綜合法02101分析與綜合是人類在認(rèn)識(shí)事物過程中將整體分解為部分,而后將部分整合為整體的邏輯思維方式,其主要解決部分與整體、系統(tǒng)與要素之間的問題。信息分析活動(dòng)中研究對象較為復(fù)雜,分析與綜合方法作為信息加工的基本方法,能夠揭示事物的本質(zhì)和規(guī)律,形成對事物的觀點(diǎn)和看法,被較多應(yīng)用于信息分析與研究工作中。分析與綜合法02102表象和本質(zhì)分析利用事物的表象與本質(zhì)之間的關(guān)系進(jìn)行分析的方法。本質(zhì)是事物的根本性質(zhì),是構(gòu)成事物的關(guān)鍵要素之間的內(nèi)在聯(lián)系。而表象則是事物的表面特征及其外部聯(lián)系。表象和本質(zhì)是揭示事物外部表現(xiàn)和內(nèi)在聯(lián)系間關(guān)系的范疇。通過表象和本質(zhì)分析,能夠透過現(xiàn)象,把握事物的本質(zhì)特征。分析與綜合法02103相關(guān)分析利用事物間的相關(guān)關(guān)系進(jìn)行分析研究,以一種或幾種已知事物來判斷或推知未知事物的方法的統(tǒng)稱。按照事物之間關(guān)聯(lián)關(guān)系的不同,相關(guān)關(guān)系可以分為因果相關(guān)、伴隨相關(guān)等。因果相關(guān):基于已知事物與未知事物之間的因果關(guān)系對事物進(jìn)行研究伴隨相關(guān):基于已知事物與未知事物之間相伴出現(xiàn)的特點(diǎn)對事物進(jìn)行研究。分析與綜合法02104因果分析因果分析是客觀事物各種現(xiàn)象之間的一種普遍的聯(lián)系形式。任何現(xiàn)象都有它產(chǎn)生的原因,任何原因也都必然引起一定的結(jié)果。引起某種現(xiàn)象出現(xiàn)的現(xiàn)象就是原因,由原因的作用而產(chǎn)生的現(xiàn)象就是結(jié)果。只要當(dāng)某一現(xiàn)象出現(xiàn)時(shí),另一現(xiàn)象必定會(huì)接著出現(xiàn),就可認(rèn)為這兩個(gè)現(xiàn)象具備因果關(guān)系。分析與綜合法02105因果分析因果分析通常需要遵循以下三點(diǎn)原則:居先原則:在時(shí)間上,原因在前,結(jié)果在后。共變原則:即結(jié)果跟隨原因的變化而變化關(guān)聯(lián)原則:即原因和結(jié)果作為兩種現(xiàn)象需要互相接觸,或通過一系列中介事物相關(guān)聯(lián)。分析與綜合法02106因果分析因果分析的三種形式:求同法:在不同的場合觀察到相同的現(xiàn)象,這些不同的場合各有若干原因,其中有一個(gè)原因相同,則可初步確定該原因就是產(chǎn)生該現(xiàn)象的共同原因。求異法:所觀察現(xiàn)象在第一種場合出現(xiàn),在第二種場合不出現(xiàn),而這兩種場合只有一個(gè)原因不同,則可初步確定該原因?yàn)橐l(fā)此種現(xiàn)象的原因。共變法:所觀察現(xiàn)象發(fā)生變化的各種場合里,其他原因保持不變,有一個(gè)原因發(fā)生了變化,則可初步確定該原因是使所觀察的現(xiàn)象發(fā)生變化的原因。信息計(jì)量法03107信息計(jì)量學(xué)分為廣義的信息計(jì)量學(xué)和狹義的信息計(jì)量學(xué)。廣義的信息計(jì)量學(xué)探討以廣義信息論為基礎(chǔ)的信息計(jì)量問題,涉及范圍十分廣泛。狹義的信息計(jì)量學(xué)是通常意義上的信息計(jì)量學(xué),主要基于數(shù)學(xué)和統(tǒng)計(jì)學(xué)等定量分析方法對信息的現(xiàn)象、過程和規(guī)律進(jìn)行研究和描述。信息計(jì)量法03108信息計(jì)量學(xué)理論研究方法研究應(yīng)用研究學(xué)科基本問題信息分布變化規(guī)律信息測度指標(biāo)體系建立引文分析法詞頻分析法共現(xiàn)分析法等基于信息計(jì)量學(xué)的基本原理及方法對信息資源加工、整理、分析、解讀對某一學(xué)科或技術(shù)領(lǐng)域的可能的發(fā)展方向進(jìn)行預(yù)測信息計(jì)量法03109引文分析科學(xué)文獻(xiàn)的引用與被引用,代表了科學(xué)知識(shí)的傳承與利用。在科學(xué)文獻(xiàn)體系中,文獻(xiàn)間的關(guān)聯(lián)和相互作用突出表現(xiàn)為文獻(xiàn)間的引用關(guān)系。通過對文獻(xiàn)引證頻次進(jìn)行分析,能夠?qū)崿F(xiàn)對某一學(xué)科、研究人員、期刊、機(jī)構(gòu)、地區(qū)乃至國家科學(xué)水平和學(xué)術(shù)能力的評價(jià)。此外,研究者可以基于科學(xué)文獻(xiàn)引文網(wǎng)絡(luò)探索信息流的方向、規(guī)律和特征,從而挖掘科學(xué)發(fā)展的規(guī)律和方向。引文分析法是利用統(tǒng)計(jì)學(xué)和數(shù)學(xué)、及比較、歸納等邏輯學(xué)方法,對科學(xué)文獻(xiàn)、期刊、著者等分析對象的引證與被引證情況進(jìn)行分析,以揭示其數(shù)量特征及內(nèi)在規(guī)律的分析方法。信息計(jì)量法03110引文分析的分類引文的數(shù)量分析引文的網(wǎng)狀分析引文的鏈狀分析引文分析法引文數(shù)據(jù)庫可視化軟件信息計(jì)量法03111引文分析的測度指標(biāo)測度指標(biāo)表示形式期刊載文量期刊所刊登的論文數(shù)量期刊引用量期刊引用其他期刊的次數(shù)期刊被引量期刊被其他期刊引用的數(shù)量引用率期刊參考文獻(xiàn)總量/期刊載文量影響因子期刊論文的被引量/期刊可引用論文總量表

期刊測度指標(biāo)信息計(jì)量法03112引文分析的測度指標(biāo)測度指標(biāo)表示形式共被引強(qiáng)度兩篇文獻(xiàn)共同被其他論文引用的次數(shù)被自引率主體文獻(xiàn)被自引的次數(shù)/主體被引用的總次數(shù)耦合強(qiáng)度兩篇文獻(xiàn)同時(shí)引用一篇或多篇相同文章的次數(shù)自引率主體本身范圍內(nèi)文獻(xiàn)引用的次數(shù)/主體引用的文獻(xiàn)次數(shù)表

文獻(xiàn)測度指標(biāo)信息計(jì)量法03113引文分析的工具引文分析的工具主要是一些引文數(shù)據(jù)庫,例如美國的《科學(xué)引文索引》(SCI)、《基本科學(xué)指標(biāo)》(ESI)等,國內(nèi)的如《中國科學(xué)引文數(shù)據(jù)庫》(CSCD)、《中國科技論文與引文分析數(shù)據(jù)庫》(CSTPC)、《中國社會(huì)科學(xué)引文索引》(CSSCI)等。美國《科學(xué)引文索引》SCI美國《基本科學(xué)指標(biāo)》ESIGoogleScholar……中國科學(xué)引文數(shù)據(jù)庫CSCD中國科技論文與引文分析數(shù)據(jù)庫CSTPC中國社會(huì)科學(xué)引文索引CSSCI中國人文社會(huì)科學(xué)引文數(shù)據(jù)庫中國引文數(shù)據(jù)庫CCD……信息計(jì)量法03114引文分析的步驟選取統(tǒng)計(jì)對象根據(jù)所要研究的學(xué)科的具體情況,選擇該學(xué)科中有代表性的較權(quán)威的雜志,確定若干期及若干篇相關(guān)論文作為統(tǒng)計(jì)的對象。統(tǒng)計(jì)引文數(shù)據(jù)在選取的若干篇論文中,分項(xiàng)統(tǒng)計(jì)每篇論文后面引文的數(shù)量,引文的出版年代、語種、類型,論文作者的自引量等。進(jìn)行引文分析在獲取的引文數(shù)據(jù)的基礎(chǔ)上,根據(jù)研究的目的,從引文的各種指標(biāo)或其他角度進(jìn)行分析。得出結(jié)論根據(jù)引文分析原理和其他一般原則進(jìn)行判斷和預(yù)測,從而做出相應(yīng)的分析結(jié)論?;貧w分析法04115回歸分析法是運(yùn)用數(shù)理統(tǒng)計(jì)方法,通過兩個(gè)及兩個(gè)以上變量之間的相關(guān)關(guān)系對未來狀況進(jìn)行預(yù)測的一種定量化研究方法。由于回歸分析法提供了建立變量間相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式的一般途徑,且能夠分析所建立公式的適用性以對其進(jìn)行有效的控制和預(yù)測,因此被廣泛應(yīng)用于信息分析領(lǐng)域?;貧w分析法04116回歸分析的基本步驟數(shù)據(jù)搜集設(shè)定回歸方程統(tǒng)計(jì)檢驗(yàn)確定回歸系數(shù)預(yù)測及置信區(qū)間確定回歸分析法04117回歸分析模型的分類回歸分析模型按自變量個(gè)數(shù)分類按變量的關(guān)系分類非線性回歸模型線性回歸模型一元回歸模型多元回歸模型回歸分析法04118

回歸分析法04119

回歸分析法04120

回歸分析法04121多元回歸分析多元回歸模型的統(tǒng)計(jì)檢驗(yàn)t檢驗(yàn)以判斷多元線性回歸方程中系數(shù)的作用是否顯著。F檢驗(yàn)用于判斷多元線性回歸方程在整體上是否顯著成立。R檢驗(yàn)通過負(fù)相關(guān)系數(shù)R的大小來衡量回歸方程擬合真實(shí)數(shù)據(jù)的總近似水平?;貧w分析法04122應(yīng)用:專利知識(shí)吸收和擴(kuò)散演化規(guī)律及影響研究[1]張雪,張志強(qiáng).專利知識(shí)吸收和擴(kuò)散演化規(guī)律及影響研究[J/OL].科研管理:1-18[2021-10-13]./kcms/detail/11.1567.G3.20211001.2012.028.html.社會(huì)網(wǎng)絡(luò)分析法05六度分隔理論:哈佛大學(xué)心理學(xué)教授斯坦利.米爾格蘭姆曾將一封信件隨機(jī)發(fā)送給50名參與者,要求參與者將這封信至一個(gè)股票經(jīng)紀(jì)人手中。最終經(jīng)過六次以內(nèi)的人際傳遞,信的送達(dá)率達(dá)到了97%。任何兩個(gè)人間最多只需要通過六個(gè)中間人建立聯(lián)系,這便是著名的“六度分隔理論”。150定律:英國牛津大學(xué)人類學(xué)家羅賓.鄧巴根據(jù)猿猴的智力與社交網(wǎng)絡(luò)推斷,人類智力允許人類擁有穩(wěn)定社交網(wǎng)絡(luò)的人數(shù)是148人,四舍五入則為150人,這就是著名的“鄧巴數(shù)字”,也叫150定律?!?50定律”指出人們可能擁有更多的好友,但一年內(nèi)至少聯(lián)系一次的好友圈最多由150個(gè)人組成。123起源:社會(huì)網(wǎng)絡(luò)分析[1]BarnesJA.ClassandcommitteesinaNorwegianislandparish[J].Humanrelations,1954,7(1):39-58.[2]TraversJ,MilgramS.Anexperimentalstudyofthesmallworldproblem[M].Princeton:PrincetonUniversityPress,2011:130-148.社會(huì)網(wǎng)絡(luò)分析法05社會(huì)網(wǎng)絡(luò)由多個(gè)點(diǎn)(社會(huì)行動(dòng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論