信息資源管理 課件 6-信息分析_第1頁
信息資源管理 課件 6-信息分析_第2頁
信息資源管理 課件 6-信息分析_第3頁
信息資源管理 課件 6-信息分析_第4頁
信息資源管理 課件 6-信息分析_第5頁
已閱讀5頁,還剩90頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第六章

信息分析《信息資源管理》目錄content2信息分析概述0101信息分析基本方法0202大數(shù)據(jù)分析法0303情報關切下的分析與應用04046.1信息分析概述3長尾理論的提出01美國施樂公司于二十世紀中后期首次推出辦公用復印機,壟斷世界復印機市場。隨著佳能等日本企業(yè)進入復印機市場后,行業(yè)市場競爭加劇,施樂公司因忽略了全球性的信息分析,未能及時調整經(jīng)營戰(zhàn)略,被迫陷入被動地位,其全球市場份額由82%下降到35%。當施樂公司對日本公司的產(chǎn)品和價格進行分析時發(fā)現(xiàn),日本佳能公司復印機的銷售價格與本公司成本價格一致,且并非采用低價傾銷策略。此外,其質量也并不遜色。4案例:美國施樂公司重奪市場份額施樂.加強對競爭對手分析,反敗為勝[EB/OL].[2021-08-26]./auto/db/detail.aspx?db=998001&rid=38長尾理論的提出01通過對日本公司的產(chǎn)品進行細致的信息分析比對,施樂公司發(fā)現(xiàn)對手公司在產(chǎn)品導入時長和所消耗的人力上都只有本公司的一半,且設備安裝時間僅為本公司的三分之一,這便是日本公司成本大幅降低的關鍵原因。為提升市場競爭力,爭奪市場份額,施樂公司加強對對手公司的信息搜集、處理和分析工作,還成立了專門的競爭情報研究部門,并展開了全球性的、全國性的和地區(qū)性的競爭信息分析和研究工作。在制定長期戰(zhàn)略計劃的同時,利用遍布美國的37個銷售網(wǎng)點來收集市場信息,建立相應的顧客信息數(shù)據(jù)庫。此外,施樂公司還專門剖析對手企業(yè)的專利技術和秘密技術等,從而了解對手公司降低產(chǎn)品成本,提升產(chǎn)品質量的制造原理和使用方法。最終,施樂公司奪回了其原有的市場份額。5案例:美國施樂公司重奪市場份額施樂.加強對競爭對手分析,反敗為勝[EB/OL].[2021-08-26].

/auto/db/detail.aspx?db=998001&rid=38長尾理論的提出01為達到擴大市場份額的目的,美國施樂公司綜合運用定性及定量化的信息分析方法來提升市場競爭力,在制定長期戰(zhàn)略計劃的同時,還根據(jù)市場環(huán)境及時調整戰(zhàn)略決策,以達到信息分析的最優(yōu)效果。通過上述案例可以發(fā)現(xiàn),信息分析在企業(yè)提升市場競爭力、降低生產(chǎn)成本、搶占市場份額的過程中發(fā)揮了關鍵作用。只有依靠事實數(shù)據(jù),基于科學的方法對對手企業(yè)進行詳細的剖析,才能做到知己知彼,百戰(zhàn)不殆。6案例:美國施樂公司重奪市場份額信息分析的概念、類型、特征及作用01科研領域:信息分析是運用科學的理論、方法和手段,在搜集、加工和整理海量信息的同時,把握客觀事物發(fā)展運動的規(guī)律[1]。信息分析是以社會用戶的特定需求為依托,采用定量及定性分析方法對文獻信息進行收集、整理、鑒別、評價、分析和綜合,從而形成新的信息產(chǎn)品增益,服務于具有科研性質的智能活動的決策[2]。軍事領域:又稱“情報分析”,軍事情報分析是通過對軍事情報特性、工作規(guī)律和指導規(guī)律進行研究和概括,對軍事情報工作實踐進行思考、分析和總結,從而更好的服務于國防政策制定、指揮作戰(zhàn)的戰(zhàn)略決策的過程[3]。7[1]查先進.信息分析與預測[M].武漢:武漢大學出版社,2000:2.[2]朱慶華.信息分析:基礎、方法及應用[M].北京:科學出版社,2004:4.[3]高金虎.軍事情報學研究現(xiàn)狀與發(fā)展前瞻[J].情報學報,2018,37(5):477-485信息分析的概念、類型、特征及作用01政治領域:政治信息分析指國家機關、團體組織和個人在法律和道德允許的界限內對與競爭對手及環(huán)境相關的信息進行收集、分析、總結和概括,以實現(xiàn)維護國家和民族利益,提升綜合國力和國家核心競爭力的目的[1]。經(jīng)濟領域:經(jīng)濟信息分析指通過對經(jīng)濟事物過去和現(xiàn)在狀態(tài)的數(shù)據(jù)和資料信息進行深加工,認識和總結經(jīng)濟事物發(fā)展的特定規(guī)律,基于科學的理論方法對其發(fā)展狀態(tài)進行分析預測,以期為經(jīng)濟發(fā)展提供決策依據(jù)[2]。8[1]唐超.國家競爭情報系統(tǒng)構架的基礎性理論框架研究[D].天津:天津師范大學,2008:22.[2]滕佳東.經(jīng)濟信息管理與分析教程[M].北京:經(jīng)濟科學出版社,2001:59.信息分析的概念、類型、特征及作用01參考不同學者對信息分析概念的界定,信息分析的定義包含3個部分:結合研究分析方法。以用戶需求為基礎進行數(shù)據(jù)的處理,這里的用戶需求不僅僅局限于科技領域,還包括政治、經(jīng)濟、軍事等諸多領域。將數(shù)據(jù)處理結果進行深加工以實現(xiàn)信息增益,從而為不同用戶群體的戰(zhàn)略發(fā)展決策提供支持。9信息分析的概念、類型、特征及作用01大數(shù)據(jù)及人工智能等技術為信息分析的發(fā)展帶來了機遇和挑戰(zhàn),而信息分析概念的界定也逐漸模糊化。數(shù)據(jù)分析(DataAnalysis)、信息分析(InformationAnalysis)和情報分析(IntelligenceAnalysis)常常被認為是相同的概念。在很多情境下,信息分析是一種廣義上的理解,其在延伸情報分析思想的基礎上,以數(shù)據(jù)分析為基礎,不斷吸納和融合其他學科的理論方法,進一步加深了學科間的融合。綜合來看,對信息分析的理解可以從信息鏈的廣義視角作出闡釋,因為從本質上看,信息分析及信息鏈要素上的各種分析都具有相通性或相關性,在特定情境下則顯示出差異。10信息分析的類型、特點和作用01信息分析的類型:按分析方法劃分?;诜椒ㄐ再|,信息分析的方法可以劃歸為定性分析方法、定量分析方法以及定性與定量相結合的方法。按所屬領域劃分。按照信息所屬的不同領域,可將信息分析分為政治信息分析、經(jīng)濟信息分析、科技信息分析、軍事信息分析和社會信息分析等。按分析內容劃分。按照不同的信息分析內容,可將信息分析劃分為評價信息分析、比較信息分析、跟蹤信息分析和預測信息分析等。11信息分析的類型、特點和作用01信息分析的特點:主體性和針對性。信息分析的主體性和針對性體現(xiàn)在兩方面:一方面,信息分析為特定組織的行為活動提供服務。另一方面,信息分析是以用戶需求為導向,其總是針對特定事物開展,以達到為生產(chǎn)、決策及科研活動服務的目的。系統(tǒng)性和綜合性。信息分析的系統(tǒng)性體現(xiàn)在信息分析的各個過程中,包括信息分析中系統(tǒng)化的數(shù)據(jù)采集與處理、信息分析程序及方法的結構化以及信息分析理論、方法和知識的系統(tǒng)化應用。信息分析的綜合性則體現(xiàn)在其對不同來源、不同格式數(shù)據(jù)的整合、定量及定性分析方法的綜合應用以及政治、經(jīng)濟、科技等諸多領域的綜合考量??茖W性和創(chuàng)造性。信息分析是科學技術發(fā)展的產(chǎn)物。因此,信息分析工作建立在科學理論和方法論基礎上,具有科學研究活動的一般特性。此外,信息分析工作在認識事物特性的同時,也致力于挖掘事物發(fā)展的規(guī)律。這個過程依靠研究人員知識積淀、敏銳的洞察力和準確的判斷力,產(chǎn)生新的智力勞動成果,因此,信息分析具有創(chuàng)造性。12信息分析的類型、特點和作用01信息分析的作用:為科學決策服務。在科學決策的每一個環(huán)節(jié),信息分析都扮演著重要的角色,信息分析工作也因此受到各級各類管理者和決策者的重視。為研發(fā)活動服務??萍蓟顒右匝邪l(fā)的形式表征。隨著科學和技術的發(fā)展,研發(fā)活動也日益成為企業(yè)、部門、產(chǎn)業(yè)和國家競爭力的體現(xiàn)。信息分析的功能能夠產(chǎn)生研發(fā)活動所需的有序信息資源,這些經(jīng)過深加工的信息資源對科學研究具有重要的借鑒、啟迪和推動作用。為開拓市場服務。信息分析的預測和反饋功能支撐其為開拓市場服務,具體體現(xiàn)在結合內部和外部信息資源,幫助用戶識別市場機會、把握方向,精準突破新的市場,等等。13信息分析的流程02(1)確定分析問題滿足政策制定需要滿足科研項目需求滿足大型工程項目需求滿足產(chǎn)品開發(fā)需求(2)研究計劃制定問題概述調查大綱研究方法人員分工完成時間和實施步驟預計成果形式14(3)信息采集、整理、評估和分析文獻信息采集非文獻信息采集信息形式整理信息內容整理(4)報告撰寫主題確定材料選擇結構設計提綱擬定撰寫初稿修改報告信息分析的發(fā)展趨勢0315分析內容的多元化。從決策主體的角度來看,信息分析不僅面向政府和企業(yè)的決策需求,針對個人的咨詢服務也逐步興起。從服務內容的角度來看,當前信息分析的服務內容已經(jīng)囊括了經(jīng)濟、政治、社會、國防等諸多領域乃至細分領域。因此需要相關工作者構建從多維度、多領域視角開展信息分析研究的觀念和思維。技術手段的現(xiàn)代化。在大數(shù)據(jù)與智能化環(huán)境下,數(shù)據(jù)資源、算力算法不斷發(fā)展,各種形式的數(shù)據(jù)挖掘、知識發(fā)現(xiàn)等智能化信息分析軟件得以開發(fā)和利用,從多個方面提升了信息收集、存儲、分析和處理的能力,從而使得過去信息分析不能研究的問題或者難以研究的問題在技術賦能下變得可能。信息分析的發(fā)展趨勢0316分析結果的市場化。信息分析的成果是體現(xiàn)信息分析人員智慧的勞動產(chǎn)品。將信息分析的結果商品化、將信息分析業(yè)務的經(jīng)營產(chǎn)業(yè)化,是適應市場經(jīng)濟大環(huán)境的必然趨勢。交流協(xié)作的多樣化。信息分析交流與合作的多樣化主要體現(xiàn)在服務范圍及交流協(xié)作的多樣化。一方面,引入和推進與國際接軌的行業(yè)準則和規(guī)范,建立國際范圍內認可的工作流程,是實現(xiàn)信息服務范圍國際化的關鍵。另一方面,加強各國對信息分析結果的交流與協(xié)作,監(jiān)測信息分析的發(fā)展趨勢,了解國際上關于科技、經(jīng)濟發(fā)展的動向,對推進信息分析的多樣化也至關重要。6.2信息分析基本方法17推理法0118推理法是信息分析的基本邏輯學方法,推理法是從已知的信息和知識中推導未知的信息和知識,并獲得新的認識和判斷的邏輯思維方法,其反映了事物之間的內在聯(lián)系和發(fā)展趨勢,從而實現(xiàn)信息分析的預測功能。推理都是由前提、推理過程和結論三個要素組成。一個正確的推理既要內容真實又要形式正確。推理法0119歸納推理在一個平面內,直角三角形內角和是180度;銳角三角形內角和是180度;鈍角三角形內角和是180度。而直角三角形、銳角三角形和鈍角三角形包含了全部三角形。因此,平面內所有三角形的內角和都是180度。個別一般推理法0120歸納推理所謂歸納推理就是以有關某類思維對象個別或部分個體的知識為前提,從中推出關于該類思維對象全體的一般性知識的結論的推理。歸納推理的類型按照其發(fā)展的不同階段可以分為古典和現(xiàn)代兩種。根據(jù)前提中所考察的事物對象的范圍不同,古典歸納邏輯把歸納推理分為完全歸納推理和不完全歸納推理。歸納推理完全歸納推理不完全歸納推理簡單枚舉歸納推理科學歸納推理推理法0121

推理法0122

推理法0123

推理法0124演繹推理演繹推理是由普通性的前提推出特殊性結論的推理。按照推理的前提是簡單判斷還是復合判斷,演繹推理又分為:簡單判斷的推理——三段論等;復合判斷的推理——假言推理、選言推理等。一般個別推理法0125

推理法0126演繹推理假言推理:基于一個假言判斷的前提,推出其前件和后件,并通過肯定其后件或前件來論證原有假言判斷結論正確性的推理方法。假言判斷是斷定事物之間條件關系的判斷。假言推理分為充分條件假言推理、必要條件假言推理和充分必要條件假言推理。例如:

如果他是作案人,那他一定有作案時間,現(xiàn)已查明,他沒有作案時間;所以,他一定不是作案人。推理法0127演繹推理選言推理:以至少一個選言判斷為前提,并根據(jù)選言判斷中“各選言支”之間的關系進行推演的推理方式。假言推理分為相容的選言推理和不相容的選言推理。相容的選言推理:

大前提:老舍是畫家或作家;小前提:老舍不是畫家;結論:老舍是作家不相容的選言推理:

大前提:電動汽車要么屬于機動車,要么屬于非機動車小前提:國家規(guī)定,電動車按機動車管理結論:電動車不屬于非機動車分析與綜合法0228分析與綜合是人類在認識事物過程中將整體分解為部分,而后將部分整合為整體的邏輯思維方式,其主要解決部分與整體、系統(tǒng)與要素之間的問題。信息分析活動中研究對象較為復雜,分析與綜合方法作為信息加工的基本方法,能夠揭示事物的本質和規(guī)律,形成對事物的觀點和看法,被較多應用于信息分析與研究工作中。分析與綜合法0229表象和本質分析利用事物的表象與本質之間的關系進行分析的方法。本質是事物的根本性質,是構成事物的關鍵要素之間的內在聯(lián)系。而表象則是事物的表面特征及其外部聯(lián)系。表象和本質是揭示事物外部表現(xiàn)和內在聯(lián)系間關系的范疇。通過表象和本質分析,能夠透過現(xiàn)象,把握事物的本質特征。分析與綜合法0230相關分析利用事物間的相關關系進行分析研究,以一種或幾種已知事物來判斷或推知未知事物的方法的統(tǒng)稱。按照事物之間關聯(lián)關系的不同,相關關系可以分為因果相關、伴隨相關等。因果相關:基于已知事物與未知事物之間的因果關系對事物進行研究伴隨相關:基于已知事物與未知事物之間相伴出現(xiàn)的特點對事物進行研究。分析與綜合法0231因果分析因果分析是客觀事物各種現(xiàn)象之間的一種普遍的聯(lián)系形式。任何現(xiàn)象都有它產(chǎn)生的原因,任何原因也都必然引起一定的結果。引起某種現(xiàn)象出現(xiàn)的現(xiàn)象就是原因,由原因的作用而產(chǎn)生的現(xiàn)象就是結果。只要當某一現(xiàn)象出現(xiàn)時,另一現(xiàn)象必定會接著出現(xiàn),就可認為這兩個現(xiàn)象具備因果關系。分析與綜合法0232因果分析因果分析通常需要遵循以下三點原則:居先原則:在時間上,原因在前,結果在后。共變原則:即結果跟隨原因的變化而變化關聯(lián)原則:即原因和結果作為兩種現(xiàn)象需要互相接觸,或通過一系列中介事物相關聯(lián)。分析與綜合法0233因果分析因果分析的三種形式:求同法:在不同的場合觀察到相同的現(xiàn)象,這些不同的場合各有若干原因,其中有一個原因相同,則可初步確定該原因就是產(chǎn)生該現(xiàn)象的共同原因。求異法:所觀察現(xiàn)象在第一種場合出現(xiàn),在第二種場合不出現(xiàn),而這兩種場合只有一個原因不同,則可初步確定該原因為引發(fā)此種現(xiàn)象的原因。共變法:所觀察現(xiàn)象發(fā)生變化的各種場合里,其他原因保持不變,有一個原因發(fā)生了變化,則可初步確定該原因是使所觀察的現(xiàn)象發(fā)生變化的原因。信息計量法0334信息計量學分為廣義的信息計量學和狹義的信息計量學。廣義的信息計量學探討以廣義信息論為基礎的信息計量問題,涉及范圍十分廣泛。狹義的信息計量學是通常意義上的信息計量學,主要基于數(shù)學和統(tǒng)計學等定量分析方法對信息的現(xiàn)象、過程和規(guī)律進行研究和描述。信息計量法0335信息計量學理論研究方法研究應用研究學科基本問題信息分布變化規(guī)律信息測度指標體系建立引文分析法詞頻分析法共現(xiàn)分析法等基于信息計量學的基本原理及方法對信息資源加工、整理、分析、解讀對某一學科或技術領域的可能的發(fā)展方向進行預測信息計量法0336引文分析科學文獻的引用與被引用,代表了科學知識的傳承與利用。在科學文獻體系中,文獻間的關聯(lián)和相互作用突出表現(xiàn)為文獻間的引用關系。通過對文獻引證頻次進行分析,能夠實現(xiàn)對某一學科、研究人員、期刊、機構、地區(qū)乃至國家科學水平和學術能力的評價。此外,研究者可以基于科學文獻引文網(wǎng)絡探索信息流的方向、規(guī)律和特征,從而挖掘科學發(fā)展的規(guī)律和方向。引文分析法是利用統(tǒng)計學和數(shù)學、及比較、歸納等邏輯學方法,對科學文獻、期刊、著者等分析對象的引證與被引證情況進行分析,以揭示其數(shù)量特征及內在規(guī)律的分析方法。信息計量法0337引文分析的分類引文的數(shù)量分析引文的網(wǎng)狀分析引文的鏈狀分析引文分析法引文數(shù)據(jù)庫可視化軟件信息計量法0338引文分析的測度指標測度指標表示形式期刊載文量期刊所刊登的論文數(shù)量期刊引用量期刊引用其他期刊的次數(shù)期刊被引量期刊被其他期刊引用的數(shù)量引用率期刊參考文獻總量/期刊載文量影響因子期刊論文的被引量/期刊可引用論文總量表

期刊測度指標信息計量法0339引文分析的測度指標測度指標表示形式共被引強度兩篇文獻共同被其他論文引用的次數(shù)被自引率主體文獻被自引的次數(shù)/主體被引用的總次數(shù)耦合強度兩篇文獻同時引用一篇或多篇相同文章的次數(shù)自引率主體本身范圍內文獻引用的次數(shù)/主體引用的文獻次數(shù)表

文獻測度指標信息計量法0340引文分析的工具引文分析的工具主要是一些引文數(shù)據(jù)庫,例如美國的《科學引文索引》(SCI)、《基本科學指標》(ESI)等,國內的如《中國科學引文數(shù)據(jù)庫》(CSCD)、《中國科技論文與引文分析數(shù)據(jù)庫》(CSTPC)、《中國社會科學引文索引》(CSSCI)等。美國《科學引文索引》SCI美國《基本科學指標》ESIGoogleScholar……中國科學引文數(shù)據(jù)庫CSCD中國科技論文與引文分析數(shù)據(jù)庫CSTPC中國社會科學引文索引CSSCI中國人文社會科學引文數(shù)據(jù)庫中國引文數(shù)據(jù)庫CCD……信息計量法0341引文分析的步驟選取統(tǒng)計對象根據(jù)所要研究的學科的具體情況,選擇該學科中有代表性的較權威的雜志,確定若干期及若干篇相關論文作為統(tǒng)計的對象。統(tǒng)計引文數(shù)據(jù)在選取的若干篇論文中,分項統(tǒng)計每篇論文后面引文的數(shù)量,引文的出版年代、語種、類型,論文作者的自引量等。進行引文分析在獲取的引文數(shù)據(jù)的基礎上,根據(jù)研究的目的,從引文的各種指標或其他角度進行分析。得出結論根據(jù)引文分析原理和其他一般原則進行判斷和預測,從而做出相應的分析結論。回歸分析法0442回歸分析法是運用數(shù)理統(tǒng)計方法,通過兩個及兩個以上變量之間的相關關系對未來狀況進行預測的一種定量化研究方法。由于回歸分析法提供了建立變量間相關關系的數(shù)學表達式的一般途徑,且能夠分析所建立公式的適用性以對其進行有效的控制和預測,因此被廣泛應用于信息分析領域?;貧w分析法0443回歸分析的基本步驟數(shù)據(jù)搜集設定回歸方程統(tǒng)計檢驗確定回歸系數(shù)預測及置信區(qū)間確定回歸分析法0444回歸分析模型的分類回歸分析模型按自變量個數(shù)分類按變量的關系分類非線性回歸模型線性回歸模型一元回歸模型多元回歸模型回歸分析法0445

回歸分析法0446

回歸分析法0447

回歸分析法0448多元回歸分析多元回歸模型的統(tǒng)計檢驗t檢驗以判斷多元線性回歸方程中系數(shù)的作用是否顯著。F檢驗用于判斷多元線性回歸方程在整體上是否顯著成立。R檢驗通過負相關系數(shù)R的大小來衡量回歸方程擬合真實數(shù)據(jù)的總近似水平?;貧w分析法0449應用:專利知識吸收和擴散演化規(guī)律及影響研究[1]張雪,張志強.專利知識吸收和擴散演化規(guī)律及影響研究[J/OL].科研管理:1-18[2021-10-13]./kcms/detail/11.1567.G3.20211001.2012.028.html.社會網(wǎng)絡分析法05六度分隔理論:哈佛大學心理學教授斯坦利.米爾格蘭姆曾將一封信件隨機發(fā)送給50名參與者,要求參與者將這封信至一個股票經(jīng)紀人手中。最終經(jīng)過六次以內的人際傳遞,信的送達率達到了97%。任何兩個人間最多只需要通過六個中間人建立聯(lián)系,這便是著名的“六度分隔理論”。150定律:英國牛津大學人類學家羅賓.鄧巴根據(jù)猿猴的智力與社交網(wǎng)絡推斷,人類智力允許人類擁有穩(wěn)定社交網(wǎng)絡的人數(shù)是148人,四舍五入則為150人,這就是著名的“鄧巴數(shù)字”,也叫150定律?!?50定律”指出人們可能擁有更多的好友,但一年內至少聯(lián)系一次的好友圈最多由150個人組成。50起源:社會網(wǎng)絡分析[1]BarnesJA.ClassandcommitteesinaNorwegianislandparish[J].Humanrelations,1954,7(1):39-58.[2]TraversJ,MilgramS.Anexperimentalstudyofthesmallworldproblem[M].Princeton:PrincetonUniversityPress,2011:130-148.社會網(wǎng)絡分析法05社會網(wǎng)絡由多個點(社會行動者)和各點之間的連線(行動者之間的關系)組成,是指由多個組織或者個人的節(jié)點所構成的社會結構,且能夠展現(xiàn)節(jié)點之間的關聯(lián)關系。社會網(wǎng)絡分析是對社會關系結構及其屬性進行分析的一套規(guī)范和方法。51社會網(wǎng)絡分析法05社會網(wǎng)絡分析方法的步驟確定研究問題明確研究對象和層次研究對象的選擇和抽樣數(shù)據(jù)收集數(shù)據(jù)整理和表示52社會網(wǎng)絡分析法05科研合作網(wǎng)絡分析科研合作網(wǎng)絡是社會網(wǎng)絡的一種重要形式,其形成基于研究主體間合作發(fā)文的交互關系??蒲泻献骶W(wǎng)絡是無向網(wǎng)絡,對科研合作網(wǎng)絡指標的深入挖掘能夠從宏觀和微觀角度呈現(xiàn)網(wǎng)絡的結構屬性和內在規(guī)律。53社會網(wǎng)絡分析法05

54社會網(wǎng)絡分析法05

55社會網(wǎng)絡分析法05

56社會網(wǎng)絡分析法05

57社會網(wǎng)絡分析法05圖中的政務Twitter用戶之間的聯(lián)系較為緊密,這說明相同類型的政務Twitter用戶之間容易相互關注。其次,不同用戶在該網(wǎng)絡中的關注者數(shù)量差異較大,且具有一定的聚集效應。58案例:基于社會網(wǎng)絡分析的政務微博影響力研究[1]吳錦池,余維杰.基于社會網(wǎng)絡分析的政務微博影響力研究[J].情報科學,2021,39(02):78-85.6.3大數(shù)據(jù)分析法59關聯(lián)分析01在美國沃爾瑪連鎖超市中,有管理人員在進行銷售記錄分析時發(fā)現(xiàn),嬰兒的尿不濕和啤酒這兩種看起來毫不相關的商品,其銷售數(shù)據(jù)曲線竟十分相似。于是,銷售人員就將尿布與啤酒擺放在一起進行售賣,而這一舉措也成功使尿布和啤酒的銷量大幅上升。這一現(xiàn)象是由于美國婦女通常在家照顧孩子,所以她們經(jīng)常會囑咐下班回家的丈夫讓其為孩子買尿不濕,而丈夫在買尿不濕的同時又會順手購買自己喜歡喝的啤酒。60案例:尿布和啤酒關聯(lián)分析01關聯(lián)分析又叫關聯(lián)挖掘,是無監(jiān)督算法的一種。從上述案例可以看出,關聯(lián)分析能夠從大量數(shù)據(jù)中挖掘潛在的關聯(lián)性和相關性,從而對一個事務中某些屬性同時出現(xiàn)的規(guī)律和模式進行描述。關聯(lián)分析的基本概念:項集(Itemset):由多個項組成的集合。若一個項集包括k個項,則稱其為“k-項集”,k表示項集的長度。關聯(lián)規(guī)則(Associationrules):若X和Y表示不相交的兩個項集,則X→Y則表示兩個項集間的關聯(lián)規(guī)則。通過支持度和置信度能夠衡量關聯(lián)規(guī)則的強度,強關聯(lián)規(guī)則同時滿足最小支持度和置信度。支持度計數(shù)(Supportcount):表示指定項集出現(xiàn)的頻數(shù),用σ表示。支持度(Support):所有事務中,指定項集出現(xiàn)頻次所占比重。置信度(Confidence):表示Y在X的交易中出現(xiàn)的頻繁程度。頻繁項集(Frenquentitemset):支持度大于等于所設定閾值的項集。61[1]徐涵.大數(shù)據(jù)、人工智能和網(wǎng)絡輿情治理[M].武漢:武漢大學出版社,2018:161.關聯(lián)分析01先驗原理1:如果一個項集是頻繁的,則其所有子集也一定是頻繁的。先驗原理2:如果一個項集是非頻繁的,則其所有超集也是非頻繁的62圖

先驗原理1圖

先驗原理2[1]TanP,SteinbachM,KumarV.數(shù)據(jù)挖掘導論(完整版)[M].范明,范宏建,譯.北京:人民郵電出版社,2011:281.關聯(lián)分析01Apriori算法Apriori算法是挖掘布爾型關聯(lián)規(guī)則頻繁項集的最基礎和經(jīng)典的算法②,其核心思想是通過多次掃描數(shù)據(jù)庫并逐層迭代的方式來探索數(shù)據(jù)庫中項集的關系。Apriori算法中支持度(Support)、置信度(Confidence)、頻繁項集三個概念至關重要。Apriori算法的基本步驟:基于逐層搜索的迭代方式,k-項集用于搜索(k+1)-項集?;谧钚≈С侄龋@得頻繁1-項集的集合L1,再基于L1找到頻繁2-項集,以此類推,直到不能找到頻繁k-項集連接:基于找到的Lk集合,將其兩兩連接,其中必有k-1個屬性是相同的,產(chǎn)生候選集Ck+1剪枝:候選集中并不都是頻繁項集,基于閾值剪枝后得到頻繁k-項集的集合Lk。基于所得到的頻繁k-項集,以置信度閾值為標準,挖掘產(chǎn)生強關聯(lián)規(guī)則。63分類分析02在信息分析領域,分類能夠對已知類別數(shù)據(jù)進行分析,從中發(fā)現(xiàn)分類規(guī)則,以預測新數(shù)據(jù)類別的數(shù)據(jù)挖掘方法,這不僅解決了傳統(tǒng)信息分析面對大數(shù)據(jù)無法有效處理的問題,同時也擴寬了信息分析的應用范圍。當前,分類算法是應用最為廣泛的數(shù)據(jù)挖掘方法,是有監(jiān)督學習的一種。數(shù)據(jù)分類算法中的基本概念:訓練集(TrainingSet):為建立模型而被分析的數(shù)據(jù)集合為訓練集。其中的單一樣本為訓練樣本。分類器(Classifier):通過對訓練集的訓練生成的用于分類的模型。測試集(TestingSet):將分類器應用于測試集,能夠對分類器的準確性和性能進行評價。當未達到理想效果,就需要對訓練集重新訓練,直到分類器的準確性和性能達到要求。將分類器應用于未分類的新數(shù)據(jù)中,就可以對數(shù)據(jù)所屬類別進行預測。64分類分析0265圖

分類算法原理分類分析02常見的分類算法樸素貝葉斯算法(Na?veBayesClassifier,NBC):一種基于概率統(tǒng)計原理進行分類的算法,其基于貝葉斯定理對樣本所屬類別的概率進行預測。決策樹(DecisionTree):基于決策判斷樹對無次序、無規(guī)則的實例進行歸納學習,并推理出樹形結果的分類規(guī)則。支持向量機(SupportVectorMachine,SVM):對數(shù)據(jù)進行二元分類的廣義分類器,其決策邊界為對學習樣本求解的最大邊距超平面。支持向量機最終的決策函數(shù)僅由少量支持向量確定,得到局部最優(yōu)解,從而避免了高維樣本數(shù)據(jù)計算的復雜性,大大簡化了分類問題。K-近鄰算法:數(shù)據(jù)挖掘分類技術中最簡單、常用的方法之一。66K-近鄰分類算法K-近鄰算法根據(jù)與所需預測點最近的幾個樣本值來推斷預測點的結果。相比于其他分類算法,K-近鄰分類算法是一種懶惰學習算法,因為這種算法并沒有實際的訓練過程,也不產(chǎn)生真實意義上的“分類模型”,而只是將訓練樣本按原樣保存,當需要分類新樣本時,與其最近的k個樣本就可代表新樣本的類別。分類分析0267圖K-近鄰分類示意圖

來源:/p/25994179聚類分析是指基于樣本特征之間的相似性程度,對一批沒有標記類別的模式樣本集進行分類的過程。其中,樣本特征之間的相似性程度是以樣本間的距離遠近作為評價指標,即兩個樣本的距離越近,則其相似性就越大。聚類分析與分類分析的區(qū)別:分類問題是在特定類別標識下探尋新樣本的所屬類別。聚類分析所劃分的類別是未知的,是通過對樣本數(shù)據(jù)集的分析比較來生成新的類標識。聚類分析0368圖

聚類分析原理示意圖聚類分析的步驟:聚類分析0369相似度計算和分組特征獲取和選擇特征標準化和降維存儲準備分析階段(使用聚類結果進行分析,考察結論是否科學合理)數(shù)據(jù)準備聚類結果展示聚類結果評估聚類階段(構建聚類模型)聚類統(tǒng)計量:①距離②相關系數(shù)數(shù)據(jù)對象的多樣性基于模型的算法基于劃分的算法基于密度的算法基于網(wǎng)格的算法層次聚類算法……可視化:Ucinet、Pajek、CiteSpace分析工具:SPSS、SAS、STAT、S-Plus語言:R、python……其他:Matlab、Ntsys、Weka……提高聚類效果聚類分析的類型:基于分層的聚類。這種聚類方法是對給定的數(shù)據(jù)集進行逐層分解。初始時,每個數(shù)據(jù)記錄為單獨的一組,在迭代過程中不斷將相互臨近的組合成為一組,直到所有記錄組成一個分組為止。由于分解策略不同,這種聚類方法分為“分類法”和“凝聚法”兩種。典型的算法包括BIRCH算法、CURE算法等?;趧澐值木垲悺_@種聚類方法是將包含n個對象的數(shù)據(jù)庫劃分成k類,其中k≤n。k值由用戶指定,對于給定的k,首先由算法給出初始分組,并通過反復迭代的方式,基于上述基本聚類原理確定最優(yōu)分組。典型的算法包括K-means算法、K-medoids算法等。聚類分析0370聚類分析的類型:基于密度的聚類。基于密度的聚類方法彌補了層次聚類算法和劃分聚類算法等只能發(fā)現(xiàn)凸形聚類簇的缺陷,其通過將區(qū)域內點的密度與閾值相比較,如果密度大于閾值,則將其加入到相近的聚類,該方法中閾值的設定是以用戶經(jīng)驗為主。典型的算法包括DBSCAN算法等。基于模型的聚類。這種聚類方法針對數(shù)據(jù)對象集合以潛在的混合概率分布為基礎生成假設,且給每一個聚類假定一個模型,試圖將給定數(shù)據(jù)與假定的數(shù)據(jù)模型達成最佳擬合。典型的算法包括期望最大化方法、自組織神經(jīng)網(wǎng)絡方法及概念聚類等。聚類分析0371聚類分析的類型:基于網(wǎng)格的聚類。這種聚類方法將數(shù)據(jù)對象所在的空間劃分為有限數(shù)目的單元,從而形成網(wǎng)格結構,通過對網(wǎng)格進行聚類操作來得到聚類結果。由于該方法處理時間僅與每一維空間所劃分的單元數(shù)量有關,因此具有處理時間短等優(yōu)點。典型算法包括STING算法等。聚類分析0372K-means算法K-means算法是典型的基于距離進行劃分的聚類算法。由于該方法簡單、操作便捷、且具有高效處理大量數(shù)據(jù)的優(yōu)勢,是數(shù)據(jù)挖掘領域較為常用的一種聚類算法。K-means算法也被稱為快速聚類和動態(tài)聚類。k是指研究者制定的聚類數(shù)目,means是指聚心,為一個聚類的凝聚點。聚類分析0373K-means算法K-means算法的步驟:分析變量的確定;從n個數(shù)據(jù)對象中選定k個對象作為初始聚類中心;按照距初始聚心距離最小的原則將各數(shù)據(jù)對象分配到各聚心所在類別,完成第一次迭代。計算每個聚類中數(shù)據(jù)對象的均值,并依照均值再次計算各數(shù)據(jù)對象到聚心的距離,按照照最小距離原則重新劃分聚類。重復③-④步,經(jīng)過t次迭代,直至每個聚類中數(shù)據(jù)對象不再發(fā)生變化,輸出最終的聚類結果。聚類分析0374K-means算法K-means算法的優(yōu)點:不需要在計算機處理過程中存儲距離矩陣,因而其占據(jù)的存儲空間和計算工作量較小,適用于大樣本文件的聚類分析。簡單、快速、且對大數(shù)據(jù)集的處理效率較高并具有可伸縮性。聚類分析03756.4情報關切下的分析與應用76競爭情報是指經(jīng)過篩選、提煉和分析后,可據(jù)之采取行動的關于競爭對手和商業(yè)環(huán)境的信息集合。競爭情報的層次在戰(zhàn)術層面,競爭情報分析要解決既定戰(zhàn)役目標下的競爭模式及其實現(xiàn),在其作用時限內(三個月-一年)為短期的任務提供清晰的指導;在戰(zhàn)役層面,競爭情報分析服務于企業(yè)既定戰(zhàn)略下所要達成的目標。根據(jù)Fahey的觀點,在該層面競爭情報分析關注市場戰(zhàn)略;資產(chǎn)、能力/素質、技術;活動/價值鏈、網(wǎng)絡;假設;基礎設施、文化等方面的要素。在戰(zhàn)略層面,競爭情報分析關注實現(xiàn)目標的關鍵資源投入和運用,最典型的分析框架是Porter的五力競爭模型。在愿景層面,競爭情報分析需要回答企業(yè)“在長期想要達成的目標”或它“如何看待自己”這一重大問題。該層面的競爭情報分析框架更為廣泛,遠遠超出企業(yè)邊界乃至行業(yè)邊界。競爭情報分析0177競爭情報的關鍵問題與競爭對手的比較挖掘與競爭對手的聯(lián)盟關系及產(chǎn)品的潛在市場對細分競爭市場未來前景的預測以及從總體上把握競爭對手的戰(zhàn)略競爭情報的分析方法基礎商業(yè)分析的常用方法,例如核心競爭能力分析、企業(yè)戰(zhàn)略分析、財務分析、產(chǎn)品、價格及市場分析等。完全信息條件下的分析方法,可以看作是經(jīng)典的信息分析方法。例如時間序列分析、標桿分析、關鍵成功因素分析、SWOT分析、價值鏈分析、戰(zhàn)爭游戲法、博弈分析、層次分析、投入-產(chǎn)出分析等等。不完全信息條件下的分析方法,例如信號分析、片段情報分析、內容分析、競爭性假設分析、預警分析等等。這一類分析方法最能體現(xiàn)競爭情報分析的“競爭”二字。競爭情報分析0178科學注重對理論方法的探索,其目的是在現(xiàn)象中尋求本質而完成知識創(chuàng)造的過程,是對自然現(xiàn)象進行闡述的理論成果。技術是人類在解決實際問題中所采用的方法和手段,其以物質形態(tài)呈現(xiàn)新的技術、工藝和方法等,通過改造客觀世界來滿足人們的需求。隨著科學和技術的轉化周期不斷縮短,科學與技術也逐漸發(fā)展成為不可分割的整體。科技情報分析0279科技情報信息是通過基礎研究、應用研究和開發(fā)研究三個層次的科技活動產(chǎn)生、存儲、轉換和加工形成的各種信息??萍记閳笮畔⑹怯嘘P科學及技術活動的一切信息的總稱??萍记閳蟮姆治雠c研究是指按需求基于信息載體所傳遞的科學技術信息或知識單元,即基于用戶的特定需求,在廣泛搜集和整理科技情報信息及資料的基礎上,基于科學的分析方法對科技情報信息進行整理、歸納和評估以提出具有預測性質的研究結論的過程??萍记閳蠓治?280[1]盧小賓.信息分析[M].北京:科學技術文獻出版社,2008:199.[2]劉全根.科技情報分析研究[M].蘭州:甘肅科學技術出版社,1993:7.科技情報分析研究的特征針對性??萍记閳蠓治鲂枰忻鞔_的研究目的,這種目的是為了滿足用戶的某種需求。綜合性。與信息分析相似,科技情報研究不僅在科技領域展開,還廣泛應用于經(jīng)濟、政治和社會等諸多領域。時效性。情報分析需要在用戶特定需求下,精準的為用戶服務,才能發(fā)揮其最大的社會效益和經(jīng)濟效益。如果錯過了需求的時效性,則情報分析也失去了價值。交叉性。科技情報分析的交叉性不僅體現(xiàn)在研究領域的交叉,也體現(xiàn)在研究方法的交叉。科技情報分析0281科技情報分析研究的過程科技情報分析0282圖

科技情報分析流程[1]呂斌,李國秋.信息分析新論[M].北京/西安:世界圖書出版公司,2018:62.專利分析專利的分類專利分為發(fā)明專利、實用新型專利以及外觀設計專利三種類型。發(fā)明分為產(chǎn)品發(fā)明和方法發(fā)明兩類。中國《專利法》規(guī)定,發(fā)明是指對產(chǎn)品、方法或者其改進所提出的新的技術方案,發(fā)明專利的有效期為20年。實用新型專利是指產(chǎn)品的形狀、構造或者其結合所提出的適于實用的新的技術方案,其保護期限為10年。實用新型專利只針對具有立體形狀、構造的產(chǎn)品而言,且產(chǎn)品必須能夠在產(chǎn)業(yè)上利用,具有實用性。外觀設計是指對產(chǎn)品的形狀、圖案以及色彩與形狀、圖案的結合所做出的富有美感并適用于工業(yè)應用的新設計,其有效期為10年??萍记閳蠓治?283專利分析專利的特征獨占性:對同一內容的發(fā)明創(chuàng)造,國家只授予一項專利權,且在一定的時間(專利權有效期)和地域(法律管轄區(qū))內,任何單位和個人若未經(jīng)專利權人許可,不得以生產(chǎn)經(jīng)營為目使用、制造、銷售進口,或使用其專利方法制造、許諾銷售、銷售、進口其專利產(chǎn)品。時效性:專利僅在法律規(guī)定的有效期保護期內有效,當保護期限結束后,專利權則自動失效,成為公共財富,可供他人無償使用。區(qū)域性:專利的空間限制性,指一個國家授予的專利權,僅在該國的轄區(qū)內有效,其他國家和地區(qū)對其不具有法律約束力??萍记閳蠓治?284[1]劉海桑.決策情報學從概念、框架到應用[M].廈門:廈門大學出版社,2018:160-161.[2]曹彩英.科技信息資源檢索[M].北京:海洋出版社,2013:157.專利分析專利分析的類型科技情報分析0285圖

專利分析方法專利分析的類型定量分析方法是在對大量專利文獻進行加工整理的基礎上,對專利的申請人、專利引用以及專利分類等特征進行科學計量分析。從而將零散的、分散的專利信息整合成為完整的、有價值的情報信息。定性分析方法則是基于演繹、歸納推理等定性分析方法提取專利文獻的內在特征,來呈現(xiàn)某一具體技術領域的發(fā)展狀態(tài)??萍记閳蠓治?286技術預見技術預見(TechnologyForesight)是一種對科技、經(jīng)濟與社會的未來進行系統(tǒng)研究的情報收集過程,其致力于信息一體化以及資源的優(yōu)化配置,是一種戰(zhàn)略管理工具。\技術預見的分類(基于技術預見的功能和過程)調查研究方法:包括情景分析法、頭腦風暴法、社會需求調查法等分析評估方法:對技術是否具有發(fā)展前景進行科學評價,主要包括科學計量學法、模型模擬以及專利分析法科技情報分析0287[1]曾忠祿.21世紀商業(yè)情報分析、理論、方法與案例[M].北京:中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論