文獻計量與內容分析的一致性邏輯_第1頁
文獻計量與內容分析的一致性邏輯_第2頁
文獻計量與內容分析的一致性邏輯_第3頁
文獻計量與內容分析的一致性邏輯_第4頁
文獻計量與內容分析的一致性邏輯_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

文獻計量與內容分析的一致性邏輯

1文獻計量、內容分析的應用文獻計量和內容分析是研究和信息科學的一般方法。文獻計量起源于對科技文獻數(shù)量特征的考察;內容分析最初是傳播學研究中特有的方法,后來被推廣到幾乎所有社會科學領域,也少量地應用于對科技文獻的分析。近年來,隨著文獻計量、內容分析各自理論與方法體系的成熟,其應用也在不斷擴展,并有相互交叉融合的趨勢,表現(xiàn)在對于某些特定的研究案例,無法簡單地判定其究竟是屬于文獻計量方法還是內容分析方法。有人認為,內容分析是文獻計量的一個分支,只是各自側重點不同,但這種說法并未得到廣泛認可。因此,如何認識這兩種重要的研究方法的本質、相互關系以及兩者整合應用的可能性,將是本文所力圖探究的問題。2文獻計量法的特征與內容分析方法的性質相比2.1研究的理論有以下幾種傳播學家伯納德·貝雷爾森給出了對內容分析法的權威定義:“一種對具有明確特征的傳播內容進行的客觀、系統(tǒng)和定量的描述的研究技術”。本文作者之一——邱均平教授對文獻計量學有如下定義:“以文獻體系和文獻計量特征為研究對象,采用數(shù)學、統(tǒng)計學等的計量方法,研究文獻情報的分布結構、數(shù)量關系、變化規(guī)律和定量管理,并進而探討科學技術的某些結構、特征和規(guī)律的一門學科”。2.2文獻計量法與內容分析法客觀、系統(tǒng)和定量的特征描述,不僅適用于內容分析法,對文獻計量法也同樣適用。另外,筆者認為它們在方法上都有較為簡單、直觀、粗略和間接、非接觸的特點。2.2.1類目體系的可驗證性用事實和數(shù)據(jù)說話,是兩者客觀性的主要表現(xiàn)。所分析的對象,對于文獻計量來講,是十分顯著的文獻外部特征;對于內容分析來講,則是有明確特征的傳播內容。它們都從不憑空推測分析對象背后的可能含義,而依賴于固有的分析程序來得出結果;一旦研究目的與范圍確定,就要盡量排除人為因素的影響,做到客觀、無偏向;所選擇的類目體系應科學,具有可驗證的合理性;同樣的對象和程序如果由不同的人來進行,應能得到相同的結果;對于編碼后得出的統(tǒng)計數(shù)據(jù),一般還要進行信度檢驗,確保數(shù)據(jù)偏差在正常范圍內。2.2.2確定數(shù)據(jù)統(tǒng)計的依據(jù)一般而言,文獻計量與內容分析的對象都是大量的、系統(tǒng)化的、具有一定歷時性的文獻;都要面對如何確定調查范圍和取樣的問題。系統(tǒng)化調查取樣是進行數(shù)據(jù)統(tǒng)計的基本前提,必須有足夠的數(shù)據(jù)來克服可能出現(xiàn)的隨機偏差。除語言符號分析等特殊情形之外,單個的、少量的文獻通常不能作為分析的依據(jù)。2.2.3文獻計數(shù)模型即都涉及某些定量化過程,通過將文獻特征表示成一些數(shù)量指標來進行統(tǒng)計和推測。文獻計量以幾個經(jīng)驗定律為核心,直接對一個個的文獻外部特征等予以計數(shù),所使用的數(shù)學模型略微復雜一些;內容分析大多采用人工判讀的方式將分析單元歸入某個類目,進行簡單的計數(shù)統(tǒng)計,再加以比較分析。2.2.4內容分析,主要關注研究的內容表現(xiàn)在分析單元的選取上,都比較粗略。文獻計量中采用的一些計量指標以簡單的文獻數(shù)量作為核心,如文獻增長率、老化率、借閱流通率、被引次數(shù)、科學生產率等。它并不關心更細致的內容之間的差別。內容分析雖然深入到了文獻內容的層次,但也只限于“具有明確特征”的內容,如判讀電視廣告中的某個人物形象是否具有女性歧視意味等。在數(shù)學處理上,內容分析以直觀的線性計數(shù)與統(tǒng)計為主;文獻計量則用到了幾個復雜一點的經(jīng)驗定律,也仍然以驗證性的應用為主。與現(xiàn)代數(shù)據(jù)挖掘中所用到的某些復雜算法相比,文獻計量與內容分析的量化處理具有簡單、易用、明了的特點。2.2.5非接觸它們都是通過二手資料進行的間接、非接觸式的研究方法,這一點與社會調查、訪談、實驗等研究方法有著根本的不同。2.3不同的東西體現(xiàn)在以下幾個方面:2.3.1科學文獻篩選文獻計量的指標以文獻的外部特征為主,故只適用于有實體形態(tài)的科學文獻。而內容分析不僅適用于對科學文獻內容的分析,而且也可用于非科學領域的一般文獻的分析以及無文獻實體的語言傳播的分析,甚至可推廣到動作、行為等非語言內容的分析。2.3.2內容分析的應用文獻計量學是圖書館學情報學的特殊研究方法,主要用于對科學文獻的研究,對各門學科都適用。內容分析發(fā)源于傳播學研究,現(xiàn)已推廣到社會科學各個領域,如政治、軍事、教育等,在科技領域的應用則比較少。目前還很難說內容分析到底是哪一個學科的專有方法。2.3.3指標體系與類目體系所謂粒度,是指所選取分析單元的大小。顯然,注重文獻外部特征的文獻計量法,其分析粒度要比注重文獻內容特征的內容分析法粗。文獻計量法中,量化的核心是以件、篇、個為單位計算的實體數(shù)目,其他所有計量指標如增長率、老化率、流通率、引文率、被引率等,都是在此基礎之上的衍生。因此,文獻計量法中的指標體系具有一元性特征,指標穩(wěn)定且系統(tǒng)化。內容分析大多采用類似“有、無”的二度指標,或類似“正面、負面、中立”的三度、五度指標,少數(shù)采用七度指標,在此基礎上計算各度指標出現(xiàn)的頻次。不同的是,文獻計量的類目體系是直觀的,文獻、作者、機構、期刊、學科、引文,都一目了然且是有限的。而內容分析所依據(jù)的類目體系則十分不穩(wěn)定、不系統(tǒng),經(jīng)常要根據(jù)研究目的的不同而自行設定。類目體系的確立可以說是內容分析法的關鍵,但它卻是一個相當主觀的、人為的、定性的過程。所以內容分析法的指標體系具有多元性特征,不存在一個統(tǒng)一而穩(wěn)定的指標系統(tǒng)。2.3.4紀念等級內容分析對數(shù)學方法的運用還處于初級階段,屬于半定量化的研究方法。相比而言,文獻計量的量化程度更高一些,數(shù)學上的處理更為成熟。2.3.5內容分析的研究目的和方法按照邱均平教授對文獻計量學的概念定義,文獻計量的目標在于“研究文獻情報的分布結構、數(shù)量關系、變化規(guī)律和定量管理,并進而探討科學技術的某些結構、特征和規(guī)律”,可見其主要致力于對文獻群實體自身運動變化規(guī)律的研究,謀求改進文獻信息的管理,提高文獻信息交流效率。至于通過文獻計量對科學技術規(guī)律加以推斷,其實是間接的和輔助性的。這本是文獻計量學的原義。而按照傳播學研究的通常說法,內容分析的目標可以歸納為三點:①將傳播內容與社會現(xiàn)實進行比較;②推斷信息傳播者的態(tài)度、傾向;③推斷傳播效果??梢?內容分析法從不以其所依據(jù)的文獻信息本身作為研究目的。3質與概念的一致性通過以上對比,筆者基于文獻計量與內容分析法的相似性推斷,這種相似性有可能反映了它們的某種共同本質,即有可能采用某種一致性的程序框架予以承載。這種框架可以描述為:借助某種形式化體系及其運算集,將客觀實在經(jīng)過簡化映射為抽象的概念符號,從而可以量化運算與推導,發(fā)現(xiàn)隱含于大量文獻群背后的客觀知識。至于兩者的差異性問題,筆者將其歸結為該框架中的某些可控變量及由此變量變化而引致的結果。3.1大量文獻群的定量分析文獻計量與內容分析所據(jù)以分析的對象本身是十分明確的,即文獻外部特征或具有明顯特征的傳播內容。其目的則是通過分析得出之前我們所不知道或無法確證的某個隱含事實,例如某學科文獻信息量近十年來的增長趨勢、小說人物形象中的種族歧視意味等。這些信息不可能事先以顯性文本的方式表達出來,而只能通過對大量文獻群的定量分析才能予以事后揭示。在時間線上,這種定量研究只能是借助于文獻這種二手資料所進行的事后分析;因為在此之前,隱含信息尚未完整地生成,任何分析都是接近無效的。若將決定文獻信息分布與變化的社會存在視作一個隱含信息表達的“主體”,則整個過程可以視作一個完整的語義生成、表達、傳遞與獲取的過程:以待分析的文獻群整體即“世界3”作為載體,作為“世界1”的社會存在得以表達和反映,最終為“世界2”所感知。對這一過程可略作如下描述。3.1.1隱含語義的生成根據(jù)因果律,既然待分析文獻信息呈現(xiàn)出一定的分布、變化狀態(tài),而不是另外一種狀態(tài),則必有決定該狀態(tài)呈現(xiàn)的動因。假如某報紙記者中存在種族歧視觀念,則極可能在報紙內容中表達出來,使得對黑人的負面報道遠遠多于正面。同樣,如果某個學科正處于新興階段,則關于該學科的文獻數(shù)量就會急劇增長。這種決定大量文獻信息呈現(xiàn)狀態(tài)背后的社會存在,即為隱含語義生成的源泉。語義生成屬于“世界1”的范圍。3.1.2隱蔽語義與“世界3”由于世界聯(lián)系的普遍性和多樣性,作為原因的某個事件可能引發(fā)多個不同的后果,乃至發(fā)生一系列的連鎖反應。也就是說,來自“世界1”的隱含語義在生成之后可能沿多個路徑表達和傳播。但對于文獻計量和內容分析方法而言,它們所關心的僅僅是其中的一個路徑,即社會存在決定了文獻信息分布所呈現(xiàn)的某個特定狀態(tài)。隱含語義通過影響“世界3”而得以表達。值得注意的是,語義并非通過“世界3”中的實際存在的文本得到顯性表達,而是通過文獻自身有規(guī)律的分布來隱含地表示。3.1.3意義的表達因為語義是隱含的、未知的,故我們通過文獻計量、內容分析等方法來解讀該語義,其實質是通過研究文獻信息自身的分布規(guī)律來進行間接的推斷。3.1.4入“世界2”即語義解讀完畢,為人們所認知從而進入“世界2”的過程。此時,該隱含語義可能獲得顯性表達,形成客觀知識文本,并以新的文獻實體形式進入“世界3”。3.2定量分析過程一致性描述以下框架可以作為文獻計量與內容分析以及幾乎所有定量分析過程的一致性描述。為此,需要用一些較為抽象的名詞術語,如“粒度”、“實體”、“形式化體系”、“符號化”等來予以容納。3.2.1劃定研究范圍,進行資料搜集首先,要明確研究目標,即對問題或假設做清楚明白的表述,避免將一些無關因素扯入其中;其次,要劃定研究范圍,對問題所涉及的時間域、空間域、主題域、收集資料的范圍等作進一步限定;最后,按照研究目標與范圍的要求搜集資料。如果樣本總量太大,則采取一定的方法進行抽樣。這些準備程序實際上對于任何信息分析流程來說,都是一樣的。3.2.2數(shù)據(jù)分析單元粒度粗細主要是指分析單元的大小。分析單元可以是整個文獻層次上的,如文獻的一切外部特征以及單篇文獻的主題、引文等。更小的分析單元有文章段落、句子、單詞、符號,某個特定的事實、數(shù)據(jù),或與分析類目有關的某個意思表示。選取粒度并非越細越好,也不是越粗越好,而要根據(jù)研究目標的不同來具體規(guī)定,因為不同的粒度是用來適應不同的目標的。3.2.3類目的描述和測量集操作序列所謂形式化體系,是指對現(xiàn)實的物及其運動變化規(guī)律的概念抽象,并由一套符號系統(tǒng)予以表示。具體對于文獻計量或內容分析來說,它包括三個方面:類目、指標和運算集(操作序列)。類目表達定性方面的屬性和規(guī)律,如類屬關系、包含關系、同一關系、并列關系、互斥關系等。指標則用以表達定量方面的屬性,有統(tǒng)計前指標、統(tǒng)計后指標。運算集不僅可以包括數(shù)值運算,也可以包括歸納、演繹、判斷、比較等邏輯運算。特定的運算操作只能在特定的類目和指標集上進行,不可能相互之間隨意套用。類目、指標與運算集所構成的形式化體系整體,應是一個與現(xiàn)實狀況無關、邏輯上自洽的純理論體系,但卻反映了客觀事物運動規(guī)律的關鍵方面。3.2.4類目的類目設計實體是指文獻群。文獻群根據(jù)選定的分析粒度被拆分,形成分析單元。分析單元在概念上與預先劃定的類目有著一一對應關系。從實體的角度來看,“類目”可以看作是該實體在某個維度上的屬性;而“指標”則是該屬性的值。因為類目本身是可以用符號來表示的,因而分析單元就被在多個維度上表示為“屬性-值”的形式。理論上,“值”可以取包括文本在內的所有形式,為了便于量化統(tǒng)計和計算,我們通常預先通過類目設計,使得該值只能取“0、1”二度指標或“-1、0、1”三度指標等數(shù)值形式。整個文獻群的所有分析單元都被表示成一組“屬性-值”對,就完成了實體的符號化。3.2.5類目與指標之間的互補集是約定將多個分析單元的同一類指標值進行累計,再計算各類指標總數(shù)值之間的關系,是最常用的統(tǒng)計匯總運算方法之一。但實際情況可能遠比這復雜,例如,每個指標值而非該類指標本身可以形成一個單獨的分析維度。類目與類目、指標與指標之間可以具有復雜的層次關系和其他聯(lián)系,其運算集是預定義的。就像實體的符號化是實體向類目、指標體系的形式化映射一樣,對已符號化的文獻群所進行的一切統(tǒng)計匯總和運算操作,也是向定義在該類目、指標體系之上的運算集的映射。3.2.6評估可靠性并解釋結果經(jīng)過運算后所得出的結果,應至少具有形式上的一致性,這就是檢驗信度的過程。如果該結果是有意義的,即可視作完成了文獻群中隱含信息的挖掘。3.3基于隱喻的討論無論是內容分析還是文獻計量,都不可避免地涉及到兩個必須作為前提的隱含假設。3.3.1文獻群的構建與重構對于客觀世界某種不可知的存在事實,通過影響文獻群的分布而間接建構出來的隱性知識,我們有能力通過文獻計量或內容分析等形式化、程序化的分析方法予以解構和重構,從而使其為人們所認知。應該說,萬事萬物有因必有果,有果必有因,這是自然的。因而,我們也完全有理由相信,文獻群之所以表現(xiàn)出此種分布狀態(tài),而不是彼種狀態(tài),必定有其背后的動因,也就是說必定傳達了某種隱含的信息。但問題在于,隱含信息透過文獻信息特征進行表達的方式,未必與我們所預想的方式一致。以10-1=9而論,我們也許以為因素-1是使我們獲得結果9的關鍵因素,而忽略了因素10,導致了南轅北轍。3.3.2文獻計算學中“定量分析”的前提是什么?用概念、類目來劃分事物是可行的;歸入同一類目的事物具有完全相同的質,并用同樣的符號來代表。所選用的指標體系則完全表達了同質事物之間一切量的區(qū)別。同時,定義于該形式化體系之上的運算集,是與該形式化體系相對應的客觀事物運動規(guī)律的真實反映。以1+1=2為例,這只適用于兩種絕對同質的事物,如兩只蘋果相加。蘋果與蘋果之間也許有好壞之分,但這種差別被我們忽略,它們被賦予絕對相同的形式并同等地參與計量。如果仔細考察文獻計量或內容分析的過程,完全可以發(fā)現(xiàn)類似的情形。因此,若因文獻計量、內容分析或任何定量化研究方法,運用了某種邏輯上自洽的、嚴密的形式化體系,進行了相當復雜的數(shù)學計算或證明,得出一個精確度很高的計算結果,就認為這個結果就絕對正確,顯然是沒有注意到進行定量分析所必須依賴的假設前提。實際上,正如邱均平教授在《文獻計量學》一書中所指出的那樣,任何定量分析都只能是相對精確和客觀的,所以在應用時應持慎重態(tài)度。如果忽視這些隱含前提,不恰當?shù)剡\用定量分析手段,也極有可能產生南轅北轍的后果。3.4在方程化建模過程中,振動器變量3.4.1統(tǒng)一概念系統(tǒng)文獻計量較注重文獻的外部特征,因此類目體系較為穩(wěn)定,有一整套既定的、成熟的類目與指標系統(tǒng);基本上不需要自定義類目,只需要確定分析主題和分析范圍即可做到高度程序化、機械化。文獻內容范圍廣、變化大,其研究主題很可能要求作基于語用的分析,而語用表達的可能性幾乎是無窮的。因而想用一套統(tǒng)一的、不變的概念系統(tǒng)來囊括所有可能類目基本是不可能的。因而,內容分析大多要根據(jù)研究目標和樣本數(shù)據(jù)來自定義類目。3.4.2可以進一步開發(fā)指數(shù)集并促進統(tǒng)計分析目前,文獻計量與內容分析均以線性的統(tǒng)計運算為主。在此基礎上,文獻計量可以運用和驗證幾個經(jīng)驗公式;而內容分析通常只做一些簡單的對比分析和直觀推測??傊?運算集(我們對現(xiàn)實關系進行模擬的數(shù)學模型)是有限的。因此,就運算集而言,尚有很大的開發(fā)潛力:一則可以通過對現(xiàn)實的觀察和科學發(fā)現(xiàn),提出更多、更有效的經(jīng)驗公式,形成知識庫;二是線性近似未必是對客觀事實的最佳模擬,應以有效度為標準,開發(fā)一些非線性的運算模型;三是可以從單純的數(shù)值運算發(fā)展到數(shù)值運算與邏輯運算相結合。3.4.3分析粒度粒度有粗細之

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論