版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)學(xué)與應(yīng)用數(shù)學(xué)論文:信息管理中的信息分布規(guī)律研究摘要 1引言 21.信息內(nèi)容的離散分布規(guī)律 31.1布拉德福定律的概念 31.2布拉德福定律在信息管理中的表現(xiàn) 31.3齊夫定律的概念 41.4齊夫定律在信息管理中的表現(xiàn) 41.5馬太效應(yīng)的概念 62.信息對(duì)時(shí)間的分布 72.1信息對(duì)時(shí)間的分布的概念 72.2指數(shù)增長(zhǎng)率 72.3逐漸過(guò)時(shí)律 83.信息生產(chǎn)者的分布規(guī)律 93.1洛特卡定律簡(jiǎn)介 93.2洛特卡定律應(yīng)用范圍 103.3洛特卡定律的國(guó)內(nèi)外應(yīng)用 103.4洛特卡定律的局限性 11結(jié)束語(yǔ) 12參考文獻(xiàn) 13摘要:信息分布簡(jiǎn)單來(lái)說(shuō)就是指信息在時(shí)間和空間上的特征、狀態(tài)和存在形式.研究信息分布可以指導(dǎo)實(shí)際的信息管理工作,揭示和發(fā)現(xiàn)信息管理學(xué)的奠基性規(guī)律.本文從信息在時(shí)間和空間上的分布規(guī)律以及信息制造者的分布上進(jìn)行研究,探討信息內(nèi)容的離散分布規(guī)律,包括布拉德福定律、齊夫定律,信息對(duì)時(shí)間的分布規(guī)律中的指數(shù)增長(zhǎng)率和逐漸過(guò)時(shí)率,以及信息生產(chǎn)者的分布規(guī)律中的洛特卡定律.關(guān)鍵詞:布拉德福定律;齊夫定律;指數(shù)增長(zhǎng)率;逐漸過(guò)時(shí)率;洛特卡定律引言信息分布規(guī)律是信息管理中非常重要的一部分,通過(guò)研究信息分布規(guī)律,我們可以更好地了解信息,從而更好的利用信息滿足我們的需要.對(duì)于信息管理中的信息分布規(guī)律,有許多國(guó)內(nèi)外的學(xué)者都進(jìn)行過(guò)研究,取得很多成果.在國(guó)內(nèi),還有學(xué)者利用信息分布規(guī)律中的齊夫定律,論證了莫言獲得諾貝爾文學(xué)獎(jiǎng)的理論基礎(chǔ).由此可見信息分布規(guī)律規(guī)律研究有很強(qiáng)的實(shí)用性.目前關(guān)于信息管理中的信息分布規(guī)律,有很多的參考文獻(xiàn).文獻(xiàn)[2]敘述了洛特卡定律相關(guān)應(yīng)用.文獻(xiàn)[4]與文獻(xiàn)[5]敘述了信息內(nèi)容的離散分布規(guī)律中“布拉德福定律”在現(xiàn)實(shí)生活中的表現(xiàn).文獻(xiàn)[6]敘述了信息內(nèi)容的離散分布規(guī)律中“齊夫定律”對(duì)一些文本的適用性研究情況.文獻(xiàn)[7]與文獻(xiàn)[8]敘述了信息對(duì)時(shí)間的分布規(guī)律“指數(shù)增長(zhǎng)率”在現(xiàn)實(shí)生活中的表現(xiàn),從而說(shuō)明了實(shí)際情況里信息的增長(zhǎng)情況.文獻(xiàn)[9]與文獻(xiàn)[10]敘述了在生活中信息資源老化的原因與對(duì)策以及社會(huì)化媒體的信息老化的研究綜述.本論文主要通過(guò)查找資料,先敘述信息分布規(guī)律:信息內(nèi)容的離散分布規(guī)律(如“布拉德福定律”、“齊夫定律”)、信息對(duì)時(shí)間的分布規(guī)律(如“指數(shù)增長(zhǎng)率”、“遂漸過(guò)時(shí)率”)、信息生產(chǎn)者的分布規(guī)律(如“洛特卡定律”)他們有什么特點(diǎn),之后將現(xiàn)有的知識(shí)與前人研究的該規(guī)律在管理學(xué)中的應(yīng)用相結(jié)合,從而進(jìn)行簡(jiǎn)單的論述,解釋信息分布在管理中的應(yīng)用規(guī)律.1.信息內(nèi)容的離散分布規(guī)律1.1布拉德福定律的概念布拉德福定律(LawofBradford)也被稱為文學(xué)散逸定律和文獻(xiàn)分散定律,英國(guó)化學(xué)家和語(yǔ)言學(xué)家布拉德福德在上世紀(jì)五十年代提出的一個(gè)描述文獻(xiàn)秩序結(jié)構(gòu)的經(jīng)驗(yàn)法則,適合于測(cè)量教育文學(xué).它的內(nèi)容簡(jiǎn)單來(lái)說(shuō)就是:如果將某雜志按照發(fā)布某一學(xué)術(shù)領(lǐng)域的文獻(xiàn)數(shù)目以逐漸減少的方式排列,就能夠在全部文獻(xiàn)里面找出載文率最高的主要部分和包含著與主要部分等數(shù)量論文的之后幾區(qū),這時(shí)核心區(qū)和后續(xù)各區(qū)中所含的雜志數(shù)成的關(guān)系(a>1).同一年,維克利通過(guò)分析對(duì)布拉德福定律作出了修改,而且把雜志分區(qū)的數(shù)目推廣到了大于三個(gè)的更普遍的情形,提出了布氏定律的維克利修正式:(為常數(shù),稱為維氏分布系數(shù),為前個(gè)區(qū)的雜志數(shù)量之和).1.2布拉德福定律在信息管理中的表現(xiàn)在布拉德福德定律在網(wǎng)絡(luò)環(huán)境里面是否適用的問(wèn)題上,上世紀(jì)九十年代,國(guó)外專家學(xué)者提出了網(wǎng)絡(luò)計(jì)量學(xué)的概念,并進(jìn)行了相應(yīng)的研究.美國(guó)專家巴伊蘭將論文及其發(fā)表信息的分布情況與各雜志及其論文進(jìn)行了比較分析,確定了核心新聞組根據(jù)布拉德福定律,主題“瘋?!?發(fā)現(xiàn)布拉德福定律也存在于網(wǎng)絡(luò)環(huán)境,但這個(gè)研究針對(duì)某一特定主題,它的數(shù)據(jù)有一定的局限性,通過(guò)對(duì)美國(guó)醫(yī)學(xué)院校排名前二十多位的網(wǎng)站進(jìn)行鏈接分析,發(fā)現(xiàn)網(wǎng)站鏈接存在集中、分散的現(xiàn)象,網(wǎng)站數(shù)量之比為78:452:1201,比較符合1:4:42,這說(shuō)明醫(yī)學(xué)院的網(wǎng)絡(luò)鏈接是符合布拉德福德的法律的,但這一定律是否適用于所有網(wǎng)絡(luò)環(huán)境,這一事實(shí)必須進(jìn)一步審查.兩位美國(guó)學(xué)者對(duì)MEDLINE數(shù)據(jù)庫(kù)中關(guān)于RCT的文獻(xiàn)作了文獻(xiàn)計(jì)量分析,發(fā)現(xiàn)通過(guò)區(qū)域分析可知第四區(qū)的期刊數(shù)明顯大于預(yù)測(cè)值,但是四個(gè)區(qū)的期刊數(shù)之比較接近于1:2.5:2.52(6.25):2.53(15.6)符合傳統(tǒng)的布拉德福定律,但又有明顯區(qū)別,文中對(duì)布拉德福定律的驗(yàn)證方法比較單調(diào),不能從各個(gè)層面證明這種適用性.貝倫斯和盧克對(duì)無(wú)機(jī)晶體結(jié)構(gòu)數(shù)據(jù)庫(kù)中晶體學(xué)主題的文獻(xiàn)進(jìn)行分析,利用函數(shù)模型對(duì)數(shù)據(jù)樣本進(jìn)行分析研究,發(fā)現(xiàn)了晶體學(xué)題目的文獻(xiàn)符合布拉德福定律的分布,這一研究主要針對(duì)數(shù)據(jù)庫(kù)里面的數(shù)據(jù)并且只進(jìn)行了單一方式的分析,并不具有非常顯著的代表性.克里斯蒂娜·法巴·佩雷斯通過(guò)對(duì)我那個(gè)上空間鏈接狀態(tài)的圖像分析得出,有些圖像并不符合標(biāo)準(zhǔn)的布拉德福分布且通過(guò)模塊分析可知每個(gè)區(qū)域的比例數(shù)也都不符合的關(guān)系.1.3齊夫定律的概念齊夫定律是由美國(guó)哈佛大學(xué)的一位人類語(yǔ)言學(xué)家喬治·金斯利·齊夫于上世紀(jì)五十年代發(fā)表的實(shí)驗(yàn)定律.定律內(nèi)容可以簡(jiǎn)單表述為:在人類自然語(yǔ)言的數(shù)據(jù)庫(kù)里,某一個(gè)詞出現(xiàn)的頻率與它在頻率分布表里的順序形成反比例函數(shù).因此,出現(xiàn)次數(shù)最高的這個(gè)詞出現(xiàn)的次數(shù)大約是出現(xiàn)次數(shù)第二位的單詞的兩倍,而出現(xiàn)次數(shù)稍微減少的單詞則是出現(xiàn)次數(shù)第四位的某個(gè)詞的兩倍.這個(gè)發(fā)現(xiàn)被用來(lái)做所有與冪定律概率分布相關(guān)聯(lián)的數(shù)據(jù)的分析.舉個(gè)例子,在英語(yǔ)數(shù)據(jù)庫(kù)中,“the”是最經(jīng)常出現(xiàn)單詞,它在這個(gè)數(shù)據(jù)庫(kù)中出現(xiàn)了大概百分之七(每一百萬(wàn)單詞中出現(xiàn)大約七萬(wàn)次).正如齊夫定律中所說(shuō)的一樣,出現(xiàn)頻率其次的單詞“of”占了整個(gè)數(shù)據(jù)庫(kù)中的百分之三點(diǎn)五(約四萬(wàn)次),第三位的是“and”(約三萬(wàn)次).僅僅一百三十多個(gè)單詞就占了英語(yǔ)數(shù)據(jù)庫(kù)的一半.齊夫定律是通過(guò)實(shí)踐得來(lái)的定律,而不是一個(gè)理論.齊夫定律可以在很多地方中被觀察到.齊夫分布的在現(xiàn)實(shí)中的起源一直沒有具體的令人信服的說(shuō)法.齊夫定律可以用圖像來(lái)觀察,坐標(biāo)為(排名)和(頻率).比如,“the”這個(gè)單詞就可以描述為的點(diǎn).如果所有的數(shù)據(jù)分布點(diǎn)幾乎是一條直線,那么它就符合齊夫定律.最容易明白的的例子是“”.如果有一些齊夫分布的數(shù)據(jù),以出現(xiàn)的頻率多少來(lái)排列,那么排在第二位的頻率會(huì)是第一位的一半,第三位則是第一位的三分之一,以此類推.然而,這并不非常精確,因?yàn)槊恳粋€(gè)項(xiàng)必須出現(xiàn)一個(gè)整數(shù)次數(shù),一個(gè)單詞不可能出現(xiàn)二點(diǎn)五次.但是,在一個(gè)較大區(qū)域內(nèi)而且做出合適的約算,很多自然的現(xiàn)象都可以用齊夫定律描述.1.4齊夫定律在信息管理中的表現(xiàn)巴塞羅那自治大學(xué)數(shù)學(xué)研究中心的研究者最近使用數(shù)學(xué)和統(tǒng)計(jì)學(xué)的專業(yè)知識(shí),對(duì)齊夫定律進(jìn)行了嚴(yán)格的研究.該研究是對(duì)古登堡計(jì)劃(一個(gè)將沒有著作權(quán)的英文著作進(jìn)行電子化的網(wǎng)絡(luò)工程,里面有許多的資料可以無(wú)償使用)的數(shù)據(jù)進(jìn)行分析.這是一項(xiàng)非常大的試驗(yàn)工程,因?yàn)樵谠缦鹊墓ぷ髦幸话阒粫?huì)使用一百篇以內(nèi)的數(shù)據(jù)庫(kù).而實(shí)驗(yàn)結(jié)果顯示,假如不統(tǒng)計(jì)那些出現(xiàn)頻率非常低的詞語(yǔ),有百分之五十五的數(shù)據(jù)是符合的,如果全部統(tǒng)計(jì)在內(nèi),適用齊夫定律的數(shù)據(jù)也還有百分之四十.而且據(jù)這項(xiàng)實(shí)驗(yàn)的發(fā)言人所描述,假如把只出現(xiàn)了三次至五次的詞語(yǔ)也不計(jì)算在內(nèi),那么符合定律的數(shù)據(jù)數(shù)量會(huì)更加龐大.在自然語(yǔ)言中通過(guò)齊夫定律我們可以發(fā)現(xiàn),文章中詞語(yǔ)出現(xiàn)的次數(shù)和其排序等級(jí)呈反比例關(guān)系,即是說(shuō)這兩個(gè)數(shù)的積是一個(gè)固定的數(shù).對(duì)式子兩邊求自然對(duì)數(shù)可知:如果我們對(duì)于統(tǒng)計(jì)數(shù)據(jù)數(shù)據(jù)結(jié)果繪制一個(gè)與的關(guān)系曲線,即可得到截距和斜率.在我國(guó)也有很多專家展開了對(duì)齊夫定律還有齊夫定律相關(guān)應(yīng)用的調(diào)研.就在前不久,江南大學(xué)的專家學(xué)者以諾貝爾文學(xué)獎(jiǎng)得主莫言的作品《紅高粱》,《蛙》還有《透明的紅蘿卜》來(lái)做了一個(gè)研究調(diào)查,他們研究了莫言的作品中字?jǐn)?shù)出現(xiàn)次數(shù)和單詞出現(xiàn)頻率,得出了滿足齊夫定律的結(jié)論.他們的研究發(fā)現(xiàn)包括西班牙語(yǔ)、法語(yǔ)、英語(yǔ)等在內(nèi)的許多種類語(yǔ)言的成果是一樣的.這個(gè)數(shù)據(jù)從統(tǒng)計(jì)學(xué)這一方面說(shuō)明了莫言可以成為中國(guó)大陸第一位獲諾獎(jiǎng)文學(xué)獎(jiǎng)的其中一個(gè)原因.在詞語(yǔ)出現(xiàn)次數(shù)的研究中,主要采用了兩種方法確定詞語(yǔ)等級(jí):1)隨機(jī)法:齊夫第一定律在第一次被發(fā)現(xiàn)時(shí),就是使用的隨機(jī)法.隨機(jī)法通俗來(lái)說(shuō)就是在明確詞語(yǔ)的等級(jí)的過(guò)程中,如果出現(xiàn)頻率一樣的詞,那么就用統(tǒng)計(jì)文本中詞語(yǔ)的自然詞序或隨機(jī)詞序排列確定詞語(yǔ)的等級(jí),這樣每個(gè)詞的等級(jí)就是它的自然或隨機(jī)詞序.例如詞序?yàn)榈?-8的詞是同頻詞,那么它們的詞級(jí)隨機(jī)排列則是5,6,7,8.2)并列法:并列法是指把遇到的同頻詞并列為一個(gè)詞級(jí),并延承上一個(gè)詞級(jí)例如詞序?yàn)榈?-8的詞是同頻詞,那么它們的詞級(jí)就是5;若詞序?yàn)榈?-12的詞也是同頻詞,那么這些詞的詞級(jí)則要延承上一個(gè)詞級(jí)成為6.分詞原則:(一)采用計(jì)算機(jī)來(lái)進(jìn)行自動(dòng)分詞統(tǒng)計(jì)時(shí),拿齊夫定律理論為根本,根據(jù)漢語(yǔ)自身的語(yǔ)言特點(diǎn),參考《現(xiàn)代漢語(yǔ)詞典》目錄所給出的單詞語(yǔ)言的詞性,把保留詞語(yǔ)意思的完整無(wú)缺作為前提條件.(二)地名、人名等這些專有名詞要作為獨(dú)立的詞來(lái)進(jìn)行劃分.(三)統(tǒng)計(jì)時(shí)不計(jì)算標(biāo)點(diǎn)或者不是漢字的符號(hào).如果對(duì)一份報(bào)告里面出現(xiàn)的字詞頻率與序號(hào)以及等級(jí)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),就可以建立一個(gè)平面直角坐標(biāo)系,那么橫坐標(biāo)久表示這個(gè)詞的序號(hào)也就是等級(jí),那么頻次就是縱坐標(biāo),那么就會(huì)得到一條曲線,這就是齊夫分布曲線,它類似于雙曲線的一半.然后我們?cè)賹⒌燃?jí)序號(hào)與頻次都求得對(duì)數(shù)坐標(biāo),那么我們所說(shuō)的齊夫規(guī)律,也就是齊夫分布對(duì)數(shù)曲線.如果符合這種類型的分布,那么就可以說(shuō)是是齊夫分布.齊夫定律已經(jīng)在許多方面,例如語(yǔ)言、地理、經(jīng)濟(jì)、情報(bào)、信息科學(xué)、網(wǎng)絡(luò)方面有了廣泛的應(yīng)用,而且有了很多有實(shí)際意義的成果.齊夫定律作為一種數(shù)學(xué)統(tǒng)計(jì)工具,在詞語(yǔ)頻率的規(guī)律描述上作用很大,但還是有很多的改進(jìn)空間值得我么去探究.1.5馬太效應(yīng)的概念馬太效應(yīng)是在信息生產(chǎn)和分布中產(chǎn)生的一種規(guī)律,信息生產(chǎn)之后在時(shí)間和空間上傳遞時(shí),可以形成優(yōu)勢(shì)與劣勢(shì)兩種情況.古時(shí)候的人將形成的這種優(yōu)勢(shì)與劣勢(shì)稱做信息分布里的馬太效應(yīng).馬太效應(yīng)這一詞語(yǔ),來(lái)自于古代圣經(jīng)中《新約·馬太福音》這一篇文章中的“…誰(shuí)如果有,就給他,并不斷增加;而誰(shuí)沒有,就連已有的都要被奪走”.二十世紀(jì)六十年代,默頓--美國(guó)著名的社會(huì)學(xué)家,曾說(shuō):越有名的學(xué)者所發(fā)表的文章,越能人民所發(fā)現(xiàn)、所認(rèn)識(shí)、所重視,越能聚焦更多的學(xué)術(shù)資源,越能更容易的把握熱點(diǎn)、發(fā)表文章.這就是非常典型的一種馬太效應(yīng).馬太效應(yīng)實(shí)際上是在描述一種優(yōu)勢(shì)與劣勢(shì)的積累過(guò)程,一旦你處于比較優(yōu)勢(shì)的地位,這種優(yōu)勢(shì)便可以不斷增強(qiáng),變得更加優(yōu)勢(shì);反之,如果你處于劣勢(shì)地位,這種不利地位也會(huì)隨意加深,達(dá)到更劣的程度.同時(shí),馬太效應(yīng)也可以支配社會(huì)信息流,比如說(shuō),某些對(duì)象,它被選擇的次數(shù)是不一樣的,有的經(jīng)常被人們或者其他事物所選擇,有的卻不經(jīng)常被選擇,而這些都是這個(gè)對(duì)象或者事物的特征的表現(xiàn),同時(shí)這個(gè)特征又成為再次被選擇的依據(jù),從而就使信息分布與生產(chǎn)達(dá)到一種“富集”與“貧集”的情況.馬太效應(yīng)具有集中取向和核心趨勢(shì)兩個(gè)特點(diǎn),集中取向是社會(huì)選擇的結(jié)果,因?yàn)槟承?duì)象或事物具有某些特征,而被他人所接受,所利用.比如說(shuō)一首音樂,它的點(diǎn)擊率,播放量都是由用戶所決定的,與信息的生產(chǎn)者無(wú)關(guān),因此可以說(shuō),集中取向具有被動(dòng)性.信息生產(chǎn)者主動(dòng)的選擇形成了核心趨勢(shì),某些對(duì)象或者事物的生產(chǎn)者,為了達(dá)到某種目的,使得該對(duì)象或事物的表現(xiàn)更加明顯.比如說(shuō),一個(gè)作者為了吸引更多的讀者,從而提升他們的作品的質(zhì)量、使他們文章的內(nèi)容更加吸引人們的眼球,因此可以說(shuō),與集中取向相比,核心趨勢(shì)具有主動(dòng)性.而當(dāng)今,馬太效應(yīng)在信息管理等方面也普遍存在.2.信息對(duì)時(shí)間的分布2.1信息對(duì)時(shí)間的分布的概念什么是信息在時(shí)間上的分布?簡(jiǎn)單來(lái)說(shuō),就是信息在生產(chǎn)出來(lái)之后,是如何被利用的.而我們研究信息在時(shí)間上的信息分布規(guī)律可以探究信息如何增長(zhǎng)與老化的.同時(shí),在我們探究過(guò)程中,可以用準(zhǔn)確的、科學(xué)的、高效的理論模型來(lái)表現(xiàn)信息隨著時(shí)間的推移而表現(xiàn)出來(lái)的規(guī)律,把握信息的分布的變化規(guī)律,從而對(duì)信息進(jìn)行動(dòng)態(tài)管理.2.2指數(shù)增長(zhǎng)率美國(guó)科學(xué)家普萊斯對(duì)于信息隨時(shí)間增長(zhǎng)的變化規(guī)律,做了系統(tǒng)的研究.通過(guò)研究不同年份科學(xué)期刊的文獻(xiàn)量與年份之間的區(qū)別,從而得到了一個(gè)近似地發(fā)表文獻(xiàn)隨時(shí)間增長(zhǎng)的規(guī)律的曲線,叫做普賴斯曲線.但事實(shí)上,文獻(xiàn)量的增加與各個(gè)學(xué)科領(lǐng)域的發(fā)展或?qū)W科發(fā)展到哪個(gè)階段、物質(zhì)的、智力的、時(shí)間的等多個(gè)因素都有關(guān)系,所以在現(xiàn)實(shí)條件下,這種趨勢(shì)更像是動(dòng)植物生長(zhǎng)的曲線.即最初增長(zhǎng)很快,但隨著時(shí)間的推移,增長(zhǎng)速度越來(lái)越慢,以致幾乎不增長(zhǎng).然而在我們實(shí)際生活中,在不同的階段,文獻(xiàn)的增長(zhǎng)趨勢(shì)也是大有不同的.此時(shí),如果有一個(gè)正處于剛剛誕生或者是發(fā)展階段的學(xué)科,那么,該學(xué)科發(fā)表的文獻(xiàn)量的指數(shù)便會(huì)增長(zhǎng),但與此同時(shí)文獻(xiàn)的壽命比較短.然后當(dāng)該學(xué)科繼續(xù)成長(zhǎng),進(jìn)入到相對(duì)成熟的階段,文獻(xiàn)量的增長(zhǎng)不會(huì)保持在原來(lái)的增長(zhǎng)速率,它的增長(zhǎng)率變小,曲線變緩,但此刻文獻(xiàn)量卻一直在增加,文獻(xiàn)壽命也相對(duì)變長(zhǎng).但如果該知識(shí)領(lǐng)域的某一研究有了突飛猛進(jìn)的發(fā)展,那么,該學(xué)科就將進(jìn)入相對(duì)成熟的階段,即使之前該領(lǐng)域的文獻(xiàn)處于趨于平緩的狀態(tài),但更新的文獻(xiàn)量又將會(huì)進(jìn)入一個(gè)新的急劇增長(zhǎng)時(shí)期(如指數(shù)增長(zhǎng)).然后又將進(jìn)入一個(gè)穩(wěn)定時(shí)期.因此文獻(xiàn)常常會(huì)呈現(xiàn)出錯(cuò)綜復(fù)雜的情況,是因?yàn)槲墨I(xiàn)的增長(zhǎng)往往會(huì)如上述一樣,出現(xiàn)幾個(gè)急劇增長(zhǎng)時(shí)期和幾個(gè)相對(duì)穩(wěn)定時(shí)期.而在我們實(shí)際生活中,信息無(wú)處不在,而我們?cè)谏a(chǎn)和生活中,信息也在不斷地產(chǎn)生,因此郭紅轉(zhuǎn)教授通過(guò)以CNKI、萬(wàn)方等數(shù)據(jù)庫(kù)中收錄的文件為數(shù)據(jù)源,通過(guò)運(yùn)用信息研究領(lǐng)域的機(jī)構(gòu)分布、學(xué)科分布、作者分布等圖譜進(jìn)行分析近十年(2003年—2013年)的研究文獻(xiàn),探究信息發(fā)展趨勢(shì)及研究情況.通過(guò)研究發(fā)現(xiàn),論文數(shù)量主要以報(bào)紙、期刊為主,報(bào)紙占總檢驗(yàn)結(jié)果的51%,而期刊占總檢驗(yàn)結(jié)果的44.1%.其中信息研究中,經(jīng)濟(jì)、工業(yè)技術(shù)、文學(xué)、科學(xué)等方面,所占總檢驗(yàn)結(jié)果的比例較大,其中,經(jīng)濟(jì)占總檢驗(yàn)結(jié)果的24.5%,工業(yè)技術(shù)占總檢驗(yàn)結(jié)果的23.7%,文化、科學(xué)、教育、體育占總檢驗(yàn)結(jié)果的19.5%.也就是說(shuō)這些領(lǐng)域中信息增長(zhǎng)的速度要高于其他領(lǐng)域.通過(guò)這個(gè)研究可以看出,在2003年至2013年,對(duì)于各個(gè)領(lǐng)域信息主題的研究較廣泛,也證明了信息技術(shù)發(fā)展迅速,因此人們可以從多個(gè)途徑獲取信息,從而可以接受到更多的信息,各個(gè)領(lǐng)域信息的增長(zhǎng)也處于快速發(fā)展中.2.3逐漸過(guò)時(shí)律信息對(duì)時(shí)間的分布規(guī)律,不僅包括信息的增長(zhǎng),還包括信息的逐漸老化,也被稱作信息的逐漸過(guò)時(shí)律.而信息的逐漸過(guò)時(shí)率主要有四個(gè)方面的含義.第一:信息還是有用的但是它包括在更新的文獻(xiàn)中,第二:信息還是有用的,但是它被后來(lái)的文獻(xiàn)超越,第三:信息還是有用的,但是它處于一個(gè)人們對(duì)它興趣正在逐漸下降的學(xué)科,第四:就是信息不再有用.為了衡量信息衰老,或者說(shuō)它的過(guò)時(shí)速度,人們用半衰期作為指標(biāo)來(lái)描述老化的速度.這里的半衰期實(shí)質(zhì)上是用到了物理學(xué)所學(xué)的概念我們把半衰期的概念運(yùn)用到科學(xué)文獻(xiàn)或者文獻(xiàn)信息的老化中.文獻(xiàn)的半衰期一般是指在一個(gè)學(xué)術(shù)方向上還在使用的所有文獻(xiàn)的百分之五十發(fā)布的時(shí)間段.舉個(gè)例子,如果生物學(xué)文獻(xiàn)的半衰期是五年,那就是說(shuō)還有效的生物學(xué)文獻(xiàn)是在最近五年內(nèi)發(fā)表的.其次,對(duì)于衡量信息衰老的規(guī)律的方法還有普賴斯指數(shù),簡(jiǎn)單來(lái)說(shuō),就是某一學(xué)科內(nèi),對(duì)發(fā)表年限不超過(guò)五年的文獻(xiàn)的引用次數(shù)與總的引用次數(shù)之比值.我們通常認(rèn)為,普賴斯指數(shù)越大,半衰期就越小,文獻(xiàn)老化速度越快.對(duì)于信息老化的研究一直都是信息分布規(guī)律的重要部分,其過(guò)程也從對(duì)文本文獻(xiàn)的研究轉(zhuǎn)變?yōu)閷?duì)于互聯(lián)網(wǎng)信息的研究,而互聯(lián)網(wǎng)信息的統(tǒng)計(jì)調(diào)查也由單一的網(wǎng)站內(nèi)容向論壇博客等全新的信息載體的差異性比較上發(fā)展.互聯(lián)網(wǎng)信息的實(shí)用性隨時(shí)間減弱是一個(gè)客觀存在的事實(shí).現(xiàn)在我國(guó)對(duì)于互聯(lián)網(wǎng)信息的衰減的研究有大致幾種方法,第一點(diǎn)就是要看測(cè)度指標(biāo),一個(gè)正確的測(cè)度指標(biāo)是是開展工作的前提.但是測(cè)度指標(biāo)怎樣才算合適,還沒有一個(gè)明確的標(biāo)準(zhǔn).有些學(xué)者會(huì)使用微博生命周期來(lái)處理這類問(wèn)題,也有學(xué)者認(rèn)為微博生命周期(或稱微博壽命)指的是微博的存活時(shí)間,并將其定義為:自微博發(fā)布到其最后一次被評(píng)論之間的時(shí)間差,提出了微博生命周期的4種類型.也有學(xué)者認(rèn)為微博生命周期指一條微博的被轉(zhuǎn)發(fā)數(shù)達(dá)到百分之九十五總轉(zhuǎn)發(fā)數(shù)時(shí)需要的時(shí)間.目前有關(guān)微博半衰期的深入探討尚不多見,但是早在一九四四年,就有專家學(xué)者提出了半衰期的概念.半衰期可以準(zhǔn)確的描述信息老化的速度,它的發(fā)展也從文本轉(zhuǎn)向了互聯(lián)網(wǎng).在決定文獻(xiàn)老化速度的原因中以這四點(diǎn)最為顯著.第一點(diǎn):文獻(xiàn)增長(zhǎng).文獻(xiàn)總是在不斷的增長(zhǎng)和老化,這是描述學(xué)科發(fā)展的兩個(gè)方向,并且還表現(xiàn)了科學(xué)信息擁有不斷更新優(yōu)化的能力.第二點(diǎn):學(xué)科差異.研究發(fā)現(xiàn),世界上93%-98%的科學(xué)雜志被引用的壽命常在20年左右,但這并不表示,所有學(xué)科的文獻(xiàn)老化速率都大體一致,更為神奇的是,這些學(xué)科甚至彼此之間差異甚大.第三點(diǎn).學(xué)科發(fā)展階段的差異.簡(jiǎn)單來(lái)說(shuō),即使是同一學(xué)科,但如果它處在不同的時(shí)期或階段,那么文獻(xiàn)的半衰期不盡完全相同.第四點(diǎn).信息環(huán)境和需求.不同信息用戶對(duì)文獻(xiàn)的需求是不同的,因而信息利用者的需求及所處的信息環(huán)境的研究十分必要.3.信息生產(chǎn)者的分布規(guī)律3.1洛特卡定律簡(jiǎn)介洛特卡(Alfred.J.Lotka),十八世紀(jì)八十年代出生于奧地利.他主要工作是將科學(xué)活動(dòng)視為人類的生產(chǎn)活動(dòng)來(lái)開展研究工作,曾率先提出了“科學(xué)生產(chǎn)率”.上世紀(jì)二十年代洛特卡發(fā)表在《華盛頓科學(xué)院報(bào)》上的文章《科學(xué)生產(chǎn)率的頻率分布》整理統(tǒng)計(jì)了《化學(xué)文摘》十年來(lái)索引中以字母A和B開頭的六千八百名作者及其論著數(shù),以及奧爾巴赫的《物理學(xué)史一覽表》中的一千年三百位科學(xué)家及其論著數(shù).經(jīng)過(guò)分析發(fā)現(xiàn),“寫了2篇論文的作者數(shù)量大約是寫了1篇論文作者人數(shù)的四分之一,寫了3篇論文的作者人數(shù)大約是寫了1篇論文作者數(shù)量的九分之一,以此類推,寫了n篇論文的作者數(shù)量大約是寫了1篇論文作者數(shù)量的1/n洛特卡定律將某個(gè)指定領(lǐng)域的學(xué)者文獻(xiàn)產(chǎn)出率規(guī)律和科學(xué)生產(chǎn)率的頻率分布規(guī)律進(jìn)行了描述,也即是說(shuō)在一個(gè)指定領(lǐng)域,撰寫n篇論文的作者數(shù)是寫1篇論文的人數(shù)的1/n2,而只發(fā)表1篇論文的文獻(xiàn)作者數(shù)會(huì)占該領(lǐng)域的百分之六十.也就是說(shuō),在指定領(lǐng)域的所有文獻(xiàn)作者中,百分之六十的人只寫了1篇論文,百分之十五的人寫了2篇論文(0.60的1/22),百分之七的人寫了3篇(0.60的1/該定理在發(fā)現(xiàn)早期沒有得到人們的關(guān)注,經(jīng)過(guò)后人的不斷完善與發(fā)展,到了二十世紀(jì)八十年代才被人們所重視起來(lái).3.2洛特卡定律應(yīng)用范圍采用洛特卡定律,就能夠用估算或者統(tǒng)計(jì)文獻(xiàn)作者數(shù)量的方法,來(lái)預(yù)測(cè)文獻(xiàn)數(shù)量的增長(zhǎng)速率以及文獻(xiàn)流動(dòng)的方向,進(jìn)一步了解文獻(xiàn)的流動(dòng)規(guī)律;也可以從文獻(xiàn)計(jì)量的方向預(yù)測(cè)專家學(xué)者的人數(shù)變化以及科學(xué)發(fā)展的范圍和趨勢(shì);在人才管理和科學(xué)研究方面,能夠用來(lái)研究學(xué)者的行為模式,探索人才的文獻(xiàn)寫作風(fēng)格,有利于對(duì)專家學(xué)者的理論研究和科學(xué)發(fā)展史的探索,從而為科學(xué)研究與人才管理提供了全新的模式與方法.在科研人才和科研文獻(xiàn)大量涌現(xiàn)的今天,洛特卡定律應(yīng)用于提前預(yù)測(cè)某一學(xué)科文獻(xiàn)的學(xué)者和材料的數(shù)量,探索文獻(xiàn)的增長(zhǎng)趨勢(shì)和分布,總結(jié)優(yōu)秀學(xué)者的行為模式和各行業(yè)頂尖人才的著述特征,來(lái)作為依據(jù)制定相關(guān)的科學(xué)發(fā)展政策,幫助科學(xué)文化相關(guān)產(chǎn)業(yè)的蓬勃發(fā)展有著重大意義.3.3洛特卡定律的國(guó)內(nèi)外應(yīng)用以洛特卡定律為基礎(chǔ),普賴斯更深一步探索了專家學(xué)者數(shù)量和文獻(xiàn)著作數(shù)量還有不同水平區(qū)段專家學(xué)者中的某種關(guān)系,發(fā)表了普賴斯定律與一些相關(guān)的規(guī)律.普賴斯定律通過(guò)將科學(xué)家總數(shù)進(jìn)行開方,獲得的科學(xué)家數(shù)量發(fā)布了所有文獻(xiàn)的百分之五十.一些專家學(xué)者在經(jīng)濟(jì)、生物、情報(bào)等等許多學(xué)科范圍內(nèi)逐個(gè)對(duì)洛特卡定律開展了適用性的調(diào)查研究,并且據(jù)此提出了進(jìn)一步優(yōu)化洛特卡定律的研究方向.這里面最著名的就是上世紀(jì)八十年代帕歐利利用二十個(gè)領(lǐng)域和三個(gè)國(guó)家級(jí)圖書館目錄里的四十八組相關(guān)著作來(lái)檢驗(yàn)洛特卡定律,而且重新劃分了洛特卡定律中的參數(shù)的范圍,使洛特卡定律更加完善.洛特卡定律的應(yīng)用有很多方面,學(xué)術(shù)性的期刊雜志以及公共信息的軟件開發(fā)者的研究都可以使用洛特卡定律.該定律在各個(gè)區(qū)域的學(xué)術(shù)研究中表現(xiàn)出良好的適用性和發(fā)展價(jià)值.在我國(guó),對(duì)于該定律的驗(yàn)證始于上世紀(jì)八十年代,時(shí)間雖晚但成果頗多.在多個(gè)作者合作文獻(xiàn)的處理和洛特卡分布中參數(shù)的擬合方法等領(lǐng)域發(fā)表了許多新穎的著作,并且嘗試將該定律應(yīng)用到新興學(xué)科的未來(lái)趨勢(shì)的預(yù)測(cè)方法研究上.在國(guó)內(nèi)學(xué)者中以武漢大學(xué)的邱均平教授成果最為豐厚.邱教授以近五到十年中國(guó)知網(wǎng)收錄的圖書方面情報(bào)的文獻(xiàn)進(jìn)行研究,利用實(shí)踐證明的方式檢驗(yàn)該定律,而且創(chuàng)造性采用著作者權(quán)重這一指標(biāo)來(lái)分析同一文獻(xiàn)多個(gè)作者對(duì)于著作者分布規(guī)律的研究,更加準(zhǔn)確地體現(xiàn)了作者分布的規(guī)律.在洛特卡定律的基礎(chǔ)性探索方面,我國(guó)學(xué)者張賢澳在洛特卡分布里的參數(shù)的擬合方法做了更加透徹的研究,發(fā)表了非回歸分析的該定律參數(shù)的直接估算方法.3.4洛特卡定律的局限性該定律的在基礎(chǔ)性方面的研究一直較少,在上世紀(jì)九十年代張賢澳教授之后就很少有人展開相關(guān)研究.不過(guò)各式各樣的統(tǒng)計(jì)軟件以及文獻(xiàn)管理軟件的陸續(xù)使用,讓改良文獻(xiàn)計(jì)量學(xué)的基礎(chǔ)研究方法增添了新的方向.在數(shù)據(jù)的收集和分析中,如今通常使用上世紀(jì)八十年代國(guó)外學(xué)者米蘭德所發(fā)表的利用普賴斯與揚(yáng)布蘭斯基的準(zhǔn)則作為基礎(chǔ),去掉離差比較大的較高發(fā)布量作者的數(shù)據(jù),一個(gè)個(gè)進(jìn)行擬合與比較,在里面找出最佳回歸直線的方式,也就是把回歸分析作為基本的擬合方式.不過(guò)在現(xiàn)實(shí)應(yīng)用中,發(fā)布量比較高的學(xué)者一般是按照學(xué)者總數(shù)進(jìn)行開方又或取科學(xué)家總數(shù)量的百分之一來(lái)得到的,這樣的方式并不妥當(dāng).而且計(jì)算方法復(fù)雜,經(jīng)常會(huì)出現(xiàn)錯(cuò)誤.不過(guò),我們可以使用一些常用辦公軟件來(lái)處理這些在過(guò)去不容易解決的問(wèn)題.例如在Excel的圖表向?qū)Ю锩?我們就能用添加一個(gè)趨勢(shì)線的方式來(lái)篩選最優(yōu)分析類型,來(lái)完成數(shù)據(jù)的擬合刪除.并且文獻(xiàn)的難易程度也會(huì)影響洛特卡定律的應(yīng)用.就比如博客一般只有一個(gè)作者,不受合著的影響.但國(guó)內(nèi)有些學(xué)者對(duì)科學(xué)網(wǎng)的博文作者分布規(guī)律開展調(diào)查后發(fā)現(xiàn)并不符合洛特卡定律,具體原因應(yīng)該是此類文章沒有很高的發(fā)表要求而且內(nèi)容隨意性強(qiáng),這就使得對(duì)此類作品進(jìn)行學(xué)術(shù)評(píng)價(jià)不太容易.因此可以得出,對(duì)于專業(yè)有較高要求的期刊雜志中文獻(xiàn)的分布常常滿足洛特卡定律,因?yàn)榘l(fā)布資質(zhì)要求高,被拒絕的概率高,文獻(xiàn)發(fā)布時(shí)間長(zhǎng),這就與洛特卡定律發(fā)布時(shí)的學(xué)術(shù)環(huán)境比較一致,就適用洛特卡分布.而現(xiàn)在學(xué)術(shù)環(huán)境的改變很大,一些功利性強(qiáng)而內(nèi)容粗淺的文獻(xiàn)數(shù)量巨大,發(fā)布時(shí)間也在減少,資質(zhì)要求也在變低.相同領(lǐng)域中的文獻(xiàn)充斥在質(zhì)量不高的期刊雜志里面,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024個(gè)人合同合作協(xié)議范本
- 2024工藝品買賣合同范本
- 2024勞動(dòng)合同法中英文對(duì)照上
- 聯(lián)營(yíng)創(chuàng)業(yè)合同書
- 2024年二手車交易協(xié)議
- 戶外廣告牌租用協(xié)議
- 2024房屋裝修合同寫房屋裝修合同協(xié)議清單樣式
- 2024工程承攬協(xié)議合同
- 2024子女撫養(yǎng)協(xié)議書
- 2024車輛買賣合同范本大全
- 《人行自動(dòng)門安全要求》標(biāo)準(zhǔn)
- 廣鐵集團(tuán)校園招聘機(jī)考題庫(kù)
- 第一章、總體概述:施工組織總體設(shè)想、工程概述、方案針對(duì)性及施工標(biāo)段劃分
- 2024-2030年中國(guó)語(yǔ)言服務(wù)行業(yè)發(fā)展規(guī)劃與未來(lái)前景展望研究報(bào)告
- 2024-2030年白玉蝸牛養(yǎng)殖行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及發(fā)展前景與投資機(jī)會(huì)研究報(bào)告
- HGT 2902-2024《模塑用聚四氟乙烯樹脂》
- 2024 年上海市普通高中學(xué)業(yè)水平等級(jí)性考試 物理 試卷
- 國(guó)家開放大學(xué)專科《法理學(xué)》(第三版教材)形成性考核試題及答案
- 計(jì)量基礎(chǔ)知識(shí)考核試題及參考答案
- 眼科學(xué)基礎(chǔ)病例分析
- 混合痔中醫(yī)護(hù)理 方案
評(píng)論
0/150
提交評(píng)論