基于H指數(shù)的霧霾信息微博用戶影響力評價(jià)_第1頁
基于H指數(shù)的霧霾信息微博用戶影響力評價(jià)_第2頁
基于H指數(shù)的霧霾信息微博用戶影響力評價(jià)_第3頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 基于H指數(shù)的霧霾信息微博用戶影響力評價(jià) 謝靖【摘 要】微博健康信息質(zhì)量參差不齊,是我國網(wǎng)絡(luò)謠言的重災(zāi)區(qū)。文章以新浪微博霧霾信息為數(shù)據(jù)源,利用H指數(shù)考察微博用戶影響力,為網(wǎng)絡(luò)輿情信息中信息源質(zhì)量評價(jià)提供新的計(jì)量指標(biāo)。從結(jié)果來看,在社交網(wǎng)絡(luò)中對于霧霾信息發(fā)布、傳播起主要作用的是各類媒體用戶,而H指數(shù)較高的個(gè)人用戶則能提供更為細(xì)節(jié)的原創(chuàng)體驗(yàn)?!綤ey】H指數(shù);微博;用戶影響力;霧霾;健康信息: G203 : A : 2095-2457(2019)23-0052-003DOI:10.19694/ki.issn2095-2457.2019.23.0220 引言隨著社交網(wǎng)絡(luò)在我國的快速發(fā)展,微博已成為健

2、康信息的傳播的重要媒介。在這些健康信息的傳播過程中,一些偽健康信息成為社會輿論關(guān)注焦點(diǎn),容易引發(fā)突發(fā)性輿論事件。同時(shí),以微博為代表的社交網(wǎng)絡(luò)也成為公眾獲取、表達(dá)自身健康信息訴求的重要渠道。如何能夠有效的辨別社交網(wǎng)絡(luò)中真實(shí)信息?怎樣有效的評價(jià)社交網(wǎng)絡(luò)中用戶的影響力?文章利用科學(xué)計(jì)量學(xué)的相關(guān)指標(biāo),在大數(shù)據(jù)量環(huán)境下進(jìn)行了傳統(tǒng)指標(biāo)的統(tǒng)計(jì),并提出利用H指數(shù)對用戶的影響力進(jìn)行考察,為社交網(wǎng)絡(luò)中高質(zhì)量用戶數(shù)據(jù)源發(fā)現(xiàn)提供新思路。在社交網(wǎng)絡(luò)普及過程中,國內(nèi)外學(xué)者利用文獻(xiàn)學(xué)基本定律對社交環(huán)境下的用戶行為進(jìn)行了計(jì)量與分析:Chu采集了Twitter中50萬用戶的行為數(shù)據(jù),以此設(shè)計(jì)了一個(gè)自動分類器,用于區(qū)分真實(shí)用戶、

3、機(jī)器人和企業(yè)廣告用戶1;原福永等利用用戶被關(guān)注度、活躍度、被轉(zhuǎn)發(fā)數(shù)和被評論數(shù)設(shè)計(jì)了用戶影響力模型,用戶降低微博僵尸粉影響2及體現(xiàn)用戶的社交影響力 3;顏月明、趙捧未借鑒科學(xué)計(jì)量學(xué)H指數(shù)及R指數(shù),構(gòu)建了We Chat Index模型,用戶微信公眾號影響力的評價(jià)4;王林等以40所雙一流高校的微博為實(shí)證對象,對比了h指數(shù)、g指數(shù)和p指數(shù)在微博影響力評價(jià)中的應(yīng)用5。在社交網(wǎng)絡(luò)中,健康信息的傳播影響力正日益擴(kuò)大,與健康信息質(zhì)量評價(jià)相關(guān)的研究也成為學(xué)界關(guān)注熱點(diǎn):莫秀婷等利用因子分析獲取了社交網(wǎng)絡(luò)中健康信息的采納特點(diǎn)和影響因素6;鄧勝利等通過內(nèi)容分析法對國外網(wǎng)絡(luò)健康信息的評價(jià)領(lǐng)域、過程、標(biāo)準(zhǔn)、工具和結(jié)果進(jìn)行

4、綜合分析7;李月琳等利用信息質(zhì)量評價(jià)框架,通過NVivo質(zhì)性數(shù)據(jù)分析工具對偽健康信息的信息特征進(jìn)行了判斷8。關(guān)于霧霾危害的研究是今年來國內(nèi)學(xué)術(shù)界的關(guān)注熱點(diǎn),也包括霧霾網(wǎng)絡(luò)輿情的相關(guān)研究:王晰巍等運(yùn)用社會網(wǎng)絡(luò)分析法的點(diǎn)度中心性、中間中心性和接近中心性,對新浪微博霧霾輿情的傳播進(jìn)行了實(shí)證分析9;廖海涵等利用新浪微博霧霾信息用戶發(fā)布數(shù)、評論數(shù)、轉(zhuǎn)發(fā)數(shù),通過相關(guān)分析、偏相關(guān)分析、回歸分析研究了相關(guān)的用戶行為10。綜上所述,對于社交網(wǎng)絡(luò)中的健康信息質(zhì)量的評判有助于獲取社會輿情熱點(diǎn),科學(xué)計(jì)量學(xué)的一些方法和指標(biāo)有助于解決此問題。文章以H指數(shù)為計(jì)量方法,辨別和獲取在霧霾信息傳播中起到真實(shí)信息發(fā)布的數(shù)據(jù)源,為社

5、會大眾的健康訴求提供更可靠的分析來源。1 霧霾信息的社交網(wǎng)絡(luò)數(shù)據(jù)源研究以新浪微博為數(shù)據(jù)來源,通過拓爾思公司的海貝大數(shù)據(jù)管理系統(tǒng)(Hybase)11獲取與霧霾相關(guān)數(shù)據(jù)669113萬條,其中有轉(zhuǎn)發(fā)或回復(fù)的信息187034條。在用戶信息獲取時(shí),根據(jù)認(rèn)證情況,主要分為個(gè)人認(rèn)證、媒體認(rèn)證、機(jī)構(gòu)認(rèn)證等,其中通過實(shí)名認(rèn)證的加V新浪用戶信度較高。因此根據(jù)實(shí)名認(rèn)證情況,文章將其劃分為個(gè)人實(shí)名用戶及其他用戶數(shù)據(jù)兩個(gè)大類型,分布情況如表1所示。從表1可知,在新浪微博霧霾相關(guān)信息傳播中,實(shí)名加V認(rèn)證用戶占所有用戶比例為22.32%,其總發(fā)帖量占12.35%,總轉(zhuǎn)帖和回復(fù)分別占3.65%和8.46%。從這些數(shù)據(jù)來看,在

6、社交網(wǎng)絡(luò)中,對于霧霾信息的網(wǎng)絡(luò)輿情起到主要作用的是非加V認(rèn)證個(gè)人用戶,這些用戶中包含大量的企業(yè)微博、機(jī)構(gòu)認(rèn)證、網(wǎng)絡(luò)媒體以及非實(shí)名網(wǎng)絡(luò)用戶,而能夠比較真實(shí)反映公眾對霧霾認(rèn)知的信息則比較集中于加V認(rèn)證個(gè)人用戶。2 霧霾信息的H指數(shù)設(shè)計(jì)傳統(tǒng)用戶影響力借鑒了用戶粉絲數(shù)、關(guān)注數(shù)、是否有頭像等簡單信息,對于用戶與粉絲間的互動考量較少。文章認(rèn)為社交媒體用戶影響力主要體現(xiàn)在發(fā)帖數(shù)、發(fā)帖回復(fù)數(shù)、發(fā)帖轉(zhuǎn)載數(shù)這三個(gè)能夠體現(xiàn)用戶及用戶互動行為的指標(biāo)上。在此基礎(chǔ)上,借鑒科學(xué)計(jì)量學(xué)中計(jì)量科學(xué)家影響力的指標(biāo)H指數(shù),設(shè)計(jì)社交領(lǐng)域回復(fù)H指數(shù)、轉(zhuǎn)載H指數(shù)指標(biāo)??茖W(xué)計(jì)量學(xué)H指數(shù)概念12:H指數(shù)是一個(gè)混合量化指標(biāo),最初是由美國加利福

7、尼亞大學(xué)圣地亞哥分校的物理學(xué)家喬治赫希在2005年的時(shí)候提出來的,其目的是量化科研人員作為獨(dú)立個(gè)體的研究成果。赫希的原始定義是,一名科學(xué)家的h指數(shù)是指其發(fā)表的Np篇論文中有h篇每篇至少被引h次。舉例:赫希本人的h指數(shù)是49,這表示他已發(fā)表的論文中,每篇被引用了至少49次的論文總共有49篇?!径x】回復(fù)H指數(shù):將用戶發(fā)帖的回復(fù)看作是科學(xué)計(jì)量學(xué)的引用,一個(gè)博主的回復(fù)H指數(shù)是指其發(fā)帖中有h篇被回復(fù)h次以上。【定義】轉(zhuǎn)帖H指數(shù):將用戶發(fā)帖的轉(zhuǎn)載看作是科學(xué)計(jì)量學(xué)的引用,一個(gè)博主的轉(zhuǎn)載H指數(shù)是指其發(fā)帖中有h篇被回復(fù)h次以上。3 霧霾信息的H指數(shù)實(shí)證分析3.1 回復(fù)H指數(shù)結(jié)果與分析根據(jù)以上回復(fù)H指數(shù)計(jì)算方法

8、,文章計(jì)算了相關(guān)新浪微博數(shù)據(jù)中實(shí)名認(rèn)證個(gè)人用戶的回復(fù)H指數(shù)、非實(shí)名認(rèn)證其他用戶回復(fù)H指數(shù),結(jié)果如表2所示。由表2可知,通過對比實(shí)名認(rèn)證個(gè)人用戶和其他用戶的回復(fù)H指數(shù),可以看出社交網(wǎng)絡(luò)中其他用戶(主要是網(wǎng)絡(luò)媒體或者傳統(tǒng)媒體公眾號)的用戶影響力較大。實(shí)名認(rèn)證個(gè)人用戶由于其內(nèi)容主要以個(gè)人生活為主,因此回復(fù)H指數(shù)遠(yuǎn)低于網(wǎng)絡(luò)媒體公眾號。但從內(nèi)容上來看,實(shí)名認(rèn)證個(gè)人用戶信息量更為豐富,且與其生活、感受多有直接關(guān)系,能夠比較全面的反映公眾對霧霾這一問題的健康信息訴求。如微博用戶“紅蘿卜先生-卜康”發(fā)帖:“對于北京的霧霾天氣實(shí)在無力吐槽.嗓子癢了一個(gè)月,咳嗽不停”,這條微博被評論439次。高回復(fù)H指數(shù)的實(shí)名認(rèn)

9、證個(gè)人用戶,可以作為可信度較高的社交網(wǎng)絡(luò)內(nèi)容分析情報(bào)來源。在以上計(jì)算的基礎(chǔ)上,結(jié)合認(rèn)證個(gè)人用戶的注冊地理信息,文章獲取了回復(fù)H指數(shù)4及4以上的用戶地域信息,如上圖1所示。從以上數(shù)據(jù)可以看出,在新浪微博霧霾輿情發(fā)布中具有較高發(fā)帖質(zhì)量的用戶主要集中在北京。從回復(fù)H指數(shù)的計(jì)算來看,這些認(rèn)證個(gè)人用戶的即有發(fā)帖量,其發(fā)帖通過其他用戶回復(fù)在社交網(wǎng)絡(luò)中起到了重要影響。此外,河北、山東、遼寧等北方省市有影響力的用戶也較多,而上海、廣東等自媒體發(fā)達(dá)的省市也有一些有影響力用戶。3.2 轉(zhuǎn)載H指數(shù)結(jié)果與分析根據(jù)轉(zhuǎn)帖H指數(shù)計(jì)算方法,文章計(jì)算了相關(guān)新浪微博數(shù)據(jù)中實(shí)名認(rèn)證個(gè)人用戶的轉(zhuǎn)帖H指數(shù)、非實(shí)名認(rèn)證其他用戶轉(zhuǎn)帖H指數(shù)

10、,結(jié)果前20位如下表3所示。由表3可知,對霧霾信息傳播產(chǎn)生主要作用的仍然主要是媒體類用戶。對比表2、表3,可以看出,從社交網(wǎng)絡(luò)的用戶行為來看,轉(zhuǎn)發(fā)H指數(shù)高于回復(fù)H指數(shù)。從非實(shí)名認(rèn)證個(gè)人用戶來看,影響力較大的轉(zhuǎn)發(fā)H媒體與回復(fù)H媒體有較大重合,但在個(gè)人實(shí)名認(rèn)證用戶中則有一定差異。從原創(chuàng)性來看,個(gè)人實(shí)名認(rèn)證用戶回復(fù)H指數(shù)較高的用戶原創(chuàng)比例高于轉(zhuǎn)發(fā)H指數(shù)較高的用戶。這表明,這些轉(zhuǎn)發(fā)H指數(shù)較高的用戶在霧霾輿情傳播中起到了一定中轉(zhuǎn)作用。4 結(jié)語文章運(yùn)用了科學(xué)計(jì)量學(xué)H指數(shù)計(jì)算方法,對新浪微博中發(fā)表霧霾信息用戶影響力進(jìn)行了考察。這種計(jì)算方法即能反映用戶發(fā)帖活躍度,又能反映其發(fā)帖在社交網(wǎng)絡(luò)中獲得的響應(yīng)情況。通過

11、計(jì)算,文章發(fā)現(xiàn)在新浪微博中對于霧霾信息發(fā)布和傳播,具有較高回復(fù)H指數(shù)、轉(zhuǎn)發(fā)H指數(shù)的用戶多為媒體類用戶,具有較高回復(fù)H指數(shù)個(gè)人實(shí)名認(rèn)證用戶則能提供更為細(xì)節(jié)、準(zhǔn)確的公眾個(gè)人感受。從地域分布來看,具有較高回復(fù)H指數(shù)的個(gè)人認(rèn)證用戶以北方、特別是北京、河北為主。【Reference】1Chu Z,Gianvecchio S,Wang H,et al.Detecting Automation of Twitter Accounts:Are You a Human,Bot,or Cyborg?J.IEEE Transactions on Dependable and Secure Computing,201

12、2,9(6):811-824.2原福永,馮靜,符茜茜,等.一種降低微博僵尸粉影響的方法J.現(xiàn)代圖書情報(bào)技術(shù),2012,28(5):70-75.3原福永,馮靜,符茜茜.微博用戶的影響力指數(shù)模型J. 現(xiàn)代圖書情報(bào)技術(shù),2012,28(6):60-64.4顏月明,趙捧未.一種微信公眾號影響力的評估方法J. 情報(bào)雜志,2016,35(9):141-145.5王林,潘陳益,朱文靜.基于h指數(shù)、g指數(shù)和p指數(shù)的微博影響力評價(jià)對比研究J.現(xiàn)代情報(bào),2018,38(6):13-20+63.6莫秀婷,鄧朝華.基于社交網(wǎng)站采納健康信息行為特點(diǎn)及其影響因素的實(shí)證研究J.現(xiàn)代情報(bào),2014,34(12):29-37.7鄧勝利,趙海平.國外網(wǎng)絡(luò)健康信息質(zhì)量評價(jià):指標(biāo)、工具及結(jié)果研究綜述J.情報(bào)資料工作,2017(01):69-76.8李月琳,張秀,王姍姍.社交媒體健康信息質(zhì)量研究:基于真?zhèn)谓】敌畔⑻卣鞯姆治鯦.情報(bào)學(xué)報(bào),2018,37(03):294-304.9王晰巍,邢云菲,趙丹,李嘉興.基于社會網(wǎng)絡(luò)分析的移動環(huán)境下網(wǎng)絡(luò)輿情信息傳播研究以新浪微博“霧霾”話題為例J.圖書情報(bào)工作,2015,59(07):14

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論