微博與微博的關(guān)系研究_第1頁
微博與微博的關(guān)系研究_第2頁
微博與微博的關(guān)系研究_第3頁
微博與微博的關(guān)系研究_第4頁
微博與微博的關(guān)系研究_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

微博與微博的關(guān)系研究

1微博用戶信息傳播行為特征研究隨著信息技術(shù)的普及和飛速發(fā)展,網(wǎng)絡(luò)逐漸從web1.0時代(以“物”為中心)和web2.0時代(以“人”為中心)進(jìn)入web3.0時代(以“公共服務(wù)”為中心)。作為一種典型的Web應(yīng)用,微博的迅猛發(fā)展對報刊和雜志等在內(nèi)的傳統(tǒng)媒體產(chǎn)生了巨大沖擊。不同的統(tǒng)計數(shù)據(jù)與實踐表明,微博能夠有效地促進(jìn)信息傳播行為。微博用戶之間通過關(guān)注、轉(zhuǎn)發(fā)和評論后形成微博互動。在這種互動中,微博信息發(fā)生了流動、共享、利用與創(chuàng)造。有較多文獻(xiàn)對這種動態(tài)的信息傳播行為進(jìn)行了研究。主要有:(1)從學(xué)科方面看,體現(xiàn)在多學(xué)科交叉運用上,綜合利用圖書情報學(xué)、傳播學(xué)、管理學(xué)以及經(jīng)濟(jì)學(xué)等學(xué)科領(lǐng)域知識進(jìn)行研究;(2)從關(guān)注的層面來看,已有研究主要涉及技術(shù)層面和應(yīng)用層面的研究。相比而言,關(guān)注微博用戶的信息傳播行為特征這一主題的研究并不多。微博用戶之間互動關(guān)系有主動關(guān)注、相互關(guān)注和被關(guān)注等【1】。微博信息的傳播是通過關(guān)系網(wǎng)絡(luò)的“節(jié)點”向外傳播,這種社交網(wǎng)絡(luò)是社會行動者(用戶)及其之間關(guān)系的結(jié)合【2】,不同用戶個體的相互作用使得微博社交網(wǎng)絡(luò)的關(guān)系表現(xiàn)得更為廣泛【3】。微博關(guān)系網(wǎng)絡(luò)中關(guān)鍵用戶(強(qiáng)關(guān)系節(jié)點)數(shù)量、意見領(lǐng)袖的數(shù)量和質(zhì)量與微博信息的傳播價值有關(guān)【4】。微博社區(qū)中,影響力大的用戶被稱為關(guān)鍵用戶,關(guān)鍵用戶中存在一些意見領(lǐng)袖,能在一定程度上引導(dǎo)輿論、影響其他一般用戶行為(購買行為)、政治觀點等【5】。對關(guān)鍵用戶的識別,不同網(wǎng)絡(luò)平臺出現(xiàn)了多樣性的研究方法【6-8】。覃夢河等從用戶的博文內(nèi)容出發(fā),通過對傳統(tǒng)詞頻分析生成用戶標(biāo)簽權(quán)重來表征用戶,提出了一種全新的用戶關(guān)系推薦機(jī)制【9】。對用戶影響力進(jìn)行預(yù)測,利用信息的傳播特征來度量用戶影響力,通過個人屬性對其進(jìn)行回歸分析來找出最能反應(yīng)用戶影響力的屬性特征【10】。以上文獻(xiàn)對微博用戶的研究集中在微博社交網(wǎng)絡(luò)分析和關(guān)鍵用戶的識別方面,并進(jìn)一步從微博信息內(nèi)容方面深入擴(kuò)展。但是微博的發(fā)展離不開微博用戶的持續(xù)使用,微博用戶不僅包括關(guān)鍵用戶,還包括普通用戶,且大多數(shù)微博用戶為普通用戶。因此,揭示微博不同類型用戶的信息傳播行為特征,并進(jìn)行對比,不僅能更好地認(rèn)識關(guān)鍵用戶的信息傳播特點,而且能激發(fā)更多的用戶持續(xù)使用微博并促進(jìn)微博信息的有效傳播。本文從微博的普通用戶和明星用戶(關(guān)鍵用戶)入手,分別對兩者的使用特征變量進(jìn)行實證分析。2用戶數(shù)據(jù)搜集本文使用的實驗數(shù)據(jù)來源于擁有超過5億用戶的新浪微博平臺,選擇具有代表性的用戶為名人或達(dá)人用戶作為種子用戶,利用數(shù)據(jù)挖掘方法,提取真實的用戶交互數(shù)據(jù)。數(shù)據(jù)搜集的思路為:通過新浪平臺開放接口(OpenAPI),對微博系統(tǒng)進(jìn)行讀取獲得新浪微博中名人用戶和普通用戶的用戶信息。包括:用戶ID、用戶昵稱、所在地、性別、認(rèn)證標(biāo)志、達(dá)人標(biāo)志、關(guān)注數(shù)、粉絲數(shù)、博文數(shù)。2.1獲取相關(guān)特征信息第一步,注冊新浪微博,并在上申請成為開發(fā)者、創(chuàng)建應(yīng)用,獲取APP_KEY和APP_SECRET。第二步,設(shè)置回調(diào)URL并連接微博服務(wù)器,獲取訪問令牌(accesstoken),即token和expires。第三步,輸入?yún)?shù),調(diào)用相應(yīng)api,從服務(wù)器獲取相關(guān)信息。第四步,按相應(yīng)格式,將獲得的信息存入數(shù)據(jù)庫。2.2調(diào)查問卷的采集(1)名人用戶數(shù)據(jù)(數(shù)據(jù)1)的采集步驟如下:第一步,選取某一名人用戶作為種子,應(yīng)用廣度優(yōu)先搜索算法,將粉絲數(shù)超過10萬的關(guān)注對象進(jìn)行記錄。第二步,將得到的記錄再次應(yīng)用上一步的方法進(jìn)行搜集,直至不再有滿足條件的新用戶為止。(2)普通用戶數(shù)據(jù)(數(shù)據(jù)2)的采集步驟如下:第一步,選取某一普通用戶作為種子,應(yīng)用廣度優(yōu)先搜索算法,將粉絲數(shù)和關(guān)注數(shù)超過10的關(guān)注對象進(jìn)行記錄。第二步,將得到的記錄再次應(yīng)用上一步的方法進(jìn)行搜集,直至不再有滿足條件的新用戶或者采集到的用戶量達(dá)到某一數(shù)量為止。(3)名人用戶關(guān)注關(guān)系數(shù)據(jù)(數(shù)據(jù)3)的采集步驟如下:第一步,搜集排名前100的名人用戶。第二步,對每一位用戶分別提取關(guān)注用戶信息。例如,“李開復(fù)”的關(guān)注用戶有U1,U2,U3…。(4)微博達(dá)人關(guān)注關(guān)系數(shù)據(jù)(數(shù)據(jù)4)的采集步驟如下:第一步,搜集排名前100的達(dá)人用戶。第二步,對每一位用戶分別提取關(guān)注用戶信息。例如,“時尚小波哥”的關(guān)注用戶有U1,U2,U3…。數(shù)據(jù)的預(yù)處理方式為:對于數(shù)據(jù)1、數(shù)據(jù)2,以所有用戶的關(guān)注數(shù)、被關(guān)注數(shù)、博文數(shù)的平均值作為閾值,分別比較每個用戶的關(guān)注數(shù)、被關(guān)注數(shù)、博文數(shù),如果變量大于閾值,則取0,否則取1。最后,將得到每個用戶的三元組存入結(jié)果數(shù)據(jù)庫;對于數(shù)據(jù)3、數(shù)據(jù)4,構(gòu)建100*100的0-1矩陣,矩陣中的成員aij表示用戶i對用戶j的關(guān)注情況,關(guān)注用1表示,未關(guān)注則標(biāo)為0。3微博用戶的基本分析3.1不同性別用戶的政治利用總體情況從名人用戶和普通用戶的性別分布(分別如圖1和圖2所示)??梢钥闯?名人用戶中,74%的用戶為男性;而普通用戶這一比例相對要小(61%)。總體來說,男性用戶遠(yuǎn)遠(yuǎn)超過女性用戶。3.2用戶集中分布圖3顯示了名人用戶和普通用戶所在的地區(qū)分布。對比分析結(jié)果顯示:(1)名人用戶分布相對較為集中,用戶更多地集中在北京(57.84%);其次是上海、廣東、海外等。(2)普通用戶更為分散,用戶分布最多的省份為廣東(18.52%),其次是北京、上海、浙江??傮w來說,微博用戶的地區(qū)分布不均衡,其主要來自于經(jīng)濟(jì)發(fā)達(dá)省份。名人用戶的地區(qū)分布相對集中,而普通用戶的地區(qū)分布則較為分散。4微博用戶行為特征分析4.1微博關(guān)注的用戶數(shù)據(jù)集中關(guān)注數(shù)(follow)是指用戶關(guān)注他人的數(shù)量。例如,所搜集的名人數(shù)據(jù)集中,用戶“李開復(fù)”的關(guān)注數(shù)是479,這說明“李開復(fù)”一共關(guān)注了微博網(wǎng)絡(luò)中其他479名用戶。通常來說,普通用戶的關(guān)注數(shù)往往比名人用戶多。通過對關(guān)注數(shù)進(jìn)行散點圖分析,可揭示其特征。4.1.1對用戶關(guān)注數(shù)分布的分析如圖4所示,顯示了名人用戶關(guān)注數(shù)的分布特征。其中,X軸為用戶的關(guān)注數(shù)數(shù)值,Y軸為某一關(guān)注數(shù)擁有的頻次??梢钥闯?其分布呈現(xiàn)出一定的冪律分布特征。即關(guān)注數(shù)超過2000的名人用戶相比很少,大多數(shù)用戶的關(guān)注數(shù)都較小。4.1.2用戶關(guān)注數(shù)分布圖5描述了普通用戶關(guān)注數(shù)的分布特征??梢钥闯?普通用戶關(guān)注數(shù)呈現(xiàn)明顯的冪律分布特征。即,只有少部分用戶的關(guān)注數(shù)超過2000。總體來看,和已有研究結(jié)果相似,用戶關(guān)注數(shù)呈冪律分布特征。但根據(jù)本研究所搜集的數(shù)據(jù)集來看,普通用戶的這一特征更為明顯。4.2微博公眾的粉絲分析粉絲數(shù)(followed)是指有多少其他用戶關(guān)注某用戶。例如,所搜集的普通用戶數(shù)據(jù)集中,用戶“panet”的粉絲數(shù)是23,這說明微博網(wǎng)絡(luò)中一共有23名用戶關(guān)注了“panet”。一般來講,名人用戶的粉絲數(shù)比普通用戶的粉絲數(shù)要大得多。通過對粉絲數(shù)進(jìn)行散點圖分析,可揭示其特征。4.2.1粉絲數(shù)分布如圖6所示,描述了名人用戶粉絲數(shù)的分布特征??梢园l(fā)現(xiàn),一方面,所有用戶粉絲數(shù)出現(xiàn)的頻率均為1,也即所搜集的名人數(shù)據(jù)集中沒有兩位用戶的粉絲數(shù)是一樣的;另一方面,其分布符合冪律分布特征。4.2.2用戶粉絲數(shù)的模擬如圖7所示,顯示了普通用戶粉絲數(shù)的分布。可以看出,這一分布呈現(xiàn)典型的冪律分布。即絕大部分普通用戶的粉絲數(shù)低于2000??傮w來看,用戶粉絲數(shù)呈現(xiàn)冪律分布特征。相比名人用戶,普通用戶的冪律特征很典型。這與已有的大多數(shù)相關(guān)研究結(jié)論相似。4.3發(fā)表文件數(shù)據(jù)的特征分析發(fā)布博文數(shù)是某一用戶自注冊以來,所發(fā)表的博文總數(shù)。對博文數(shù)進(jìn)行散點圖分析,可以進(jìn)一步揭示其分布特征。4.3.1微博內(nèi)容的特性圖8顯示了名人用戶發(fā)布的博文數(shù)分布特征??梢园l(fā)現(xiàn),名人用戶發(fā)布的博文數(shù)近似呈現(xiàn)冪律特征。同時,絕大部分博文數(shù)出現(xiàn)的頻次為1;少部分博文數(shù)出現(xiàn)的頻次為2和3。4.3.2用戶的行為特征圖9描述了普通用戶發(fā)表博文數(shù)的分布特征??梢钥闯?這一分布呈現(xiàn)出典型的冪律分布??傮w來看,用戶發(fā)布的博文數(shù)呈現(xiàn)冪律分布特征。而普通用戶的分布特征更為典型。綜上所述,可以發(fā)現(xiàn)不同類型的用戶的行為特征:(1)名人用戶的行為特征:雖然在一定程度上符合冪律分布特征,但其分布仍然有自身的特點;(2)普通用戶的行為特征:呈現(xiàn)出典型的冪律分布特征。5微博用戶關(guān)系的特征分析5.1數(shù)據(jù)分析過程考慮到名人用戶數(shù)據(jù)和普通用戶數(shù)據(jù)集中上述三個指標(biāo)均不符合正態(tài)分布(上文證實了屬于冪律分布),所以適合采用Spearman(斯皮爾曼)相關(guān)系數(shù)進(jìn)行分析。如表1所示,顯示了名人用戶和普通用戶關(guān)注數(shù)、粉絲數(shù)和博文數(shù)三者兩兩之間的相關(guān)性程度。根據(jù)學(xué)者Hair等的建議,當(dāng)相關(guān)系數(shù)值位于[0.8,1.0]之間時,意味著極強(qiáng)相關(guān);當(dāng)相關(guān)系數(shù)值位于[0.6,0.8]之間時,意味著強(qiáng)相關(guān);當(dāng)相關(guān)系數(shù)值位于[0.4,0.6]之間時,意味著中等程度相關(guān);當(dāng)相關(guān)系數(shù)值位于[0.2,0.4]之間時,意味著弱相關(guān);當(dāng)相關(guān)系數(shù)值位于[0.0,0.2]之間時,意味著極弱相關(guān)或無相關(guān)【11】。5.1.1不同公民關(guān)注數(shù)聯(lián)合發(fā)布的分析(1)關(guān)注數(shù)(follow)和粉絲數(shù)(followed)之間的相關(guān)系數(shù)值為-.201(0.01水平上顯著),這意味著名人用戶關(guān)注數(shù)的多少與粉絲數(shù)的多少幾乎不相關(guān)。(2)關(guān)注數(shù)(follow)和博文數(shù)(post)之間的相關(guān)系數(shù)值為.460(0.01水平上顯著),這意味著名人用戶關(guān)注數(shù)越多,其發(fā)表的博文數(shù)可能越多。(3)粉絲數(shù)(followed)和博文數(shù)(post)之間的相關(guān)系數(shù)值為.071(0.01水平上顯著),這意味著名人用戶的粉絲數(shù)多少與其發(fā)表的博文數(shù)多少不相關(guān)。5.1.2微博關(guān)注數(shù)、粉絲數(shù)和發(fā)表的對比情況(1)關(guān)注數(shù)(follow)和粉絲數(shù)(followed)之間的相關(guān)系數(shù)值為.782(0.01水平上顯著),這意味普通用戶關(guān)注數(shù)的多少與粉絲數(shù)的多少有關(guān)。(2)關(guān)注數(shù)(follow)和博文數(shù)(post)之間的相關(guān)系數(shù)值為.524(0.01水平上顯著),這意味著通用戶關(guān)注數(shù)越多,其發(fā)表的博文數(shù)可能越多。(3)粉絲數(shù)(followed)和博文數(shù)(post)之間的相關(guān)系數(shù)值為.618(0.01水平上顯著),這意味著普通用戶的粉絲數(shù)越多,其發(fā)表的博文數(shù)可能越多。從微博實踐活動來看,名人用戶的關(guān)注數(shù)、粉絲數(shù)和博文數(shù)之間的相關(guān)性都不很強(qiáng),名人用戶往往擁有很多粉絲,但其發(fā)表的博文數(shù)并不受粉絲數(shù)的多寡而影響;名人用戶往往喜歡發(fā)表博文,其內(nèi)容可能涉及自身的日常所見所聞與所想,也可能是相關(guān)的名人名言等。但普通用戶的關(guān)注數(shù)、粉絲數(shù)和發(fā)表的博文數(shù)存在一定的相關(guān)性?;蛘哒f,對于大多數(shù)普通用戶來說,當(dāng)其粉絲數(shù)越多時,更可能鼓勵他/她發(fā)表更多的博文;同時,普通用戶往往也更愿意去關(guān)注更多的他人,如朋友、名人、機(jī)構(gòu)等。5.2用戶關(guān)注數(shù)、粉絲數(shù)和公共網(wǎng)絡(luò)數(shù)量之間的相關(guān)性分析5.2.1突出的關(guān)注數(shù)將粉絲數(shù)(followed)設(shè)置為控制變量,將關(guān)注數(shù)(follow)和博文數(shù)(post)設(shè)置為偏相關(guān)分析變量,進(jìn)行雙側(cè)檢驗,結(jié)果如表2所示。當(dāng)控制粉絲數(shù)時,名人用戶的關(guān)注數(shù)(follow)和博文數(shù)(post)之間呈現(xiàn)顯著的偏相關(guān)關(guān)系(相關(guān)系數(shù)值為.311,在.000水平上顯著)。這從實踐中可以得到較好地證實。例如,名人發(fā)表博文的原因可能是他們想記錄下自己的即時想法,與他人交流或共享。實際中,很多名人(尤其是明星型名人)往往很少關(guān)注他人(即關(guān)注數(shù)很少),同時其發(fā)表的博文數(shù)也往往很多。但對于那些關(guān)注數(shù)較大的名人用戶來說,這往往意味著這部分名人用戶在微博上較為活躍,因此其往往會更愿意發(fā)表博文。5.2.2關(guān)注數(shù)、粉絲數(shù)對普通用戶發(fā)表宣告壓力的影響分別將粉絲數(shù)、博文數(shù)和關(guān)注數(shù)設(shè)為控制變量,進(jìn)行雙側(cè)檢驗,結(jié)果如表3所示。(1)以粉絲數(shù)為控制變量時,普通用戶的關(guān)注數(shù)與其發(fā)表的博文數(shù)呈正相關(guān)關(guān)系(相關(guān)系數(shù)為.338,在.000水平上顯著)。從普通用戶的實踐活動來分析,關(guān)注數(shù)越多的普通用戶,說明該用戶在網(wǎng)上越積極,而積極的用戶往往更愿意發(fā)表博文。(2)以博文數(shù)為控制變量時,普通用戶的關(guān)注數(shù)和粉絲數(shù)之間并不呈現(xiàn)相關(guān)關(guān)系。這與已有研究的結(jié)論一致:關(guān)注數(shù)涉及到用戶對他人感興趣,而粉絲數(shù)則與他人是否對用戶感興趣有關(guān)。(3)以關(guān)注數(shù)為控制變量時,對普通用戶來說,其粉絲數(shù)的多少與發(fā)表的博文數(shù)多少并不顯著相關(guān)。這是因為,博文的發(fā)表涉及用戶自身的行為,而粉絲數(shù)的多少與他人的行為相關(guān)。對普通用戶來說,其粉絲來源可能更多的是親朋好友對其的關(guān)注,與其是否發(fā)表博文以及發(fā)表數(shù)量的多少沒有顯著關(guān)系。5.3回歸分析的階段為更好地揭示關(guān)注數(shù)、粉絲數(shù)和博文數(shù)的因果分析,有必要進(jìn)一步進(jìn)行回歸分析。回歸分析用于研究相關(guān)變量之間的因果關(guān)系。這里,為了探索關(guān)注數(shù)和粉絲數(shù)是否會影響博文數(shù),以博文數(shù)為因變量Y,關(guān)注數(shù)和粉絲數(shù)為自變量X,使用的回歸方法為“進(jìn)入”。5.3.1能夠正向影響關(guān)注數(shù)據(jù)分析表4顯示了名人用戶數(shù)據(jù)集的回歸分析結(jié)果。結(jié)果顯示,關(guān)注數(shù)(follow)能夠正向影響博文數(shù)(β=.314,在.000水平上顯著)。從名人用戶使用微博的實際情況來分析:大多數(shù)名人用戶,尤其是明星用戶,一般很少關(guān)注他人。當(dāng)某一名人用戶關(guān)注他人較多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論