在線社交網(wǎng)絡(luò)影響力分析_第1頁(yè)
在線社交網(wǎng)絡(luò)影響力分析_第2頁(yè)
在線社交網(wǎng)絡(luò)影響力分析_第3頁(yè)
在線社交網(wǎng)絡(luò)影響力分析_第4頁(yè)
在線社交網(wǎng)絡(luò)影響力分析_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

在線社交網(wǎng)絡(luò)影響力分析第一頁(yè),共24頁(yè)。社交影響力的相關(guān)因素社交網(wǎng)絡(luò)影響力的度量方法社交網(wǎng)絡(luò)中影響力的傳播總結(jié)與展望第二頁(yè),共24頁(yè)。摘要社交影響力分析是社交網(wǎng)絡(luò)分析的關(guān)鍵問(wèn)題之一。近十幾年間,隨著在線社交網(wǎng)絡(luò)的蓬勃發(fā)展,研究人員才開(kāi)始有機(jī)會(huì)在大量現(xiàn)實(shí)數(shù)據(jù)的基礎(chǔ)上對(duì)社交影響力進(jìn)行建模和分析,并取得了豐碩的研究成果和廣泛的應(yīng)用價(jià)值。文中闡述了社交影響力的相關(guān)概念和它們之間的關(guān)系,重點(diǎn)從網(wǎng)絡(luò)拓?fù)?、用戶行為和交互信息等幾個(gè)方面總結(jié)了影響力分析的建模和度量方法,并對(duì)在線社交網(wǎng)絡(luò)影響力分析的前景進(jìn)行了展望。第三頁(yè),共24頁(yè)。社交影響力的相關(guān)因素

影響力社交影響力只有通過(guò)人們之間的交互活動(dòng)才能夠體現(xiàn)出來(lái),比如用戶A在網(wǎng)上的發(fā)帖吸引了用戶B,使得后者成為A的粉絲,即A對(duì)B產(chǎn)生了影響力。社交影響力的定義具有明顯的因果性,而人們的思想、行為等產(chǎn)生變化的原因則是不勝枚舉且因人而異,社交影響力只是其中之一。目前大部分研究工作都是針對(duì)社交網(wǎng)絡(luò)結(jié)構(gòu)及其上的交互信息和用戶行為特征進(jìn)行量化和分析的,因此可以把能對(duì)信息傳播過(guò)程或他人行為產(chǎn)生影響的個(gè)體視為具有社交影響力。第四頁(yè),共24頁(yè)。

同質(zhì)性同質(zhì)性指具有相似特征的個(gè)體選擇彼此作為朋友的傾向,即所謂的“物以類(lèi)聚,人以群分”。如果用戶B發(fā)現(xiàn)用戶A和自己有相同的興趣和愛(ài)好,因而選擇A作為自己的朋友,這種現(xiàn)象即是同質(zhì)性的表現(xiàn)。第五頁(yè),共24頁(yè)。

互惠性等其他因素社交影響力除了受到同質(zhì)性的影響,還有很多因素都會(huì)對(duì)影響力分析結(jié)果產(chǎn)生影響,比如互惠性、活躍度、同時(shí)性、異質(zhì)性、環(huán)境因素和關(guān)聯(lián)效應(yīng)等。上述因素中的互惠性指的是用戶在社交過(guò)程中出于禮貌或習(xí)慣等原因?qū)ζ渌脩舻男袨榻o予相應(yīng)回應(yīng)的現(xiàn)象。例如,社交網(wǎng)絡(luò)中,用戶B申請(qǐng)作為A的好友,A在接受請(qǐng)求后出于禮貌又申請(qǐng)作為B的好友,這種投桃報(bào)李的現(xiàn)象就體現(xiàn)出互惠性。社交網(wǎng)絡(luò)的外部因素也會(huì)對(duì)影響力和信息傳播產(chǎn)生作用。例如,研究發(fā)現(xiàn)YouTube上的有些視頻信息能以很快的速度傳播開(kāi)來(lái),而這類(lèi)現(xiàn)象可以用視頻信息受到的外部影響進(jìn)行解釋。第六頁(yè),共24頁(yè)。社交網(wǎng)絡(luò)影響力的度量方法

社交網(wǎng)絡(luò)影響力度量的主要任務(wù)是分析和預(yù)測(cè)用戶社交影響力的大小及演化規(guī)律,為基于社交影響力的研究和應(yīng)用提供技術(shù)支持和理論依據(jù)。常用的影響力度量方法大致可以劃分為基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、基于用戶行為和基于交互信息的度量等類(lèi)型。在進(jìn)行社交影響力分析時(shí),既需要根據(jù)實(shí)際情況選擇合適的度量手段,還可以綜合使用上述方法,盡可能準(zhǔn)確客觀地刻畫(huà)社交影響力的真實(shí)面貌。第七頁(yè),共24頁(yè)。

基于社交網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的度量對(duì)社交網(wǎng)絡(luò)進(jìn)行影響力分析時(shí),網(wǎng)絡(luò)結(jié)構(gòu)中的節(jié)點(diǎn)表示用戶,而節(jié)點(diǎn)之間的連接則表示用戶之間建立的關(guān)系,它們?cè)诜治鲇绊懥r(shí)都起著至關(guān)重要的作用,因此我們分別以網(wǎng)絡(luò)節(jié)點(diǎn)和連接為對(duì)象介紹一些廣泛使用的度量方法。在下文中,社交網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)用圖G=(V,E)表示,如無(wú)特別說(shuō)明,一般是指無(wú)向圖。其中n=|V|表示節(jié)點(diǎn)數(shù);表示節(jié)點(diǎn)i;表示節(jié)點(diǎn)i和j之間的邊,很多時(shí)候也被稱(chēng)之為連接;表示圖的鄰接矩陣;是其中的元素;如果是帶權(quán)圖,我們用表示節(jié)點(diǎn)i和j之間的權(quán)重。節(jié)點(diǎn)的度量第八頁(yè),共24頁(yè)。

第九頁(yè),共24頁(yè)。

連接的度量對(duì)連接的影響力度量即是對(duì)兩個(gè)用戶相互之間影響程度的度量。一般而言,兩個(gè)節(jié)點(diǎn)的鄰居重疊程度越高,這兩個(gè)節(jié)點(diǎn)之間的關(guān)系越緊密,它們之間的影響力也越強(qiáng)烈,可以用Jaccard相似度度量這種關(guān)系:Jaccard相似度用于統(tǒng)計(jì)節(jié)點(diǎn)i和j的共同鄰居在總鄰居數(shù)中所占比例。邊介數(shù)也可用于度量邊在網(wǎng)絡(luò)中的重要程度:第十頁(yè),共24頁(yè)。邊介數(shù)統(tǒng)計(jì)的是網(wǎng)絡(luò)中經(jīng)過(guò)邊的最短路徑的總數(shù)量。博客圖:用有向多重圖表示節(jié)點(diǎn)間的影響力,弧的重?cái)?shù)越多代表節(jié)點(diǎn)間的影響力越強(qiáng),弧的方向表示影響力的作用方向。影響力圖:該圖是有向帶權(quán)圖,弧的方向表示影響力來(lái)源,權(quán)重代表影響力強(qiáng)度,用表示從節(jié)點(diǎn)u到節(jié)點(diǎn)v之間的平行邊條數(shù),其計(jì)算方式為第十一頁(yè),共24頁(yè)?;谟脩粜袨榈亩攘恳话闱闆r下,在線社交網(wǎng)絡(luò)都會(huì)記錄人們通過(guò)交互活動(dòng)產(chǎn)生的大量信息,其中就包括各種用戶行為數(shù)據(jù)。通過(guò)分析這些數(shù)據(jù),可以衡量用戶之間的影響大小及其傳播途徑第十二頁(yè),共24頁(yè)。和范圍,還可以據(jù)此建立用戶之間的社交關(guān)系網(wǎng)絡(luò)。網(wǎng)絡(luò)日志是一種重要的用戶行為數(shù)據(jù)來(lái)源,Goyal等人利用日志信息分別計(jì)算了用戶和動(dòng)作自身的影響力:

其中,u和v表示不同用戶;a表示動(dòng)作;表示動(dòng)作之間的時(shí)間間隔;是時(shí)間常量;表示動(dòng)作在用戶之間的傳播;表示用戶u產(chǎn)生的動(dòng)作數(shù)量;U(a)表示執(zhí)第十三頁(yè),共24頁(yè)。行動(dòng)作a的用戶數(shù)量,與基于網(wǎng)絡(luò)拓?fù)涞墓?jié)點(diǎn)影響力度量方法不同,上述模型以動(dòng)作的傳播頻率作為用戶影響力評(píng)估指標(biāo),并用動(dòng)作的執(zhí)行范圍度量動(dòng)作本身的影響力指標(biāo)?;谟脩艚换バ畔?nèi)容的度量由于用戶的社交影響力能夠促進(jìn)信息的傳播,所以分析在線社交網(wǎng)絡(luò)中信息內(nèi)容的傳播范圍和時(shí)間,能夠比較準(zhǔn)確地反映用戶的影響力。在社交網(wǎng)絡(luò)中,很多傳播廣泛的流行消息都是由影響力較大,擁有大量粉絲的用戶發(fā)起的,因此流行消息的傳播可以作為用戶社交影響力的判斷依據(jù)。第十四頁(yè),共24頁(yè)。P(k)表示用戶在經(jīng)受k次曝光后才開(kāi)始使用該標(biāo)簽的概率,圖中曲線表示實(shí)驗(yàn)數(shù)據(jù)集中最流行的500個(gè)標(biāo)簽的P(k)值的平均分布。從圖中可以間接證明時(shí)間因素在影響力度量中的重要作用。第十五頁(yè),共24頁(yè)。社交網(wǎng)絡(luò)中影響力的傳播

社交影響力本質(zhì)上具有動(dòng)態(tài)屬性,從參與社交活動(dòng)開(kāi)始,每個(gè)人在社會(huì)群體中的影響力都在隨著他的言行和社會(huì)屬性發(fā)生變化,也隨著社交活動(dòng)在社交網(wǎng)絡(luò)中進(jìn)行傳播。在Katz和Lazarsfeld提出的經(jīng)典傳播模型中,信息或者創(chuàng)新的傳播首先從具有較強(qiáng)社會(huì)影響力的群體開(kāi)始,再經(jīng)由他們把信息和創(chuàng)新傳播到更大范圍的人群中去。意見(jiàn)領(lǐng)袖問(wèn)題意見(jiàn)領(lǐng)袖就是能在相應(yīng)環(huán)境下對(duì)其他人產(chǎn)生影響的個(gè)體,很多時(shí)候也被視為有影響力的人。根據(jù)分析過(guò)程中數(shù)據(jù)對(duì)象的不同,意見(jiàn)領(lǐng)袖發(fā)掘方法可以分為基于網(wǎng)絡(luò)結(jié)構(gòu)的方法和基于以交互信息為主的方法。社交網(wǎng)絡(luò)結(jié)構(gòu)能在很大程度上反映某個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中所第十六頁(yè),共24頁(yè)。處位置的重要程度。如果用戶在社交網(wǎng)絡(luò)中的位置能夠如實(shí)體現(xiàn)他在社交活動(dòng)中的領(lǐng)袖地位,利用基于PageRank算法的排名方法就能對(duì)其進(jìn)行度量?;诰W(wǎng)絡(luò)結(jié)構(gòu)的方法過(guò)分強(qiáng)調(diào)了意見(jiàn)領(lǐng)袖的“領(lǐng)袖”特點(diǎn),即在社交網(wǎng)絡(luò)中地位顯赫,而忽視了他發(fā)布“意見(jiàn)”的重要性。因此分析用戶所發(fā)信息的影響力及其傳播特性,能夠更客觀準(zhǔn)確地發(fā)現(xiàn)網(wǎng)絡(luò)中的意見(jiàn)領(lǐng)袖。博客中的意見(jiàn)領(lǐng)袖可以根據(jù)他發(fā)布的有影響力的帖子數(shù)量進(jìn)行識(shí)別,利用博文的引用數(shù)量、評(píng)論數(shù)量、新穎程度和內(nèi)容長(zhǎng)度評(píng)價(jià)帖子的影響力,從而發(fā)掘出意見(jiàn)領(lǐng)袖。通過(guò)觀察和分析用戶網(wǎng)絡(luò)用戶的行為特征及其傳播規(guī)律,也能對(duì)用戶的影響力大小和范圍進(jìn)行度量。第十七頁(yè),共24頁(yè)。

上述兩類(lèi)方法各有優(yōu)勢(shì)和不足,基于網(wǎng)絡(luò)結(jié)構(gòu)的方法模型簡(jiǎn)單,計(jì)算效率高,能夠處理大規(guī)模的社交網(wǎng)絡(luò),但是準(zhǔn)確率相對(duì)較低,在真實(shí)網(wǎng)絡(luò)環(huán)境中存在誤判的可能性;基于交互信息的分析方法得到的結(jié)果客觀準(zhǔn)確,但是由于涉及到大量信息的預(yù)處理和相關(guān)性的計(jì)算,難以適應(yīng)規(guī)模較大的社交網(wǎng)絡(luò)。策略:先利用基于網(wǎng)絡(luò)結(jié)構(gòu)的方法篩選意見(jiàn)領(lǐng)袖的備選集合,然后再利用交互信息的方法選取真正的意見(jiàn)領(lǐng)袖。最大影響力傳播問(wèn)題最大影響力傳播問(wèn)題首先是由Domingos和Richardson提出的,簡(jiǎn)言之就是在社交網(wǎng)絡(luò)中尋找最有影響力的成員集合。第十八頁(yè),共24頁(yè)。

影響力的傳播模型(1)獨(dú)立級(jí)聯(lián)模型可以描述為:在社交網(wǎng)絡(luò)G=(V,E)中,部分用戶在初始時(shí)刻就處于激活狀態(tài),用戶與其鄰居間的影響力用表示,的取值是獨(dú)立的,在傳播過(guò)程中不受和其他鄰居節(jié)點(diǎn)間關(guān)系的影響。如果用戶在某一時(shí)刻t由非激活狀態(tài)變成激活狀態(tài),則對(duì)于非激活狀態(tài)的每一個(gè)鄰居節(jié)點(diǎn),僅在t時(shí)刻有一次機(jī)會(huì)嘗試激活他。例如,的鄰居在t時(shí)刻還沒(méi)有激活,則以概率激活,如果成功,從t+1時(shí)刻起處于激活狀態(tài),但是不管成功與否,再也不能試圖去激活。如果在t時(shí)刻同時(shí)有多個(gè)鄰居都變成了激活狀態(tài),則他們嘗試激活的順序第十九頁(yè),共24頁(yè)。是任意的,系統(tǒng)從初始態(tài)開(kāi)始傳播過(guò)程,直到?jīng)]有新的用戶可以被激活為止。(2)線性閾值模型線性閾值模型在新產(chǎn)品采用等問(wèn)題中應(yīng)用廣泛,該模型可以描述為:在社交網(wǎng)絡(luò)G=(V,E)中,用戶與其鄰居節(jié)點(diǎn)間的影響力權(quán)重為,且所有另?yè)?jù)的影響力權(quán)重之和最大為1,即任意一個(gè)用戶都會(huì)隨機(jī)選定屬于自己的閾值,表示只有當(dāng)?shù)泥従庸?jié)點(diǎn)對(duì)的影響力超過(guò)該閾值,才會(huì)被激活。與獨(dú)立級(jí)聯(lián)模型類(lèi)似,初始時(shí)刻處于激活狀態(tài)第二十頁(yè),共24頁(yè)。的用戶集合,如果截止t時(shí)刻用戶被激活狀態(tài)的鄰居集合為,而尚未被激活,則在滿足以下條件時(shí):從t+1時(shí)刻起變?yōu)榧せ顮顟B(tài),且保持該狀態(tài)不變。系統(tǒng)從出事?tīng)顟B(tài)開(kāi)始演變,直到?jīng)]有新用戶被激活為止。第二十一頁(yè),共24頁(yè)。總結(jié)與展望

本文主要介紹了在線社交網(wǎng)絡(luò)興起以來(lái)社交影響力分析的主要成果,首先闡述了社交影響力的基本概念和與之相關(guān)的其他因素,介紹了區(qū)分影響力和這些因素的研究工作,接著重點(diǎn)總結(jié)了影響力分析建模和度量方法。雖然社交影響力分析已經(jīng)取得豐碩的理論和應(yīng)用成果,但我們認(rèn)為至少還有以下問(wèn)題有待深入研究和探索:(1)社交網(wǎng)絡(luò)用戶數(shù)量眾多,用戶之間形成的關(guān)系也非常復(fù)雜,在這樣的環(huán)境下對(duì)社交影響力的定性分析也受到很多因素的影響和干擾。(2)目前,社交影響力的建模方法大致分為兩

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論