基于SemRank的CWME專家權(quán)威度計算方法研討_第1頁
基于SemRank的CWME專家權(quán)威度計算方法研討_第2頁
基于SemRank的CWME專家權(quán)威度計算方法研討_第3頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于SemRank的CWME專家權(quán)威度計算方法研討

摘要:針對綜合集成研討環(huán)境中的專家權(quán)威度評價問題,提出了一種基于SemRank的專家權(quán)威度計算方法。該方法既考慮專家之間的交互結(jié)構(gòu),又考慮專家發(fā)言內(nèi)容之間的語義關(guān)聯(lián)。由于專家之間的交互具有動態(tài)復(fù)雜性,在計算語義關(guān)聯(lián)時,引入了時間衰減函數(shù),反映時間這一要素的影響。實驗結(jié)果表明,提出的專家權(quán)威度計算方法合理有效;在綜合集成研討環(huán)境中,對促進(jìn)專家良性互動和激發(fā)專家思維具有一定的作用。關(guān)鍵詞:基于cyberspace的綜合集成研討廳;群體交互;SemRank;開放的復(fù)雜巨系統(tǒng)

ExpertauthorityestimatingmethodbasedonSemRankinCWME

WANGAi,LIYao-dong,LIWei-jie

(KeyLaboratoryofComplexSystems&IntelligenceScience,InstituteofAutomation,ChineseAcademyofSciences,Beijing100190,China)

Abstract:Tosolvetheproblemofmeasuringexperts’authorityinCWME,thispaperproposedamethodforestimatingexpertauthoritybasedonSemRank.Thismethodnotonlyconsideredtheinteractivestructurebetweenexperts,butalsotookintoaccountsemanticrelationbetweentheexperts’speeches.Astheinteractionbetweenexpertspossesseddynamiccomplexity,introducedthetimedecayfunctiontoestimatingsemanticrelation.Experimentalresultshowsthattheproposedmethodisfeasibleandeffective.ItlaysagoodfoundationforexpertstointeractandinspireinCWME.

Keywords:cyberspaceforworkshopofmetasyntheticengineering(CWME);collectiveinteraction;SemRank;opencomplexgiantsystems

0引言

1990年錢學(xué)森等人[1]提出開放的復(fù)雜巨系統(tǒng)的概念,以及處理這類系統(tǒng)的方法論——從定性到定量的綜合集成方法。綜合集成法就其實質(zhì)而言是將專家群體(各種有關(guān)的專家)、數(shù)據(jù)和各種信息與計算機技術(shù)有機地結(jié)合起來,把各種學(xué)科的科學(xué)理論和人的經(jīng)驗知識結(jié)合起來,三者構(gòu)成一個系統(tǒng)。這個方法的成功關(guān)鍵在于充分發(fā)揮了系統(tǒng)的整體優(yōu)勢和綜合優(yōu)勢。1992年3月,錢學(xué)森進(jìn)一步提出了人機結(jié)合,從定性到定量的綜合集成研討廳(HWME)體系的思想[2]。這個研討廳的構(gòu)思是把人集成于系統(tǒng)之中,采用人機結(jié)合、以人為主的技術(shù)路線,充分發(fā)揮人的作用,使研討的集體在討論問題時互相啟發(fā),互相激活,使集體創(chuàng)見遠(yuǎn)遠(yuǎn)勝過個人的智慧[3]。

隨著Internet和各種通信網(wǎng)絡(luò)的迅速普及,cyberspace(電子空間和數(shù)字空間)成為一個重要的概念,它使參與者跨越時間和地域的限制,隨時隨地就所關(guān)心的問題進(jìn)行研究、交流和探討,并可隨時利用網(wǎng)絡(luò)上的大量資源。信息技術(shù)的這個發(fā)展,為綜合集成研討廳的實現(xiàn)提供了一種新的、可能的形式,即基于cyberspace的綜合集成研討廳(CWME)[4]。通過多年的探索與實踐,已經(jīng)成功建立了幾個典型的CWME系統(tǒng)[5,6]。

在CWME體系中,專家群體是最具有能動性的成員,各專家以研討的方式暢所欲言,充分表達(dá)自己的觀點,隨時進(jìn)行質(zhì)詢和辯論,以促進(jìn)對復(fù)雜問題認(rèn)識的提高。但是在研討過程中,每個專家對同一復(fù)雜問題的認(rèn)識和判斷都不盡相同,且參與者個人的行為和判斷會不同程度地影響周圍每個人的思維判斷,使得專家群體中的交互關(guān)系存在著微妙的隨時間變化的動態(tài)復(fù)雜性。因此,在綜合集成研討廳體系中,如何衡量專家意見的合理性,計算在研討過程中涌現(xiàn)出來的專家權(quán)威度,刻畫專家群體之間的交互關(guān)系和結(jié)構(gòu),從而促進(jìn)研討流暢、高效地進(jìn)行,是研討廳體系實踐和應(yīng)用過程中的一個重要問題。

文獻(xiàn)[7]提出一種對發(fā)言觀點進(jìn)行權(quán)威度計算的方法。該方法借鑒萬維網(wǎng)網(wǎng)頁的鏈接概念,根據(jù)發(fā)言之間的響應(yīng)關(guān)系建立廣義專家群體的有向鏈接結(jié)構(gòu)。該結(jié)構(gòu)采用有向?qū)傩詧D表示,專家的每條發(fā)言作為一個節(jié)點,每個節(jié)點有兩個屬性,即見解質(zhì)量屬性和見解評價屬性。專家發(fā)言之間的響應(yīng)關(guān)系作為有向邊(鏈接)。根據(jù)發(fā)言響應(yīng)和被響應(yīng)的情況計算每條發(fā)言的權(quán)威度,發(fā)言被響應(yīng)的次數(shù)越多,該條發(fā)言的權(quán)威度越高;權(quán)威度較高的發(fā)言所響應(yīng)的發(fā)言,其權(quán)威度也較高,反之權(quán)威度越小。文獻(xiàn)[8]提出了基于即時發(fā)言評價的專家權(quán)威度計算方法。在研討過程中,各位專家在主持人的引導(dǎo)下按照一定的評價指標(biāo)即時對發(fā)言進(jìn)行評價,所采用的評價指標(biāo)是相關(guān)度、可信度、合理度以及啟發(fā)度。在研討過程中,一個專家的權(quán)威度主要是由其發(fā)言效率和評價效率決定的。因此,基于即時發(fā)言評價的專家權(quán)威度計算方法的基本思想是通過計算專家的發(fā)言效率和評價效率,并對兩者進(jìn)行適當(dāng)加權(quán),進(jìn)而得出專家的總體權(quán)威度。

上述方法盡管可以計算專家某條發(fā)言的權(quán)威度,但是并沒有從語義的角度考慮專家的發(fā)言內(nèi)容之間的關(guān)系,同時也沒有考慮專家群體交互的動態(tài)復(fù)雜性?;诖耍疚奶岢隽嘶赟emanticRank(SemRank)的專家權(quán)威度計算方法。該方法既考慮專家之間的交互結(jié)構(gòu),又考慮專家發(fā)言內(nèi)容之間的語義關(guān)聯(lián);在計算語義關(guān)聯(lián)時,該方法還引入了時間要素這一概念來體現(xiàn)專家交互的動態(tài)復(fù)雜性。實驗結(jié)果表明,本文提出的專家權(quán)威度計算方法合理、有效,可以為與會專家在綜合集成研討環(huán)境中進(jìn)行良性互動提供一定的參考意義。

1PageRank算法

本文提出的SemRank算法是在PageRank的基礎(chǔ)發(fā)展得到的,“PageRank”技術(shù)[9]最早由斯坦福大學(xué)的“Google”研究小組提出??梢杂靡环N“隨機沖浪”模型作為“PageRank”的理論基礎(chǔ),該模型描述網(wǎng)絡(luò)用戶對網(wǎng)頁的訪問行為。假設(shè)如下:

a)用戶隨機地選擇一個網(wǎng)頁作為上網(wǎng)的起始網(wǎng)頁;

b)看完這個網(wǎng)頁后,從該網(wǎng)頁所含的超鏈接中隨機地選擇一個頁面繼續(xù)進(jìn)行瀏覽;

c)沿著超鏈接前進(jìn)了一定數(shù)目的網(wǎng)頁后,用戶對這個主題感到厭煩,重新隨機選擇一個網(wǎng)頁進(jìn)行瀏覽,如此反復(fù)。

根據(jù)上述的用戶行為模型,PageRank的基本思想就是引入一個網(wǎng)頁的權(quán)威值的概念,其網(wǎng)頁的權(quán)威值與網(wǎng)頁的內(nèi)容無關(guān),權(quán)威值計算是根據(jù)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)圖。網(wǎng)頁p的權(quán)威值取決于兩個要素:a)有多少網(wǎng)頁引用了它(網(wǎng)頁p);b)引用網(wǎng)頁p的這些網(wǎng)頁的權(quán)威值。因此這是一個循環(huán)迭代的過程[10]。計算公式如下:x?p=dN+(1-d)?q∈pa[p]x?qh?q(1)

其中:d∈(0,1)是阻尼因子;h?q是節(jié)點q的出度,就是q有多少個超鏈接外鏈;pa[p]是指向p的網(wǎng)頁集合;N是指網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中節(jié)點數(shù),即網(wǎng)頁的數(shù)量。

2基于SemRank的專家權(quán)威度計算方法

綜合集成研討廳體系的鏈接結(jié)構(gòu)是通過專家群體的有效互動建立起來的。在互動過程中,專家對以前的發(fā)言進(jìn)行評論,同時發(fā)表自己對問題的見解,通過這種響應(yīng)建立起個體之間響應(yīng)關(guān)系,進(jìn)而可建立專家群體的有向鏈接結(jié)構(gòu)。鏈接結(jié)構(gòu)中,專家每次的發(fā)言為一個節(jié)點,專家發(fā)言的響應(yīng)或者被響應(yīng)關(guān)系為有向邊,從而使得這種鏈接結(jié)構(gòu)可用有向?qū)傩詧D表示。這與PageRank中描述WWW的有向?qū)傩杂邢嗨浦?WWW中的網(wǎng)頁對應(yīng)一個節(jié)點,WWW中網(wǎng)頁的鏈接關(guān)系對應(yīng)圖中的邊。文獻(xiàn)[7]采用的就是這個思路計算專家發(fā)言的權(quán)威度。

在實踐過程中,運用上述方法卻經(jīng)常遇到兩個問題:a)雖然某條發(fā)言A在長時間內(nèi)得到較多的響應(yīng),但此時發(fā)言的主題已經(jīng)發(fā)生了一定程度的改變,此時A的權(quán)威度理應(yīng)下降,但是由于PageRank算法本身不考慮發(fā)言內(nèi)容的語義相似度,導(dǎo)致計算出來的A的權(quán)威度偏高;b)越早的發(fā)言,權(quán)威度容易越高,這是因為較早的發(fā)言容易得到相對較多的響應(yīng),或者說最近的發(fā)言經(jīng)常尚未得到充分的響應(yīng),此時按照PageRank計算的權(quán)威度會偏離真實的權(quán)威度情況。

針對這兩個常見問題,在PageRank算法的基礎(chǔ)上,本文提出SemRank方法。該方法的優(yōu)勢在于:a)引入發(fā)言內(nèi)容的語義相似度計算方法,在衡量某條發(fā)言的權(quán)威度時,不僅考慮它得到了多少響應(yīng),同時考慮它與所響應(yīng)的發(fā)言之間的語義聯(lián)系;b)引入時間衰減函數(shù),對較近的響應(yīng)賦予較大的權(quán)重,削弱某些早期發(fā)言過于長久的影響。

SemRank算法同樣根據(jù)有向?qū)傩詧D來計算每條發(fā)言的權(quán)威度,然后對每個專家的所有發(fā)言的權(quán)威值求均值,獲得該專家的總體權(quán)威度。

2.1發(fā)言內(nèi)容的動態(tài)相似度計算

首先考慮專家發(fā)言之間的語義關(guān)聯(lián),把研討中的每條發(fā)言表示成tf-idf向量形式,采用余弦相似度計算語義關(guān)聯(lián)程度,計算公式如下:

sim(u,v)=?ω∈u,vtf?u(ω)tf?v(ω)idf(ω)?2

?ω∈u(tf?u(ω)idf(ω))?2

?ω∈v(tf?v(ω)idf(ω))?2

(2)

其中:tf?u(ω)和tf?v(ω)分別表示詞ω在發(fā)言u和v中的詞頻;idf(ω)表示逆文本頻率,計算公式為

idf(ω)=log(N/n?ω)(3)

其中:n?ω是表示有多少條發(fā)言包含詞ω,N為總的發(fā)言數(shù)。

式(2)只考慮了專家發(fā)言之間的靜態(tài)關(guān)系。實際上這種關(guān)系應(yīng)該是與時間相關(guān)的:兩條發(fā)言之間的時間間隔越長,語義之間的相似度就越低,反之則越高。因此本文考慮時間衰減要素,引入時間衰減函數(shù)(這里考慮的時間信息是專家的每條發(fā)言在整個研討過程中的相對位置,而不是每條發(fā)言在研討過程中出現(xiàn)的絕對時間),得到如下的動態(tài)相似度計算公式:

s?i(u,v,T)=sim(u,v)×f?i(u,v,T);i=1,2(4)

其中:f?i(u,v,T)為發(fā)言u與v之間的時間衰減函數(shù)。這里采用兩種形式:

a)f?1(u,v,T)=1-|k-i-1|/N。其中:發(fā)言u為研討中第k個發(fā)言,發(fā)言v為研討中第i個發(fā)言。

b)f?2(u,v,T)=1/|k-i|。其中:發(fā)言u為研討中第k個發(fā)言,發(fā)言v為研討中第i個發(fā)言。

2.2專家權(quán)威度計算

基于SemRank的專家權(quán)威度計算的算法實現(xiàn)過程如下:

初始值:向量P?0=(p?0(1),p?0(2),…,p?0(N)),其中p?0(u)=1/N(u=1,2,…,N)。?

輸入:errorε。

輸出:向量P=(p(1),p(2),…,P(N))。

t=0

repeat

t=t+1

根據(jù)式(6)計算P?t(u)(u=1,2,…,N)

δ=‖P?t-Pt-1‖

untilδ<ε

returnP?t

在考慮了發(fā)言內(nèi)容之間的動態(tài)語義相似度以后,專家之間交互的有向?qū)傩詧D就成為了一個加權(quán)的有向?qū)傩詧D。從文獻(xiàn)[11]獲得啟發(fā),在加權(quán)的有向?qū)傩詧D的基礎(chǔ)上計算專家發(fā)言的權(quán)威值。

加權(quán)的有向?qū)傩詧D通過兩個矩陣的點乘形式表示:

B?kN×N=AN×N??×sim?kN×N;k=1,2(5)

其中:B?kN×N(i,j)=AN×N(i,j)×sim?kN×N(i,j)(i,j=1,2,…,N;k=1,2);矩陣AN×N為鄰接矩陣,如果節(jié)點i到j(luò)之間有一條有向邊,則AN×N(i,j)為1,否則為0;矩陣sim?kN×N為動態(tài)相似度矩陣,式中sim?kN×N(i,j)=s?k(i,j,T)(k=1,2)。

在此加權(quán)有向?qū)傩詧D矩陣B?kN×N的基礎(chǔ)上,專家發(fā)言的權(quán)威值計算如下:

p?k(u)=dN+(1-d)?v∈adj[u]B?k(v,u)B?k(v,i)p?k(v)(6)

其中:k=1或k=2,即計算矩陣B?kN×N時采用了哪個時間衰減函數(shù);N是屬性圖的節(jié)點總數(shù);d是阻尼因子,一般都在區(qū)間[0.1,0.2]選擇,一般選擇0.15;adj[u]是指向u的發(fā)言集合。

最后將權(quán)威度向量進(jìn)行歸一化,即

P=(p(1)maxNi=1p(i),

p(2)maxNi=1p(i),…,

p(N)maxNi=1p(i))(7)4結(jié)束語

針對綜合集成研討環(huán)境中的專家權(quán)威度評價問題,本文提出基于SemRank的專家權(quán)威度計算方法。該方法既考慮了專家之間的交互結(jié)構(gòu),又考慮了專家發(fā)言內(nèi)容之間的語義關(guān)聯(lián),同時引入了時間衰減函數(shù)來反映交互的動態(tài)復(fù)雜性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論