基于熵最優(yōu)化的工程項(xiàng)目風(fēng)險(xiǎn)預(yù)警方法_第1頁(yè)
基于熵最優(yōu)化的工程項(xiàng)目風(fēng)險(xiǎn)預(yù)警方法_第2頁(yè)
基于熵最優(yōu)化的工程項(xiàng)目風(fēng)險(xiǎn)預(yù)警方法_第3頁(yè)
基于熵最優(yōu)化的工程項(xiàng)目風(fēng)險(xiǎn)預(yù)警方法_第4頁(yè)
基于熵最優(yōu)化的工程項(xiàng)目風(fēng)險(xiǎn)預(yù)警方法_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于熵最優(yōu)化的工程項(xiàng)目風(fēng)險(xiǎn)預(yù)警方法

項(xiàng)目風(fēng)險(xiǎn)預(yù)警系統(tǒng)是根據(jù)項(xiàng)目的實(shí)際特點(diǎn),在不同的建設(shè)階段研究和評(píng)估風(fēng)險(xiǎn)因素,確定風(fēng)險(xiǎn)等級(jí),建立預(yù)警系統(tǒng),采取風(fēng)險(xiǎn)防范和控制措施,降低風(fēng)險(xiǎn)損失,確保項(xiàng)目順利進(jìn)行。然而,由于項(xiàng)目的復(fù)雜性,在風(fēng)險(xiǎn)評(píng)估過(guò)程中,人們無(wú)法全面、正確地識(shí)別項(xiàng)目的真實(shí)狀態(tài),只能依靠一些指標(biāo)(特征)來(lái)評(píng)估其所屬類別。顯然,這些指標(biāo)的選擇非常重要,這也將嚴(yán)重影響分類器的設(shè)計(jì)和性能。然而,當(dāng)前項(xiàng)目指標(biāo)的選擇和評(píng)價(jià)主要集中在對(duì)專家的咨詢和評(píng)估上。因此,解決資源選擇問(wèn)題是項(xiàng)目風(fēng)險(xiǎn)預(yù)算模型設(shè)計(jì)的一項(xiàng)重要課題。本工作使用最小干擾閾值和專家評(píng)估的方法,完成了評(píng)價(jià)模型中的資源選擇。在風(fēng)險(xiǎn)分類中,基于極云原理,設(shè)計(jì)了公共簇中的公共熵函數(shù)。然后,利用優(yōu)化理論,提出了一種新的集群聚類算法。這是c-平均值算法的推廣。1項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型的設(shè)計(jì)1.1判別熵概率分布描述工程項(xiàng)目經(jīng)營(yíng)管理狀況的指標(biāo)涉及到技術(shù)開(kāi)發(fā)風(fēng)險(xiǎn)、生產(chǎn)風(fēng)險(xiǎn)、市場(chǎng)風(fēng)險(xiǎn)、資金風(fēng)險(xiǎn)、金融風(fēng)險(xiǎn)、技術(shù)管理風(fēng)險(xiǎn)、社會(huì)環(huán)境風(fēng)險(xiǎn)等各個(gè)方面.特征選取基本任務(wù)是從許多特征中找出那些最有效的特征.作為不確定性的一種度量的表達(dá)式shannon熵,這樣一種概念也可以用來(lái)作為某個(gè)概率分布密度p(xi)偏離給定標(biāo)準(zhǔn)分布ω(xi)的程度的度量,把它叫做相對(duì)熵,即V(p,ω)=-∑p(xi)log[p(xi)/ω(xi)]≤0(1)求和應(yīng)在該特征所有可能的取值上進(jìn)行.相對(duì)熵越小,這兩類概率分布的差別就越大,但兩類概率分布完全相同時(shí),相對(duì)熵達(dá)最大值(等于零).根據(jù)相對(duì)熵的特點(diǎn),可以定義判別熵W(p,q)來(lái)表征兩類分布p(xi)和q(xi)的差別大小.w(p,q)=V(p,q)+V(q,p)=-∑p(xi)logp(xi)-∑q(xi)logq(xi)+∑p(xi)logq(xi)+∑q(xi)logp(xi)≤0(2)在多種情況下,可以用∑i∑jW(p(i),q(j))來(lái)表示各類分布之間的分離程度.i,j代表類別號(hào).對(duì)于特征提取來(lái)說(shuō),在給定維數(shù)d的條件下,應(yīng)該求得這樣d個(gè)指標(biāo),它使上述判別熵最小.為了計(jì)算方便起見(jiàn),可以用下列函數(shù)U(p,q)=-∑i(pi-qi)2≤0(3)來(lái)代替W(p,q),而不影響選取d個(gè)最優(yōu)指標(biāo)的結(jié)果.在不對(duì)概率分布作估計(jì)的情況下,可以用經(jīng)過(guò)歸一化處理的樣本指標(biāo)值來(lái)代替上式中的概率分布:p(1)i=1Ν1Ν1∑k=1(x(1)ki)2D∑i=1(x(1)ki)2=1}(4)式中,k是第一類樣本集中的樣本號(hào);N1是第一類的樣本總數(shù);i是特征號(hào).由于D∑i=1pi=1,所以這樣做是合理的.同理計(jì)算qi.1.2極大熵聚類算法若按判別熵最小原則,即依據(jù)式(3),式(4),在n個(gè)項(xiàng)目樣本組成的樣本集中,選定樣本的k個(gè)指標(biāo),指標(biāo)矩陣可表示為X=[x11x12?x1nx21x22?x2n???xk1xk2?xkn](5)式中,xij為樣本j指標(biāo)i的指標(biāo)值,i=1,2,…,k,j=1,2,…,n.亦可將X表示成一個(gè)指標(biāo)向量集X={x1,x2,…,xk}?Rn.若將項(xiàng)目風(fēng)險(xiǎn)狀態(tài)等級(jí)總數(shù)記為c,即c個(gè)評(píng)語(yǔ)等級(jí),考慮某種相似性度量,則可將X聚合成c個(gè)分離開(kāi)的子集X1,X2,…,Xc.每個(gè)子集表示一類,分別包括n1,n2,…,nc個(gè)指標(biāo)向量,設(shè)Xj={x(j)1,x(j)2,…,x(j)nj}.為了衡量聚類的質(zhì)量,常采用誤差平方和J為目標(biāo)函數(shù),即J(X,V)=c∑j=1∑xk∈Xjp(xk)∥xk-vj∥2(6)式中,p(xk)是抽樣概率;V={v1,v2,…,vc}?Rn是碼本;而vj(j=1,2,…,c)稱為碼向量;它被定義為第j類Xj的均值,即vj=1njn∑k=1x(j)k;指標(biāo)向量xk∈Xj由最近鄰原理定義,即當(dāng)∥xk-vj∥2=minl∥xk-vl∥2,xk∈Xj.C-均值算法就是由最近鄰原理和vj=1njn∑k=1x(j)k定義的,但它是一個(gè)啟發(fā)過(guò)程,而不是一個(gè)最優(yōu)化過(guò)程,這是由于函數(shù)J是不可微的,于是無(wú)約束最優(yōu)化的梯度方法不能夠直接應(yīng)用.這類算法最大的問(wèn)題是算法訓(xùn)練沒(méi)有一個(gè)終止準(zhǔn)則,算法最后結(jié)果嚴(yán)重依賴碼向量的初始值.從最優(yōu)化理論的角度看,求式(6)的最小問(wèn)題其實(shí)是個(gè)不可微優(yōu)化問(wèn)題.人們常用一簇可微函數(shù)逼近目標(biāo)函數(shù)來(lái)處理該問(wèn)題.比如,文獻(xiàn)借助極大熵原理構(gòu)造了一致逼近目標(biāo)函數(shù)的熵函數(shù),本文根據(jù)這一思想,研究了一種極大熵聚類算法進(jìn)行分類.對(duì)于指標(biāo)向量x,定義函數(shù)fx:Rcn→Rc,fx(V)=fx(v1,v2,…,vc)=(-‖x-v1‖2,-‖x-v2‖2,…,-‖x-vc‖2)T,則∥fx(V)∥∞=maxj(-∥x-vi∥2)=-minj(∥x-vj∥)2.于是式(6)可以改寫為J(X?V)=Κ∑k=1p(xk)(-∥fxk(V)∥∞)(7)下面引入一種新的衡量聚類質(zhì)量的目標(biāo)函數(shù),Jc=Jc(X,V)=c∑j=1∑xk∈Xjp(xk)p(vj|xk)∥xk-vj∥2=c∑i=1∑xk∈Xjp(xk,vj)∥xk-vj∥2=Κ∑k=1p(xk)Jc(V|xk)(8)式中,p(xk,vj)是xk和vj的聯(lián)合概率;p(vj,xk)是條件概率;Jc(V|xk)定義為Jc(V|xk)=Jc(v1,v2,?,vc|xk)=c∑j=kp(vj|xk)∥xk-vj∥2(9)當(dāng)完全分配一個(gè)指標(biāo)向量給與之最近的碼向量,即條件概率由下式定義時(shí),p(vj|xk)={1,xk∈Xj0,其他(10)式(8)退化為式(6).此時(shí)關(guān)于自由參數(shù){vj,p(vj|xk)}(k=1,2,…,K;j=1,2,…,c)求式(8)定義的Jc最小,立即可以產(chǎn)生一個(gè)硬聚類解.然而可以把這個(gè)最優(yōu)化問(wèn)題考慮為去尋找一個(gè)分布,在滿足一定程度隨機(jī)性下它最小化目標(biāo)函數(shù)Jc.自然,隨機(jī)程度可以用X和V的Shannon聯(lián)合熵來(lái)度量,即Η(X,V)=-Κ∑k=1c∑j=1p(xk,vj)lnp(xk,vj)(11)于是這個(gè)最優(yōu)化問(wèn)題可以簡(jiǎn)單地變?yōu)長(zhǎng)agrange最小化問(wèn)題:L(X,V)=Jc(X,V)-ΤΗ(X,V)(12)T是Lagrange乘子.很明顯,對(duì)大的T,主要是試圖最大熵,隨著T的降低,以熵?fù)Q取失真的減少,當(dāng)T趨于零,最小Jc直接獲得一個(gè)非隨機(jī)解.進(jìn)一步分析由式(12)定義的Lagrange函數(shù)L,首先注意到可以分解聯(lián)合熵:Η(X,V)=-Κ∑k=1c∑j=1p(xk,vj)lnp(xk,vj)=-Κ∑k=1c∑j=1p(xk)p(vj|xk)ln(p(xk)p(vj|xk))=-Κ∑k=1c∑j=1p(xk)p(vj|xk)(lnp(xk)+lnp(vj|xk))=-Κ∑k=1p(xk)lnp(xk)-Κ∑k=1p(xk)c∑j=1p(vj|xk)lnp(vj|xk)=Η(X)+Κ∑k=1p(xk)Η(V|xk)=Η(X)+Η(V|X)(13)其中Η(X)=-Κ∑k=1p(xk)lnp(xk)(14)Η(V|xk)=Η(v1,v2,?,vc|xk)=-c∑j=1p(vj|xk)lnp(vj|xk)(15)Η(V|X)=-Κ∑k=1p(xk)c∑j=1p(vj|xk)lnp(vj|xk)=Κ∑k=1p(xk)Η(V|xk)(16)由于H(X)是信源熵,它獨(dú)立于聚類,因而可以從函數(shù)L中抽取常數(shù)H(X),而主要集中于條件熵H(V|X).另一方面,由式(6)定義的目標(biāo)函數(shù)J總是非負(fù)的,自然也希望逼近它的函數(shù)L同樣非負(fù),但由于-H(V|X)是負(fù)的,因而這個(gè)條件不能夠得到保證.然而知道H(V|X)=Κ∑k=1p(xk)?H(V|xk)≤Κ∑k=1p(xk)lnC=lnC,并且min(-H(V|X))同min(lnC-H(V|X))是等價(jià)的.于是可以把最小化問(wèn)題式(12)變?yōu)閙in{LΤ(X,V)=Jc(X,V)+Τ(lnC-Η(V|X))=Κ∑k=1p(xk)LΤ(V|xk)}(17)LΤ(V|xk)=Jc(V|xk)+Τ(lnC-Η(V|xk))(18)關(guān)于p(vj,xk)直接最小化LT(X,V),可以得到p(vj|xk)滿足Gibbs分布,即p(vj|xk)=exp[-∥xk-vj∥2/Τ]Ζxk(19)正則參數(shù)Zxk為Ζxk=C∑j=1exp[-∥xk-vj∥2/Τ](20)把式(19)代入到式(17),就可以獲得函數(shù)LT(X,V)相應(yīng)的最小形式L*T(X,V):LΤ*(X,V)=minp(vj|xk)LΤ(X,V)=Τ∑k=1Κp(xk)?[lnC-ln∑t=1cexp[-∥xk-vj∥2/Τ]]=∑k=1Κp(xk)LΤ*(V|xk)(21)其中,L*T(X,V)稱為熵函數(shù)(或凝聚函數(shù)).LΤ*(V|xk)=-Τln∑j=1Cexp[-∥xk-vj∥2Τ]+ΤlnC(22)關(guān)于碼向量vj最小化L*T(X,V),設(shè)置它的梯度為零,經(jīng)過(guò)簡(jiǎn)單計(jì)算得到:∑k=1Κp(xk)p(vj|xk)(xk-vj)=0(23)或∑k=1Κp(xk,vj)(xk-vj)=0(24)所以vj=∑k=1Κp(xk,vj)xk∑k=1Κp(xk|vj)=∑k=1Κp(vj)p(xk|vj)xkp(vj)=∑k=1Κp(xk|vj)xkj=1,2,?,c(25)在實(shí)際應(yīng)用中,一般都假設(shè)X={x1,x2,…,xk}?RN中的指標(biāo)向量是相互獨(dú)立的,即p(xk)=1/K時(shí),此時(shí)由式(23)可得vj=∑k=1Κp(vj|xk)xk∑k=1Κp(vj|xk)j=1,2,?,c(26)綜上所述,由于該聚類算法起源于極大熵函數(shù),稱之為極大熵聚類算法.可以看出,當(dāng)T→0時(shí)極大熵聚類算法就是C-均值算法,由此可以說(shuō)極大熵聚類算法是C-均值算法的一種推廣格式;而當(dāng)T→∞時(shí),由于所有的碼向量的值相等,因而實(shí)際上是把所有的指標(biāo)向量聚成一類.由式(25)或式(26)可知,算法對(duì)于任一指標(biāo)向量是以概率為比例分配給所有碼向量,而不是僅僅只完全分配給與之最近的碼向量,它在一定程度上能克服標(biāo)準(zhǔn)C-聚類對(duì)初始碼向量選取敏感的問(wèn)題.而且算法對(duì)具有噪聲干擾的指標(biāo)向量進(jìn)行聚類時(shí)具有較強(qiáng)的魯棒性.2案例研究以某高速公路路面結(jié)構(gòu)設(shè)計(jì)和道路工程質(zhì)量檢驗(yàn)為例,對(duì)公路工程質(zhì)量進(jìn)行風(fēng)險(xiǎn)預(yù)警.2.1特征提取指標(biāo)根據(jù)公路工程質(zhì)量評(píng)定國(guó)家標(biāo)準(zhǔn),將評(píng)定要素取為特征集,利用專家評(píng)價(jià)法從中選擇10個(gè)特征,對(duì)每一個(gè)要評(píng)判的具體工程,其評(píng)定結(jié)果可分為2類:優(yōu),劣.通過(guò)德?tīng)栰撤ㄟx擇12條優(yōu)質(zhì)和12條劣質(zhì)高速公路的數(shù)據(jù)作為訓(xùn)練樣本.現(xiàn)要將10個(gè)指標(biāo)值通過(guò)特征提取后得到4個(gè)指標(biāo),用pi表示第1類(劣質(zhì))樣本的第i個(gè)指標(biāo)值的概率分布,qi表示第2類(優(yōu)質(zhì))樣本的第i個(gè)指標(biāo)值的概率分布,通過(guò)式(6)計(jì)算得出pi和qi的值.為保證式(5)成立,只需找出使-(pi-qi)2最小的4個(gè)指標(biāo)即可.從而得到特征提取后的4個(gè)指標(biāo)為:路基路面,安全舒適,橋梁涵洞,排水防護(hù).2.2確定初始值迭代規(guī)則將某高速公路路面結(jié)構(gòu)設(shè)計(jì)和道路工程質(zhì)量檢驗(yàn)作為測(cè)試樣本,取出其4個(gè)指標(biāo)值.根據(jù)極大熵聚類算法的步驟:定義危機(jī)等級(jí)c=2,Lagrange乘子

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論