基于云模型定性規(guī)則推理的分類方法_第1頁
基于云模型定性規(guī)則推理的分類方法_第2頁
基于云模型定性規(guī)則推理的分類方法_第3頁
基于云模型定性規(guī)則推理的分類方法_第4頁
基于云模型定性規(guī)則推理的分類方法_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于云模型定性規(guī)那么推理的分類方法論文導(dǎo)讀::根據(jù)粗糙集原理和模糊集理論,提出了一種基于云模型定性規(guī)那么推理的分類方法,它利用云的相關(guān)理論獲得多條件單規(guī)那么中包含隸屬度的決策表,結(jié)合模糊模式識(shí)別技術(shù)進(jìn)行樣本分類。針對(duì)一些數(shù)據(jù)對(duì)象分別隸屬于不同類別的情況,定性概念來代替模糊集中的定量數(shù)據(jù)并建立二元關(guān)系,能對(duì)連續(xù)型數(shù)據(jù)進(jìn)行更為簡單合理的軟;分類,從而使基于定性概念的算法模型符合人類思維方式。論文關(guān)鍵詞:云模型,規(guī)那么推理,分類算法,定性概念0 引言在模糊理論【1】中,模糊聚類分析方法就是通過建立模糊相似矩陣或模糊等價(jià)矩陣,利用直接聚類法、最大樹法、編網(wǎng)法等方法結(jié)合閾值對(duì)論域中的樣本進(jìn)行分類。然而模

2、糊相似矩陣和模糊等價(jià)矩陣都是通過相似系數(shù)法、距離法和其它方法如數(shù)量積法、夾角余弦法、海明距離、歐氏距離、切比雪夫距離等方法建立在二元關(guān)系的根底之上,并且通過等價(jià)關(guān)系的傳遞性質(zhì)進(jìn)行動(dòng)態(tài)聚類。因此,建立二元關(guān)系是進(jìn)行分類或聚類的重要過程。不同論域中定量數(shù)據(jù)可以通過模糊聚類方法中的一般步驟建立起二元關(guān)系,即兩個(gè)樣本之間的相似關(guān)系或相關(guān)程度。那么,定性概念是符合人類思維方式的一種數(shù)據(jù)結(jié)果表達(dá)方法,建立定性概念之間的二元關(guān)系是否也能對(duì)相應(yīng)論域中的樣本進(jìn)行分類呢?由于云是定量數(shù)據(jù)與定性概念之間相互轉(zhuǎn)化的智能模型,它主要應(yīng)于數(shù)據(jù)挖掘、預(yù)測【6】和決策等領(lǐng)域,實(shí)現(xiàn)算法過程的定性概念描述和推理分析。通常情況下,

3、定量數(shù)據(jù)的推理過程是通過模糊控制理論來實(shí)現(xiàn),起到定量數(shù)據(jù)的模糊化推理,可以到達(dá)較好的結(jié)果。同樣,不確定性人工智能云理論的誕生,為定性推理奠定理論根底。本文主要根據(jù)模糊粗糙集理論,提出一種基于云理論定性推理的分類算法。與傳統(tǒng)方法相比,該方法通過利用云模型的相關(guān)機(jī)制對(duì)隸屬于不同概念的樣本實(shí)現(xiàn)軟;分類,而且其分類的輸出結(jié)果符合人的思維模式。1 云模型為了更為方便地說明分類算法過程分類算法,我們對(duì)李德毅院士提出的云模型的相關(guān)定義作一些簡單的介紹,并給出一些相關(guān)定義。定義1設(shè)是一個(gè)用精確數(shù)據(jù)值表示的定量論域,是上的定性概念,假設(shè)定量值,且是定性概念的一次隨機(jī)實(shí)現(xiàn),對(duì)的隸屬度確定度為是具有穩(wěn)定傾向的隨機(jī)數(shù)

4、,那么在論域上的分布稱為云,每個(gè)稱為一個(gè)云滴。云是用語言值表示的某個(gè)概念與其定量表示之間的不確定性轉(zhuǎn)換模型,用以反映自然語言中概念的不確定性。概念的整體特性用云的數(shù)字特征來反映,數(shù)字特征用三個(gè)參數(shù)來描述,分別為期望,熵和超熵論文參考文獻(xiàn)格式。期望表示最能夠代表定性概念的點(diǎn),熵表示定性概念的不確定性度量,反映了模糊性與隨機(jī)性的關(guān)聯(lián)性,超熵是熵的不確定性度量。定義2由統(tǒng)計(jì)學(xué)原理可知,假設(shè)滿足:,其中,且對(duì)定性概念確實(shí)定度滿足,那么稱在論域上的分布稱為正態(tài)云。定量數(shù)據(jù)和定性數(shù)據(jù)的轉(zhuǎn)換可以通過正向正態(tài)云發(fā)生器和逆向正態(tài)云發(fā)生器來實(shí)現(xiàn),如圖1所示。圖1云發(fā)生器示意圖在不確定性人工智能研究過程中,如圖2所

5、示,軟與;可以看成是一個(gè)定性概念,處理雙條件單規(guī)那么發(fā)生器時(shí),用二維正態(tài)云表示,其中兩個(gè)維的論域分別對(duì)應(yīng)著確定度和的取值范圍,即和。通過軟與;操作轉(zhuǎn)換后的云滴的統(tǒng)計(jì)分布的期望是1,1,那么在論域中的這一點(diǎn)上,它確實(shí)定度,相當(dāng)于邏輯上的與;操作,而其它位置確實(shí)定度都小于1,反映了與;的不確定性,這就是軟與;的特性。圖2雙條件單規(guī)那么發(fā)生器定義3 對(duì)于多條件單規(guī)那么If 、,Then ,前件規(guī)那么被激活概念的隸屬度分別為、,通過軟與;運(yùn)算SA(Soft And)的結(jié)果為;那么稱是分別在概念、下的相關(guān)程度,記。除了上述重要定義外,本文還利用了一些其它相關(guān)的云理論及定義,如云變換分類算法,云的普適性說

6、明,云概念提升等,限于篇幅,我們就不再逐一說明,具體知識(shí)請(qǐng)參考文【2】。2分析過程及算法描述2.1分析過程在多條件單規(guī)那么發(fā)生器中,規(guī)那么前件的多個(gè)條件和規(guī)那么后件的單個(gè)規(guī)那么可以用形如表1的決策表所描述,其中任意。表1中表示僅描述了規(guī)那么集中一條規(guī)那么的數(shù)據(jù)分布信息,這條規(guī)那么為If 、,Then 。表1多條件單規(guī)那么決策表 樣本ID 條件屬性 決策屬性 1 2 n 決策表中所有樣本滿足同一規(guī)那么推理,即If 、,Then ,按規(guī)那么推理可知,應(yīng)該把這些樣本都?xì)w為同一類,即歸為概念集合中。然而根據(jù)粗糙集相關(guān)原理可知,在屬性決策表中,假設(shè)所有樣本的條件屬性值和它對(duì)應(yīng)決策屬性值都各不相同,那么說

7、明這些樣本之間存在一定的差異,應(yīng)該對(duì)它實(shí)現(xiàn)進(jìn)一步的分類,從而讓更相似的數(shù)據(jù)樣本歸為同一類。事實(shí)上,如果所有樣本的條件屬性值激活每個(gè)條件概念屬性的隸屬度都為1,那么可以推出所有樣本決策屬性值對(duì)應(yīng)于概念的隸屬程度也為1,即對(duì)于表1中任意一個(gè)樣本,假設(shè)、,一定可以推出。根據(jù)逆向云發(fā)生器原理可知,假設(shè)隸屬度為1,那么說明為概念云模型的期望值,因此,所有樣本就成了同一個(gè)樣本的復(fù)寫。但在工程實(shí)踐中,決策表是不可以是同一數(shù)據(jù)的復(fù)寫,其條件屬性與決策屬性都不相同,因此,對(duì)于可以推出同一規(guī)那么且具有相同的激活概念的樣本,由于條件隸屬度的不同,導(dǎo)致每個(gè)樣本隸屬于同一規(guī)那么決策屬性的程度存在差異,即隸屬于同一決策概

8、念的樣本之間可能存在較大的差異,故需對(duì)它們實(shí)現(xiàn)進(jìn)一步的分類。從粗糙集的角度出發(fā)分類算法,如果斷策屬性為連續(xù)型數(shù)據(jù),那么要對(duì)數(shù)據(jù)樣本進(jìn)行分類,首先將連續(xù)型數(shù)據(jù)轉(zhuǎn)化為離散型數(shù)據(jù)。假設(shè)利用邊界劃分或人工劃分等方法對(duì)連續(xù)型數(shù)據(jù)進(jìn)行離散化,但通常會(huì)導(dǎo)致臨界數(shù)據(jù)的劃分不合理性,即對(duì)數(shù)據(jù)實(shí)現(xiàn)了硬劃分。然而,利用云模型中的云變換,對(duì)連續(xù)型數(shù)據(jù)進(jìn)行軟劃分,不僅對(duì)數(shù)據(jù)進(jìn)行了有效的離散化,而且充分考慮到數(shù)據(jù)客觀分布的特性。、能夠推出,說明之間存在一定的相互關(guān)系,這樣才能共同作用推出規(guī)那么,這種關(guān)系就是軟與;關(guān)系,其相關(guān)程度的值為軟與;操作的結(jié)果。極端地說,如果激活其相應(yīng)概念的隸屬度都為1,那么可以推出,此時(shí)值為決策

9、概念的期望值,它最能代表決策概念的特征,說明具有超強(qiáng)關(guān)系或穩(wěn)定關(guān)系。因此,的相互關(guān)系是通過對(duì)同一決策屬性的共同作用來反映它們之間的關(guān)系,展示這種關(guān)系的過程就是軟與;操作。相應(yīng)地,為了方便進(jìn)一步討論基于云規(guī)那么推理的分類思想,需要把表1的決策表變成以隸屬度為數(shù)據(jù)值的決策表,如表2所示。表2多條件單規(guī)那么中隸屬度的決策表 樣本ID 條件屬性 決策屬性 概念 概念 概念 概念 1 2 n 通過上述分析,表2所有的樣本不能簡單地把其歸為概念類。那么,這些樣本到底可以歸為哪些類?哪些樣本能夠比擬適宜地被概念所描述呢?根據(jù)知識(shí)的不確定性,概念與概念之間的關(guān)系存在著一定的模糊區(qū)域,因此,在模式識(shí)別或概念識(shí)別

10、過程中,對(duì)特定概念所描述的區(qū)域或稱管轄范圍可以允許存在一定的彈性,使得這個(gè)概念隨著條件的變化更能夠表達(dá)其描述的力度。把這種能夠增強(qiáng)概念描述力度的彈性對(duì)象稱為彈性系數(shù),其值是根據(jù)決策表2中所有決策屬性值的分布情況來決定的。通常情況下,彈性系數(shù)取值為,其中、分別為概念云模型左右相鄰的云模型、與之相交的隸屬度值,如圖3所示。圖3 概念及相鄰概念的云模型圖3中,兩個(gè)紅點(diǎn)u1與u2的縱坐標(biāo)的值就對(duì)應(yīng)于、的值,此時(shí)彈性系數(shù)的值就為論文參考文獻(xiàn)格式。2.2 算法描述有了上述的分析理論做準(zhǔn)備分類算法,那么基于云規(guī)那么推理的分類模型的核心思想如下:(1)對(duì)于決策表2,假設(shè)第個(gè)樣本在規(guī)那么前件的隸屬度通過軟與;后

11、得到的相關(guān)程度為,假設(shè),那么把該樣本歸入概念類中;(2)假設(shè),那么利用條件云發(fā)生器計(jì)算出云模型在激活強(qiáng)度為的值兩個(gè)值,即;再利用條件云發(fā)生器計(jì)算分別在云模型確實(shí)定度,即,;(3)假設(shè),那么把該樣本歸入概念類中,否那么,把樣本歸入概念類中;(4)反復(fù)執(zhí)行步驟(1)(3),直到為止。步驟(2)是分類思想的主要運(yùn)算局部,其過程及對(duì)應(yīng)值分布如圖4所示。圖4 各概念被激活的隸屬度分布圖3 實(shí)例分析通過對(duì)某一網(wǎng)站上Web日志上大量數(shù)據(jù)的采集,對(duì)大量不同客戶的數(shù)據(jù)進(jìn)行分析處理,即考慮客戶在網(wǎng)站上的停留時(shí)間,訪問次數(shù)和訪問信息量等條件因素,來調(diào)查客戶對(duì)該網(wǎng)站信息的滿意程度,最終得到客戶的有效分類。圖4實(shí)際上是

12、該實(shí)驗(yàn)過程的結(jié)果,通過本文方法,假設(shè)將最終的決策屬性分為三個(gè)定性概念,即不滿意、較滿意和滿意三個(gè)不同的概念,其對(duì)應(yīng)的云模型分別為:LCB29,9.5,0.113,CB50,8.4,0.097,RCB85,10,0.082。某一客戶對(duì)網(wǎng)站的訪問信息為因素集停留時(shí)間、訪問次問、訪問信息量和滿意值,通過計(jì)算得到這些條件因素的相關(guān)程度。又因?yàn)闆Q策屬性的三個(gè)定性概念之間的彈性系數(shù)為,且,通過算法可知,該用戶被歸入了概念LCB中。在此過程中可以最多得到個(gè)規(guī)那么,為每個(gè)條件因素的概念個(gè)數(shù),例如:表示決策表中客戶的滿意程度的三個(gè)概念。最終任意一多條件單規(guī)那么R都可以描述為形如:停留時(shí)間長、訪問次數(shù)較大和訪問信

13、息量一般分類算法,那么客戶的滿意度為較滿意;的規(guī)那么。與定量數(shù)據(jù)相比,它更符合人類的思維模式。實(shí)事上,在模糊模式識(shí)別當(dāng)中,最大隸屬原那么和擇近原那么是樣本歸屬分類的主要依據(jù),同樣,基于云規(guī)那么推理的分類模型的出發(fā)點(diǎn)也是利用最大確定度的原那么來對(duì)樣本進(jìn)行恰當(dāng)?shù)姆诸悾@也就證明了該模型的可行性。4 總結(jié)本文提出了一種基于云模型的定性規(guī)那么推理分類方法,事先通過云變換對(duì)每個(gè)數(shù)值型屬性進(jìn)行離散化,生成一系列用云表示的根本概念集。將這些根本概念提升到適宜的概念層次上,采用極大判定法對(duì)每個(gè)數(shù)值型屬性進(jìn)行軟劃分,并求得相應(yīng)被激活各屬性概念確實(shí)定度,就可以得到基于隸屬度的決策表。該方法擺脫了以往依賴于定量數(shù)據(jù)

14、的分類,實(shí)現(xiàn)了數(shù)據(jù)的軟操作,通過定性推理過程,對(duì)數(shù)據(jù)對(duì)象進(jìn)行定性概念的推理,進(jìn)而實(shí)現(xiàn)了符合人類思維活動(dòng)的分類過程。需要說明的是,多條件單規(guī)那么是多條件多規(guī)那么的一個(gè)子集,可以通過擴(kuò)展,把多條件單規(guī)那么拓展到多條件多規(guī)那么中,實(shí)現(xiàn)基于多條件多規(guī)那么的定性推理分類。參考文獻(xiàn)【1】謝季堅(jiān).模糊數(shù)學(xué)方法及其應(yīng)用. 武漢: 華中科技出版社, 2003,7.【2】李德毅.隸屬云和隸屬云發(fā)生器. 計(jì)算機(jī)研究與開展, 1995, 32(6):15-20.【3】李德毅.不確定性人工智能. 北京: 國防工業(yè)出版社, 2005.7【5】Li Deyi, Di Kai chang, Li Deren, et al. Miningassociation rules with linguistic cloud models. Journal of Software. 2000, 11(20):143-158.【7】柳炳祥,李海林,楊麗彬.云決策方法. 控制與決策, 2021, 24(6):957:960.李海林,柳炳祥,楊麗彬.一種基于云理論的考核成績?cè)u(píng)價(jià)模型. 計(jì)算機(jī)時(shí)代, 2007, 10: 4-5.Li Deyi, Han J,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論