第三章-云模型簡(jiǎn)介_(kāi)第1頁(yè)
第三章-云模型簡(jiǎn)介_(kāi)第2頁(yè)
第三章-云模型簡(jiǎn)介_(kāi)第3頁(yè)
第三章-云模型簡(jiǎn)介_(kāi)第4頁(yè)
第三章-云模型簡(jiǎn)介_(kāi)第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章 云模型簡(jiǎn)介在人類認(rèn)知以及進(jìn)行決策過(guò)程中,語(yǔ)言文字是一種強(qiáng)有力的思維工具,它是人類智能和其他生物智能的根本區(qū)別。人腦進(jìn)行思維不是純粹地應(yīng)用數(shù)學(xué)知識(shí),而是靠自然語(yǔ)言特別是客觀事物在人腦中的反映而形成的概念。以概念為基礎(chǔ)的語(yǔ)言、理論、模型是人類描述和理解世界的方法。自然語(yǔ)言中,常常通過(guò)語(yǔ)言值,也就是詞來(lái)表示概念。而語(yǔ)言值、詞或概念與數(shù)學(xué)和物理的符號(hào)的最大區(qū)別就是其中包含太多的不確定性。在人工智能領(lǐng)域,不確定性的研究方法有很多,主要有概率理論,模糊理論,證據(jù)理論和粗糙集理論;對(duì)于確定性系統(tǒng)的不確定性的研究還有混沌和分形的方法。這些方法從不同的視角研究了不確定性,優(yōu)點(diǎn)是:有切入點(diǎn)明確、邊界條件約

2、束清楚、能夠?qū)?wèn)題進(jìn)行深入研究等,但是在研究中常常將不確定性分成模糊性和隨機(jī)性分開(kāi)進(jìn)行研究,然而兩者之間有很強(qiáng)的關(guān)聯(lián)性,往往不能完全的分開(kāi)。隨機(jī)性是指有明確定義但是不一定出現(xiàn)的事件中所包含的不確定性。例如在投擲硬幣試驗(yàn)中,硬幣落地時(shí)要么有國(guó)徽的一面向上,要么標(biāo)有分值的一面向上,結(jié)果是明確的可以預(yù)知的,但是每次試驗(yàn)結(jié)果是隨機(jī)的。概率論和數(shù)理統(tǒng)計(jì)是研究和揭示這種隨機(jī)現(xiàn)象的一門學(xué)科,至今已有幾百年的研究歷史模糊性是另一種不確定性,是已經(jīng)出現(xiàn)的但是很難精確定義的事件中所包含的不確定性。在日常工作和生活中存在著許多模糊概念,如“胖子”“年輕人”“收入較高”等。為處理這些模糊概念,引入了模糊集的概念41,

3、使用隸屬度來(lái)刻畫(huà)模糊事物彼此間的程度。隸屬度函數(shù)常用的確定方法有模糊統(tǒng)計(jì)法、例證法專家經(jīng)驗(yàn)法等,這些方法確定隸屬度函數(shù)的過(guò)程是確定的,本質(zhì)上說(shuō)是客觀的,但每個(gè)人對(duì)于同一個(gè)模糊概念的認(rèn)識(shí)理解存在差異,因此有很強(qiáng)的主觀性,而且一旦隸屬度函數(shù)確定之后,得到的概念、定理等包含著嚴(yán)密的數(shù)學(xué)思維,其不具有任何模糊性。針對(duì)上述問(wèn)題李德毅院士在傳統(tǒng)的概率統(tǒng)計(jì)理論和模糊理論的基礎(chǔ)上提出了定性定量不確定性轉(zhuǎn)換模型云模型,實(shí)現(xiàn)定性概念和定量值之間的不確定性轉(zhuǎn)換。在此工作上,一些學(xué)者對(duì)云模型做了深入系統(tǒng)的研究,使其日趨成熟,并將它成功地應(yīng)用于不確定性推理、關(guān)聯(lián)規(guī)則挖掘,空間數(shù)據(jù)的挖掘,智能控制及時(shí)間序列預(yù)測(cè)等領(lǐng)域。云

4、模型能模擬人類思維靈活劃分屬性空間,在較高的概念層上泛化屬性值,完成定量數(shù)值到定性概念間的轉(zhuǎn)換,同時(shí)允許相鄰屬性值或語(yǔ)言之間有重疊,這種劃分使發(fā)現(xiàn)的知識(shí)具有穩(wěn)健性。 而由于計(jì)算機(jī)系統(tǒng)的行為存在隨機(jī)性和不確定性,云模型能夠很好地處理具有隨機(jī)性和不確定性的數(shù)據(jù),所以可將云模型引入到入侵檢測(cè)中來(lái),通過(guò)云模型建立的入侵檢測(cè)系統(tǒng)具有較準(zhǔn)確的檢測(cè)能力和適應(yīng)能力。3.1 云模型的引入云模型能夠?qū)崿F(xiàn)定性概念與定量值之間的不確定性轉(zhuǎn)換。同時(shí)數(shù)據(jù)挖掘是基于不同認(rèn)知層次的“數(shù)據(jù)-概念-知識(shí)”視圖,“數(shù)據(jù)”中包含大量的不確定性知識(shí),而云模型能夠更準(zhǔn)確地將數(shù)據(jù)表達(dá)為概念,進(jìn)而發(fā)現(xiàn)準(zhǔn)確、完整的知識(shí)。因此將云模型應(yīng)用于數(shù)據(jù)

5、挖掘中可以提高數(shù)據(jù)挖掘的準(zhǔn)確度。下面簡(jiǎn)單介紹云模型的一些概念和數(shù)字特征,重點(diǎn)介紹云的概念、正態(tài)云發(fā)生器及正態(tài)云的數(shù)學(xué)性質(zhì)。3.1.1 云和云滴定義3.142 設(shè)是一個(gè)精確數(shù)值表示的定量論域,是上的定性概念,若定量值,且是定性概念的一次隨機(jī)實(shí)現(xiàn),對(duì)的確定度是有穩(wěn)定傾向的隨機(jī)數(shù) (3.1)則在論域上的分布稱為云(Cloud),每一個(gè)稱為一個(gè)云滴42。云具有以下性質(zhì)42 42:(1)論域可以是一維的,也可以是或多維的。;(2)定義中所提及的隨機(jī)實(shí)現(xiàn),是概率意義下的實(shí)現(xiàn);定義中所提及提到的確定度,是模糊集意義下的隸屬度,同時(shí)又具有概率意義下的分布。;(3)對(duì)于任意一個(gè),到區(qū)間0,1上的映射是一對(duì)多的變

6、換,對(duì)的確定度不是一個(gè)固定的數(shù)值,而是一個(gè)概率分布。;(4)云由云滴組成,云滴之間無(wú)次序性,一個(gè)云滴是定性概念在數(shù)量上的一次實(shí)現(xiàn),云滴越多,越能反映這個(gè)定性概念的整體特征。;(5)云滴出現(xiàn)的概率大,云滴的確定度大,則云滴對(duì)概念的貢獻(xiàn)大。3.1.2 云的數(shù)字特征云的數(shù)字特征能夠反映概念的整體性和定性知識(shí)的定量特性,其它對(duì)定性概念的理解定性概念的內(nèi)涵和外延有著極其重要有很重要的意義。云一般用期望(Expected value)、熵(Entropy)和超熵這(Hyper entropy)三個(gè)數(shù)字特征來(lái)整體表征一個(gè)概念43,如圖3-1所示。圖3-1 云的數(shù)字特征Fig.3-1 Digital Char

7、acteristics of the Cloud 期望:云滴在論域空間分布的期望,是概念在論域中的中心點(diǎn),其最能夠它是最可以代表定性概念的值點(diǎn)43。熵:定性概念的不確定性度量,由概念的隨機(jī)性和模糊性共同決定。一方面熵是定性概念隨機(jī)性的度量,反映了能代表這個(gè)定性概念的云滴的離散程度;另一方面又是定性概念模糊度的度量,反映了論域空間中可被概念接受的云滴的取值范圍,此外熵還能反映隨機(jī)性和模糊性之間的關(guān)聯(lián)性43。超熵:是熵的不確定性的度量,即熵的熵,由熵的隨機(jī)性和模糊性共同決定,反映了云滴的離散程度,超熵的大小間接地反映云的厚度,超熵越大,云的厚度越大43。3.1.3 云模型的類型云模型是云的具體實(shí)現(xiàn)

8、方法,是云運(yùn)算、云推理、云控制、云聚類等方法的基礎(chǔ)。由定性概念到定量表示的過(guò)程,也即由云的數(shù)字特征產(chǎn)生云滴的過(guò)程,稱為正向云發(fā)生器。由定量表示到定性概念的過(guò)程,也即由云滴群得到云的數(shù)字特征的過(guò)程,稱為逆向云發(fā)生器。云有很多種實(shí)現(xiàn)方法,可構(gòu)成不同類型的云,如半云模型、對(duì)稱云模型、組合云模型等,還可以擴(kuò)展到多維云模型。3.2 正態(tài)云正態(tài)分布是概率理論中重要分布之一,通常用均值和方差兩個(gè)數(shù)字特征表示;鐘形隸屬度函數(shù)是模糊理論中使用最多的隸屬函數(shù),通常用來(lái)表示。正態(tài)云正是在二者基礎(chǔ)上發(fā)展起來(lái)的全新模型。定義3.243 設(shè)是一個(gè)精確數(shù)值表示的定量論域,是上的定性概念,若定量值,且是定性概念的一次隨機(jī)實(shí)現(xiàn)

9、,若滿足:,其中,且對(duì)的確定度滿足: (3.2)則在論域上的分布稱為正態(tài)云43。3.2.1 正態(tài)云發(fā)生器正態(tài)云發(fā)生器44是指用計(jì)算機(jī)實(shí)現(xiàn)的一種特定算法,其可以用集成的微電子器件來(lái)實(shí)現(xiàn),包括正向云發(fā)生器和逆向云發(fā)生器。(1) 正向云發(fā)生器正向云發(fā)生器是實(shí)現(xiàn)定性概念到定量值的轉(zhuǎn)換模型,其由云的數(shù)字特征()產(chǎn)生云滴,如圖3-2所示。 圖3-2 正向云發(fā)生器Fig.3-2 Forward Cloud Generator(2) 逆向云發(fā)生器逆向云發(fā)生器44是實(shí)現(xiàn)定量值到定性概念的轉(zhuǎn)換模型,它可以將一定數(shù)量的精確數(shù)據(jù)轉(zhuǎn)換為以數(shù)字特征()表示的定性概念,如圖3-3所示。圖3-3 逆向云發(fā)生器Fig.3-3

10、Backward Cloud Generator逆向正態(tài)云發(fā)生器的算法基于統(tǒng)計(jì)原理思想,基本算法有兩種:一是無(wú)需確定度信息的逆向云發(fā)生器算法;二是需要確定度信息的逆向云發(fā)生器算法44。3.2.2 云滴對(duì)概念的貢獻(xiàn)在正向正態(tài)云模型中,云滴群對(duì)概念的貢獻(xiàn)是不同的。本文以一維正向正態(tài)云為例來(lái)說(shuō)明云滴群對(duì)概念的貢獻(xiàn)程度。定義3.3 在一維論域中,中任一小區(qū)間上的云滴群對(duì)定性概念的貢獻(xiàn)43為 (3.3)易得,論域()上所有元素對(duì)概念的總貢獻(xiàn)為 (3.4)同理,可得論域上所有元素對(duì)概念的總貢獻(xiàn)為:= (3.5)因此論域中對(duì)定性概念有所貢獻(xiàn)的云滴,主要落在區(qū)間區(qū)間中,常常通??梢院雎詤^(qū)間區(qū)間之外的云滴對(duì)定性

11、概念所做的貢獻(xiàn),這這就即是為正向正態(tài)云的“規(guī)則”44。同理位于區(qū)間區(qū)間內(nèi)的云滴,占全部所有定量值的22.33%,對(duì)定性概念的貢獻(xiàn)它的貢獻(xiàn)占總貢獻(xiàn)的50,這部分的這部分云滴被稱為“骨干元素”;位于區(qū)間區(qū)間內(nèi)的云滴,占全部所有定量值的33.33,對(duì)定性概念這部分的貢獻(xiàn)占總貢獻(xiàn)的68.26,這部分元素被稱為“基本元素”;位于區(qū)間區(qū)間和區(qū)間區(qū)間內(nèi)的云滴,占全部所有定量值的33.33,它們對(duì)定性概念的貢獻(xiàn)占總貢獻(xiàn)的27.18,這該部分元素被稱為元素為“外圍元素”;位于區(qū)間區(qū)間和區(qū)間區(qū)間內(nèi)的云滴,占全部定量值的33.33,它們對(duì)定性概念的貢獻(xiàn)占總貢獻(xiàn)的4.3,這部分云滴被稱為“弱外圍元素”44。不同的區(qū)域

12、內(nèi)的云滴群對(duì)定性概念所做的的貢獻(xiàn)不同,如圖3-4所示。圖3-4 云滴群對(duì)定性概念的貢獻(xiàn) 這圖能不能小點(diǎn)兒Fig.3-4 Cloud Droplets Contribute to Qualitative Concept3.3 正態(tài)云的數(shù)學(xué)性質(zhì)3.3.1 云滴分布的統(tǒng)計(jì)分析根據(jù)正態(tài)云發(fā)生器算法,所有云滴的集合構(gòu)成隨機(jī)變量,服從以為期望、為方差的正態(tài)分布,所以的概率密度函數(shù)44為 (3.6)如果為定值時(shí),服從以為期望、為方差的正態(tài)分布,此時(shí)的概率密度函數(shù)44為 (3.7)由于是隨機(jī)變量,由條件概率密度公式可知的概率密度函數(shù)為 (3.8)這是式(3.8)是一個(gè)概率密度函數(shù),它沒(méi)有不具備解析形式的概率密

13、度函數(shù),對(duì)于任意的變量,可以通過(guò)數(shù)值積分計(jì)算可以得到與之相應(yīng)的函數(shù)值。對(duì)于當(dāng)云滴個(gè)數(shù)為個(gè)云滴的情況時(shí),可以采利用Parzen窗的方法可以估計(jì)估算出的概率密度函數(shù)44。特殊地特別地,當(dāng)時(shí),的概率密度函數(shù)為 (3.9)因?yàn)樗械脑频尉紒?lái)自于期望為的正態(tài)隨機(jī)變量,所以期望,方差。由此可得由此可知,由正態(tài)云發(fā)生器所產(chǎn)生的云滴,是一個(gè)期望為、方差為的一個(gè)隨機(jī)變量44。3.3.2 云滴確定度的統(tǒng)計(jì)分析根據(jù)正態(tài)云發(fā)生器算法,隨機(jī)變量由所有云滴的確定度構(gòu)成隨機(jī)變量,每一個(gè)確定度可以看作是由隨機(jī)變量 (3.10)產(chǎn)生的一個(gè)樣本可以作為一個(gè)云滴的確定度。經(jīng)過(guò)計(jì)算可知,無(wú)論取何什么值,隨機(jī)變量的概率密度函數(shù)都均保持不變,即所有的也就是全部的確定度都來(lái)自一個(gè)密度為 (3.11)的隨機(jī)變量。故所以,隨機(jī)變量的概率密度函數(shù)就是即為隨機(jī)變量的概率密度函數(shù),由此可以看出看到,確定度的概率密度函數(shù)同與正態(tài)云的三個(gè)數(shù)字特征無(wú)關(guān)沒(méi)有關(guān)系43。對(duì)于論域空間中的,還可以研究聯(lián)合分布的概率密度函數(shù)。當(dāng)論域空間是一維時(shí),是一個(gè)二維的隨機(jī)變量,可以計(jì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論