




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第三章 云模型簡(jiǎn)介在人類認(rèn)知以及進(jìn)行決策過(guò)程中,語(yǔ)言文字是一種強(qiáng)有力的思維工具,它是人類智能和其他生物智能的根本區(qū)別。人腦進(jìn)行思維不是純粹地應(yīng)用數(shù)學(xué)知識(shí),而是靠自然語(yǔ)言特別是客觀事物在人腦中的反映而形成的概念。以概念為基礎(chǔ)的語(yǔ)言、理論、模型是人類描述和理解世界的方法。自然語(yǔ)言中,常常通過(guò)語(yǔ)言值,也就是詞來(lái)表示概念。而語(yǔ)言值、詞或概念與數(shù)學(xué)和物理的符號(hào)的最大區(qū)別就是其中包含太多的不確定性。在人工智能領(lǐng)域,不確定性的研究方法有很多,主要有概率理論,模糊理論,證據(jù)理論和粗糙集理論;對(duì)于確定性系統(tǒng)的不確定性的研究還有混沌和分形的方法。這些方法從不同的視角研究了不確定性,優(yōu)點(diǎn)是:有切入點(diǎn)明確、邊界條件約
2、束清楚、能夠?qū)?wèn)題進(jìn)行深入研究等,但是在研究中常常將不確定性分成模糊性和隨機(jī)性分開(kāi)進(jìn)行研究,然而兩者之間有很強(qiáng)的關(guān)聯(lián)性,往往不能完全的分開(kāi)。隨機(jī)性是指有明確定義但是不一定出現(xiàn)的事件中所包含的不確定性。例如在投擲硬幣試驗(yàn)中,硬幣落地時(shí)要么有國(guó)徽的一面向上,要么標(biāo)有分值的一面向上,結(jié)果是明確的可以預(yù)知的,但是每次試驗(yàn)結(jié)果是隨機(jī)的。概率論和數(shù)理統(tǒng)計(jì)是研究和揭示這種隨機(jī)現(xiàn)象的一門學(xué)科,至今已有幾百年的研究歷史模糊性是另一種不確定性,是已經(jīng)出現(xiàn)的但是很難精確定義的事件中所包含的不確定性。在日常工作和生活中存在著許多模糊概念,如“胖子”“年輕人”“收入較高”等。為處理這些模糊概念,引入了模糊集的概念41,
3、使用隸屬度來(lái)刻畫(huà)模糊事物彼此間的程度。隸屬度函數(shù)常用的確定方法有模糊統(tǒng)計(jì)法、例證法專家經(jīng)驗(yàn)法等,這些方法確定隸屬度函數(shù)的過(guò)程是確定的,本質(zhì)上說(shuō)是客觀的,但每個(gè)人對(duì)于同一個(gè)模糊概念的認(rèn)識(shí)理解存在差異,因此有很強(qiáng)的主觀性,而且一旦隸屬度函數(shù)確定之后,得到的概念、定理等包含著嚴(yán)密的數(shù)學(xué)思維,其不具有任何模糊性。針對(duì)上述問(wèn)題李德毅院士在傳統(tǒng)的概率統(tǒng)計(jì)理論和模糊理論的基礎(chǔ)上提出了定性定量不確定性轉(zhuǎn)換模型云模型,實(shí)現(xiàn)定性概念和定量值之間的不確定性轉(zhuǎn)換。在此工作上,一些學(xué)者對(duì)云模型做了深入系統(tǒng)的研究,使其日趨成熟,并將它成功地應(yīng)用于不確定性推理、關(guān)聯(lián)規(guī)則挖掘,空間數(shù)據(jù)的挖掘,智能控制及時(shí)間序列預(yù)測(cè)等領(lǐng)域。云
4、模型能模擬人類思維靈活劃分屬性空間,在較高的概念層上泛化屬性值,完成定量數(shù)值到定性概念間的轉(zhuǎn)換,同時(shí)允許相鄰屬性值或語(yǔ)言之間有重疊,這種劃分使發(fā)現(xiàn)的知識(shí)具有穩(wěn)健性。 而由于計(jì)算機(jī)系統(tǒng)的行為存在隨機(jī)性和不確定性,云模型能夠很好地處理具有隨機(jī)性和不確定性的數(shù)據(jù),所以可將云模型引入到入侵檢測(cè)中來(lái),通過(guò)云模型建立的入侵檢測(cè)系統(tǒng)具有較準(zhǔn)確的檢測(cè)能力和適應(yīng)能力。3.1 云模型的引入云模型能夠?qū)崿F(xiàn)定性概念與定量值之間的不確定性轉(zhuǎn)換。同時(shí)數(shù)據(jù)挖掘是基于不同認(rèn)知層次的“數(shù)據(jù)-概念-知識(shí)”視圖,“數(shù)據(jù)”中包含大量的不確定性知識(shí),而云模型能夠更準(zhǔn)確地將數(shù)據(jù)表達(dá)為概念,進(jìn)而發(fā)現(xiàn)準(zhǔn)確、完整的知識(shí)。因此將云模型應(yīng)用于數(shù)據(jù)
5、挖掘中可以提高數(shù)據(jù)挖掘的準(zhǔn)確度。下面簡(jiǎn)單介紹云模型的一些概念和數(shù)字特征,重點(diǎn)介紹云的概念、正態(tài)云發(fā)生器及正態(tài)云的數(shù)學(xué)性質(zhì)。3.1.1 云和云滴定義3.142 設(shè)是一個(gè)精確數(shù)值表示的定量論域,是上的定性概念,若定量值,且是定性概念的一次隨機(jī)實(shí)現(xiàn),對(duì)的確定度是有穩(wěn)定傾向的隨機(jī)數(shù) (3.1)則在論域上的分布稱為云(Cloud),每一個(gè)稱為一個(gè)云滴42。云具有以下性質(zhì)42 42:(1)論域可以是一維的,也可以是或多維的。;(2)定義中所提及的隨機(jī)實(shí)現(xiàn),是概率意義下的實(shí)現(xiàn);定義中所提及提到的確定度,是模糊集意義下的隸屬度,同時(shí)又具有概率意義下的分布。;(3)對(duì)于任意一個(gè),到區(qū)間0,1上的映射是一對(duì)多的變
6、換,對(duì)的確定度不是一個(gè)固定的數(shù)值,而是一個(gè)概率分布。;(4)云由云滴組成,云滴之間無(wú)次序性,一個(gè)云滴是定性概念在數(shù)量上的一次實(shí)現(xiàn),云滴越多,越能反映這個(gè)定性概念的整體特征。;(5)云滴出現(xiàn)的概率大,云滴的確定度大,則云滴對(duì)概念的貢獻(xiàn)大。3.1.2 云的數(shù)字特征云的數(shù)字特征能夠反映概念的整體性和定性知識(shí)的定量特性,其它對(duì)定性概念的理解定性概念的內(nèi)涵和外延有著極其重要有很重要的意義。云一般用期望(Expected value)、熵(Entropy)和超熵這(Hyper entropy)三個(gè)數(shù)字特征來(lái)整體表征一個(gè)概念43,如圖3-1所示。圖3-1 云的數(shù)字特征Fig.3-1 Digital Char
7、acteristics of the Cloud 期望:云滴在論域空間分布的期望,是概念在論域中的中心點(diǎn),其最能夠它是最可以代表定性概念的值點(diǎn)43。熵:定性概念的不確定性度量,由概念的隨機(jī)性和模糊性共同決定。一方面熵是定性概念隨機(jī)性的度量,反映了能代表這個(gè)定性概念的云滴的離散程度;另一方面又是定性概念模糊度的度量,反映了論域空間中可被概念接受的云滴的取值范圍,此外熵還能反映隨機(jī)性和模糊性之間的關(guān)聯(lián)性43。超熵:是熵的不確定性的度量,即熵的熵,由熵的隨機(jī)性和模糊性共同決定,反映了云滴的離散程度,超熵的大小間接地反映云的厚度,超熵越大,云的厚度越大43。3.1.3 云模型的類型云模型是云的具體實(shí)現(xiàn)
8、方法,是云運(yùn)算、云推理、云控制、云聚類等方法的基礎(chǔ)。由定性概念到定量表示的過(guò)程,也即由云的數(shù)字特征產(chǎn)生云滴的過(guò)程,稱為正向云發(fā)生器。由定量表示到定性概念的過(guò)程,也即由云滴群得到云的數(shù)字特征的過(guò)程,稱為逆向云發(fā)生器。云有很多種實(shí)現(xiàn)方法,可構(gòu)成不同類型的云,如半云模型、對(duì)稱云模型、組合云模型等,還可以擴(kuò)展到多維云模型。3.2 正態(tài)云正態(tài)分布是概率理論中重要分布之一,通常用均值和方差兩個(gè)數(shù)字特征表示;鐘形隸屬度函數(shù)是模糊理論中使用最多的隸屬函數(shù),通常用來(lái)表示。正態(tài)云正是在二者基礎(chǔ)上發(fā)展起來(lái)的全新模型。定義3.243 設(shè)是一個(gè)精確數(shù)值表示的定量論域,是上的定性概念,若定量值,且是定性概念的一次隨機(jī)實(shí)現(xiàn)
9、,若滿足:,其中,且對(duì)的確定度滿足: (3.2)則在論域上的分布稱為正態(tài)云43。3.2.1 正態(tài)云發(fā)生器正態(tài)云發(fā)生器44是指用計(jì)算機(jī)實(shí)現(xiàn)的一種特定算法,其可以用集成的微電子器件來(lái)實(shí)現(xiàn),包括正向云發(fā)生器和逆向云發(fā)生器。(1) 正向云發(fā)生器正向云發(fā)生器是實(shí)現(xiàn)定性概念到定量值的轉(zhuǎn)換模型,其由云的數(shù)字特征()產(chǎn)生云滴,如圖3-2所示。 圖3-2 正向云發(fā)生器Fig.3-2 Forward Cloud Generator(2) 逆向云發(fā)生器逆向云發(fā)生器44是實(shí)現(xiàn)定量值到定性概念的轉(zhuǎn)換模型,它可以將一定數(shù)量的精確數(shù)據(jù)轉(zhuǎn)換為以數(shù)字特征()表示的定性概念,如圖3-3所示。圖3-3 逆向云發(fā)生器Fig.3-3
10、Backward Cloud Generator逆向正態(tài)云發(fā)生器的算法基于統(tǒng)計(jì)原理思想,基本算法有兩種:一是無(wú)需確定度信息的逆向云發(fā)生器算法;二是需要確定度信息的逆向云發(fā)生器算法44。3.2.2 云滴對(duì)概念的貢獻(xiàn)在正向正態(tài)云模型中,云滴群對(duì)概念的貢獻(xiàn)是不同的。本文以一維正向正態(tài)云為例來(lái)說(shuō)明云滴群對(duì)概念的貢獻(xiàn)程度。定義3.3 在一維論域中,中任一小區(qū)間上的云滴群對(duì)定性概念的貢獻(xiàn)43為 (3.3)易得,論域()上所有元素對(duì)概念的總貢獻(xiàn)為 (3.4)同理,可得論域上所有元素對(duì)概念的總貢獻(xiàn)為:= (3.5)因此論域中對(duì)定性概念有所貢獻(xiàn)的云滴,主要落在區(qū)間區(qū)間中,常常通??梢院雎詤^(qū)間區(qū)間之外的云滴對(duì)定性
11、概念所做的貢獻(xiàn),這這就即是為正向正態(tài)云的“規(guī)則”44。同理位于區(qū)間區(qū)間內(nèi)的云滴,占全部所有定量值的22.33%,對(duì)定性概念的貢獻(xiàn)它的貢獻(xiàn)占總貢獻(xiàn)的50,這部分的這部分云滴被稱為“骨干元素”;位于區(qū)間區(qū)間內(nèi)的云滴,占全部所有定量值的33.33,對(duì)定性概念這部分的貢獻(xiàn)占總貢獻(xiàn)的68.26,這部分元素被稱為“基本元素”;位于區(qū)間區(qū)間和區(qū)間區(qū)間內(nèi)的云滴,占全部所有定量值的33.33,它們對(duì)定性概念的貢獻(xiàn)占總貢獻(xiàn)的27.18,這該部分元素被稱為元素為“外圍元素”;位于區(qū)間區(qū)間和區(qū)間區(qū)間內(nèi)的云滴,占全部定量值的33.33,它們對(duì)定性概念的貢獻(xiàn)占總貢獻(xiàn)的4.3,這部分云滴被稱為“弱外圍元素”44。不同的區(qū)域
12、內(nèi)的云滴群對(duì)定性概念所做的的貢獻(xiàn)不同,如圖3-4所示。圖3-4 云滴群對(duì)定性概念的貢獻(xiàn) 這圖能不能小點(diǎn)兒Fig.3-4 Cloud Droplets Contribute to Qualitative Concept3.3 正態(tài)云的數(shù)學(xué)性質(zhì)3.3.1 云滴分布的統(tǒng)計(jì)分析根據(jù)正態(tài)云發(fā)生器算法,所有云滴的集合構(gòu)成隨機(jī)變量,服從以為期望、為方差的正態(tài)分布,所以的概率密度函數(shù)44為 (3.6)如果為定值時(shí),服從以為期望、為方差的正態(tài)分布,此時(shí)的概率密度函數(shù)44為 (3.7)由于是隨機(jī)變量,由條件概率密度公式可知的概率密度函數(shù)為 (3.8)這是式(3.8)是一個(gè)概率密度函數(shù),它沒(méi)有不具備解析形式的概率密
13、度函數(shù),對(duì)于任意的變量,可以通過(guò)數(shù)值積分計(jì)算可以得到與之相應(yīng)的函數(shù)值。對(duì)于當(dāng)云滴個(gè)數(shù)為個(gè)云滴的情況時(shí),可以采利用Parzen窗的方法可以估計(jì)估算出的概率密度函數(shù)44。特殊地特別地,當(dāng)時(shí),的概率密度函數(shù)為 (3.9)因?yàn)樗械脑频尉紒?lái)自于期望為的正態(tài)隨機(jī)變量,所以期望,方差。由此可得由此可知,由正態(tài)云發(fā)生器所產(chǎn)生的云滴,是一個(gè)期望為、方差為的一個(gè)隨機(jī)變量44。3.3.2 云滴確定度的統(tǒng)計(jì)分析根據(jù)正態(tài)云發(fā)生器算法,隨機(jī)變量由所有云滴的確定度構(gòu)成隨機(jī)變量,每一個(gè)確定度可以看作是由隨機(jī)變量 (3.10)產(chǎn)生的一個(gè)樣本可以作為一個(gè)云滴的確定度。經(jīng)過(guò)計(jì)算可知,無(wú)論取何什么值,隨機(jī)變量的概率密度函數(shù)都均保持不變,即所有的也就是全部的確定度都來(lái)自一個(gè)密度為 (3.11)的隨機(jī)變量。故所以,隨機(jī)變量的概率密度函數(shù)就是即為隨機(jī)變量的概率密度函數(shù),由此可以看出看到,確定度的概率密度函數(shù)同與正態(tài)云的三個(gè)數(shù)字特征無(wú)關(guān)沒(méi)有關(guān)系43。對(duì)于論域空間中的,還可以研究聯(lián)合分布的概率密度函數(shù)。當(dāng)論域空間是一維時(shí),是一個(gè)二維的隨機(jī)變量,可以計(jì)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度互聯(lián)網(wǎng)數(shù)據(jù)中心委托經(jīng)營(yíng)管理協(xié)議
- 二零二五年度醫(yī)院?jiǎn)T工招聘與管理服務(wù)合同
- 二零二五年度人工智能聯(lián)營(yíng)投資合同模板
- 二零二五年度果園承包與農(nóng)業(yè)金融服務(wù)合作協(xié)議
- 2025年度沿街房屋租賃合同(含房屋維護(hù)及保養(yǎng)責(zé)任)
- 二零二五年度金融行業(yè)競(jìng)業(yè)禁止協(xié)議補(bǔ)償金計(jì)算細(xì)則
- 二零二五年度精裝修房屋租賃協(xié)議書(shū)
- 二零二五年度主合同與從合同在新能源汽車產(chǎn)業(yè)鏈中的協(xié)同發(fā)展及風(fēng)險(xiǎn)共擔(dān)協(xié)議
- 二零二五年度文化產(chǎn)業(yè)股權(quán)投資合同協(xié)議
- 2025年度苗木種植與生態(tài)農(nóng)業(yè)開(kāi)發(fā)協(xié)議
- 產(chǎn)品品質(zhì)檢驗(yàn)流程標(biāo)準(zhǔn)規(guī)范模板()
- DB12-595-2015醫(yī)院安全防范系統(tǒng)技術(shù)規(guī)范
- 五年級(jí)下冊(cè)英語(yǔ)課件-Unit 2 My favourite season B Let's learn 人教PEP版(共15張PPT)
- GB∕T 7260.40-2020 不間斷電源系統(tǒng) UPS 第4部分:環(huán)境 要求及報(bào)告
- 高邊坡施工危險(xiǎn)源辨識(shí)及分析
- 水廠項(xiàng)目基于BIM技術(shù)全生命周期解決方案-城市智慧水務(wù)講座課件
- 幼兒園繪本:《閃閃的紅星》 紅色故事
- 三年級(jí)學(xué)而思奧數(shù)講義.doc
- 劉姥姥進(jìn)大觀園課本劇劇本3篇
- 產(chǎn)品承認(rèn)書(shū)客(精)
- 投標(biāo)人基本情況一覽表格
評(píng)論
0/150
提交評(píng)論