第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)課件_第1頁
第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)課件_第2頁
第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)課件_第3頁
第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)課件_第4頁
第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)課件_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

粒計算及其應(yīng)用梁俊奇數(shù)學(xué)與信息科學(xué)學(xué)院粒計算及其應(yīng)用梁俊奇1教學(xué)內(nèi)容、教學(xué)時數(shù)第一章緒論4學(xué)時第二章粒計算的常見模型2學(xué)時第三章粗糙集模型28學(xué)時第一節(jié)各種集合理論的哲學(xué)基礎(chǔ)2學(xué)時

第二節(jié)經(jīng)典集合與等價關(guān)系2學(xué)時

第三節(jié)Pawlak.Z粗糙集模型8學(xué)時

第四節(jié)常見廣義粗糙集模型8學(xué)時

第五節(jié)簡單應(yīng)用—決策分析6學(xué)時教學(xué)內(nèi)容、教學(xué)時數(shù)第一章緒論2第一章緒論內(nèi)容提要

一、軟計算(SoftComputing,SC)

二、粒計算(GranularComputing,GrC)第一章緒論內(nèi)容提要30.引言:確定性和不確定性禿頭悖論問題;精確數(shù)學(xué)是描述確定性規(guī)律的;概率論是揭示隨機現(xiàn)象的統(tǒng)計規(guī)律性,是對精確數(shù)學(xué)的突破,但不排斥概率統(tǒng)計模型可能轉(zhuǎn)化為精確數(shù)學(xué)模型去處理;模糊集和粗糙集是揭示模糊現(xiàn)象的亦此亦彼的規(guī)律性,是對精確數(shù)學(xué)的突破,但不排斥模糊學(xué)模型可能轉(zhuǎn)化為概率統(tǒng)計模型甚至精確數(shù)學(xué)模型去處理;隨機性和模糊性是不確定性的兩個方面,確定值可以被看作是不確定性的特例。0.引言:確定性和不確定性禿頭悖論問題;4不確定性:隨機性模糊性不完全性不穩(wěn)定性不一致性不確定性的魅力!隨機性和模糊性的關(guān)聯(lián)性不確定性:隨機性不確定性的魅力!隨機性和模糊性的關(guān)聯(lián)性5對不確定性現(xiàn)象的研究,并不一定非要分別從隨機性和模糊性入手去認識,也不一定非要去區(qū)分隨機體現(xiàn)在那里,模糊在哪里。對不確定性現(xiàn)象的研究,并不一定非要分別從隨機性6視覺的不確定性視覺的不確定性7視覺的錯覺視覺的錯覺8認知的不確定性認知的不確定性9模式識別(人臉識別)的不確定性身份識別表情識別性別識別年齡識別性格識別人種識別

.......模式識別(人臉識別)的不確定性身份識別10手語(Signlanguage)識別:內(nèi)容識別圖形識別身份識別年齡識別風格識別

.......手語(Signlanguage)識別:內(nèi)容識別11文字識別:內(nèi)容識別寫字人身份識別性別識別年齡識別風格(性格)識別字體識別

.......文字識別:內(nèi)容識別12聲音識別:內(nèi)容識別說話人身份識別性別識別年齡識別性格識別字體識別

.......語調(diào)(情感)識別音樂識別方言識別語種識別

.......聲音識別:內(nèi)容識別語調(diào)(情感)識別13紋理識別:靜態(tài)紋理指紋臉紋聲紋皮、石、木、布紋草地、森林、海灘

.......動態(tài)紋理海浪噴泉煙霧云彩瀑布

.......紋理識別:靜態(tài)紋理動態(tài)紋理14思維的不確定性

思維有精確的一面,更有不確定的一面。人類習慣于用自然語言進行思維,思維的結(jié)果往往是可能如何、大概如何等定性的結(jié)論。人類還擅長通過聯(lián)想的、直覺的、創(chuàng)造的形象思維來思考,很少象計算機一樣做精確的數(shù)學(xué)運算或者邏輯推理,但是這并不妨礙人類具有發(fā)達的、靈活的智能,并不妨礙人類具有發(fā)達的、靈活的模式識別能力。思維的不確定性思維有精確的一面,更有不確定的一面。人15自然界中的不確定現(xiàn)象隨機模糊混沌分形復(fù)雜網(wǎng)絡(luò)自然界中的不確定現(xiàn)象隨機16不確定性的基礎(chǔ)科學(xué)問題

不確定性知識的形式化表達問題,即

不確定性知識的表示問題。

不確定性知識的最好表示,就是使用自然語言表示!要研究自然語言基元的定性定量轉(zhuǎn)換模型,給出不確定性轉(zhuǎn)換模型的形式化方法。不確定性的基礎(chǔ)科學(xué)問題不確定性知識的形式化表達問題,即17研究人類認知活動的切入層次人腦亞細胞的化學(xué)、電學(xué)層次人腦的神經(jīng)構(gòu)造層次自然語言層次數(shù)學(xué)語言層次符號語言層次腦科學(xué)神經(jīng)科學(xué)不確定性人工智能數(shù)學(xué)傳統(tǒng)人工智能研究人類認知活動的切入層次人腦亞細胞的化學(xué)、電學(xué)層次人腦的神18基本理念:人腦的思維基本上不是純數(shù)學(xué)的;自然語言具有不可替代性;自然語言中的基元是語言值,它對應(yīng)的概念,是人類思維的基本細胞。數(shù)據(jù)和概念之間的轉(zhuǎn)換是不確定性人工智能研究的基石?;纠砟睿喝四X的思維基本上不是純數(shù)學(xué)的;19不確定性的度量——熵熱力學(xué)熵熵增加原理玻爾茲曼熵分子運動的無序程度和混亂程度仙農(nóng)熵拓撲熵………云模型中的熵和超熵不確定性的度量——熵熱力學(xué)熵熵增加原理20一、軟計算(SoftComputing,SC)

1.軟計算的概念

傳統(tǒng)計算(硬計算)的主要特征是嚴格、確定和精確。但是硬計算并不適合處理現(xiàn)實生活中的許多問題,例如駕駛汽車、禿子問題。而軟計算通過對不確定、不精確及不完全真值的容錯以取得低代價的解決方案和魯棒性。一、軟計算(SoftComputing,SC)

1.軟計212.軟計算的特點

(1)不需要建立問題本身的精確數(shù)學(xué)或邏輯模型,而是直接對輸入數(shù)據(jù)進行處理得出結(jié)果;

(2)更適用于解決哪些傳統(tǒng)AI技術(shù)難以有效地處理、甚至無法處理的問題;

(3)只有數(shù)值數(shù)據(jù)可利用時可以用神經(jīng)網(wǎng)絡(luò);

(4)處理具有模糊性的知識,可以使用模糊邏輯;

(5)從多個組合中選優(yōu),可以使用遺傳算法。2.軟計算的特點

(1)不需要建立問題本身的精確數(shù)學(xué)或22第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)ppt課件23二、粒計算(granularcomputing,GrC)1.粒計算的基本概念

信息粒廣泛存在于我們的現(xiàn)實生中.是對現(xiàn)實的一種抽象,信息?;侨祟愄幚砗痛鎯π畔⒌囊环N反映。粒計算對人類的問題求解非常重要.它通過把復(fù)雜問題抽象、劃分從而轉(zhuǎn)化為若干較為簡單的問題.有助于我們更好的分析和解決問題。

粒計算是一種看待客觀世界的世界觀和方法論. 二、粒計算(granularcomputing,GrC)124粒計算的基本概念主要有粒子、粒層和粒結(jié)構(gòu).粒子:粒子是構(gòu)成粒計算模型的最基本元素,是粒計算模型的原語,沒有十分確切的定義.粒子具有雙重身份,一個粒子的元素可以是粒子,一個粒子也可以是另外一個粒子的元素.而衡量粒子“大小”的概念是粒度,一般來講,對粒子進行“量化”時用粒度來反映?;某潭龋F(xiàn)實世界中,粒子無處不在,如一座辦公大樓,這座大樓是由很多樓層組成的,每個樓層又包含了很多房間,每個房間又被分成小的辦公區(qū)域。相對于整個社區(qū)環(huán)境,這座大樓是一個整體,是一個粒子,它的外墻及外形設(shè)計就是它的外在屬性。相對于更小的組成部分,這座大樓是復(fù)雜的分層結(jié)構(gòu),它的內(nèi)部組成和劃分就是它的內(nèi)在屬性。粒計算的基本概念主要有粒子、粒層和粒結(jié)構(gòu).25粒層:按照某個實際需求的?;瘻蕜t得到的所有粒子的全體構(gòu)成一個粒層,是對問題空間的一種抽象化描述.根據(jù)某種關(guān)系或算子,問題空間產(chǎn)生相應(yīng)的粒子.同一層的粒子內(nèi)部往往具有相同的某種性質(zhì)或功能.由于粒化的程度不同,導(dǎo)致同一問題空間會產(chǎn)生不同的粒層.粒層的內(nèi)部結(jié)構(gòu)是指在該粒層上的各個粒子組成的論域的結(jié)構(gòu),即粒子之間的相互關(guān)系.在問題求解中,選擇最合適的粒層對于問題求解尤為關(guān)鍵,因為在不同粒層求解同一問題的復(fù)雜度往往不同.在高一級粒層上的粒子能夠分解成為下一級粒層上的多個粒子(增加一些屬性),在低一級粒層上的多個粒子可以合并成高一級粒層上的粒子(忽略一些屬性).粒計算模型的主要目標是能夠在不同粒層上進行問題求解,且不同粒層上的解能夠相互轉(zhuǎn)化.粒層:按照某個實際需求的粒化準則得到的所有粒子的全體構(gòu)成一個26

粒結(jié)構(gòu):一個粒化準則對應(yīng)一個粒層,不同的?;瘻蕜t對應(yīng)多個粒層,它反應(yīng)了人們從不同角度、不同側(cè)面來觀察問題、理解問題、求解問題.所有粒層之間的相互聯(lián)系構(gòu)成一個關(guān)系結(jié)構(gòu),稱為粒結(jié)構(gòu).粒結(jié)構(gòu)給出了一個系統(tǒng)或者問題的結(jié)構(gòu)化描述.粒結(jié)構(gòu):一個粒化準則對應(yīng)一個粒層,不同的?;瘻蕜t對應(yīng)多個27粒計算模型的主要目標是能夠在不同粒層上進行問題求解,且不同粒層上的解能夠相互轉(zhuǎn)化。粒結(jié)構(gòu),一個粒化準則對應(yīng)一個粒層,不同的粒化準則對應(yīng)多個粒層,粒層之間的相互聯(lián)系構(gòu)成一個關(guān)系結(jié)構(gòu),稱為粒結(jié)構(gòu)。在一般的粒計算理論中,把同一粒層的粒子看成一個集合,通常并不考慮粒子之間的結(jié)構(gòu)關(guān)系,而在我們的商空間理論中,粒層中的粒子間具有結(jié)構(gòu)關(guān)系,因此我們所談的粒結(jié)構(gòu),通常既指粒層間的結(jié)構(gòu)關(guān)系,同時又指粒層中的結(jié)構(gòu)。粒計算模型的主要目標是能夠在不同粒層上進行問題求解,且不同粒282.粒計算的基本問題根據(jù)粒計算的上述模型與概念,可以看到,粒計算中存在2個基本問題:?;突诹;挠嬎恪<慈绾螛?gòu)造這個模型,以及根據(jù)這個模型的計算。?;?是問題空間的一個劃分過程,它可以簡單理解為在給定?;瘻蕜t下(如等價關(guān)系)得到一個粒層的過程,是粒計算的基礎(chǔ),通過?;覀兛梢缘玫絾栴}空間的層次間與層次內(nèi)部的結(jié)構(gòu)。在同一或者不同的粒化準則下均可得到多個粒層,形成多層次的網(wǎng)絡(luò)結(jié)構(gòu)。粒計算通過訪問粒結(jié)構(gòu)求解問題,包括在層次結(jié)構(gòu)中自上而下、或者自下而上2個方向的交互,以及在同一層次內(nèi)部的移動。即不同粒層上粒子之間的轉(zhuǎn)換與推理,以及同一粒層上粒子之間相互交互,形成所謂的多粒度計算。2.粒計算的基本問題根據(jù)粒計算的上述模型與概念,可以看到,29第一章作業(yè)1.舉例說明不確定性現(xiàn)象的客觀存在性。2.如何表示不確定性知識?表示不確定知識的基本理念有哪些?第一章作業(yè)1.舉例說明不確定性現(xiàn)象的客觀存在性。30第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)ppt課件31第二章粒計算的常見模型內(nèi)容提要詞計算粗糙集商空間云計算第二章粒計算的常見模型內(nèi)容提要32粒計算的主要模型粒計算模型大體分為2大類:一類以處理不確定性為主要目標,如以模糊處理為基礎(chǔ)的計算模型(Fuzzyset,詞計算),以粗糙集為基礎(chǔ)的計算模型(Roughset);另一類則以多粒度計算為目標,如商空間理論。粒計算的主要模型粒計算模型大體分為2大類:33這2類模型的側(cè)重點有所不同,前者在粒化過程中,側(cè)重于計算對象的不確定性處理,Zadel認為,在人類推理與概念形成中,其粒度幾乎都是模糊的,因此他認為以模糊概念為基礎(chǔ)的詞計算,是粒計算的主要組成部分。以Pawlak為首的波蘭學(xué)者提出的粗糙集理論,其基礎(chǔ)也是基于“思維的計算,即關(guān)于含糊、不清晰概念的近似推理”。而多粒度計算的思想則來源于Hobbs的如下思想“人類問題求解的基本特征之一,就是具有從不同的粒度上觀察世界,并很容易地從一個抽象層次轉(zhuǎn)換到其它層次的能力,即分層次地處理它們”。因此多粒度計算的目的是為了降低處理復(fù)雜問題的復(fù)雜性。這2類模型的側(cè)重點有所不同,前者在粒化過程中,側(cè)重于計算34詞計算模型詞計算(computingwithwords)是用詞語代替數(shù)進行計算及推理的方法,它基于模糊集合.詞計算模型詞計算(computingwithwords)35

高標準的精確表達,普遍存在于數(shù)學(xué)、化學(xué)、工程學(xué)和另外一些“硬”科學(xué)之中,而不精確表達卻普遍存在于社會、心理、政治、歷史、哲學(xué)、語言、人類學(xué)、文學(xué)、文藝及相關(guān)的領(lǐng)域中.針對復(fù)雜且非明晰定義的現(xiàn)象,無法用精確的數(shù)學(xué)方法來描述,但可以用一些程度詞語,如不很可能、十分不可能、極不可能等,來對某些模糊概念進行修飾.盡管普通的精確方法(如數(shù)學(xué))在某些科學(xué)領(lǐng)域應(yīng)用相當廣泛,也一直嘗試著應(yīng)用到人文學(xué)科中,但人們在長期的實踐中已經(jīng)清楚地認識到精確的方法應(yīng)用到人文學(xué)科有很大的局限性.面對巨大而又復(fù)雜的人文學(xué)科系統(tǒng),區(qū)別于傳統(tǒng)方法的新方法——模糊計算方法被L.A.Zadeh提出.高標準的精確表達,普遍存在于數(shù)學(xué)、化學(xué)36粗糙集模型

一個對象屬于某個集合的程度隨著屬性粒度的不同而不同,為了更好地刻畫集合邊界的模糊性,波蘭學(xué)者Z.Pawlakg在20世紀80年代提出了粗糙集理論,其本質(zhì)思想是利用不可分辨關(guān)系(等價關(guān)系)來建立論域的一個劃分,得到不區(qū)分的等價類,即不同屬性粒度下的概念粒,從而建立一個近似空間(由不同大小的概念粒形成).粗糙集模型一個對象屬于某個集合的程度隨著37

在近似空間上,用2個精確的集合(上近似集和下近似集)來逼近一個邊界模糊的集合.如果近似空間的粒度較粗,被近似的集合的邊界域較寬,而如果近似空間的粒度較細,被近似集合的邊界域較窄.

等價關(guān)系的泛化是推廣粗糙集模型的一種重要手段.所謂等價關(guān)系的泛化問題實質(zhì)上就是將滿足等價關(guān)系的3個條件(自反、對稱、傳遞)根據(jù)實際問題進行組合,得到不同的二元關(guān)系,再根據(jù)這些二元關(guān)系得到不同的模型.在近似空間上,用2個精確的集合(上近似38商空間模型

張鈸和張鈴在研究問題求解時,提出了商空間理論,他們指出“人類智能的公認特點,就是人們能從極不相同的粒度上觀察和分析同一問題.人們不僅能在不同粒度的世界上進行問題求解,而且能夠很快地從一個粒度世界跳到另一個粒度的世界,往返自如,毫無困難.這種處理不同世界的能力,正是人類問題求解的強有力的表現(xiàn)”.商空間模型張鈸和張鈴在研究問題求解時,提39云模型定性概念和定量實現(xiàn)之間的轉(zhuǎn)化是人類認知過程中的重要環(huán)節(jié),一方面是通過自然語言表達的定性知識,另一方面是客觀世界中存在的定量實現(xiàn)。30度以上,熱;23,24,25度等,舒服。云模型作為一個定性定量轉(zhuǎn)換的認知模型具有重要意義。云模型定性概念和定量實現(xiàn)之間的轉(zhuǎn)化是人類認知過程中的重要環(huán)節(jié)40云模型的定義設(shè)U是一個用數(shù)值表示的定量論域,C是U上的定性概念。若定量值(x屬于U)是定性概念C的一次隨機實現(xiàn),x對C的確定度是穩(wěn)定傾向的隨機數(shù),則x在論域U上的分布稱為云,每一個x稱為一個云滴。云發(fā)生器云模型的定義設(shè)U是一個用數(shù)值表示的定量論域,C是U上的定性概41粒計算是信息處理的一種新的概念和計算范式,覆蓋了所有有關(guān)粒度的理論、方法、技術(shù)和工具的研究,主要用于處理不確定的、模糊的、不完整的和海量的信息.粗略地講,一方面它是模糊信息粒度理論、粗糙集理論、商空間理論、區(qū)間計算等的超集,另一方面是粒數(shù)學(xué)的子集.具體地講,凡是在分析問題和求解問題中,應(yīng)用了分組、分類和聚類手段的一切理論與方法均屬于粒計算的范疇.對它的研究,引起了人們的關(guān)注,已成為人工智能領(lǐng)域新近研究的熱點方向之一.

粒計算是信息處理的一種新的概念和計算范式,覆蓋了所有有關(guān)粒度42第二章作業(yè)粒計算的主要模型有哪些?第二章作業(yè)粒計算的主要模型有哪些?43第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)ppt課件44

第三章

粗糙集模型內(nèi)容提要

第一節(jié)各種集合理論的哲學(xué)基礎(chǔ)

第二節(jié)經(jīng)典集合與等價關(guān)系

第三節(jié)Pawlak.Z粗糙集模型

第四節(jié)常見廣義粗糙集模型第五節(jié)簡單應(yīng)用—決策分析

第三章粗糙集模型45面對日益增長的數(shù)據(jù)庫,將如何從這些浩瀚的數(shù)據(jù)中找出有用的知識?我們?nèi)绾螌⑺鶎W(xué)到的知識去粗取精?什么是對事物的粗線條描述什么是細線條描述?面對日益增長的數(shù)據(jù)庫,將如何從這些浩瀚的數(shù)據(jù)中找出有用的知識46第一節(jié)各種集合理論的哲學(xué)基礎(chǔ)內(nèi)容提要

一、普通集合的哲學(xué)基礎(chǔ)

二、模糊集合的哲學(xué)基礎(chǔ)三、可拓集合的哲學(xué)基礎(chǔ)四、反演集合的哲學(xué)基礎(chǔ)五、粗集合的哲學(xué)基礎(chǔ)第一節(jié)各種集合理論的哲學(xué)基礎(chǔ)內(nèi)容提要47一、普通集合的哲學(xué)基礎(chǔ)普通集合的哲學(xué)基礎(chǔ)是亞里士多德(Aristotle’s)提出的形式邏輯的矛盾律和排中律,即:“A不能既是B又不是B”和“A是B或不是B”。一、普通集合的哲學(xué)基礎(chǔ)普通集合的哲學(xué)基礎(chǔ)是亞里士多德(Ari48二、模糊集合的哲學(xué)基礎(chǔ)模糊集合的哲學(xué)基礎(chǔ)是:形式邏輯矛盾律+模糊中介邊界(排中律的替代品)。二、模糊集合的哲學(xué)基礎(chǔ)模糊集合的哲學(xué)基礎(chǔ)是:形式邏輯矛盾律+49三、可拓集合的哲學(xué)基礎(chǔ):可拓集合的哲學(xué)基礎(chǔ)是:形式邏輯矛盾律+臨界+可拓域。三、可拓集合的哲學(xué)基礎(chǔ):可拓集合的哲學(xué)基礎(chǔ)是:形式邏輯矛盾律50四、反演集合的哲學(xué)基礎(chǔ)

反演集合就是在充分肯定以形式邏輯矛盾為基礎(chǔ)的普通集合的同時,把普通集合(或)所對應(yīng)的另一半(或)找回來。因為它們原本就是一對相互依存、同生同滅的孿生兄弟,就像作用力與反作用力一樣不可分割?,F(xiàn)在找回來,并探討其之間的關(guān)系,這就是反演集合理論的實質(zhì)。四、反演集合的哲學(xué)基礎(chǔ)反演集合就是在充分51五、粗集的哲學(xué)基礎(chǔ)

粗集的哲學(xué)基礎(chǔ)應(yīng)該是形式邏輯矛盾律+“邊界”。五、粗集的哲學(xué)基礎(chǔ)粗集的哲學(xué)基礎(chǔ)應(yīng)該是形式邏輯矛盾律52第三章第一節(jié)作業(yè)簡述各種集合的哲學(xué)基礎(chǔ)分別是什么?第三章第一節(jié)作業(yè)簡述各種集合的哲學(xué)基礎(chǔ)分別是什么?53第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)ppt課件54第二節(jié)經(jīng)典集合與等價關(guān)系第二節(jié)經(jīng)典集合與等價關(guān)系55第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)ppt課件56第三節(jié)Pawlak.Z粗糙集模型第三節(jié)Pawlak.Z粗糙集模型57一、粗糙集的概念(一)粗糙集概述在很多實際系統(tǒng)中均不同程度地存在著不確定性因素,采集到的數(shù)據(jù)常常包含著噪聲,不精確甚至不完整.粗糙集理論是繼概率論,模糊集,證據(jù)理論之后的又一個處理不確定性的數(shù)學(xué)工具。(二)相關(guān)概念知識:(舉例說明)一、粗糙集的概念58A={x1,x2,x3,x4,x5,x6,x7,x8},每個積木塊都有顏色屬性,按照顏色的不同,我們能夠把這堆積木分成R1={紅,黃,蘭}三個大類,那么所有紅顏色的積木構(gòu)成集合X1={x1,x2,x6},

黃顏色的積木構(gòu)成集合X2={x3,x4},

蘭顏色的積木構(gòu)成集合X3={x5,x7,x8}。按照顏色這個屬性我們就把積木集合A進行了一個劃分(所謂A的劃分就是指對于A中的任意一個元素必然屬于且僅屬于一個分類),那么我們就說顏色屬性就是一種知識在這個例子中我們不難看到,一種對集合A的劃分就對應(yīng)著關(guān)于A中元素的一個知識

A={x1,x2,x3,x4,x5,x6,x7,x8},每個59假如還有其他的屬性,比如還有形狀R2={三角,方塊,圓形},大小R3={大,中,小},這樣加上R1屬性對A構(gòu)成的劃分分別為:

A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}}(顏色分類)

A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}}(形狀分類)

A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}}(大小分類)

上面這些所有的分類合在一起就形成了一個基本的知識庫。

假如還有其他的屬性,比如還有形狀R2={三角,方塊,圓形},60除了紅的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}這樣的概念以外還可以表達例如

大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2},

大三角{x1,x2,x5}∩{x1,x2}={x1,x2},

蘭色的小的圓形({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7},

蘭色的或者中的積木{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。而類似這樣的概念可以通過求交運算得到,比如X1與Y1的交就表示紅色的三角形。除了紅的{x1,x2,x6}、大的{x1,x2,x5}、三角61所有的這些能夠用交、并表示的概念以及加上上面的三個基本知識(A/R1,A/R2.A/R3)一起就構(gòu)成了一個知識系統(tǒng)記為R=R1∩R2∩R3,它所決定的所有知識是A/R={{x1,x2},{x3},{x4},{x5},{x6},{x7},{x8}}以及A/R中集合的并。

所有的這些能夠用交、并表示的概念以及加上上面的三個基本知識(62近似下近似集是在那些所有的包含于X的知識庫中的集合中求并得到的,而上近似則是將那些包含X的知識庫中的集合求并得到的。近似63一般的,我們可以用右面的圖來表示上、下近似的概念。

這其中藍色曲線圍的區(qū)域是X的區(qū)域,紫色曲線圍的部分是內(nèi)部參考消息,是下近似,紅色曲線圍的內(nèi)部部分就是上近似集。其中各個小方塊可以被看成是論域上的知識系統(tǒng)所構(gòu)成的所有劃分。

整個粗集理論的核心就是上面說的有關(guān)知識、集合的劃分、近似集合等等概念。一般的,我們可以用64

1.關(guān)于粗糙集的用途粗糙集是用來處理不確定信息不確定性按性質(zhì)劃分:1)隨機性.例:明天可能會下雨2)模糊性:模糊性就是一個命題中所出現(xiàn)的某些言詞概念上無明確的內(nèi)涵和外延。模糊現(xiàn)象是指邊界不清楚,在質(zhì)上沒有確定性的含義,在量上沒有確切界限的事物的一種客觀屬性,是事物之間的差異存在一定的中間過渡的結(jié)果.例:這孩子是個聰明的孩子1.關(guān)于粗糙集的用途653)不完全性:例:在炒股票中.4)不一致性:相同原因產(chǎn)生不一樣的結(jié)果5)時變性:隨著時間會改變的事物3)不完全性:66一些基本術(shù)語論域:數(shù)學(xué)定義是:U={U1,U2,…,Um}解釋:所要處理的所有對象(在數(shù)據(jù)庫中即是所有數(shù)據(jù))的總和例:例如,對于貨票集合來說,其任意子集稱為一個概念。根據(jù)運輸距離對貨票進行分類,可以形成不同的概念:概念1:運距在500公里(含500公里)以下的貨票;概念2:運距在500公里-1500公里(含1500公里)間的貨票;概念3:運距在1500公里以上的貨票。對于上例來說U就是貨票集合,它由價格分成了3個概念即類(U1,U2,U3)粗糙集理論建立在這樣一個前提上:即所考慮的論域中的每一個對象都包含某種信息(數(shù)據(jù)和知識)。一些基本術(shù)語粗糙67條件屬性集:數(shù)學(xué)定義是:P={P1,P2,…,Pm}解釋:就是對象的各種屬性總和(也就是數(shù)據(jù)庫中的字段)Pm就是這個對象的一個屬性基本集(基本粒度):定義:所有不可區(qū)分的對象形成的集合解釋:可區(qū)分(可分辨):如果Ui≠Uj就稱這兩個對象在其條件P下是可區(qū)分的(對于兩個不同的對象至少有一個屬性是不同的)否則即為不可區(qū)分條件屬性集:68例對于上表來說,U中有四個對象(概念),而現(xiàn)在條件集合中只有一個屬性,對于U1和U2來說,它們的p不同所以可以通過p來區(qū)分,即u1,u2在p下可區(qū)分;而U2和U3雖然是不同的對象但是在P下卻是相同的,即在p下不可區(qū)分,就成為不可區(qū)分例對于上表來說,U中有四個對象(概念),而現(xiàn)在條件集合中只69粗糙集:一個集合若恰好等于基本集的任意并集稱為一個清晰(crisp)集(精確集),否則稱為粗糙(rough)集(不精確集)。解釋:都可區(qū)分的是清晰集,有不可區(qū)分的對象為粗糙集主要特點:以不完全信息或知識去處理一些不分明現(xiàn)象的能力,或依據(jù)觀察、度量到的某些不精確的結(jié)果而進行分類數(shù)據(jù)的能力.粗糙集體現(xiàn)了集合中元素間的不可區(qū)分性.主要優(yōu)勢:它不需要提供問題所需處理的數(shù)據(jù)集合之外的任何先驗知識,而且與處理其它不確定性問題的理論有很強的互補性.粗糙集:70第一章緒論第二章粒計算常見模型第三章第一節(jié)哲學(xué)基礎(chǔ)ppt課件71屬性約簡粗糙集是處理模糊數(shù)據(jù)的有力工具,而要達到這樣的目的需要有兩個重要的步驟來進行處理—屬性約簡和值約簡,屬性約簡是對粗糙集合(那些不能區(qū)分的集合)進行縱向的簡化,把不必要的屬性去掉,即去掉這些屬性也不會影響對象的區(qū)分能力,這樣便于以后進一步的簡約處理屬性約簡72關(guān)于屬性約簡的一些基本概念1.由可區(qū)分的概念引申出來:如果在整個信息系統(tǒng)S(即帶所有P的所有U)上所有Ui都互不相等,那么就稱為這個S在P下是可分辨的,一般記作ind(P)解釋:這個標號說明是在P這個條件集合下是可分辨的,而且另一個P’下可能不可分辨,所以在對于一個S是否分辨取決于它的屬性集合,因此ind(P)只需一個參數(shù)P即可2.如果去掉P中的某個屬性集合Pi,系統(tǒng)S仍然是可以分辨的,那么P中的Pi是可以簡約的,一般記作ind(P-Pi)=ind(P)關(guān)于屬性約簡的一些基本概念73

3.如果P中的任何一條屬性都是不可簡約的,那么就稱P是獨立的解釋:P是獨立的說明P中的任何一個屬性都是必不可少的,它獨立的表達一個系統(tǒng)分類的特征。屬性約簡的算法分析:

初始狀態(tài):所有數(shù)據(jù)已存入數(shù)據(jù)庫(以下為模擬數(shù)據(jù))uabcdE1100112100013000004110105110226210223.如果P74現(xiàn)在設(shè)e為決策屬性,其他為條件屬性,即對于不同的對象,不同的條件屬性的組合會對決策屬性有怎么樣的影響?算法思路:基本假設(shè)是能影響屬性e的只有a,b,c,d四個(即系統(tǒng)在a,b,c,d,e下可區(qū)分)基本原則是如果所有的條件屬性都是一樣的兩個對象其決策屬性也應(yīng)該是一樣的(因為否則說明這個對象還有能影響其決策屬性的條件屬性未被列入表內(nèi))那么如果去掉某個條件屬性,對于任意兩個不同的決策屬性其他屬性都不同,那么這個屬性冗余,否則這個屬性必需(即前面的概念2)現(xiàn)在設(shè)e為決策屬性,其他為條件屬性,即對于不同的對象,不同的75實例如表一所示.描述了一些人的教育程度以及是否找到了較好工作,旨在說明兩者之間的關(guān)系.

表1教育程度與是否找到好工作的關(guān)系姓名教育程度是否找到了好工作王治高中否馬麗高中是李得小學(xué)否劉保大學(xué)是趙凱博士是如表一所示.描述了一些人的教育程度以及是否找到了較好工作76

設(shè)O表示找到了好工作的人的集合,則

O={馬麗,劉保,趙凱},設(shè)I表示屬性“教育程度”所構(gòu)成的一個等效關(guān)系根據(jù)教育程度的不同,該論域被分割為四個等效類:{王治,馬麗},{李得},{劉保},{趙凱}.王治和馬麗在同一個等效類中,他們都為高中文化程度,是不可分辨的.設(shè)O表示找到了好工作的人的集合,則77集合O的下逼近(即正區(qū))為I3(O)=POS(O)={劉保,趙凱}集合O的負區(qū)為NEG(O)={李得}集合O的邊界區(qū)為BND(O)={王治,馬麗}集合O的上逼近為I3(O)=POS(O)+BND(O)={劉保,趙凱,王治,馬麗}根據(jù)表1,可以歸納出下面幾條規(guī)則,揭示了教育程度與是否能找到好工作之間的關(guān)

RULE1:IF(教育程度=大學(xué))OR(教育程度=博士)THEN(可以找到好工作)

RULE2:IF(教育程度=小學(xué))THEN(找不到好工作)

RULE3:IF(教育程度=高中)THEN(可能找到好工作)從這個簡單的例子中,我們還可以體會到粗糙集理論在數(shù)據(jù)分析,尋找規(guī)律方面的作用

集合O的下逼近(即正區(qū))為I3(O)=PO78二、粗糙集的特點粗糙集方法的簡單實用性是令人驚奇的,它能在創(chuàng)立后的不長時間內(nèi)得到迅速應(yīng)用是因為具有以下特點:(1)它能處理各種數(shù)據(jù),包括不完整(incomplete)的數(shù)據(jù)以及擁有眾多變量的數(shù)據(jù);(2)它能處理數(shù)據(jù)的不精確性和模棱兩可(ambiguity),包括確定性和非確定性的情況;

(3)它能求得知識的最小表達(reduct)和知識的各種不同顆粒(granularity)層次;

(4)它能從數(shù)據(jù)中揭示出概念簡單,易于操作的模式(pattern);二、粗糙集的特點(1)它79(5)它能產(chǎn)生精確而又易于檢查和證實的規(guī)則,特別適于智能控制中規(guī)則的自動生成.特點綜述:粗糙集理論作為一種處理不精確(imprecise)、不一致(inconsistent)、不完整(incomplete)等各種不完備的信息有效的工具。一方面得益于他的數(shù)學(xué)基礎(chǔ)成熟、不需要先驗知識;另一方面在于它的易用性。由于粗糙集理論創(chuàng)建的目的和研究的出發(fā)點就是直接對數(shù)據(jù)進行分析和推理,從中發(fā)現(xiàn)隱含的知識,揭示潛在的規(guī)律,因此是一種天然的數(shù)據(jù)挖掘或者知識發(fā)現(xiàn)方法,它與基于概率論的數(shù)據(jù)挖掘方法、基于模糊理論的數(shù)據(jù)挖掘方法和基于證據(jù)理論的數(shù)據(jù)挖掘方法等其他處理不確定性問題理論的方法相比較,最顯著的區(qū)別是它不需要提供問題所需處理的數(shù)據(jù)集合之外的任何先驗知識,而且與處理其他不確定性問題的理論有很強的互補性(特別是模糊理論)。(5)它能產(chǎn)生精確而又易于檢查和證實的規(guī)則,特別適于智能80粗糙集理論所處理的問題

?不確定或不精確知識的表達;

?經(jīng)驗學(xué)習并從經(jīng)驗中獲取知識;

?不一致信息的分析;

?根據(jù)不確定,不完整的知識進行推理;

?在保留信息的前提下進行數(shù)據(jù)化簡;

?近似模式分類;

?識別并評估數(shù)據(jù)之間的依賴關(guān)系粗糙集理論所處理的問題81

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論