粗糙集理論-研究現(xiàn)狀與發(fā)展前景課件_第1頁
粗糙集理論-研究現(xiàn)狀與發(fā)展前景課件_第2頁
粗糙集理論-研究現(xiàn)狀與發(fā)展前景課件_第3頁
粗糙集理論-研究現(xiàn)狀與發(fā)展前景課件_第4頁
粗糙集理論-研究現(xiàn)狀與發(fā)展前景課件_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

粗糙集理論

--研究現(xiàn)狀與發(fā)展前景粗糙集理論

--研究現(xiàn)狀與發(fā)展前景主要內(nèi)容研究背景粗糙集基本理論粗糙集與知識表達與其它處理不確定性問題方法的關(guān)系粗糙集理論的應(yīng)用與發(fā)展前景參考文獻主要內(nèi)容研究背景研究背景粗糙集(RoughSets)是波蘭數(shù)學(xué)家Z.Pawlak于1982年提出的[1](為開發(fā)自動規(guī)則生成系統(tǒng)及研究軟計算問題而引入)。由于最初關(guān)于粗糙集理論的研究大部分是用波蘭語發(fā)表的,因此當(dāng)時沒有引起國際計算機學(xué)界和數(shù)學(xué)界的重視。研究地域也局限在東歐一些國家,直到80年代末才引起各國學(xué)者的注意。九十年代初,人們才逐漸認(rèn)識到它的意義。1992年在波蘭Kiekrz召開了第一屆國際RS研討會。這次會議著重討論了集合近似定義的基本思想及應(yīng)用,其中RS環(huán)境下的機器學(xué)習(xí)基礎(chǔ)研究是這次會議的四個專題之一。研究背景粗糙集(RoughSets)是波研究背景(續(xù))1993年在加拿大Banff召開第二屆國際RS理論與知識發(fā)現(xiàn)研討會。這次會議積極推動了國際上對RS理論與應(yīng)用的研究。由于當(dāng)時正值KDD(數(shù)據(jù)庫知識發(fā)現(xiàn))成為研究的熱門話題,一些著名KDD學(xué)習(xí)者參加這次會議,并且介紹了許多應(yīng)用擴展RS理論的知識發(fā)現(xiàn)方法與系統(tǒng)。1996年在日本東京召開了第5屆國際RS研討會,推動了亞洲地區(qū)對RS理論與應(yīng)用的研究。1995年,ACMCommunication將其列為新浮現(xiàn)的計算機科學(xué)的研究課題。研究背景(續(xù))1993年在加拿大Banff召開第二屆研究背景(續(xù))1998年,國際信息科學(xué)雜志(InformationSciences)為粗糙集理論的研究出了一期專輯[2,3]。第一屆中國RS理論與軟計算學(xué)術(shù)研討會,于2001年5月在重慶舉行。第二屆中國RS理論與軟計算學(xué)術(shù)研討會,于2002年10月在蘇州大學(xué)舉行。第三屆中國RS理論與軟計算學(xué)術(shù)研討會,于2003年8月在重慶舉行。第四屆中國RS理論與軟計算學(xué)術(shù)研討會,將于2004年在舟山舉行。研究背景(續(xù))1998年,國際信息科學(xué)雜志(Info

粗糙集的理論及應(yīng)用的文章主要發(fā)表在以下雜志國內(nèi):1.模式識別與人工智能2.軟件學(xué)報3.科學(xué)通報4.計算機科學(xué)5.計算機學(xué)報6.模糊系統(tǒng)與數(shù)學(xué)7.計算機應(yīng)用與軟件8.計算機研究與發(fā)展9.計算技術(shù)與自動化粗糙集的理論及應(yīng)用的文章國內(nèi):1.模式識別與人工

粗糙集的理論及應(yīng)用的文章主要發(fā)表在以下雜志(續(xù))國際:1.InformationSciences2.Fuzzysetsandsystems3.InternationalJournalofComputerandInformationSciences4.CommunicationoftheACM5.ComputationalIntelligence6.Journalofcomputerandsystemsciences

粗糙集的理論及應(yīng)用的文章國際:1.Informa7.AIMagazine8.AICommunications9.EuropeanJournalofOperationalResearch10.InternationalJournalofApproximateReasoning11.Theoreticalcomputersciences12.DecisionsupportSystems13.InternationalJournalofMan-Machinestudies14.FundamentaInformaticae15.IntelligentAutomationSciences7.AIMagazine粗糙集理論粗糙集理論是一種處理不精確、不確定與不完全數(shù)據(jù)的新的數(shù)學(xué)方法。由于它在機器學(xué)習(xí)與知識發(fā)現(xiàn)、數(shù)據(jù)挖掘、決策支持與分析、專家系統(tǒng)、歸納推理、模式識別等方面的廣泛應(yīng)用,現(xiàn)已成為一個熱門的研究領(lǐng)域[2]。RS理論主要興趣在于它恰好反映了人們用Rough集方法處理不分明問題的常規(guī)性,即以不完全信息或知識去處理一些不分明現(xiàn)象的能力?;蛞罁?jù)觀察,度量到的某些不確定的結(jié)果而進行分類數(shù)據(jù)的能力[4]。粗糙集理論粗糙集理論是一種處理不精確、不確定粗糙集理論的基本概念RS理論認(rèn)為知識即是將對象進行分類的能力,假定我們起初對全域里的元素(對象)具有必要的信息、或知識,通過這些知識能夠?qū)⑵鋭澐值讲煌念悇e。若我們對兩個元素具有相同的信息,則它們就是不可區(qū)分的(即根據(jù)已有的信息不能夠?qū)⑵鋭澐珠_)。顯然這是一種等價關(guān)系。不可區(qū)分關(guān)系是RS理論最基本概念。在此基礎(chǔ)上引入了成員關(guān)系,上近似和下近似等概念來刻劃不精確性與模糊性[1,2,4,5]。粗糙集理論的基本概念RS理論認(rèn)為知識即是將對象進行樣本粗糙集方法處理具有優(yōu)化指標(biāo)的樣本評審樣本學(xué)習(xí)樣本數(shù)據(jù)預(yù)處理(粗糙集方法、模糊集方法)模糊、粗糙推理神經(jīng)網(wǎng)絡(luò)遺傳算法智能信息系統(tǒng)樣本粗糙集方法處理具有優(yōu)化指標(biāo)的樣本評審樣本學(xué)習(xí)樣

設(shè)U是非空有限論域(全域、集合),R是U上的二元等價關(guān)系(具有相反、對稱、傳遞性的關(guān)系),R稱為不可分辨關(guān)系。序?qū)=(U,R)稱為近似空間。,若,則稱對象x與y在近似空間A中是不可分辨的。U/R是U上由R生成的等價類全體,它構(gòu)成U的一個劃分,U上的劃分可以與U上的二元等價關(guān)系之間建立一一對應(yīng)。

基本概念基本概念

U/R中的元素(集合)稱為U的基本集或原子集,任意有限個基本集的并稱為可定義集,空集也稱為可定義集(可定義集也稱為精確集)。否則稱為不可定義集。若將U中的集合稱為概念或表示知識,則A=(U,R)稱為知識庫,原子集(基本集)表示基本概念或知識模塊。那么精確集可以在知識庫中被精確地定義或描述,可表示已知的知識。

基本概念(續(xù))基本概念(續(xù))

上近似,下近似

對于一個近似空間A=(U,R),X是U的任意一個子集。X不一定能用知識庫中的知識來精確地描述;即X可能為不可定義集,這時就用X關(guān)于A的一對下近似、上近似來“近似”地描述。下面表示x所在的R-等價類。

稱為集合X關(guān)于R的下近似。=稱為集合X關(guān)于R的上近似。上近似,下近似對于一個近似空間A=(U,R),粗糙集理論--研究現(xiàn)狀與發(fā)展前景課件

例1

給定一玩具積木的集合,并假設(shè)這些積木有不同的顏色(紅、黃、藍),形狀(方、圓、三角)和體積(大、?。?。積木的集合U可按顏色、形狀、體積分類。:顏色關(guān)系,:形狀關(guān)系,:體積。則例1給定一玩具積木的集合

例1(續(xù))

取,那么

例1(續(xù))取下近似也稱為X關(guān)于近似空間A的正域,記為pos(X)。解釋為:由那些根據(jù)現(xiàn)有知識判斷出肯定屬于X的對象所組成的最大集合。上近似可以解釋為:由那些根據(jù)現(xiàn)有知識判斷出可能屬于X的對象所組成的最小集合。稱作X關(guān)于A的負(fù)域,記為neg(X)。解釋為:由那些根據(jù)現(xiàn)有知識判斷肯定不屬于X的對象所組成的集合。

下近似也稱為X關(guān)于近似空間A的正域,

稱作X的邊界(域)記為BND(X)。解釋為:由那些根據(jù)現(xiàn)有知識判斷出可能屬于X但不能完全肯定是否一定屬于X的對象所組成的集合[5]。(上下近似之差,即:)

X是可定義;X是不可定義的,此時稱X在近似空間A中是粗糙集。同時,稱為粗糙代數(shù)系統(tǒng)[6],其中∽表示集合補。

粗糙集的幾種表示①稱二元對為Rough集(粗糙集)可認(rèn)為Rough集的另一種表示形式,這種定義方式可直接算出U上關(guān)于其子集X的含糊元素數(shù)目。這種邊界區(qū)意味著由于掌握的知識不完全而存在不能辨別的區(qū)域,即bnd(X)上的元素不可分辨,所以U上子集X關(guān)于U上不分明關(guān)系R是Rough的,主要是,否則它是可分辨的。一個集合X的邊界區(qū)域越大,則這個集合X的含糊元素也越多,這種思想可以用數(shù)值化的系數(shù)表示。粗糙集的幾種表示①稱二元對粗糙集的幾種表示(續(xù))③,cardX表X的基數(shù)。稱為X的近似精度,(粗糙程度。于是也可用來定義Rough集。當(dāng),稱U上子集X關(guān)于U上不分明關(guān)系R是Rough的;當(dāng),稱X關(guān)于R是精確的;可被用作Rough邏輯中的算子。粗糙集的幾種表示(續(xù))③粗糙集的幾種表示(續(xù))④在Rough集上也有元素隸屬于集合的問題(與Fuzzy集一樣)。設(shè),

,則。稱為Rough隸屬函數(shù),解釋為一種條件概率,能從全域上的個體加以計算。Fuzzy集上的隸屬函數(shù)則不然。用來定義Rough集,則得到Rough集的第四種表示形式。粗糙集的幾種表示(續(xù))④在Rough集上也有元素隸屬于集合的粗糙集的幾種表示(續(xù))若存在,有,稱X關(guān)于R是Rough的,若對每個,有,則X關(guān)于R是精確的。相反地,Rough隸屬函數(shù)可用來定義一個集合的上、下近似集及邊界集

粗糙集的幾種表示(續(xù))若存在,有粗糙集的幾種表示(續(xù))無論哪一種Rough集的表示形式都離不開全域U上的不分明關(guān)系R以及由R定義的下和上近似集。因此對Rough集理論中的不分明關(guān)系以及下和上近似集的研究尤其重要。定義觀點的不同往往帶來研究的側(cè)重面的不同。

粗糙集的幾種表示(續(xù))X關(guān)于A的度量

X關(guān)于A的近似質(zhì)量:近似質(zhì)量反映了知識X中肯定在知識庫中的部分在現(xiàn)有知識中的百分比。X關(guān)于A的粗糙性測度:則,且X是可定義的X是粗糙的。粗糙性測度反映了知識的不完全程度。X關(guān)于A的度量X關(guān)于A的近似質(zhì)量:X關(guān)于A的度量(續(xù))

X關(guān)于A的近似精度:它反映了根據(jù)現(xiàn)有知識對X的了解程度[2,5]。

X關(guān)于A的度量(續(xù))X關(guān)于A的近似精度:集合類關(guān)于近似空間的下近似、上近似設(shè)是由U的子集所構(gòu)成的集類。則F關(guān)于近似空間A的下近似F和上近似F:F關(guān)于A的近似精度集合類關(guān)于近似空間的下近似、上近似設(shè)集合類關(guān)于近似空間的下近似、上近似近似質(zhì)量為當(dāng)F也是U的劃分時,F(xiàn)關(guān)于A的近似在判別一個決策表是否是協(xié)調(diào)的和規(guī)則提取中有重要作用。集合類關(guān)于近似空間的下近似、上近似近似質(zhì)量為粗糙集理論中的知識表示

信息系統(tǒng)屬性的約簡及核規(guī)則的協(xié)調(diào)與提取粗糙集理論中的知識表示信息系統(tǒng)屬性的約簡

信息系統(tǒng)粗糙集理論中的知識表達方式一般采用信息表或稱為信息系統(tǒng)的形式。信息表表示輸入數(shù)據(jù),這些數(shù)據(jù)是從任意領(lǐng)域中收集的。信息系統(tǒng)可用四元有序組表示,其中U是對象的全體,即論域;A是屬性全體;,是屬性a的值域;是一個信息函數(shù),反映了對象x在K中的完全信息[5,10]。如下信息表:信息系統(tǒng)粗糙集理論中的知識表達方式一般采用信息表或稱為對象屬性頭痛肌肉痛體溫決策流感是是正常

否是是高

是是是很高

是否是正常否否否高否否是很高

是表1信息表對象屬性決策是是

信息系統(tǒng)(續(xù))標(biāo)記被稱為實例(個體,實體,對象),記。識別兩種變量:屬性(有時稱之為條件屬性),決策(有時稱之為決策屬性)。例如:如果信息表描述一家醫(yī)院,每個實例可能就是病人,屬性是癥狀和檢測,而決策是病癥。如果信息表表示一個工業(yè)生產(chǎn)過程,則這些實例可代表在某些特定時刻及時采集的過程中的樣品,屬性是過程中的參數(shù),而決策是由操作員(專家)采取的決定。信息系統(tǒng)(續(xù))標(biāo)記

信息系統(tǒng)(續(xù))RS理論的一個重要概念是不分明關(guān)系,它通常與一屬性集合聯(lián)系在一起。如上表1中頭痛、肌肉痛、體溫均為屬性。?。╊^痛且肌肉痛決定不分明關(guān)系,則ⅱ)集合根據(jù)屬性頭痛和肌肉痛是可定義的。ⅲ)頭痛和體溫決定不分明關(guān)系,則信息系統(tǒng)(續(xù))RS理論的一個重要概念是不分明關(guān)

信息系統(tǒng)(續(xù))

iv)頭痛、體溫、肌肉痛決定不分明關(guān)系,則

于是說明肌肉痛是多余的屬性。對于信息系統(tǒng),每個屬性子集都定義了論域上的一個等價關(guān)系。即,對信息系統(tǒng)(續(xù))

屬性的約簡及核粗糙集理論給出了對知識(或數(shù)據(jù))的約簡和求核的方法,從而提供了從信息系統(tǒng)中分析多余屬性的能力[2,5,9,10]。信息系統(tǒng)類似于關(guān)系數(shù)據(jù)庫模型的表達方式。有時屬性集A還可分為條件屬性C和決策(結(jié)論)屬性D,這時的信息系統(tǒng)也稱為決策表,常記為。無決策的數(shù)據(jù)分析和有決策的數(shù)據(jù)分析是粗糙集理論在數(shù)據(jù)分析中的兩個主要應(yīng)用。屬性的約簡及核粗糙集理論給出了對知識(

定義:設(shè)是一個信息系統(tǒng),由屬性集所導(dǎo)出的等價關(guān)系為。?。┰O(shè),則稱屬性a是多余的(如表1中的肌肉痛)。ⅱ)若在系統(tǒng)中沒有多余屬性,則稱A是獨立的iii)子集稱為是A的約簡。若,且B中沒有多余屬性。常記為A的全體約簡,ⅳ)A的所有約簡的交集稱為A的核,記為core(A)。一般來說:屬性集的約簡不唯一而核是唯一的。定義:設(shè)

例2(無決策情形的屬性的約簡、核

設(shè),其中,,信息函數(shù)見下表2

例2(無決策情形的屬性的約簡、核)設(shè)

例2(續(xù))

表2信息系統(tǒng)U11111221111112212211221133323332例2(續(xù))

例2(續(xù))

因此將對象及其信息壓縮后得下面表3例2(續(xù))因此將對象及其信息壓縮后得下面表3

例2(續(xù))

表3信息系統(tǒng)U/A{,}1111{,}1221{,}2211{,}3332且可驗證屬性是多余,且令。則有中沒有多余屬性。

例2(續(xù))

例2(續(xù))

于是信息表2有三個屬性的約簡,即,從而可得信息系統(tǒng)的三個約簡表如下。112221231112223311122133而且。表1的核:CoreA={頭痛,體溫}。例2(續(xù))于是信息表2有三個屬性的約簡,即

規(guī)則的協(xié)調(diào)與提取

粗糙集理論除給出了對知識(或數(shù)據(jù))的約簡和求核的方法外,還提供了從決策表中抽取規(guī)則的能力,機器學(xué)習(xí)和從數(shù)據(jù)庫中的機器發(fā)現(xiàn)就是基于這個能力。在一個決策表中,若,X關(guān)于由導(dǎo)出的近似空間的下近似和上近似相等,即,稱條件屬性子集關(guān)于決策屬性是協(xié)調(diào)的。也稱決策表是協(xié)調(diào)的,否則為不協(xié)調(diào)[10]。

規(guī)則的協(xié)調(diào)與提取粗糙集理論除給出了對

規(guī)則的協(xié)調(diào)與提取(續(xù))

如果用包含度理論來解釋,則決策表是協(xié)調(diào)的,當(dāng)且僅當(dāng)[2],其中

規(guī)則的協(xié)調(diào)與提?。ɡm(xù))如果用包含度理論來解釋,

規(guī)則的協(xié)調(diào)與提?。ɡm(xù))

從協(xié)調(diào)的決策表中可以抽出確定性規(guī)則,而從不協(xié)調(diào)的決策表中只能抽出不確定性的規(guī)則或可能性規(guī)則,有時也稱為廣義決策規(guī)則,這是因為在不協(xié)調(diào)的系統(tǒng)中存在著矛盾的事例。決策表中的決策規(guī)則一般可以表示為形式[5]:其中稱為規(guī)則的條件表示,稱為規(guī)則的決策部分。決策規(guī)則即使是最優(yōu)的也不一定唯一。規(guī)則的協(xié)調(diào)與提?。ɡm(xù))從協(xié)調(diào)的決策表中可以

規(guī)則的協(xié)調(diào)與提取(續(xù))

在決策表中抽取規(guī)則的一般方法為[3]:(1)在決策表中將信息相同(即具有相同描述)的對象及其信息刪除只留其中一個得到壓縮后的信息表,這一步稱為刪除多余事例;(2)刪除多余的屬性;(3)對每一個對象及其信息中將多余的屬性值刪除;(4)求出最小約簡;(5)根據(jù)最小約簡,求出邏輯規(guī)則。規(guī)則的協(xié)調(diào)與提?。ɡm(xù))在決策表中抽取規(guī)則的一般方法為

例3(決策情形)

設(shè),其中,具體的決策表見下面表4

例3(決策情形)設(shè)

例3(續(xù))

表4決策表U111112211111122122112211333233321122132435354545例3(續(xù))

例3(續(xù))

因此

例3(續(xù))因此

例3(續(xù))

從而對于它的決策子表(U,,V,),(U,,V,),我們可得到它們的一個約簡表如下(一般不唯一)例3(續(xù))從而對于它的決策子表(U,,

例3(續(xù))

111122213234111122113124225335表5表6例3(續(xù))1111222

例3(續(xù))

且,,故(U,,V,)是協(xié)調(diào)的。但,,,

故(U,,V,)不協(xié)調(diào)的。例3(續(xù))且,

例3(續(xù))

由表5可得決策表(U,,V,)的四條最優(yōu)決策規(guī)則。且這四條規(guī)則都是確定的。例3(續(xù))由表5可得決策表(U,,V

例3(續(xù))

由表6(它是不協(xié)調(diào)的)也可得到?jīng)Q策表(U,,V,)的四條最優(yōu)決策規(guī)則:其中是不確定的,而只有是確定的。例3(續(xù))由表6(它是不協(xié)調(diào)的)也可得到?jīng)Q策表其中

與其他不確定性數(shù)學(xué)方法的關(guān)系

RS理論與其他處理不確定和不精確問題理論的最顯著的區(qū)別是無需提供問題所需處理的數(shù)據(jù)集合之外的任何先驗信息即它不需要任何預(yù)備的或額外的有關(guān)數(shù)據(jù)信息。如統(tǒng)計學(xué)中的概率分布,F(xiàn)uzzy理論中的隸屬度函數(shù)等。所以RS理論對問題的不確定性的描述或處理可以說是比較客觀的。與其他不確定性數(shù)學(xué)方法的關(guān)系RS理

與其他不確定性數(shù)學(xué)方法的關(guān)系

由于這個理論未能包含處理不精確或不確定原始數(shù)據(jù)的機制,因此,單純地使用這個理論不一定能有效地描述數(shù)據(jù)不精確或不確定的實際問題,而證據(jù)理論與模糊集理論等具有處理不精確或不確定數(shù)據(jù)的方法,所以這個理論與概率統(tǒng)計,模糊數(shù)學(xué),證據(jù)理論等其他處理不精確或不確定問題的理論有很強的互補性。。與其他不確定性數(shù)學(xué)方法的關(guān)系由于這

與其他不確定性數(shù)學(xué)方法的關(guān)系

在粗糙集理論與其它處理模糊性或不確定性方法的理論研究中,主要集中在它與概率統(tǒng)計,模糊數(shù)學(xué),D-S證據(jù)理論和信息論的相應(yīng)滲透與補充。下面從三方面進行比較。(1)與概率統(tǒng)計結(jié)合(2)與模糊數(shù)學(xué)(3)與D-S證據(jù)理論(Dempster-Shafer證據(jù)理論)。與其他不確定性數(shù)學(xué)方法的關(guān)系在粗糙集

與概率統(tǒng)計結(jié)合在信息系統(tǒng)中,知識庫的知識的類型一般有兩類:一類庫中所有對象的描述是完全已知的,Pawlak粗糙集模型和一般二元關(guān)系下的粗糙集模型的是屬于這一種。另一類庫中的對象的描述只有部分是已知的,即知識庫中的知識是不確定的,它只能通過訓(xùn)練樣本所提供的信息來刻畫概念。與概率統(tǒng)計結(jié)合在信息系統(tǒng)中,知識庫的知識

與概率統(tǒng)計結(jié)合(續(xù))

為了使從訓(xùn)練樣本獲得的規(guī)則符合整個論域的對象,在抽取樣本時應(yīng)符合統(tǒng)計規(guī)律性,粗糙集理論不管這一類工作,因些概率統(tǒng)計作為研究自然界,人類社會及技術(shù)過程中大量隨機現(xiàn)象的規(guī)律性的一門學(xué)科,它與粗糙集理論的結(jié)合就顯得非常自然[2]。

與概率統(tǒng)計結(jié)合(續(xù))為了使從訓(xùn)練樣本獲得的規(guī)則符合整

與模糊數(shù)學(xué)粗糙集理論用粗糙隸屬函數(shù)來刻畫知識的模糊性[2,13,14]。(ⅰ)這是對一般二元關(guān)系R下的近似空間A(U,R)而言的。當(dāng)R為等價關(guān)系時,。(ⅱ)

與模糊數(shù)學(xué)粗糙集理論用粗糙隸屬函數(shù)來

與模糊數(shù)學(xué)(續(xù))

在概率近似空間下,用它表示粗糙隸屬函數(shù)。粗糙隸屬一般不是Zadeh意義下的隸屬函數(shù)。粗糙集理論和模糊集理論在處理不確定性和不精確性問題方面都推廣了經(jīng)典集合論,雖有一定的相容性和相似性,然后它們的側(cè)重面不同。

a)從知識的“粒度“的描述上來看,模糊集通過對象關(guān)于集合的隸屬程度來近似描述;而粗糙集是通過一個集合關(guān)于某個可利用的知識庫的一對上、下近似來描述的。

與模糊數(shù)學(xué)(續(xù))在概率近似空間下,用它表示粗

與模糊數(shù)學(xué)(續(xù))

b)從集合對象間的關(guān)系來看,模糊集強調(diào)的是集合邊界的不分明性,而粗糙強調(diào)是是對象間的不可分辨性。

c)從研究的對象來看,模糊集研究的是屬于同一類的不同對象間的隸屬關(guān)系,重在隸屬程度,而粗糙集研究的是不同類中的對象組成的集合關(guān)系,重在分類。

與模糊數(shù)學(xué)(續(xù))b)從集合對象間的關(guān)系來看

與模糊數(shù)學(xué)(續(xù))

雖然模糊集的隸屬函數(shù)和粗糙集的粗糙隸屬函數(shù)都反映了概念的模糊性,直觀上有一定的相似性,但模糊集的隸屬函數(shù)大多是專家憑經(jīng)驗給出的,因此往往帶有很強烈的主觀意志,而粗糙的粗糙隸屬函數(shù)的計算是從被分析的數(shù)據(jù)中直接獲得的,非??陀^。也正因為如此,將粗糙集理論和模糊集理論進行某些“整合”后去描述知識的不確定性和不精確性比它們各自描述知識的不確定性和不精確性可望顯示更強的功能。(目前所見的模糊粗糙集模型是其中的一些成功范例)。與模糊數(shù)學(xué)(續(xù))雖然模糊集的隸屬函

與D-S證據(jù)理論粗糙集理論是為開發(fā)規(guī)則的機器自動生成而提出的,而D-S理論主要用于證據(jù)推理;RS理論用概念的一對上,下近對其進行描述,而D-S證據(jù)理論是用一對信任函數(shù)和似然函數(shù)在給定證據(jù)下對假設(shè)進行估計和評價。RS理論中的下近似和上近似的概率恰好分別是信任函數(shù)和似然函數(shù)。然而生成信任函數(shù)和似然函數(shù)的基本概率分配函數(shù)(mass函數(shù))方法是不同的。前者來自于系統(tǒng)中數(shù)據(jù)本身,比較客觀,而后者往往來自于專家的經(jīng)驗,帶有很強的主觀性。RS理論與D-S證據(jù)理論有很強的互補性[15]。與D-S證據(jù)理論粗糙集理論是

與D-S證據(jù)理論(續(xù))

粗糙集理論中知識的不確定性主要由兩個原因產(chǎn)生[2]:(1)直接來自論域上的二元關(guān)系及其產(chǎn)生的知識模塊,即近似空間本身。如果二元等價關(guān)系產(chǎn)生的每一個等價中只有一個元素,那么等價關(guān)系產(chǎn)生的劃分不含有任何信息,劃分越粗,每個知識模塊越大,知識庫中的知識越粗糙,相對于近似空間的概念和知識就越不確定。這時處理知識的不確定性的方法往往用香農(nóng)信息熵來刻畫,知識的粗糙性與信息熵的關(guān)系比較密切,知識的粗糙性實質(zhì)上是其所含信息多少的更深層次刻畫。單從這個角度來看,RS理論與信息論的關(guān)系就比較密切。與D-S證據(jù)理論(續(xù))粗糙集理論中知識的不確定性主要

與D-S證據(jù)理論(續(xù))

粗糙集理論中知識的不確定性主要由兩個原因產(chǎn)生[2]:(2)來自于給定論域里粗糙近似的邊界。當(dāng)邊界為空集時知識就是完全確定的,邊界越大知識就越粗糙或越模糊。至今,RS理論刻畫概念X的不確定性用正則條件熵和粗糙性測度來實現(xiàn)的。但這兩個度量并沒有完全提供哪些完全屬于X的下近似的區(qū)域里面與不可分辨關(guān)系的知識粒度有關(guān)的不確定性,于是有人引進了粗糙熵Er(X)的概念來刻畫概念X的不確定性,所以,尋求一個合適的度量來刻畫知識的不確定性也是RS理論研究的一個重要方向[2,16]。與D-S證據(jù)理論(續(xù))粗糙集理論中知識的不確定性主

粗集理論的應(yīng)用及發(fā)展前景RS理論已經(jīng)被證實在實踐中是非常有用的。從大量的現(xiàn)實生活中應(yīng)用的記錄來看已經(jīng)非常明顯,這一理論對AI(人工智能)和認(rèn)知科學(xué)尤為重要,在專家系統(tǒng),決系表等方面都有有非常成功的應(yīng)用實例。利用Rough集理論處理的主要問題包括:數(shù)據(jù)簡化(即刪除多余的數(shù)據(jù)),數(shù)據(jù)相關(guān)性的發(fā)現(xiàn),數(shù)據(jù)意義的評估,由數(shù)據(jù)產(chǎn)生決策(控制)算法,數(shù)據(jù)的近似分類等。下面介紹兩的應(yīng)用和研究前景:粗集理論的應(yīng)用及發(fā)展前景RS理論已經(jīng)被證實在實

(1)美國Kansas大學(xué)開發(fā)了基于RS方法學(xué)習(xí)的例子,并開發(fā)了基于Rough集方法的學(xué)習(xí)系統(tǒng)——LERS(LearningfromExamplesbasedonRS)。這個系統(tǒng)的知識獲取項對于用不完全信息工作的專家系統(tǒng),幫助其建立知識庫是一個十分恰當(dāng)?shù)囊?guī)則歸納法的應(yīng)用實例,它在NASA’SJohnson空間中心應(yīng)用了多年,充分顯示了它在開發(fā)專家系統(tǒng)進行全球氣候變化的研究中起的作用,它是作為一種開發(fā)專家系統(tǒng)的工具被引用的。

基于RS的典型系統(tǒng)

(1)美國Kansas大學(xué)開發(fā)了基于RS方法學(xué)習(xí)的例子,

LERS可以從信息表形式中給定的實例導(dǎo)出一套規(guī)則集,并且可以利用這一套規(guī)則分類新的實例,LERS還被用于兩項醫(yī)學(xué)方面,其一用來比較手術(shù)后的病人取暖設(shè)備的效果,其二用來評估孕婦超強度勞動的危險。還有一種很重要的LERS用途是全球氣候變化的研究,描述對全球氣溫有影響的規(guī)則由一些屬性所表征的數(shù)據(jù)引出。如太陽的能量釋放,火山活動、美國南部的指針搖擺器、二氧化碳流向和二氧化碳的余量。這方面的專家依據(jù)獲得的新數(shù)據(jù)把握地球氣候變化的奧妙。

基于RS的典型系統(tǒng)(續(xù))

LERS可以從信息表形式中給定的實例導(dǎo)出一套規(guī)

Rough集理論之所以提供了AI的有效方法,是因為實現(xiàn)它的程序可以很容易在平行機上運行。且基于Rough集理論的Rough邏輯將使單調(diào)邏輯非單調(diào)化,從而在AI的近似或不精確推理中將發(fā)揮不可估量作用。

基于RS的典型系統(tǒng)(續(xù))

Rough集理論之所以提供了AI的有效方法,是

(2)Rough集方法用于決策分析已體現(xiàn)在波蘭Poznan科技大學(xué)開發(fā)的計算機系統(tǒng)中,稱之為RoughDAS和RoughClass,它們對任務(wù)分別執(zhí)行解釋和描述。這兩個系統(tǒng)已經(jīng)在許多實際領(lǐng)域都有應(yīng)用。(RoughDAS執(zhí)行信息系統(tǒng)數(shù)據(jù)分析任務(wù),RoughClass支持新對象的分類,這兩個軟件都是基于DOS操作系統(tǒng)的)[4]。

基于RS的典型系統(tǒng)(續(xù))

(2)Rough集方法用于決策分析已體現(xiàn)在波蘭P

RS理論在AI中的應(yīng)用可分為兩大類:有決策的分析,無決策的分析。有決策的分析主要包括:監(jiān)督學(xué)習(xí)與決策分析。RS理論在監(jiān)督學(xué)習(xí)中的應(yīng)用可分為兩個方面:其一:對學(xué)習(xí)的訓(xùn)練集作預(yù)處理,這是考試到從實際測量中所獲得的訓(xùn)練集,常包含有多余的屬性,應(yīng)用RS的屬性約簡可有效地去除冗余的屬性。例如:對豌豆疾病的數(shù)據(jù)進行RS處理,使得原有屬性數(shù)從35個約簡到9個;對美國1984年眾議案的投票數(shù)據(jù)的分析,則使屬性從原有16個減少為9個。另外,每個屬性的值域也會有冗余,同樣應(yīng)用RS方法中的約簡技術(shù)可以刪除某些屬性的多余值。

RS理論在AI中的應(yīng)用可分為兩大類:有決策的分析,無決

RS理論在AI中的應(yīng)用(續(xù))

其二應(yīng)用RS方法獲取規(guī)則:利用RS中提供的值約簡方法由實例集直接獲取規(guī)則,但是,由于從決策表中直接獲取所有的值約簡已被證明是一個NP完全問題,因此,利用領(lǐng)域獨立的啟發(fā)式算法求取最小約簡是一個自然的方法。例如,通過值約簡可將美國1984年眾議案的投票數(shù)據(jù)由435個例子約簡為44條規(guī)則。

RS理論在AI中的應(yīng)用(續(xù))其二應(yīng)用RS方法獲取規(guī)

RS理論在AI中的應(yīng)用(續(xù))

RS理論應(yīng)用于有決策分析還包括:(1)應(yīng)用于決策不完全時的學(xué)習(xí)(利用RS理論中的上,下近似的概念表示不完全的決策,以及對學(xué)習(xí)效果所產(chǎn)生的影響)。(2)進行增量式學(xué)習(xí)(從RS理論中的差別矩陣出發(fā),利用與或邏輯求取規(guī)則描述,對新的例子只需在差別矩陣上添加相應(yīng)的行列,即可獲取增量后的規(guī)則)。在決策分析的應(yīng)用中,則是利用RS理論的屬性約簡,值約簡及核等概念,對被決策的數(shù)據(jù)進行約簡和尋找對于決策最有用的信息。

RS理論在AI中的應(yīng)用(續(xù))RS理論應(yīng)用于有決

RS理論在AI中的應(yīng)用(續(xù))

無決策的數(shù)據(jù)分析主要是:數(shù)據(jù)壓縮、化簡、聚類、模式發(fā)現(xiàn)與機器發(fā)現(xiàn)等。這類問題主要是利用屬性的約簡去除不必要的屬性,利用值約簡壓縮數(shù)據(jù)及進行數(shù)據(jù)的聚類分析,由于無決策的數(shù)據(jù)的約簡問題也是NP完全問題,因而仍要利用啟發(fā)式知識求取最小約簡。屬于這類應(yīng)用的典型AI分支是機器發(fā)現(xiàn),特別是從大型數(shù)據(jù)庫進行知識發(fā)現(xiàn),RS被認(rèn)為是一個非常有效的方法。

RS理論在AI中的應(yīng)用(續(xù))無決策的數(shù)據(jù)分析主要

RS理論在AI中的應(yīng)用(續(xù))

近幾年來,RS理論已在很多實際領(lǐng)域得到了成功應(yīng)用。如美國的NASAJohnson空間中心利用LERS學(xué)習(xí)系統(tǒng)來發(fā)展空間自由行走的醫(yī)學(xué)專家系統(tǒng),希臘的工業(yè)發(fā)展銀行ETEUA應(yīng)用RS求取貸款信用,美國的環(huán)境保護署利用LERS來增進資源之間的協(xié)調(diào)等。目前,RS理論已在西方的研究機構(gòu)和大學(xué)與大的公司得到較廣泛的應(yīng)用,前者側(cè)重于將這個理論作為機制來研究、而后者則使用作為大規(guī)模數(shù)據(jù)的處理的工具[3]。

RS理論在AI中的應(yīng)用(續(xù))近幾年來,RS理論已研究領(lǐng)域與前景

Rough集理論除了朝著邏輯及其近似推理方向發(fā)展以外,近些年來出現(xiàn)了大量的Rough數(shù)及Rough函數(shù)的研究,發(fā)表了一系列關(guān)于Rough函數(shù)方面的論文,Rough函數(shù)的各種近似運算,Rough函數(shù)的基本性質(zhì),關(guān)于它的Rough連續(xù),Rough數(shù)限,Rough可導(dǎo)Rough積分和Rough穩(wěn)定性,Rough函數(shù)控制及建立由Rough實函數(shù)控制的離散動態(tài)系統(tǒng)都是典型的問題,這些問題都要求在Rough函數(shù)理論的模型下,給予公式化。這些問題的研究將有貢獻于定性推理方法的研究。這種研究實質(zhì)上是使連續(xù)數(shù)學(xué)離散化。如此,連續(xù)數(shù)學(xué)也能被現(xiàn)代計算機所接受。

研究領(lǐng)域與前景Rough集理論除了朝著邏輯及其近似研究領(lǐng)域與前景(續(xù))

目前,對RS理論研究集中在其數(shù)學(xué)性質(zhì),RS拓廣,與其它不確定方法的關(guān)系和互補,及有效算法等方面。1)RS理論數(shù)學(xué)性質(zhì)方面的研究,主要討論RS的代數(shù)結(jié)構(gòu)。拓?fù)浣Y(jié)構(gòu),以及RS的收斂性問題。2)RS拓廣方面的研究主要涉及廣義RS模型(或稱變精確性RS模型)與對連續(xù)屬性的離散化等。3)RS理論與其他不確定性方法之間的關(guān)系的研究中,目前主要討論它與模糊集理論和D-S證據(jù)理論的關(guān)系和互補。

研究領(lǐng)域與前景(續(xù))目前,對RS理論研究集中在其數(shù)學(xué)性質(zhì)研究領(lǐng)域與前景(續(xù))

4)在RS有效算法方面的研究,主要集中于(a)導(dǎo)出規(guī)則的增量式算法:原有的算法是在固定的數(shù)據(jù)集上進行的,當(dāng)有新的數(shù)據(jù)增加到數(shù)據(jù)集時,若用原有算法導(dǎo)出規(guī)則是相當(dāng)麻煩的,增量式算法是對原有規(guī)則進行修正,從而得出關(guān)于新數(shù)據(jù)集的規(guī)則的方法。

研究領(lǐng)域與前景(續(xù))4)在RS有效算法方面的研究,主要集研究領(lǐng)域與前景(續(xù))

(b)約簡的啟發(fā)式算法對于一個信息系統(tǒng)來說,找出其所有約簡是NP完全問題,很自然的想法是采用啟發(fā)式方法找出最優(yōu)或次優(yōu)約簡,這些算法的共同特點是利用屬性的重要性作為啟發(fā)式,去求約簡,只是它們對屬性重要性的度量不同。(c)RS基本運算的并行算法RS的基本性質(zhì)決定,它的很多基本運算可以并行計算,由于RS研究的初衷就是試圖為處理大量數(shù)據(jù)提供一個數(shù)學(xué)工具。由此,這些性質(zhì)就顯得十分重要了。

研究領(lǐng)域與前景(續(xù))(b)約簡的啟發(fā)式算法研究領(lǐng)域與前景(續(xù))

5)基于RS的邏輯是關(guān)于RS的不確定推理的基礎(chǔ),發(fā)展這類邏輯的理論基礎(chǔ)也是目前RS理論研究的重要課題。今后,圍繞著其邏輯特點和知識處理機理,主要有下列研究方向值得注意。其一、是數(shù)學(xué)理論的系統(tǒng)化和形式化。盡管Rough集理論產(chǎn)生于真正的數(shù)學(xué)基礎(chǔ),但許多理論問題仍有待于真正澄清。Pawlak粗糙集模型的推廣一直是RS理論研究的主流方向,目前主要有兩種方法a)構(gòu)造性方法b)代數(shù)性(公理化)方法。

研究領(lǐng)域與前景(續(xù))5)基于RS的邏輯是關(guān)于RS的不確定研究領(lǐng)域與前景(續(xù))

其二、是算法的研究。RS理論中有效算法研究是粗糙集在人工智能方向上研究的一個主要方向。目前,RS理論中有效算法研究主要集中在導(dǎo)出規(guī)則的增量式算法,約簡的啟發(fā)式算法,粗糙集基本并行算法,以及與粗糙集有關(guān)的神經(jīng)網(wǎng)絡(luò)與遺傳算法等。這些研究的成功應(yīng)用有的已經(jīng)獲得了商業(yè)價值。

其三、是面向粗糙集對象的專家系統(tǒng)和智能系統(tǒng)和粗糙集在工程技術(shù)方面的應(yīng)用。

研究領(lǐng)域與前景(續(xù))其二、是算法的研究。RS理論中研究領(lǐng)域與前景(續(xù))

其四、是與其他數(shù)學(xué)理論的聯(lián)系。從算子的觀點看RS理論,與之關(guān)系較緊的有拓?fù)淇臻g,數(shù)理邏輯,格與布爾代數(shù),模態(tài)邏輯,算子代數(shù)等。從構(gòu)造性和集合的觀點來看,它與概率統(tǒng)計、模糊數(shù)學(xué)、證據(jù)理論、圖論、信息論等聯(lián)系較為密切。RS理論研究不但需要以這些理論作為基礎(chǔ),同時也相應(yīng)地帶動這些理論的發(fā)展。隨著RS結(jié)構(gòu)與代數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論