信息表知識表達系統(tǒng)_第1頁
信息表知識表達系統(tǒng)_第2頁
信息表知識表達系統(tǒng)_第3頁
信息表知識表達系統(tǒng)_第4頁
信息表知識表達系統(tǒng)_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

13其次章信息表學(xué)問表達系統(tǒng)學(xué)問表達是智能信息系統(tǒng)的關(guān)鍵。所謂學(xué)問獵取,就是要從大量的原始數(shù)據(jù)信息中分析覺察有用的規(guī)律信息,即是將學(xué)問從一種原來的表達形式〔原始數(shù)據(jù)表達形式〕轉(zhuǎn)換為一種的目標(biāo)表達形式〔人Rough集理論的學(xué)問覺察,主要是借助于信息表這樣一種有效的數(shù)據(jù)表學(xué)問表達方式。本章就將介紹這種信息表學(xué)問表達系統(tǒng)。首先對學(xué)問利用分類的概念進展描述,然后對信息表描述的學(xué)問表達系統(tǒng)進展介紹,并加以形式化描述,再對決策表這種特別的信息表進展具體爭論,最終爭論與決策表相應(yīng)的決策規(guī)章。學(xué)問的分類概念學(xué)問是人類通過實踐,生疏到的客觀世界的規(guī)律性的東西,是人類實踐閱歷的總結(jié)和提煉,具有抽象和普遍的特性。學(xué)問是信息經(jīng)過加工處理、解釋、選擇和改造而形成的。學(xué)問是命題、規(guī)章等的集合。學(xué)問一般可分為說明性學(xué)問、過程性學(xué)問和掌握性學(xué)問。說明性學(xué)問供給概念和事實。例如,一個智能檢索系統(tǒng)中,說明性學(xué)問包括說明具體事實的數(shù)據(jù)庫內(nèi)容。用規(guī)章表示問題的學(xué)問稱作過程性學(xué)問。智能信息檢索系統(tǒng)中利用過程性學(xué)問處理說明性學(xué)問。用掌握策略表示問題的學(xué)問稱為掌握性學(xué)問。掌握性學(xué)問包含有關(guān)各種處理過程、策略和構(gòu)造的學(xué)問,常用來協(xié)調(diào)整個問題求解的過程。從認(rèn)知科學(xué)的一些觀點來看,可以認(rèn)為學(xué)問來源于人類以及其他物種的分類力量,本書中,我們認(rèn)為學(xué)問即是將對象進展分類的力量。上述的說明性學(xué)問可以認(rèn)為是對現(xiàn)實世界客觀個體的描述,即是區(qū)分客觀個體的學(xué)問;過程性學(xué)問實質(zhì)上是通過利用說明性學(xué)問對客觀個體進展分類的學(xué)問;而掌握性學(xué)問也是關(guān)于如何用過程性學(xué)問實現(xiàn)對客觀個體進展分類的學(xué)問,也可以認(rèn)為是關(guān)于對過程性學(xué)問的分類。假定我們起初對論域里的個體〔對象〕具有必要的信息或?qū)W問,通過這些學(xué)問能夠?qū)⑵鋭澐值讲煌念悇e。假設(shè)我們對兩個元素具有一樣的信息,則他們是不行區(qū)分的,即依據(jù)已有的信息不能夠?qū)⑵鋭澐珠_,明顯這是一種等價關(guān)系。通常,我們在對現(xiàn)實問題進展處理的時候,會將我們爭論的現(xiàn)實個體〔或稱元素、對象、樣本〕局限在某一個特定的區(qū)域范圍之內(nèi),這個區(qū)域內(nèi)的全部個體就組成問題的論域U。UX,都可稱之為UU中U的抽象學(xué)問,也簡稱學(xué)問,它也是代表了對U中個體的分類。這樣,學(xué)問就可以定義為:給定一組數(shù)據(jù)〔集合U和等價關(guān)系集合R,在等價關(guān)系集合R下對數(shù)據(jù)集合U的劃分,稱為學(xué)問U/U〔對U的分類,稱為關(guān)于U的學(xué)問庫UURU上的一族等價關(guān)系,依據(jù)這些等價關(guān)系就可以對U進展不同的劃分〔學(xué)問,每種劃分將把U分為不同的子集〔概念。設(shè)U是一個論域,R是U上的一個等價關(guān)系。U/R表示U上導(dǎo)出的全部等價類[x]表示包含元素x的R的等價類,x U一個學(xué)問庫RK={U,P}U是論域,PU上的一個等價關(guān)系簇。假設(shè)QP,且Q,則Q〔Q的全部等價關(guān)系的交〕也是一個等價關(guān)系,記作IND(Q)。定義2.1-1 設(shè)K=(U,P)和K=(U,Q)是兩個學(xué)問庫。假設(shè)1IND(P)=IND(QK和K或U和P)K或PQ)。學(xué)問庫KK1

1等價,意味著KK1

1具有一樣的根底類,因而它們具有一樣的表達力量。123123456個體編號頭疼肌肉疼體溫流感e是是正常否e是是高是e是是很高是e否是正常否e否否高否e否是很高是例2.1-1 表2.1-1所示的個體集合組成論域U其中包含6個個體每個個體是一個四元組,元組的每一維表示個體的一個屬性信息。這些個體都可以通過用其屬性學(xué)問來描述。例如一個個體可以代表其是否頭疼、是否肌肉疼、體溫是否正常、是否是流感。假設(shè)我們依據(jù)某一個屬性或多個屬性來描述這些個體,就可以得到不同的分類學(xué)問。依據(jù)頭疼來分類:U/頭疼={{e,e,e},{e,e,e}}1 2 3 4 5 6這里,e、e和e這三個個體在頭疼這個屬性上是不行區(qū)分的,1 2 3即他們一起構(gòu)成一個類,e、ee這三個個體構(gòu)成另一個類。4 5 6依據(jù)肌肉疼、體溫順流感這三個屬性分別來分類:U/肌肉疼={{e,e,e,e,e},{e}}1 2 3 4 6 5U/體溫={{e,e},{e,e},{e,e}}1 4 2 5 3 6U/流感={{e,e,e},{e,e,e}}1 4 5 2 3 6依據(jù)頭疼和肌肉疼這兩個屬性來共同分類:U/頭疼和肌肉疼={{e,e,e},{e,e},{e}}1 2 3 4 6 5依據(jù)頭疼和體溫這兩個屬性來共同分類:U/頭疼和體溫={{e},{e},{e},{e},{e},{e}}1 2 3 4 5 6依據(jù)頭疼和流感這兩個屬性來共同分類:U/頭疼和流感={{e},{e,e},{e,e},{e}}1 2 3 4 5 6由此,可以看出,我們可以用不同的標(biāo)準(zhǔn)來對論域進展分類,得到不同的概念和抽象,有的概念是我們需要的,有的概念是沒有價值的,學(xué)問獵取就是要探尋有用的概念,并得到概念之間的關(guān)系。信息表學(xué)問表達系統(tǒng)人之所以有智能行為是由于他們有學(xué)問。要讓機器具有智能行為的力量,就必需讓機器具有相應(yīng)的學(xué)問,它需要以人的學(xué)問作為其工作根底。學(xué)問表示就是要爭論用機器表示學(xué)問的可行的、有效的、通用的原則和方法。近年來學(xué)問表示的爭論引起了廣泛的留意。目前,常用的學(xué)問表示方法有規(guī)律模式、框架、語意網(wǎng)絡(luò)、產(chǎn)生式規(guī)章、狀態(tài)空間、劇本等,這些是學(xué)問工程需要爭論的內(nèi)容。本節(jié)中,我們將介紹一種基于信息表的學(xué)問表達形式,它是Rough集理論中對學(xué)問進展表達和處理的根本工具。在人工智能爭論中,一個實例〔現(xiàn)實世界中的一個對象、個體〕常常使用屬性-值對的集合來表示,實例集就是這樣的實例集合,記為U。U可被劃分為有限個類X

、X、、X1 2

,使得nXU,X,XX(ij)i,j=1,2,,n且XU。i i i j i信息表學(xué)問表達系統(tǒng)的根本成分是爭論對象的集合,關(guān)于這些對象的學(xué)問是通過指定對象的屬性〔特征〕和它們的屬性值〔特征值〕來描述的。一般地,一個信息表學(xué)問表達系統(tǒng)S可以表示為S=<U,R,V,f>。這里,U是對象的集合,也稱為論域,R=CD是屬性集合,子集C和D分別稱為條件屬性集和結(jié)果屬性集,V=

是屬性值的集合,Vr表示屬性rRr的值域,f:URV是一個信息函數(shù),它指定U中每一個對象x的屬性值。為了直觀便利,U也可以寫成一個表,縱軸表示實例標(biāo)記,橫軸表示實例屬性,實例標(biāo)記與屬性的交會點就是這個實例在這個屬性的值。這個表稱為信息表,是表達描述學(xué)問的數(shù)據(jù)表格。對于每個屬性子集BR,我們定義一個不行區(qū)分二元關(guān)系〔不清楚關(guān)系〕IND(B),即,IND(B)={(x,y)|(x,y)U2,

bB

(b(x)=b(y))}.明顯,IND(B)是一個等價關(guān)系,且IND(B) IND({b。bB每個子集BRBB為原始的,否則稱B為復(fù)合的。屬性B可以認(rèn)為是用等價關(guān)系〔在該屬性上的取值相等〕表示的學(xué)問的一個名稱,稱為標(biāo)識屬性。一個表可以看作是定義的一個等價關(guān)系簇,即學(xué)問庫。實際上,信息表這種數(shù)據(jù)表格學(xué)問表達系統(tǒng)是對客觀對象的描述和排列,表達的是屬于說明性的學(xué)問。當(dāng)信息表包含的數(shù)據(jù)足以反映論域的時候,通過屬性所對應(yīng)的等價關(guān)系就可以表達論域中的過程知識,即概念之間的規(guī)律關(guān)系或規(guī)章學(xué)問。事實上,從信息表所表達的說明性學(xué)問中覺察過程性學(xué)問〔規(guī)章學(xué)問〕就是學(xué)問覺察的爭論內(nèi)容。在對信息表進展進一步論述之前,我們先來看幾個信息表學(xué)問表達系統(tǒng)的例子。2.2-12.2-1給出了一個關(guān)于玩具積木的信息表。依據(jù)這個信息表,我們可以得到有關(guān)的概念描述,如將玩具積木依據(jù)顏色、外形和大小分別可以進展如下分類,得到有關(guān)玩具積木的概念學(xué)問:U/R

={{x,x,x},{x,x},{x,x,x}}1 1 3 7 2 4 5 6 8U/R={{x,x},{x,x},{x,x,x,x}}2 1 5 2 6 3 4 7 8U/R={{x,x,x,x,x},{x,x,x}}3 1 3 4 5 6 2 7 8這里,信息表中所包含的屬性集只有對對象〔積木〕進展描述的屬性。2.2-1樣本集樣本集顏色(R)xxxxxxxx1外形(R)2大小(R)312345678RedBlueRedBlueRoundYellowYellowRedYellowSquareTriangularTriangularRoundSquareTriangularTriangularSmallLargeSmallSmallSmallSmallLargeLarge例2.2-2 如表2.1-1所示的信息表,表示了流感病例的數(shù)據(jù)信息。有的病例屬于流感,有的病例不是流感。論域U={e,e,e,e,e,e},1 2 3 4 5 6它的屬性集可以分為條件屬性集C={頭疼,肌肉疼,體溫}和結(jié)果屬性{是,否},體溫的值域是{正常、高、很高},信息函數(shù)將每個對象的屬性取值映射到具體的屬性值上,例如f(e,1f(e,2從表2.1-1這可以形成諸如規(guī)章等形式的過程性學(xué)問,這是以后爭論學(xué)問獵取的時候?qū)⒁獱幷摰膯栴}。用信息表來表示學(xué)問,我們對系統(tǒng)的實際語意、表中的取值的具體含義內(nèi)容并不感興趣。實際上,表中的屬性值都是從現(xiàn)實問題中采集得到的,是對客觀對象屬性的抽象描述。我們以后將把信息表中的屬性值僅當(dāng)作數(shù)據(jù)來爭論。下面,我們再對決策表這種數(shù)據(jù)表格學(xué)問表達系統(tǒng)作形式化的爭論。決策表決策表是一類特別而重要的學(xué)問表達系統(tǒng),也是一種特別的信息表,它表示當(dāng)滿足某些條件時,決策〔行為、操作、掌握〕應(yīng)當(dāng)如何進展。決策表可以定義如下:2.3-1S=<U,R,V,f>,R=CD是屬性集合,子集CD分別稱為條件屬性集和結(jié)果屬性集,D。CDIND(C)IND(D)的等價類分別稱為條件類和決策類。一個決策表中的結(jié)果屬性有時是唯一的,稱為單一決策;有時是不唯一的,稱為多決策。對于具有多個結(jié)果屬性的決策表,我們可以通過如下兩種方法變換成為單一決策的決策表。方法一假設(shè)決策表S=<U,R,V,f>,R=CDCDD={d,d,,d

},則可以1將該決策表分解成為n個不同決策的單一決策表{S

2 n,S,,S},其中1 2 nS=<U,R,V,f,U是論域,RC{d是屬性集合,子集C和{d分別i i ii i i i稱為條件屬性集和結(jié)果屬性集,Vi

r

表示屬

的屬性值范圍,即屬性r的值域,f:URV

是信息函數(shù)。i i i i明顯,這種方法得到的每個單一決策表是通過將原決策表中其余決策〔結(jié)果屬性〕所對應(yīng)的列去掉而得到的的決策表。通常狀況下,這樣得到的單一決策表中會包含條件屬性和決策屬性取值完全一樣的重復(fù)記錄,還需要將這些重復(fù)記錄進一步合并為一個記錄。方法二假設(shè)決策表S=<U,R,V,f>,R=CDC和DD={d,d,,d},則可以1 2 n構(gòu)造一個的決策表S’=<U,R’,V’,f’>,U是論域,R’=C6611611,子集C和1666666分別稱為條件屬性集和的結(jié)果屬性集,V’=

rR’Vr

是屬性值的r

表示屬性rR’r的值域,f’:UR’V’是信息函數(shù)。這里,結(jié)果屬性d的取值要滿足如下要求: (d(x)=d(y)(d

(x)=d

(y)d

(x)=d

(y)d

(x)=d(y)))。x,yU

1 1 2 2 n n可以看出,這種方法是通過綜合多決策表中全部結(jié)果屬性的取值來形成一個綜合決策〔結(jié)果屬性值策問題的。在本書以后章節(jié)的爭論中,我們對于決策表,將只考慮單一決策表問題,因多決策表通常都是轉(zhuǎn)化為單一決策問題來解決的,這有利于問題的簡化和求解。下面用一個實例來說明多決策表轉(zhuǎn)化為單一決策表的方法。2.3-12.3-1所示的多決策表,此決策表可以通過方法一轉(zhuǎn)化為兩個單一決策表,表2.3-2和表2.3-3,通過方法二可以轉(zhuǎn)化為表2.3-4所示的單一決策表。這里,綜合d和決策d1

d有如下對應(yīng)關(guān)系:2d=1((d=+)(d=y)),1 2d=2((d=+)(d=n)),1d=3((d=-)(d

2=y)),1 2d=4((d=-)(d

=n))。1 2表2.3-1 多決策表 表2.3-2 單一決策表樣例12樣例1234567cc d d1 2 1 2abacbab1312213++--+-+yynynyn樣例12345c c d1 2 1abacb13122++--+2表2.3-3 單一決策表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論