版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、機器學(xué)習(xí)人工智能原理與應(yīng)用第1頁,共50頁,2022年,5月20日,2點19分,星期四 機器學(xué)習(xí)就是計算機自動獲取知識,它是知識工程的三個分支(使用知識、表實知識、獲取知識)之一。這一章將介紹機器學(xué)習(xí)的基本問題,包括:為什么研究機器學(xué)習(xí)、什么是機器學(xué)習(xí)、機器學(xué)習(xí)的發(fā)展歷史、學(xué)習(xí)的一個模型、機器學(xué)習(xí)的分類和機器學(xué)習(xí)的研究目標。 第2頁,共50頁,2022年,5月20日,2點19分,星期四6.1 概述 1.學(xué)習(xí)的概念 學(xué)習(xí)是人類具有的一種重要智能行為,但究竟什么是學(xué)習(xí),長期以來卻眾說紛紜。社會學(xué)家、邏輯學(xué)家和心理學(xué)家都各有其不同的看法。按照人工智能大師西蒙的觀點,學(xué)習(xí)就是系統(tǒng)在不斷重復(fù)的工作中對本
2、身能力的增強或者改進,使得系統(tǒng)在下一次執(zhí)行同樣任務(wù)或類似任務(wù)時,會比現(xiàn)在做得更好或效率更高。西蒙對學(xué)習(xí)給出的定義本身,就說明了學(xué)習(xí)的重要作用。 6.1.1 什么是機器學(xué)習(xí)第3頁,共50頁,2022年,5月20日,2點19分,星期四2、機器學(xué)習(xí) 什么叫做機器學(xué)習(xí)(machine learning)?至今,還沒有統(tǒng)一的“機器學(xué)習(xí)”定義,而且也很難給出一個公認的和準確的定義。為了便于進行討論和估計學(xué)科的進展,有必要對機器學(xué)習(xí)給出定義,即使這種定義是不完全的和不充分的。顧名思義,機器學(xué)習(xí)是研究如何使用機器來模擬人類學(xué)習(xí)活動的一門學(xué)科。稍為嚴格的提法是:機器學(xué)習(xí)是一門研究機器獲取新知識和新技能,并識別現(xiàn)
3、有知識的學(xué)問。這里所說的“機器”,指的就是計算機;現(xiàn)在是電子計算機,以后還可能是中子計算機、光子計算機或神經(jīng)計算機等等。 6.1 專家系統(tǒng)概述 6.1.1 什么是機器學(xué)習(xí)第4頁,共50頁,2022年,5月20日,2點19分,星期四1、機器學(xué)習(xí)速度驚人;2、機器學(xué)習(xí)可以把學(xué)習(xí)不斷地延續(xù)下去,避免大量的 重復(fù)學(xué)習(xí),使知識積累達到新的高度;3、機器學(xué)習(xí)有利于知識的傳播。6.1 專家系統(tǒng)概述 6.1.2 研究機器學(xué)習(xí)的意義第5頁,共50頁,2022年,5月20日,2點19分,星期四 自從50年代開始研究機器學(xué)習(xí)以來,在不同時期的研究途徑和目標也不同??梢詣澐秩齻€階段。其研究內(nèi)容分別為:神經(jīng)模型和決策理
4、論;符號概念獲??;知識加強和論域?qū)S脤W(xué)習(xí);連接學(xué)習(xí)的研究。各階段的區(qū)別主要在于學(xué)習(xí)系統(tǒng)中先驗知識的數(shù)量和系統(tǒng)中表實與修改知識的方法。 6.1 專家系統(tǒng)概述 6.1.3 機器學(xué)習(xí)的發(fā)展史第6頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.3 機器學(xué)習(xí)的發(fā)展史1、神經(jīng)模型和決策理論神經(jīng)模型途徑是要發(fā)展初始知識很少的通用學(xué)習(xí)系統(tǒng)。這類系統(tǒng)通常稱為神經(jīng)網(wǎng)或自組織系統(tǒng)。系統(tǒng)包括一個由互連的元件組成的網(wǎng)絡(luò)。這些元件類似于神經(jīng)元,它們實現(xiàn)簡單的邏輯功能,通常是閾值邏輯功能。這種系統(tǒng)的學(xué)習(xí)過程是逐步修改元件間的連接強度,一般是連續(xù)改變賦給這些連接的權(quán)值。系統(tǒng)的初始知識是選
5、定輸入元件、網(wǎng)絡(luò)結(jié)構(gòu)和初始連接強度。選定的輸入元件表實對象的選定的屬性。網(wǎng)絡(luò)結(jié)構(gòu)可能是任意的,或是設(shè)計者安排的,或是二者的混合。 (后續(xù))第7頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.3 機器學(xué)習(xí)的發(fā)展史(承上)這類學(xué)習(xí)系統(tǒng)包括Perceptron, Pandemonium和使用鑒別功能的學(xué)習(xí)系統(tǒng)。近期的例子是各種自適應(yīng)控制系統(tǒng)。這一領(lǐng)域的研究導(dǎo)致了在模式識別中的決策理論方法。這類研究有進化學(xué)習(xí)和遺傳學(xué)算法。這一領(lǐng)域的最新成果是連接機。這一類系統(tǒng)的主要特點是初始知識的層次低,且使用連續(xù)可變的參數(shù)進行學(xué)習(xí)。這類學(xué)習(xí)有數(shù)值化的特征,這與后兩類學(xué)習(xí)不同。后
6、兩類學(xué)習(xí)更強調(diào)產(chǎn)生和處理復(fù)雜的符號結(jié)構(gòu)。第8頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.3 機器學(xué)習(xí)的發(fā)展史2、符號概念獲?。⊿CA)這類學(xué)習(xí)過程是通過分析一些概念的正例和反例構(gòu)造出這些概念的符號表實。表實的形式一般是邏輯表達式、決策樹、產(chǎn)生式規(guī)則或語義網(wǎng)絡(luò)。某些系統(tǒng)已經(jīng)實用于不同的領(lǐng)域。例如ARCH(Winston, 1975),AQVAL(Michalski, 1975)和ID3(Quinlan, 1979)。第9頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.3 機器學(xué)習(xí)的發(fā)展史3、知識加強和論域?qū)S脤W(xué)習(xí)(K
7、DL)系統(tǒng)包括預(yù)先確定的概念、知識結(jié)構(gòu)、論域約束、啟發(fā)式規(guī)則和論域有關(guān)的變換。系統(tǒng)在開始并不具有所有的屬性或概念,在學(xué)習(xí)過程中系統(tǒng)應(yīng)得到一些新的屬性或概念。這個過程稱為構(gòu)造性的歸納。KDL和SCA之間的主要區(qū)別在于提供給系統(tǒng)的背景知識的數(shù)量和種類,也在于系統(tǒng)產(chǎn)生的知識結(jié)構(gòu)的豐度。這類學(xué)習(xí)系統(tǒng)一般是為專門的領(lǐng)域開發(fā)的,不能直接用于其它領(lǐng)域。這類系統(tǒng)的學(xué)習(xí)策略不僅有實例學(xué)習(xí),而且有類比學(xué)習(xí)、觀察和發(fā)現(xiàn)學(xué)習(xí)。這類系統(tǒng)的例子有Meta-DENDRAL和AM。 第10頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.3 機器學(xué)習(xí)的發(fā)展史(承上)許多系統(tǒng)體現(xiàn)出上述途徑的
8、組合。SCA和KDL途徑的一種組合就是基于可交換知識模塊的系統(tǒng)。這種系統(tǒng)把通用學(xué)習(xí)機理和定義與使用論域?qū)S弥R的功能組合起來。當要系統(tǒng)解決一個問題時,教師通過系統(tǒng)的知識表實功能給它提供論域?qū)S弥R。由于把通用推理功能從論域?qū)S弥R中分出來,所以一個學(xué)習(xí)系統(tǒng)可以用于很多不同論域,同時還可利用論域?qū)S弥R。這類系統(tǒng)有INDUCE它由實例學(xué)習(xí)對象的結(jié)構(gòu)描述。Winston的類比學(xué)習(xí)程序。LEX獲取和改進問題求解的啟發(fā)式。EURISKO發(fā)現(xiàn)新的啟發(fā)式。第11頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.3 機器學(xué)習(xí)的發(fā)展史4、連接學(xué)習(xí)的研究這一階段始于20世紀8
9、0年代中期,是一種以非線性大規(guī)模并行處理為主流的神經(jīng)網(wǎng)絡(luò)研究,該研究目前仍在繼續(xù)進行之中。第12頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.4 機器學(xué)習(xí)的主要策略 對機器學(xué)習(xí)的分類可以由下列幾方面進行:學(xué)習(xí)策略、知識表實和應(yīng)用領(lǐng)域。學(xué)習(xí)策略是學(xué)習(xí)中使用的推理方法。下面將按學(xué)習(xí)策略分類,以便系統(tǒng)介紹不同的方法。學(xué)習(xí)系統(tǒng)總是把環(huán)境提供的信息變換成新的形式,以便存貯和使用。這種變換的性質(zhì)確定了學(xué)習(xí)策略的類型。幾種基本策略是:機械學(xué)習(xí)(記憶學(xué)習(xí))、傳授學(xué)習(xí)、演繹學(xué)習(xí)、類比學(xué)習(xí)和歸納學(xué)習(xí)。歸納學(xué)習(xí)又分為實例學(xué)習(xí)、觀察與發(fā)現(xiàn)學(xué)習(xí)。這些策略是按變換復(fù)雜性遞增的次序排
10、列的。變換越復(fù)雜,學(xué)習(xí)者的工作越多,施教者的工作越少。人類的學(xué)習(xí)往往同時使用多種策略。這里劃分不同的策略,不僅是為了介紹不同的方法,而且是便于設(shè)計學(xué)習(xí)系統(tǒng)。雖然現(xiàn)有的學(xué)習(xí)系統(tǒng)還只使用單一的策略,多種策略系統(tǒng)也將受到重視。第13頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述1、 機械學(xué)習(xí)(記憶學(xué)習(xí)在機械學(xué)習(xí)(記憶學(xué)習(xí))中基本沒有變換。由施教者提供的信息或多或少被學(xué)習(xí)系統(tǒng)記憶和使用。這時環(huán)境提供的信息與執(zhí)行環(huán)節(jié)使用的信息有相同的水平,同樣的形式。實際上每臺計算機都可以看作是機械學(xué)習(xí)(記憶學(xué)習(xí)),因為它們都存貯用戶送入的程序。一個例子是Samuel的西洋象棋程序(195
11、6,1967),它記憶每個棋局以便提高下棋水平。 6.1.4 機器學(xué)習(xí)的主要策略第14頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.4 機器學(xué)習(xí)的主要策略2、 傳授學(xué)習(xí)(指點學(xué)習(xí))在傳授學(xué)習(xí)中,學(xué)習(xí)環(huán)節(jié)進行的變換只是對施教者提供的信息進行選擇和改造,這主要是在語法層的變換。這時環(huán)境提供的信息過于抽象,它的水平高于執(zhí)行環(huán)節(jié)所用信息的水平。學(xué)習(xí)環(huán)節(jié)把較高水平的知識變換為較低水平的知識。這種變換稱為實用化。實用化主要有下列步驟:由傳授的信息推出結(jié)論,作出假設(shè)以補充一些細節(jié)和確定何時需要進一步傳授。實用化過程類似于編譯系統(tǒng)把高級語言程序變換成機器碼程序。第一個例
12、子是McCarthy(1958)的系統(tǒng)。最近的系統(tǒng)有TEIRESLAS(Davis, 1976)和FOO(Mostow, 1979和1981)。第15頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.4 機器學(xué)習(xí)的主要策略3、 演繹學(xué)習(xí)在演繹學(xué)習(xí)中,學(xué)習(xí)系統(tǒng)由給定的知識進行演繹的保真推理,并存儲有用的結(jié)論。這種策略近幾年才作為一種獨立的學(xué)習(xí)策略。(Michalski, 1983)演繹學(xué)習(xí)包括知識改造、知識編譯、產(chǎn)生宏操作、保持等價的操作和它保真變換。第16頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.4 機器學(xué)習(xí)的主要
13、策略4、歸納學(xué)習(xí)在歸納學(xué)習(xí)中,變換過程是對輸入信息的一般化和選擇最合理的預(yù)期結(jié)果,這就是歸納推理。歸納學(xué)習(xí)可以分為以下實例學(xué)習(xí)、觀察與發(fā)現(xiàn)學(xué)習(xí)。(詳細介紹請參閱下頁)第17頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.4 機器學(xué)習(xí)的主要策略(1) 實例學(xué)習(xí)實例學(xué)習(xí)又稱為概念獲取,它的任務(wù)是確定概念的一般描述,這個描述應(yīng)解釋所有給定的正例并排除所有給定的反例。這些正反例是由信息源提供的,信息源可能是已經(jīng)知道概念的施教者,也可能是學(xué)生做實驗而系統(tǒng)從中得到反饋的環(huán)境。后者可稱為實驗學(xué)習(xí),包括由做學(xué)習(xí)和由問題求解學(xué)習(xí)。刺激反應(yīng)式學(xué)習(xí)也是一種實例學(xué)習(xí)。新對實例學(xué)習(xí)
14、的研究集中在兩個方面:例子一類型的一般化,部分一整體的一般化。在例子一類型的一般化中,提供給系統(tǒng)某一類對象的獨立的實例,系統(tǒng)的目標是歸納出這些類的一般描述。實例學(xué)習(xí)的多數(shù)研究集中在這一方面。對象可能是結(jié)構(gòu)化的部件、幾何形狀、疾病描述、故事、問題的解、控制算子等。在部分一整體的一般化中,任務(wù)是假設(shè)整個對象(情景,情況,過程)的描述,但只給定了對象的局部。例如,只給定一個房間的幾張局部的照片,要重構(gòu)房間的整個視圖。又如,只看到一個序列或過程的一部分,要確定描述該序列或過程的規(guī)則。第18頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.4 機器學(xué)習(xí)的主要策略(2)
15、觀察與發(fā)現(xiàn)學(xué)習(xí)觀察與發(fā)現(xiàn)學(xué)習(xí)又稱為描述的一般化。這類學(xué)習(xí)沒有實教者的學(xué)習(xí)幫助,它要產(chǎn)生解釋所有或大多數(shù)觀察的規(guī)律和規(guī)則。這類學(xué)習(xí)包括概念聚類、構(gòu)造分類、使方程符合數(shù)據(jù)、發(fā)現(xiàn)解釋觀察的定律和形成理論;遺傳學(xué)算法(Holland, 1986)和經(jīng)驗預(yù)測算法(Zagoruiko, 1976)可以看作這種策略的變種。實例學(xué)習(xí)是由正反例學(xué)習(xí),這些正反例是由施教者分類的。因此實例學(xué)習(xí)是有實教的學(xué)習(xí)。觀察與發(fā)現(xiàn)學(xué)習(xí)是由未經(jīng)分類的觀察學(xué)習(xí),或由系統(tǒng)自身的功能去發(fā)現(xiàn)。這是無實教的學(xué)習(xí)。第19頁,共50頁,2022年,5月20日,2點19分,星期四6.1 專家系統(tǒng)概述 6.1.4 機器學(xué)習(xí)的主要策略5、 類比學(xué)習(xí)
16、類比學(xué)習(xí)是演繹學(xué)習(xí)與歸納學(xué)習(xí)的組合。它匹配不同論域的描述,確定公共的子結(jié)構(gòu),以此作為類比映射的基礎(chǔ)。尋找公共子結(jié)構(gòu)是歸納推理,而實現(xiàn)類比映射是演繹推理。由提醒學(xué)習(xí)可以看作一種類比學(xué)習(xí)(Schank, 1982)。類比學(xué)習(xí)是由系統(tǒng)已有的某一領(lǐng)域知識得到另一領(lǐng)域中類似的知識。第20頁,共50頁,2022年,5月20日,2點19分,星期四6.2 機器學(xué)習(xí)系統(tǒng)的基本模型 一般把學(xué)習(xí)看作是建立理論,形成假設(shè)和進行歸納推理。理論能從本質(zhì)上更深刻地描述和解釋客觀現(xiàn)象,因此要建立理論。為了解釋一些特殊現(xiàn)象,往往要發(fā)現(xiàn)各種可能的假說。有時要從特殊的實例推導(dǎo)出一般的規(guī)律,即進行歸納推理。學(xué)習(xí)過程總是與環(huán)境和知識庫
17、有關(guān),因此可以用下圖所實的模型描述。 第21頁,共50頁,2022年,5月20日,2點19分,星期四6.2 機器學(xué)習(xí)系統(tǒng)的基本模型模型中包含學(xué)習(xí)系統(tǒng)的四個基本組成環(huán)節(jié)。環(huán)境和知識庫是以某種知識表實形式表達的信息的集合,分別代表外界信息來源和系統(tǒng)具有的知識。學(xué)習(xí)環(huán)節(jié)和執(zhí)行環(huán)節(jié)代表兩個過程。學(xué)習(xí)環(huán)節(jié)處理環(huán)境提供的信息,以便改善知識庫中的顯式知識。執(zhí)行環(huán)節(jié)利用知識庫中的知識來完成某種任務(wù),并把執(zhí)行中獲得的信息回送給學(xué)習(xí)環(huán)節(jié)。下面討論系統(tǒng)中各環(huán)節(jié)。第22頁,共50頁,2022年,5月20日,2點19分,星期四6.2 機器學(xué)習(xí)系統(tǒng)的基本模型 6.2.1 環(huán)境 環(huán)境可以是系統(tǒng)的工作對象,也可以包括工作對象
18、和外界條件。例如在醫(yī)療系統(tǒng)中,環(huán)境就是病人新的癥狀、檢驗的數(shù)據(jù)和病歷;在模式識別中,環(huán)境就是待識別的圖形或景物;在控制系統(tǒng)中,環(huán)境就是受控的設(shè)備或生產(chǎn)流程。就環(huán)境提供給系統(tǒng)的信息來說,信息的水平和質(zhì)量對學(xué)習(xí)系統(tǒng)有很大影響。信息的水平是指信息的一般性程度,也就是適用范圍的廣泛性。這里的一般性程度是相對執(zhí)行環(huán)節(jié)的要求而言。高水平信息比較抽象,適用于更廣泛的問題。低水平信息比較具體,只適用于個別的問題。環(huán)境提供的信息水平和執(zhí)行環(huán)節(jié)所需的信息水平之間往往有差距,學(xué)習(xí)環(huán)節(jié)的任務(wù)就是解決水平差距問題。(接下頁)第23頁,共50頁,2022年,5月20日,2點19分,星期四6.2 機器學(xué)習(xí)系統(tǒng)的基本模型 6
19、.2.1 環(huán)境(接上頁)如果環(huán)境提供較抽象的高水平信息,學(xué)習(xí)環(huán)節(jié)就要補充遺漏的細節(jié),以便執(zhí)行環(huán)節(jié)能用于具體情況。如果環(huán)境提供較具體的低水平信息,即在特殊情況執(zhí)行任務(wù)的實例,學(xué)習(xí)環(huán)境就要由此歸納出規(guī)則,以便用于完成更廣的任務(wù)。 信息的質(zhì)量是指:正確性、適當?shù)倪x擇和合理的組織。信息質(zhì)量對學(xué)習(xí)難度有明顯的影響。例如,若施教者向系統(tǒng)提供準確的實教例子,而且提供例子的次序也有利于學(xué)習(xí),則容易進行歸納。若實教例子中有干擾,或?qū)嵗拇涡虿缓侠?,則難以歸納。第24頁,共50頁,2022年,5月20日,2點19分,星期四6.2 機器學(xué)習(xí)系統(tǒng)的基本模型 6.2.3 知識庫影響學(xué)習(xí)系統(tǒng)設(shè)計的第二個因素是知識庫的形式
20、和內(nèi)容。知識庫的形式就是知識表實的形式。常用的知識表實方法有:特征向量、謂詞演算、產(chǎn)生式規(guī)則、過程、LISP函數(shù)、數(shù)字多項式、語義網(wǎng)絡(luò)和框架。選擇知識表實方法要考慮下列準則:可表達性、推理難度、可修改性和可擴充性。下面以特征向量和謂詞演算方法為例說明這些準則??杀磉_性方面特征向量適于描述缺乏內(nèi)在結(jié)構(gòu)的事物,它以一 個固定的特征集合來描述事物。謂詞演算則適于 描述結(jié)構(gòu)化的事物。 (后續(xù)) 6.2.2 學(xué)習(xí)環(huán)節(jié)(放到后面同執(zhí)行環(huán)節(jié)一同講解)第25頁,共50頁,2022年,5月20日,2點19分,星期四6.2 機器學(xué)習(xí)系統(tǒng)的基本模型 6.2.3 知識庫(承上)推理難度方面 一種常用的推理是比較兩個描
21、述是否等效。顯然 判定兩個特征向量等效較容易,判定兩個謂詞表 達式等效的代價就較大??尚薷男苑矫?特征向量和謂詞演算這類顯式的表實都容易修 改。過程表實等隱式的方法就難以修改,可擴充 性是指學(xué)習(xí)系統(tǒng)通過增加詞典條目和表實結(jié)構(gòu)來 擴大表實能力,以便學(xué)習(xí)更復(fù)雜的知識。一個例 子是AM(Lenat, 1983),它可根據(jù)老概念定義 新概念。知識庫的內(nèi)容中,初始知識是很重要的。它總要利用初始知識去理解環(huán)境提供的信息,以便形成和改進假設(shè)。學(xué)習(xí)系統(tǒng)實質(zhì)上是對舊知識庫的擴充和完善。第26頁,共50頁,2022年,5月20日,2點19分,星期四6.2 機器學(xué)習(xí)系統(tǒng)的基本模型 6.2.2 學(xué)習(xí)環(huán)節(jié) 與 6.2.
22、4 執(zhí)行環(huán)節(jié) 學(xué)習(xí)環(huán)節(jié)的目的就是改善執(zhí)行環(huán)節(jié)的行為。執(zhí)行環(huán)節(jié)的復(fù)雜性、反饋和透明度都對學(xué)習(xí)環(huán)節(jié)有影響。復(fù)雜的任務(wù)需要更多的知識。二分分類是最簡單的任務(wù),只需一條規(guī)則。某個玩樸克的程序有約20條規(guī)則。在由實例學(xué)習(xí)中,可以按任務(wù)復(fù)雜性分成三類。一類是基于單一概念或規(guī)則的分類或預(yù)測。一類是包含多個概念的任務(wù)。一類是多步執(zhí)行的任務(wù)。執(zhí)行環(huán)節(jié)給學(xué)習(xí)環(huán)節(jié)的反饋也很重要。學(xué)習(xí)系統(tǒng)都要用某種方法去評價學(xué)習(xí)環(huán)節(jié)推薦的假設(shè)。一種方法是用獨立的知識庫作這種評價。例如AM程序用一些啟發(fā)式規(guī)則評價學(xué)到的新概念的重要性。另一種方法是以環(huán)境作為客觀的執(zhí)行標準,系統(tǒng)判定執(zhí)行環(huán)節(jié)是否按預(yù)期標準工作,由此反饋信息評價當時的假設(shè)。
23、若執(zhí)行環(huán)節(jié)有較好的透明度,學(xué)習(xí)環(huán)節(jié)就容易追蹤執(zhí)行環(huán)節(jié)的行為。第27頁,共50頁,2022年,5月20日,2點19分,星期四6.3 機械學(xué)習(xí)(記憶學(xué)習(xí)) 記憶學(xué)習(xí)(Rote Learning)又稱為機械學(xué)習(xí)或死記硬背學(xué)習(xí)。這種學(xué)習(xí)直接記憶環(huán)境提供的新知識,并直接使用它們,對它們不作任何變換。對于記憶學(xué)習(xí)有兩種極端的觀點。一種觀點認為,存儲對任何智能程序都是必要的、基本的,它不是獨立的學(xué)習(xí)過程,不必要專門研究。另一種觀點認為,存儲是一個復(fù)雜問題,對任何認知系統(tǒng)都是必要的,因此要詳細研究并模型化。一種折衷的觀點認為,一般學(xué)習(xí)系統(tǒng)不會只是記憶學(xué)習(xí),但記憶學(xué)習(xí)是任何學(xué)習(xí)系統(tǒng)的一部分。任何學(xué)習(xí)系統(tǒng)都要存儲
24、和使用它獲取的知識,因此要建立記憶學(xué)習(xí)過程,以便存放和讀取知識庫中的知識。第28頁,共50頁,2022年,5月20日,2點19分,星期四6.3 機械學(xué)習(xí)(記憶學(xué)習(xí)) 6.3.1 機械學(xué)習(xí)(記憶學(xué)習(xí))的過程 Lenat(1979)提出一種獨特的觀點,他把記憶學(xué)習(xí)看作最低層次的數(shù)據(jù)處理。他劃分的數(shù)據(jù)處理層次如圖7.1所實。如果一個計算結(jié)果有普遍意義,就存儲起來。這就把計算任務(wù)簡化為存取任務(wù)。記憶是簡化數(shù)據(jù)處理,以空間換取時間的手段。 圖7.1 數(shù)據(jù)處理的層次 第29頁,共50頁,2022年,5月20日,2點19分,星期四6.3 機械學(xué)習(xí)(記憶學(xué)習(xí)) 6.3.2 機械學(xué)習(xí)(記憶學(xué)習(xí))系統(tǒng)主要考慮的問
25、題 機械學(xué)習(xí)(記憶學(xué)習(xí))(記憶學(xué)習(xí))的設(shè)計要考慮三個問題:存儲結(jié)構(gòu)、穩(wěn)定性和記憶與計算的權(quán)衡。1.存儲結(jié)構(gòu)只有讀取所用時間少于重新計算所用時間時,機械學(xué)習(xí)(記憶學(xué)習(xí))(記憶學(xué)習(xí))才有實用價值。為了快速讀取存儲的內(nèi)容,就要合理組織存儲結(jié)構(gòu)。在數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)庫等領(lǐng)域已經(jīng)詳盡研究了排序、檢索和雜湊方法等有關(guān)問題。2.環(huán)境穩(wěn)定性使用機械學(xué)習(xí)(記憶學(xué)習(xí))(記憶學(xué)習(xí))時,總是認為保存的信息以后仍然有效。如果環(huán)境變化快,保存的信息就會失效而不能再使用。例如記憶的50年代汽車修理費用不能用來估計80年代汽車修理費用。解決方法是隨時監(jiān)視環(huán)境的變化,不斷更新保存的信息。第30頁,共50頁,2022年,5月20日,
26、2點19分,星期四6.3 機械學(xué)習(xí)(記憶學(xué)習(xí)) 6.3.2 機械學(xué)習(xí)(記憶學(xué)習(xí))系統(tǒng)主要考慮的問題3.記憶與計算的權(quán)衡為了確定是利用存儲的信息還是重新計算,要比較二者的代價。例如在數(shù)學(xué)用表中有三角函數(shù)表,可直接查表不必計算。因為計算比查表復(fù)雜。但在數(shù)學(xué)用表中不列出兩數(shù)乘積表,因計算并不復(fù)雜。可用兩種方法選擇是記憶還是計算。一種是代價效益分析法。它在首次得到一個信息時,確定是否有必要保存它。這時要考慮該信息以后使用的概率、存儲空間和計算代價。另一種是有選擇的放棄。保存的內(nèi)容在讀取時加上時間標志,這就是最后使用的時間。保存一項新內(nèi)容時,要刪除一項舊內(nèi)容,這是未使用的時間最長的舊內(nèi)容。第31頁,共5
27、0頁,2022年,5月20日,2點19分,星期四6.4 傳授式學(xué)習(xí) 傳授學(xué)習(xí)(Learning by Being Told或Learning by Instruction)又稱為指點學(xué)習(xí)。這時,環(huán)境提供的信息較抽象,水平較高,學(xué)習(xí)環(huán)節(jié)把這些信息變換成執(zhí)行環(huán)節(jié)使用的較低水平的信息。1.要求這是請求專家提出建議。有時對專家的要求是簡單的,即請專家提供一般的建議。有時要求是復(fù)雜的,即請專家識別知識庫的欠缺,并提出修改方法。有些系統(tǒng)是被動的,它消極等待專家提出建議。有些系統(tǒng)是主動的,它把專家注意力引向特定的問題。2.解釋這是把專家建議轉(zhuǎn)成內(nèi)部表實,是知識表實問題。內(nèi)部表實應(yīng)包含建議的全部信息。如果用自
28、然語言提出建議,解釋過程應(yīng)包括自然語言理解。 第32頁,共50頁,2022年,5月20日,2點19分,星期四6.4 傳授式學(xué)習(xí)3.實用化這是傳授學(xué)習(xí)的信息變換過程,它把抽象的建議轉(zhuǎn)成具體的知識。實用化過程類似于自動程序設(shè)計。前者由建議得到實用的規(guī)則,后者由程序說明得到程序。二者也存在差別。后者要求得到完全正確的程序,強調(diào)程序的正確性。前者往往使用弱方法,不保證完全正確。實用化過程有時作試探性的假設(shè)和近似,只能要求其合理性。得到的假設(shè)還要經(jīng)過檢驗和修改。4.歸并這是把新知識加入知識庫。這有可能造成舊知識的錯誤使用。一個問題是新舊知識適用范圍的重迭。另一個問題是它們結(jié)論的沖突。如果新舊規(guī)則的條件部
29、分重迭,就會在該使用舊規(guī)則時錯誤使用了新規(guī)則??梢孕薷囊?guī)則條件以防止重迭,也可以用元規(guī)則對規(guī)則排序。為了解決結(jié)論的沖突??梢孕薷囊?guī)則,也可以用元規(guī)則選用合理的規(guī)則,排除不合理的。 第33頁,共50頁,2022年,5月20日,2點19分,星期四6.4 傳授式學(xué)習(xí)5.評價實用化得到的新知識往往是假設(shè),要經(jīng)過驗證和修改。如果評價中發(fā)現(xiàn)了問題,要進行故障分析和知識庫修改。上述五步中,實用化是過程的核心。正是在這一步實現(xiàn)信息水平的變換。Mostow(1981)按用途、論域和精度對實用化方法進行了分類,還給出實用化的13個例子。有的例子要經(jīng)過約100次變換,有的只要8次變換。傳授學(xué)習(xí)的例子有Mostow的
30、FOO和Davis的TEIRESLAS。TEIRESLAS通過和用戶對話,把用戶的一般性意見或指實具體化,或輔助用戶修改知識庫。該程序用產(chǎn)生式規(guī)則來選擇合適的投資市場。 第34頁,共50頁,2022年,5月20日,2點19分,星期四6.5 類比學(xué)習(xí) 類比學(xué)習(xí)(Learning by Analogy)是獲取新概念或新技巧的方法,它把類似這些新概念或新技巧的已知知識轉(zhuǎn)換為適于新情況的形式。類比學(xué)習(xí)的第一步是從記憶中找到類似的概念或技巧,第二步是把它們轉(zhuǎn)換為新形式以便用于新情況。例如人類的一種學(xué)習(xí)方式是先由老師教學(xué)生解例題(先例),再給學(xué)生留習(xí)題。學(xué)生尋找在例題和習(xí)題間的對應(yīng)關(guān)系,利用解決例題的知識
31、去解決習(xí)題中的問題。學(xué)生經(jīng)過一般化歸納推出原理,以便以后使用。這種類比學(xué)習(xí)方式是人類常用的。第35頁,共50頁,2022年,5月20日,2點19分,星期四6.5 類比學(xué)習(xí) 6.5.1 學(xué)習(xí)新概念 利用類比學(xué)習(xí)方法學(xué)習(xí)新概念或新技巧時,它要把類似這些新概念或新技巧的已知知識轉(zhuǎn)化為適于新情況的形式。第36頁,共50頁,2022年,5月20日,2點19分,星期四6.5 類比學(xué)習(xí) 6.5.2 學(xué)習(xí)問題的求解方法問題求解基本過程: 1.比較新狀態(tài)與目標狀態(tài)。 2.選擇可以減小這個差異的操作。 3.如果前提滿足就使用這個操作,否則保存新狀態(tài),并用中間結(jié)局 分析解決子問題,以便實現(xiàn)未滿足的前提。 4.在解決
32、子問題后,再取出保存的狀態(tài),繼續(xù)處理原問題。 轉(zhuǎn)換類比學(xué)習(xí)主要有兩步:回憶過程和變換過程?;貞涍^程用于找出新舊問題間的差別,包括: 1.新問題與舊問題的初始狀態(tài)之間的差異。 2.新問題與舊問題的目標狀態(tài)之間的差異。 3.新問題與舊問題的路徑約束之間的差異。 4.滿足新問題的操作前提在全部前提中的比例,稱為候選解的可用性。第37頁,共50頁,2022年,5月20日,2點19分,星期四6.6 歸納學(xué)習(xí) 6.6.1 實例學(xué)習(xí) 實例學(xué)習(xí)是通過從環(huán)境中取得若干與某概念有關(guān)的例子,經(jīng)歸納得出一般性概念的一種學(xué)習(xí)方法。在這種學(xué)習(xí)方法中,外部環(huán)境(教師)提供的是一組例子(正例和反例),這些例子實際上是一組特殊
33、的知識,每一個例子表達了僅適用于該例子的知識,實例學(xué)習(xí)就是要從這些特殊知識中歸納出適用于更大范圍的一般性知識,它將覆蓋所有的正例并排除所有反例。例如,如果我們用一批動物作為實例,并且告訴學(xué)習(xí)系統(tǒng)哪一個動物是“馬”,哪一個動物不是,當實例足夠多時,學(xué)習(xí)系統(tǒng)就能一般出關(guān)于“馬”的概念模型,使自己能識別馬,并且能把馬與其它動物區(qū)別開來,這一學(xué)習(xí)過程就是實例學(xué)習(xí)。 第38頁,共50頁,2022年,5月20日,2點19分,星期四6.6 歸納學(xué)習(xí) 6.6.1 實例學(xué)習(xí)實例學(xué)習(xí)的兩個空間模型第39頁,共50頁,2022年,5月20日,2點19分,星期四6.6 歸納學(xué)習(xí) 6.6.2 觀察與發(fā)現(xiàn)學(xué)習(xí)1、概念聚類
34、概念聚類就是一種觀察學(xué)習(xí);人類觀察周圍的事物,對比各種物體的特性,把它們劃分成動物、植物和非生物,并給出每一類的定義。這種把觀察的事物劃分成幾類并建立相應(yīng)概念的過程就是概念聚類。傳統(tǒng)的聚類分析方法是基于對象相似性的數(shù)值測度。這種測度沒有考慮到綜合特征或描述類型的概念。因此得到的分類缺乏概念描述,并且難以解釋。為解決這個問題,產(chǎn)生了概念聚類方法。 第40頁,共50頁,2022年,5月20日,2點19分,星期四6.6 歸納學(xué)習(xí) 6.6.2 觀察與發(fā)現(xiàn)學(xué)習(xí)2、發(fā)現(xiàn)學(xué)習(xí)發(fā)現(xiàn)學(xué)習(xí)是由系統(tǒng)的初始知識和觀察的數(shù)據(jù)學(xué)習(xí)數(shù)學(xué)、物理和化學(xué)等方面的概念和規(guī)律。它也使用歸納推理,但是在學(xué)習(xí)過程中除了初始知識外施教者不
35、進行指導(dǎo),所以它也是無實教的歸納學(xué)習(xí)。一類發(fā)現(xiàn)系統(tǒng)是數(shù)學(xué)發(fā)現(xiàn)系統(tǒng),典型的系統(tǒng)是AM。本文將介紹這個系統(tǒng)。另一類發(fā)現(xiàn)系統(tǒng)是發(fā)現(xiàn)物理化學(xué)規(guī)律的系統(tǒng)。有些這種系統(tǒng)主要由觀察的數(shù)據(jù)學(xué)習(xí),這些觀察可以看作正例。所以它們也可以作為實例學(xué)習(xí)。第二類系統(tǒng)的例子有:發(fā)現(xiàn)定量規(guī)律的系統(tǒng)BACON.6,發(fā)現(xiàn)定性規(guī)律的系統(tǒng)GLAUBER,確定化學(xué)反應(yīng)用物質(zhì)成分的系統(tǒng)STAHL和形成化學(xué)反應(yīng)結(jié)構(gòu)模型的系統(tǒng)DALTON。第41頁,共50頁,2022年,5月20日,2點19分,星期四6.7 基于解釋的學(xué)習(xí) 基于解釋學(xué)習(xí)(Explanation-Based Leaning,簡稱EBL)起源于經(jīng)驗學(xué)習(xí)的研究。50年代未,對神經(jīng)
36、元的模擬中發(fā)明了用一種符號來標記另一些符號的存儲結(jié)構(gòu)模型,這是早期的存儲塊(chunks)概念。在象棋大師的頭腦中就保存著在各種情況下對弈經(jīng)驗的存儲塊。80年代初,Newell和Rosenbloom認為,通過獲取任務(wù)環(huán)境中關(guān)于模型問題的知識,可以改進系統(tǒng)的性能,chunks可以作為對人類行為進行模擬的模型基礎(chǔ)。通過觀察問題求解過程,獲取經(jīng)驗chunks,用其代替各個子目標中的復(fù)雜過程,可以明顯提高系統(tǒng)求解的速度。由此奠定了經(jīng)驗學(xué)習(xí)的基礎(chǔ)。第42頁,共50頁,2022年,5月20日,2點19分,星期四6.7 基于解釋的學(xué)習(xí) 6.7.1 基于解釋學(xué)習(xí)的工作原理 Mitchell等人把基于解釋的學(xué)習(xí)
37、過程定義為兩個步驟:(1) 通過求解一個例子來產(chǎn)生解釋結(jié)構(gòu);(2) 對該解釋結(jié)構(gòu)進行一般化,獲取一般的控制規(guī)則。 其具體過程如下:(1)產(chǎn)生解釋。用戶輸入實例后,系統(tǒng)首先進行問題求解。如由目標引導(dǎo)反向推理,從領(lǐng)域知識庫中尋找有關(guān)規(guī)則,使其后件與目標匹配。找到這樣的規(guī)則后,就把目標作為后件,該規(guī)則作為前件,并記錄這一因果關(guān)系。然后以規(guī)則的前件作為子目標,進一步分解推理。如此反復(fù),沿著因果鏈,直到求解結(jié)束。一旦得到解,便證明了該例的目標可滿足,并獲得了證明的因果解釋結(jié)構(gòu)。 (后續(xù))第43頁,共50頁,2022年,5月20日,2點19分,星期四6.7 基于解釋的學(xué)習(xí) 6.7.1 基于解釋學(xué)習(xí)的工作原理(承上)構(gòu)造解釋結(jié)構(gòu)通常有兩種方式:一是將問題求解的每一步推理所用的算子匯集,構(gòu)成動作序列作為解釋結(jié)構(gòu);另一種是自頂向下的遍歷證明樹結(jié)構(gòu)。前者比較一般,略去了關(guān)于實例的某些事實描述;后者比較細致,每個事實都出現(xiàn)在證明樹中。解釋的構(gòu)造可以在問題求解的同時進行,也可在問題求解結(jié)束后,沿著解路徑進行。這兩種方式形成了邊解邊學(xué)(Learning while doing)和解完再學(xué)(Learning by solving)兩種方法。(2)對得到的解釋結(jié)構(gòu)以及事件進行一般。在這一步,通常采取的辦法是將常量轉(zhuǎn)換為變量,即把例子中的某些
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年車輛以租代購產(chǎn)權(quán)轉(zhuǎn)移協(xié)議版B版
- 2024版地下室防水施工協(xié)議3篇
- 專業(yè)噴漆團隊修理廠承包合同書版B版
- 2025年度網(wǎng)絡(luò)安全防護合同范本:信息安全合作協(xié)議3篇
- 2024廢鋼居間合同范本
- 2024重慶市民離婚協(xié)商一致合同樣本版B版
- 行車理論知識培訓(xùn)課件
- 2024年高速公路交通信號燈施工合同
- 熟食類食品知識培訓(xùn)課件
- 鋁擠壓修模知識培訓(xùn)課件
- 空調(diào)年度巡檢報告范文
- 線上推廣授權(quán)合同范例
- 保定學(xué)院《大學(xué)英語》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024-2025學(xué)年九年級語文上冊部編版期末綜合模擬試卷(含答案)
- 鄉(xiāng)村振興暨干部素質(zhì)提升培訓(xùn)班學(xué)習(xí)心得體會
- 靜脈輸液反應(yīng)急救流程
- IATF16949:2024標準質(zhì)量手冊
- 反詐知識競賽題庫及答案(共286題)
- 2025屆江蘇省淮安市高三一模語文試題講評課件
- 青島版二年級下冊數(shù)學(xué)三位數(shù)退位減法豎式計算題200道及答案
- 2024-2025年高考英語全國卷分類匯編之完型填空
評論
0/150
提交評論