人工智能通識教程 第2版 課件 第3、4章 大數(shù)據(jù)與人工智能、智能體與智能代理_第1頁
人工智能通識教程 第2版 課件 第3、4章 大數(shù)據(jù)與人工智能、智能體與智能代理_第2頁
人工智能通識教程 第2版 課件 第3、4章 大數(shù)據(jù)與人工智能、智能體與智能代理_第3頁
人工智能通識教程 第2版 課件 第3、4章 大數(shù)據(jù)與人工智能、智能體與智能代理_第4頁
人工智能通識教程 第2版 課件 第3、4章 大數(shù)據(jù)與人工智能、智能體與智能代理_第5頁
已閱讀5頁,還剩174頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第2版人工智能通識教程第3章周蘇教授QQ:81505050大數(shù)據(jù)與人工智能導(dǎo)讀案例:電子商務(wù)的推薦系統(tǒng)知道人們?yōu)槭裁磳@些信息感興趣可能是有用的,但這個問題目前并不是很重要。但是,知道“是什么”可以創(chuàng)造點擊率,這種洞察力足以重塑很多行業(yè),不僅僅只是電子商務(wù)。01什么是模糊邏輯02模糊邏輯系統(tǒng)03數(shù)據(jù)思維與變革04大數(shù)據(jù)與人工智能目錄/CONTENTS模糊邏輯模仿人腦的不確定性概念判斷和推理思維方式,對于模型未知或不能確定的描述系統(tǒng)等,應(yīng)用模糊集合和模糊規(guī)則進(jìn)行推理,表達(dá)過渡性界限或定性知識經(jīng)驗,實行模糊綜合判斷,推理解決常規(guī)方法難于對付的規(guī)則型模糊信息問題。

圖3-1模糊推理過程第3章大數(shù)據(jù)與人工智能大數(shù)據(jù)是人工智能的基礎(chǔ)。大數(shù)據(jù)時代,人們對待數(shù)據(jù)的思維方式主要發(fā)生了以下三個變化:第一,人們處理的數(shù)據(jù)從樣本數(shù)據(jù)變成全部數(shù)據(jù);第二,由于是全樣本數(shù)據(jù),人們不得不接受數(shù)據(jù)的混雜性,而放棄對精確性的追求;第三,人們通過對大數(shù)據(jù)的處理,減少對因果關(guān)系的渴求,轉(zhuǎn)而關(guān)注相關(guān)關(guān)系。第3章大數(shù)據(jù)與人工智能PART01什么是模糊邏輯計算機(jī)的二進(jìn)制邏輯通常只有兩種狀態(tài),一句陳述要么是真要么是假,然而,現(xiàn)實生活中卻很少有這么一刀切的情況。一個人如果不餓不一定就是餓,有點餓和餓昏頭不是一回事兒,有點冷比凍僵了的程度也要輕得多。如果我們將含義的所有層次都納入考慮范疇,那么寫入計算機(jī)程序的規(guī)則將會變得過分的復(fù)雜難懂。3.1什么是模糊邏輯昆蟲有許多本能幫助其應(yīng)對不同環(huán)境。它可能傾向于遠(yuǎn)離光線,隱藏在樹葉和巖石下,這樣不容易被捕食者發(fā)現(xiàn)。然而,它也會朝食物移動,否則就會餓死。如果我們要制作一個甲蟲機(jī)器人,可以考慮賦予其如下規(guī)則:如果光線亮度高于50%,食物質(zhì)量低于50%,那么遠(yuǎn)離,否則接近。圖3-2甲蟲機(jī)器人3.1.1甲蟲機(jī)器人的規(guī)則如果食物和光線所占百分比一致會怎么樣?吃飽了的昆蟲會為了保持安全繼續(xù)藏匿在黑暗中,而饑餓的昆蟲就會冒險去接近食物。光越亮,越危險;食物質(zhì)量越高,昆蟲越容易冒險。我們可以根據(jù)這一情況制定出更多規(guī)則,例如:如果饑餓和光線高于75%,食物質(zhì)量低于25%,那么遠(yuǎn)離,否則接近。3.1.1甲蟲機(jī)器人的規(guī)則但是這些規(guī)則都無法很好把握極值。如果光線為76%,食物質(zhì)量為24%,機(jī)器人就會餓死,雖然這僅僅與所設(shè)置的規(guī)則相差1%。當(dāng)然,我們也可以設(shè)置更多規(guī)則來應(yīng)對極值和特殊情況,但這樣的操作很快就會把程序變成無法理解的一團(tuán)亂麻??墒?,在不讓其變復(fù)雜的前提下,怎么能夠處理所有變數(shù)呢?3.1.1甲蟲機(jī)器人的規(guī)則假設(shè)我們正在經(jīng)營一家婚姻介紹所。一個客戶的要求是高個子但不富有的男子。我們的記錄中有一名男子,身高1.78米,年收入是全國平均水平的兩倍。應(yīng)該將這名男子介紹給客戶嗎?如何判斷什么是個子高?什么是富有?怎樣對資料庫中的男子進(jìn)行打分來找到最符合的對象?身高和收入之間不能簡單加減,就像蘋果和橙子不能混為一談一樣。3.1.2模糊邏輯的發(fā)明模糊邏輯的發(fā)明就是為了解決這類問題。在常規(guī)邏輯中,上述規(guī)則的情況只有兩種,不是對就是錯,即不是1就是0。要么有光要么沒有光,要么高要么不高。而在模糊邏輯中,每一個情況的真值可以是0到1中間的任何值。假定身高超過2米的男子是絕對的高個子,身高低于1.7米的為不高,那么1.78米高的客戶可以算作0.55高,既不是特別高但是也不矮。要計算他不高的程度,用1減去高的程度即可。因此,該男子是0.55高,也就是0.45不高。3.1.2模糊邏輯的發(fā)明我們同樣可以對“矮”的范疇進(jìn)行界定。身高低于1.6米是絕對的矮個子,身高超過1.75米為不矮。由此可以發(fā)現(xiàn)“高”和“矮”的定義有一部分是重疊的,也就意味著處于中間值的人在某種程度上來說是高,而在另一種程度上來說是矮?!鞍焙汀安桓摺笔莾蓚€概念,“高”“矮”“不高”和“不矮”對應(yīng)的值都是不同的。類似地,我們也可以說他是0.2富有,也就是0.8不富有。女性客戶的要求是“高AND(和)不富有”,所以我們需要計算“0.55AND0.8”,結(jié)果是0.44。通過檢索所有各選項,找到得分最高者就可以介紹給客戶了。3.1.2模糊邏輯的發(fā)明在模糊邏輯中進(jìn)行“AND”與“OR”運算時計算方法不同,如何選擇應(yīng)當(dāng)根據(jù)數(shù)字所起的作用決定。本例中是將兩個數(shù)字相乘。另一種純數(shù)學(xué)方式就是選擇二者中的最小值。然而,如果采取這樣的方式,較大的值將不影響結(jié)果。同樣身高的男子,一個0.5不富有,另一個0.8不富有,其運算結(jié)果都是一樣的。同樣,我們也可以為甲蟲機(jī)器人設(shè)置規(guī)則,如果饑餓并且光線不太亮,那么就朝食物進(jìn)發(fā)。這些例子展示了可以利用模糊邏輯解決的問題類型。3.1.2模糊邏輯的發(fā)明專家系統(tǒng)是利用人類專長建立起來的,可以提供程序使用的明確規(guī)則。系統(tǒng)可能會說“如果溫度高于95度超過兩分鐘,或是高于97度超過一分鐘,那么可以斷定恒溫器損壞”。但是更多情況下它們會說“如果溫度過高的情況持續(xù)太久,那么恒溫器可能已經(jīng)損壞”。這時需要由程序員負(fù)責(zé)填進(jìn)具體數(shù)字。而利用模糊邏輯,則完全可以制定與專家所言一致的規(guī)則。3.1.3制定模糊邏輯的規(guī)則如果溫度過高并且溫度過高的時間過長,那么恒溫器已經(jīng)損壞。程序?qū)Α昂銣仄饕呀?jīng)損壞”這一命題進(jìn)行賦值,取值在0到1之間。如果溫度只是稍微偏高并且沒有持續(xù)太長時間,那么命題真值可能約為0.1,即不太可能。而其他規(guī)則得出的值可能更高。比如,假設(shè)另一條規(guī)則判定輸入冷卻器損壞真值為0.95,那么程序?qū)蟾嬖斐晒收献钣锌赡艿脑蚓褪禽斎肜鋮s器,這些數(shù)據(jù)被稱作可能性。與概率不同,0.1并不意味著恒溫器有10%的概率已經(jīng)損壞。高個子真值0.55也只代表他個子高的可能性,這僅僅是我們衡量可能性的一種方式。類似地,如果是10%肯定恒溫器損壞,如果是95%肯定問題出在輸入冷卻器。3.1.3制定模糊邏輯的規(guī)則更加復(fù)雜的專家系統(tǒng)可能用于決定銀行是否應(yīng)該向客戶提供貸款,規(guī)則如下:如果薪水高并且工作穩(wěn)定性高,那么風(fēng)險低。如果薪水低或者工作穩(wěn)定性低,那么風(fēng)險中等。如果信用評分低,那么風(fēng)險高。這一部分程序可能得出以下數(shù)據(jù):風(fēng)險低=0.1風(fēng)險中等=0.3風(fēng)險高=0.73.1.3制定模糊邏輯的規(guī)則通過數(shù)學(xué)算法,這三組數(shù)據(jù)可以轉(zhuǎn)化為評估風(fēng)險的單個數(shù)字,這一過程被稱為去模糊化。從上述數(shù)據(jù)我們還是可以看出借貸的風(fēng)險程度可能為中等偏上。3.1.3制定模糊邏輯的規(guī)則模糊邏輯的另一用途就是控制機(jī)械裝置,例如控制供暖系統(tǒng)的部分規(guī)則如下:如果溫度高,那么停止供暖。如果溫度非常低,那么加強(qiáng)供暖。如果溫度低并且升溫慢,那么加強(qiáng)供暖。如果溫度低并且升溫快,那么中等供暖。如果溫度稍微偏低并且升溫慢,那么中等供暖。如果溫度稍微偏低并且升溫快,那么停止供暖。3.1.3制定模糊邏輯的規(guī)則運行所有這些規(guī)則后,我們可以得到應(yīng)該停止供暖、中等供暖,以及加強(qiáng)供暖等的可能性。將這些可能性轉(zhuǎn)化為單個數(shù)據(jù)后就可以相應(yīng)地設(shè)置加熱器了。模糊控制系統(tǒng)管控設(shè)備狀態(tài),并生成控制信號不斷調(diào)整以維持理想狀態(tài)。在設(shè)備非線性的情況下,某種控制可能因設(shè)備狀態(tài)產(chǎn)生不同影響,而模糊控制系統(tǒng)的優(yōu)勢在此時就能得以展現(xiàn)。3.1.3制定模糊邏輯的規(guī)則所謂模糊邏輯,是建立在多值邏輯基礎(chǔ)上,運用模糊集合的方法來研究模糊性思維、語言形式及其規(guī)律的科學(xué)。模糊邏輯模仿人腦的不確定性概念判斷、推理思維方式,對于模型未知或不能確定的描述系統(tǒng)等,應(yīng)用模糊集合和模糊規(guī)則進(jìn)行推理,表達(dá)過渡性界限或定性知識經(jīng)驗,實行模糊綜合判斷,推理解決常規(guī)方法難于對付的規(guī)則型模糊信息問題。模糊邏輯善于表達(dá)界限不清晰的定性知識與經(jīng)驗,它區(qū)分模糊集合,處理模糊關(guān)系,模擬人腦實施規(guī)則型推理,解決種種不確定問題。3.1.4模糊邏輯的定義模糊邏輯十分有趣的原因有兩點。首先,它運作良好,是將人類專長轉(zhuǎn)化為自動化系統(tǒng)的有力途徑。利用模糊邏輯建立的專家系統(tǒng)和控制程序能夠解決利用數(shù)學(xué)計算和常規(guī)邏輯系統(tǒng)難以解決的問題。其次,模糊邏輯與人類思維運作模式十分匹配。它能夠成功吸收人類專長,因為專家們的表達(dá)方式恰好與其向程序注入信息的模式相符。模糊邏輯以重疊的模糊類別表達(dá)世界,這也正是我們思考的方式。3.1.4模糊邏輯的定義可以看到,傳統(tǒng)的人工智能是基于一些“清晰”的規(guī)則,這個“清晰”給出的結(jié)果往往是很詳細(xì)的,比如一個具體的房價預(yù)測值。而模糊邏輯模擬人的思考方式,對預(yù)測的房價值給出一個類似是高了還是低了的結(jié)果。不少創(chuàng)建智能的途徑,都是依賴人類程序員以不同形式編寫的系列規(guī)則。程序員能夠參與不同領(lǐng)域程序的編寫,歸根結(jié)底還是依賴規(guī)則的執(zhí)行。這些規(guī)則的存在也正是試圖以我們理解的思考過程建立起一個思考程序(圖3-3)。3.1.4模糊邏輯的定義

圖3-3模糊邏輯系統(tǒng)3.1.4模糊邏輯的定義1965年,美國加利福尼亞大學(xué)自動控制理論專家查德在關(guān)于“模糊控制”的一系列論著中首先提出了模糊集合的概念,標(biāo)志著模糊數(shù)學(xué)的誕生。建立在二值邏輯基礎(chǔ)上的原有的邏輯與數(shù)學(xué)難以描述和處理現(xiàn)實世界中許多模糊性的對象。模糊數(shù)學(xué)與模糊邏輯實質(zhì)上是要對模糊性對象進(jìn)行精確的描述和處理。3.1.5模糊理論的發(fā)展模糊集合的引入,可將人的判斷、思維過程用比較簡單的數(shù)學(xué)形式直接表達(dá)出來,從而使對復(fù)雜系統(tǒng)做出合乎實際的、符合人類思維方式的處理成為可能,為經(jīng)典模糊控制器的形成奠定了基礎(chǔ)。隨后,在1974年,英國人馬丹尼使用模糊控制語言建成的控制器、控制鍋爐和蒸汽機(jī),取得了良好的效果。他的實驗研究標(biāo)志著模糊控制的誕生。3.1.5模糊理論的發(fā)展查德為了建立模糊性對象的數(shù)學(xué)模型,把只取0和1二值的普通集合概念推廣為在[0,1]區(qū)間上取無窮多值的模糊集合概念,并用“隸屬度”這一概念來精確地刻畫元素與模糊集合之間的關(guān)系。正因為模糊集合是以連續(xù)的無窮多值為依據(jù)的,所以,模糊邏輯可看做是運用無窮連續(xù)值的模糊集合去研究模糊性對象的科學(xué)。把模糊數(shù)學(xué)的一些基本概念和方法運用到邏輯領(lǐng)域中,產(chǎn)生了模糊邏輯變量、模糊邏輯函數(shù)等基本概念。對于模糊聯(lián)結(jié)詞與模糊真值表也作了相應(yīng)的對比研究。查德還開展了模糊假言推理等似然推理研究,有些成果已直接應(yīng)用于模糊控制器的研制。3.1.5模糊理論的發(fā)展創(chuàng)立和研究模糊邏輯的主要意義有:(1)運用模糊邏輯變量、模糊邏輯函數(shù)和似然推理等新思想、新理論,為尋找解決模糊性問題的突破口奠定了理論基礎(chǔ),從邏輯思想上為研究模糊性對象指明了方向。(2)模糊邏輯在原有的布爾代數(shù)、二值邏輯等數(shù)學(xué)和邏輯工具難以描述和處理的自動控制過程、疑難病癥的診斷、大系統(tǒng)的研究等方面,都具有獨到之處。3.1.5模糊理論的發(fā)展(3)在方法論上,為人類從精確性到模糊性、從確定性到不確定性的研究提供了正確的研究方法。此外,在數(shù)學(xué)基礎(chǔ)研究方面,模糊邏輯有助于解決某些悖論。對辯證邏輯的研究也會產(chǎn)生深遠(yuǎn)的影響。當(dāng)然,模糊邏輯理論本身還有待進(jìn)一步系統(tǒng)化、完整化、規(guī)范化。3.1.5模糊理論的發(fā)展對于經(jīng)典模糊控制系統(tǒng)穩(wěn)態(tài)性能的改善,模糊集成控制、模糊自適應(yīng)控制、專家模糊控制與多變量模糊控制的研究,特別是針對復(fù)雜系統(tǒng)的自學(xué)習(xí)與參數(shù)(或規(guī)則)自調(diào)整模糊系統(tǒng)方面的研究,尤其受到各國學(xué)者的重視。將神經(jīng)網(wǎng)絡(luò)和模糊控制技術(shù)相互結(jié)合、取長補(bǔ)短,形成了一種模糊神經(jīng)網(wǎng)絡(luò)技術(shù)。由此組成一個更接近于人腦的智能信息處理系統(tǒng),其發(fā)展前景十分誘人。3.1.5模糊理論的發(fā)展PART02模糊邏輯系統(tǒng)模糊邏輯系統(tǒng)是指利用模糊概念和模糊邏輯構(gòu)成的系統(tǒng),它可以用來充當(dāng)模糊邏輯控制器。由于選擇模糊概念和邏輯的隨意性,可以構(gòu)造出多種模糊邏輯系統(tǒng)。常見的有三類:純模糊邏輯系統(tǒng)、高木-關(guān)野模糊邏輯系統(tǒng)和具有模糊產(chǎn)生器以及模糊消除器的模糊邏輯系統(tǒng)。3.2模糊邏輯系統(tǒng)純模糊邏輯系統(tǒng)是其他類型的模糊邏輯系統(tǒng)的核心部分,它提供了一種量化語言信息和在模糊邏輯原則下利用這類語言信息的一般化模式。圖3-4純模糊邏輯系統(tǒng)結(jié)構(gòu)圖3.2.1純模糊邏輯系統(tǒng)純模糊邏輯系統(tǒng)也可以解釋為一個映射關(guān)系,其結(jié)構(gòu)圖中的中間部分具有類似于線性變換中變換矩陣的映射功能。純模糊邏輯系統(tǒng)的缺點在于它的輸入和輸出均為模糊集合,這不利于工程應(yīng)用。但是,它為其他具有應(yīng)用價值的模糊邏輯系統(tǒng)提供了一個基本的樣板,由此出發(fā)可以構(gòu)造出其他具有實用性質(zhì)的模糊邏輯系統(tǒng)。3.2.1純模糊邏輯系統(tǒng)高木-關(guān)野模糊邏輯系統(tǒng)(簡稱T-S模糊邏輯系統(tǒng))是將純模糊邏輯系統(tǒng)中的每一條模糊規(guī)則的后件(即THEN以后的部分)加以定量化后形成的,也就是說,T-S模糊邏輯系統(tǒng)中的模糊規(guī)則,其前件是迷糊的,后件是確定的。這種模糊邏輯系統(tǒng)已經(jīng)在許多實際問題中得到成功的應(yīng)用,它的優(yōu)點是模糊邏輯系統(tǒng)的輸出為精確值,其中的參數(shù)也可以用參數(shù)估計、適應(yīng)機(jī)構(gòu)等方法加以確定。但是,由于模糊規(guī)則后件的確定性,T-S模糊邏輯系統(tǒng)不能方便地利用更多的語言信息和模糊原則,限制了其應(yīng)用的靈活性。3.2.2高木-關(guān)野模糊邏輯系統(tǒng)具有模糊產(chǎn)生器及模糊消除器的模糊邏輯系統(tǒng)的基本框圖如下圖所示。它是把純模糊邏輯系統(tǒng)的輸入端和輸出端分別接上模糊產(chǎn)生器和模糊消除器后構(gòu)成的。圖3-5具有模糊產(chǎn)生器和模糊消除器的模糊邏輯系統(tǒng)結(jié)構(gòu)圖3.2.3具有產(chǎn)生器及消除器的模糊邏輯系統(tǒng)具有模糊產(chǎn)生器及模糊消除器的模糊邏輯系統(tǒng)具有以下顯著優(yōu)點:(1)這種模糊邏輯系統(tǒng)提供了一種描述領(lǐng)域?qū)<抑R的模糊規(guī)則的一般化方法;(2)使用者在設(shè)計其中的模糊產(chǎn)生器、模糊推理機(jī)和模糊消除器時具有很大的自由度,因此可以根據(jù)實際情況,找到一個最適合的模糊邏輯系統(tǒng);(3)其輸入、輸出均為精確值,因此適合在工程領(lǐng)域中應(yīng)用。3.2.3具有產(chǎn)生器及消除器的模糊邏輯系統(tǒng)這類模糊邏輯系統(tǒng)是由馬丹尼首先提出,已經(jīng)在許多工業(yè)過程和商業(yè)產(chǎn)品中得到成功應(yīng)用,如用在電冰箱、電飯鍋、洗衣機(jī)、空調(diào)等家用電器的自動控制中,在洗衣機(jī)中感知裝載量和清潔劑濃度并據(jù)此調(diào)整它們的洗滌周期,同時還廣泛運用在游戲的開發(fā)中。3.2.3具有產(chǎn)生器及消除器的模糊邏輯系統(tǒng)PART03數(shù)據(jù)思維與變革生產(chǎn)資料是人類文明的核心。農(nóng)業(yè)時代生產(chǎn)資料是土地,工業(yè)時代生產(chǎn)資料是機(jī)器,數(shù)字時代生產(chǎn)資料是數(shù)據(jù)。勞動方式是人類文明的重要表征。漁獵農(nóng)耕時代形成的是以手工勞動為主要方式的“手工文明”,工業(yè)時代發(fā)展為以機(jī)器勞動為主要方式的“機(jī)器文明”,智能時代則基于數(shù)字勞動而不斷推動和豐富著“數(shù)字文明”。3.3數(shù)據(jù)思維與變革“數(shù)字文明”折射出以大數(shù)據(jù)、人工智能等為代表的數(shù)字技術(shù)對世界和人類的影響,在廣度和深度上有了質(zhì)的飛躍,到了塑造一種人類文明新形態(tài)的高度。數(shù)字技術(shù)正以新理念、新業(yè)態(tài)、新模式全面融入人類經(jīng)濟(jì)、政治、文化、社會、生態(tài)文明建設(shè)各領(lǐng)域和全過程,給人類生產(chǎn)生活帶來廣泛而深刻的影響。以數(shù)字技術(shù)為基座的互聯(lián)網(wǎng),促進(jìn)交流、提高效率,也在重塑制度、催生變革,更影響社會思潮和人類文明進(jìn)程。這是不可逆轉(zhuǎn)的時代趨勢。在人工智能時代,數(shù)據(jù)處理變得更加容易、更加快速,而“大數(shù)據(jù)”全在于發(fā)現(xiàn)和理解信息內(nèi)容及信息與信息之間的關(guān)系,其精髓是我們分析信息時的三個思維轉(zhuǎn)變,這三個轉(zhuǎn)變相互聯(lián)系和相互作用。3.3數(shù)據(jù)思維與變革很長時間以來,因為記錄、儲存和分析數(shù)據(jù)的工具不夠好,為了讓分析變得簡單,當(dāng)面臨大量數(shù)據(jù)時,通常都依賴于采樣分析。但是采樣分析是信息缺乏時代和信息流通受限制的模擬數(shù)據(jù)時代的產(chǎn)物。如今信息技術(shù)的條件已經(jīng)有了非常大的提高,雖然人類可以處理的數(shù)據(jù)依然是有限的,但是可以處理的數(shù)據(jù)量已經(jīng)大大地增加,而且未來會越來越多。大數(shù)據(jù)時代的第一個轉(zhuǎn)變,是要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量的數(shù)據(jù)樣本。3.3.1思維轉(zhuǎn)變之一:樣本=總體采樣的目的是用最少的數(shù)據(jù)得到更多的信息,而當(dāng)我們可以處理海量數(shù)據(jù)的時候,采樣就沒有什么意義了。如今,計算和制表已經(jīng)不再困難,感應(yīng)器、手機(jī)導(dǎo)航、網(wǎng)站點擊和微信等被動地收集了大量數(shù)據(jù),而計算機(jī)可以輕易地對這些數(shù)據(jù)進(jìn)行處理。但是,數(shù)據(jù)處理技術(shù)己經(jīng)發(fā)生了翻天覆地的改變,而我們的方法和思維卻沒有跟上這種改變。在很多領(lǐng)域,從收集部分?jǐn)?shù)據(jù)到收集盡可能多的數(shù)據(jù)的轉(zhuǎn)變已經(jīng)發(fā)生。如果可能的話,我們會收集所有的數(shù)據(jù),即“樣本=總體”,這是指我們能對數(shù)據(jù)進(jìn)行深度探討。3.3.1思維轉(zhuǎn)變之一:樣本=總體谷歌流感趨勢預(yù)測不是依賴于隨機(jī)樣本,而是分析了全美國幾十億條互聯(lián)網(wǎng)檢索記錄。分析整個數(shù)據(jù)庫,而不是對一個小樣本進(jìn)行分析,能夠提高微觀層面分析的準(zhǔn)確性,甚至能夠推測出某個特定城市的流感狀況。通過使用所有的數(shù)據(jù),我們可以發(fā)現(xiàn)如若不然則將會在大量數(shù)據(jù)中淹沒掉的情況。例如,信用卡詐騙是通過觀察異常情況來識別的,只有掌握了所有的數(shù)據(jù)才能做到這一點。在這種情況下,異常值是最有用的信息,你可以把它與正常交易情況進(jìn)行對比。而且,因為交易是即時的,所以你的數(shù)據(jù)分析也應(yīng)該是即時的。3.3.1思維轉(zhuǎn)變之一:樣本=總體因為大數(shù)據(jù)是建立在掌握所有數(shù)據(jù),至少是盡可能多的數(shù)據(jù)的基礎(chǔ)上的,所以我們就可以正確地考察細(xì)節(jié)并進(jìn)行新的分析。在任何細(xì)微的層面,我們都可以用大數(shù)據(jù)去論證新的假設(shè)。當(dāng)然,有些時候,我們還是可以使用樣本分析法,畢竟我們?nèi)匀换钤谝粋€資源有限的時代。但是更多時候,利用手中掌握的所有數(shù)據(jù)成為了最好也是可行的選擇。于是,慢慢地,我們會完全拋棄樣本分析。3.3.1思維轉(zhuǎn)變之一:樣本=總體當(dāng)我們測量事物的能力受限時,關(guān)注最重要的事情和獲取最精確的結(jié)果是可取的。直到今天,我們的數(shù)字技術(shù)依然建立在精準(zhǔn)的基礎(chǔ)上。我們假設(shè)只要電子數(shù)據(jù)表格把數(shù)據(jù)排序,數(shù)據(jù)庫引擎就可以找出和我們檢索的內(nèi)容完全一致的檢索記錄。這種思維方式適用于掌握“小數(shù)據(jù)量”的情況,因為需要分析的數(shù)據(jù)很少,所以我們必須盡可能精準(zhǔn)地量化我們的記錄。在某些方面,我們已經(jīng)意識到了差別。例如,一個小商店在晚上打烊的時候要把收銀臺里的每分錢都數(shù)清楚,但是我們不會、也不可能用“分”這個單位去精確度量國民生產(chǎn)總值。隨著規(guī)模的擴(kuò)大,對精確度的癡迷將減弱。3.3.2思維轉(zhuǎn)變之二:接受數(shù)據(jù)的混雜性針對小數(shù)據(jù)量和特定事情,追求精確性依然是可行的,比如一個人的銀行賬戶上是否有足夠的錢開具支票。但是,在大數(shù)據(jù)時代,很多時候,追求精確度已經(jīng)變得不可行,甚至不受歡迎了。大數(shù)據(jù)紛繁多樣,優(yōu)劣摻雜,分布在全球多個服務(wù)器上。擁有了大數(shù)據(jù),我們不再需要對一個現(xiàn)象刨根究底,只要掌握大體的發(fā)展方向即可。當(dāng)然,我們也不是完全放棄了精確度,只是不再沉迷于此。適當(dāng)忽略微觀層面上的精確度會讓我們在宏觀層面擁有更好的洞察力。3.3.2思維轉(zhuǎn)變之二:接受數(shù)據(jù)的混雜性大數(shù)據(jù)時代的第二個轉(zhuǎn)變,是我們樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再一味追求其精確性。在越來越多的情況下,使用所有可獲取的數(shù)據(jù)變得更為可能,但為此也要付出一定的代價。數(shù)據(jù)量的大幅增加會造成結(jié)果的不準(zhǔn)確,與此同時,一些錯誤的數(shù)據(jù)也會混進(jìn)數(shù)據(jù)庫。然而,重點是我們能夠努力避免這些問題。3.3.2思維轉(zhuǎn)變之二:接受數(shù)據(jù)的混雜性大數(shù)據(jù)在多大程度上優(yōu)于算法,這個問題在自然語言處理上表現(xiàn)得很明顯。2000年,微軟研究中心的米歇爾·班科和埃里克·布里爾一直在尋求改進(jìn)Word程序中語法檢查的方法。但是他們不能確定是努力改進(jìn)現(xiàn)有的算法、研發(fā)新的方法,還是添加更加細(xì)膩精致的特點更有效。所以,在實施這些措施之前,他們決定往現(xiàn)有的算法中添加更多的數(shù)據(jù),看看會有什么不同的變化。很多對計算機(jī)學(xué)習(xí)算法的研究都建立在百萬字左右的語料庫基礎(chǔ)上。最后,他們決定往4種常見的算法中逐新添加數(shù)據(jù),先是一千萬字,再到一億字,最后到十億。3.3.2思維轉(zhuǎn)變之二:接受數(shù)據(jù)的混雜性結(jié)果有點令人吃驚。他們發(fā)現(xiàn),隨著數(shù)據(jù)的增多,4種算法的表現(xiàn)都大幅提高了。當(dāng)數(shù)據(jù)只有500萬的時候,有一種簡單的算法表現(xiàn)得很差,但當(dāng)數(shù)據(jù)達(dá)10億的時候,它變成了表現(xiàn)最好的,準(zhǔn)確率從原來的75%提高到了95%以上。與之相反地,在少量數(shù)據(jù)情況下運行得最好的算法,當(dāng)加入更多的數(shù)據(jù)時,也會像其他的算法一樣有所提高,但是卻變成了在大量數(shù)據(jù)條件下運行得最不好的。它的準(zhǔn)確率會從86%提高到94%。后來,班科和布里爾在他們發(fā)表的研究論文中寫到,“如此一來,我們得重新衡量一下更多的人力物力是應(yīng)該消耗在算法發(fā)展上還是在語料庫發(fā)展上?!?.3.2思維轉(zhuǎn)變之二:接受數(shù)據(jù)的混雜性這是因前兩個轉(zhuǎn)變而促成的。尋找因果關(guān)系是人類長久以來的習(xí)慣,即使確定因果關(guān)系很困難而且用途不大,人類還是習(xí)慣性地尋找緣由。相反,在大數(shù)據(jù)時代,我們無須再緊盯事物之間的因果關(guān)系,而應(yīng)該尋找事物之間的相關(guān)關(guān)系,這會給我們提供非常新穎且有價值的觀點。相關(guān)關(guān)系也許不能準(zhǔn)確地告知我們某件事情為何會發(fā)生,但是它會提醒我們這件事情正在發(fā)生。在許多情況下,這種提醒的幫助已經(jīng)足夠大了。在很多時候,尋找數(shù)據(jù)間的關(guān)聯(lián)并利用這種關(guān)聯(lián)就足夠了。這些思想上的重大轉(zhuǎn)變導(dǎo)致了第三個變革。3.3.3思維轉(zhuǎn)變之三:數(shù)據(jù)的相關(guān)關(guān)系大數(shù)據(jù)時代的第三個轉(zhuǎn)變是人們嘗試著不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。例如,如果數(shù)百萬條電子醫(yī)療記錄都顯示橙汁和阿司匹林的特定組合可以治療癌癥,那么找出具體的藥理機(jī)制就沒有這種治療方法本身來得重要。同樣,只要我們知道什么時候是買機(jī)票的最佳時機(jī),就算不知道機(jī)票價格瘋狂變動的原因也無所謂了。大數(shù)據(jù)告訴我們“是什么”而不是“為什么”。在大數(shù)據(jù)時代,我們不必知道現(xiàn)象背后的原因,只要讓數(shù)據(jù)自己發(fā)聲。我們不再需要在還沒有收集數(shù)據(jù)之前,就把分析建立在早已設(shè)立的少量假設(shè)的基礎(chǔ)之上。讓數(shù)據(jù)發(fā)聲,我們會注意到很多以前從來沒有意識到的聯(lián)系的存在。3.3.3思維轉(zhuǎn)變之三:數(shù)據(jù)的相關(guān)關(guān)系與常識相反,經(jīng)常憑借直覺而來的因果關(guān)系并沒有幫助我們加深對這個世界的理解。很多時候,這種認(rèn)知捷徑只是給了我們一種自己已經(jīng)理解的錯覺,但實際上,我們因此完全陷入了理解誤區(qū)之中。就像采樣是我們無法處理全部數(shù)據(jù)時的捷徑一樣,這種找因果關(guān)系的方法也是我們大腦用來避免辛苦思考的捷徑。不像因果關(guān)系,證明相關(guān)關(guān)系的實驗耗資少,費時也少。與之相比,分析相關(guān)關(guān)系,我們既有數(shù)學(xué)方法,也有統(tǒng)計學(xué)方法,同時,數(shù)字工具也能幫我們準(zhǔn)確地找出相關(guān)關(guān)系。3.3.3思維轉(zhuǎn)變之三:數(shù)據(jù)的相關(guān)關(guān)系相關(guān)關(guān)系分析本身意義重大,同時它也為研究因果關(guān)系奠定了基礎(chǔ)。通過找出可能相關(guān)的事物,我們可以在此基礎(chǔ)上進(jìn)行進(jìn)一步的因果關(guān)系分析.如果存在因果關(guān)系的話,我們再進(jìn)一步找出原因。這種便捷的機(jī)制通過實驗降低了因果分析的成本。我們也可以從相互聯(lián)系中找到一些重要的變量,這些變量可以用到驗證因果關(guān)系的實驗中去??墒牵覀儽仨毞浅UJ(rèn)真。相關(guān)關(guān)系很有用,不僅僅是因為它能為我們提供新的視角,而且提供的視角都很清晰。而我們一旦把因果關(guān)系考慮進(jìn)來,這些視角就有可能被蒙蔽掉。3.3.3思維轉(zhuǎn)變之三:數(shù)據(jù)的相關(guān)關(guān)系例如,Kaggle是一家為所有人提供數(shù)據(jù)挖掘競賽平臺的公司,舉辦了關(guān)于二手車的質(zhì)量競賽。經(jīng)銷商將二手車數(shù)據(jù)提供參加比賽二手車數(shù)據(jù),統(tǒng)計學(xué)家們用這些數(shù)據(jù)建立一個算法系統(tǒng)來預(yù)測經(jīng)銷商拍賣的哪些車有可能出現(xiàn)質(zhì)量問題。相關(guān)關(guān)系分析表明,橙色的車有質(zhì)量問題的可能性只有其他車的一半。3.3.3思維轉(zhuǎn)變之三:數(shù)據(jù)的相關(guān)關(guān)系當(dāng)我們讀到這里的時候,不禁也會思考其中的原因。難道是因為橙色車的車主更愛車,所以車被保護(hù)得更好嗎?或是這種顏色的車子在制造方面更精良些嗎?還是因為橙色的車更顯眼、出車禍的概率更小,所以轉(zhuǎn)手的時候.各方面的性能保持得更好?3.3.3思維轉(zhuǎn)變之三:數(shù)據(jù)的相關(guān)關(guān)系馬上,我們就陷入了各種各樣謎一樣的假設(shè)中。若要找出相關(guān)關(guān)系,我們可以用數(shù)學(xué)方法,但如果是因果關(guān)系的話,這卻是行不通的。所以,我們沒必要一定要找出相關(guān)關(guān)系背后的原因,當(dāng)我們知道了“是什么”的時候,“為什么”其實沒那么重要了,否則就會催生一些滑稽的想法。比方說上面提到的例子里,我們是不是應(yīng)該建議車主把車漆成橙色呢?畢竟,這樣就說明車子的質(zhì)量更過硬啊!3.3.3思維轉(zhuǎn)變之三:數(shù)據(jù)的相關(guān)關(guān)系考慮到這些,如果把以確鑿數(shù)據(jù)為基礎(chǔ)的相關(guān)關(guān)系和通過快速思維構(gòu)想出的因果關(guān)系相比的話,前者就更具有說服力。但在越來越多的情況下,快速清晰的相關(guān)關(guān)系分析甚至比慢速的因果分析更有用和更有效。慢速的因果分析集中體現(xiàn)為通過嚴(yán)格控制的實驗來驗證的因果關(guān)系,而這必然是非常耗時耗力的。3.3.3思維轉(zhuǎn)變之三:數(shù)據(jù)的相關(guān)關(guān)系近年來,科學(xué)家一直在試圖減少這些實驗的花費,比如說,通過巧妙地結(jié)合相似的調(diào)查,做成“類似實驗”。這樣一來,因果關(guān)系的調(diào)查成本就降低,但還是很難與相關(guān)關(guān)系體現(xiàn)的優(yōu)越性相抗衡。還有,正如我們之前提到的,在專家進(jìn)行因果關(guān)系的調(diào)查時,相關(guān)關(guān)系分析本來就會起到幫助的作用。在大多數(shù)情況下,一旦我們完成了對大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道“是什么”時,我們就會繼續(xù)向更深層次研究因果關(guān)系,找出背后的“為什么”。3.3.3思維轉(zhuǎn)變之三:數(shù)據(jù)的相關(guān)關(guān)系因果關(guān)系還是有用的,但是它將不再被看成是意義來源的基礎(chǔ)。在大數(shù)據(jù)時代,即使很多情況下,我們依然指望用因果關(guān)系來說明我們所發(fā)現(xiàn)的相互聯(lián)系,但是,我們知道因果關(guān)系只是一種特殊的相關(guān)關(guān)系。相反,大數(shù)據(jù)推動了相關(guān)關(guān)系分析。相關(guān)關(guān)系分析通常情況下能取代因果關(guān)系起作用,即使不可取代的情況下,它也能指導(dǎo)因果關(guān)系起作用。3.3.3思維轉(zhuǎn)變之三:數(shù)據(jù)的相關(guān)關(guān)系PART04大數(shù)據(jù)與人工智能人工智能和大數(shù)據(jù)是緊密相關(guān)的熱門技術(shù),二者既有聯(lián)系,又有區(qū)別。人工智能的發(fā)展要早于大數(shù)據(jù),在20世紀(jì)50年代就已經(jīng)開始,而大數(shù)據(jù)的概念直到2010年左右才形成。人工智能受到國人關(guān)注要遠(yuǎn)早于大數(shù)據(jù),受到廣泛關(guān)注,其影響力要大于大數(shù)據(jù)。3.4大數(shù)據(jù)與人工智能在大數(shù)據(jù)時代,面對海量數(shù)據(jù),傳統(tǒng)的人工智能算法所依賴的單機(jī)存儲和單機(jī)算法已經(jīng)無能為力,建立在集群技術(shù)之上的大數(shù)據(jù)技術(shù)(主要是分布式存儲和分布式計算),可以為人工智能提供強(qiáng)大的存儲能力和計算能力。人工智能,特別是機(jī)器學(xué)習(xí),需要數(shù)據(jù)來建立其智能。例如,機(jī)器學(xué)習(xí)圖像識別應(yīng)用程序可以查看數(shù)以萬計的飛機(jī)圖像,了解飛機(jī)的構(gòu)成,以便將來能夠識別出它們。人工智能應(yīng)用的數(shù)據(jù)越多,其獲得的結(jié)果就越準(zhǔn)確。如今,大數(shù)據(jù)為人工智能提供了海量數(shù)據(jù),使人工智能技術(shù)有了長足發(fā)展,甚至可以說,沒有大數(shù)據(jù)就沒有人工智能。3.4.1人工智能與大數(shù)據(jù)的聯(lián)系人工智能技術(shù)立足于神經(jīng)網(wǎng)絡(luò),同時發(fā)展出多層神經(jīng)網(wǎng)絡(luò),從而可以進(jìn)行深度學(xué)習(xí),決定了它更為靈活、且可以根據(jù)不同的訓(xùn)練數(shù)據(jù)而擁有自優(yōu)化的能力。“機(jī)器學(xué)習(xí)”“深度學(xué)習(xí)”“強(qiáng)化學(xué)習(xí)”等技術(shù)的發(fā)展推動著人工智能的進(jìn)步。以計算機(jī)視覺為例,作為一個數(shù)據(jù)復(fù)雜領(lǐng)域,傳統(tǒng)的淺層算法識別準(zhǔn)確率并不高。自深度學(xué)習(xí)出現(xiàn)以后,基于尋找合適特征來讓機(jī)器識別物體,計算機(jī)視覺的圖像識別精準(zhǔn)度從70%提升到95%。人工智能的快速演進(jìn),不僅需要理論研究,還需要大量的數(shù)據(jù)作為支撐。3.4.1人工智能與大數(shù)據(jù)的聯(lián)系人工智能與大數(shù)據(jù)存在著明顯的區(qū)別,人工智能是一種計算形式,它允許機(jī)器執(zhí)行認(rèn)知功能,例如對輸入起作用或做出反應(yīng),類似于人類的做法。而大數(shù)據(jù)是一種傳統(tǒng)計算,只是尋找結(jié)果,不會根據(jù)結(jié)果采取行動。另外,二者要達(dá)成的目標(biāo)和實現(xiàn)目標(biāo)的手段不同。大數(shù)據(jù)主要是為了獲得洞察力,通過數(shù)據(jù)的對比分析來掌握和推演出更優(yōu)的方案。就拿視頻推送為例,我們之所以會接收到不同的推送內(nèi)容,便是因為大數(shù)據(jù)根據(jù)人們?nèi)粘S^看的內(nèi)容,綜合考慮觀看習(xí)慣,推斷出哪些內(nèi)容更可能產(chǎn)生同樣的感覺,并將其推送給我們。3.4.2人工智能與大數(shù)據(jù)的區(qū)別而人工智能的開發(fā),是為了輔助和代替我們更快、更好地完成某些任務(wù)或進(jìn)行某些決定。不管是汽車自動駕駛、軟件自我調(diào)整亦或者是醫(yī)學(xué)樣本檢查工作,完成相同的任務(wù)人工智能總是比人類速度更快、錯誤更少,它能通過機(jī)器學(xué)習(xí)的方法,掌握我們?nèi)粘_M(jìn)行的重復(fù)性的事項,并以計算機(jī)的處理優(yōu)勢來高效的達(dá)成目標(biāo)。3.4.2人工智能與大數(shù)據(jù)的區(qū)別大數(shù)據(jù)定義了非常大的數(shù)據(jù)集和極其多樣的數(shù)據(jù)。在大數(shù)據(jù)集中,可以存在結(jié)構(gòu)化數(shù)據(jù),如關(guān)系數(shù)據(jù)庫中的事務(wù)數(shù)據(jù),以及非結(jié)構(gòu)化數(shù)據(jù),例如圖像、電子郵件數(shù)據(jù)、傳感器數(shù)據(jù)等。大數(shù)據(jù)需要在數(shù)據(jù)變得有用之前進(jìn)行清洗、結(jié)構(gòu)化和集成的原始輸入,而人工智能則是輸出,即處理數(shù)據(jù)產(chǎn)生的智能。這使得兩者有著本質(zhì)上的不同。雖然有很大區(qū)別,但人工智能和大數(shù)據(jù)仍然能夠很好地協(xié)同工作。這是因為人工智能需要數(shù)據(jù)來建立其智能,特別是機(jī)器學(xué)習(xí)。3.4.2人工智能與大數(shù)據(jù)的區(qū)別人工智能與大數(shù)據(jù)密不可分。大數(shù)據(jù)的許多應(yīng)用可以歸因于人工智能。隨著人工智能的快速應(yīng)用和普及,大數(shù)據(jù)不斷積累,深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等算法不斷優(yōu)化。數(shù)據(jù)技術(shù)將與人工智能技術(shù)更緊密地結(jié)合在一起,它將具有理解、分析、發(fā)現(xiàn)數(shù)據(jù)和對數(shù)據(jù)做出決策的能力,從而能夠從數(shù)據(jù)中獲得更準(zhǔn)確、更深入的知識,挖掘數(shù)據(jù)背后的價值,并產(chǎn)生新的知識。3.4.3人工智能深化大數(shù)據(jù)應(yīng)用人工智能是一種計算形式,它允許機(jī)器執(zhí)行認(rèn)知功能,例如對輸入起作用或做出反應(yīng),類似于人類的做法。傳統(tǒng)的計算應(yīng)用程序也會對數(shù)據(jù)做出反應(yīng),但反應(yīng)和響應(yīng)都必須采用人工編碼。如果出現(xiàn)任何類型的差錯,就像意外的結(jié)果一樣,應(yīng)用程序無法做出反應(yīng)。而人工智能系統(tǒng)不斷改變它們的行為,以適應(yīng)調(diào)查結(jié)果的變化并修改它們的反應(yīng)。支持人工智能的機(jī)器旨在分析和解釋數(shù)據(jù),然后根據(jù)這些解釋解決問題。通過機(jī)器學(xué)習(xí),計算機(jī)會學(xué)習(xí)一次如何對某個結(jié)果采取行動或做出反應(yīng),并在未來知道采取相同的行動。3.4.3人工智能深化大數(shù)據(jù)應(yīng)用人工智能實現(xiàn)最大的飛躍是大規(guī)模并行處理器的出現(xiàn),特別是GPU,它是具有數(shù)千個內(nèi)核的大規(guī)模并行處理單元,而不是CPU中的幾十個并行處理單元。這大大加快了現(xiàn)有的人工智能算法的速度,現(xiàn)在已經(jīng)使它們可行。大數(shù)據(jù)可以采用這些處理器,機(jī)器學(xué)習(xí)算法可以學(xué)習(xí)如何重現(xiàn)某種行為,包括收集數(shù)據(jù)以加速機(jī)器。人工智能不會像人類那樣推斷出結(jié)論。它通過試驗和錯誤學(xué)習(xí),這需要大量的數(shù)據(jù)來訓(xùn)練人工智能。人工智能是總的概念,機(jī)器學(xué)習(xí),深度學(xué)習(xí)都是實現(xiàn)人工智能的重要途徑,大數(shù)據(jù)是重要的推動力。3.4.3人工智能深化大數(shù)據(jù)應(yīng)用第2版人工智能通識教程第4章周蘇教授QQ:81505050智能體與智能代理導(dǎo)讀案例:智能體:下一個顛覆性AI應(yīng)用如今,越來越多的人開始關(guān)注智能體的發(fā)展。而基于大語言模型的智能體則會是AI領(lǐng)域接下來的重要應(yīng)用方向,也引起越來越多AI從業(yè)者的重視。自主AI還處于發(fā)展的早期階段,呈現(xiàn)出一個值得期待的未來愿景。01智能體和環(huán)境02智能體的良好行為03環(huán)境的本質(zhì)04智能體的結(jié)構(gòu)目錄/CONTENTS05智能代理技術(shù)06智能代理典型應(yīng)用智能體(Agents)是人工智能領(lǐng)域中一個很重要的概念,它是指能自主活動的軟件或者硬件實體,任何獨立的能夠思考并可以同環(huán)境交互的實體都可以抽象為智能體。我們可以把人工智能進(jìn)一步定義為“對從環(huán)境中接受感知并執(zhí)行行動的智能體的研究”,“智能體”概念既能概括以機(jī)器為載體的人工智能,也能概括以有機(jī)體為載體的生物智能——生物就是感知環(huán)境并適應(yīng)環(huán)境的有機(jī)智能體。更一般地,“智能是系統(tǒng)通過獲取和加工信息而獲得的一種能力,從而實現(xiàn)從簡單到復(fù)雜的演化”,這也同時涵蓋了生物智能和機(jī)器智能。第4章智能體和智能代理另一方面,所謂智能代理(IntelligentAgent,IA)在社會科學(xué)中是指一個理性并且自主的人或其他系統(tǒng),它根據(jù)感知世界得到的信息來做出動作以影響這個世界。這一定義在計算機(jī)智能代理中同樣適用。代理必須理性,根據(jù)可得的信息做出正確的決定;代理也必須自主,它與世界的關(guān)系包括感知世界的過程,它做出的決定源于對世界的感知及自身經(jīng)歷。我們不期望智能代理能像象棋程序一樣獲得最完美、最完備的信息,它的一部分任務(wù)就是理解周邊環(huán)境,隨后做出反應(yīng)。它的行為將改變環(huán)境,隨即改變其感知,但它仍舊需要在已經(jīng)改變的世界中繼續(xù)運作。第4章智能體和智能代理PART01智能體和環(huán)境任何通過傳感器感知環(huán)境并通過執(zhí)行器作用于該環(huán)境的事物都可以被視為智能體。我們從檢查智能體、環(huán)境以及它們之間的耦合,觀察到某些智能體比其他智能體表現(xiàn)得更好,可以自然而然地引出理性智能體的概念,即行為盡可能好。智能體的行為取決于環(huán)境的性質(zhì)。圖4-2智能體通過傳感器和執(zhí)行器

與環(huán)境交互4.1智能體和環(huán)境一個人類智能體以眼睛、耳朵和其他器官作為傳感器,以手、腿、聲道等作為執(zhí)行器。機(jī)器人智能體可能以攝像頭和紅外測距儀作為傳感器,各種電動機(jī)作為執(zhí)行器。軟件智能體接收文件內(nèi)容、網(wǎng)絡(luò)數(shù)據(jù)包和人工輸入(鍵盤/鼠標(biāo)/觸摸屏/語音)作為傳感輸入,并通過寫入文件、發(fā)送網(wǎng)絡(luò)數(shù)據(jù)包、顯示信息或生成聲音對環(huán)境進(jìn)行操作。環(huán)境可以是一切,甚至是整個宇宙。實際上,我們在設(shè)計智能體時關(guān)心的只是宇宙中某一部分的狀態(tài),即影響智能體感知以及受智能體動作影響的部分。4.1智能體和環(huán)境我們使用術(shù)語感知來表示智能體的傳感器知覺的內(nèi)容。一般而言,一個智能體在任何給定時刻的動作選擇,可能取決于其內(nèi)置知識和迄今為止觀察到的整個感知序列,而不是它未感知到的任何事物。通過為每個可能的感知序列指定智能體的動作選擇,或多或少地說明了關(guān)于智能體的內(nèi)容。從數(shù)學(xué)上講,智能體的行為由智能體函數(shù)描述,該函數(shù)將任意給定的感知序列映射到一個動作。4.1智能體和環(huán)境可以想象將描述任何給定智能體的智能體函數(shù)制成表格,對大多數(shù)智能體來說,這將是一個非常大的表,事實上是無限的(除非限制所考慮的感知序列的長度)。給定一個要進(jìn)行實驗的智能體,原則上,可以通過嘗試所有可能的感知序列并記錄智能體響應(yīng)的動作來構(gòu)建此表,當(dāng)然,該表只是該智能體的外部特征。在內(nèi)部,人工智能體的智能體函數(shù)將由智能體程序?qū)崿F(xiàn),區(qū)別這兩種觀點很重要,智能體函數(shù)是一種抽象的數(shù)學(xué)描述,而智能體程序是一個具體的實現(xiàn),可以在某些物理系統(tǒng)中運行。4.1智能體和環(huán)境為了闡明這些想法,我們舉一個簡單的例子——真空吸塵器世界。在一個由方格組成的世界中,包含一個機(jī)器人真空吸塵器智能體,其中的方格可以是臟的,也可以是干凈的??紤]只有兩個方格——方格A和方格B——的情況。真空吸塵器智能體可以感知它在哪個方格中,以及方格中是否干凈。智能體從方格A開始??蛇x的操作包括向右移動、向左移動、吸塵或什么都不做(其實,真正的機(jī)器人不太可能會有“向右移動”和“向左移動”這樣的動作,而是采用“向前旋轉(zhuǎn)輪子”和“向后旋轉(zhuǎn)輪子”這樣的動作)。4.1智能體和環(huán)境一個非常簡單的智能體函數(shù)如下:如果當(dāng)前方格是臟的,就吸塵;否則,移動到另一個方格。智能體這一概念主要作為分析系統(tǒng)的工具,而不是將世界劃分為智能體和非智能體的絕對表征。在某種意義上,工程的所有領(lǐng)域都可以被視為設(shè)計與世界互動的人工制品,人工智能運行在最有趣的一端,在這一端,人工制品具有重要的計算資源,任務(wù)環(huán)境需要非凡的決策。4.1智能體和環(huán)境PART02智能體的良好行為理性智能體是做正確事情的事物。人工智能通常通過結(jié)果來評估智能體的行為。當(dāng)智能體進(jìn)入環(huán)境時,它會根據(jù)接受的感知產(chǎn)生一個動作序列,這會導(dǎo)致環(huán)境經(jīng)歷一系列的狀態(tài)。如果序列是理想的,則智能體表現(xiàn)良好,這個概念由性能度量描述,評估任何給定環(huán)境狀態(tài)的序列。4.2智能體的良好行為人類有適用于自身的理性概念,它與成功選擇產(chǎn)生環(huán)境狀態(tài)序列的行動有關(guān),這些環(huán)境狀態(tài)序列從人類的角度來看是可取的。但是機(jī)器沒有自己的欲望和偏好,至少在最初,性能度量是在機(jī)器設(shè)計者的頭腦中或者是在機(jī)器受眾的頭腦中。一些智能體設(shè)計具有性能度量的顯式表示,而在其他設(shè)計中,性能度量完全是隱式的,智能體可能會做正確的事情,但它不知道為什么。4.2.1性能度量應(yīng)該確?!笆┮詸C(jī)器的目的是我們真正想要的目的”,但是正確地制定性能度量可能非常困難。例如,考慮真空吸塵器智能體,我們可能會建議用單個8小時班次中清理的灰塵量來度量性能。然而,一個理性的智能體可以通過清理灰塵,然后將其全部傾倒在地板上,然后再次清理,如此反復(fù),從而最大化這一性能度量值。更合適的性能度量是獎勵擁有干凈地板的智能體。例如,在每個時間步中,每個干凈方格可以獲得1分(可能會對耗電和產(chǎn)生的噪聲進(jìn)行懲罰)。4.2.1性能度量作為一般規(guī)則,更好的做法是根據(jù)一個人在環(huán)境中真正想要實現(xiàn)的目標(biāo),而不是根據(jù)一個人認(rèn)為智能體應(yīng)該如何表現(xiàn)來設(shè)計性能度量。即使避免了明顯的缺陷,一些棘手的問題仍然存在。例如,“干凈地板”的概念是基于一段時間內(nèi)的平均整潔度。然而,兩個不同的智能體可以達(dá)到相同的平均整潔度,其中一個智能體工作始終保持一般水平,而另一個智能體短時間工作效率很高但需要長時間的休息。哪種工作方式更可取,這似乎是保潔工作的好課題,而實際上還是一個具有深遠(yuǎn)影響的哲學(xué)問題。4.2.1性能度量在任何時候,理性取決于以下4方面:(1)定義成功標(biāo)準(zhǔn)的性能度量;(2)智能體對環(huán)境的先驗知識;(3)智能體可以執(zhí)行的動作;(4)智能體到目前為止的感知序列。于是,對理性智能體的定義是:對于每個可能的感知序列,給定感知序列提供的證據(jù)和智能體所擁有的任何先驗知識,理性智能體應(yīng)該選擇一個期望最大化其性能度量的動作。4.2.2理性考慮一個簡單的真空吸塵器智能體,如果一個方格是臟的就清理它,如果不臟就移動到另一個方格,它是理性智能體嗎?首先,我們需要說明性能度量是什么,對環(huán)境了解多少,以及智能體具有哪些傳感器和執(zhí)行器。我們假設(shè):·在1000個時間步的生命周期內(nèi),性能度量在每個時間步為每個干凈的方格獎勵1分;4.2.2理性·環(huán)境的“地理信息”是先驗的,但灰塵的分布和智能體的初始位置不是先驗的,干凈的方格會繼續(xù)保持干凈,吸塵動作會清理當(dāng)前方格,向左或向右的動作使智能體移動一個方格,如果該動作會讓智能體移動到環(huán)境之外,智能體將保持在原來的位置;·可用的動作僅有向右、向左和吸塵;·智能體能夠正確感知其位置以及該位置是否有灰塵。4.2.2理性在這種情況下,智能體確實是理性的,它的預(yù)期性能至少與任何其他智能體一樣。顯然,同一個智能體在不同情況下可能會變得不理性。例如,在清除所有灰塵后,該智能體會毫無必要地反復(fù)來回;如果考慮對每個動作罰1分,那么智能體的表現(xiàn)就會很差。在確定所有方格都干凈的情況下,一個好的智能體不會做任何事情。如果干凈的方格再次變臟,智能體應(yīng)該偶爾檢查,并在必要時重新清理。如果環(huán)境地理信息是未知的,智能體則需要對其進(jìn)行探索。4.2.2理性我們需要仔細(xì)區(qū)分理性和全知。全知的智能體能預(yù)知其行動的實際結(jié)果,并據(jù)此采取行動,但在現(xiàn)實中,全知是不可能的,理性不等同于完美。理性使期望性能最大化,而完美使實際性能最大化。不要求完美不僅僅是對智能體公平的問題,關(guān)鍵是,如果期望一個智能體做事后證明是最好的行動,就不可能設(shè)計一個符合規(guī)范的智能體。因此,對理性的定義并不需要全知,因為理性決策只取決于迄今為止的感知序列。我們還必須確保沒有無意中允許智能體進(jìn)行低智的行動。4.2.3全知、學(xué)習(xí)和自主首先,考慮到這種缺乏信息的感知序列,過馬路是不理性的:不觀察路況就過馬路發(fā)生事故的風(fēng)險太大。其次,理性智能體在上街之前應(yīng)該選擇“觀察”動作,因為觀察有助于最大化期望性能。采取行動來改變未來的感知,有時被稱為信息收集,這是理性的一個重要組成部分。4.2.3全知、學(xué)習(xí)和自主我們的定義要求理性智能體不僅要收集信息,還要盡可能多地從它所感知到的東西中學(xué)習(xí)。智能體的初始配置可以反映對環(huán)境的一些先驗知識,但隨著智能體獲得經(jīng)驗,這可能會被修改和增強(qiáng)。在一些極端情況下,環(huán)境完全是先驗已知的和完全可預(yù)測的,這種情況下智能體不需要感知或?qū)W習(xí),只需正確地運行。當(dāng)然,這樣的智能體是脆弱的。4.2.3全知、學(xué)習(xí)和自主如果在某種程度上,智能體依賴于其設(shè)計者的先驗知識,而不是其自身的感知和學(xué)習(xí)過程,就說該智能體缺乏自主性。一個理性的智能體應(yīng)該是自主的,它應(yīng)該學(xué)習(xí)如何彌補(bǔ)部分或不正確的先驗知識,例如學(xué)習(xí)預(yù)測何時何地會出現(xiàn)額外灰塵的真空吸塵器就比不能學(xué)習(xí)預(yù)測的要好。4.2.3全知、學(xué)習(xí)和自主實際上,很少從一開始就要求智能體完全自主:除非設(shè)計者提供一些幫助,否則當(dāng)智能體幾乎沒有經(jīng)驗時,它將不得不隨機(jī)行動。正如進(jìn)化為動物提供了足夠的內(nèi)建反射,使其能夠生存足夠長的時間來學(xué)習(xí)一樣,為人工智能體提供一些初始知識和學(xué)習(xí)能力也是合理的。在充分體驗相應(yīng)環(huán)境后,理性智能體的行為可以有效地獨立于其先驗知識。因此,結(jié)合學(xué)習(xí)能夠讓我們設(shè)計單個理性智能體,它能在各種各樣的環(huán)境中取得成功。4.2.3全知、學(xué)習(xí)和自主PART03環(huán)境的本質(zhì)有了理性的定義,構(gòu)建理性智能體還必須考慮任務(wù)環(huán)境,它本質(zhì)上是“問題”,理性智能體是“解決方案”。首先是指定任務(wù)環(huán)境,然后展示任務(wù)環(huán)境的多種形式。任務(wù)環(huán)境的性質(zhì)直接影響到智能體程序的恰當(dāng)設(shè)計。4.3環(huán)境的本質(zhì)討論簡單真空吸塵器智能體的理性時,必須為其指定性能度量、環(huán)境以及智能體的執(zhí)行器和傳感器,這些都?xì)w在任務(wù)環(huán)境的范疇下,稱其為PEAS(Performance,Environment,Actuator,Sensor,性能、環(huán)境、執(zhí)行器、傳感器)描述。在設(shè)計智能體時,第一步始終是盡可能完整地指定任務(wù)環(huán)境。我們來考慮一個更復(fù)雜的問題:自動駕駛出租車的任務(wù)環(huán)境PEAS描述(表4-1)。4.3.1指定任務(wù)環(huán)境表4-1自動駕駛出租車司機(jī)任務(wù)環(huán)境的PEAS描述4.3.1指定任務(wù)環(huán)境首先,對于自動駕駛追求的性能度量,理想的標(biāo)準(zhǔn)包括到達(dá)正確的目的地,盡量減少油耗和磨損,盡量減少行程時間或成本,盡量減少違反交通法規(guī)和對其他駕駛員的干擾,最大限度地提高安全性和乘客舒適度,最大化利潤。顯然,其中有一些目標(biāo)是相互沖突的,需要權(quán)衡。接下來,出租車將面臨什么樣的駕駛環(huán)境?任何出租車司機(jī)都必須能夠在各種道路上行駛,如鄉(xiāng)村車道、城市小巷以及多個車道的高速公路。道路上有其他交通工具、行人、流浪動物、道路工程、警車、水坑和坑洼。出租車還必須與潛在以及實際的乘客互動。另外,還有一些可選項。出租車可以選擇在很少下雪的南方或者經(jīng)常下雪的北方運營。顯然,環(huán)境越受限,設(shè)計問題就越容易解決。4.3.1指定任務(wù)環(huán)境自動駕駛出租車的執(zhí)行器包括可供人類駕駛員使用的器件,例如通過加速器控制發(fā)動機(jī)以及控制轉(zhuǎn)向和制動。此外,它還需要輸出到顯示屏或語音合成器,以便與乘客進(jìn)行對話,或許還需要某種方式與其他車輛進(jìn)行禮貌的或其他方式的溝通。4.3.1指定任務(wù)環(huán)境出租車的基本傳感器將包括一個或多個攝像頭以便觀察,以及激光雷達(dá)和超聲波傳感器以便檢測其他車輛和障礙物的距離。為了避免超速罰單,出租車應(yīng)該有一個速度表,而為了正確控制車輛(特別是在彎道上),它應(yīng)該有一個加速度表。要確定車輛的機(jī)械狀態(tài),需要發(fā)動機(jī)、燃油和電氣系統(tǒng)的傳感器常規(guī)陣列。像許多人類駕駛者一樣,它可能需要獲取北斗導(dǎo)航信號,這樣就不會迷路。最后,乘客需要觸摸屏或語音輸入才能說明目的地。4.3.1指定任務(wù)環(huán)境表4-2中簡要列舉了一些其他智能體類型的基本PEAS元素。這些示例包括物理環(huán)境和虛擬環(huán)境。注意,虛擬任務(wù)環(huán)境可能與“真實”世界一樣復(fù)雜。例如,在拍賣和轉(zhuǎn)售網(wǎng)站上進(jìn)行交易的軟件智能體,它為數(shù)百萬其他用戶和數(shù)十億對象提供交易業(yè)務(wù)。4.3.1指定任務(wù)環(huán)境表4-2智能體類型及其PEAS描述的示例4.3.1指定任務(wù)環(huán)境人工智能中可能出現(xiàn)的任務(wù)環(huán)境范圍非常廣泛。然而,我們可以確定少量的維度,并根據(jù)這些維度對任務(wù)環(huán)境進(jìn)行分類。這些維度在很大程度上決定了恰當(dāng)?shù)闹悄荏w設(shè)計以及智能體實現(xiàn)的主要技術(shù)系列的適用性。首先我們列出維度,然后分析任務(wù)環(huán)境,闡明思路。4.3.2任務(wù)環(huán)境的屬性完全可觀測與部分可觀測:如果智能體的傳感器能讓它在每個時間點都能訪問環(huán)境的完整狀態(tài),那么我們說任務(wù)環(huán)境是完全可觀測的。如果傳感器檢測到與動作選擇相關(guān)的所有方面,那么任務(wù)環(huán)境就是有效的完全可觀測的,而所謂的相關(guān)又取決于性能度量標(biāo)準(zhǔn)。完全可觀測的環(huán)境很容易處理,因為智能體不需要維護(hù)任何內(nèi)部狀態(tài)來追蹤世界。由于傳感器噪聲大且不準(zhǔn)確,或者由于傳感器數(shù)據(jù)中缺少部分狀態(tài),環(huán)境可能部分可觀測。4.3.2任務(wù)環(huán)境的屬性例如,只有一個局部灰塵傳感器的真空吸塵器無法判斷其他方格是否有灰塵,自動駕駛出租車無法感知其他司機(jī)的想法。如果智能體根本沒有傳感器,那么環(huán)境是不可觀測的。在這種情況下,有人可能會認(rèn)為智能體的困境是無解的,但是,智能體的目標(biāo)可能仍然可以實現(xiàn)。4.3.2任務(wù)環(huán)境的屬性單智能體與多智能體:單智能體和多智能體環(huán)境之間的區(qū)別似乎足夠簡單。例如,獨自解決縱橫字謎的智能體顯然處于單智能體環(huán)境中,而下國際象棋的智能體則處于二智能體環(huán)境中。然而,這里也有一些微妙的問題。首先,我們已經(jīng)描述了如何將一個實體視為智能體,但沒有解釋哪些實體必須視為智能體。智能體A(例如出租車司機(jī))是否必須將對象B(另一輛車)視為智能體,還是可以僅將其視為根據(jù)物理定律運行的對象,類似于海灘上的波浪或隨風(fēng)飄動的樹葉?關(guān)鍵的區(qū)別在于B的行為是否被最佳地描述為一個性能度量的最大化,而這一性能度景的值取決于智能體A的行為。4.3.2任務(wù)環(huán)境的屬性例如,國際象棋中的對手實體B正試圖最大化其性能度量,根據(jù)國際象棋規(guī)則,這將最小化智能體A的性能度量。因此,國際象棋是一個競爭性的多智能體環(huán)境。但是,在出租車駕駛環(huán)境中,避免碰撞使所有智能體的性能度量最大化,因此它是一個部分合作的多智能體環(huán)境,它還具有部分競爭性,例如,一個停車位只能停一輛車。多智能體環(huán)境中的智能體設(shè)計問題通常與單智能體環(huán)境下有較大差異。例如,在多智能體環(huán)境中,通信通常作為一種理性行為出現(xiàn):在某些競爭環(huán)境中,隨機(jī)行為是理性的,因為它避免了一些可預(yù)測性的陷阱。4.3.2任務(wù)環(huán)境的屬性確定性與非確定性:如果環(huán)境的下一個狀態(tài)完全由當(dāng)前狀態(tài)和智能體執(zhí)行的動作決定,那么我們說環(huán)境是確定性的,否則是非確定性的。原則上,在完全可觀測的確定性環(huán)境中,智能體不需要擔(dān)心不確定性。然而,如果環(huán)境是部分可觀測的,那么它可能是非確定性的。4.3.2任務(wù)環(huán)境的屬性大多數(shù)真實情況非常復(fù)雜,以至于不可能追蹤所有未觀測到的方面;出于實際目的,必須將其視為非確定性的。從這個意義上講,出租車駕駛顯然是非確定性的,因為人們永遠(yuǎn)無法準(zhǔn)確地預(yù)測交通行為。此外,輪胎可能會意外爆胎,發(fā)動機(jī)可能會在沒有警告的情況下失靈。我們描述的真空吸塵器世界是確定性的,但變化可能包括非確定性因素,如隨機(jī)出現(xiàn)的灰塵和不可靠的吸力機(jī)制。4.3.2任務(wù)環(huán)境的屬性最后注意一點,“隨機(jī)”與“非確定性”的不同。如果環(huán)境模型顯式地處理概率(例如,“明天的降雨可能性為25%”),那么它是隨機(jī)的;如果可能性沒有被量化,那么它是“非確定性的”(例如,“明天有可能下雨”)?;睾鲜脚c序貫:在回合式任務(wù)環(huán)境中,智能體的經(jīng)驗被劃分為原子式的回合,每接收一個感知,然后執(zhí)行單個動作。重要的是,下一回合并不依賴于前幾回合采取的動作。許多分類任務(wù)是回合式的。例如,在裝配流水線上檢測缺陷零件的智能體需要根據(jù)當(dāng)前零件做出每個決策,而無須考慮以前的決策;而且,當(dāng)前的決策并不影響下一個零件是否有缺陷。4.3.2任務(wù)環(huán)境的屬性但是,在序貫環(huán)境中,當(dāng)前決策可能會影響未來所有決策。國際象棋和出租車駕駛是序貫的:在這兩種情況下,短期行為可能會產(chǎn)生長期影響。在回合式環(huán)境下智能體不需要提前思考,所以要比序貫環(huán)境簡單很多。4.3.2任務(wù)環(huán)境的屬性靜態(tài)與動態(tài):如果環(huán)境在智能體思考時發(fā)生了變化,就說該智能體的環(huán)境是動態(tài)的,否則是靜態(tài)的。靜態(tài)環(huán)境容易處理,因為智能體在決定某個操作時不需要一直關(guān)注世界,也不需要擔(dān)心時間的流逝。但是,動態(tài)環(huán)境會不斷地詢問智能體想要采取什么行動,如果它還沒有決定,那就等同于什么都不做。如果環(huán)境本身不會隨著時間的推移而改變,但智能體的性能分?jǐn)?shù)會改變,我們就說環(huán)境是半動態(tài)的。駕駛出租車顯然是動態(tài)的,因為駕駛算法在計劃下一步該做什么時,其他車輛和出租車本身在不斷移動。在用時鐘計時的情況下國際象棋是半動態(tài)的。填字游戲是靜態(tài)的。4.3.2任務(wù)環(huán)境的屬性離散與連續(xù):這之間的區(qū)別適用于環(huán)境的狀態(tài)、處理時間的方式以及智能體的感知和動作。例如,國際象棋環(huán)境具有有限數(shù)量的不同狀態(tài)(不包括時鐘),國際象棋也有一組離散的感知和動作。駕駛出租車是一個連續(xù)狀態(tài)和連續(xù)時間的問題,出租車和其他車輛的速度和位置是一系列連續(xù)的值,并隨著時間平穩(wěn)地變化。出租車的駕駛動作也是連續(xù)的(轉(zhuǎn)向角等)。嚴(yán)格來說,來自數(shù)字照相機(jī)的輸入是離散的,但通常被視為表示連續(xù)變化的強(qiáng)度和位置。已知與未知:這種區(qū)別是指智能體(或設(shè)計者)對環(huán)境“物理定律”的認(rèn)知狀態(tài)。4.3.2任務(wù)環(huán)境的屬性在已知環(huán)境中,所有行動的結(jié)果(如果環(huán)境是非確定性的,則對應(yīng)結(jié)果的概率)都是既定的。顯然,如果環(huán)境未知,智能體將不得不了解它是如何工作的,才能做出正確的決策。已知和未知環(huán)境之間的區(qū)別與完全可觀測和部分可觀測環(huán)境之間的區(qū)別不同。一個已知的環(huán)境很可能是部分可觀測的,例如,在紙牌游戲中,知道規(guī)則但仍然無法看到尚未翻轉(zhuǎn)的牌。相反,一個未知環(huán)境可以是完全可觀測的,如一個全新的電子游戲,屏幕可能會顯示整個游戲狀態(tài),但在嘗試之前并不知道各個按鈕的作用。4.3.2任務(wù)環(huán)境的屬性性能度量本身可能是未知的,這可能是因為設(shè)計者不確定如何正確地描述,也可能是因為最終用戶(其偏好很重要)是未知的。例如,出租車司機(jī)通常不知道新乘客是喜歡悠閑還是快速的旅程,是喜歡謹(jǐn)慎還是激進(jìn)的駕駛風(fēng)格。虛擬個人助理一開始對其主人的個人喜好一無所知。在這種情況下,智能體可以基于與設(shè)計者或用戶的進(jìn)一步交互來了解更多關(guān)于性能度量的信息。繼而,這表明,任務(wù)環(huán)境必須被視為一個多智能體環(huán)境。4.3.2任務(wù)環(huán)境的屬性最困難的情況是部分可觀測的、多智能體的、非確定性的、序貫的、動態(tài)的、連續(xù)的且未知的。駕駛出租車除了駕駛員的環(huán)境大多是已知的,在所有其他方面都很難。在一個陌生的國家駕駛租來的汽車,那里有不熟悉的地理環(huán)境、不同的交通法規(guī)以及焦慮的乘客,這令人更加緊張。4.3.2任務(wù)環(huán)境的屬性表4-3列舉了許多熟悉環(huán)境的屬性。注意,這些屬性并不總是一成不變的。例如,將患者的患病過程作為智能體建模并不適合,所以我們將醫(yī)療診斷任務(wù)列為單智能體,但是醫(yī)療診斷系統(tǒng)還可能會應(yīng)對頑固的病人和多疑的工作人員,因此環(huán)境還具有多智能體的方面。此外,如果我們將任務(wù)設(shè)想為根據(jù)癥狀列表進(jìn)行診斷,那么醫(yī)療診斷是回合式的;如果任務(wù)包括提出一系列測試、評估治療過程中的進(jìn)展、處理多個患者等,那就是序貫的。4.3.2任務(wù)環(huán)境的屬性表4-3任務(wù)環(huán)境的例子及其特征4.3.2任務(wù)環(huán)境的屬性因為“已知的/未知的”不是嚴(yán)格意義上的環(huán)境屬性。對于某些環(huán)境,例如國際象棋和撲克,很容易為智能體提供完整的規(guī)則知識,但考慮智能體如何在沒有這些知識的情況下學(xué)會玩這些游戲仍然是有趣的。實驗通常不是針對單個環(huán)境進(jìn)行的,而是針對從環(huán)境類中抽象的許多環(huán)境進(jìn)行的。例如,要在模擬交通中評估出租車司機(jī),我們需要運行具有不同的交通狀況、照明和天氣條件的多次模擬,關(guān)注智能體在環(huán)境類上的平均性能。4.3.2任務(wù)環(huán)境的屬性PART04智能體的結(jié)構(gòu)我們通過描述行為(即在任意給定的感知序列之后執(zhí)行的動作)討論了智能體。下面我們來討論智能體內(nèi)部是如何工作的。人工智能的工作是設(shè)計一個智能體程序?qū)崿F(xiàn)智能體函數(shù),即從感知到動作的映射。假設(shè)該程序?qū)⑦\行在某種具有物理傳感器和執(zhí)行器的計算設(shè)備上,我們稱之為智能體架構(gòu):智能體=架構(gòu)+程序4.4智能體的結(jié)構(gòu)顯然,我們選擇的程序必須是適合相應(yīng)架構(gòu)的程序。如果程序打算推薦步行這樣的動作,那么對應(yīng)的架構(gòu)最好有腿。架構(gòu)可能只是一臺普通PC,也可能是一輛帶有多臺車載計算機(jī)、攝像頭和其他傳感器的機(jī)器人汽車。通常,架構(gòu)使程序可以使用來自傳感器的感知,然后運行程序,并將程序生成的動作選擇反饋給執(zhí)行器。4.4智能體的結(jié)構(gòu)我們考慮的智能體程序都有相同的框架:它們將當(dāng)前感知作為傳感器的輸入,并將動作返回給執(zhí)行器。注意智能體程序框架還有其他選擇。例如,可以讓智能體程序作為與環(huán)境異步運行的協(xié)程。每個這樣的協(xié)程都有一個輸入和輸出端口,并由一個循環(huán)組成,該循環(huán)讀取輸入端口的感知,并將動作寫到輸出端口。4.4.1智能體程序注意智能體程序(將當(dāng)前感知作為輸入)和智能體函數(shù)(可能依賴整個感知歷史)之間的差異。因為環(huán)境中沒有其他可用信息,所以智能體程序別無選擇,只能將當(dāng)前感知作為輸入。如果智能體的動作需要依賴于整個感知序列,那么智能體必須記住歷史感知。人工智能面臨的關(guān)鍵挑戰(zhàn)是找出編寫程序的方法,盡可能從一個小程序而不是從一個大表中產(chǎn)生理性行為。有4種基本的智能體程序,它們體現(xiàn)了幾乎所有智能系統(tǒng)的基本原理,每種智能體程序以特定的方式組合特定的組件來產(chǎn)生動作。4.4.1智能體程序(1)簡單反射型智能體。這是最簡單的智能體,它們根據(jù)當(dāng)前感知選擇動作,忽略感知歷史的其余部分。4.4.1智能體程序(2)基于模型的反射型智能體。處理部分可觀測性的最有效方法是讓智能體追蹤它現(xiàn)在觀測不到的部分世界。也就是說,智能體應(yīng)該維護(hù)某種依賴于感知歷史的內(nèi)部狀態(tài),從而反映當(dāng)前狀態(tài)的一些未觀測到的方面。對于剎車問題,內(nèi)部狀態(tài)范圍不僅限于攝像頭拍攝圖像的前一幀,要讓智能體能夠檢測車輛邊緣的兩個紅燈何時同時亮起或熄滅。對于其他駕駛?cè)蝿?wù),如變道,如果智能體無法同時看到其他車輛,則需要追蹤它們的位置。4.4.1智能體程序隨著時間的推移,更新這些內(nèi)部狀態(tài)信息需要在智能體程序中以某種形式編碼兩種知識。首先,需要一些關(guān)于世界如何隨時間變化的信息,這些信息大致可以分為兩部分:智能體行為的影響和世界如何獨立于智能體而發(fā)展。例如,當(dāng)智能體順時針轉(zhuǎn)動方向盤時,汽車就會向右轉(zhuǎn);而下雨時,汽車的攝像頭就會被淋濕。這種關(guān)于“世界如何運轉(zhuǎn)”的知識(無論是在簡單的布爾電路中還是在完整的科學(xué)理論中實現(xiàn))被稱為世界的轉(zhuǎn)移模型。4.4.1智能體程序其次,我們需要一些關(guān)于世界狀態(tài)如何反映在智能體感知中的信息。例如,當(dāng)前面的汽車開始剎車時,前向攝像頭的圖像中會出現(xiàn)一個或多個亮起的紅色區(qū)域;當(dāng)攝像頭被淋濕時,圖像中會出現(xiàn)水滴狀物體并部分遮擋道路。這種知識稱為傳感器模型。轉(zhuǎn)移模型和傳感器模型結(jié)合在一起讓智能體能夠在傳感器受限的情況下盡可能地跟蹤世界的狀態(tài)。使用此類模型的智能體稱為基于模型的智能體。4.4.1智能體程序(3)基于目標(biāo)的智能體。即使了解了環(huán)境的現(xiàn)狀也并不總是能決定做什么。例如,在一個路口,出租車可以左轉(zhuǎn)、右轉(zhuǎn)或直行。正確的決定還取決于出租車要去哪里。換句話說,除了當(dāng)前狀態(tài)的描述之外,智能體還需要某種描述理想情況的目標(biāo)信息,例如設(shè)定特定的目的地。智能體程序可以將其與模型相結(jié)合,并選擇實現(xiàn)目標(biāo)的動作。4.4.1智能體程序(4)基于效用的智能體。在大多數(shù)環(huán)境中,僅靠目標(biāo)并不足以產(chǎn)生高質(zhì)量的行為。例如,許多動作序列都能使出租車到達(dá)目的地,但有些動作序列比其他動作序列更快、更安全、更可靠或者更便宜。這個時候,目標(biāo)只是在“快樂”和“不快樂”狀態(tài)之間提供了一個粗略的二元區(qū)別。更一般的性能度量應(yīng)該允許根據(jù)不同世界狀態(tài)的“快樂”程度來對智能體進(jìn)行比較。經(jīng)濟(jì)學(xué)家和計算機(jī)科學(xué)家通常用效用這個詞來代替“快樂”,因為“快樂”聽起來不是很科學(xué)。4.4.1智能體程序我們已經(jīng)看到,性能度量會給任何給定的環(huán)境狀態(tài)序列打分,因此它可以很容易地區(qū)分到達(dá)出租車目的地所采取的更可取和更不可取的方式。智能體的效用函數(shù)本質(zhì)上是性能度量的內(nèi)部化。如果內(nèi)部效用函數(shù)和外部性能度量一致,那么根據(jù)外部性能度量選擇動作,以使其效用最大化的智能體是理性的。4.4.1智能體程序在圖靈早期的著名論文中,曾經(jīng)考慮了手動編程實現(xiàn)智能機(jī)器的想法。他估計了這可能需要多少工作量,并得出結(jié)論,“似乎需要一些更快捷的方法”。他提出的方法是構(gòu)造學(xué)習(xí)型機(jī)器,然后教它們。在人工智能的許多領(lǐng)域,這是目前創(chuàng)建最先進(jìn)系統(tǒng)的首選方法。任何類型的智能體(基于模型、基于目標(biāo)、基于效用等)都可以構(gòu)建(或不構(gòu)建)成學(xué)習(xí)型智能體。4.4.2學(xué)習(xí)型智能體學(xué)習(xí)還有另一個優(yōu)勢:它讓智能體能夠在最初未知的環(huán)境中運作,并變得比其最初的能力更強(qiáng)。學(xué)習(xí)型智能體可分為4個概念組件(圖4-4),其中,“性能元素”框表示我們之前認(rèn)為的整個智能體程序,“學(xué)習(xí)元素”框可以修改該程序以提升其性能。最重要的區(qū)別在于負(fù)責(zé)提升的學(xué)習(xí)元素和負(fù)責(zé)選擇外部行動的性能元素。性能元素是我們之前認(rèn)為的整個智能體:它接受感知并決定動作。學(xué)習(xí)元素使用來自評估者對智能體表現(xiàn)的反饋,并以此確定應(yīng)該如何修改性能元素以在未來做得更好。4.4.2學(xué)習(xí)型智能體圖4-4通用學(xué)習(xí)型智能體4.4.2學(xué)習(xí)型智能體學(xué)習(xí)元素的設(shè)計在很大程度上取決于性能元素的設(shè)計。當(dāng)設(shè)計者試圖設(shè)計一個學(xué)習(xí)某種能力的智能體時,第一個問題是“一旦智能體學(xué)會了如何做,它將使用什么樣的性能元素?”給定性能元素的設(shè)計,可以構(gòu)造學(xué)習(xí)機(jī)制來改進(jìn)智能體的每個部分。4.4.2學(xué)習(xí)型智能體評估者告訴學(xué)習(xí)元素:智能體在固定性能標(biāo)準(zhǔn)方面的表現(xiàn)如何。評估者是必要的,因為感知本身并不會指示智能體是否成功。例如,國際象棋程序可能會收到一個感知,提示它已將死對手,但它需要一個性能標(biāo)準(zhǔn)來知道這是一件好事。確定性能標(biāo)準(zhǔn)很重要。從概念上講,應(yīng)該把它看作完全在智能體之外,智能體不能修改性能標(biāo)準(zhǔn)以適應(yīng)自己的行為。4.4.2學(xué)習(xí)型智能體學(xué)習(xí)型智能體的最后一個組件是問題生成器。它負(fù)責(zé)建議動作,這些動作將獲得全新和信息豐富的經(jīng)驗。如果性能元素完全根據(jù)自己的方式,它會繼續(xù)選擇已知最好的動作。但如果智能體愿意進(jìn)行一些探索,并在短期內(nèi)做一些可能不太理想的動作,那么從長遠(yuǎn)來看,它可能會發(fā)現(xiàn)更好的動作。問題生成器的工作是建議這些探索性行動。這就是科學(xué)家在進(jìn)行實驗時所做的。伽利略并不認(rèn)為從比薩斜塔頂端扔石頭本身有價值。他并不是想要打碎石頭或改造不幸行人的大腦。他的目的是通過確定更好的物體運動理論來改造自己的大腦。4.4.2學(xué)習(xí)型智能體學(xué)習(xí)元素可以對智能體圖中顯示的任何“知識”組件進(jìn)行更改。最簡單的情況是直接從感知序列學(xué)習(xí)。觀察成對相繼的環(huán)境狀態(tài)可以讓智能體了解“我的動作做了什么”以及“世界如何演變”以響應(yīng)其動作。例如,如果自動駕駛出租車在濕滑路面上行駛時進(jìn)行一定程度的剎車,那么它很快就會發(fā)現(xiàn)實際減速多少,以及它是否滑出路面。問題生成器可能會識別出模型中需要改進(jìn)的某些部分,并建議進(jìn)行實驗,例如在不同條件下的不同路面上嘗試剎車。無論外部性能標(biāo)準(zhǔn)如何,改進(jìn)基于模型的智能體的組件,使其更好地符合現(xiàn)實幾乎總是一個好主意。4.4.2學(xué)習(xí)型智能體(從計算的角度來看,在某些情況下簡單但稍微不準(zhǔn)確的模型比完美但極其復(fù)雜的模型更好。)當(dāng)智能體試圖學(xué)習(xí)反射組件或效用函數(shù)時,需要外部標(biāo)準(zhǔn)的信息。從某種意義上說,性能標(biāo)準(zhǔn)將傳入感知的一部分區(qū)分為獎勵或懲罰,以提供對智能體行為質(zhì)量的直接反饋。更一般地說,人類的選擇可以提供有關(guān)人類偏好的信息。例如,假設(shè)出租車不知道人們通常不喜歡噪聲,于是決定不停地按喇叭以確保行人知道它即將到來。隨之而來的人類行為,如蓋住耳朵、說臟話甚至可能剪斷喇叭上的電線,將為智能體提供更新其效用函數(shù)的證據(jù)。4.4.2學(xué)習(xí)型智能體總之,智能體有各種各樣的組件,這些組件可以在智能體程序中以多種方式表示,因此學(xué)習(xí)方法之間似乎存在很大差異。然而,主題仍然是統(tǒng)一的:智能體中的學(xué)習(xí)可以概括為對智能體的各個組件進(jìn)行修改的過程,使各組件與可用的反饋信息更接近,從而提升智能體的整體性能。4.4.2學(xué)習(xí)型智能體智能體程序由各種組件組成,組件表示了智能體所處環(huán)境的各種處理方式。我們通過一個復(fù)雜性和表達(dá)能力不斷增加的方式來描述,即原子表示、因子化表示和結(jié)構(gòu)化表示。例如,我們來考慮一個特定的智能體組件,處理“我的動作會導(dǎo)致什么”。這個組件描述了采取動作的結(jié)果可能在環(huán)境中引起的變化。

圖4-5表示狀態(tài)及其轉(zhuǎn)移的3種方法4.4.3智能體程序組件的工作圖4-5(a)中,原子表示一個狀態(tài)(如B或C)是沒有內(nèi)部結(jié)構(gòu)的黑盒;圖4-5(b)中因子化表示狀態(tài)由屬性值向量組成,值可以是布爾值、實值或一組固定符號中的一個;圖4-5(c)中結(jié)構(gòu)化表示狀態(tài)包括對象,每個對象可能有自己的屬性以及與其他對象的關(guān)系。4.4.3智能體程序組件的工作在原子表示中,世界的每一個狀態(tài)都是不可分割的,它沒有內(nèi)部結(jié)構(gòu)。考慮這樣一個任務(wù):通過城市序列找到一條從某個國家的一端到另一端的行車路線。為了解決這個問題,將世界狀態(tài)簡化為所處城市的名稱就足夠了,這就是單一知識原子,也是一個“黑盒”,唯一可分辨的屬性是與另一個黑盒相同或不同。搜索和博弈中的標(biāo)準(zhǔn)算法、隱馬爾可夫模型以及馬爾可夫決策過程都基于原子表示。4.4.3智能體程序組件的工作因子化表示將每個狀態(tài)拆分為一組固定的變量或?qū)傩?,每個變量或?qū)傩远伎梢杂幸粋€值??紤]同一個駕駛問題,即我們需要關(guān)注的不僅僅是一個城市或另一個城市的原子位置,可能還需要關(guān)注油箱中的汽油量、當(dāng)前的北斗導(dǎo)航坐標(biāo)、油量警示燈是否工作、通行費、收音機(jī)頻道等。兩個不同的原子狀態(tài)沒有任何共同點(只是不同的黑盒),但兩個不同的因子化狀態(tài)可以共享某些屬性(如位于某個導(dǎo)航位置),而其他屬性不同(如有大量汽油或沒有汽油),這使得研究如何將一種狀態(tài)轉(zhuǎn)換為另一種狀態(tài)變得更加容易。人工智能的許多重要領(lǐng)域都基于因子化表示,包括約束滿足算法、命題邏輯、規(guī)劃、貝葉斯網(wǎng)絡(luò)以及各種機(jī)器學(xué)習(xí)算法。4.4.3智能體程序組件的工作此外,我們還需要將世界理解為存在著相互關(guān)聯(lián)的事物,而不僅僅是具有值的變量。例如,我們可能注意到前面有一輛卡車正在倒車進(jìn)入一個奶牛場的車道,但一頭奶牛擋住了卡車的路。這時就需要一個結(jié)構(gòu)化表示,可以明確描述諸如奶牛和卡車之類的對象及其各種不同的關(guān)系。結(jié)構(gòu)化表示是關(guān)系數(shù)據(jù)庫和一階邏輯、一階概率模型和大部分自然語言理解的基礎(chǔ)。事實上,人類用自然語言表達(dá)的大部分內(nèi)容都與對象及其關(guān)系有關(guān)。4.4.3智能體程序組件的工作PART05智能代理技術(shù)大部分的人工智能應(yīng)用都是一個獨立和龐大的程序系統(tǒng),通常系統(tǒng)在前期的實驗性操作取得成功之后,卻無法按比例放大至所需要的規(guī)模,因為系統(tǒng)將變得太過龐大而運作太慢。當(dāng)然,也可以利用其他途徑來擴(kuò)大規(guī)模,但常常又伴隨著難以理解甚至無法理解作為代價。因此,人們開發(fā)了智能代理來解決這些問題。智能代理的復(fù)雜性源于不同簡單程序間的相互作用。由于程序本身很小,行動范圍有限,所以系統(tǒng)是能夠被理解的。4.5智能代理技術(shù)智能代理是定期地收集信息或執(zhí)行服務(wù)的程序,它不需要人工干預(yù),具有高度智能性和自主學(xué)習(xí)性,可以根據(jù)用戶定義的準(zhǔn)則,主動地通過智能化代理服務(wù)器為用戶搜集最感興趣的信息,然后利用代理通信協(xié)議把加工過的信息按時推送給用戶,并能推測出用戶的意圖,自主制訂、調(diào)整和執(zhí)行工作計劃。通常,廣義的智能代理包括人類、物理世界中的移動機(jī)器人和信息世界中軟件機(jī)器人,而狹義的智能代理則專指信息世界中的軟件機(jī)器人,它是代表用戶或其他程序,以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論