人工智能通識教程 第2版 課件 第14、15章 自動規(guī)劃、人工智能發(fā)展_第1頁
人工智能通識教程 第2版 課件 第14、15章 自動規(guī)劃、人工智能發(fā)展_第2頁
人工智能通識教程 第2版 課件 第14、15章 自動規(guī)劃、人工智能發(fā)展_第3頁
人工智能通識教程 第2版 課件 第14、15章 自動規(guī)劃、人工智能發(fā)展_第4頁
人工智能通識教程 第2版 課件 第14、15章 自動規(guī)劃、人工智能發(fā)展_第5頁
已閱讀5頁,還剩190頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第2版人工智能通識教程第14章周蘇教授QQ:81505050自動規(guī)劃導讀案例:自動駕駛泊車技術自動泊車系統(tǒng)可以大大簡化泊車過程,特別是在極端狹窄的地方,或者是對于新手而言,自動泊車系統(tǒng)可以帶來更加智能和便捷的體驗。01規(guī)劃的概念02人工智能的烏姆普思世界03什么是自動規(guī)劃04規(guī)劃方法目錄/CONTENTS05時間、調度和資源規(guī)劃一系列動作是人工智能技術中智能體的關鍵需求,而正確表示的動作和狀態(tài)以及正確的算法可以使規(guī)劃變得更容易。自動規(guī)劃是一種重要的問題求解技術。與一般問題求解相比,自動規(guī)劃更注重于問題的求解過程,而不是求解結果。此外,規(guī)劃要解決的問題,如機器人世界問題,往往具有真實性,而不是比較抽象的數(shù)學模型問題。與一些求解技術相比,自動規(guī)劃系統(tǒng)與專家系統(tǒng)均屬高級求解系統(tǒng)與技術。第14章自動規(guī)劃

圖14-2自動裝箱規(guī)劃第14章自動規(guī)劃PART01規(guī)劃的概念所謂規(guī)劃,是指個人或組織制定的比較全面長遠的發(fā)展計劃,是對未來整體性、長期性、基本性問題的考量,以設計未來的整套行動方案。規(guī)劃是融合多要素、多人士看法的某一特定領域的發(fā)展愿景,它代表了人類為實現(xiàn)目標而對活動進行調整的一種某種自我意識和能力。在日常生活中,規(guī)劃意味著在行動之前決定其進程,或者說,是在執(zhí)行一個問題求解程序之前,計算該程序具體執(zhí)行的過程。規(guī)劃可用來監(jiān)控問題求解過程,并能夠在造成較大危害之前發(fā)現(xiàn)差錯。規(guī)劃的好處可歸納為簡化搜索、解決目標矛盾以及為差錯補償提供基礎。14.1規(guī)劃的概念規(guī)劃有兩個突出的特點,一是為了完成任務可能需要一系列確定的步驟;二是定義問題解決方案的步驟順序可能是有條件的。也就是說,構成規(guī)劃的步驟可能會根據(jù)條件進行修改(稱為條件規(guī)劃)。一個規(guī)劃是一個行動過程的描述,它雖然可以是像商品清單那樣的沒有次序的目標列表,但一般都具有某個目標的蘊含排序。例如,一個機器人要搬動某工件,必須先移動到該工件附近,抓住該工件,然后帶著工件移動。14.1規(guī)劃的概念大多數(shù)規(guī)劃都具有子規(guī)劃結構,具有分層結構的每個子目標由達到此目標的比較詳細的子規(guī)劃確定,最終得到的規(guī)劃是某個問題求解算符的線性或分步排序。14.1規(guī)劃的概念規(guī)劃的概念很多,具體可以整理成如下幾點:(1)從某個特定的問題狀態(tài)出發(fā),尋求一系列行為動作并建立一個操作序列,直到求得目標狀態(tài)為止,這個求解過程就是規(guī)劃;(2)規(guī)劃是關于動作的推理,它是一種抽象但清晰的深思熟慮的過程,該過程通過預期動作的期望效果,選擇和組織一組動作,其目的是盡可能好地實現(xiàn)一個預先給定的目標;14.1規(guī)劃的概念(3)規(guī)劃是針對某個待求解問題給出求解過程的步驟,規(guī)劃設計如何將問題分解為若干相應的子問題,記錄和處理問題求解過程中發(fā)現(xiàn)的子問題間的關系;(4)規(guī)劃系統(tǒng)是一個涉及有關問題求解過程的步驟的系統(tǒng)。14.1規(guī)劃的概念把某些較復雜的問題分解為一些較小的子問題。有兩條實現(xiàn)這種分解的重要途徑。第一條是當從一個問題狀態(tài)移動到下一個狀態(tài)時,無需計算整個新的狀態(tài),而只要考慮狀態(tài)中可能變化了的那些部分。第二條是把單一困難問題分割為幾個有希望較為容易解決的子問題。14.1規(guī)劃的概念PART02人工智能的烏姆普思世界這是一個簡單的世界示例。烏姆普思(Wumpus)世界是一個山洞,有4×4共16個房間,房間與通道相連,有一個商人(智能體)將在這個世界中移動。圖14-3烏姆普思世界14.2人工智能的烏姆普思世界山洞里的某一間屋子里有個叫烏姆普思的怪物,它會吃掉進屋的任何人。商人可以射殺烏姆普思,但他只有一枝箭。在烏姆普思世界中有一些深坑洞室(PIT),如果商人落在深坑中,會被永遠困在坑里。令人興奮的是,洞穴里有一個房間里有可能找到一大堆金子。因此,商人的目標是找到金子并爬出洞穴,而不會掉落坑中或被烏姆普思吞噬。如果商人帶金子出來,會得到獎勵;如果商人被烏姆普思吞下或掉進坑里,會受到懲罰。14.2人工智能的烏姆普思世界為解釋烏姆普思世界,對任務環(huán)境做如下描述。(1)性能指標:·如果商人帶著金子從烏姆普思世界中出來,可獲得1000點獎勵積分?!け粸跄菲账汲缘艋虻暨M坑里,點數(shù)為-1000分?!?1表示每個操作,-10表示使用箭?!と绻倘怂劳龌驈纳蕉闯鰜?,游戲就結束。14.2.1描述烏姆普思世界(2)環(huán)境:·4×4的房間網(wǎng)格?!ど倘俗畛跷挥诜块g正方形[1,1]中,朝向右側?!こ说谝粋€正方形[1,1]以外,都是隨機選擇烏姆普思和金子的位置?!こ谝粋€正方形以外,洞穴中每個正方形是坑室的概率為0.2。(3)執(zhí)行器:左轉、右轉、前進、抓取、發(fā)布、射擊。14.2.1描述烏姆普思世界(4)傳感器:·如果商人進到與烏姆普思相鄰的房間(不是對角線的),會聞到惡臭?!と绻倘诉M到與坑室相鄰的房間內,會感覺到微風?!ど倘四芨兄椒庞薪鹱拥姆块g中的閃光?!ど倘俗呦驂Ρ跁杏X到撞擊?!ど錃跄菲账紩r,它會發(fā)出可怕的尖叫聲,這在山洞的任何地方都可以感覺到。14.2.1描述烏姆普思世界·這些感知可以表示為五個元素列表。例如,如果商人聞到惡臭或者感到微風,但沒有閃光,沒有碰撞和尖叫聲,可以表示為:[惡臭,微風,無,無,無]。14.2.1描述烏姆普思世界(5)烏姆普思世界:·部分可觀察:因為商人只能感知附近的環(huán)境,例如相鄰的房間。·確定性的:因為世界的結果是已知的?!ろ樞虻模喉樞蚝苤匾!れo態(tài):烏姆普思和深坑不移動,是靜態(tài)的?!るx散的:環(huán)境是離散的?!ひ粋€智能體(商人):環(huán)境中只有一個智能體,烏姆普思不被視為智能體。14.2.1描述烏姆普思世界現(xiàn)在,我們來探索烏姆普思世界,并通過邏輯推理來確定商人如何找到目標。步驟1:商人位于第一個房間,即正方形[1,1]上,并且已知該房間對商人是安全的。因此,圖14-4(a)表示該房間是安全的。符號A代表商人,符號B代表微風,符號G代表閃光或金幣,符號V代表已訪問過的房間,符號P代表深坑,符號W代表烏姆普思。在[1,1]室,商人不會感到微風或惡臭,這意味著相鄰的正方形也是安全的。14.2.2探索烏姆普思世界

圖14-4探索烏姆普思世界的步驟1和步驟214.2.2探索烏姆普思世界步驟2:商人需要向前移動,因此它將移動到[1,2]或[2,1]。假設移動到房間[2,1],在這個房間商人感覺到微風,這意味著坑在這個房間周圍,可能在[3,1]或[2,2]中有坑室?,F(xiàn)在,商人停止思考,不采取任何措施,回到[1,1]房間。商人訪問過房間[1,1]和[2,1],因此使用符號V表示訪問過的正方形。14.2.2探索烏姆普思世界步驟3:商人移動到房間[1,2](圖14-5),這時商人聞到惡臭,這意味著附近有烏姆普思。而按照游戲規(guī)則,烏姆普思不能在房間[1,1]中,也不在[2,2]中(商人在[2,1]時沒有聞到惡臭)。因此,推斷出烏姆普思在房間[1,3]中,并且當前狀態(tài)下沒有微風,這意味著在[2,2]中沒有深坑也沒有烏姆普思,是安全的,將其標記為OK。商人在[2,2]中進一步移動。14.2.2探索烏姆普思世界

圖14-5探索烏姆普思世界的步驟3和步驟414.2.2探索烏姆普思世界步驟4:在房間[2,2]上,這里沒有惡臭,也沒有微風,所以我們假設商人決定移動到[2,3]。在[2,3]房間,商人感知到閃光,他抓住金子并爬出洞穴。14.2.2探索烏姆普思世界PART03什么是自動規(guī)劃自動規(guī)劃屬于高級的求解系統(tǒng)與技術。由于自動規(guī)劃系統(tǒng)具有廣泛的應用場合和應用前景,因而引起人們的濃厚興趣并取得了許多研究成果。14.3什么是自動規(guī)劃經(jīng)典規(guī)劃定義為是在一個離散的、確定性的、靜態(tài)的、完全可觀測的環(huán)境中,找到完成目標的一系列動作的任務。完成這個任務的方法受到兩個限制。首先,對于每個新領域,它們都需要特定的啟發(fā)式方法:用于搜索的啟發(fā)式評價函數(shù)和用于混合烏姆普思智能體的人工代碼。其次,它們都需要明確地表示指數(shù)量級的狀態(tài)空間。例如,在烏姆普思世界的命題邏輯模型中,向前移動一步的公理只能在所有4個智能體朝向、T個時間步和n個當前位置重復。14.3.1定義經(jīng)典規(guī)劃我們來看另外兩個例子。(1)范例:積木世界。這是最著名的規(guī)劃領域之一,這個問題由一組立方體形狀的積木組成,積木放在一張任意大的桌子上。積木可以堆疊,但只有一塊積木可以直接放在另一個上面。機械臂可以拿起一塊積木并將其放到另一個位置,可以是放在桌子上,也可以放在另一塊積木上。機械臂一次只能拿一塊積木,因此它無法拿起上面有另一塊積木的積木。一個典型的目標是使積木A在積木B上,并且積木B在積木C上(圖14-6)。14.3.1定義經(jīng)典規(guī)劃

圖14-6積木世界問題的示意圖14.3.1定義經(jīng)典規(guī)劃(2)范例:備用輪胎問題??紤]更換癟氣輪胎的問題。其目標是在車軸上正確安裝一只備用輪胎,而初始狀態(tài)是車軸上有一只癟氣輪胎,后備箱里有一只備用輪胎。為簡單起見,我們對這個問題的描述是抽象的,不考慮難擰的螺母之類的復雜問題。問題只有4種動作:從后備箱取出備用輪胎、從車軸上卸下癟氣輪胎、把備用輪胎裝在車軸上、把汽車留下整夜無人看管。我們假設汽車停在一個特別糟糕的街區(qū),因此把汽車留下整夜無人看管的效果是輪胎不見了。14.3.1定義經(jīng)典規(guī)劃規(guī)劃一直是人工智能研究的活躍領域,包括機器人技術、流程規(guī)劃、基于Web的信息收集、自主智能體、動畫和多智能體。

圖14-7規(guī)劃自動化立體庫14.3.2自動規(guī)劃問題人工智能中一些典型的規(guī)劃問題如:(1)對時間、因果關系和目的的表示和推理。(2)在可接受的解決方案中,物理和其他類型的約束。(3)規(guī)劃執(zhí)行中的不確定性。(4)如何感覺和感知“現(xiàn)實世界”。(5)可能合作或互相干涉的多個智能體。14.3.2自動規(guī)劃問題以機器人規(guī)劃與問題求解作為典型例子來討論自動規(guī)劃,是因為機器人規(guī)劃能夠得到形象和直觀的檢驗,它是機器人學的一個重要研究領域,也是人工智能與機器人學一個令人感興趣的結合點。機器人規(guī)劃的原理、方法和技術可以推廣應用到其他規(guī)劃對象或系統(tǒng)。雖然通常我們會將規(guī)劃和調度視為相同的問題類型,但它們之間有一個明確的區(qū)別:規(guī)劃關注“找出需要執(zhí)行哪些操作”,而調度關注“計算出何時執(zhí)行動作”。規(guī)劃側重于為實現(xiàn)目標選擇適當?shù)男袆有蛄?,而調度側重于資源約束(包括時間)??梢园颜{度問題當作規(guī)劃問題的一個特例。14.3.2自動規(guī)劃問題在人工智能領域,所有規(guī)劃問題的本質就是將當前狀態(tài)(可能是初始狀態(tài))轉變?yōu)樗枘繕藸顟B(tài)。求解規(guī)劃問題所遵循的步驟順序稱為操作符模式。操作符模式表征動作或事件(可互換使用的術語)。操作符模式表征一類可能的變量,這些變量可以用值(常數(shù))代替,構成描述特定動作的操作符實例?!安僮鞣边@個術語可以用作“操作符模式”或“操作符實例”的同義詞。14.3.2自動規(guī)劃問題在魔方的離散拼圖和15拼圖的移動方塊示例中可以找到熟悉的規(guī)劃應用,其中包括國際象棋、橋牌以及調度問題。由于運動部件的規(guī)律性和對稱性,這些領域非常適合開發(fā)和應用規(guī)劃算法。

魔方拼圖15拼圖圖14-8魔方拼圖與15拼圖示例14.3.3規(guī)劃問題示例計算機和機器人視覺領域的一個典型問題是試圖讓機器人識別墻壁和障礙物,在迷宮中移動并成功地到達其目標,如圖14-9,其中機器人不僅需要從A移動到B,還需要能夠識別墻壁并進行妥善處理。圖14-9一個典型的迷宮問題14.3.3規(guī)劃問題示例在設計和制造應用中,人們應用規(guī)劃來解決組裝、可維護性和機械部件拆卸問題。人們使用運動規(guī)劃,自動計算從組裝中移除零件的無碰撞路徑。在視頻游戲中,自動智能可以用來生成精彩、獨特、類似人類的角色。動畫師的目標是開發(fā)具有人類演員特征的角色,同時能夠設計高層次的運動描述,使得這些運動可以由智能體執(zhí)行。這是一個非常詳細、費力的逐幀過程,動畫師希望通過規(guī)劃算法的發(fā)展來減少這些過程。14.3.3規(guī)劃問題示例將自動規(guī)劃應用在計算機動畫中,根據(jù)任務規(guī)格計算場景中人物的動畫,使動畫師可以專注于場景的整體設計,而無須關注如何在逼真、無碰撞的路徑中移動人物的細節(jié)。這不但與計算機動畫相關,而且與人體工程學和產(chǎn)品的可用性評估相關。圖14-10所示的是一個機器人手臂規(guī)劃器,這個規(guī)劃器執(zhí)行了多臂任務,在汽車裝配線上協(xié)助制造。圖14-10在汽車裝配線上協(xié)助

制造的機器人手臂14.3.3規(guī)劃問題示例示例14-1說明制訂規(guī)劃過程和執(zhí)行規(guī)劃過程之間的區(qū)別。請規(guī)劃你離開家去工作場所的過程。你必須出席上午9:00的會議。早上上班的路上通常需要花費40分鐘。在準備上班的過程中,你還可以做一些自己喜歡做的任務——一些任務是非常重要的,一些任務是可有可無的,這取決于你可用的時間。14.3.3規(guī)劃問題示例下面所列出的是在工作前你認為要完成的一些任務。(1)將幾件襯衫送至干洗店。(2)將瓶子送去回收。(3)把垃圾拿出去。(4)在銀行的自動提款機上取現(xiàn)金。(5)以本地最便宜的價格購買汽油。(6)為自行車輪胎充氣。(7)清理汽車——整理和吸塵。(8)為汽車輪胎充氣。14.3.3規(guī)劃問題示例你可能立刻會問這些事情(以下按照規(guī)劃的觀點將它們稱為任務)的限制時間。也就是說,在保證你能夠準時參加會議的情況下,這些任務有多少可用的時間?你于上午7:00起床,認為兩個小時已經(jīng)足夠執(zhí)行上述許多任務,并能及時參加上午9:00的會議。14.3.3規(guī)劃問題示例在上述8項可能的任務中,你很快就會確定只有兩項是非常重要的:第4項(獲得現(xiàn)金)和第8項(為汽車輪胎充氣)。第4項很重要,因為根據(jù)經(jīng)驗,如果現(xiàn)金不足,那么你這一天會寸步難行。你需要購買餐點、小吃和其他可能的物品。第8項可能比第4項更重要,這取決于輪胎中還有多少氣。在極端情況下,輪胎癟了可能會導致你無法駕駛或無法安全駕駛。14.3.3規(guī)劃問題示例現(xiàn)在,你確定第4項和第8項很重要、不能避免。這就是分級規(guī)劃的例子,也就是對必須完成的任務進行分級或賦值。換句話說,并不是所有的任務都是同等重要的,你可以相應地對它們進行排序。你查詢是否有靠近銀行ATM的加油站,結論是最近的加油站距離銀行有約三個街區(qū)。你還可以想:“在銀行附近的哪個加油站會有輪胎的充氣泵?”這是一個機會規(guī)劃的例子。也就是說,你正在嘗試利用在規(guī)劃形成和規(guī)劃執(zhí)行過程中的某個狀態(tài)所提供的條件和機會。14.3.3規(guī)劃問題示例在這一點上,第1~3項看起來完全不重要;第6~7項看起來同樣不重要,并且這些任務更適合周末進行,因為周末可以有更多時間完成這樣的任務。在這些情況中,第1~3可能非常相關。14.3.3規(guī)劃問題示例第1項:將幾件襯衫送至干洗店。在繁忙的工作日上午,這看起來似乎是一項無關緊要的任務,但是,也許第二天你要接受新工作的面試,或者你想在做演講時穿得得體一些,或者這是你期待已久的一個約會。在這些情況下,你要正確思考(規(guī)劃),做正確的事情,獲得最佳機會,讓自己變得成功和快樂。14.3.3規(guī)劃問題示例第2項:將舊瓶子進行丟棄回收。同樣,這通常是一個“周末”型的活動。會不會有這樣一種情況使這件事情成為必需的行動?例如,假設你剛剛丟了錢包,而錢包里有你所有的現(xiàn)金、信用卡和身份證。為此,你需要將100個空瓶子送到回收站,以此來獲得必要的現(xiàn)金。此外,如果你丟了錢包,你就不應該在沒有駕駛證的情況下駕駛。如果真有這樣的事情發(fā)生了,你也許有足夠的理由不參加那次活動。14.3.3規(guī)劃問題示例第3項:把垃圾拿出去。在一些現(xiàn)實條件下,這個任務在重要性方面可以得到很大程度上的重視。例如:(1)垃圾散發(fā)出可怕的異味。(2)鄰居投訴你的公寓都是廢棄物,你有責任清理它。(3)這是星期一早上,如果現(xiàn)在不收拾,那么直到星期四才會有人來收拾垃圾。14.3.3規(guī)劃問題示例基于某些可能發(fā)生的事件或某些緊急情況所做出的規(guī)劃稱為條件規(guī)劃。這種規(guī)劃通常作為一種有用的“防御性”措施,或者必須考慮到一些可能發(fā)生的事件。例如,如果你計劃7月份在杭州舉辦大型活動,那么就應該考慮臺風保險。14.3.3規(guī)劃問題示例有時候,我們只能規(guī)劃事件(操作符)的某些子集,這些事件的子集可能會影響到我們達成目標,而無須特別關注這些步驟執(zhí)行的順序。我們將此稱為部分有序規(guī)劃。在示例14-1的情況下,如果輪胎的情況不是很糟糕,那么我們可以先去加油站充氣,也可以先到銀行取現(xiàn)金。但是,如果輪胎確實癟了,那么執(zhí)行該規(guī)劃的順序是先修理輪胎,然后進行其他任務。14.3.3規(guī)劃問題示例通過注意更多的現(xiàn)實情況,我們就可以結束這個例子了。即使兩個小時看起來像是花了大量的時間來處理一些事情,我們依然需要40分鐘的上班時間,但是人們很快就意識到,即使在這個簡單的情況下,也有許多未知數(shù)。例如,去加油站、充氣泵處或是銀行可以有很多條路線;在高速公路上可能會發(fā)生事故,拖延了上班時間;或者可能會有警察檢查、發(fā)生火警等突發(fā)情況,這些也會導致延遲。換句話說,有許多未知事件可能會干擾最佳規(guī)劃。14.3.3規(guī)劃問題示例PART04規(guī)劃方法規(guī)劃可用來監(jiān)控問題求解過程,并能夠在造成較大的危害之前發(fā)現(xiàn)差錯。規(guī)劃的好處可歸納為簡化搜索、解決目標矛盾以及為差錯補償提供基礎,以及把某些較復雜的問題分解為一些較小的子問題。14.4規(guī)劃方法規(guī)劃本質上是一個搜索問題,就計算步驟數(shù)、存儲空間、正確性和最優(yōu)性而言,這些都涉及到搜索技術的效率。找到一個有效的規(guī)劃,從初始狀態(tài)開始,并在目標狀態(tài)處結束,一般要涉及探索潛在大規(guī)模的搜索空間。如果有不同的狀態(tài)或部分規(guī)劃相互作用,事情會變得更加困難。因此,研究結果也證明了,即使是簡單的規(guī)劃問題在大小方面也可能是指數(shù)級的。14.4.1規(guī)劃即搜索1.狀態(tài)空間搜索早期的規(guī)劃工作集中在游戲和拼圖的“合法移動”方面,觀察是否可以發(fā)現(xiàn)一系列的移動將初始狀態(tài)轉換到目標狀態(tài),然后應用啟發(fā)式來評估到達目標狀態(tài)的“接近度”——這些技術己經(jīng)應用到規(guī)劃領域了。14.4.1規(guī)劃即搜索2.中間結局分析最早的人工智能系統(tǒng)的一般問題求解器(GPS)使用了一種稱為“中間結局分析”的問題求解和規(guī)劃技術,在中間結局分析背后的主要思想是減少當前狀態(tài)和目標狀態(tài)之間的距離。也就是說,如果要測量兩個城市之間的距離,算法將選擇能夠在最大程度上減少到目標城市距離的“移動”,而不考慮是否存在機會從中間城市達到目標城市。這是一個貪心算法,它對所到過的位置沒有任何記憶,對其任務環(huán)境沒有特定的知識。14.4.1規(guī)劃即搜索例如,你想從紐約市到加拿大的渥太華,距離是682千米,估計需要約9小時的車程。飛機只需要1小時,但由于這是一次國際航班,費用高達600美元。對于這個問題,中間結局分析自然偏向飛行,但這是非常昂貴的。一個有趣的可替代方法是結合了時間和金錢的成本效率,同時允許充分的自由,即飛往紐約州錫拉丘茲(最接近渥太華的美國大城市),然后租一輛車開車到渥太華。注意到就推薦的解決方案而言,可能會有一些關鍵性因素。例如,你必須考慮租車的實際成本,你將在渥太華度過的天數(shù)以及你是否真的需要在渥太華開車。根據(jù)這些問題的答案,你可以選擇公共汽車或火車來滿足部分或全部的交通需求。14.4.1規(guī)劃即搜索3.規(guī)劃中的各種啟發(fā)式搜索方法狀態(tài)空間(非智能、窮盡)的搜索技術可能會導致巨大的探索工作量,為此,我們簡要介紹為此開發(fā)的各種啟發(fā)式搜索技術。(1)最小承諾搜索。是指“規(guī)劃器的任何方面,只有在受到某些約束迫使的情況下,才承諾特定的選擇”。比如說,你打算搬到一所新的公寓。首先,你根據(jù)自己的收入水平選定合適的城鎮(zhèn)和社區(qū),不需要決定將要居住的區(qū)塊、建筑和具體的公寓。這些決定可以推遲到更晚、更適合的時間做出。14.4.1規(guī)劃即搜索(2)選擇并承諾。這是一種獨特的規(guī)劃搜索技術,這種方法并不能激發(fā)太多的信心。它是指基于局部信息(類似于中間結局分析),遵循一條解決路徑的新技術,它通過做出的決策(承諾)得到測試。使用這種方式測試的其他規(guī)劃器可以集成到稍后的規(guī)劃器中,然后可以搜索替代方案。當然,如果對一條路徑的承諾沒有產(chǎn)生解就會存在問題。14.4.1規(guī)劃即搜索(3)深度優(yōu)先回溯。是考慮替代方案的一種簡單方法,特別是當只有少數(shù)解決方案可供選擇時。這種方法涉及在有替代解決方案的位置保存解決方案路徑的狀態(tài),選中第一個替代路徑,備份搜索;如果沒有找到解決方案,則選擇下一個替代路徑。通過部分實例化操作符來查看是否已經(jīng)找到解決方案,測試這些分支的過程被稱為“舉起”。(4)集束搜索。它與其他啟發(fā)式方法一起實現(xiàn),選擇“最佳”解決方案,也許是由集束搜索建議子問題的“最佳”解決方案。14.4.1規(guī)劃即搜索(5)主因最佳回溯。通過搜索空間的回溯,雖然可能得到解決方案,但是在多個層次中所需要探索的節(jié)點數(shù)量龐大,所以這可能非常昂貴。主因最佳回溯花費更多的努力,確定了在特定節(jié)點所備份的局部選擇是最佳選擇。作為一個類比,讓我們回到選擇生活在某個城鎮(zhèn)的問題??紤]候選地區(qū)的兩個主要因素是距離和價格。根據(jù)這些因素,我們找到最理想的區(qū)域。14.4.1規(guī)劃即搜索但是現(xiàn)在,我們必須在可能的5~10個合理候選城鎮(zhèn)中做出決定,為此必須考慮更多的因素。①學校設置怎么樣(為了小孩)?②在這個地區(qū)購物是否便利?③這個城鎮(zhèn)安全嗎?④它距離中心區(qū)域有多遠(運輸)?⑤這個地區(qū)有哪些景點?14.4.1規(guī)劃即搜索當進行評估時,基于公寓的價格和每個候選城鎮(zhèn)到你工作地點的距離,再加上上述5個附加因素,你應該可以選擇一個城鎮(zhèn),然后繼續(xù)進行搜索,進而選擇一處適當?shù)墓ⅰR坏┻x定了城鎮(zhèn),就可以查看這個城鎮(zhèn)某些公寓的可用性和適用性。如有必要,可以重新評估其他城鎮(zhèn)的可能性,并選擇另一個城鎮(zhèn)(基于兩個主要因素和5個次要因素)作為主要選擇。這就是主因最佳回溯算法的工作原理。14.4.1規(guī)劃即搜索(6)依賴導向式搜索。回溯到保存狀態(tài)并恢復搜索可能帶來極大的浪費。實踐證明,存儲決策之間的依賴關系所做出的假設和可以做出選擇的替代方案可能更有用、更有效。通過重建解決方案中的所有依賴部分,系統(tǒng)避免了失敗,同時不相關的部分也可以保持不變。(7)機會式搜索。基于“可執(zhí)行的最受約束的操作”。所有問題求解組件都可以將其對解決方案的要求歸結為對解決方案的約束,或對表示被操作對象的變量值的限制。操作可以暫停,直到有進一步可用信息。14.4.1規(guī)劃即搜索(8)元級規(guī)劃。是從各種規(guī)劃選項中進行推理和選擇的過程。一些規(guī)劃系統(tǒng)具有類似操作符表示的規(guī)劃轉換可供規(guī)劃器使用。系統(tǒng)執(zhí)行獨立的搜索,在任何點上,確定最適合應用哪個操作符。這些動作發(fā)生在做出任何關于規(guī)劃應用的決策之前。(9)分布式規(guī)劃。系統(tǒng)在一群專家中分配子問題,讓他們求解這些問題,在通過黑板進行溝通的專家之間傳遞子問題并執(zhí)行子問題。這里總結回顧了在規(guī)劃中使用的搜索方法。人工智能的自動規(guī)劃領域已經(jīng)開發(fā)了一些技術來限制所需要的搜索量。14.4.1規(guī)劃即搜索部分有序規(guī)劃(POP)被定義為“事件(操作符)的某個子集可以實現(xiàn)、達到目標,而無須特別關注執(zhí)行步驟的順序?!痹诓糠钟行蛞?guī)劃器中,可以使用操作符的部分有序網(wǎng)絡表示規(guī)劃。在制訂規(guī)劃過程中,只有當問題請求操作符之間存在有序鏈時,才引進它,在這個意義上,部分有序規(guī)劃器表現(xiàn)為最小承諾。相比之下,完全有序規(guī)劃器使用操作符序列表示其搜索空間中的規(guī)劃。14.4.2部分有序規(guī)劃部分有序規(guī)劃通常有以下3個組成部分。(1)動作集。例如:{開車上班,穿衣服,吃早餐,洗澡}。(2)順序約束集。例如:{洗澡,穿衣服,吃早餐,開車去上班}。(3)因果關系鏈集。例如:穿衣服——著裝→開車去上班。這里的因果關系鏈是,如果你不想沒穿衣服就開車,那么請在開車上班前穿好衣服!在不斷完善和實現(xiàn)部分規(guī)劃時,這種鏈有助于撿測和防止不一致。在標準搜索中,節(jié)點等于具體世界(或狀態(tài)空間)中的狀態(tài)。14.4.2部分有序規(guī)劃在規(guī)劃世界中,節(jié)點是部分規(guī)劃。因此,部分規(guī)劃包括以下內容?!げ僮鞣麘贸绦蚣疭i?!げ糠郑〞r間)順序約束Si<Sj。·因果關系鏈Si—→Sj。操作符是在因果關系條件上的動作,可以用來獲得開始條件。開始條件是未被因果關系鏈接的動作的前提條件。14.4.2部分有序規(guī)劃這些步驟組合形成一個部分規(guī)劃:·為獲得開始條件,使用因果關系鏈描述動作。·從現(xiàn)有動作到開始條件過程中,做出因果關系鏈?!ぴ谏鲜霾襟E之間做出順序約束。圖14-11描繪了一個簡單的部分有序規(guī)劃。這個規(guī)劃在家開始,在家結束。

圖14-11部分有序規(guī)劃14.4.2部分有序規(guī)劃在部分有序規(guī)劃中,不同的路徑(如首先選擇去加油站還是銀行)不是可選規(guī)劃,而是可選動作。如果每個前提條件都能達成(我們到銀行和加油站,然后安全回家),我們就說規(guī)劃完成了。當動作順序完全確定后,部分有序規(guī)劃成了完全有序規(guī)劃。例如,如果發(fā)現(xiàn)汽車的油箱幾乎是空的,當且僅當達成每個前提條件時,規(guī)劃才能算完成。當一些動作Sk發(fā)生時,這阻止我們實現(xiàn)規(guī)劃中所有前提條件,阻礙了規(guī)劃的執(zhí)行,我們就說發(fā)生了對規(guī)劃的威脅。威脅是一個潛在的干擾步驟,阻礙因果關系達成條件。14.4.2部分有序規(guī)劃在上面的例子中,如果車子沒有啟動,那么這個威脅就可能會推翻“最好的規(guī)劃”??傊斉c良好的問題描述結合時,部分有序規(guī)劃是一種健全、完整、有效的規(guī)劃方法。如果失敗,它可以回溯到選擇點,但它對子目標的順序非常敏感。14.4.2部分有序規(guī)劃并不是所有的任務都處于同一個重要級別,一些任務必須在進行其他任務之前完成,而其他任務可能會交錯進行。層次結構有助于降低復雜性。分級規(guī)劃通常由動作描述庫組成,而動作描述包含了執(zhí)行組成規(guī)劃的一些前提條件的操作符。其中一些動作描述被“分解”成多個子動作,在更詳細(較低)級別上操作。因此,一些子動作被定義為“原語″,即不能進一步分為更簡單任務。14.4.3分級規(guī)劃在實際應用中,分級規(guī)劃已經(jīng)得到廣泛部署,如物流、軍事運行規(guī)劃、危機應對(例如漏油)、生產(chǎn)線調度、施工規(guī)劃,又如任務排序、衛(wèi)星控制的空間應用和軟件開發(fā)。14.4.3分級規(guī)劃基于案例的推理是一種經(jīng)典的人工智能技術,它描述某個世界中狀態(tài)的先前實例,并確定新情況與先前情況的相符程度。在基于案例的規(guī)劃中,學習的過程是通過規(guī)劃重演以及通過在類似情況下工作過的先前規(guī)劃進行“派生類比”。基于案例的規(guī)劃側重于應用過去的成功規(guī)劃以及從過去失敗的規(guī)劃中恢復。14.4.4基于案例的規(guī)劃基于案例的規(guī)劃器設計用于尋找以下問題的解決方案:·規(guī)劃內存表示是指決定存儲的內容以及如何組織內存的問題,以便有效并高效地檢索和重用舊規(guī)劃。·規(guī)劃檢索處理檢索一個或多個解決過類似當前問題的規(guī)劃問題。·規(guī)劃重用解決為滿足新問題而能夠重新利用已檢索的規(guī)劃問題?!ひ?guī)劃修訂是指成功測試新規(guī)劃,如果規(guī)劃失敗了,則修復規(guī)劃的問題?!ひ?guī)劃保留處理存儲新規(guī)劃的問題,以便用于將來的規(guī)劃。通常情況下,如果新規(guī)劃失敗了,則此規(guī)劃與一些導致其失敗的原因一起被存儲。14.4.4基于案例的規(guī)劃基于案例的規(guī)劃器使用合理的局部選擇,積累和協(xié)商成功的規(guī)劃。重復使用部分匹配所學習到的經(jīng)驗,新問題只需要相似就可以重新使用規(guī)劃,這樣所學的片斷就不需要為其正確性做解釋,因此也就不需要完整的領域理論。在局部決策中的學習可以增加所學知識的轉移(但是也增加了匹配成本),因此還需要定義在規(guī)劃情況之間相似性度量。為了完成此類任務,現(xiàn)代規(guī)劃系統(tǒng)通常與機器學習方法相關聯(lián)。14.4.4基于案例的規(guī)劃規(guī)劃結合了人工智能的兩個主要領域;搜索和邏輯。一個規(guī)劃器可以被看作一個搜索解的程序,或者是一個(構造性地)證明解存在的程序。這兩個領域的思想相互滲透,使規(guī)劃器能夠從動作和狀態(tài)數(shù)量為十幾個的玩具問題擴展到具有數(shù)百萬狀態(tài)和數(shù)千動作的實際工業(yè)應用。規(guī)劃首先是一種控制組合爆炸的方法。如果一個領域中有n個命題,那么就有2n個狀態(tài)。為應對這種悲觀情況,找出獨立子問題可能是一個強大的武器。最好情況下——問題完全可分解——我們會得到指數(shù)級的加速。然而,動作之間的負相互作用破壞了可分解性。14.4.5規(guī)劃方法分析遺憾的是,我們還沒有清楚地了解哪種技術對哪種類型的問題最有效。新技術很可能還會出現(xiàn),也許會提供一種具有高度表現(xiàn)力的方法的整合,并具有當今占主導地位的高效因子化表示和命題化表示。我們可以看到一些組合規(guī)劃系統(tǒng)正在出現(xiàn),它們的算法集可用來求解任意給定的問題。這既可以是選擇性的(系統(tǒng)對每個新問題進行分類以選擇最佳算法),也可以是并行的(所有算法都同時運行在不同的CPU上),或者根據(jù)調度輪流運行算法。14.4.5規(guī)劃方法分析PART05時間、調度和資源經(jīng)典的規(guī)劃討論的是要做什么、以什么順序,但不討論時間:動作需要多長時間以及何時發(fā)生。例如,在機場領域,我們可以生成一份規(guī)劃,說明哪些飛機要去哪里、攜帶什么,但不能指定起飛和到達時間——這是調度所討論的主題。14.5時間、調度和資源真實世界還存在資源約束:航空公司的員工數(shù)量有限,一名乘務員不能同時執(zhí)飛兩個航班。我們來了解資源約束下解決規(guī)劃和調度問題的技術。我們采取的方法是“先規(guī)劃,后調度”:整個問題劃分成在順序約束下選擇動作以達到問題目標的規(guī)劃階段,和之后為規(guī)劃添加時間信息來確保它符合資源和截止時間約束的調度階段。這種方法在真實世界的制造業(yè)和物流場景中很常見,其中規(guī)劃階段有時是自動化的,而有時由人類專家進行。14.5時間、調度和資源典型的作業(yè)車間調度問題由一組作業(yè)組成,每個作業(yè)都有一組動作,這些動作之間有順序約束。每個動作都有一個持續(xù)時間和一組動作所需的資源約束。約束指定資源的類型(例如螺釘、扳手或飛行員)、所需資源的數(shù)量、資源是否是消耗型的(例如,螺釘不可再用)或可復用的(例如,一個飛行員飛行期間沒有空,但在飛行結束后可再次執(zhí)飛下個航班)。動作也可以產(chǎn)生資源(例如,制造動作和再供應動作)。14.5.1時間約束和資源約束的表示作業(yè)車間調度問題的解決方案指定了每個動作的開始時間,并且必須滿足所有的時間順序約束和資源約束。與搜索和規(guī)劃問題一樣,解決方案可以根據(jù)代價函數(shù)進行評估,這可能非常復雜,存在非線性資源成本、依賴于時間的延遲成本等。為簡單起見,我們假設成本函數(shù)就是規(guī)劃的總持續(xù)時間,稱為最大完工時間。14.5.1時間約束和資源約束的表示我們從忽略資源約束,只考慮時間調度問題開始。為了最小化最大完工時間(規(guī)劃持續(xù)時間),必須找到與問題提供的順序約束一致的所有動作的最早開始時間,將這些順序約束視為與動作相關的有向圖會很有幫助。14.5.2解決調度問題我們可以應用關鍵路徑方法,以確定每個動作可能的開始時間和結束時間。關鍵路徑是總持續(xù)時間最長的路徑,這條路徑是“關鍵的”,因為它決定了整體規(guī)劃的持續(xù)時間-縮短其他路徑并不會縮短整體規(guī)劃,但是延遲關鍵路徑上的任何動作的開始時間都會減慢整體規(guī)劃的進度。不在關鍵路徑上的動作有一個執(zhí)行時間窗口。窗口由最早可能開始時間ES和最晚可能開始時間LS指定。LS-ES的量稱為動作的松弛。所有動作的ES和LS時間一起構成了問題的調度。14.5.2解決調度問題從數(shù)學上講關鍵路徑問題容易求解,當引入資源約束時,在開始時間和結束時間上產(chǎn)生的約束將變得更加復雜。到目前為止,我們假設動作集和順序約束是固定的。在這些假設下,每個調度問題都可以通過可避免所有資源沖突的不重疊序列來求解,只要每個動作本身是可行的。然而,如果一個調度問題被證明是非常困難的,那么以這種方式求解可能不是一個好主意,更好的方法是重新考慮動作和約束,也許會產(chǎn)生一個簡單得多的調度問題。因此,通過在規(guī)劃的構建過程中考慮持續(xù)時間和重疊部分來整合規(guī)劃和調度是有意義的。14.5.2解決調度問題第2版人工智能通識教程第15章周蘇教授QQ:81505050人工智能發(fā)展導讀案例:科學家發(fā)現(xiàn)新的人類腦細胞關于人類大腦最令人感興趣的問題之一,也是神經(jīng)科學家們最難回答的問題之一,即:是什么能讓人類大腦與其他動物的大腦區(qū)別開來。01創(chuàng)新發(fā)展與社會影響02倫理與安全03人工智能的極限04人工智能架構目錄/CONTENTS05人工智能的機遇與挑戰(zhàn)06未來的人工智能人工智能技術的三大結合領域分別是大數(shù)據(jù)、物聯(lián)網(wǎng)和邊緣計算(云計算)。經(jīng)過多年的發(fā)展,大數(shù)據(jù)目前在技術體系上已經(jīng)趨于成熟,而且機器學習也是大數(shù)據(jù)分析比較常見的方式。物聯(lián)網(wǎng)是人工智能的基礎,也是未來智能體重要的落地應用場景,所以學習人工智能技術也離不開物聯(lián)網(wǎng)知識。人工智能領域的研發(fā)對于數(shù)學基礎的要求比較高,具有扎實的數(shù)學基礎對于掌握人工智能技術很有幫助。

圖15-2人工智能的未來第15章人工智能發(fā)展2018年9月17日首屆世界人工智能大會在上海開幕,習近平總書記致信祝賀并強調指出:人工智能發(fā)展應用將有力提高經(jīng)濟社會發(fā)展智能化水平,有效增強公共服務和城市管理能力。學習領會習總書記關于人工智能的一系列重要論述,務實推進我國《新一代人工智能發(fā)展規(guī)劃》,有效規(guī)避人工智能“鴻溝”,著力收獲人工智能“紅利”,對將我國建設成為世界科技強國、實現(xiàn)“兩個一百年”的奮斗目標具有重大戰(zhàn)略意義。第15章人工智能發(fā)展PART01創(chuàng)新發(fā)展與社會影響經(jīng)過數(shù)十年的發(fā)展,人工智能取得突破性的發(fā)展,在經(jīng)濟社會各領域得到廣泛應用并引領著新一輪的產(chǎn)業(yè)變革,推動人類社會進入智能化時代。世界各發(fā)達國家都制定了發(fā)展人工智能的國家戰(zhàn)略,我國也于2017年發(fā)布了《新一代人工智能發(fā)展規(guī)劃》,國家各大部委和一些地方政府相繼出臺了推動人工智能發(fā)展的相關政策文件,社會各界對人工智能的重大戰(zhàn)略意義形成廣泛共識。15.1創(chuàng)新發(fā)展與社會影響人們研究了各種不同的智能體設計,從反射型智能體到基于知識的決策論智能體,再到使用強化學習的深度學習智能體都有涉及。將這些設計組合起來的技術也是多樣的:可以使用邏輯推理、概率推理或神經(jīng)推理,可以使用狀態(tài)的原子表示、因子化表示或結構化表示,對各種類型的數(shù)據(jù)使用不同的學習算法,以及多種與外界交互的傳感器和執(zhí)行器??梢钥吹饺斯ぶ悄茉卺t(yī)學、金融、交通、通信以及其他領域的各種應用,人們在科學認識和技術能力上都取得了長足的進步。15.1創(chuàng)新發(fā)展與社會影響總體上看,人工智能的發(fā)展具有“四新”特征:(1)以深度學習為代表的人工智能核心技術取得新突破;(2)“智能+”模式的普適應用為經(jīng)濟社會發(fā)展注入新動能;(3)人工智能成為世界各國競相戰(zhàn)略布局的新高地;(4)人工智能的廣泛應用給人類社會帶來法律法規(guī)、道德倫理、社會治理等一系列新挑戰(zhàn)。人們普遍認可人工智能的蓬勃興起將帶來新的社會文明,推動產(chǎn)業(yè)變革,深刻改變人們的生產(chǎn)生活方式,是一場影響深遠的科技革命。15.1創(chuàng)新發(fā)展與社會影響人工智能的目標是模擬、延伸和擴展人類智能,探尋智能本質,發(fā)展類人智能機器,其探索之路充滿未知且曲折起伏。通過總結人工智能發(fā)展歷程中的經(jīng)驗和教訓,可以得到以下啟示:(1)尊重發(fā)展規(guī)律是推動學科健康發(fā)展的前提。科學技術的發(fā)展有其自身的規(guī)律,人工智能學科發(fā)展需要基礎理論、數(shù)據(jù)資源、計算平臺、應用場景的協(xié)同驅動,當條件不具備時很難實現(xiàn)重大突破。15.1.1人工智能發(fā)展的啟示(2)基礎研究是學科可持續(xù)發(fā)展的基石。加拿大多倫多大學杰弗里·辛頓教授堅持研究深度神經(jīng)網(wǎng)絡30年,奠定人工智能蓬勃發(fā)展的重要理論基礎。谷歌DeepMind團隊長期深入研究神經(jīng)科學啟發(fā)的人工智能等基礎問題,取得了阿爾法狗等一系列重大成果。15.1.1人工智能發(fā)展的啟示(3)應用需求是科技創(chuàng)新的不竭之源。引領學科發(fā)展的動力主要來自于科學和需求的雙輪驅動。人工智能發(fā)展的驅動力除了知識與技術體系內在矛盾外,貼近應用、解決用戶需求是創(chuàng)新的最大源泉與動力。比如人工智能專家系統(tǒng)實現(xiàn)了從理論研究走向實際應用的突破,安防監(jiān)控、身份識別、無人駕駛、互聯(lián)網(wǎng)和物聯(lián)網(wǎng)、大數(shù)據(jù)分析等應用需求帶動了人工智能的技術突破。15.1.1人工智能發(fā)展的啟示(4)學科交叉是創(chuàng)新突破的“捷徑”。人工智能研究涉及信息科學、腦科學、心理科學等,上世紀50年代人工智能的出現(xiàn)本身就是學科交叉的結果。特別是腦認知科學與人工智能的成功結合,帶來了人工智能神經(jīng)網(wǎng)絡幾十年的持久發(fā)展。智能本源、意識本質等一些基本科學問題正在孕育重大突破,對人工智能學科發(fā)展具有重要促進作用。15.1.1人工智能發(fā)展的啟示(5)寬容失敗是支持創(chuàng)新的題中應有之義。任何學科的發(fā)展都不可能一帆風順,任何創(chuàng)新目標的實現(xiàn)都不會一蹴而就。人工智能60余載的發(fā)展生動地詮釋了一門學科創(chuàng)新發(fā)展起伏曲折的歷程。可以說沒有過去發(fā)展歷程中的“寒冬”就沒有今天人工智能發(fā)展新的春天。15.1.1人工智能發(fā)展的啟示(6)實事求是設定發(fā)展目標是制定學科發(fā)展規(guī)劃的基本原則。達到全方位類人水平的機器智能是人工智能學科宏偉的終極目標,但是需要根據(jù)科技和經(jīng)濟社會發(fā)展水平來設定合理的階段性研究目標,否則會有挫敗感從而影響學科發(fā)展,人工智能發(fā)展過程中的幾次低谷皆因不切實際的發(fā)展目標所致。15.1.1人工智能發(fā)展的啟示從技術維度來看,人工智能技術突破集中在專用智能,但是通用智能發(fā)展水平仍處于起步階段;從產(chǎn)業(yè)維度來看,人工智能創(chuàng)新創(chuàng)業(yè)如火如荼,技術和商業(yè)生態(tài)已見雛形;從社會維度來看,世界主要國家紛紛將人工智能上升為國家戰(zhàn)略,人工智能社會影響日益凸顯。15.1.2人工智能的發(fā)展現(xiàn)狀與影響(1)專用人工智能取得重要突破。面向特定領域的人工智能技術(即專用人工智能)由于任務單一、需求明確、應用邊界清晰、領域知識豐富、建模相對簡單,因此形成了人工智能領域的單點突破,在局部智能水平的單項測試中可以超越人類智能。人工智能的近期進展主要集中在專用智能領域,統(tǒng)計學習是專用人工智能走向實用的理論基礎。深度學習、強化學習、對抗學習等統(tǒng)計機器學習理論在計算機視覺、語音識別、自然語言理解、人機博弈等方面取得成功應用。15.1.2人工智能的發(fā)展現(xiàn)狀與影響例如,阿爾法狗在圍棋比賽中戰(zhàn)勝人類冠軍,人工智能程序在大規(guī)模圖像識別和人臉識別中達到了超越人類的水平,語音識別系統(tǒng)5.1%的錯誤率比肩專業(yè)速記員,人工智能系統(tǒng)診斷皮膚癌達到專業(yè)醫(yī)生水平,等等。15.1.2人工智能的發(fā)展現(xiàn)狀與影響(2)通用人工智能尚處于起步階段。人的大腦是一個通用的智能系統(tǒng),能舉一反三、融會貫通,可處理視覺、聽覺、判斷、推理、學習、思考、規(guī)劃、設計等各類問題,可謂“一腦萬用”。真正意義上完備的人工智能系統(tǒng)應該是一個通用的智能系統(tǒng)。美國國防高級研究計劃局把人工智能發(fā)展分為三個階段:規(guī)則智能、統(tǒng)計智能和自主智能,認為當前國際主流人工智能水平仍然處于第二階段,核心技術依賴于深度學習、強化學習、對抗學習等統(tǒng)計機器學習,人工智能系統(tǒng)在信息感知、機器學習等智能水平維度進步顯著,但是在概念抽象和推理決策等方面能力還很薄弱。15.1.2人工智能的發(fā)展現(xiàn)狀與影響(3)人工智能創(chuàng)新創(chuàng)業(yè)如火如荼。全球產(chǎn)業(yè)界充分認識到人工智能技術引領新一輪產(chǎn)業(yè)變革的重大意義,紛紛調整發(fā)展戰(zhàn)略。比如,谷歌明確提出將發(fā)展戰(zhàn)略從“移動優(yōu)先”轉向“AI優(yōu)先”;微軟將人工智能作為公司發(fā)展愿景。15.1.2人工智能的發(fā)展現(xiàn)狀與影響(4)創(chuàng)新生態(tài)布局成為人工智能產(chǎn)業(yè)發(fā)展的戰(zhàn)略高地。信息技術(IT)和產(chǎn)業(yè)的發(fā)展史就是新老IT巨頭搶灘布局IT創(chuàng)新生態(tài)的更替史。例如,傳統(tǒng)信息產(chǎn)業(yè)IT代表企業(yè)有微軟、英特爾、IBM、甲骨文等,互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)IT代表企業(yè)有谷歌、蘋果、臉書、亞馬遜、阿里巴巴、騰訊、百度等,目前智能科技IT的產(chǎn)業(yè)格局還沒有形成壟斷,因此全球科技產(chǎn)業(yè)巨頭都在積極推動人工智能技術生態(tài)的研發(fā)布局,全力搶占人工智能相關產(chǎn)業(yè)的制高點。15.1.2人工智能的發(fā)展現(xiàn)狀與影響人工智能創(chuàng)新生態(tài)包括縱向的數(shù)據(jù)平臺、開源算法、計算芯片、基礎軟件、圖形處理GPU服務器等技術生態(tài)系統(tǒng)和橫向的智能制造、智能醫(yī)療、智能安防、智能零售、智能家居等商業(yè)和應用生態(tài)系統(tǒng)。在技術生態(tài)方面,人工智能算法、數(shù)據(jù)、圖形處理器(GPU)/張量處理器(TPU)/神經(jīng)網(wǎng)絡處理器(NPU)計算、運行/編譯/管理等基礎軟件已有大量開源資源;此外,谷歌、IBM、英偉達、英特爾、蘋果、華為、中國科學院等積極布局人工智能領域的計算芯片。15.1.2人工智能的發(fā)展現(xiàn)狀與影響在人工智能商業(yè)和應用生態(tài)布局方面,“智能+X”成為創(chuàng)新范式,例如“智能+制造”“智能+醫(yī)療”“智能+安防”等,人工智能技術向創(chuàng)新性的消費場景和不同行業(yè)快速滲透融合并重塑整個社會發(fā)展,這是人工智能作為第四次技術革命關鍵驅動力的最主要表現(xiàn)方式。人工智能商業(yè)生態(tài)競爭進入白熱化,例如智能駕駛汽車領域的參與者既有通用、福特、奔馳、豐田等傳統(tǒng)龍頭車企,又有互聯(lián)網(wǎng)造車者如谷歌、特斯拉、優(yōu)步、蘋果、百度等新貴。15.1.2人工智能的發(fā)展現(xiàn)狀與影響(5)人工智能上升為國家重大發(fā)展戰(zhàn)略。人工智能正在成為新一輪產(chǎn)業(yè)變革的引擎,必將深刻影響國際產(chǎn)業(yè)競爭格局和一個國家的國際競爭力。世界主要發(fā)達國家紛紛把發(fā)展人工智能作為提升國際競爭力、維護國家安全的重大戰(zhàn)略,加緊積極謀劃政策,圍繞核心技術、頂尖人才、標準規(guī)范等強化部署,力圖在新一輪國際科技競爭中掌握主導權。在世界各國的重大國家戰(zhàn)略中,人工智能都是其中的核心關鍵技術。15.1.2人工智能的發(fā)展現(xiàn)狀與影響(6)人工智能的社會影響日益凸顯。人工智能的社會影響是多元的,既有拉動經(jīng)濟、服務民生、造福社會的正面效應,又可能出現(xiàn)安全失控、法律失準、道德失范、倫理失常、隱私失密等社會問題,以及利用人工智能熱點進行投機炒作從而存在泡沫風險。15.1.2人工智能的發(fā)展現(xiàn)狀與影響人工智能的發(fā)展突破了算法、算力和算料(數(shù)據(jù))等“三算”方面的制約因素,拓展了互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等廣闊應用場景,開始進入蓬勃發(fā)展的黃金時期。人類社會已開始邁入智能化時代,人工智能引領社會發(fā)展是大勢所趨,不可逆轉。經(jīng)歷六十余年積累后,人工智能開始進入爆發(fā)式增長的紅利期。伴隨著人工智能自身的創(chuàng)新發(fā)展和向經(jīng)濟社會的全面滲透,這個紅利期將持續(xù)相當長的時期。15.1.2人工智能的發(fā)展現(xiàn)狀與影響PART02倫理與安全弗朗西斯·培根是一位被譽為創(chuàng)造科學方法的哲學家,他在《論古人的智慧》一書中指出:“機械藝術的用途是模糊的,它既可用于治療,也可用于傷害。”隨著人工智能在經(jīng)濟、社會、科學、醫(yī)療、金融和軍事領域發(fā)揮越來越重要的作用,我們應該考慮一下它可能帶來的傷害和補救措施——用現(xiàn)代的說法,就是風險和收益。15.2倫理與安全對創(chuàng)造超級智能機器的想法產(chǎn)生普遍的不安感覺是自然的,稱之為大猩猩問題。大約700萬年前,一種現(xiàn)已滅絕的靈長類進化了,一個分支進化為大猩猩,另一個分支進化為人類。今天,大猩猩對人類分支不太滿意,它根本無法控制自己的未來。試想,如果這是成功創(chuàng)造出超級人工智能的結果(人類放棄對未來的控制),那么我們也許應該停止人工智能的研究,并且作為一個必然的結果,放棄人工智能可能帶來的好處。這就是圖靈警告的本質:我們可能無法控制比我們更聰明的機器。15.2.1創(chuàng)造智能機器的大猩猩問題如果超級人工智能是一個來自外太空的黑匣子,那么謹慎地打開這個黑匣子確實是明智之舉。但事實并非如此:人類設計了人工智能系統(tǒng),所以如果它們最終“掌控了自己”,那將是設計失敗的結果(正如圖靈所說)。為了避免這種結果,需要了解潛在失敗的根源。15.2.1創(chuàng)造智能機器的大猩猩問題許多文化都有關于人類向神靈、精靈、魔術師或魔鬼索取東西的神話。在這些故事中,他們總是得到了他們真正想要的東西并最終后悔。如果還有第三個愿望的話,那就是撤銷前兩個。我們將其稱為米達斯國王問題:米達斯是希臘神話中的傳奇國王,他要求他所接觸的一切都變成黃金,但他在接觸了其食物和家人后,就后悔了。如果米達斯遵循基本的安全原則,并在他的愿望中包括“撤消”按鈕和“暫停”按鈕,他會過得更好。15.2.1創(chuàng)造智能機器的大猩猩問題跟其他高科技一樣,人工智能也是一把雙刃劍。認識人工智能的社會影響,正在日益得到人們的重視。積極的方面有很多,例如,通過改進醫(yī)學診斷、發(fā)現(xiàn)新的醫(yī)學成果、更好地預測極端天氣、通過輔助駕駛直至最終做到自動駕駛來實現(xiàn)更安全的駕駛,人工智能可以拯救生命。改善生活的機會也很多。微軟的人道行動計劃將人工智能用于自然災害災后恢復、滿足兒童需求和保護難民。15.2.2積極與消極的方面谷歌的賦能社會AI項目則支持雨林保護、污染監(jiān)測、化石燃料排放量測量、危機咨詢、新聞事實核查、自殺預防、回收利用等方面的工作。芝加哥大學社會福利數(shù)據(jù)科學中心應用機器學習處理刑事司法、經(jīng)濟發(fā)展、教育、公共衛(wèi)生、能源和環(huán)境等領域的問題。15.2.2積極與消極的方面人工智能在農作物管理和糧食生產(chǎn)等方面的應用有助于養(yǎng)活全世界。用機器學習優(yōu)化業(yè)務流程使企業(yè)更具生產(chǎn)力、創(chuàng)造更多財富、提供更多就業(yè)機會。自動化能夠取代許多工人所面臨的乏味而危險的任務,讓他們可以專注從事更加有趣的事情。殘障人士將從基于人工智能的視覺、聽覺和移動輔助功能中受益。機器翻譯已經(jīng)讓來自不同文化背景的人們可以相互交流。基于軟件的人工智能解決方案的邊際生產(chǎn)成本幾乎為零,因此可能有助于先進技術的大眾化(即使軟件的其他方面有集權的可能性)。15.2.2積極與消極的方面盡管有這么多積極方面,我們也不應該忽略人工智能的消極方面。許多新技術都曾產(chǎn)生意想不到的負面影響:核裂變導致了切爾諾貝利事故并產(chǎn)生毀滅全球的威脅;內燃機帶來了空氣污染、全球變暖和死亡的威脅。即使按設計初衷使用,有些技術也會產(chǎn)生負面影響,如沙林毒氣和電話推銷。15.2.2積極與消極的方面所有科學家和工程師都面臨著倫理考量,哪些項目應該做,哪些項目不應該進行,以及如何確保項目執(zhí)行是安全且有益的。2010年,英國工程和物理科學研究委員會制定了一系列機器人準則。接下來數(shù)年里,其他政府機構、非盈利組織以及各公司紛紛建立了類似的準則。建立準則的重點是,要讓每一個創(chuàng)造人工智能技術的機構,以及這些機構中的每個人都要負責確保技術對社會有益而非有害。15.2.2積極與消極的方面最常被提到的準則是:確保安全性 建立問責制確保公平性 維護人權和價值觀尊重隱私 體現(xiàn)多樣性與包容性促進協(xié)作 避免集權提供透明度 承認法律和政策的影響限制人工智能的有害用途 考慮對就業(yè)的影響15.2.2積極與消極的方面這些原則中有許多(如“確保安全”)適用于所有軟硬件,而不僅僅是人工智能系統(tǒng)。一些原則措辭模糊,難以衡量與執(zhí)行。這在一定程度上是因為人工智能有著眾多子領域,每個子領域都有著不同的歷史規(guī)范,每個子領域中人工智能開發(fā)者和利益相關者之間的關系也不同。15.2.2積極與消極的方面對于很多潛在的人工智能用戶而言,要想實現(xiàn)人工智能的成功應用,必須首先解決兩方面突出問題:一是人才短缺問題,即無法吸引和留住人工智能技術開發(fā)方面和相關管理方面的人才;二是技術基礎設施短缺問題,即數(shù)據(jù)能力、運算網(wǎng)絡能力等數(shù)字能力薄弱。15.2.3人才和基礎設施短缺人工智能仍然僅能解決特定問題并具有嚴重的背景依賴性,這意味著,人工智能當前執(zhí)行的是有限的任務,通過嵌入到較大型系統(tǒng)來發(fā)揮作用。作為一種處于早期發(fā)展階段的技術,人工智能促成的能力提高微不足道,這意味著,迫切將人工智能投入使用的當前用戶面臨著巨大的前期成本,效益不大。15.2.3人才和基礎設施短缺許多用戶所執(zhí)行的任務涉及人類生命或高昂設備風險,因此在依靠人工智能來執(zhí)行任務之前要首先解決人工智能可靠性問題。在私營領域,許多責任和知識產(chǎn)權相關法律問題尚未得到充分研究;在公共部門,大量關鍵任務尚無明確途徑確保人工智能的可靠性。以上都是人工智能管理挑戰(zhàn),只有建立了配套的人工智能生態(tài)系統(tǒng),人工智能用戶才能在這些方面得到滿足。雖然人工智能生態(tài)系統(tǒng)的大部分可以也將在私營部門中發(fā)展起來,但這對很多政府用戶特別是國家安全用戶來說,只是必要因素而非充分因素。15.2.3人才和基礎設施短缺信任方面,人工智能透明度的重要性和必要性因具體的人工智能應用而定;人工智能的算法、數(shù)據(jù)和結果都必須可信;用戶必須能理解人工智能系統(tǒng)可能被愚弄的機制。安全性方面,為打造強大且富有彈性的數(shù)字化能力,需要在研發(fā)、操作和安全之間進行平衡;在各機構中樹立網(wǎng)絡風險管理文化與網(wǎng)絡安全負責制至關重要。15.2.3人才和基礎設施短缺人員與文化方面,使用人工智能需要具備相關領域專業(yè)知識、接受過技術訓練且擁有合適工具的工作人員;各機構必須培養(yǎng)數(shù)據(jù)卓越文化。數(shù)字能力方面,為了成功運用人工智能技術,各機構必須打造基本的數(shù)字能力;通過信息和分析獲得競爭優(yōu)勢,需要包括上至總部下至部署作戰(zhàn)人員在內的整個系統(tǒng)的全力投入。15.2.3人才和基礎設施短缺政策方面,一是必須制定倫理方面的政策和標準,指導人工智能技術的應用。二是必須通過一系列政策措施來加強人工智能生態(tài)系統(tǒng):改革人員雇用權限和安全許可流程,以更好地招募和利用人才;改變軟件開發(fā)方面的預算措施,以提升政府采購和迭代開發(fā)軟件的能力;與業(yè)界進行全面接觸與合作,除了利用技術巨頭和國防工業(yè)巨頭外,還要利用中小型數(shù)據(jù)科學公司;投資于處在早期階段的研發(fā)工作,尤其是那些需要政府支持的領域;開發(fā)可解決人工智能可靠性問題的工具。15.2.3人才和基礎設施短缺三是必須認識到國際社會在人工智能方面的活動,采取措施保護人工智能生態(tài)環(huán)境,使其免遭攻擊,免受有害投資的影響;利用資源,主要手段包括:與擁有共同目標、設備和數(shù)據(jù)共享協(xié)議的伙伴合作,同時在與拓展新伙伴時,也要注意打造這些共同性。在理解人工智能對國家安全的影響方面,我們仍處于早期階段。15.2.3人才和基礎設施短缺人工智能是人類智能的延伸,也是人類價值系統(tǒng)的延伸。在其發(fā)展的過程中,應當包含對人類倫理價值的正確考量。設定人工智能技術的倫理要求,要依托于社會和公眾對人工智能倫理的深入思考和廣泛共識,并遵循一些共識原則:15.2.4設定倫理要求(1)人類利益原則,即人工智能應以實現(xiàn)人類利益為終極目標。這一原則體現(xiàn)對人權的尊重、對人類和自然環(huán)境利益最大化以及降低技術風險和對社會的負面影響。在此原則下,政策和法律應致力于人工智能發(fā)展的外部社會環(huán)境的構建,推動對社會個體的人工智能倫理和安全意識教育,讓社會警惕人工智能技術被濫用的風險。此外,還應該警惕人工智能系統(tǒng)作出與倫理道德偏差的決策。15.2.4設定倫理要求(2)責任原則,即在技術開發(fā)和應用兩方面都建立明確的責任體系,以便在技術層面可以對人工智能技術開發(fā)人員或部門問責,在應用層面可以建立合理的責任和賠償體系。在責任原則下,在技術開發(fā)方面應遵循透明度原則;在技術應用方面則應當遵循權責一致原則。15.2.4設定倫理要求人工智能的發(fā)展是建立在大量數(shù)據(jù)的信息技術應用之上,不可避免地涉及到個人信息的合理使用問題,因此對于隱私應該有明確且可操作的定義。人工智能技術的發(fā)展也讓侵犯個人隱私的行為更為便利,因此相關法律和標準應該為個人隱私提供更強有力的保護。15.2.5強力保護個人隱私此外,人工智能技術的發(fā)展使得政府對于公民個人數(shù)據(jù)信息的收集和使用更加便利。大量個人數(shù)據(jù)信息能夠幫助政府各個部門更好地了解所服務的人群狀態(tài),確保個性化服務的機會和質量。但隨之而來的是,政府部門和政府工作人員個人不恰當使用個人數(shù)據(jù)信息的風險和潛在的危害應當?shù)玫阶銐虻闹匾暋?5.2.5強力保護個人隱私人工智能語境下的個人數(shù)據(jù)的獲取和知情同意應該重新進行定義。首先,相關政策、法律和標準應直接對數(shù)據(jù)的收集和使用進行規(guī)制,而不能僅僅征得數(shù)據(jù)所有者的同意;其次,應當建立實用、可執(zhí)行的、適應于不同使用場景的標準流程以供設計者和開發(fā)者保護數(shù)據(jù)來源的隱私;再次,對于利用人工智能可能推導出超過公民最初同意披露的信息的行為應該進行規(guī)制。最后,政策、法律和標準對于個人數(shù)據(jù)管理應該采取延伸式保護,鼓勵發(fā)展相關技術,探索將算法工具作為個體在數(shù)字和現(xiàn)實世界中的代理人。15.2.5強力保護個人隱私涉及的安全、倫理和隱私問題是人工智能發(fā)展面臨的挑戰(zhàn)。安全問題是讓技術能夠持續(xù)發(fā)展的前提。技術的發(fā)展給社會信任帶來了風險,如何增加社會信任,讓技術發(fā)展遵循倫理要求,特別是保障隱私不會被侵犯是亟需解決的問題。為此,需要制訂合理的政策、法律、標準基礎,并與國際社會協(xié)作。建立一個令人工智能技術造福于社會、保護公眾利益的政策、法律和標準化環(huán)境,是人工智能技術持續(xù)、健康發(fā)展的重要前提。15.2.5強力保護個人隱私機器人應該享受哪些權利,這一問題十分重要。虛構類文學作品中經(jīng)??紤]機器人人格的問題:從皮格馬利翁到葛佩莉亞,再到匹諾曹,再到電影《人工智能》和《機器管家》,我們都聽過一個娃娃/機器人獲得生命,并努力被接受為一個有人權的人的傳說。索菲亞是一個長得像人的木偶,能夠說事先編排好的臺詞。在現(xiàn)實生活中,索菲亞被正式授予沙特阿拉伯公民榮譽身份的報道登上了頭條新聞。15.2.6機器人權利為逃避機器人意識這一困境,厄尼·戴維斯主張永遠不要造出可能被認為有意識的機器人。約瑟夫·維森鮑姆在1976年出版的《計算力量與人類理性:從判斷到計算》一書中曾提出過這一論點,而在此之前,朱利安·德·拉梅特麗在《人是機器》一書中也提出過這一論點。機器人是我們創(chuàng)造出來用以完成我們指令的工具,如果我們授予它們人格,我們其實只是拒絕為自己財產(chǎn)的行為負責:“我的自動駕駛汽車的車禍不是我的錯,是汽車自己造成的。”15.2.6機器人權利如果我們開發(fā)出人與機器人的混合體,這個問題又將不同。當然,人們已經(jīng)通過隱形眼鏡、起搏器和人工髖關節(jié)等技術增強了人類。但計算概念的加入可能會模糊人和機器之間的界限。15.2.6機器人權利PART03人工智能的極限1980年,哲學家約翰·希爾勒提出了弱人工智能和強人工智能的區(qū)別。弱人工智能的機器可以表現(xiàn)得智能,而強人工智能的機器是真正地有意識地在思考(而非僅模擬思考)。隨著時間的推移,強人工智能的定義轉而指代“人類級別的人工智能”或“通用人工智能”等,可以解決各種各樣的任務,包括各種新奇的任務,并且可以完成得像人類一樣好。然而,近年來的飛速進展并不能說明人工智能的成就可以無所不及。艾倫·圖靈是第一個定義人工智能的人,也是第一個對人工智能提出可能的異議的人,他預見了后來人提出的幾乎所有的意見。15.3人工智能極限圖靈在“由行為的非形式化得出的論據(jù)”中提到,人類的行為太復雜了,現(xiàn)實中,人們必須使用一些非形式化的準則,任何一個形式化的規(guī)則集都無法被完全捕捉到,而非形式化準則也無法被形式化規(guī)則集捕捉,因此也無法在計算機程序中編碼。15.3.1由非形式化得出的論據(jù)休伯特·德雷福斯是這一觀點的主要支持者,他曾就人工智能發(fā)展發(fā)表過一系列頗具影響力的質疑:《計算機不能做什么》以及和他的兄弟斯圖爾特·德雷福斯合著的《頭腦重于機器》。同樣,哲學家肯尼斯·薩瑞說:“在對計算主義的狂熱推崇中追求人工智能,是根本不可能有任何長久的結果的?!彼麄兯u的技術后來被稱為老式人工智能。15.3.1由非形式化得出的論據(jù)老式人工智能對應的簡單邏輯智能體設計確實很難在一個充要的邏輯規(guī)則集里捕捉適當行為的每一種可能性,我們稱之為資格問題。但就概率推理系統(tǒng)更適合開放領域和深度學習系統(tǒng)在各種“非形式化”任務上表現(xiàn)良好一樣,這一批評評論并不是針對計算機本身,而僅針對使用邏輯規(guī)則進行編程這一特定風格。這種風格曾在20世紀80年代流行,但已被新方法取代。15.3.1由非形式化得出的論據(jù)德雷福斯最有力的論據(jù)之一是針對情景式智能體而不是無實體的邏輯推理機。相比于那些看過狗奔跑、和狗一起玩過、曾被狗舔過的智能體來說,一個對“狗”的理解僅來自一組有限的如“Dog(x)=Mannal(x)”這樣的邏輯語句的智能體是處于劣勢的。哲學家安迪·克拉克曾說過:“生物大腦是生物體的首要控制系統(tǒng),生物體在豐富的真實世界環(huán)境中行動?!备鶕?jù)克拉克的觀點,我們“擅長于飛盤游戲而弱于邏輯”。15.3.1由非形式化得出的論據(jù)體驗認知方法聲稱單獨考慮大腦是毫無意義的:認知發(fā)生在軀體內部,而軀體處于環(huán)境中。我們需要從整體上去研究這個系統(tǒng)。大腦的運行利用其所處環(huán)境中的規(guī)律,這里說的環(huán)境包括軀體的其他部分。在體驗認知方法中,機器人、視覺和一些其他的傳感器成為核心而非外圍部分??偟膩碚f,德雷福斯看到了人工智能還未能完全解決的領域,并由此聲稱人工智能是不可能的?,F(xiàn)在我們看到許多科研人員正在這些領域進行持續(xù)的研究和開發(fā),從而提高了人工智能的能力,降低了其不可能性。15.3.1由非形式化得出的論據(jù)艾倫·圖靈在他那篇著名論文“計算與智能”中提出,與其問機器能否思考,不如問機器能否通過行為測試,即圖靈測試。圖靈測試需要一個計算機程序與測試者進行5分鐘的對話(通過鍵入消息的方式)。然后,測試者必須猜測與其對話的是人還是程序;如果程序讓測試者做出的誤判超過30%,那么它就通過了測試。對圖靈來說,關鍵不在于測試的具體細節(jié),而是智能應該通過某種開放式行為任務上的表現(xiàn)而不是通過哲學上的推測來衡量。15.3.2衡量人工智能圖靈曾推測,到2000年,擁有10億存儲單元的計算機可以通過圖靈測試。但2000年已經(jīng)過去了,我們仍不能就是否有程序通過圖靈測試達成一致。許多人在他們不知道有可能是和計算機在聊天時被計算機程序欺騙了。ELIZA程序、網(wǎng)絡聊天機器人MGoNZ和納塔恰塔多次欺騙了與它們交談的人,而聊天機器人賽博愛好者引起了執(zhí)法部門的注意,因為它熱衷于誘導聊天對象泄露足夠多的個人信息致使他們的身份被盜用。15.3.2衡量人工智能2014年,一款名為尤金·古斯特曼的聊天機器人在圖靈測試中令33%未受訓練的業(yè)余評測者做出誤判。這款程序聲稱自己是一名來自烏克蘭的男孩,英語水平有限。這點讓它出現(xiàn)語法錯誤有了解釋。或許圖靈測試其實是關于人類易受騙性的測試。目前為止聊天機器人還不能騙過受過良好訓練的評測者。圖靈測試競賽帶來了更優(yōu)秀的聊天機器人,但這還沒成為人工智能領域的研究重點。相反,追逐競賽的研究者更傾向于下國際象棋、下圍棋、玩《星際爭霸II》游戲、參加八年級科學考試或在圖像中識別物體。15.3.2衡量人工智能在許多這類競賽中,程序已經(jīng)達到或超過人類水平,但這并不意味著程序在這些特定任務之外也能夠像人類一樣。人工智能研究的關鍵點在于改進基礎科學技術和提供有用的工具,而不是讓評測者上當。15.3.2衡量人工智能PART04人工智能架構在人工智能領域中,反射型響應適用于時間是重要因素的情形;基于知識的深思熟慮允許智能體提前做準備;當數(shù)據(jù)充足時,機器學習比較方便;但當環(huán)境發(fā)生變化或人類設計者在相關領域知識不足時,機器學習就是必要的了。長期以來,人工智能一直分裂為符號系統(tǒng)(基于邏輯和概率推斷)和連接系統(tǒng)(基于大量參數(shù)的損失函數(shù)最小化)兩個方向。如何取兩家之長是人工智能的一個持續(xù)性的挑戰(zhàn)。符號系統(tǒng)可以拼接長推理鏈,并利用結構化表示的表達能力。連接系統(tǒng)在數(shù)據(jù)有噪聲的情況下也能識別出模式。一個研究方向是將概率編程與深度學習相結合。15.4人工智能架構同時,智能體也需要控制自己的思考過程。它們必須充分利用時間,在需要做出決策前結束思考。比如,一個出租車駕駛智能體在看到前方事故時,必須在一瞬間決定是剎車還是轉向。它也需要在瞬間考慮最重要的問題,如左右兩側車道是否暢通、后方是否緊跟著一輛大卡車,而不是考慮該去哪接下一位乘客。這些問題通常在實時人工智能課題下進行研究。隨著人工智能系統(tǒng)轉向更加復雜的領域,智能體永遠不會有足夠長的時間來精確解決問題,因此所有問題都將變?yōu)閷崟r問題。15.4人工智能架構觀察人工智能技術的發(fā)展,可以發(fā)現(xiàn)大多數(shù)時候,人工智能裝置通常并沒有直接接觸外界。除少數(shù)例外,人工智能系統(tǒng)都建立在人工提供輸入并解釋輸出的基礎上。同時,機器人系統(tǒng)專注于低層級任務,這些任務通常不涉及高層級的推理和規(guī)劃,對感知的要求也極低。這種狀況一部分是因為要讓真正的機器人工作所需要的費用和工程量很大,另一部分是因為處理能力和算法有效性不足以處理高帶寬的視覺輸入。15.4.1傳感器與執(zhí)行器近年來,隨著可編程機器人技術的成熟,情況迅速轉變。而可編程機器人的進步得益于可靠的小型電動機驅動和改進的傳感器。自動駕駛汽車中激光雷達的成本大幅度下降,而單芯片版本的傳感器成本已經(jīng)很便宜。雷達傳感器一度只能進行粗粒度檢測,但現(xiàn)在它已足夠靈敏,可以計算一疊紙包含的紙張數(shù)量。15.4.1傳感器與執(zhí)行器手機攝像頭對更優(yōu)秀圖像處理性能的需求降低了用在機器人上的高分辨率攝像頭的成本。MEMS(微機電系統(tǒng))技術提供了小型化加速度計、陀螺儀,以及小到可以植入人工飛行昆蟲中的處理器。我們可以將數(shù)以百萬個MEMS設備結合成強大的大型執(zhí)行器。3D打印和生物打印技術使得用原型進行實驗更為容易。15.4.1傳感器與執(zhí)行器由此,可以看出人工智能系統(tǒng)正處在從最初的純軟件系統(tǒng)轉變?yōu)橛行У那度胧綑C器人系統(tǒng)的關鍵時期,靈活、智能的機器人很可能最先在工業(yè)領域(環(huán)境更可控、任務重復度更高、投資價值更易衡量)而非民用領域(環(huán)境與任務的變化更復雜)取得進步。15.4.1傳感器與執(zhí)行器從21世紀初到目前為止,人工智能的大多數(shù)進展都由特定任務上的競賽驅動,如DARPA舉辦

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論