智能Agent及多Agent在虛擬現(xiàn)實系統(tǒng)中的應(yīng)用研究進展

上傳人：風(fēng)*** IP屬地：湖北上傳時間：2022-08-31 格式：DOCX 頁數(shù)：41 大?。?MB 積分：15 舉報 版權(quán)申訴

智能Agent及多Agent在虛擬現(xiàn)實系統(tǒng)中的應(yīng)用研究進展_第2頁

智能Agent及多Agent在虛擬現(xiàn)實系統(tǒng)中的應(yīng)用研究進展_第3頁

智能Agent及多Agent在虛擬現(xiàn)實系統(tǒng)中的應(yīng)用研究進展_第4頁

智能Agent及多Agent在虛擬現(xiàn)實系統(tǒng)中的應(yīng)用研究進展_第5頁

已閱讀5頁，還剩36頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、智能Agent及多Agent在虛擬環(huán)境中的應(yīng)用研究進展人工智能讀書報告董子龍 10421038浙江大學(xué)CAD&CG實驗室摘要:Agent在虛擬環(huán)境中的應(yīng)用研究主要是單一的對話表情功能，虛擬生物的交互運動和社會系統(tǒng)的內(nèi)部結(jié)構(gòu)。本文概括性地介紹智能Agent及多Agent在虛擬環(huán)境中的應(yīng)用現(xiàn)狀，根據(jù)系統(tǒng)的規(guī)模，由易到繁地說明當(dāng)前研究的體系框架和實現(xiàn)。關(guān)鍵字：智能Agent，多Agent，虛擬環(huán)境，體系框架一引言Introduction 隨著計算機硬件的不斷升級，用戶對系統(tǒng)環(huán)境的要求越高。在系統(tǒng)環(huán)境上，用戶希望在一個與現(xiàn)實世界相仿甚至難辨真假的平臺上工作；在交互控制上，用戶希望系統(tǒng)提供更強大更全面

2、的輔助，適應(yīng)用戶的操作。前者促進了虛擬環(huán)境技術(shù)的不斷分化深入；后者常常引入人工智能領(lǐng)域的重要概念A(yù)gent，在面向過程，面向?qū)嶓w，面向?qū)ο缶幊痰幕A(chǔ)上發(fā)展出更抽象的面向Agent編程5。利用Agent技術(shù)建構(gòu)的智能化實體，廣泛應(yīng)用在探測、材料、醫(yī)療、教育、游戲等領(lǐng)域，幫助或代替人類完成工作7。1.1 一些工作 Some Works虛擬環(huán)境涵義很寬，對現(xiàn)實世界中物理的方法、行為、地理和抽象的思維、情緒、感情的模擬都屬于虛擬現(xiàn)實的范疇，所以Agent與之的結(jié)合點很多，在實際應(yīng)用給開發(fā)人員很好的實現(xiàn)靈感。Helmut設(shè)計一個卡通形象的動畫(Animated)Agent2，具有讓人信服的表情和社交能力

3、，用于日本學(xué)生的英語對話訓(xùn)練。他們使用XML風(fēng)格的MPML 腳本語言(Multi-modal presentation Markup Language)控制不參與交互的Agent角色的行為語言。Baldi3由俄勒岡州研究院、卡內(nèi)基梅隆大學(xué)等聯(lián)合開發(fā)的語言教學(xué)系統(tǒng)，是一個具有聽覺和可視化演講能力的Agent，結(jié)合了語音識別，面部動畫，表情跟蹤和語音朗讀四個方向的技術(shù)。Marche和Anton的Jacob4項目在虛擬現(xiàn)實系統(tǒng)中構(gòu)建一個叫做Jacob的擬人(Human- like)Agent，傳達給用戶操作指示。Jacob項目涉及虛擬現(xiàn)實模型的軟件工程、自然語言等交互模塊和融合Agent技術(shù)，由于任

4、務(wù)模塊和指令模塊的分離，Jacob Agent可以容易地移植到其它虛擬環(huán)境中。Ipke和Yong在VIENA6項目中(Virtual Environments and Agents)使用適應(yīng)性Agent幫助用戶設(shè)計和探索3D圖形，這是一個多Agent系統(tǒng)，Agent之間根據(jù)當(dāng)前狀態(tài)互相協(xié)作實現(xiàn)用戶的指令；而對于用戶來說，只是面對一個能理解和執(zhí)行語言指令的Agency。Agent的研究還包括控制腳本891018和實際應(yīng)用的性能分析1112 13。1.2 本文框架Layout of This Article本文從三個層次總結(jié)智能Agent和多Agent系統(tǒng)在虛擬環(huán)境中的應(yīng)用。第3章介紹會話(Con

5、versational)Agent，第4章介紹行為(Behavioral)Agent，第四章關(guān)于多Agent。為了幫助讀者形成完整的概念，第2章會對智能Agent做出探索性定義。二關(guān)于Agent Concepts of Agent智能Agent的定義很不統(tǒng)一，在不同應(yīng)用，從不同的角度，研究人員總是在自己的理解基礎(chǔ)上給出說明。Stan和Art考察大量Agent的概念，得出模糊卻內(nèi)涵豐富的結(jié)論14：自主(Autonomous)Agent系統(tǒng)是環(huán)境的一部分，只在特定的(Situated)環(huán)境中感知環(huán)境并作用于環(huán)境，從而實現(xiàn)自身的日程，影響將來的感知。自主Agent和智能Agent應(yīng)該是等價的。智能

6、Agent總是與之對應(yīng)的環(huán)境緊密結(jié)合，離開了所處的環(huán)境，Agent就失去其存在的意義，再也不是Agent。她通過感應(yīng)器(Sensor)感知環(huán)境，利用效應(yīng)器(Effector)作用于環(huán)境。她具有自己的信念，即有目的，有意圖地行為，使環(huán)境將來的狀態(tài)符合日程。智能Agent可以是硬件，如機器人，人眼等，自然更是軟件(Softbot)。本文主要討論軟件(Software)Agent的設(shè)計框架和實現(xiàn)。對智能Agent概念的詳細解釋可以從Winikoff32等提出的SAC(Simplified Agent Concepts)“一個簡化的模型，能讓更多人開發(fā)智能Agent系統(tǒng)，但是保存BDI的能力和效率”中

7、獲得。 2.1 描述性定義Descriptive Definition描述性定義指出只要一個基于硬件或軟件的系統(tǒng)具有某些描述性特性，就可以被稱為Agent?？煞譃槿醵x和強定義15。弱定義包括自主性(Autonomy)，社會性(Social ability)，反應(yīng)性(Reactivity)等人類特有的性質(zhì)。強定義在弱定義的基礎(chǔ)上加入知識(Knowledge)、信念(Belief)、意圖(Intention)、責(zé)任(Obligation)等精神概念，有研究者稱之情感(Emotional) Agent17。其它很多詞匯也常被研究者用來描述Agent，如移動性(Mobility)，誠實(Veraci

8、ty)，善良(Benevolence)，理性(Rationality)，長壽性 (Longevity)，前瞻性(Pro-active, Goal-directed) 等。2.2 形式化定義 Formal Definition本文的形式化定義只是以理想理性(Ideal Rational)Agent16為例，拋磚引玉，幫助讀者對不同類型的Agent形成自己的形式化方法。理想理性Agent：對每一個可能的感知序列(Percept sequence)，她都能基于感知序列和內(nèi)建的知識提供的證據(jù)采取行為，期望性能最優(yōu)化。Agent由PAGE描述：感知(Percept)，行為(Action)，目標(Goal

9、)，環(huán)境(Environment)。Agent等于體系構(gòu)架(Architecture)和程序(Program)。Stuart和Peter提出最基本的骨架Agent程序：function SKELETON-AGENT (percept) returns action static: memory, the agents memory of the world memory UPDATE-MEMORY(memory,percept) action CHOOSE-BEST-ACTION(memory) memory UPDATE-MEMORY(memory, action) return actio

10、n而根據(jù)程序設(shè)計的立足點不同，由簡到繁區(qū)分成：表格驅(qū)動(Table-driven)Agent，簡單反射(Simple reflex)Agent，跟蹤內(nèi)部狀態(tài)的反射Agent (Reflex agent with internal state)，基于目標的(Goal-based)Agent，基于效能的(Utility-based)Agent。三會話Agent Conversational Agent會話Agent主要在教育培訓(xùn)程序中扮演導(dǎo)師和同學(xué)的角色，隨時隨地供給交流學(xué)習(xí)的伙伴，增強娛樂性和參與性，極大提高教學(xué)效率，也可以在場館中推廣產(chǎn)品，或說明旅游項目。Microsoft Office系列

11、軟件的幫助精靈是我們最熟悉的會話Agent。會話Agent具有一般的語言能力，也有一定的聲音識別能力，甚至有感情；在虛擬環(huán)境中，她常常通過圖形具體化(Embodied)。本章將介紹Baldi和Max兩個系統(tǒng)，說明如何讓Agent表示出表情和嘴形，或手勢，進一步加入情感。關(guān)于會話Agent的更多研究請參考22232425。3.1表情和嘴形Facial Expression and Lips與一個表情豐富、語言流暢的伙伴交流，無疑是長期在計算機前學(xué)習(xí)生活的人很吸引的事。圖3-1所示的Baldi319曾在上文引述過，是一個由計算機驅(qū)動的聊天人頭，暫時用于聾啞兒童的課堂語言教學(xué)。她的存在和功能完全依賴

12、于計算機動畫控制，和文本語言合成。圖3-1她的語言有33個參數(shù)：頜旋轉(zhuǎn)和擠壓，嘴的水平寬度，嘴唇彎曲和突出控制，下嘴唇褶皺，嘴唇垂直位置，牙齒的位移，舌頭的角度、寬度和長度。為了能在低端設(shè)備上實時繪制，研究者采用目標相似合成(Terminal Analogue Synthesis)技術(shù)，僅令最終結(jié)果看起來很像，并沒有完全模仿生理結(jié)構(gòu)。大約900個多邊形邊邊相連組成Baldi的眼睛、瞳孔、虹膜、鞏膜、眉毛、鼻子、皮膚、嘴唇、舌頭、牙齒、脖子。多邊形的拓撲結(jié)構(gòu)和動畫由一個參數(shù)集控制。Baldi的研發(fā)進展主要在控制參數(shù)的增加和修改，舌頭的兩代實現(xiàn)方式，視覺語言合成控制，文本語言合成，雙模（視覺/聽

13、覺）合成，和并行信息處理。最終大概有20000行C代碼，可在SGI和PC上實時運行，圖3-2是一些結(jié)果。圖3-2 Baldi的表情：高興、生氣、吃驚、恐懼、傷心、惡心3.2 手勢 Gesture手勢是人們自發(fā)的無意識的語言表達，是很重要的溝通手段，對多模式(Multi-Modal)會話Agent的具體化最終都需要一套肢體語言的支持，可從真人捕捉，或手動預(yù)定義。擬人Agent Max20是在3D虛擬環(huán)境中的裝配專家，通過上肢活動和口述的相互協(xié)同向用戶展示裝配過程，圖3-3。圖3-3 與Max多模交互Max的多模(Multi-Modal)發(fā)言直接由一種基于XML的語言描述，包括語言詞句和非語言行為

14、。語句被時間點(Time Point)分隔，特定的手勢動作被定義在相應(yīng)的時間間隔中。手勢由發(fā)出階段(Stroke Phrase)的時空特性決定，由子動作組成。子動作被定義成：(1)拳頭的位置，(2)手的形狀，(3)拳頭的朝向；每一項性質(zhì)用數(shù)值或符號表示。子動作是靜態(tài)或動態(tài)，靜態(tài)代表一定時間內(nèi)不變，動態(tài)子動作又由連續(xù)的動作片斷(Segment)組成。手勢的特點，如并發(fā)(Simultaneity)，滯后(Posteriority)，重復(fù)(Repetition)和對稱(Symmetry)，既可以顯示說明，也可以用行為通信函數(shù)表達。圖3-4是XML說明片斷，圖3-5是其結(jié)果。圖 3-4圖 3-5基于特

15、點的手勢動畫要求運動規(guī)劃和上肢控制。在高級(Higher-Level)規(guī)劃時，手勢發(fā)出(Stroke)階段的約束條件被充分限定，按時序傳給獨立的運動控制模塊(Motion Control Module)，手、拳頭、手臂、脖子和臉都有不同的模塊。低級(Lower-Level)規(guī)劃采用局部運動程序(Local Motion Program)，幾個LMP組成的運動程序根據(jù)動力學(xué)原理控制上肢的移動。LMP定義在外部坐標系或關(guān)節(jié)連接角上，根據(jù)當(dāng)前運動狀態(tài)自動激活，并按照給定的邊界條件互相連接，如圖3-5。圖 3-5在介紹口語和手勢同步協(xié)作之前，先說明塊(Chunk)的意義。手勢被分成準備(Prepara

16、tion)、保持(Hold)、發(fā)出(Stroke)、收回(Reaction)四個階段，語言也組織成音調(diào)階段(Intonational Phrase)。塊就是一個音調(diào)階段加上一個手勢階段，復(fù)雜的發(fā)言和手勢由多個快組成。在Max的同步結(jié)構(gòu)中，塊各自在獨立的黑板上交叉執(zhí)行。在InPrep狀態(tài)，口語合成和手勢規(guī)劃模塊共同決定完成規(guī)劃(Planning)過程；規(guī)劃完成后，塊進入Pending狀態(tài)，如果上一塊在Subsiding狀態(tài)，調(diào)度器將切換到處在Lurking狀態(tài)的塊，接著進入InExec狀態(tài)，最后，如果還有LMP活動，到Subsiding狀態(tài)，否者Done，圖3-6。圖3-63.3 情感 Emot

17、ion情感為人類特有，在Agent的應(yīng)用中，如何給Agent 賦予一定的感情(Emotion)、情緒(Mood)和個性(Personality)一直是研究者們最感興趣的問題。情感Agent更有生命，更讓人信服，Max21在這個方向上又前進了一步。為了表現(xiàn)情感，需要：(1) 評估內(nèi)外事件對動態(tài)情感(Emotion Dynamics)的影響；(2) 模擬Agent的感情和情緒，及其相互作用；(3) 確信將Agent的情感表達出來。第一個方面可以：在非認知(Non-Cognitive)層，感應(yīng)器從虛擬現(xiàn)實系統(tǒng)直接反饋；或在認知層，BDI理解器的意愿推理得到。下面詳細說明另外兩個方面。3.3.1 情感

18、系統(tǒng)的內(nèi)部結(jié)構(gòu) Internal Structure of Emotion System首先，區(qū)分感情(Emotion)和情緒(Mood)兩個概念。感情由激勵引起，持續(xù)時間短，情緒則比較均勻的分布在時間維度上，時間比較長；感情能加強或減弱情緒，而情緒可看作比較弱而且較長久的感情。Max的感情和情緒分布在二維空間上(圖3-7)，感情價(Valence)對應(yīng)X軸，情緒價對應(yīng)Y軸。原點被認為是穩(wěn)定點，所以類比彈簧，感情價和情緒價分別對應(yīng)一個彈性系數(shù)dx、dy，由此產(chǎn)生的力Fx、Fy使它們在一定時間后恢復(fù)到原點。圖3-7在公式1中，將感情當(dāng)作情緒的變化梯度，可以表達感情對情緒的增強和減弱作用。較小的導(dǎo)

19、致懶性，較大的使Agent更加情緒化。公式 3-1作為對動態(tài)情緒的補充，厭煩(Boredom)被添加到系統(tǒng)中。如果Agent的情感處在原點的一個橢圓區(qū)域(圖3-8)內(nèi)，在沒有刺激的情況下，厭煩程度線形增長；一旦出了這個區(qū)域，厭煩程度重設(shè)為0。厭煩線形增長公式是：Z(t+1) = Z(t) b，Z定義在-1,0，即-1時，Agent最感厭煩。圖3-8以上的模型有效的概括了人類的情感，然而體現(xiàn)在交流中，情感有三個維度內(nèi)涵：愉快(Please)、激活(Arousal)、支配(Dominance)。感情、情緒、厭煩最終被映射到PAD空間，并歸類。公式3-2規(guī)定映射方式，定義域由公式3-3確定。xt、y

20、t、zt分別代表感情價、情緒價、厭煩程度，t是時間。公式 3-2公式 3-3p(xt, yt)是愉快度。愉快全面代表價信息，當(dāng)感情價和情緒價都是最大值時，Agent最愉快，反之則最勉強。A(xt, zt)是激活度。激活度總是處在困倦，及心理敏感度和生理興奮度最大值之間?？偸侨∝撝档膮挓┏潭绕鸾档图せ疃鹊淖饔谩(t)是支配度。支配的存在是為了區(qū)分影響外界狀況和事件的感覺，如厭煩和生氣，或被外界環(huán)境控制的感覺，如恐懼和悲傷。根據(jù)以上的計算結(jié)果，將情感歸入相應(yīng)的類，如圖3-9。一個形容詞代表一種PAD類別，人工設(shè)定相應(yīng)的PDA值。圖3-9每一類對應(yīng)一個激活閾值和一個飽和閾值，如圖3-10。當(dāng)點在且

21、僅在一個類的內(nèi)，類被激活，激活程度由公式3-4計算。當(dāng)點在且僅在一個類的，類完全激活，W = 1。如果以上條件都不滿足，Agent進入特殊的混亂(Confused)狀態(tài)。圖3-10公式3-43.3.2 集成和應(yīng)用 Integration and Application最終，將情感系統(tǒng)集成到現(xiàn)有的Max中，設(shè)定相應(yīng)的輸入輸出，圖3-11。Max的認知構(gòu)架通過兩種途徑提供給情感系統(tǒng)情感價信息：(1) Interpretation和Dialog Manager，審察過程；(2) Perception，對正面或負面刺激的直接反應(yīng)。而情感系統(tǒng)反饋給認知構(gòu)架三方面數(shù)據(jù)：(1) 情緒價和厭煩程度；(2) P

22、AD三元組；(3) 被激活的情感類型及其強度，或者混亂(Confused)。前兩項數(shù)據(jù)用于Behavior Generation，第三項用于Dialog Manager。圖3-12圖3-13是Max生氣并走出畫面的例子。圖3-133.4小結(jié)會話Agent對實時性的要求比較高，在交互、展示、教育上有廣范的應(yīng)用，但是由于硬件的限制，Agent的外形一般計較粗糙。另一方面，會話Agent的語言、行為、情感都是由開發(fā)者根據(jù)實際環(huán)境預(yù)先設(shè)定，缺少自學(xué)習(xí)的能力，不能一般地在各種情況中切換。還有，語言識別模塊是會話Agent比較薄弱的一塊，這個模塊如果不能很好的適應(yīng)環(huán)境，會使Agent答非所問，完全背離設(shè)

23、計的目的。所以，將來會話Agent的發(fā)展應(yīng)該至少有三個方向：更逼真的視覺效果，包括精細的肌肉變化、眼神的變化、毛發(fā)的飄動等，也許可以用骨架來控制肌肉變化；學(xué)習(xí)能力的增強，對新語句的融會和理解，這需要語言學(xué)和人工智能其它領(lǐng)域的支持；(3) 語言識別模塊更強大，聲音的采集處理，能夠應(yīng)付各種各樣的意外因素。四行為Agent Behavioral Agent行為Agent與會話Agent有所不同。行為Agent研究的是Agent在虛擬環(huán)境中根據(jù)環(huán)境的狀態(tài)，調(diào)整行為，規(guī)劃運動，完成目的，主要用于控制動物在虛擬環(huán)境中的運動。徐曉媛26和James27分別就動物和人的運動模擬所做的博士工作，深入細致的探索

24、了理論模型和實踐方法。28提出垂直的多級抽象層次結(jié)構(gòu)AHA (Asynchronous, Hierarchical Agents)，模擬人類多層次的迭代思考過程。29將增強學(xué)習(xí)法(Reinforcement Learning)用于自發(fā)虛擬Agent(Autonomous Virtual Agent)的運動控制，采用Q-Learning和TD-Learning兩種算法。30的離散調(diào)度機制決定運動隨時間的變化，而由一個多通道構(gòu)架完成動作的執(zhí)行和渲染。MIT Media Lab C431的理念基于大腦被分成很多系統(tǒng)，并在一塊黑板上交流。主要模塊有：感應(yīng)系統(tǒng)和感知系統(tǒng)，動作系統(tǒng)，導(dǎo)航和運動系統(tǒng)，短期記

25、憶和心理黑板(Mental Blackboard)。C4的工作集中在訓(xùn)練一只家庭寵物上，4.1詳細介紹。4.2介紹Wen32等提出的將Agent的行為可視化的方法，。4.1C4C4描述了一種新的多層次腦體系，模擬生活在圖形世界中的自主半自主生物。設(shè)計目標有：反映行為，學(xué)習(xí)能力，擴展性。因此，C4是高度模塊化的系統(tǒng)，除了必需的子系統(tǒng)外，很方便擴充。圖4-1是C4訓(xùn)練的一只“牧羊狗”。圖4-1C4與世界之間的相互作用通過數(shù)據(jù)記錄(DataRecord)的形式傳輸，數(shù)據(jù)記錄可以表示C4的感應(yīng)器和感知系統(tǒng)所能識別的任何信息，包括聲音、視覺、符號等。圖4-2是C4腦的體系框圖，每一個部分都可以通過端口對

26、黑板進行讀寫訪問。圖4-24.1.1 感應(yīng)系統(tǒng) Sensor System為了保持世界Agent分離的完整性，C4采用抽象感應(yīng)系統(tǒng)(Sensor System Abstraction)。感應(yīng)系統(tǒng)有兩個作用：(1) 過濾器，比如牧羊狗不應(yīng)該看到她后面的羊；(2) 轉(zhuǎn)換器，因為同一條信息在不同的Agent眼里意義并不相同。4.1.2 感知系統(tǒng) Perception System感知系統(tǒng)將“意義(Meaning)”賦予感應(yīng)到的事件。感知子(Percept)是感知系統(tǒng)的原子類型，又是一種數(shù)據(jù)提取單元。感知子的輸入是從感應(yīng)系統(tǒng)傳過來的數(shù)據(jù)記錄，返回匹配概率(SheepShapePercept返回看到的是

27、一頭羊的概率)，如果概率大于閾值，同時返回提取的數(shù)據(jù)(SheepShapePercept羊的位置坐標)。C4沒有對感知子的實現(xiàn)方式做任何假設(shè)，因此開發(fā)者可以根據(jù)需求選擇算法，這是模塊化增強可擴展性的直接體現(xiàn)。為了提高感知效率，感知子以樹形結(jié)構(gòu)(圖4-3)組織，每一次判斷都裁減掉大量不可能的感知判斷，降低復(fù)雜度；而且子感知子只接受父感知子提取的數(shù)據(jù)；減少數(shù)據(jù)量。如果一個聲音信號直接傳遞給Sound感知子，而不再考慮Shape等感知子。每當(dāng)數(shù)據(jù)記錄到達，感知系統(tǒng)就會創(chuàng)建一個感知存儲(PerceptMemory)對象，此后每一個感知子返回的可信度和提取的數(shù)據(jù)都保存在感知存儲中。感知存儲代表Agent

28、對刺激理解的所有內(nèi)容。圖4-3感知子不僅僅作為接受場(Receptive Field)，而且會根據(jù)反應(yīng)系統(tǒng)(Action System)的反饋，修改樹的拓撲結(jié)構(gòu)，動態(tài)添加子節(jié)點稱之為革新(Innovation)。4.1.3 工作存儲 Working MemoryC4包含一個Working Memory結(jié)構(gòu)，儲藏駐存的Percept Memory對象，保存對世界中的物體的感知歷史。她們構(gòu)成生物對世界的“視圖(View)”。4.1.4 預(yù)測和驚奇 Predication and Surprise基于Percept Memory對象，生物可以模仿下意識，對現(xiàn)在或?qū)淼臓顟B(tài)作出預(yù)測。預(yù)測一般對感知存儲

29、的數(shù)據(jù)進行外推函數(shù)逼近，更復(fù)雜地考慮周期性為和知行關(guān)系。預(yù)測偶爾出現(xiàn)的偏差，可以作為驚奇的基礎(chǔ)。4.1.5 動作系統(tǒng) Action System動作是一個五元組ActionTuple：(1) Primitive Action(s)：做什么；(2) TriggerContext：什么時候做；(3) ObjectContext：對誰做；(4) DoUntilContext：做多久；(5) Intrinsic Value：做的好處。C4有Attention Group和Primary ActionGroup兩個動作組(ActionGroups)，每個動作組有兩條ActionTuple鏈表：Start

30、le、Default。Startle具有較高的優(yōu)先級，具有最高優(yōu)先級的ActionTuple被激活；Default根據(jù)e-values隨機的激活動作。學(xué)習(xí)是C4的研究重點，類似人類訓(xùn)練狗的方法，有三種學(xué)習(xí)方式：Credit Assignment，State-space Discovery，Innovation。4.1.6 導(dǎo)航系統(tǒng) Navigation System導(dǎo)航系統(tǒng)是對動作系統(tǒng)的高級實現(xiàn)，她隱藏動作的實現(xiàn)細節(jié)，使動作簡化成“前進、吃、離開”等一般的指令。導(dǎo)航系統(tǒng)從動作系統(tǒng)接受指令，將之分解優(yōu)化成恰當(dāng)?shù)倪\動命令，再傳送給運動系統(tǒng)。4.1.7 運動系統(tǒng) Motor System運動系統(tǒng)組織

31、成動詞圖(Verb Graph)，定義了最基本的運動和運動序列。運動節(jié)點是手工設(shè)置的，每個節(jié)點可以由副詞空間(Adverb Space)描述，如向左、筆直、向右地行走。參數(shù)從黑板的MOTOR_DESIRED和MOTOR_ADVERB獲得。分層使生物能同步進行多個運動。如牧羊狗的頭部層、身體層、尾巴層。圖4-44.2 一種可視化的新方法 A New Approach for VisualizingWen的方法主要有三個部分：視覺合成(Synthetic Vision)，記憶FzFSM，動畫庫；圖4-4。4.2.1 感覺輸入 Sensorial Input系統(tǒng)有兩個信息通道：視覺和聽覺，主要是視覺

32、。有別于一般的直接感應(yīng)，一種視覺合成方法多層次空間場景，用于表示外部世界。3D的虛擬環(huán)境由多層次空間表示成八叉樹(Octree)，如果一個節(jié)點包圍的圖元大于某個閾值，就將這個節(jié)點再次叉分成八個字結(jié)點。視覺合成用八叉樹結(jié)合局部Z緩沖算法，判斷Agent的可見物體。同樣地，感知層也要對輸入進行過濾。4.2.2 FzFSM和記憶 FzFSM and MemoryFzFSM是一個有限狀態(tài)機，每一個狀態(tài)有介于0,1的模糊值代表狀態(tài)等級，調(diào)節(jié)動畫的轉(zhuǎn)移矩陣，避免重復(fù)的動畫。角色的行為設(shè)計分成高級和低級兩層。高級層面向目標，更概括，更直觀。低級層面向動作，更具體，更細致。如一個“追逐獵物”的高級行為可分解成

33、“直沖”，“轉(zhuǎn)彎”，“加速”等低級行為。記憶就是將能記住的物體保留在八叉樹中，并用一個遞減的八進制數(shù)說明記憶的準確度。4.2.3 動畫層 Animation Layer動畫層用面片皮膚動畫(Mess Skinning Animation)實現(xiàn)，激活骨骼(Skeleton)尾部的轉(zhuǎn)移矩陣完成動畫。Quaternion方法的球面線形插值(Spherical Linear Interpolation)算法完成動畫的平滑過渡。圖4-3分別表示行走的人，邊走邊小心觀望的人，驚恐的跑的人。圖4-34.3小結(jié) 行為Agent主要從行為上模擬生物，代替人類在虛擬環(huán)境中活動，給其它研究一個相對理想的試驗平臺，不

34、論是動力學(xué)、社會學(xué)、生物學(xué)。行為Agent與特定的硬件結(jié)合，還可以幫助人類完成繁重危險的工作。如汽車裝配機器，外太空探測器等。然而，現(xiàn)在的研究還不足以令行為Agent讓人信服，只是在特定的條件下才能發(fā)揮特點。如讓Agent平衡自然上下樓梯就不是一件易為的工作。我想行為Agent發(fā)展的將來就是機器人，與人類一起生活工作在現(xiàn)實世界中，距完全實現(xiàn)這一天也許很遠，但在一定程度上獲得突破很值得期待。五多Agent系統(tǒng)Multi-Agent在大型的虛擬環(huán)境中，一個Agent并不能很真實的反映客觀世界的情況，常常需要大群Agent參予其中，相互交流，協(xié)同合作。比如社會系統(tǒng)的模擬，35稱之為MAS(Mul

35、ti-Agent Society)；36中螞蟻王國的例子是基于計算Agent (Computational Agent)，CA代表一一對應(yīng)關(guān)系的有機體。以下以金斯敦大學(xué)計算和信息學(xué)院的FreeWill3334體系構(gòu)架為例，說明多Agent在生成人群場景上的應(yīng)用。FreeWill的目的是利用多Agent完成人群場景的模擬，設(shè)計實現(xiàn)一套可擴展可調(diào)節(jié)的認知構(gòu)架，并和其它軟件包協(xié)同工作，如幾何引擎，AI引擎等。FreeWill用java編碼，圖形包用的是3D Max Studio。5.1 虛擬人AvatarFreeWill的虛擬人集合FCAFunges Cognitive Architecture和S

36、AC32的特點，并擴展成更魯棒更靈活的體系。表5-1是關(guān)于FCA和SAC的對比。表5-1每個虛擬人都是改進的SAC Agent，有兩個子系統(tǒng)：幾何引擎和AI引擎。幾何引擎包括一系列幾何函數(shù)，把握虛擬人的軀體參數(shù)。幾何引擎是從FCA體系中借鑒過來，以反運動學(xué)控制虛擬人的幾何面。幾何引擎內(nèi)建了許多簡單的動作模式模擬人的行為。AI引擎完成環(huán)境感應(yīng)，數(shù)據(jù)感知，目標規(guī)劃，碰撞避免等。FCA的內(nèi)部世界模型是知識的基本組成，同樣包含計劃庫(Plan Library)。圖5-25.2 虛擬人間的通信Communication among Agents虛擬人之間的通信主要通過基于事件(Event)的全局調(diào)度(圖

37、5-2)實現(xiàn)。調(diào)度器(Scheduler)維護一個事件隊列，既分配事件，又要安排事件的序列。虛擬人必須先提交一個事件到調(diào)度器，等到接受這個事件才能執(zhí)行相應(yīng)的命令。所以FreeWill執(zhí)行周期是這樣進行的：(1) 虛擬人感應(yīng)環(huán)境的變化；(2) 更新信念(Belief)；(3) 評估當(dāng)前計劃，如果一個新的動作必須被執(zhí)行，取消當(dāng)前運動隊列，提交新的動作事件；(4) 如果需要，更新目標；(5) 如果需要，更新計劃；(6) 選擇上一個動作并提交，當(dāng)虛擬人執(zhí)行一個動作時，也會提交一個感應(yīng)事件。例如兩個虛擬人都要走過環(huán)境的某一個位置，感應(yīng)時都發(fā)現(xiàn)沒有其她人，于是提交行走動作，此時，調(diào)度器就可以延遲其中一個

38、動作事件的分配，使一個虛擬人等待。目的層次切換也是虛擬人交互的重要手段。起初，要為每一個虛擬人設(shè)定一個主目的，然后驅(qū)動她們。在運動過程中，虛擬人根據(jù)內(nèi)部知識和感應(yīng)數(shù)據(jù)，判斷是否有新目的，并會切換執(zhí)行。比如，虛擬人在走到一點的過程中遇到一個朋友，會將主目的替換成第二目的，重新計劃同步握手動作，之后如果沒有其它意外，又切回主目的，繼續(xù)行走。圖5-3是FreeWill模擬人行道上行人們的結(jié)果。圖5-35.3 小結(jié)相對單個Agent，多Agent替社會系統(tǒng)等群體結(jié)構(gòu)的研究打下了基礎(chǔ)。然而體系構(gòu)架更為復(fù)雜，現(xiàn)有的進展尚且不能滿足人們的實踐要求。將來的發(fā)展應(yīng)該有：交流基礎(chǔ)上的協(xié)作，如FreeWill系統(tǒng)的

39、虛擬人就不能合作抬起一個箱子；個體和群體相結(jié)合，不僅僅在整體結(jié)構(gòu)上模擬，而且單個Agent也具有多種多樣的生物行為；環(huán)境更加真實，Agent也更加適應(yīng)，如果給環(huán)境加入天氣、災(zāi)難、謠言等因素，Agent也應(yīng)該可以模擬人的行為。六總結(jié)Conclusion通過以上的閱讀學(xué)習(xí)，對智能Agent在虛擬環(huán)境中的應(yīng)用，我形成了一個大致的框架。智能Agent這個概念雖然在很多應(yīng)用程序中都存在，但是真正能提出一個完整的體系框架的系統(tǒng)卻寥寥無幾。因此，智能Agent其實并沒有在市場上普及。隨著人們對計算機越來越熟悉，自然不會再滿足于單方向的控制，不論是商業(yè)還是個人的應(yīng)用，都希望計算機更聰明，能自主地選擇具體命令

40、，合理協(xié)調(diào)規(guī)劃，不僅正確而且高效地完成規(guī)定的目標。同時，給計算機一個人性化的外表，而不僅是一堆冰冷的金屬，也是家庭應(yīng)用的發(fā)展方向。這將促進多通道、多方位的人機交流。我想，智能Agent應(yīng)該是一個與現(xiàn)實世界的性質(zhì)較為吻合的理論，偏向于實際，可以很容易地引入到系統(tǒng)中，當(dāng)如果設(shè)計不當(dāng)，勉強使用，并不能起到應(yīng)有的效果，反而混淆概念，僅給系統(tǒng)披上人工智能的流行外衣，內(nèi)里是一塌糊涂。從所查閱的論文看出，美國的研究者自然投入很多資源，而歐洲和日本的大學(xué)和研究機構(gòu)在智能Agent科研上也作了很多工作，取得顯著的成績。七引文References以下引文全部來自互聯(lián)網(wǎng)，僅僅仔細閱讀其中的一部分，其它只是粗略的瀏

41、覽歸類。1 Stan Franklin , Art Graesser, Is it an Agent, or just a Program?:A Taxonomy for Autonomous Agents, Institute for Intelligent Systems, University of Memphis, Proceedings of the Third International Workshop on Agent Theories, Architectures, and Languages, Springer-Verlag, 1996.2 Helmut Prendinge

42、r, Santi Saeyor, and Mitsuru Ishizuka, Animated Agents for Language Conversation Training, Department of Information and Communication Engineering, School of Engineering, University of Tokyo3 Ron Cole, Tim Carmell, Pam Connors, Mike Macon, Johan Wouters, Jacques de Villiers, Alice Tarachow，Intellige

43、nt Animated Agents for Interactive Language Training, Center for Spoken Language Understanding, Oregon Graduate Institute, Portland, Oregon4 Marc Evers, Anton Nijholt, Jacob: An Educational Agent in a Virtual Environment, Centre of Telematics and Information Technology (CTIT) University of Twente 5S

44、hoham, “Agent-oriented Programming”6 Ipke Wachsmuth, Yong Cao, Interactive Graphics Design with Situated Agents, Faculty of Technology, University of Bielefeld7 Norman Badler, Virtual Humans for Animation, Ergonomics, and Simulation, Center for Human Modeling and Simulation University of Pennsylvani

45、a Philadelphia8 Elisabeth Andr, Thomas Rist, Controlling the Behaviour of Animated Presentation Agents in the Interface:Scripting versus Instructing9 Helmut Prendinger, Mitsuru Ishizuka, SCREAM: Scripting Emotion- based Agent Minds, Dept. of Information and Communication Eng. Graduate School of Info

46、rmation Science and Technology, University of Tokyo10 Yasmine Arafa, Kaveh Kamyab, Ebrahim Mamdani, Sumedha Kshirsagar, Nadia Magnenat-Thalmann, Anthony Guye-Vuillme, Daniel Thalmann, Two approaches to Scripting Character Animation11 Johan F. Hoorn , Anton Eliens , Zhisheng Huang , Henriette C. van

47、Vugt, Elly A. Konijn, Cees T. Visser, Agents with Character: Evaluation of Empathic Agents in Digital Dossiers12 Animated Pedagogical Agents in Multimedia Educational Environments: Effects of Agent Properties, Picture Features, and Redundancy13 *Cholyeun Hongpaisanwiwat, *Michael Lewis, Attentional

48、Effect of Animated Character, *Department of Computer Science, Thammasat University, *School of Information Sciences, University of Pittsburgh14 Stan Franklin, Art Graesser, Is it an Agent, or just a Program?: A Taxonomy for Autonomous AgentsInstitute for Intelligent Systems University of MemphisPro

49、ceedings of the Third International Workshop on Agent Theories, Architectures, and Languages, Springer-Verlag, 199615 *Michael Wooldridge, *Nicholas R. Jennings, Intelligent Agents: Theory and Practice, *Department of Computing Manchester Metropolitan University, *Department of Electronic Engineerin

50、g Queen Mary & Westfield College, Knowledge Engineering Review, October 199416 Stuart Russell, Peter Norvig, Artificial Intelligence: A Modern Approach, 2nd ed., Prentice Hall, Upper Saddle River, NJ, 200317 Ian Paul Wright, Emotional Agent, School of Computer Science, Cognitive Science Research Cen

51、tre, University of Birmingham, A thesis submitted to the Faculty of Science of the University of Birmingham for the degree of DOCTOR OF PHILOSOPHY18 *Yukiko I. Nakano, * Masashi Okamoto, *Daisuke Kawahara, *Qing Li, *Toyoaki Nishida, Converting Text into Agent Animations: Assigning Gestures to Text,

52、 *Japan Science and Technology Agency, *The University of Tokyo19 Dominic W. Massaro, Michael M. Cohen, Jonas Beskow, Sharon Daniel, and Ronald A. Cole, Developing and Evaluating Conversational Agents Perceptual Science Laboratory University of California20 Stefan Kopp, Ipke Wachsmuth, Model-based A

53、nimation of Coverbal Gesture, Artificial Intelligence Group Faculty of Technology, University of Bielefeld21 Christian Becker, Stefan Kopp, and Ipke Wachsmuth, Simulating the emotion dynamics of a multimodal conversational agent, Artificial Intelligence Group Faculty of Technology, University of Bie

54、lefeld22 Multimodal Dialogs with a Conversational Agent23 Jonas Beskow, ANIMATION OF TALKING AGENTS, Centre for Speech Technology KTH, 199724 Norman Badler, Jan Allbeck, Liwei Zhao, Meeran Byun, Representing and Parameterizing Agent Behaviors, Center for Human Modeling and Simulation, Computer and I

55、nformation Science, University of Pennsylvania25 Vinoba Vinayagamoorthy, Mel Slater, Anthony Steed, Emotional personification of humanoids in Immersive Virtual Environments, Department of Computer Science, University College London26 徐曉媛(Xiaoyuan), Artificial Animals for Computer Animation: Biomecha

56、nics, Locomotion, Perception, and Behavior, Department of Computer Science, University of Toronto, for the defree of Doctor of Philosophy, 199627 James J. Ku_ner, Jr, AUTONOMOUS AGENTS FOR REAL-TIME ANIMATION, the department of computer science of stanford university, for the degree of Doctor of Phi

57、losophy, December 199928 Armin Bruderlin, Sidney Fels, Silvio Esser, Kenji Mase, Hierarchical Agent Interface for Animation, ATR Media Integration & Communication, Japan29 Toni Conde, William Tambellini, and Daniel Thalmann, Behavioral Animation of Autonomous Virtual Agents Helped by Reinforcement L

58、earning, Virtual Reality Lab, Swiss Federal Institute of Technology (EPFL)30 John P. Granieri, Welton Becket, Barry D. Reich, Jonathan Crabtree, Norman I. Badler, Behavioral Control for Real-Time Simulated Human Agents, Center for Human Modeling and Simulation, University of Pennsylvania31 Damian Is

59、la, Robert Burke, Marc Downie, Bruce Blumberg, A Layered Brain Architecture for Synthetic Creatures, The Media Laboratory Massachusetts Institute of Technology, pp. 1051-1058, in Proceedings of Seventeenth Joint Conference on Artificial Conference IJCAI-01, 4-10 August, Seattle, USA, 200132 Zhigang Wen, Q.H. Mehdi, N.E. Gough, A New Animation Approach

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

智能Agent及多Agent在虛擬現(xiàn)實系統(tǒng)中的應(yīng)用研究進展

文檔簡介

溫馨提示

最新文檔

評論

智能Agent及多Agent在虛擬現(xiàn)實系統(tǒng)中的應(yīng)用研究進展

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔