大語言模型通識微課課件：智能體和環(huán)境

上傳人：熊*** IP屬地：山東上傳時間：2024-10-12 格式：PPTX 頁數(shù)：14 大?。?20.12KB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩9頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

大語言模型通識微課

智能體和環(huán)境智能體是人工智能領(lǐng)域中的一個很重要的概念，它指的是一個能自主活動的軟件或者硬件實(shí)體。任何獨(dú)立的能夠思考并可以與環(huán)境交互的實(shí)體都可以抽象為智能體。大模型在人工智能應(yīng)用領(lǐng)域的重大突破，讓人們看到了智能體新的發(fā)展機(jī)會。像ChatGPT和GPT-4這樣的基于Transformer架構(gòu)的大模型，成為了為智能體裝備的擁有廣泛任務(wù)能力的“大腦”，從推理、規(guī)劃和決策到行動都使智能體展現(xiàn)出前所未有的能力?；诖竽Ｐ偷闹悄荏w將廣泛深刻地影響人們生活工作的方式。微課10.1智能體和環(huán)境智能體通過傳感器感知環(huán)境并通過執(zhí)行器作用于該環(huán)境的事物。我們從檢查智能體、環(huán)境以及它們之間的耦合，觀察到某些智能體比其他智能體表現(xiàn)得更好，可以自然而然地引出理性智能體的概念，即行為盡可能好。智能體的行為取決于環(huán)境的性質(zhì)。

圖10-1智能體通過傳感器和執(zhí)行器與環(huán)境交互微課10.1智能體和環(huán)境一個人類智能體以眼睛、耳朵和其他器官作為傳感器，以手、腿、聲道等作為執(zhí)行器。而機(jī)器人智能體可能以攝像頭和紅外測距儀作為傳感器，各種電動機(jī)作為執(zhí)行器。軟件智能體接收文件內(nèi)容、網(wǎng)絡(luò)數(shù)據(jù)包和人工輸入（鍵盤/鼠標(biāo)/觸摸屏/語音）作為傳感輸入，并通過寫入文件、發(fā)送網(wǎng)絡(luò)數(shù)據(jù)包、顯示信息或生成聲音對環(huán)境進(jìn)行操作。環(huán)境可以是一切，甚至是整個宇宙。實(shí)際上，我們在設(shè)計智能體時關(guān)心的只是宇宙中某一部分的狀態(tài)，即影響智能體感知以及受智能體動作影響的部分。微課10.1智能體和環(huán)境智能體這一概念主要作為分析系統(tǒng)的工具。理性智能體是做正確事情的事物。人工智能通常通過結(jié)果來評估智能體的行為。當(dāng)智能體進(jìn)入環(huán)境時，它會根據(jù)接受的感知產(chǎn)生一個動作序列，這會導(dǎo)致環(huán)境經(jīng)歷一系列的狀態(tài)。如果序列是理想的，則智能體表現(xiàn)良好，這個概念由性能度量描述，評估任何給定環(huán)境狀態(tài)的序列。10.1.1關(guān)于智能體人類有適用于自身的理性概念，它與成功選擇產(chǎn)生環(huán)境狀態(tài)序列的行動有關(guān)，而這些環(huán)境狀態(tài)序列從人類的角度來看是可取的。但是，機(jī)器沒有自己的欲望和偏好，至少在最初，性能度量是在機(jī)器設(shè)計者或者機(jī)器受眾的頭腦中。一些智能體設(shè)計具有性能度量的顯式表示，而在其他設(shè)計中，性能度量完全是隱式的，智能體可能會做正確的事情，但它不知道為什么。應(yīng)該確?！笆┮詸C(jī)器的目的是我們真正想要的”，但是正確地制定性能度量可能非常困難。例如，考慮真空吸塵器智能體，我們可能會用單個8小時班次中清理的灰塵量來度量其性能。然而，一個理性的智能體可以通過清理灰塵，然后將其全部傾倒在地板上，然后再次清理，如此反復(fù)，從而最大化這一性能度量值。更合適的性能度量是獎勵擁有干凈地板的智能體。例如，在每個時間步中，每個干凈方格可以獲得1分（可能會對耗電和產(chǎn)生的噪聲進(jìn)行懲罰）。作為一般規(guī)則，更好的做法是根據(jù)一個人在環(huán)境中真正想要實(shí)現(xiàn)的目標(biāo)，而不是根據(jù)一個人認(rèn)為智能體應(yīng)該如何表現(xiàn)來設(shè)計性能度量。10.1.2性能度量在任何時候，理性取決于以下4方面：（1）定義成功標(biāo)準(zhǔn)的性能度量；（2）智能體對環(huán)境的先驗(yàn)知識；（3）智能體可以執(zhí)行的動作；（4）智能體到目前為止的感知序列。于是，對理性智能體的定義是：對于每個可能的感知序列，給定感知序列提供的證據(jù)和智能體所擁有的任何先驗(yàn)知識，理性智能體應(yīng)該選擇一個期望最大化其性能度量的動作。10.1.3理性需要區(qū)分理性和全知。全知的智能體能預(yù)知其行動的實(shí)際結(jié)果，并據(jù)此采取行動，但現(xiàn)實(shí)中這是不可能的，理性不等同于完美。理性使期望性能最大化，而完美使實(shí)際性能最大化。因此，對理性的定義并不需要全知，因?yàn)槔硇詻Q策只取決于迄今為止的感知序列。首先，考慮到這種缺乏信息的感知序列，過馬路是不理性的：不觀察路況就過馬路發(fā)生事故的風(fēng)險太大。其次，理性智能體在上街之前應(yīng)該選擇“觀察”動作，因?yàn)橛^察有助于最大化期望性能。采取行動來改變未來的感知，有時被稱為信息收集，這是理性的一個重要組成部分。10.1.4全知、學(xué)習(xí)和自主理性智能體不僅要收集信息，還要盡可能多地從它所感知到的東西中學(xué)習(xí)。智能體的初始配置反映對環(huán)境的一些先驗(yàn)知識，隨著智能體獲得經(jīng)驗(yàn)，這可能會被修改和增強(qiáng)。在一些極端情況下，環(huán)境完全是先驗(yàn)已知和完全可預(yù)測的，這種情況下智能體只需要感知或?qū)W習(xí)，但這樣的智能體是脆弱的。一個理性的智能體應(yīng)該學(xué)習(xí)如何彌補(bǔ)部分或不正確的先驗(yàn)知識。實(shí)際上，很少從一開始就要求智能體完全自主，除非設(shè)計者提供幫助，否則它將不得不隨機(jī)行動。10.1.4全知、學(xué)習(xí)和自主構(gòu)建理性智能體還必須考慮任務(wù)環(huán)境，它本質(zhì)上是“問題”，而理性智能體是其“解決方案”。首先指定任務(wù)環(huán)境，然后展示任務(wù)環(huán)境的多種形式。任務(wù)環(huán)境的性質(zhì)直接影響到智能體程序的恰當(dāng)設(shè)計。例如在討論簡單真空吸塵器智能體的理性時，必須為其指定性能度量、環(huán)境以及智能體的執(zhí)行器和傳感器（PEAS）描述，這些都在任務(wù)環(huán)境的范疇下。設(shè)計智能體時，第一步始終是盡可能完整地指定任務(wù)環(huán)境。10.1.5指定任務(wù)環(huán)境人工智能中可能出現(xiàn)的任務(wù)環(huán)境范圍非常廣泛。然而，我們可以確定少量的維度，并根據(jù)這些維度對任務(wù)環(huán)境進(jìn)行分類。完全可觀測與部分可觀測：如果智能體的傳感器能讓它在每個時間點(diǎn)都能訪問環(huán)境的完整狀態(tài)，那么就說任務(wù)環(huán)境是完全可觀測的。單智能體與多智能體：多智能體環(huán)境中的智能體設(shè)計問題通常與單智能體環(huán)境下有較大差異。確定性與非確定性：如果環(huán)境的下一個狀態(tài)完全由當(dāng)前狀態(tài)和智能體執(zhí)行的動作決定，那么就說環(huán)境是確定性的，否則是非確定性的。10.1.6任務(wù)環(huán)境的屬性回合式與序貫：在回合式任務(wù)中，智能體的經(jīng)驗(yàn)被劃分為原子式回合，每接收一個感知執(zhí)行單個動作。下一回合不依賴于前幾回合采取的動作?；睾鲜江h(huán)境下的智能體不需要提前思考，所以要比序貫環(huán)境簡單很多。靜態(tài)與動態(tài)：如果環(huán)境在智能體思考時發(fā)生了變化，就說該智能體的環(huán)境是動態(tài)的，否則是靜態(tài)的。離散與連續(xù)：這之間的區(qū)別適用于環(huán)境的狀態(tài)、處理時間的方式以及智能體的感知和動作。例如駕駛出租車是一個連續(xù)狀態(tài)和連續(xù)時間的問題。10.1.6任務(wù)環(huán)境的屬性已知與未知：這種區(qū)別是指智能體（或設(shè)計者）對環(huán)境“物理定律”的認(rèn)知狀態(tài)。在已知環(huán)境中，所有行動的結(jié)果（如

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

大語言模型通識微課課件：智能體和環(huán)境

文檔簡介

溫馨提示

最新文檔

評論

大語言模型通識微課課件：智能體和環(huán)境

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔