人工智能在計(jì)算機(jī)兵棋推演領(lǐng)域的應(yīng)用_第1頁
人工智能在計(jì)算機(jī)兵棋推演領(lǐng)域的應(yīng)用_第2頁
人工智能在計(jì)算機(jī)兵棋推演領(lǐng)域的應(yīng)用_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、人工智能在計(jì)算機(jī)兵棋推演領(lǐng)域的應(yīng)用摘要:智能化博弈對抗的理念和技術(shù)可以應(yīng)用于兵棋推演?;谟?jì)算機(jī)兵棋的 特點(diǎn)、人工智能發(fā)展現(xiàn)狀和核心技術(shù),探討將深度學(xué)習(xí)應(yīng)用到兵棋推演的方法、途 徑和問題,分析人工智能在計(jì)算機(jī)兵棋推演中的應(yīng)用現(xiàn)狀和未來發(fā)展。關(guān)鍵詞:計(jì)算機(jī)工程;?兵棋推演;?人工智能;?深度學(xué)習(xí);1956 年達(dá)特茅斯會議上約翰 ?麥肯錫首次提出了人工智能 (ArtificialIntelligence,AI)的概念,當(dāng)初定義的基本范圍是“用計(jì)算機(jī)模擬人的邏輯思維”。可以 看出,這一定義并沒有包含人類的學(xué)習(xí)能力、歸納總結(jié)能力、決策能力等,可以認(rèn) 為是狹義人工智能范疇。近些年來,隨著模糊邏輯和遺傳算

2、法等技術(shù)的成熟,特別 是神經(jīng)網(wǎng)絡(luò)的發(fā)展及深度學(xué)習(xí)的興起,人工智能更傾向于指依托計(jì)算機(jī)運(yùn)用數(shù)學(xué)算 法模仿人類智力,讓機(jī)器“學(xué)會”人類的分析、推理、思維乃至決策的能力。兵棋特點(diǎn)兵棋推演的實(shí)施過程主要如下:在導(dǎo)演部及導(dǎo)調(diào)機(jī)構(gòu)的導(dǎo)控下,由參演人員在 想定的戰(zhàn)場環(huán)境下,與假定的藍(lán)軍部隊(duì)進(jìn)行指揮層面的對抗,完整實(shí)現(xiàn)演訓(xùn)準(zhǔn)備、 組織實(shí)施和總結(jié)評估全流程。兵棋是棋 與常規(guī)棋一樣,兵棋體現(xiàn)了兩個(gè)核心因素,(1)規(guī)則制定的客觀性;(2)行棋過程的自由性。兵棋系統(tǒng)的基本構(gòu)成要素主要有棋子、棋盤、規(guī)則、骰子(隨機(jī)數(shù)發(fā)生 器)、回合以及裁決表。兵棋中的棋子、棋盤、裁決表等都是具象化、數(shù)字化、精 確化棋的客觀特征體現(xiàn)。兵

3、棋的核心是兵棋規(guī)則,包括規(guī)定棋子在地圖上如何移動 的行棋規(guī)則和判定兩支部隊(duì)相遇時(shí)交戰(zhàn)結(jié)果的裁判規(guī)則。兵棋的行棋過程又稱為 兵棋推演,推演者采取類似博弈的過程輪流行棋,另設(shè)裁判者依據(jù)裁判規(guī)則對場上 局勢進(jìn)行裁定。此外,推演過程中還通過擲骰子模擬戰(zhàn)場上的隨機(jī)因素。兵棋非“棋” 兵棋推演往往是要展現(xiàn)實(shí)際作戰(zhàn)過程,很難通過“下棋”中嚴(yán)格的“你來我往”的回合制來全面體現(xiàn)。兵棋推演需要通過以上六個(gè)基本要素之間的相互作用,充分體 現(xiàn)了實(shí)際戰(zhàn)爭過程中的戰(zhàn)場復(fù)雜性、戰(zhàn)況緊迫性、戰(zhàn)情隨機(jī)性、戰(zhàn)果規(guī)律性等,需 要能逼真地反映實(shí)際作戰(zhàn)過程,陸、海、空、火、天、網(wǎng)等聯(lián)合作戰(zhàn)的特點(diǎn),需要 各方根據(jù)態(tài)勢發(fā)展進(jìn)行不斷地判斷和

4、決策,從而模擬出實(shí)際的作戰(zhàn)流程及作戰(zhàn)效果。 戰(zhàn)爭還有一個(gè)顯著的特點(diǎn)就是不可重復(fù)性,同樣的基礎(chǔ)對抗條件,在不同的隨機(jī)因 素影響下會產(chǎn)生完全不同的結(jié)果。由此可見,兵棋推演需要模擬的作戰(zhàn)要素繁多, 關(guān)系錯綜復(fù)雜,態(tài)勢瞬息萬變,常規(guī)的“棋”很難涵蓋完整這么一個(gè)復(fù)雜系統(tǒng)。1.3 計(jì)算機(jī)兵棋 兵棋推演本身對工具支撐并無太多要求,其流行之初也是以手工兵棋為主要手 段。傳統(tǒng)手工兵一般以棋子進(jìn)攻、防御二值描述,采用的是力量對比方式,在增加 隨機(jī)因素的基礎(chǔ)上,用表格的形式進(jìn)行裁決以得到交戰(zhàn)結(jié)果。其后,為了節(jié)約人力和時(shí)間、提高推演效率,體現(xiàn)更復(fù)雜的聯(lián)合作戰(zhàn)行動模擬 效果,開始出現(xiàn)了計(jì)算機(jī)兵棋。計(jì)算機(jī)兵棋推演體系采用

5、完善的軍事地理系統(tǒng)軟件, 提供規(guī)范化的作業(yè)平臺,軍事應(yīng)用人員可以更加聚焦于對抗推演本身,使兵棋推演 過程和實(shí)際作戰(zhàn)指揮結(jié)合得更密切。隨著現(xiàn)代計(jì)算機(jī)兵棋理念的發(fā)展,支撐規(guī)?;?指揮對抗模擬的復(fù)雜兵棋系統(tǒng),也開始逐步打破傳統(tǒng)兵棋回合制的推演過程,向?qū)?時(shí)推演轉(zhuǎn)變。在計(jì)算機(jī)兵棋推演環(huán)境中,作戰(zhàn)兵力的動態(tài)性、作戰(zhàn)過程的隨機(jī)性、 作戰(zhàn)決策的多樣性更能造就兵棋推演環(huán)境中的復(fù)雜性。深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)人工智能涉及的關(guān)鍵技術(shù)十分廣泛,其中神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)技術(shù) 是其重要的代表。神經(jīng)網(wǎng)絡(luò)技術(shù)從信息處理角度對人腦神經(jīng)元網(wǎng)絡(luò)進(jìn)行抽象,建立某種簡單模型, 按不同的連接方式組成不同的網(wǎng)絡(luò)。體現(xiàn)出了卓越的自我學(xué)習(xí)

6、、反饋聯(lián)想、高效 尋優(yōu)的能力特點(diǎn)。而在神經(jīng)網(wǎng)絡(luò)技術(shù)基礎(chǔ)上發(fā)展起來的深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)對人 工智能技術(shù)的成熟和推廣起到了重要的作用。具有感知能力的深度學(xué)習(xí)(deeplear ning, DL)是基于神經(jīng)網(wǎng)絡(luò)上的一種再升級, 是一種通過對大量有效樣本的學(xué)習(xí),形成對事物特征的提取、分類和解讀的方法。深度學(xué)習(xí)通過建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),模仿人腦的機(jī)制來獲 取、分析和解釋數(shù)據(jù),通過無監(jiān)督的預(yù)訓(xùn)練,有監(jiān)督的逐層訓(xùn)練、微調(diào)訓(xùn)練等過程, 逐步提煉出事物內(nèi)在的關(guān)聯(lián)關(guān)系、結(jié)構(gòu)關(guān)系和邏輯關(guān)系等。人工智能對兵棋推演的影響人工智能的快速發(fā)展,將計(jì)算機(jī)兵棋的作用從節(jié)約人力和時(shí)間、提高推演效率 支撐復(fù)雜推演提

7、升到了打造指揮對抗領(lǐng)域的智能藍(lán)軍和輔助參謀的高度。所謂智 能藍(lán)軍,就是讓系統(tǒng)充當(dāng)既定假想“藍(lán)軍”“綠軍”參加演習(xí)。通過對有限樣本數(shù)據(jù)的 不斷深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí),使得對手變得更加專業(yè)、更像假想藍(lán)軍,從而實(shí)現(xiàn)局部 乃至全局的人機(jī)對抗。所謂輔助參謀,就是計(jì)算機(jī)系統(tǒng)充當(dāng)隱藏于幕后的我方部分 指揮力量、參謀力量,實(shí)現(xiàn)識別態(tài)勢、發(fā)布計(jì)劃、自主決策、監(jiān)控行動、調(diào)整任務(wù) 等功能,為我方指揮提供實(shí)時(shí)精準(zhǔn)參謀。問題及解決途徑人工智能迅猛發(fā)展,核心技術(shù)突飛猛進(jìn)。但人工智能技術(shù)在計(jì)算機(jī)兵棋領(lǐng)域的 深入發(fā)展也存在以下的不確定性,其根源還在“棋”與“戰(zhàn)”固有的巨大差異,還在于如 何將全面感知和精準(zhǔn)決策的根本目標(biāo)在兵棋領(lǐng)域

8、實(shí)現(xiàn)。有效樣本的獲取。目前戰(zhàn)術(shù)、戰(zhàn)役乃至戰(zhàn)略層級的計(jì)算機(jī)兵棋平臺百花齊放、層出不窮,先不論 其自身的完善性、置信度,就目前基于上述平臺的推演數(shù)據(jù)而言,基本屬于量多質(zhì) 低的情況。在未能深入、全面研究假想“藍(lán)軍”的情況下,其指揮環(huán)節(jié)的戰(zhàn)術(shù)戰(zhàn)法往 往就發(fā)散為自由發(fā)揮的“紅軍”思想。同理,在無逼真“藍(lán)軍”模擬的情況下,“紅軍”的 指揮思路也更無針對性可言,用于支撐深度學(xué)習(xí)的數(shù)據(jù)樣本的有效性和標(biāo)簽性均難 以保證。所以,人工智能技術(shù)若想在計(jì)算機(jī)兵棋領(lǐng)域得以深入發(fā)展,需要確立可作 為各類標(biāo)簽數(shù)據(jù)的基本標(biāo)準(zhǔn),參透并運(yùn)用好特定“藍(lán)軍”的戰(zhàn)術(shù)戰(zhàn)法,生產(chǎn)出涵蓋所需 標(biāo)簽類別的足夠數(shù)量數(shù)據(jù),用以支撐深度學(xué)習(xí)。信息感知

9、與研判。常規(guī)棋盤是透明的,是一種典型的開放式信息感知狀態(tài)下的博弈。當(dāng)前的棋面 信息對于雙方棋手來說是完全公平和透明的,棋手每走一步,都可以根據(jù)當(dāng)前的盤 面信息做出決策。而戰(zhàn)爭過程并不是全透明的,甚至有時(shí)故意假亦真時(shí)真亦假,往往會釋放出戰(zhàn) 爭迷霧,須要通過綜合情報(bào)偵察和分析來獲取有效、真實(shí)戰(zhàn)場信息,這決定了兵棋 推演完全應(yīng)該是一種信息非對稱條件下的動態(tài)指揮博弈。兵棋推演過程若沒有情 報(bào)探測、戰(zhàn)場感知等要素的支撐,就無法體現(xiàn)“交戰(zhàn)”雙方在感知層面的手段高低和 能力差異。若無法通過強(qiáng)化學(xué)習(xí)手段讓人工智能逐步掌握剝離戰(zhàn)爭迷霧、獲取有 用信息的研判和決策能力,人工智能技術(shù)也將無法進(jìn)一步發(fā)揮打造“智能藍(lán)軍”和“輔助參謀”的作用。結(jié)語 人工智能技術(shù)的發(fā)展將計(jì)算機(jī)兵棋的作用向前進(jìn)了一大步,使之從條件支撐的 角色轉(zhuǎn)變?yōu)樯疃葏⑴c的角色。但其中支撐強(qiáng)大感知和決策能力的深度強(qiáng)化學(xué)習(xí)技 術(shù)也還處于不斷發(fā)展過程完善過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論