軍方正在開發自主機器人以執行偵察和監視等任務。其中一些機器人打算以群組形式運作。由于目前還沒有可操作的機器人群,理論開發者最初將使用建設性的實體級戰斗模型來開發和測試機器人群的戰術。實驗設計方法和1991年美軍和伊拉克軍隊之間的東興73號戰役的回顧被用來校準一個半自動兵力系統。然后,校準后的作戰模型被用來估計在該戰役中進行偵察和監視的名義上的伊拉克機器人群的戰術影響。校準確保了模型的參數是準確的,從而能夠可靠地估計機器人群的戰術影響。此外,實驗設計方法對機器人群的效果與戰斗人員的武器系統技術的相互作用進行了估計。模擬試驗和統計分析表明,伊拉克機器人群的戰術優勢被美軍的熱成像儀所提供的優勢掩蓋了。然而,額外的試驗表明,如果雙方都只裝備了光學瞄準器,機器人群向伊拉克部隊提供的早期預警可能對戰斗的結果產生重大影響。
圖1. 示例:VR-Forces的SAF系統操作界面。(圖片由MAK Technologies提供。)
隨著世界進入另一個大國競爭時期,自主性、人工智能和蜂群等屬性作為軍事技術和理論的未來被大眾媒體越來越多地提及。正在研究的自主性、人工智能和蜂群的一個應用是使用機器人群進行偵察和監視,以提高軍事部隊的態勢感知。2017年3月公布的美國陸軍機器人和自主系統(RAS)戰略是陸軍的公開聲明,說明陸軍打算如何在現有的機器人能力基礎上,"在將地面和空中RAS能力整合到陸軍組織方面實現統一的努力"。利用無人地面系統(UGS)和無人飛機系統(UAS)提高態勢感知是RAS的五個能力目標之一。
在未來的軍事行動中使用機器人群,需要制定與軍事部隊的理論、訓練和裝備的能力和限制相結合的機器人群戰術。戰術是實體層面的行為或行動的學說或程序,旨在實現任務的成功。目前還沒有軍事機器人群的作戰實例,無法在實際環境中制定這種戰術,也沒有軍事機器人群的歷史實例。因此,最初將使用建模和模擬來開發和測試這種戰術。6這樣做就需要模型不僅準確地代表機器人群的能力,而且還代表人類戰斗人員、武器系統和參戰部隊采用的戰術。
在這項研究中,一個半自動兵力(SAF)系統被用來估計機器人群的潛在戰術影響。明確地說,這項研究的目標不是如何設計蜂群機器人以達到某種水平,而是估計在某種水平上執行的機器人蜂群可能對戰斗產生什么影響。因此,模擬的機器人群被假定為具有某些合理的、甚至是適度的能力,而不考慮這些能力可能如何實現。
第一項任務是將SAF系統中的車輛和武器系統的相關參數,如裝甲保護、傳感器能力和武器精度,校準為現實的數值。校準是一個反復的過程,執行模擬模型,將其結果與描述模型系統的數據進行比較,并調整模型以提高其準確性。在這項研究中,SAF系統或模型是通過追溯預測或 "追溯 "來校準的,這種方法包括模擬一場歷史戰役并將模擬結果與戰役的歷史結果進行比較。在1991年海灣戰爭期間,美國和伊拉克的地面部隊之間發生了有據可查的73 Easting戰役,該戰役被用于校準。實際戰斗的結果是出乎意料的,而且是明顯的一邊倒,這就要求校準時考慮到美國和伊拉克軍隊在武器技術、戰術運用和部隊訓練方面的重大差異。
正式的實驗設計(DOE)方法被用來構造模型的校準。六個因素被確定為可能影響模擬戰斗的結果,每個因素被設定為兩個水平。一個全因子實驗設計,每個水平組合有兩個重復,需要128次模擬戰斗的試驗。在這六個因素中,DOE的統計分析確定了其中三個因素,即美國對熱瞄準器的使用、M1A1坦克的裝甲保護以及伊拉克軍隊占領其車輛和準備戰斗的延遲,是對戰斗結果最突出的影響。
如果使用機器人群來提供足夠的早期預警,那么延遲占領伊拉克車輛及其對戰斗結果的影響可能是可以避免的。另外還進行了120次實驗,以估計伊拉克部隊使用機器人群可能對結果產生的影響。在兩個因素的四個組合中,每個組合都進行了30次試驗。美軍采用或不采用熱傳感器,伊拉克軍隊采用或不采用無人機群進行預警。由于戰斗時天氣狀況不佳,使用熱敏瞄準器使美軍能夠在視覺范圍之外800米處觀察伊拉克人,而伊拉克人只有光學瞄準器可用。使用熱成像儀否定了蜂群可能提供的任何預警優勢。然而,在雙方部隊都只有光學傳感器的試驗中,使用蜂群機器人提供預警使美國戰車的損失平均增加了4.8輛。結果表明,使用機器人群的有效性與現有的不同軍事技術有著強烈的互動。
本文的結構如下。在這段介紹之后,第2節提供了關于本研究主要課題的背景信息。第3節解釋了如何應用實驗設計方法來校準一個SAF系統。第4節詳細介紹了校準的輸出和分析。第5節報告了使用校準后的SAF系統來模擬和估計機器人群的戰術效果的結果。第6節陳述了研究的結論,并描述了未來可能的相關工作。
在過去的二十年里,美國防部經歷了對無人機系統(UAS)的需求和依賴,以執行廣泛的軍事應用,包括情報、監視和偵察以及打擊和攻擊任務等。隨著無人機系統技術的成熟和能力的擴大,特別是在增加自主性的情況下執行行動的能力方面,采購專業人員和行動決策者必須確定如何最好地將先進的能力納入現有和新興的任務領域。為此,美國防部已經發布了多個無人系統綜合路線圖(USIRs),目的是建立一個 "未來25年的技術愿景"。此外,每個軍種都發布了類似的路線圖,強調自主系統不斷發展的作用(美國陸軍,2010年)、(美國海軍陸戰隊,2015年)、(美國空軍AF/A2CU,2016年)、(USIR,2011年)。然而,這些路線圖并沒有提供實際應用,說明如何能夠或應該將自主性納入旨在完成未來國防部任務領域的無人機系統平臺。因此,本研究以上述出版物的概念為基礎,從自主性的角度來描述無人機系統的能力,因為它們可能在未來的美國空軍軍事任務中實施。
這項研究采用了德爾菲法來預測未來20年的無人機系統任務領域,特別是在增加無人機系統自主執行此類任務的能力方面。德爾菲技術已被應用于許多類似領域,但在預測技術發展如何影響軍事行動方面取得了明顯的成功(Linstone & Turoff, 2002)。德爾菲技術使用的主題專家(SME)來自美國空軍社區的專業人員,他們負責無人機系統技術的日常操作、采購和研究。該研究使用了兩輪問題,以深入了解無人機系統社區認為最重要和可能被納入軍事任務領域的未來能力,以及不同的無人機系統社區如何看待自主性為軍事任務帶來的挑戰和機遇。
不斷發展的顛覆性技術被證明是軍事領域的游戲規則改變者,并正在改變戰爭的特征。新技術大大縮小了部隊與指揮和控制之間的空間、時間和信息差距。戰略和戰役層面的直接接觸戰正在逐漸成為過去。對敵人的遠程非接觸性影響成為實現戰斗和行動目標的主要方式。軍事機器人可以在所有的戰爭行動和所有的地形中發揮重要作用。世界上領先的軍隊正在開發機器人技術,使他們在戰場上獲得決定性的優勢。印度的對手正在開發這種技術,以便在未來的戰斗中充當力量倍增器。這項技術的發展對印度陸軍至關重要,因為它具有巨大的潛力,可以使地面上的士兵以更有效的方式執行其任務。它在巡邏、監視、掩蔽區的行動、探測和消除爆炸裝置、提高生存能力、后勤支持和軍事設施的安全方面的應用需要得到利用。完全自主的挑戰需要分析,但士兵與機器人的合作是一項可能的任務,特別是在印度的條件下。利用機器人技術將拯救寶貴的人類生命,但不一定能取代士兵,因為邊境的兩個戰線上都需要有地面部隊。為半自主士兵-機器人協作量身定做的解決方案值得關注,也是印度陸軍未來長期需求的必要條件。
印度陸軍不可避免地需要分析和發展機器人能力,以便在戰場上為其提供決定性的優勢。本文分析了與該技術有關的各個方面,它的應用及它在各種地形中的應用,發展和應用中的挑戰,并為印度陸軍提供建設性的建議。
機器人和人工智能(AI)是技術和認知智能的結合,用于模擬、處理信息和知識,在機器中建立模仿人類行為的能力。它是一種變革性的技術,在軍事領域有巨大的應用。軍用機器人是自主機器人或遙控移動機器人,設計用于監視、后勤、安全和攻擊性任務等軍事應用。這種軍用機器人是用若干代碼和算法組裝而成的。人工智能將在未來的戰爭中發揮更大的作用,使戰場機器人化,但并不完全否定人類參與的必要性。因此,人工智能、相關硬件、傳感器和控制機器人的綜合網絡構成了軍用機器人執行軍事任務的關鍵因素。根據要求,軍用機器人可以開發出不同的形狀和尺寸,它們可以是遠程控制的,也可以是完全自主的。根據應用,機器人可以被開發為攜帶不同類型的有效載荷。根據應用要求,傳感器、探測器、武器、編程軟件和其他有效載荷可以裝備在軍事用途的機器人上。 軍用機器人可大致分為無人駕駛航空器(UAV)、無人駕駛地面車輛(UGV)和水下無人駕駛車輛。這些可以進一步分為半自動和自動。 本文將主要關注陸地部分,該技術對印度士兵起到了促進作用和伙伴的重要性。
自主/半自主機器的創建不是為了成為 "真正的'道德'機器人",而是為了遵守戰爭法則和交戰規則(ROE)。因此,影響人類士兵草率決定的疲勞、壓力、情緒、腎上腺素等都被去除;不會有個人所做的決定對戰場造成的影響。 軍事機器人可以不知疲倦地工作,減少人類的工作量,也減少戰場上的傷亡。它們是準確的,因此消除了人類的錯誤。使用機器人技術同樣能提高生產力,增強盈利能力。 這些機器可以在惡劣的天氣條件下,在核、生物、化學污染區等危險情況下工作。
領先的發達國家正在開發能夠在有/無人類干預的情況下進行作戰行動的機器人。到2022年,美國的軍用機器人產業預計將達到308.3億美元,從2017年到2022年的年復合增長率為12.92%。 美國正在建立一個下一代作戰員,可以使用所有可用的數據來幫助決策,以減少風險,管理不確定性,并提高致命性。 被稱為 "超能作戰員"的機器人機器通過提供技術援助來縮短OODA環路內的時間,從而使美國特種作戰司令部(USSOCOM)的特種作戰人員具有認知上的優勢。
美國還開發了一些機器人系統,如FLIR系統公司的Centaur,一種遠程操作的中型無人地面車輛(UGV),為作戰人員提供了探測、確認、識別和處理諸如簡易爆炸裝置等危險材料的能力。 多用途戰術運輸車(MUTT)是一種跟隨士兵的UGV,在他們的路線上為他們攜帶裝備。MUTT也可以在戰場上運送受傷的士兵,以便其他士兵可以繼續他們的行動。遙控的MUTT可以在人類之前偵查一個地區,也可以用來發射武器。Themis"(履帶式混合模塊化步兵系統)是一種多功能UGV,旨在減少戰場上的部隊數量。該機器人有一個開放的架構,可以配備輕或重機槍、40毫米榴彈發射器、30毫米自動炮和反坦克導彈系統。它有一個自穩定的遙控武器系統,可以在大范圍內提供高精確度,也可以在白天和晚上發揮作用。Throwbot 2.0是Recon Robotics公司制造的可投擲機器人,僅重0.6公斤,可在室內和室外環境中發揮作用。這種軍用機器人實時傳遞情報和偵察信息。它是一個超輕量級的防水機器人,可以被扔到野外的任何地方,并被設計成可以在各種地形上爬行。
俄羅斯武裝部隊已經發展了UGV方面的專業知識,URAN6在敘利亞進行了嘗試和測試,Uran -9目前正在開發中,以支持步兵行動。他們經常對無人系統保持一種務實的態度,利用T-72(Shturm)和T-90(Prokhod)主戰坦克以及BMP-3(Vikhr)步兵戰車等舊平臺,將這些平臺轉換為可選擇的載人作戰系統,可以在無人模式下遠程操作。Uran-9的特點是 "一個遠程操作的炮塔,可安裝不同的輕型和中型口徑的武器和導彈。Sorantik正在開發的另一種UGV被指定用于偵察和火力支援任務,但也可以承擔掃雷和巡邏任務。該車可以在全自動模式下運行,但也可以由作戰員直接控制。
印度北方邊境的多山地形給武裝部隊帶來了巨大的挑戰。空中機器人平臺可以通過利用第三維度來提高對形勢的認識。可以獲得峰頂以外的實時信息,通過人工智能算法處理,無論是在無人機上還是在操作員端,都可以提供實時的目標情報。一系列微型到遠程的無人機現在正被各種軍隊用于監視。通過武裝UCAVs和游蕩彈藥,半自動的精確瞄準也是可行的。配備有合適的傳感器和攝像機的地面機器人可以執行不同的任務,移動機器人可以遠程操作進行偵察巡邏,并將視頻和圖像傳回給操作員。機器人實際上可以充當巡邏隊中領先的先遣偵察員的伙伴。配置一個機器人以登上和降低山地高度和障礙物是一個挑戰,可以通過改變設計使其更加靈活、堅固和使用更多的動力來克服。該系統必須被設計成既能克服樓梯等規則形狀的障礙物,又能克服巖石、倒下的樹木和其他雜物等不特定形狀的障礙物。"設計基準是能夠走上45度傾斜的平坦表面或不規則的障礙。有時要求高達50度或更陡峭"。
在被雪覆蓋的山區進行搜索和救援是另一個應用,軍隊中使用的機器人可以在拯救生命方面發揮關鍵作用。大多數傷亡是由于延遲向受害者提供必要的援助而發生的。許多國家正在大力投資,以最大限度地縮短反應時間,以挽救最大數量的生命。它們可以由士兵從一個指揮中心遠程操作。在某些情況下,它們甚至可以自主地工作。美國的Vecna技術公司正在開發戰場提取輔助機器人(BEAR),它可以從戰場上營救士兵而不危及人的生命。
印度軍隊在從連隊到更高的總部和彈藥到后勤基地的許多基地/地點駐扎。在這些邊境地區的安全和防御是一個挑戰,可以有效地開發機器人來保護這些基地的安全。美國已經開發了機器人狗,它是一種靈活的移動機器人,以前所未有的機動性瀏覽地形,使你能夠自動完成常規檢查任務和安全地捕獲數據,該系統已經部署在美國的各個基地。
沙漠/半沙漠地帶的行動通常以機動性為特點。機動性是贏得戰斗的一個決定性因素。UGVs在機械化戰爭中帶來了一場革命,提供了相應的機動性。半自動的UGVs可以幫助偵察部隊實現對局勢的了解,就像眼睛和耳朵一樣。除了可以在UGVs中內置大量的傳感器外,它們還可以發射無人機作為天空中的眼睛,也可以作為無線電通信的中繼。對己方和敵方機械化編隊的實時地理定位、圖像、坦克、物體的自主識別可以證明是一個游戲規則的改變者。需要開發一個UGV和半自主坦克的組合,它可以在進攻戰中穿透敵人的蓄意防御,通過建立一個機器人射擊陣地系統來支持戰術編隊的防御行動,為前進的單位和分隊提供火力掩護,并壓制敵人的武器系統。還可以開發機器人用于炮兵偵察和為地基火炮的發射提供服務。可以利用UGV進行工兵偵察、布雷、掃雷、在雷區和其他障礙物中清理出一條通道并支持其談判。他們還可以在敵人的火力影響區布置煙幕。最后,UGV可以在后勤方面發揮重要作用,作為移動后勤縱隊的一部分,還可以協助傷員撤離。
機器人在全球反恐戰爭中發揮了重要作用,它們被用來探測和消除可能爆炸的可疑物體。機器人可以在近距離戰斗中充當領頭的偵察兵或進入者,它們不僅可以探測到威脅,還可以在最初的炮擊中首當其沖,然后將恐怖分子消滅。它們可以作為士兵的伙伴,在城市戰斗中發揮作用。偵察機器人也被稱為 "投擲機器人",是 "小而輕的機器人,足夠堅固,可以通過窗戶或門縫投擲。該機器人配備了一個攝像頭,可以在不派人的情況下看到建筑物內的情況"。這些低端機器人可以很容易地被開發出來,以便在建筑物/房間干預之前立即了解情況。反簡易爆炸裝置機器人可用于識別和拆除封閉區域、建筑物、道路和車輛中的簡易爆炸裝置和其他危險物品。它們需要被整合到炸彈探測系統中。根據反簡易爆炸裝置的任務,它們可以攜帶各種有效載荷。
印度的軍事技術發展系統以一種孤立的方式進行。這是能力發展的垂直領域內不信任的一個因素。這一挑戰需要得到解決。
根據分配的任務為前線部隊配備模塊化設備是一個挑戰。這些系統應該是多功能的、可互操作的,并且有能力整合到武裝部隊現有的和先進的結構中。
為系統開發綜合網絡,使其在各個層面上運行是另一個重大挑戰。
邊界沿線不同的地形和天氣條件要求不同的電力需求和高效的傳輸系統,以獲得更高的速度、靈活性、準確性、耐久性和堅固性。
與移動機器人平臺之間傳輸的數據,特別是視頻,其安全性至關重要,需要采取足夠的措施來建立安全的網絡和加密,并采取強有力的ECCM措施。
印度陸軍的機器人系統需要圍繞七個主要技術/原則進行開發:算法、數據、軟件程序、綜合網絡、軍民合作、綜合研究與開發和強大的制造。
這些技術需要在一個屋檐下以綜合方法開發,作為政府的整體方法。
正如本文所建議的那樣,原型開發應該以部門(地形)為基礎,口號應該是小規模開始,快速測試和大規模。
研究和開發的預算應該是專用的和長期的,目的是針對中小微企業和私營企業。如果一個公司/行業的研究沒有資金,而且對產品沒有確定的需求,那么它就不會投資于技術。隧道的盡頭必須有光,才能讓印度的年輕人的思想繁榮起來。
人工智能和機器人不再是小說或基于科幻的好萊塢電影的單純想象,它們現在是一個現實。勇敢的、英勇的血肉之軀的士兵需要與智能材料和更聰明的非人類士兵合作,他們不關心獎章、徽章或在調度中的提及。發達國家正在開發這種技術,它正在改變戰爭的特征。印度IT行業擁有巨大的領域知識,并被印度和國外的民用產業在多個領域利用。這種人才需要被利用來開發這種技術以促進國家安全。這項技術的發展對于提高印度軍隊的能力至關重要,需要采取措施來建設這些能力。
美國海軍陸戰隊正在探索使用人機協作來控制前線部署環境中的無人駕駛航空系統(UAS),其任務范圍廣泛,包括情報、監視和偵察(ISR)、電子戰(EW)、通信中繼和動能殺傷。美國海軍陸戰隊設想使用未來的垂直起降平臺(VTOL)來支持混合戰爭任務并實現軍事優勢。對于美國海軍陸戰隊的混合戰爭應用,以實現任務優勢和戰爭主導權,美國海軍陸戰隊需要了解VTOL機組和無人機系統之間錯綜復雜的人機互動和關系,以獲得戰斗空間態勢感知,并有效地計劃和執行針對常規和不對稱威脅的旋轉翼行動。這項研究的重點是美國海軍陸戰隊在海洋環境中的打擊協調和偵察(SCAR)任務,以促進遠征基地先進作戰(EABO)在沿岸地區。有多種復雜的功能必須加以考慮和評估,以支持人機協作互動,提高任務的有效性:任務規劃、移動和滲透、區域偵察、偵察戰斗交接和過渡。
這份頂點報告探討了SCAR任務期間三個系統之間的人機協作:UAS、VTOL和地面控制站(GCS)。該研究從VTOL項目的文獻回顧開始,研究了美國海軍陸戰隊SCAR任務戰術和用于促進EABO的理論概念。此外,它還包括對自主性和自動化、人工智能和機器學習的研究。通過使用合作設計模型來探索這三個系統的人機協作互動和過程,文獻回顧探討了如何使用基于三個因素的相互依賴性分析(IA)框架來確定人類執行者和機器團隊成員之間的相互依賴性:可觀察性、可預測性和可指導性。
通過基于模型的系統工程(MBSE)工具,將SCAR任務的高級功能分解為分層次的任務和子任務,系統分析被用來支持聯合設計方法。根據Johnson(2014)的說法,合作設計方法研究了相互依賴的概念,并使用IA框架作為設計工具。IA框架捕捉了主要執行者和支持團隊成員之間的互動,以發展支持每個主要任務和分層子任務的所需能力,從而產生HMT要求。這份頂點報告分析了兩種選擇。第一個方案認為UAS是主要執行者,VTOL和GCS是輔助團隊成員。第二種方案認為VTOL是主要執行者,UAS和GCS是輔助團隊成員。基于這兩種選擇,IA框架評估了17個主要任務、33個分層子任務和85個執行SCAR任務的所需能力。
此外,研究發現需要一個強大的數字任務規劃系統,如升級后的海軍陸戰隊規劃和行動后系統(MPAAS),通過存儲以前的任務和經驗教訓的數據來促進機器學習。美國海軍陸戰隊將面臨無人機系統的處理能力和信息存儲方面的挑戰。應盡一切努力增加UAS的處理能力。必須實施一個有效的主要、備用、應急和緊急(PACE)通信計劃,以確保UAS、VTOL和GCS之間所有通信平臺的冗余。美國海軍陸戰隊必須實施支持信任、提供快速反饋和簡單操作的接口。
最后,為了準確評估VTOL、UAS和GCS之間的HMT要求,頂點報告促成了一個探索性實驗的發展,該實驗將在海軍研究生院(NPS)建模虛擬環境和模擬(MOVES)實驗室使用,以促進未來的研究。制定了操作要求和測量方法,以確定HMT要求的有效性。
這項頂點研究為在SCAR任務中執行VTOL/UAS混合行動的人機互動復雜性提供了明確的證據。該頂點研究確定了使用系統分析和協同設計作為一種有效的方法,通過IA框架促進人機協作需求的發展。此外,該研究確定了對復雜的自主性和技術準備程度的需求,這可能是目前還沒有的。頂點建議美國海軍陸戰隊繼續研究人機協作,并利用SCAR任務探索性實驗來進一步完善和研究VTOL/UAS的高級系統要求,以支持具有前沿部署的UAS的混合行動,重點是實現4級自主權。
航空仿真環境(葡萄牙語為Ambiente de Simula??o Aeroespacial - ASA)是一個定制的面向對象的仿真框架,主要用C++開發,能夠對軍事作戰場景進行建模和仿真,以支持巴西空軍在航空航天方面的戰術和程序開發。這項工作描述了ASA框架,帶來了其管理多個仿真機的分布式架構、用于后處理仿真數據的數據分析平臺、在仿真運行時加載模型的能力,以及同時進行多個獨立執行的批處理模式執行平臺。此外,我們還介紹了最近在空戰背景下使用ASA框架作為仿真工具的工作清單。
關鍵詞:仿真環境,分布式仿真,數據分析,軍事,作戰場景
高級研究所(IEAv)是巴西空軍(For?a Aérea Brasileira - FAB,葡萄牙語)的一個研究組織,自2018年以來,開發了航空航天仿真環境(Ambiente de Simula??o Aeroespacial - ASA,葡萄牙語),以提供一個計算解決方案,實現作戰場景的建模和仿真,允許用戶建立戰略、參數和指揮決策,支持在航空航天背景下為國防目的制定戰術、技術和程序。
現代戰場場景的特點給建立實際的戰斗仿真帶來了新的挑戰,需要更多的綜合和靈活的解決方案,不僅要解決技術問題,還要解決組織問題[10]。仿真、集成和建模高級框架(AFSIM)是一個正在開發的框架的例子,以解決其中的一些挑戰[1];然而,它只限于少數美國合作伙伴。在這種情況下,ASA環境被設想為同時足以支持FAB的戰略規劃,滿足作戰分析的需要,并允許開發和評估新技術以加強軍事研究,將自己定位為一個靈活的解決方案,可以根據用戶需求進行調整。這種靈活性是針對客戶的不同特點,這導致了廣泛的要求,而這些要求僅靠商業現成的(COTS)仿真軟件是無法滿足的。由于開發一個全新的解決方案并不高效,ASA團隊決定研究公開可用的工具,旨在將它們整合到一個靈活、可訪問和可擴展的環境中。
擬議的解決方案使用混合現實仿真平臺(MIXR)[11]作為其仿真引擎,這是一個開源的軟件項目,旨在支持開發強大的、可擴展的、虛擬的、建設性的、獨立的和分布式的仿真應用。ASA擴展了MIXR的可能性,增加了額外的元素,創造了一個環境來優化開發者和分析者的任務。我們創建了一個管理器應用程序,作為多種資源之間的接口,作為一個樞紐來運行、存儲和分析眾多計算機上的各種仿真。此外,這個應用程序允許同時創建大量的仿真,只需根據分析員的需要改變初始條件。同時,模型和工具可以在運行時動態加載,以增加靈活性。所有仿真數據都存儲在一個專門的數據庫中,這加快了數據收集過程,促進了更強大的統計分析。此外,考慮到結果的復雜性和ASA用戶的不同技術知識,我們在系統中整合了一個專門的數據分析平臺,不僅用于規劃或可視化目的,還用于對情景產生的數據進行后期處理。
因此,這項工作的主要貢獻是為軍事目的的航空航天背景下的建模和仿真引入了一個新的環境,包含:一個管理多個仿真機的分布式架構;一個用于后處理仿真數據的增強型軍事作戰場景數據分析平臺;一個在仿真運行時加載模型的能力;一個使用不同初始參數進行多次執行的批處理模式執行。此外,我們介紹了最近使用ASA平臺作為空戰領域解決問題的仿真工具的工作清單。
本文的其余部分組織如下。第2節介紹了ASA的架構。在第3節中,我們帶來了一些使用ASA作為仿真工具的研究,這些研究與空戰分析有關,作為這個仿真框架的應用實例。最后,第4節陳述了關于ASA當前狀態的結論,并為未來的工作帶來一些想法。
最佳的飛行員-飛機互動一直被認為是實現有效操作性能的基石,同時在任務或使命中保持高水平的安全。隨著飛行任務越來越復雜,越來越多的信息到達機組成員手中。市場上有新的技術解決方案,任務中的表現是可以衡量的。當考慮到基于神經科學進步的人機互動時,就有可能衡量和評估任何人機接口(HMI)的有效性。為了支持空勤人員的表現,必須利用現有的創新,如數據融合或人工智能(AI)輔助決策和任務管理,以成功執行軍事任務。人工智能和大數據管理與機器學習相結合,是改善和運行現代作戰場景的關鍵因素。以網絡為中心的綜合武器系統為聯合部隊指揮官提供了靈活性,有助于當前和即將到來的聯合任務的成功。
在聯合行動中,當兩個或更多的國家使用所有可用的領域時,盡可能快速有效地利用所有的資產和能力,以獲得戰斗空間的最佳總體情況將是至關重要的。因此,解決和驗證為機組人員優化的下一代駕駛艙的創建是很重要的。先進的指揮和控制系統,為執行任務提供安全和可互操作的支持,將確保獲得一個綜合和同步的系統,并將實現戰場上的信息優勢。在未來,各級指揮官對戰場的可視化和理解方式,利用某些輔助手段來指導和引導他們的部隊,將成為勝利的決定因素。
根據JAPCC在2021年發布的聯合全域作戰傳單,全域作戰包括 "快速處理數據和管理情報,以及實現高效作戰所需的技術能力和政策,包括所有貢獻的資產"。其他北約出版物使用術語多域作戰(MDO),主要描述任務環境的相同挑戰。找到一個連貫的、共同使用的術語是不斷發展的,但它不會改變HMI定義背后的含義。此外,重要的是開發一個連接的、復雜的接口,能夠協助指揮官和他們的下屬軍事人員同時和毫不拖延地分享信息,并迅速做出決定和采取行動。
正如Todd Prouty在他的一篇文章中所認識到的,"聯合全域指揮與控制(JADC2)正在形成,成為連接行動的指導性概念","將使用人工智能和機器學習,通過以機器速度收集、處理和計算大量的數據來連接聯合部隊"。兩種類型的態勢感知(SA)都同樣重要,因為它們不僅可能影響任務的成功完成,甚至還可能影響戰略層面的意圖。定義SA的最簡單方法是對周圍環境的徹底了解。戰術上的SA意味著機組人員知道這個場景,知道自己在任務中的任務和角色,以及所有參與同一行動區域的部隊。他們知道如何飛行任務,也知道成功或失敗的目的和后果。飛行SA主要關注的是飛行的性能和參數,空間和時間上的位置,以及飛機的性能。這兩個SA是不同的,需要在飛行過程中不斷監測。通常情況下,兩者在任務的不同階段需要不同程度的關注,如果有能力的話,可以由機組成員共享。一些技術上的改進可以只提高一個SA,但最好是同時提高兩個SA,以滿足要求并提高整體SA。這些發展也必須支持戰略層面的意圖,并提供其在決策過程中需要的SA。
現代機體和駕駛艙應支持機組人員的機載工作量,戰斗飛行員需要這種支持以保持有效。這可以通過人工智能自動管理,使機組人員能夠將更多的精力放在他們的任務和使命上。可以說,用算法來增強機體的基本需要,以補充機組人員處理飛行期間增加的信息流的能力。
在開展行動期間,預計情況可能會迅速變化,指揮官必須立即采取行動,重新安排部隊的任務。在地面或飛行中,飛行員可能會在短時間內收到一個新的任務。這個新命令不應該被格式化為純粹的基本信息;當整個更新包也能被可視化時,支持將是最佳的。一個例子是數字移動地圖系統,它描述了關于友軍和敵軍的詳細信息,包括協調信息。當飛行員改變飛行計劃時,駕駛艙及其所有設置都將自動更新。正如《國防雜志》所指出的,"從無限的資源中收集、融合和分析數據,并將其轉化為可操作的情報傳遞到戰術邊緣的能力,需要前所未有的移動處理能力"。為了符合這些要求,推動下一代人機接口的整合應該在所有現代駕駛艙中實現標準化。
HMI-Cockpit的演變。左至右:Ramon Berk, Comando Aviazione dell'Eercito, Leonardo
值得注意的是,最近飛機駕駛艙的技術發展已經出現了巨大的轉變。在短短幾年內,駕駛艙已經從帶有模擬象限的 "經典飛行甲板 "過渡到現代的 "玻璃駕駛艙",其中經典的儀表通過復雜的多功能顯示器呈現。大多數信息在儀表、飛行管理系統和自動駕駛功能之間是相互聯系的。在現代駕駛艙中,傳統的 "旋鈕和表盤 "已經被拋棄,取而代之的是電子可重新配置的顯示器和多功能可重新配置的控制,即所謂的 "軟鍵"。
傳統上,駕駛艙設計和信息顯示方式的發展是由安全和性能提升驅動的,而現在似乎更多的是由效率和競爭力標準驅動。5例如,在全狀態操作和創新駕駛艙基礎設施(ALICIA)項目中,來自14個國家的41個合作伙伴正在合作進行研究和開發活動,旨在實現一個能夠提供全狀態操作的駕駛艙系統。考慮到在不久的將來商業航班數量的增加,該項目旨在通過使用新的操作概念和駕駛艙設計來實現更高水平的效率和競爭力。
ALICIA承諾新的解決方案能夠為機組人員提供更大的SA,同時減少機組人員的工作量并提高整個飛機的安全性。這是對HMI概念的徹底反思,尋求技術的整體整合。在設想的概念中,ALICIA利用多模態輸入/輸出設備,提供一個集成在增強的機組接口中的全條件操作應用程序。
改進軍用飛機的人機接口是一項更為復雜的任務。與商業飛行相比,需要分析的情況很多,也更復雜。在軍用駕駛艙中,與飛行本身相關的任務與完成戰斗任務所需的任務合并在一起,而且往往是在危險地區和退化的環境中飛行。此外,軍用飛機配備了更多的設備,旨在處理綜合戰斗任務和軍備系統管理。
軍事飛行的典型任務可分為兩類:
駕駛和導航:在整個飛行過程中執行。
戰斗任務:只在飛行任務的某些階段執行。
當戰斗任務發生時,它們必須與駕駛和導航任務同時進行,這是軍事和商業航空的主要區別。根據自己的經驗,軍事飛行員必須判斷在任何特定的飛行階段哪一個是優先的。因此,他們將大部分資源用于該任務,而將那些經常被誤認為不太重要的任務留給機載自動系統或利用他們的注意力的殘余部分來完成。
不幸的是,軍事飛行在任務、風險、威脅、持續時間、天氣條件等方面的復雜性和不可預測性,常常使機組人員很容易超過他們的個人極限。一旦發生這種情況,風險是任務無法完成,甚至可能被放棄。在最壞的情況下,飛機和機組人員可能會丟失,或者機組人員可能會在沒有適當或最佳SA的情況下采取行動,導致附帶損害的風險增加。
新興和顛覆性的技術可以改善未來軍用飛機上的人機接口。它們可以引入基于人工智能、深度學習或實時卷積神經網絡(RT/CNN)的新解決方案,以整合新的能力,如具有認知解決方案的系統。作為一個例子,認知人機接口和互動(CHMI2)的發展和演變,用于支持多個無人駕駛飛行器的一對多(OTM)概念中的自適應自動化,也可以被利用來支持完成 "軍事駕駛艙的多項任務 "的自適應自動化。
同樣地,研究和開發CHMI2來監測飛行員的認知工作量并提供適當的自動化來支持超負荷的機組。這些先進的系統應該能夠閱讀到達駕駛艙的命令,分析相關的威脅,并提出最 "適合任務 "的任務簡介和操作概念。同時,它們應該計算所有任務所需的數據,如燃料消耗、目標時間、"游戲時間"、路線、戰斗位置、敵人和友軍的部署、武器系統和彈藥的選擇、附帶損害估計以及適當的交戰規則等。然后,考慮到船員的認知狀態,將動態地選擇自動化水平和人機接口格式及功能。
在2009年的一項研究中,Cezary J. Szczepanski提出了一種不同的HMI優化方法,其依據是任務成功的關鍵因素是飛機操作員的工作量。如果工作量超過了一個特定的限度,任務就不能成功完成。因此,他提出了一種客觀衡量機組人員在執行任務期間的工作量的方法;具體來說,就是在設計人機接口時,要確保即使在最壞的情況下,工作量也不能超過人類操作員的極限。
將近11年后的2020年,北約科技組織成立了一個研究小組,以評估空勤人員是否有能力執行其分配的任務,并有足夠的備用能力來承擔額外的任務,以及進一步應對緊急情況的能力。該小組旨在確定和建立一種基于具體指標的實時客觀方法,以評估人機接口的有效性。
通過對神經生理參數的實時測量來評估認知狀態,有望支持新形式的適應性自動化的發展。這將實現一個增強的自主水平,類似于一個虛擬的機載飛行員,這將協助機組人員進行決策,并將他們從重復性的或分散注意力的任務中解放出來。自適應自動化似乎是實現最佳人機接口的一個重要組成部分。它有望支持高水平的自主性,以減少人類的工作量,同時保持足夠的系統控制水平。這在執行需要持續工作量的任務時可能特別重要。這預示著要全面分析與自主決策機相關的倫理和道德問題。然而,這已經超出了本文的范圍。
未來的戰斗將變得越來越快節奏和動態。新興的和顛覆性的技術有望徹底改變各級指揮官計劃和實施戰場行動的方式。人工智能、機器學習、增強的指揮和控制系統以及先進的大數據管理將大大有利于指揮官,改善SA,并極大地加快決策過程。現代軍隊設想未來的行動是完全集成的、連接的和同步的,這催生了MDO概念,以完善指揮官在多個領域快速和有效地分派/重新分派所有部隊的能力。
在概念和規劃階段的這種明顯的動態性也必須反映在執行階段。因此,必須假定,雖然指揮官能夠在很少或沒有事先通知的情況下重組和重新分配部隊任務,但機組人員也必須能夠快速、有效和安全地處理和執行這些新命令,很少或沒有時間進行預先計劃或排練。
這些新要求無疑將影響下一代軍用飛機駕駛艙的設計和開發。有必要采用一種新的方式來構思下一代人機接口,更加關注飛行員的真正認知能力。此外,需要新的解決方案來為機組人員提供更大的安全空間,同時將他們的工作量減少到可以接受的最大水平,使他們保持高效。他們應該結合任務優先級原則,審慎地考慮機組人員可以將哪些任務交給自主程序或系統。
本文重點討論了空中力量和飛行員在飛機上的工作量。可以預見,在現代情況下,所有平臺都將面臨同樣的挑戰。在行動的各個層面,所有的軍事人員都應該發展一種新的思維方式,以反映人機接口的更多整合和使用。要做到這一點,需要重新認識到人的因素的重要性。與民用航空類似,北約將需要制定和采用新的標準來指導未來軍用航空接口的設計。人機接口的改進必須包括所有的航空任務,并著重于實現實時規劃和執行。如果不仔細關注軍事飛行員所面臨的壓力,人機接口的改進只會讓飛行員更加安全,而在任務執行過程中的效率卻沒有類似的提高。開發通過實時測量神經生理參數來評估機組人員的認知狀態的方法,以及隨后開發新形式的適應性自動化,對于實現符合未來戰場要求的人機接口至關重要。
Imre Baldy,中校,于1988年加入匈牙利國防軍,并在匈牙利的'Szolnok'軍事航空學院開始了他的軍事教育。1992年,他作為武器操作員/副駕駛獲得了第一個少尉軍銜。1997年,他得到了他的第一個更高級別的任命,他加入了位于韋斯普雷姆的匈牙利空軍參謀部,在那里他獲得了國際關系和空軍防御規劃方面的經驗。2007年,他被調到塞克斯費厄爾,在那里建立了新的匈牙利聯合部隊司令部。除與直升機業務有關的其他職責外,他還負責空軍的短期規劃。他曾駕駛過米24、米8和AS-350直升機。從2018年7月開始,他成為JAPCC的載人空中/攻擊直升機的SME。
利維奧-羅塞蒂,中校,于1993年在意大利軍隊中被任命為步兵軍官。三年后,他轉入陸軍航空學校,并于1998年畢業,成為一名旋翼機飛行員。他曾擔任過排長、中隊指揮官和S3小組長。他曾駕駛過通用直升機。AB-206,AB-205,AB-212,AB-412,以及AW-129 Mangusta戰斗直升機。他曾多次作為機組成員或參謀被部署到巴爾干半島(阿爾巴尼亞,科索沃),中東(黎巴嫩,伊拉克)和中亞(阿富汗)。他還是一名合格的CBRN(化學、生物、輻射和核)專家,一名空中機動教官,他目前駐扎在JAPCC,擔任戰斗航空處的空地行動SME。
在面對同行競爭對手的遠程精確火力威脅時,已經提出了很多關于重新加強西方空中優勢的新作戰概念。大多數專家主張采用更加綜合的軍隊方法,以高節奏的方式將多種軍事困境強加給對手。基于網絡協作的有人和無人資產將重新獲得戰斗力和機動能力。這樣一來,對手將被迫根據不確定的選擇做出決策,從而危及其行動結果。這樣一種新模式涉及多域作戰(MDO)概念。
多域作戰可以被描述為在一個領域內利用來自所有領域的傳感器和效應器產生軍事效果的能力,以及將指揮和控制(C2)下方給盡可能低的級別。倡導平臺整合和C2鏈中的輔助性,構成了重新加強部隊靈活性、復原力和反應力的基線。戰區的聯合部隊指揮官(JFC)將作為MDO的協調者。他們將有能力在戰術指揮官之間分配傳感器和效應器以執行專門的任務,在所有領域之間同步效果,并根據需要將任務的控制權下放到戰術邊緣。
這可以通過一個被稱為多域作戰云(MDCC)的包容信息技術和通信(IT & COM)的生態系統實現,形成一個由跨域的可操作傳感器、效應器和C2節點組成的作戰網絡。利用北約的C3分類法,MDCC將提供一種手段,以實現和加強北約國家和合作伙伴的互操作性,從而提高作戰效率。
下文將通過2040年的一個虛構的作戰場景來說明整合和輔助的原則,并強調其在作戰角度和MDCC功能要求方面的結果。
虛構的作戰場景從"空軍保護"開始,在一個國家對其少數種族進行了令人無法接受的突襲之后,隨后轉變為空中前沿基地作戰(A2BO)。聯合國(UN)授權北約進行一場軍事行動。北約部隊包括一個擁有新一代戰斗機(NGFs)和遠程航母(RCs)的下一代武器系統(NGWS)中隊,一些增強型傳統戰斗機,一個C2機載平臺,加上光學、雷達和通信衛星群,油罐車,網絡資產和地面特種部隊。一個帶有兩棲部隊的航母戰斗群也加入了該作戰區。
關于空軍保護,目標是防止任何空襲和對少數民族聚集地的騷擾進行反擊。在這個階段,聯合部隊司令部決定將空軍指定為受援部分,受援部分是特種部隊和海軍。因此,聯合部隊空軍部分指揮官(JFACC)負責戰術層面上所有空中平臺的指揮。
為了應對襲擊,JFACC需要一個由多領域傳感器輸入(空中、陸地、太空和網絡)建立的完全認可的畫面。探測特定社交網絡上的公眾騷動,結合特種部隊和天基資產的實時情報監視偵察(ISR),就可以從NGWS在動亂地區上空迅速展示武力。此外,任何支援該國家并呼吁對少數種族實施暴力的社交網絡都將受到網絡反擊,使其無法運作。
在行動的這一階段,MDCC是基于共享的開放式IT和COM架構,將所有可用的傳感器互聯起來形成包容性的助推器。它正在提供一個由實時ISR收集和過去情報融合形成的共同畫面。這樣一來,MDCC提供了一個高水平的態勢感知能力,以便根據JFC的指令,從JFACC到未來作戰航空系統(FCAS)任務指揮官層面,可以適當地開發和提出軍事行動選擇。
該突襲國家向少數種族聚集地發射了幾枚地對地中程導彈,造成了人員傷亡,局勢迅速惡化。此外,該國家啟動了他們所有的綜合防空系統(IADS),特別是遠程導彈。根據新的聯合國決議,北約立即決定改變其軍事態勢。聯盟下令破壞該國家的綜合防空系統,同時確保北約的戰略主動權,以便在以后需要時進行兩棲攻擊。
總體目標是堅定地應對襲擊,同時保持對升級態勢的控制。JFC收到來自戰略層面的指令,進行空中前沿基地作戰(A2BO),以消除該國家的空軍基地,阻礙其奪取少數種族聚集地控制權的 "既成事實"戰略。這些A2BO的目的是擴大空軍的行動選擇,同時減輕所有航空資產在脆弱作戰基地的風險。A2BO還必須提供更大的靈活性和超越該國家行動的能力。在戰斗附近,分散的空中作業點(AOL)可能有助于空中打擊,但也將有助于對方反介入空中阻斷(A2/AD)。
在從JFC分配額外的資產后,JFACC現在負責用地面、海基NGWS和來自防御與干預護衛艦(FDI)的巡航導彈對該國家空軍基地進行交戰。然而,根據局勢演變和對航母戰斗群可能出現的突發威脅,JFC在JFACC和聯合部隊海上組成部分指揮官(JFMCC)之間保持NGWS和FDI的反應性和動態重新分配。因此,JFMCC在與JFC立即同步后,將能夠向JFACC提出實時空中任務指令(ATO)或空域控制指令(ACO)的變更要求。
因此,這些由北約領導的持久前線空軍必須能夠使用彈性的、低特征的、低維護的、大量的有人和無人駕駛航空資產進行防御性和進攻性反空作戰。其目的是通過建立更加分散的、有彈性的和難以定位的AOL,形成針對A2/AD能力的效果,而不存在力量集中的相關脆弱性。這支部隊包括NGFs、各種RCs(包括傳感器和效應器)、增強型傳統戰斗機和空中戰術運輸機,作為戰區內武器、無人平臺、燃料和后勤支持的運輸工具,所有這些都通過動態利益共同體運作。根據AOL和NGF之間的通信狀態,特定的 "多域戰術功能 "將被委托給駕駛艙,以允許FCAS任務指揮官承擔 "動態目標 "和 "時間敏感ISR "的控制權。由于戰區的延伸,NGF加上衛星群將從擴展的態勢感知中受益,并在需要時承擔更廣泛的控制責任,與C2機載平臺上的 "前線控制小組 "已經承擔的責任并列。
將A2BO與JFACC和JFMCC的網絡結合起來,可以在MDCC內實現 "網絡可選系統"。這種 "網絡可選系統 "在可用時利用 "集中式網絡",并在與上級當局隔絕時在戰術邊緣的可用平臺中形成 "機會網絡"。在這里,MDCC是這種復雜MDO的助推器。一方面,MDCC整合了從JFC到戰術指揮官的所有決策過程(從計劃到評估再到執行),包括部隊分配和效果同步,為跨領域的動態支持/支援框架鋪平了道路。另一方面,它提供了所有指揮官之間的輔助性,允許在盡可能低的級別上授權C2,如AOL和NGF。
在成功的A2BO之后,北約希望利用這一情況,并指揮開展兩棲行動,以充分保障少數種族的安全。在這次行動中,JFMCC被指定為被支持的司令部,空軍和特種部隊則是被支持的司令部。所有平臺都有可能在海軍的授權下用于兩棲作戰。MDCC將使JFMCC能夠將所有領域的傳感器和平臺整合到大型海軍計劃演習艦隊中,并在需要時將C2授權給最佳海軍平臺指揮官。
這個虛構的場景說明了通過所有決策過程進行整合和輔助的必要性。這樣做有助于形成一個可靠的技術環境,以高作戰節奏產生全球戰斗力,整合所有領域的機動性,而不存在力量集中的弱點,并因此給對手帶來多種困境。這種技術環境是由MDCC提供的,它可以被描述為一個 "定制網絡系統",包括從后方到邊緣的所有可用平臺。因此,如前所述,MDCC是動態分配部隊和分配C2的MDO助推器。
作為新技術的設計者和提供者,工業界隨時準備支持武裝部隊塑造MDO作為一種新的作戰模式。考慮到利害關系,兩者之間強有力的伙伴關系對于確保徹底掌握需求和設計MDCC而不過早選擇某些技術方案至關重要,因為這將阻礙未來的MDO。在作戰概念和技術解決方案方面,這一旅程仍處于早期階段。只有攜手合作才能應對未來的挑戰。
Brigadier General準將(退役)(法國空軍)1987年畢業于法國空軍學院,2003年畢業于美國空戰學院。他有3000個飛行小時(美洲虎、幻影2000D),執行過122次戰爭任務,并作為總部官員擁有C2專業知識。他于2021年加入空中客車公司,擔任FCAS多領域行動的高級運營顧問。
Thomas Vin?otte上校(退役)(法國空軍)于1987年畢業于法國空軍戰斗機飛行員,2003年畢業于戰爭學院。他有超過3300個飛行小時(美洲虎、幻影F1CR、幻影2000 RDI和幻影2000-5),執行了83次戰爭任務,包括一次彈射,并作為總部官員擁有C2專業知識。他于2019年加入空中客車公司,擔任FCAS高級運營顧問。
Laurent le Quement于1996年畢業于阿斯頓大學。在2010年加入空中客車公司的發射器部門之前,他曾在汽車和轉型咨詢部門工作。在2018年成為FCAS的營銷主管之前,他在業務發展和創新方面擔任過許多職位
兵棋模擬是一種決策工具,可以為利益相關者分析的場景提供定量數據。它們被廣泛用于制定軍事方面的戰術和理論。最近,無人駕駛飛行器(UAVs)已經成為這些模擬中的一個相關元素,因為它們在當代沖突、監視任務以及搜索和救援任務中發揮了突出的作用。例如,容許戰術編隊中的飛機損失,有利于一個中隊在特定戰斗場景中勝利。考慮到無人機的分布可能是這種情況下的決定性因素,無人機在超視距(BVR)作戰中的位置優化在文獻中引起了關注。這項工作旨在考慮敵人的不確定性,如射擊距離和位置,使用六種元啟發法和高保真模擬器來優化無人機的戰術編隊。為紅軍蜂群選擇了一種空軍經常采用的戰術編隊,稱為line abreast,作為案例研究。優化的目的是獲得一個藍軍蜂群戰術編隊,以贏得對紅軍蜂群的BVR戰斗。采用了一個確認優化的穩健性程序,將紅軍蜂群的每個無人機的位置從其初始配置上改變到8公里,并使用兵棋方法。進行了戰術分析以確認優化中發現的編隊是否適用。
索引詞:優化方法,計算機模擬,無人駕駛飛行器(UAV),自主智能體,決策支持系統,計算智能。
兵棋是在戰術、作戰或戰略層面上模擬戰爭的分析性游戲,用于分析作戰概念,訓練和準備指揮官和下屬,探索情景,并評估規劃如何影響結果。這些模擬對于制定戰術、戰略和理論解決方案非常有用,為參與者提供了對決策過程和壓力管理的洞察力[1]。
最近,無人駕駛飛行器(UAVs)作為一種新的高科技力量出現了。利用它們來實現空中優勢可能會導致深刻的軍事變革[2]。因此,它們的有效性經常在兵棋中被測試和評估。
由于具有一些性能上的優勢,如增加敏捷性、增加過載耐久性和增加隱身能力,無人機已經逐漸發展起來,并在許多空中任務中取代了有人系統[3]。然而,由于戰斗的動態性質,在視覺范圍之外的空戰中用無人系統取代有人平臺是具有挑戰性的。在空戰中,無人機可以被遠程控制,但由于無人機飛行員對形勢的認識有限,它將在與有人平臺的對抗中處于劣勢。然而,這種限制可以通過自動戰斗機動[4]和戰術編隊的優化來克服。此外,使用無人機可以允許一些戰術編隊和戰略,而這些戰術編隊和戰略在有人駕駛的飛機上是不會被考慮的,例如允許中隊的飛機被擊落,如果它有助于團隊贏得戰斗。文獻中最早的一篇旨在優化超視距(BVR)作戰中的飛機戰術編隊的文章[5]表明,空戰戰術是用遺傳算法(GA)進行優化的候選方案。該實施方案采用分層概念,從小型常規作戰單位建立大型編隊戰術,并從兩架飛機的編隊開始,然后是四架飛機,最后是這些飛機的倍數。在模擬中沒有對導彈發射進行建模。當一架飛機將其對手置于武器交戰區(WEZ)的高殺傷概率(Pkill)區域內一段特定時間,簡化的交戰模擬器就宣布傷亡。事實證明,所提出的方法的應用是有效的,它消除了團隊中所有沒有優化編隊的飛機,并為整個優化編隊的飛機團隊提供了生存空間。
Keshi等人[6]使用了與[5]相同的分層概念,從由兩架飛機組成的元素中構建大型戰術編隊。模擬退火遺傳算法(SAGA)被用來優化編隊,使其能夠克服對局部最優解的收斂。對16架飛機的編隊進行了優化,提出的最優解表明SAGA比基本的GA更有效。最后,為了探索一個穩健的SAGA,對不同的馬爾科夫鏈進行了比較,事實證明自調整馬爾科夫電流更適合所提出的問題。
Junior等人[7]提出使用計算機模擬作為一種解決方案,以確定BVR空戰的最佳戰術,使擊落敵機的概率最大化。在低分辨率下使用通用參數對飛機和導彈進行建模,并改編了名為COMPASS的模擬優化算法,模擬了兩架飛機對一架飛機的BVR戰斗。低分辨率模型假定在水平面的二維空間內有一個均勻的直線運動。使用優化的戰術表明,擊落敵機的平均成功率從16.69%提高到76.85%。 Yang等人[8]提出了一種方法來優化飛機對一組目標的最佳攻擊位置和最佳路徑。該工作考慮到飛機能夠同時為每個目標發射導彈,并將飛機與目標有關的攻擊性和脆弱性因素作為評價攻擊位置的指標。一個高保真模擬被用來模擬每個導彈的飛機、雷達、導彈和WEZ的動態特性。這項工作并沒有解決在BVR戰斗場景中優化一組飛機對另一組飛機的編隊問題。
Li等人[9]提出了一種基于指揮員主觀認識的編隊優化方法,即在空戰中目標設備信息不確定的情況下選擇飛機編隊的問題。首先,計算戰斗機的戰斗力,這是通過指揮員的主觀認識評估目標戰斗力的基礎。戰斗機的戰斗力以能力的形式表現出來,包括攻擊、探測、生存能力、通信、電子戰、預警系統等。因此,通過采用前景理論和綜合模糊評估來優化空戰訓練。最后,一個應用實例證明了該方法在小規模空戰中的可行性。作者聲稱,利用戰斗力評估戰斗情況的能力為優化空戰訓練提供了一種新的方法。
?zpala等人[10]提出了一種在兩個對立小組中使用多個無人駕駛戰斗飛行器(UCAVs)進行空戰的決策方法。首先,確定兩隊中每個智能體的優勢地位。優勢狀態包括角度、距離和速度優勢的加權和。在一個團隊中的每個智能體與對方團隊中的每個智能體進行比較后,每個航空飛行器被分配到一個目標,以獲得其團隊的優勢而不是自己的優勢。為一對對立的團隊實施了一個零和博弈。對許多智能體參與時的混合納什均衡策略提出了一種還原方法。該解決方案基于博弈論方法;因此,該方法在一個數字案例上進行了測試,并證明了其有效性。
Huang等人[11]開發了新的方法來處理UCAV編隊對抗多目標的合作目標分配和路徑規劃(CTAPPP)問題。UCAV的編隊是基于合作決策和控制的。在完成目標偵察后,訓練指揮中心根據戰場環境和作戰任務向每架UCAV快速傳輸任務分配指令。UCAV機動到由其火控系統計算出的最佳位置,發射武器裝備。合作目標分配(CTAP)問題通過增強型粒子群優化(IPSO)、蟻群算法(ACA)和遺傳算法(GA)來解決,并在歸因、精度和搜索速度等方面進行了比較分析。在進化算法的基礎上發展了UCAV多目標編隊的合作路徑規劃(CPPP)問題,其中提供并重新定義了獨特的染色體編碼方法、交叉算子和突變算子,并考慮燃料成本、威脅成本、風險成本和剩余時間成本來規劃合作路徑。
Ma等人[12]開展的工作解決了在BVR作戰場景中優化兩組(R和B)無人機對手之間的優勢地位問題。一個無人機ri∈R對一個無人機bj∈B的優勢是通過ri和bj之間的距離、ri的導彈發射距離的下限和上限、ri的高度和bj的高度之差以及ri的最佳發射高度來估計的。決定性的變量是無人機在兩組中的空間分布和每架飛機在這些組中的目標分配。無人機在三維作戰空間BVR中的可能位置被簡化(離散化),通過立方體的中心位置來表示。每個無人機組都有一組立方體。優化問題被建模為一個零和博弈,并被解決以獲得納什均衡。
Ma等人[12]提出的工作沒有使用高保真模擬來分析無人機空間分布的選擇和分配給它們的目標對BVR作戰的影響。高保真模擬對飛機、雷達、導彈及其導彈的WEZ的動態特性進行建模。這些動態特性也影響到BVR作戰時每架飛機的行動觸發,因此也影響到最終的結果。例如,如果在兩組無人機之間第一次沖突后的時間窗口內考慮高保真BVR作戰模擬,新的沖突可能會發生,直到模擬結束。因此,每個在交戰中幸存的無人機將能夠選擇一個新的目標,這取決于可用目標的優勢值。在[12]中沒有考慮與無人機行為有關的不確定性。有關敵方無人機在戰術編隊中的確切位置及其導彈發射距離的信息是行為不確定性的例子。這兩個信息和上面描述的其他信息在BVR戰斗中是相關的:它們直接影響飛機之間的交戰結果。
在這項研究中,我們試圖解決文獻中發現的一些局限性,如低分辨率模擬、與敵人有關的不確定性的處理以及缺乏對優化解決方案的穩健性的確認,旨在提高兵棋結果的質量。我們的目標是驗證哪些藍色蜂群的戰術編隊可以在BVR戰斗中戰勝紅色蜂群。作為一個案例研究,RED蜂群使用了空軍經常采用的戰術編隊,稱為line abreast[13]。為了評估BLUE蜂群解決方案的穩健性,我們解決了新的問題,改變了RED蜂群每架飛機的位置,目的是估計新的RED蜂群編隊對BLUE蜂群的優化戰術編隊的效率的影響。
我們使用自主智能體和高保真計算機模擬來優化BVR戰斗中的無人機戰術編隊,考慮與敵人相關的不確定性,如戰術編隊中的位置誤差和導彈發射距離。統一行為框架(UBF)被采納為創建自主智能體的基礎。飛機和導彈在三維環境中用六個自由度(DoFs)建模。
該程序將在接下來的章節中進一步討論。
荷蘭的Smart Bandits項目旨在開發顯示真實戰術行為的計算機生成部隊(CGF),以提高戰斗機飛行員模擬訓練的價值。盡管重點在于展示空對空任務中的對抗行為,但其結果更廣泛地適用于模擬領域。
傳統上,CGF的行為是由腳本控制的,這些腳本規定了在一組特定事件中的預定行動。腳本的使用有一定的缺陷,例如,在考慮完整的任務場景時,腳本的復雜性很高,而且腳本的CGF往往表現出僵硬和不現實的行為。為了克服這些缺點,需要更復雜的人類行為模型,并結合最先進的人工智能(AI)技術。Smart Bandits項目探討了應用這些人工智能技術的可能性。
本文解釋了在理論行為模型和用于戰斗機訓練的CGF中的實際實施之間架起橋梁的主要架構。測試CGF的訓練環境包括四個聯網的F-16戰斗機模擬器。這種設置能夠為飛行員提供實驗性訓練,以對抗敵人的戰斗機編隊(以智能CGF的形式)。該架構是通用的,因為它可以滿足各種人類行為模型,在概念上,它們在使用人工智能技術、認知的內部表示和學習能力方面彼此不同。基于認知理論的行為模型(例如,基于情境意識、心智理論、直覺和驚訝的理論)和基于機器學習技術的行為模型實際上都嵌入到這個架構中。
戰斗機飛行員在模擬器中的戰術訓練已經被廣泛使用。戰術訓練的一個基本特征是除了受訓者之外,還有其他參與者的存在。這些參與者可以是隊友,如編隊中的其他戰斗機,支持力量,如前方空中管制員,中立力量,如平民,或敵方力量,如對手的戰斗機。在模擬中,這些參與者的角色可以由人類、半自動化部隊(SAFs)或CGFs來完成。半自動部隊有一些執行角色相關任務的功能,例如,多個虛擬實體可以由一個人控制。然而,使用人類專家參與戰術模擬可能既不符合成本效益,也不具有操作性。首先,這些人類參與者是昂貴的資產。其次,由于模擬的目的不是為他們提供訓練,他們可以在其他地方使用。因此,由CGF來扮演這些角色更為有效,只要這些CGF有能力以適當的方式扮演這些角色。
然而,目前最先進的CGFs在許多情況下并不能滿足戰術訓練的需要,因為它們的行為很簡單。除了前面提到的SAFs,可以區分四類CGF-行為(Roessingh, Merk & Montijn, 2011)。
1)非反應性行為,在這種情況下,CGF根據預先確定的行動序列行事,對環境的觀察或反應能力最小;例如,這種CGF能夠遵循由航點定義的路線。
2)刺激-反應(S-R)行為,在這種行為中,CGF對來自環境的某一組刺激或輸入的反應,總是表現出一致的行為;例如,這樣的CGF能夠在能夠連續觀察到飛機位置時攔截飛機。
3)延遲反應(DR)行為,在這種情況下,CGF不僅考慮到當前環境中的一組刺激,而且還考慮到以前的刺激,這些刺激存儲在CGF的存儲器中。這樣的CGF通過記憶以前的位置,能夠攔截一架飛機,即使這架飛機不能被連續觀察到。
4)基于動機的行為,這種CGF結合了S-R和DR行為,但另外考慮到其動機狀態。這些動機狀態是內部過程的結果,可以代表目標、假設、期望、生物和情感狀態。例如,這樣一個CGF可以假設,一架目標飛機的燃料不足,它將返回基地。因此,CGF可能決定放棄攔截。或者,CGF可能預計到飛機的路線改變,并決定在一個更有利的位置攔截飛機。
到目前為止,CGF的一個特點沒有被納入討論,那就是學習行為或適應行為(在Russell和Norvig, 2003的意義上)。表現出S-R、DR或基于動機的行為的CGF,可以在機器學習(ML)的基礎上擴展適應這種行為的能力。ML技術使CGF的發展能夠更好地適應受訓者的專業知識。此外,ML技術還可以防止為每個要解決的具體問題或情況制定一套艱苦的規則(例如 "如果-那么規則"),這些規則是基于對業務知識的人工啟發,而這些知識在很大程度上是隱性的,不能簡單地用邏輯規則來解釋。
本文的目標是說明在 "智能強盜 "項目(2010-2013年)中開發智能CGFs。該項目旨在將類似人類的智能植入模擬任務場景中出現的CGF中。通過Smart Bandits項目,荷蘭國家航空航天實驗室(NLR)和荷蘭皇家空軍(RNLAF)的目標是在模擬戰術戰斗機飛行員訓練領域邁出重要一步。本文的核心信息是,認知模型是在CGF中創造基于動機的行為的有力手段。然而,為了減輕認知建模的缺點,我們主張額外使用ML技術。這些技術對于減少開發在復雜領域中行動的代理的知識誘導工作至關重要。它展示了如何將不同的方法組合成混合模型。
產生智能行為的一種方法是認知建模。在這種方法中,計算模型被設計來模擬人類的認知。在Smart Bandits項目中,到目前為止已經設計了三個認知模型:一個自然的決策模型,一個驚喜生成模型和一個情況意識模型。所有這三個模型都是利用空戰領域的抽象場景進行評估的。
由于決策是產生任何智能行為的關鍵部分,在項目的早期就開發了一個自然決策模型。該模型的靈感來自于達馬西奧的體細胞標記假說。軀體標記假說提供了一種決策理論,該理論將體驗到的情感作為決策的直覺部分發揮了核心作用,同時將這種直覺部分與理性推理相結合,形成一個兩階段的決策過程。Hoogendoorn, Merk & Treur (2009)對這個模型進行了描述。
驚訝被認為是人類對意外情況的普遍體驗的認知反應,對行為有可識別的影響。然而,在CGF的研究中,很少有人關注驚訝現象,很少有CGF有類似人類的機制來產生驚訝強度和驚訝行為。這就導致了CGF在人類會做出驚訝反應的情況下,其行為是貧乏的和不現實的。對于空戰來說,這形成了一個問題,因為許多軍事專家認為驚訝因素是軍事行動的一個重要因素。
出于這個原因,我們開發了一個產生驚訝強度及其對行為影響的模型(Merk, 2010)。該模型是基于各種理論和對人類驚訝行為的認知研究的經驗結果。除了情境的意外性,其他的認知因素,如情境的新穎性也被考慮在內。
有效決策的一個重要因素是情景意識(Situation Awareness,SA)。SA在工作領域尤其重要,在那里信息流可能相當大,錯誤的決定可能導致嚴重的后果。為此,我們根據Endsley(1995)的SA的三個層次設計了一個模型:(1)對線索的感知,(2)對信息的理解和整合,(3)對未來事件的信息投射。
在Smart Bandits中用于智能CGF的基本SA模型(見Hoogendoorn, van Lambalgen & Treur, 2011)包括五個部分。(1)觀察,(2/3)對當前情況的信念形成,(4)對未來情況的信念形成和(5)心理模型。對當前情況和未來情況的信念通過閾值函數被激活(接收一個激活值),這是一種從神經學領域采用的技術。圖1中的SA模型代表了用于形成信念的領域的知識。人類使用專門的心理模型,這些模型代表了各種觀察和關于環境的信念形成之間的關系,反過來,這些模型又指導了要進行的進一步觀察。
圖1:情況意識的認知模型:概述
另一個重要的方面是在苛刻的環境下可能出現的SA的退化。當時間有限時,感知和線索的整合會受到影響,導致對環境的不完整了解。此外,由于工作記憶的限制,人類并不總是能夠進行所有必要的觀察。根據可用時間的多少,可以通過考慮不太活躍的信念來進一步完善對情況的了解。這些特點反映在智能CGF的行為中。上述模型的詳細描述可以在Hoogendoorn, Lambalgen and Treur (2011)中找到。
機器學習技術的一個常見區別是監督學習和無監督學習(例如Russel和Norvig,2003)。在監督學習中,在每次試驗后,代理人會得到與他應該采取行動的輸入演示(也稱為輸入實例)相匹配的反應。實際反應和預期反應之間的差異被用來訓練代理,就像培訓師或監督員讓學生意識到預期反應一樣。例如,代理人可以通過向其展示正確的反應來學習飛行動作。在無監督學習中,代理只是被告知輸入的例子。代理人必須在所提供的例子中找到隱藏的結構。由于給代理的例子沒有伴隨著反應,所以沒有差異信號來訓練代理。例如,代理可以學習區分友軍和敵軍的戰術。
強化學習具有上述兩種學習技術的要素。代理人在每次試驗后不是被告知正確的反應,而是在每次試驗的執行過程中收到來自環境的反饋。雖然反饋不一定代表每個單獨行動的正確反應,但該學習技術的目的是為整個試驗提供匯總反饋,從而平均強化正確反應。然而,這并不能保證收斂到正確的反應。強化學習的技術實現在Sutton & Barto (1998)中有所解釋。
強化學習特別適合代理在模擬環境中的應用,因為在這種環境中,代理能夠探索環境,從而可以評估大量成功和不成功的反應。另外,在復雜的環境中,所需的反應,如最佳的對手交戰戰術,往往是未知的。強化學習提供了一種技術,通過每次試驗來改進反應,從而發現更好的戰術。
強化學習的一個普遍問題是,它需要大量的內存來存儲中間計算值(反應與代理在其環境中的狀態相結合,如其位置、速度和方向)。在現實的戰術環境中,這實際上轉化為無限量的反應-狀態組合("狀態-行動空間")。在Smart Bandits項目中,模擬了兩架友軍飛機和兩架敵軍飛機之間的空對空交戰,后兩者由學習型代理人代表。在這些交戰中,學習型代理只能以四種方式做出反應(左、右、前和射擊)。在這個例子中,我們將狀態-動作空間存儲在一個表格中,在可接受的學習試驗數量之后,它需要2千兆字節的內存。這種內存需求隨著額外參數的增加而呈指數級增長。驚人的內存需求可以通過對狀態-動作-空間的近似來減少,而不是保留所有的精確值。近似一個大的狀態動作空間的方法是使用神經網絡(NN),這將在下一節解釋。
在一般意義上,NN(Haykin,1998)可以被認為是一個可以模擬任何數學函數的網絡。在這種情況下,我們使用NN來近似上述的狀態-動作空間。NN的輸入是代理人在其環境中的當前狀態。NN的輸出是代理的每個可能行動的值。NN的輸出是在RL算法產生的數據基礎上進行優化的。RL算法的數據不需要再被存儲。事實上,NN是用RL算法產生的數據來訓練的。以前我們需要2千兆字節的內存來解決一個相對簡單的空對空問題,現在我們只需要大約10千兆字節的數據來存儲這個問題的NN知識。這種知識是由NN的權重值表示的。而且,內存需求不再隨著問題的復雜性呈指數增長,而只是呈線性增長。為此,可以使用相對簡單的前饋型NN,而不是遞歸型NN。然而,我們發現有兩個原因要為需要在復雜戰術場景中行動的代理類型開發替代的ML技術。
1)與一些領域不同,如解決象棋等游戲中的問題,其中最佳的下一步行動完全由世界的當前狀態決定,而解決戰術問題的特點是需要使用以前的世界狀態。例如,一個空對空的對手可能會消失一段時間,并可能在不同的位置突然出現,代理人必須考慮到這一點。換句話說,戰術問題的特點是對環境的不完善或不完全了解1。眾所周知,RL技術對這些類型的問題并不太健壯,當面對更復雜的問題時,我們確實經歷了與我們的代理人的正確反應相背離的情況。
2)一些現實的戰術問題需要在當前的決策中考慮到對以前狀態的記憶。正因為如此,基于RL的代理不能很好地適用于現實的戰術問題。對于需要延遲反應行為或基于動機的行為的應用(見第1章),RL可能不是首選技術。
對于空對空領域的更高級問題,下一節將研究進化技術作為RL的替代品。
人工自主系統被期望在動態、復雜的環境中生存和運行。在這樣的環境中,代理人的具體能力是很難事先預測的,更不用說詳細說明了。自主系統的人工進化使代理人能夠在復雜的動態環境中優化他們的行為,而不需要使用領域專家的詳細先驗知識。RL技術假定問題的解決方案具有馬爾科夫特性(見前面的腳注),而進化技術(B?ck, Fogel, Michalewicz, 1997)不受這種約束,適用于更大的問題集。
進化技術使用一個迭代過程,在一個解決方案的群體中搜索適配性景觀,在這種情況下,就是戰術問題的解決方案。種群中更成功的實例在有指導的2次隨機搜索中被選擇,使用平行處理來實現期望的解決方案。這種過程通常受到生物進化機制的啟發,如突變和交叉。許多進化技術的實驗使用神經網絡來控制代理。神經網絡提供了一個平滑的搜索空間,對噪聲具有魯棒性,提供了概括性并允許擴展(見Nolfi和Floreano, 2000)。此外,網絡結構可以被進化或優化以允許延遲響應行為。這些特性與優化網絡的進化方法相結合,為復雜、動態領域提供了一個有趣的研究領域。作為一個例子,我們可以使用智能強盜的進化技術更新SA模型(見第2.3節)的連接強度的權重。
由于像SA模型這樣的認知模型通常有一大套相互關聯的參數,使用主題專家來確定它們的(初始)值是很麻煩的,而且是投機性的和勞動密集的。這就需要使用進化學習技術來為上述觀察、簡單信念、復雜信念和未來信念之間的聯系確定適當的權重。圖2給出了第2.3節中提到的SA模型的網絡表示的一個簡化例子(取自Hoogendoorn, van Lambalgen & Treur, 2011)。
圖2:情況意識的例子模型(Hoogendoorn, van Lambalgen & Treur, 2011)。
為了學習圖2中網絡的連接權重,我們采用了兩種不同的方法(Gini, Hoogendoorn & van Lambalgen, 2011),即遺傳算法應用和基于權重重要性的專門方法。后一種方法被稱為 "基于敏感度 "的方法。這兩種方法都利用了一個健身函數,表示一個解決方案與期望狀態的符合程度。在這種情況下,可以通過實際激活水平和主題專家估計的激活水平之間的差異來衡量適合度。遺傳算法的表現明顯優于基于敏感性的方法。
多Agent系統(MASs)屬于兩類中的一類:集中式或分散式控制的系統。集中式控制系統由具有一定程度自主權的代理組成,但整個系統由一個統一的戰略、方法或代理控制,以實現特定的目標。然而,盡管有整體的統一策略,單個代理并不知道其他代理在做什么,所以團隊策略通常在任務中的不同點與單個代理的策略相沖突。這個問題3已經成為在復雜環境中實施MAS的典型障礙。分散式系統與集中式系統不同,它的代理具有更高的自主性,但缺乏指導所有代理的預先存在的戰略。它們通常有某種形式的通信系統,允許代理在探索其環境的同時制定所需的整體戰略。開發能夠進行空對空戰術的智能CGF的挑戰,直接屬于MAS環境的集中式類別。因此,各個代理必須在同一環境中一起訓練。然而,這使狀態空間以環境中存在的代理數量的倍數膨脹。這是每個代理保持自己對環境的獨特看法的結果,這種看法被記錄在自己的狀態空間中。然而,追求多代理的方法是有道理的,特別是在與領域有關的問題上,不同的飛行成員可能有不同的,可能有沖突的目標和不完整的情況意識。
Smart Bandits項目中用于CGF的仿真環境是STAGE ?,這是一個場景生成和CGF軟件套件。作為一個基本的場景工具,STAGE為我們提供了一定的保真度和抽象度,很適合目前考慮的戰術空對空作戰模擬。當需要更高的平臺、傳感器或武器模型的保真度時,STAGE提供的基本功能將得到擴展。這種擴展CGF環境基本功能的能力是STAGE被選為Smart Bandits的主要CGF軟件套件的原因之一。
傳統上,代理人的刺激-反應(S-R)行為(見第1章)可以通過使用腳本和/或基本條件語句在CGF軟件中實現。結合這些簡單的構件,通常可以為CGF行為提供一定程度的可信度,這對于許多模擬培訓練習來說可能是足夠的。然而,對于更高級的問題和相關的代理行為,包括學習行為,如第2和第3節所述,這種方法將是不夠的。正如前幾節所論述的那樣,存在著大量的技術用于發展CGF行為和在模擬環境中控制CGF。一個標準的CGF平臺并不能滿足實現這些不同的技術。
為了將STAGE作為Smart Bandits中的CGF平臺,同時將CGF的控制權委托給外部軟件(即使用選擇的編程語言構建的特定軟件),我們開發了一個接口,外部軟件可以通過該接口接收來自STAGE中任何CGF的觀察結果,并可以命令CGF在仿真環境中執行操作。這個中間件層(圖3中所謂的調解器)通過特定的協議(nCom,Presagis專有)與STAGE進行實時通信,可以向不同的代理(可能分布在不同的計算機上)發送和接收上述的觀察和行動。為了與調解器通信,外部軟件使用一個特定的接口,該接口定義在一個庫中,可以很容易地鏈接到軟件中,例如用Java或C++。
圖 3:將智能代理納入商用現成 CGF 包(STAGE?)的架構,智能代理可以使用 C++ 或 Java 接口,通過調解器與 STAGE 通信。
本文介紹了一種認知建模的技術和各種機器學習技術。不幸的是,似乎沒有一種單一的技術來解決從事空對空任務的智能CGF的所有突發戰術問題。
認知模型是在CGF中創造基于動機的行為的有力手段。然而,為了減輕認知模型的缺點,我們主張額外使用機器學習技術。機器學習技術對于減少在復雜領域中行動的CGFs的開發的知識誘導工作至關重要。本文建議將不同的方法組合成混合模型。
這里提出的主要架構的目標有三個方面:
將智能CGF模型與戰術戰斗機模擬脫鉤。
促進人類行為模型與上述模擬的連接過程。
使得智能CGF模型能夠在不同的客戶端進行分配。
這三個特點共同促成了對混合方法的追求。
在Smart Bandits項目中,智能CGF的行為和設計必須適應手頭的戰術訓練目標。在本文中,我們沒有明確地處理訓練要求。然而,在本文中,我們隱含著這樣的假設:作戰戰斗機飛行員的戰術訓練所需的CGF行為包括以下方面:使人類對手吃驚的能力,看似隨機的行為,即不重復的反應,以及從武器平臺的角度來看是真實的。到目前為止,已經創建的智能CGF將在未來的項目階段(2012/2013)根據訓練要求進行驗證。因此,在 "智能土匪 "項目中,未來工作的兩個主要項目是:
實施混合模型,其中認知建模和ML相結合,以及
根據具體的學習目標或能力來調整智能機器人的行為。