亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

在自然界和機器人學中,自主集群(蜂群)由具有有限動力和簡單規則的移動智能體組成,它們合作產生突發的大規模一致性行為。這種一致性是動態的,以自我組織的穩定和適應性時空模式的形式出現。這種機器人群動態的國防應用的例子包括自主雷達干擾、瞄準、跟蹤和監視。自主集群行為取決于許多因素,從通信強度到噪音、延遲、網絡拓撲結構,以及敵對智能體的存在--所有這些都可以用來控制和破壞蜂群的意圖。集群(蜂群)理論的一個核心和開放性問題涉及研究蜂群實現穩定的自組織行為的條件,以及外部和內部力量如何破壞蜂群動力學的穩定。這種力量可能來自通信拓撲結構的變化、吸引和排斥力以及多個相互作用的蜂群,其中一個蜂群可以改變另一個蜂群的行為。

在本報告中,我們考慮了三個主要議題,這些議題涉及突發自組織蜂群的開放問題。首先,我們通過研究其分叉結構,考慮在存在范圍相關的通信網絡的情況下,蜂群的穩定性如何作為系統參數的函數發生變化。然后,我們看了目前的蜂群模式的混合現實實驗來驗證以前的分叉分析。最后,我們展示了一個蜂群如何通過將兩個蜂群碰撞在一起而改變另一個蜂群的行為。

具有距離相關通信時延的大規模蜂群環面分叉

蜂群模型采用了全局耦合的蜂群,并明確放寬了固定延遲的假設,包括基于固定通信半徑的范圍相關延遲。我們表明,當包括與范圍有關的延遲時,就會引入新的頻率,并產生環形的分叉。其結果是一個蜂群,只取決于幾個參數。這里的結果對機器人蜂群很重要,其目標之一是在沒有外部控制的情況下,自主地產生所需的模式。這里預測的模式形成顯示了延遲的信息,無論是來自通信、行動還是兩者,都會影響蜂群狀態的穩定性,如環形和/或旋轉狀態。通過揭示模式不穩定的那些參數區域,我們提供了在存在與范圍有關的延遲的情況下自主可得的蜂群狀態的全面特征。

混合現實實驗中延遲引起的蜂群模式分叉

在這項工作中,我們通過提出一個混合現實的實驗框架來解決工程化蜂群系統的這些實驗挑戰,作為走向全面實驗驗證的第一個重要步驟。混合現實是在模擬和現實世界中同時使用虛擬機器人和真實機器人,它保留了物理機器人的關鍵特征,同時能夠擴展到更多數量的智能體,或更大的工作空間,而不受到資源的物理限制。混合現實帶來的好處包括:能夠與大量的機器人一起工作,并確保人類機器人互動的安全性。由于所需的機器人數量減少,使用混合現實技術的實驗成本較低,同時還能從幾個真實的機器人中引入現實世界的復雜動態。混合現實是向理論研究結果的全面實驗驗證邁出的重要第一步。此外,混合現實框架提供了對理論和改進實驗設計的額外見解的機會。

我們目前的研究使用混合現實作為進一步研究Szwaykowska等人提出的控制器的方式,并在實驗中繪制出物理參數方面的完整分叉圖。除了揭示蜂群動力學的分叉結構外,我們還將重點了解行為之間的轉換和增加防撞的影響。新的實驗使用兩個不同的感興趣的平臺:一個使用無人駕駛飛行器(UAV),另一個使用自主地面車輛(ASV),都在一個混合現實框架內。使用兩個不同的平臺有幾個優點。首先,它測試了不同平臺和巨大的不同時間尺度的延遲耦合群的普遍分叉結構。其次,它允許在實驗過程中安全地測試不同數量的機器人和約束。

碰撞蜂群——用一個蜂群控制另一個蜂群

由于自然蜂群的穩健性、可擴展性和集體解決問題的能力,許多研究都集中在設計和構建具有大量且不斷擴展的平臺以及虛擬和物理交互機制的移動機器人群上。這類系統的應用范圍包括探索、繪圖、資源分配和用于防御的群組。

由于近年來機器人系統的整體成本大幅下降,在現實世界中使用人工群已成為可能。這就引入了讓多個蜂群占據同一物理空間的可能性,從而導致相互之間的互動和對彼此動態的擾動。隨著這種蜂群之間相互作用的可能性增加,對多個蜂群如何碰撞和合并的理解變得很有必要。

盡管人們對具有物理啟發的、非線性相互作用的單個孤立蜂群的行為和穩定性有很多了解,但對多個這樣的蜂群的交叉動力學卻知之甚少,即使在一個蜂群是單個粒子的情況下,如捕食者-獵物模型中。最近的數值研究表明,當兩個蜂群發生碰撞時,所產生的動態通常表現為蜂群合并成一個單一的蜂群,作為一個統一的蜂群進行研磨,或散射成單獨的復合蜂群向不同方向移動。雖然很有趣,但需要對這些行為如何以及何時發生有更詳細的分析了解,特別是在設計機器人實驗和控制其結果時。

為了取得進展,我們考慮了一個在自推進力、摩擦力和成對相互作用力影響下運動的移動智能體的通用系統。在沒有相互作用的情況下,每個個體都傾向于一個固定的速度,這平衡了它的自推進力和摩擦力,但沒有首選方向。

結論

我們考慮了自主蜂群中的三個基本的開放性問題:在存在范圍相關的通信網絡的情況下,蜂群的穩定性如何作為系統參數的函數而變化。目前混合現實實驗的蜂群模式的動態,以驗證以前的分叉分析。最后,我們展示了一個蜂群如何通過兩個蜂群的碰撞來改變另一個蜂群的行為。

具體來說,我們考慮了一個具有延遲耦合通信網絡的蜂群的新模型,其中延遲被認為是與范圍有關的。也就是說,給定一個范圍半徑,如果兩個智能體在半徑之外,延遲就是開,否則就是零。其含義是,如果智能體彼此靠近,小的延遲并不重要。額外的范圍依賴性創造了一套新的分叉,這是以前沒有看到的。對于沒有延遲的一般蜂群,通常的狀態包括成群(平移)或環形/旋轉狀態,智能體以相位傳播。隨著固定延遲的增加,旋轉狀態分叉,所有的智能體都處于相位,一起旋轉。范圍依賴性引入了一個新的旋轉分叉狀態,表現為觀察到的新的混合狀態,結合了環形和旋轉狀態的動力學。半徑參數,被用來量化旋轉混合狀態的分叉。對于小半徑,我們看到整個蜂群的動力學顯示出集群的反旋轉行為,是周期性的。這與平均場描述中的小半徑值一致。隨著半徑的增加,混合的周期性狀態在整個模型中產生了新的頻率,這些頻率在平均場中表現為環形分叉。均值場分析是通過跟蹤以復數對形式穿過虛軸的Floquet乘數來完成的。頻率分析明確地顯示了均值場中的額外頻率。

最后,我們跟蹤了不同半徑值的耦合振幅和延遲的位置,定位了發生環形分叉的參數。結果顯示,隨著延遲半徑的增加,環形分叉在較低的耦合振幅和延遲值上發生。其含義是,如果包括延遲的范圍依賴性,比周期性運動更復雜的行為在理論和實驗中被觀察到的概率更大。

通過操縱通信延遲和耦合強度,我們采取了第一個重要步驟,利用混合現實測試不同的突發蜂群狀態。混合現實框架允許通過使用模擬來增加智能體的數量,同時保持關鍵的現實世界的相互作用,這是很難用物理平臺來建模的,從而對突發的蜂群行為進行研究。由于混合現實可以處理許多不同的抽象層次,我們能夠使用兩個不同的機器人平臺來驗證蜂群行為。我們選擇了行為所需的抽象水平,在我們的案例中,它集中于表現出簡單的動態和使用延遲信息的智能體,就像在現實世界中一樣。ASVs和UAV都測試了所有三種理論上預測的行為,以及預測的蜂群狀態之間的轉換。這強調了所提出的蜂群模型有可能適用于各種平臺,并強調了通信延遲對系統行為的影響。

有一系列的理論支持所提出的模型,所提出的結果是顯示理論有效的重要步驟,同時也證明了有一些感興趣的領域是理論所沒有捕捉到的。理解這個系統的多重穩定性在分析上是很困難的,但是通過使用模擬和混合現實,我們能夠觀察到多重穩定性,以及它在與真實車輛配對時對擬議的理論模型的影響。

這項工作的下一步包括調查增加更多的現實世界的假設如何改變預測的出現模式。例如,由于網絡的限制,我們的全局耦合的通信模型在所有真實的機器人中并不實用。下一步是研究基于范圍的通信的影響。雖然經常對同質智能體進行研究,但也可以考慮異質性的影響,這可能需要使用不同類型的防撞措施來說明不同的硬件限制。最后,存在不同的動態模型,其中可以添加延遲。這就提出了新的潛在模式,可以使用所述的分析形式進行研究。這些變化將繼續增加對我們當前模型的理解,以及對物理世界中這種類型的突發行為的使用。

最后,我們研究了具有非線性相互作用的兩個蜂群的碰撞,并特別側重于預測這種蜂群何時會結合成一個群體。與完整的散射圖不同的是,它取決于一組特定的初始條件是否屬于集群的高維吸引盆地(一般來說是一個困難的問題),我們集中于預測在近乎正面碰撞時維持一個集群所需的最小耦合。通過注意到最終形成碰撞群,最初是圍繞一個密度近似恒定的共同中心旋轉,我們能夠將臨界耦合的問題轉化為確定均值場近似的極限循環狀態的穩定性。我們的分叉分析與許多智能體的模擬結果一致。盡管我們的分析直接涉及到軟核內互動的蜂群,但只要智能體之間的非線性力有一個有限的范圍,基本方法可以很容易地擴展到更廣泛的模型。此外,提高我們分析的準確性的一個直接方法是超越均勻密度假設,用具有一般相互作用的蜂群狀態的精確穩態密度來取代它。除此之外,下一步的改進將是直接包括密度動力學,這可能為控制蜂群碰撞提供進一步的見解,包括在其他設置中,如蜂群。盡管如此,這項工作為理解和分析非線性蜂群碰撞邁出了重要的一步。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

對蜂群機器人的研究已經產生了一個強大的蜂群行為庫,它們擅長確定的任務,如集群和區域搜索,其中許多有可能應用于廣泛的軍事問題。然而,為了成功地應用于作戰環境,蜂群必須足夠靈活,以實現廣泛的特定目標,并且可以由非專業人員配置和使用。這項研究探索了使用基于任務的蜂群可組合性結構(MASC)來開發特定任務的戰術,作為更普遍的、可重復使用的規則組合,供高級機器人系統工程實驗室(ARSENL)蜂群系統使用。開發了三種戰術,用于對一個地理區域進行自主搜索。這些戰術在現場飛行和虛擬環境實驗中進行了測試,并與預先存在的完成相同任務的單體行為實現進行了比較。對性能的衡量標準進行了定義和觀察,驗證了解決方案的有效性,并確認了組合在可重用性和快速開發日益復雜的行為方面所提供的優勢。

1.1 動機

美國軍方對無人駕駛飛行器(UAV)的研究和利用有很長的歷史,早在第二次世界大戰之前就有了。最近,"捕食者 "無人機的推出,首先作為偵察平臺,后來作為武裝戰斗成員,徹底改變了現代戰爭。使用 "捕食者 "型無人機的優勢很多,而且有據可查,但是這類系統并不能為每一類任務提供通用的解決方案。系統的可用性、便攜性、后勤和維護要求、人力專業化和道德問題只是限制無人機向各級作戰部隊傳播的部分因素。一些人認為,戰爭的下一次革命將來自于蜂群技術:大量低成本的自主系統采用合作行為和分散控制來實現任務目標[1]-[3]。

在過去的十年中,已經進行了大量的工作來擴展無人機群的行為、能力以及指揮和控制(C2)。海軍研究生院先進機器人系統工程實驗室(ARSENL)小組以前的研究推動了以任務為中心的C2方法的發展[4],并通過分散的動態任務分配實現了蜂群自主[5]。然而,在描述高層行為和目標以及在機器人代理的強大分布式系統中實現這些目標方面,設計蜂群系統仍然存在獨特的挑戰。目前的行為實現往往是單一的,而有效的設計需要專家編程。這項研究探索了在一個面向任務的分層框架內組成原始蜂群行為的方法,以自主實現復雜的任務目標。在面向任務的框架內應用行為組合技術,可以促進簡化行為開發和重用,并有可能加速創建復雜的以任務為重點的蜂群行為,用于軍事應用。

1.1.1 蜂群案例

蜂群飛行器并沒有提供將完全取代目前無人駕駛航空系統(UAS)的好處和能力,但它們確實有可能吞并許多目前的能力。然而,更有趣的是,蜂群有可能迫使戰爭行為的技術轉變。在[1]中,Arquilla提出蜂群是一種建立在高度連接和機動能力的小型單位上的戰爭形式,這些小型單位可以快速分散和聚集在一起。Scharre[2]和Hurst[3]通過分析機器人群的屬性及其對現代戰場的潛在影響,闡述了群戰的概念。與目前的無人機系統相比,蜂群通過飛行器的異質性使自己與眾不同,這種異質性提供了單一無人機所不具備的廣泛能力。特別是,合作行為和分散控制所帶來的決策和執行速度,可能再加上人工智能(AI),使蜂群系統具有潛在的決定性作戰優勢。或者正如[2]中指出的,"擁有最智能的算法可能比擁有最好的硬件更重要"。

美國防部已經認識到蜂群技術的內在可能性,并將蜂群行為列為具有 "推動無人系統的巨大潛力 "的人工智能技術之一[6]。這種認識進一步體現在國防高級研究計劃局(DARPA)的項目中,如進攻型蜂群戰術(OFFSET)[7]。各軍種也在各自探索蜂群技術[8],成功的概念驗證包括海軍研究辦公室(ONR)的低成本無人機蜂群技術(LOCUST)[9],海軍航空系統司令部(NAVAIR)的Perdix系統[10],以及NAVAIR對DARPA的CODE計劃的收購[11]。這些計劃不僅探討了自主協作系統的發展,而且還探討了與這些系統相關的C2和人機界面(HSI)要求。蜂群C2和HSI已被確定為建議研究的核心,以使該技術進入軍事應用范圍[2]、[6]、[8]。

1.1.2 蜂群特征

蜂群機器人的研究源于早期的元胞自動機領域的研究。元胞自動機通常可以被描述為一組細胞的數學模型,其中單個細胞的狀態由其鄰居的狀態隨時間變化的某些函數決定[12]。細胞本身的效用是有限的,但一組細胞可以有效地模擬自然和生物模式,而且一些細胞自動機已被證明能夠模擬任何計算機器[12]。

貝尼[13]的早期工作將自動機的概念應用于機器人學。他和Wang[14]的工作創造了"蜂群智能 "一詞,即 "非智能機器人系統表現出集體的智能行為,表現為在外部環境中不可預測地產生特定的有序物質模式的能力。" 該定義后來被完善,指出智能蜂群是 "一群能夠進行普遍物質計算的非智能機器人" [15]。這種蜂群智能的概念是蜂群的一個基本屬性。對于這項研究來說,這個概念可以簡化為:蜂群是一個無人機的集合,這些無人機單獨只能夠進行簡單的行為,但當它們聚集成一個集體系統時,能夠產生特定的額外和更復雜的行為。

確保蜂群中的集體行為產生最終的預期行為是蜂群工程的一個基礎概念[16]。蜂群行為通常依賴于涌現,被定義為由單個智能體構成集體行為,進而產生全系統行為[17]。雖然涌現是蜂群的一個理想和基本特征,但它并不容易預測。意外的涌現行為會表現出潛在的負面后果,降低對系統的信任度[16], [17]。涌現行為不僅在蜂群智能方面得到了廣泛的研究,而且在多Agent系統的背景下也得到了更廣泛的研究,包括經濟、物流和工程等廣泛的應用。因此,有大量的行為問題的涌現算法解決方案,已經成為該領域的基礎。直接適用于機器人群領域的是基于生物的行為集合,如成群結隊[18],螞蟻和蜜蜂群優化[19],以及粒子群優化[20],[21]。在這些問題中的每一個,單個智能體,即本研究中的單個無人機,根據本地知識和對蜂群其他部分的有限知識決定自己的最佳行動。

分散控制和集體行為使關鍵蜂群屬性成為可能:適應性(靈活性)、穩健性和可擴展性[22]。適用于蜂群機器人和蜂群智能的這些屬性的精確定義在[22]-[24]中提供。一般來說,適應性是突發行為的結果,是蜂群在動態環境中實現一系列任務的能力。穩健性源于分散控制,即無論其他智能體是否失敗,單個蜂群智能體仍然可以做出適當的決定;也就是說,即使單個智能體失敗,蜂群仍然可以集體完成行為。可擴展性與此類似,即蜂群的規模應根據需要進行調整,以便在約束條件下完成特定目標。

1.1.3 機器人群

在過去的十年里,隨著低成本機器人和通信組件的普及,蜂群的實現已經取得了快速進展。像Kilobot[25]這樣的開源機器人很容易獲得,而像海軍研究生院(NPS)ARSENL的Zephyr II固定翼和Mosquito Hawk四旋翼無人機這樣更先進的平臺也很容易制造[26]。仿真環境,如Autonomous Robots Go Swarming(ARGoS)[27]、Open Robotics的Gazebo模擬器[28]和ArduPilot的軟件在環(SITL)環境[29],可免費用于測試與物理系統相結合的行為,以加快開發速度。

物理機器人群的C2系統并不像模擬器那樣發達,而且很少有管理機器人群的總體框架。值得注意的框架包括用于無人機的Aerostack[30]和ARSENL的基于任務的蜂群可組合性結構(MASC)[4]框架。此外,C2要求與蜂群的HSI研究密切相關。鑒于蜂群的潛在規模和相對于人的認知能力而言的行為復雜性,蜂群對人類互動提出了獨特的挑戰[31]。由于集體行為的突發性質與軍事環境中固有的嚴格的操作控制結構相匹配,HSI對軍事應用具有特別的意義[32]。在進攻性機動中使用無人駕駛車輛已經引起了倫理方面的爭論,而蜂群的自主性質只會使這個問題更加復雜[33]。

1.1.4 技術現狀

目前對多機器人系統和多機器人任務分配(MRTA)的重要研究工作集中在實現機器人群中復雜行為的規劃和執行。多機器人系統通常依靠任務分配技術和高層規劃來確定實現整體蜂群目標所需的單個平臺行動。有任務的機器人可以利用蜂群智能和涌現來實現子任務目標,但也有可能采用更多慎重的方法。Khaldi[23]和Arnold等人[34]對多機器人系統和蜂群機器人技術進行了比較和分析,重點是蜂群智能的應用。

MRTA的進展通過考慮時間和任務優先級限制的綜合能力匹配,使越來越復雜的任務領域成為可能[35], [36]。例如,NPS的ARSENL小組以前的研究推動了分散的、基于市場的任務分配的發展[5],[37],并在復雜的多域蜂群行動中成功地進行了演示[26]。ARSENL已經成功地采用大型蜂群來合作執行定義明確的復雜任務。對這些系統的有效控制仍然需要操作員的實時監督。

最近的論文如[38]將機器學習和人工智能技術應用于蜂群系統以實現行為發展。在這一領域的工作相對較少,實現先進的蜂群自治的目標,即通過 "提供指揮官的意圖,系統能夠從該指揮官的意圖中找出系統能夠做什么"[11],仍然是相當遙遠的。

1.2 研究目標

這項研究的目的是實施和評估基于MASC的分層解決方案,將能夠自主搜索和調查任務的不同規則組合成更強大的戰術,在異質蜂群上執行。基于市場的任務分配被調整為向參與戰術的平臺分配行為角色。本論文假設,以這種方式組成的簡單行為可以實現與更多單一行為相媲美的性能特征,并且該方法廣泛適用于創建面向任務的一般戰術。這一目標為實現MASC的目標提供了一個步驟,即促進簡單行為的設計和重用,并為任務應用創建越來越有能力的戰術。

對所開發的解決方案進行分析,以驗證復合任務分配方法的使用,并為未來實施和研究異構多無人機群的性能和C2提供建議的基礎。特別是,本論文討論了以下研究問題。

  • 使用組合行為的蜂群與使用單體行為的蜂群相比,其性能是否具有可比性?

  • 在有效性和可用性方面,可組合行為比單體行為有哪些好處(如果有的話)?

  • 哪些性能指標適合于比較行為的實現?

  • 如何將建議的行為開發方法擴展到支持適用于任意任務的行為開發?

  • 所開發的方法是否提供了所需的靈活性和接口,以納入更大的任務控制框架中?

這項研究的范圍僅限于利用原始的規則和算法來組成強大的戰術。它沒有探索或開發在單個平臺上執行行為的算法。

1.2.1 方法

開發了三個符合MASC戰術理念的蜂群行為,該戰術由[4]中描述的更原始的規則組成。這些戰術是作為現有ARSENL規則的組合來實現的。每個戰術都由一個搜索規則和一個調查規則組成,前者指導平臺參與協調的區域搜索,后者指導平臺協調調查一個或多個感興趣的聯系體。這兩種戰術都利用以前開發的拍賣算法進行任務分配[37]。戰術動態地將每個平臺分配到其中一個規則中,并且在任何給定的時間,只有被分配的規則被用來控制平臺。

該戰術是為使用由具有獨特特征的平臺組成的異質群而開發的,這些特征影響了它們執行搜索和調查行為的適宜性。該戰術利用基于市場的方法(即拍賣算法)來考慮單個平臺的能力,具體描述如下。

  • SearchTacticStatic。一種戰術,在行為初始化時,搜索者和調查者的角色被靜態地分配給特定平臺。分配規定了搜索者的最低數量,并有效地按飛機類型優先分配(例如,更快的固定翼無人機被分配為搜索者)。

  • SearchTacticDynamic。采用這種戰術,所有平臺開始時都是搜索角色,但隨著行為的進展,可以在搜索者和調查者角色之間動態切換。當遇到聯系人時,一個單項拍賣被用來重新分配角色。需要改變角色的車輛會推遲執行向新角色的轉換,直到當前分配的任務完成之后。

  • SearchTacticImmediate。這個戰術實現了與SearchTacticDynamic戰術相同的分配方法;但是,搜索者和調查者角色之間的轉換會立即發生,而不是在當前分配的任務完成后發生。也就是說,如果平臺需要轉換角色,一個正在進行的搜索單元或調查任務將被中止。

1.3 論文組織

本論文分為五章。第一章討論了空中蜂群系統的現狀,它們與美國防部的相關性,以及這項研究的動機。第二章對相關的蜂群研究領域及其與本研究的關系進行了更詳細的討論。第三章描述了組成行為的實現,并將其與之前實現的單體行為進行了比較。第四章描述了所利用的實驗過程,并討論了所收集的數據,以提供實施的戰術性能和理論上的最佳性能之間的比較。最后,第五章提供了這項工作的結論和對該領域未來工作的建議。

付費5元查看完整內容

本報告介紹了在三個主要議題方面取得的成果:

  • 對小型無人機系統(SUAS)的分布式團隊進行實驗驗證,以協調執行復雜的行為。

  • 開發了一個現實的多架無人機模擬器,以應用強化學習技術來協調一組小型無人機系統以達到特定目的。

  • 設計并驗證了安裝在無人機上的帶有主動多輸入多輸出(MIMO)毫米波雷達傳感器的融合光學相機。

與驗證SUAS團隊有關的工作提出并實驗測試了我們的態勢感知、分布式SUAS團隊所使用的框架,該團隊能夠以自主方式實時運行,并在受限的通信條件下運行。我們的框架依賴于三層方法:(1)操作層,在這里做出快速的時間和狹窄的空間決定;(2)戰術層,在這里為智能體團隊做出時間和空間決定;以及(3)戰略層,在這里為智能體團隊做出緩慢的時間和廣泛的空間決定。這三層由一個臨時的、軟件定義的通信網絡協調,即使在通信受限的情況下,也能確保各層的智能體小組和團隊之間的信息傳遞稀少而及時。實驗結果顯示,一個由10個小型無人機系統組成的團隊負責在一個開放區域搜索和監測一個人。在操作層,我們的用例介紹了一個智能體自主地進行搜索、探測、定位、分類、識別、跟蹤和跟蹤該人,同時避免惡意碰撞。在戰術層,我們的實驗用例介紹了一組多個智能體的合作互動,使其能夠在更廣泛的空間和時間區域內監測目標人物。在戰略層,我們的用例涉及復雜行為的檢測--即被跟蹤的人進入汽車并逃跑,或者被跟蹤的人離開汽車并逃跑--這需要戰略反應以成功完成任務。

目標搜索和檢測包括各種決策問題,如覆蓋、監視、搜索、觀察和追逐-逃避以及其他問題。我們開發了一種多智能體深度強化學習(MADRL)方法來協調一組飛行器(無人機),以定位未知區域內的一組靜態目標。為此,我們設計了一個現實的無人機模擬器,它復制了真實實驗的動態和擾動,包括從實驗數據中提取的統計推斷,用于其建模。我們的強化學習方法,利用這個模擬器進行訓練,能夠為無人機找到接近最優的政策。與其他最先進的MADRL方法相比,我們的方法在學習和執行過程中都是完全分布式的,可以處理高維和連續的觀察空間,并且不需要調整額外的超參數。

為了給在受限通信條件下運行的SUAS開發一個分布式的分類和協調框架,我們的第一個目標是在無人駕駛飛行器(UAV)上建立一個多傳感器系統,以獲得高探測性能。眾所周知,安裝在無人機上的光學和熱傳感器已被成功用于對難以進入的區域進行成像。然而,這些傳感器都不提供關于場景的范圍信息;因此,它們與高分辨率毫米波雷達的融合有可能改善成像系統的性能。我們提出了一個配備了無源光學攝像機和有源多輸入多輸出(MIMO)毫米波雷達傳感器的下視無人機系統的初步實驗結果。毫米波雷達的三維成像是通過收集通過運動線的數據來實現的,從而產生一個合成孔徑,并使用垂直于運動軌跡的結線MIMO陣列。我們的初步結果顯示,融合的光學和毫米波圖像提供了形狀和范圍信息,最終導致無人機系統的成像能力增強。

付費5元查看完整內容

內聚力是團隊的一個重要屬性,它可以影響個人隊友和團隊成果。然而,在包括自主系統作為隊友的團隊中,內聚力是一個未被充分探索的話題。我們研究了關于人類團隊內聚力的現有文獻,然后在此基礎上推進對人類-自主系統團隊的內聚力的理解,包括相似性和差異性。我們描述了團隊的內聚力,各種定義、因素、維度以及相關的好處和壞處。我們討論了當團隊包括一個自主性的隊友時,該元素可能會受到怎樣的影響,并進行了逐一描述。最后,我們確定了可能與內聚力有關的人類-自主性互動的具體因素,然后闡述了對推進有效的人類-自主性團隊的科學至關重要的未來研究問題。

付費5元查看完整內容

美國陸軍最近制定了一項關于未來陸軍如何作戰的戰略以及實現這些軍事能力的相關現代化和研究重點。以高超音速飛行為基礎的遠程精確射擊對于確保美國能夠對任何競爭對手實施其意志至關重要。要實現一個有效的未來美國軍隊,必須克服許多障礙。其中一些差距是對高超音速飛行器空氣熱力學的理解,從而促使對基礎研究的需求。本報告的目標是定義一個經典的、與陸軍相關的配置,適合于基礎研究,以允許與適當的主題專家的關鍵數量的集中合作。從這種開放的幾何構型研究中獲得的數據和知識可能會受到更多的限制性分配

美國陸軍最近制定了一項關于未來陸軍如何作戰的戰略以及實現這些軍事能力的相關現代化和研究重點。以高超音速飛行為基礎的遠程精確射擊對于確保美國能夠對任何競爭對手實施其意志至關重要。

要實現一個有效的未來美國軍隊,必須克服許多障礙。其中一些差距是對高超音速飛行器空氣熱力學的理解,從而促使對基礎性研究的需求。缺乏對高超音速飛行器周圍發生的復雜物理和化學的預測性知識,抑制了及時的、優化的多部件設計。對邊界層過渡和沖擊-邊界層相互作用等具體現象了解不多。不能正確地對現象進行建模,會產生一些不確定的特征,如表面壓力分布和熱通量,這對飛行器技術,包括穩定性、控制和熱負荷管理,都有負面影響。

幸運的是,有一個先例,即通過定義政府基準飛行器來促進全社會的科學討論,這些飛行器包含功能相關的工件,但對具體的發展計劃不敏感(見陸軍-海軍基本芬納導彈、空軍改良基本芬納導彈、陸軍-海軍旋轉火箭、國家航空航天飛機和NASA研究)。本報告的目標是定義一個典型的、與軍隊相關的配置,適合于基礎研究,以便與足夠數量的適當的主題專家進行重點合作。從這個開放的幾何構型的研究中獲得的數據和知識可能會受到更多的限制性分配。

付費5元查看完整內容

執行摘要

本備忘錄報告是對美國海軍研究實驗室(NRL)資助項目 "對抗性在線學習"研究成果的總結,該項目資助周期為2017財年到2020財年。其主要目標是研究和展示在線機器學習算法的安全漏洞,并以博弈論分析和計算方法為支撐進行利用和反制。

1. 目標

對抗性在線學習項目中的目標是研究和展示在線機器學習算法的安全漏洞,并以博弈論分析和計算方法來支持開發和反措施。人工智能和機器學習算法經常被建模為具有單一目標函數的解決方案,這暗示著存在非智能對手。對抗性環境意味著有多個具有競爭性目標的智能Agent,需要一種更復雜的解決方法,這正是我們所尋求的。

2. 背景/動機

美國海軍研發框架(Naval R&D 框架)包括機器學習和推理算法,其是自主和無人系統的智能推動器。這項研究將學習與推理相結合,以減輕對手對數據的欺騙性操縱,從而影響旨在保護我們資產的在線學習算法的預測。此外,為了實現信息主導地位,未來的系統必須包括利用和操縱對手數據的能力,并保護我們數據的完整性。這項研究在信息主導權方面具有防御性以及進攻性的用途。

美國海軍信息優勢路線圖預測,未來的作戰環境將是高度競爭和信息密集的。它要求對對手進行快速分析和生成情報。探測對手的算法正在改進并變得越來越動態。然而,這些算法并不 "知道 "何時以及如何通過欺騙來隱藏自己的弱點,或對沖他們對數據的欺騙性操縱的預測,而這正是本研究的目標。

四年一度的國防審查和國防戰略越來越強調網絡空間對國家安全的重要性以及潛在對手探測我們關鍵基礎設施的風險。減輕網絡風險需要發展創新的行動概念,以挫敗對手戰略。

3. 技術方法

技術方法是基于一個博弈論的計算框架,我們將對抗性機器學習的問題視為一個被稱為學習器或防御器的機器學習算法與對手或攻擊者之間的博弈。

對抗性機器學習的背景。我們的研究主要考慮有監督的機器學習算法。在有監督的機器學習中,學習器被提供了一組稱為訓練集的樣本。訓練集中的每個樣本都可以被看作是從一組輸入變量或特征到稱為標簽或類別的輸出變量的映射。學習器的目標是通過觀察訓練集中的樣本(輸入和輸出對)來學習這種映射。訓練結束后,學習器使用其學到的映射來預測輸入的標簽,稱為查詢,其輸出或標簽并沒有提供給學習器。換句話說,機器學習算法使學習器能夠自動確定一個查詢的輸出。舉個例子,如果學習器是一個自動的垃圾郵件過濾器,對學習器的查詢可能是一個電子郵件的文本,而學習器則輸出該郵件是否是垃圾郵件。對抗性機器學習為上述機器學習問題增加了另一個層次的復雜性:對抗者通過不知不覺地修改有效的查詢來向學習器提供可疑的查詢,從而誤導學習器的輸出。例如,一個垃圾郵件發送者可以改變合法電子郵件中的有效超鏈接的幾個字符,并將超鏈接重定向到一個惡意網站,使該電子郵件成為有害或垃圾郵件。但是,學習器可以把不正確的超鏈接解釋為一個打字錯誤,并把修改后的電子郵件歸類為非垃圾郵件。對手略微修改合法軟件可執行文件的類似活動可以將良性軟件轉化為惡意軟件,從而繞過自動惡意軟件檢測器,嚴重損害受保護的計算機系統。顯然,在對抗性機器學習中,學習器有兩個目標:其主要目標是學習有效訓練實例的基礎功能,此外,還要學習識別和正確分類對抗者發送的查詢。在本報告的其余部分,我們根據討論的背景,交替使用了學習器和防御器,以及攻擊者和對手這些術語。

我們的技術方法將學習器和對手之間的互動建模為一個2人博弈。為此,學習器從過去與對手的互動中建立了一個對手的行為模型。然后,學習器與對手的模型進行多次互動,稱為博弈,以便從對手那里獲得不同的攻擊策略并確定相應的反應。例如,在我們的自動垃圾郵件檢測器學習者的例子中,學習器收到的詢問是對對手的模型所發送的電子郵件文本的不同修改。然后,學習器計算出適當的反應,以正確歸類敵方的電子郵件以及來自非敵方的合法電子郵件。我們在學習器與對手的博弈框架中考慮了三個主要方向,如下所述:

1.機器探測:我們專注于兩個問題:(1)如何找到學習器的盲點以操縱預測,以及(2)如何探測學習器以泄露有關其可預測性的信息以達到規避目的。這種類型的互動對應于探索性攻擊,試圖獲得關于學習器的信息(例如,它的偏見、它的特征或它的訓練數據)。

2.機器教學:這里的主要問題是如何毒害學習者,使其在盡可能少的嘗試中做出不準確的預測。這種類型的互動對應于通過訓練數據直接影響學習器的致病攻擊。機器教學被認為是機器學習的一個逆向問題,它將目標模型映射到一組樣本上。

3.反制措施:這方面的研究解決了從機器探測和機器教學中引出的漏洞。我們努力開發一個元學習器,作為學習器的封裝,它將權衡學習器的行動與自適應對手的關系,后者根據學習器的預測動態地演變其戰術。對于博弈的每個方面,探測或教學,我們在對手和學習器之間設置了一個博弈,對手的行動是對數據的操作,而學習器的行動是使用哪種策略來進行預測或攝取數據。收益是錯誤分類風險和學習器特征評估成本與修改對手數據成本的比值。我們的評估基于與非對抗性學習器的性能差異。

總之,我們的技術方法是在機器學習和計算博弈論的交叉點。該研究涉及分析和開發攻擊者與防御者之間的博弈,其中對手試圖回避或學習學習器使用的機器學習算法的信息,對手試圖主動修改學習器使用的機器學習算法的機器教學,以及反制措施,即學習器學會對對手的機器探測和機器教學相關行動做出戰略反應。

4. 結果

我們按財政年度總結了項目的主要結果和成果,如下所述。

4.1 2017財年

在項目的第一年,我們研究對比了應用于網絡安全的生成性和判別性機器學習(ML)模型。我們開發了一個基于深度學習的ML模型,利用字符級卷積神經網絡(CharCNN)[1]將電子郵件文本數據分類為垃圾郵件或非垃圾郵件,并使用Kaggle電子郵件和安然電子郵件數據集驗證了該ML模型(//www.kaggle.com/venky73/spam-mails-dataset,//www.kaggle.com/wanderfj/enron-spam)。我們還在[2]中發表了一個初步的基于博弈論的框架,使基于ML的分類器能夠預測它所收到的查詢是合法的還是來自對手的探測攻擊。

該項目涉及使用快速梯度符號法(FGSM)[3]從圖像數據的干凈樣本中生成擾動樣本的算法。該技術在生成來自MIST數據集的手寫數字的擾動圖像方面得到了驗證[4]。

4.2 2018財年

在項目的第二年,主要致力于開發ML技術,用于模擬對手生成對抗性數據的策略。最近關于最先進的網絡安全技術的調查顯示,電子郵件文本和網絡數據包經常被攻擊者用來繞過網絡防御,如電子郵件垃圾郵件過濾器或惡意軟件檢測器[5, 6]。基于這一觀察,主要使用字符串數據,如電子郵件和社交媒體上的帖子的文本數據,以及網絡流量數據作為我們研究的主要數據模式。

作為第一個任務,開發了一個生成對抗性文本數據的算法。實現了Liang等人[7]的算法的一個略微修改版本,用于對文本數據樣本進行最小化的擾動,以生成一個對抗性樣本。Liang等人的原始算法被設計為戰略性地確定在一個給定的干凈文本樣本中改變哪些字符和多少字符,從而使改變后的文本被分類為與干凈文本不同的標簽,而該模型已被預先訓練為文本數據的分類。我們略微修改了算法,使干凈文本中要被擾亂的字符數可以作為算法的輸入參數來指定。這使我們能夠對使用不同擾動量或擾動強度的對手進行建模,這與他們的能力(如可用的預算、計算資源等)相稱,以從干凈的數據中產生對抗性數據。

接下來,我們研究了當對手的預算有限時產生對抗性數據的問題。對用于分類查詢的ML模型的參數和超參數的了解是對手產生成功規避攻擊的一個關鍵因素。這種知識通常由對手通過發送查詢和觀察分類器的輸出或預測來探測分類器而獲得。現有的文獻主要考慮了對手可用的ML模型參數知識的兩個極端:白盒,即對手有完全的知識,和黑盒,即對手沒有知識。白盒攻擊通常需要對手有大量的預算來發送幾個探針,而黑盒攻擊則假設對手沒有預算來發送探針并獲得ML模型參數的知識。然而,在許多現實生活中,對手可能有有限的預算,可以負擔得起發送幾個探針以獲得ML模型參數的部分知識。我們研究了一個預算有限對手的場景,稱為灰盒技術[8]。我們用一個基于深度學習的文本分類器評估了我們提出的灰盒技術,同時對一個名為DBPedia(

我們研究的最后一個問題是確定文本數據的有效向量表示或嵌入,因為有效的數據表示將使防御者的分類器能夠快速計算出查詢的類別或標簽,同時減少錯誤。大多數現有的生成文本數據嵌入的技術都是在字符級或詞級對文本進行編碼。這兩種表示法都有一定的缺陷:字符級表示法會導致非常大的矢量表示法,消耗空間并需要更多的計算時間,而詞級表示法會導致對不太常用的詞的矢量表示法效率低下,或者對以前未見過的詞沒有表示,導致在從干凈的文本樣本中生成對抗性樣本時,矢量數學計算不精確。我們開發了一種混合的字詞嵌入,其中一個叫做注意力的自適應參數被用來動態地確定是使用字符級還是字詞級編碼來確定一段文本中每個字的向量表示[9]。該技術在一個由學生用英語書寫的考試答案的開源數據集上進行了評估,該數據集被稱為 "劍橋學習者語料庫-英語第一證書"(CLC-FCE)數據集(

我們還組織并主持了一個題為 "網絡安全中的對抗意識學習技術和趨勢 "的研討會,作為AAAI 2018秋季系列研討會的一部分,在弗吉尼亞州阿靈頓舉行。研討會上,人工智能和網絡安全領域的知名研究人員發表了兩個主題演講,并發表了十篇關于對抗性學習的同行評審研究論文。我們在2018年10月的 "AAAI對抗性學習技術和網絡安全趨勢研討會(ALEC 2018)論文集 "上發表了在線研討會的會議記錄[10]。

4.3 2019財年

在這一年里,我們的研究重點是將博弈論與ML結合起來,以開發針對ML模型的對抗性攻擊的反制措施或防御措施。我們今年的主要貢獻是開發了一個新的基于博弈論的框架和算法,稱為重復貝葉斯連續博弈(RBSG)。該技術使使用基于分類器的自動預測機制的學習者能夠降低其分類成本,而不影響在存在對抗性輸入時的分類質量。RBSG結合了一種稱為聯合蒙特卡洛樹搜索(MCTS)的隨機樹搜索算法,該算法有效地探索了學習者和對抗者之間的博弈樹,以及具有對手模型的強盜算法。然后,RBSG算法確定了學習者和對手的每個可能的 "動作 "或行動的效用,并向學習者推薦可能的最佳行動(換言之,具有最大預期效用的行動)。我們為這個問題建立了一個正式的數學模型,包括對防御者和對手可以使用的策略的描述,一個基于博弈論的技術,稱為自我發揮,使防御者能夠建立一個準確的對手行為模型,一個基于蒙特卡洛樹搜索(MCTS)的算法,使用自我發揮的對手模型使防御者能夠快速探索可能的策略,以及RBSG算法,使防御者能夠計算像納什均衡策略一樣的戰略反應,以有效地應對對手的攻擊。我們驗證了我們提出的在存在戰略性修改文本數據的對手的情況下預測文本數據標簽的技術,同時使用收集的亞馬遜產品評論、Yelp商業評論和電子郵件信息的開源文本數據集。我們的結果表明,我們能夠將分類成本降低30-40%,而不會降低分類器的性能指標,如準確率和精確度。

RBSG技術似乎對海軍和國防部有很高的價值潛力,因為它可以降低關鍵應用的操作成本,如網絡安全、導彈探測、雷達和其他信號分析技術,這些應用依賴于對傳入數據的分類,并可能受到對手的攻擊。我們通過NRL專利處理辦公室為RBSG技術的潛在美國專利申請提交了一份發明披露。我們還開始與一家名為Varonis的公司探討CRADA,以實現RBSG技術在網絡安全產品上的潛在商業化。

在這一年里,我們還發表了一份關于網絡安全任務中基于博弈論的對抗性學習技術的全面調查[11]。在調查中,我們將相關技術歸類為攻擊者和防御者之間的零和游戲和一般和游戲。我們為所調查的技術提出了一個新的分類,使用不同的類別,如防御者可獲得的關于對手的初始信息,防御者建立的代表對手攻擊的模型以及技術被驗證的應用領域。調查的最后,我們討論了網絡安全問題中與使用對抗性機器學習技術進一步調查有關的幾個開放性問題。

最后,我們為21財年6.1基礎項目提出了一個題為 "用于防御應用的博弈論機器學習 "的項目,該項目擴展了本報告中的結果,使用強化學習和基于博弈論的技術,在攻擊者與防御者的場景中建立有效的防御措施。

4.4 2020財年

在20財政年度,我們的研究主要集中在兩個方向:研究改進RBSG技術的計算技術,以及評估RBSG在網絡安全相關場景中的應用。在第一個方向下,我們開發了一種基于最近提出的基于博弈論的概念的技術,稱為安全值[12],用于計算防御者的策略。與原始的RBSG技術中基于納什均衡的計算不同,安全值方法假設攻擊者總是做出理性的決定,同時以最佳方式選擇其策略(即攻擊者選擇一個使其效用最大化的策略),安全值方法假設攻擊者可能偶爾會偏離最佳發揮,并且,使防御者能夠預測并利用攻擊者的偏離來改善防御者的表現(減少防御者分類器的操作成本)。我們實施了一種安全值方法,稱為安全的限制性斯塔克伯格反應(RSRS),并將其與RBSG算法相結合。RSRS算法的初步結果顯示,與在RBSG內部使用基于納什均衡的計算方法的成本相比,防御者的成本有5-10%的改善。

對于第二個方向,我們研究了生成惡意軟件數據的對抗性實例的技術,并建立了用于對抗性惡意軟件數據分類的ML模型。生成惡意軟件數據需要從干凈或正常運行的軟件可執行文件中創建惡意軟件可執行文件。這個問題的主要挑戰之一是,從圖像和文本模式的干凈數據中生成對抗性數據的相稱技術不能直接適用于軟件可執行文件,因為使用圖像或文本數據擾動技術擾動可執行文件內的二進制數據可能會破壞可執行文件的功能,使其無法正常工作。我們的研究基于MalGAN[13]技術,并在EMBER[14]和Kaggle惡意軟件數據集(

我們還開始研究一種合適的技術,以正式代表網絡安全場景中防御者與攻擊者的互動,如網絡入侵檢測。具體來說,我們研究了一個正式的數學模型,稱為攻擊圖博弈[15, 16]。在攻擊圖博弈中,攻擊者以順序的方式攻擊網絡資產,而防御者的目標是預測攻擊者未來的攻擊位置并保護它們。我們開始開發一種基于強化學習的算法,與納什均衡等博弈論概念相結合,在攻擊圖博弈框架內為防御者確定合適的策略,同時對攻擊者以前未見過的攻擊、隱蔽性和欺騙性做出智能反應。該算法在網絡入侵檢測場景中的實施和評估目前正在進行。

我們發表了幾篇關于RBSG技術研究成果的文章,包括在國防部AI/ML技術交流會議上的海報[17],在關于AI for Cyber-Security的非存檔研討會[18]上的論文(與AAAI 2020同地舉行),以及在名為FLAIRS(佛羅里達州AI研究協會)會議的同行評審存檔會議上對該研討會論文的略微擴展版本[19]。我們還在INFORMS(運籌學和管理科學研究所)2020年年會上發表了擴展摘要,并應邀介紹了我們在這個主題上的研究[20]。我們在19財年提交的RBSG技術的發明公開,在2020年7月被NRL審查小組批準獲得專利申請。

我們在人工智能、機器學習和網絡安全的交叉領域編輯了一本名為 "Adversary Aware Learning Techniques and Trends in Cyber-Security "的書[21]。該書由人工智能/ML和網絡安全領域的知名研究人員撰寫的10個章節組成,涵蓋了各種不同但又相互關聯的主題,包括以博弈的人工智能和博弈論作為對人工智能/ML系統攻擊的防御手段,有效解決在大型分布式環境(如物聯網)中運行的人工智能/ML的漏洞的方法,以及使人工智能/ML系統能夠與可能是惡意對手和/或善意隊友的人類進行智能互動的技術。

我們為上述書籍貢獻了一章,題為 "重新思考智能行為作為處理機器學習的對抗性挑戰的競爭性博弈"[22],其中我們描述了對抗性機器學習如何需要重新審視傳統的機器學習范式以及對抗性學習如何表現出智能行為。我們認為,發展對對手攻擊的抵抗力可以被建模為競爭性的多人博弈,包括具有矛盾和競爭性目標的不同玩家之間的戰略互動。在進一步的探索中,我們討論了不同的多人博弈環境的相關特征,這些環境被作為研究平臺來調查,以解決公開的問題和挑戰,從而開發出能夠超越人類智慧的人工智能算法。

繼續這個方向,我們在項目中研究的最后一個研究課題是如何通過機器學習技術發展智能能力,在復雜的互動場景中,如《星際爭霸-II》等實時戰略多人博弈中呈現的場景,發展對對手攻擊的抵抗能力[23]。我們開發了一種基于強化學習的算法,使防御者能夠智能地學習博弈戰術,包括何時以及部署多少游戲單位,以何種配置部署游戲單位等,以戰略性地擊敗更強大的對手。我們在虛擬舉行的2020年國防部AI/ML技術交流會上以海報形式展示了我們的研究成果[24],我們在會上表明,由防御者利用強化學習自動學習的策略可以勝過由人類專家手工編碼的基于啟發式的策略。我們目前正在繼續這一研究方向,同時將其擴展到更復雜的攻擊者-防御者類型的交互場景中。

付費5元查看完整內容

無人機技術的快速發展已經將蜂群機器人技術從科幻小說領域轉變為現實。今天,學術和軍事機構正在研究如何將現有的無人機技術發展成一個蜂群。問題是,在未來十年中,什么是技術上可行的,指揮官如何在戰場上使用這種技術?通過整合現有的無人機技術,就有可能開發出一種由數百架無人機組成的蜂群武器,這些無人機利用突發行為整合它們的行動。通過利用蜂群通過機動迅速集中的能力,就有可能同時對數百個點進行大規模打擊。

這提供的優勢是能夠進行約翰-沃頓上校定義的并行攻擊,且規模空前。為了論證這一點,本文將首先通過回顧現有的研究和文獻,分析未來十年在技術上的可行性。接下來,這項研究工作將開發一個使用并行攻擊概念的蜂群武器概念。然后,本文將在計算機模擬中展示這項研究工作設計的蜂群智能算法。本文將表明,在未來十年內,開發一種能夠進行并行攻擊的蜂群武器是可行的。通過在其他相同的武器中加入蜂群智能,蜂群算法使這些武器更加高效和致命。這項研究工作的結果可以為蜂群武器的多種新的使用概念奠定基礎,包括蜂群突破、蜂群區域防御、蜂群并行攻擊和蜂群在有爭議環境中的廣域偵察

引言

在過去的五年里,人工智能研究出現了爆炸性增長,而蜂群機器人技術已經上升為其最有前途的領域之一,學術和軍事機構在實驗室內外演示了無人機群。在去年,美國和中國都展示了由一百多架無人機組成的蜂群,與此同時,中國和俄羅斯都提出他們將把無人機武器化,用于攻擊。2017年,中國還發布了國家人工智能發展計劃,將蜂群智能作為一項優先發展工作,力爭在2020年之前實現可操作的蜂群智能算法。每個國家都認為蜂群技術將對戰場產生顛覆性影響;要真正理解這項新技術帶來的能力,必須將科幻小說與現實分開。在一個資源有限的時代,軍事領導人應該問的問題是,蜂群武器能提供什么能力,更重要的是,這種能力是不是已經存在了。要理解這個概念,你必須超越蜂群武器的數量優勢或其壓倒敵人先進武器系統的能力。蜂群武器提供的不僅僅是數量上的優勢,它們代表了一個相互關聯的武器系統,能夠反應性地適應環境和動態的敵人。

無人機技術已經成熟到在未來十年內采用蜂群武器來獲得戰場上的作戰優勢在技術上是可行的。為了說明在未來十年內技術上的可行性,本文將首先回顧現有文獻,以確定研究人員在實驗室外已經展示了哪些技術。使用這種方法,它將表明,擁有100個智能體的較小蜂群武器所需的硬件今天已經可以實現,在未來十年,這種技術將擴展到多達1000個無人機的蜂群將成為可能。接下來,它將使用戰爭理論來介紹蜂群武器的使用概念,而不僅僅是數量上的優勢。最后,它將把這兩者聯系起來,通過展示一個使用計算機模擬來實現這一就業概念的蜂群智能算法。這種模擬將使我們能夠理解和分析蜂群武器使用本文提出的應用概念可能產生的影響。這個軟件還將促進對人類-蜂群組隊的優勢和劣勢的分析。通過將現有的硬件與戰爭理論和應用概念聯系起來,本文表明,蜂群武器可以成為一種極具顛覆性的技術。通過對蜂群武器如何利用蜂群智能算法實現適應性行為形成共識,它有助于啟動這一對話。

蜂群智能行為是一種自然發生的現象,幾個世紀以來,它提高了數百種不同動物物種的生存機會。你可以在鳥群、魚群、螞蟻群、蜜蜂群以及其他數百個物種中看到蜂群的概念。蜂群智能算法是在科學家試圖研究、理解和復制這些行為時出現的。計算機科學家和生物學家了解到,在每一種情況下,動物們都在以某種方式進行交流,沒有領導者,而且蜂群中的每個代理都遵循一套規則。通過嘗試復制這種行為,科學家們發現,每個蜂群都在優化行為,以最大限度地提高蜂群的整體生存能力。

許多人用來描述蜂群的一個常見例子是一群椋鳥,如圖1所示。雖然它們的同步飛行令人印象深刻,但在這個鳥群中發生的事情更令人印象深刻。鳥群正在實施一個復雜的問題解決過程,優化鳥群的行為以尋找食物和避免威脅。當一只鳥檢測到威脅時,整個鳥群就會做出反應,避開該威脅。當它們探測到食物或落腳點時,整個鳥群都會跟上。蜂群在沒有領導者的情況下完成了所有這些工作,它使用的是一個局部的、分散的通信網絡,每只鳥只與他的鄰居進行通信。蜂群是一種適應,它優化了蜂群分散和搜索大片區域的能力,同時仍然允許蜂群在一個代理人發現食物或威脅時迅速集中。這種分散和集中的能力將在后面討論蜂群通過脈動進行機動的能力時變得至關重要。

圖1. 一群椋鳥。珍妮弗-史密斯,"電群",《每日郵報》,2013年11月,2017年9月12日訪問

科學家們將這種行為描述為蜂群智能,即一群智能體在決策中使用分散和自組織行為來適應環境變化和解決問題。幾十年來,研究人員從這些自然發生的蜂群中獲得靈感,開發了蜂群智能算法,如蟻群、蜂巢或粒子群優化算法。蜂群智能算法有成千上萬種不同的變化,這將超出本文的范圍,但所有這些算法的共同點是,每個算法都有一個代理群,使用本地規則集和分散的通信網絡來適應環境變化。今天,蜂群工程已經開始整合多種算法并修改規則集以解決新問題。例如,后面介紹的蜂群智能算法就是對粒子群優化的修改。因此,蜂群工程可以開發新的更復雜的蜂群行為。這種設計行為的能力對于后面討論戰爭理論和蜂群武器的使用概念也將是很重要的。

今天,無人機技術的成本降低,使這些蜂群智能算法能夠過渡到現實世界。中國和美國都已經展示了他們操作一百架無人機群的能力。例如,在2016年,美國戰略能力辦公室展示了從F-18飛機的飛行中發射的103架無人機群。現在,同一個小組正在開發一個1000架無人機群。本文將重點討論蜂群的武器化。由于該技術剛剛出現,研究人員對蜂群武器的論述非常少。這也是一個復雜的、有爭議的話題,但卻是一個重要的話題,因為這些武器有可能大大塑造戰場的優勢或劣勢。到目前為止,作者們所寫的關于蜂群武器的文章主要集中在蜂群的數量優勢或壓倒先進武器系統的能力上。盡管蜂群武器確實可以提供這種能力,但這只是觸及了其真正潛力的表面。蜂群武器對敵人動態行動的實時反應能力使蜂群能夠迅速改變狀態和行為。有了這一點,你可以設計蜂群的行為,使之與軍事理論和戰爭原則相一致。通過設計行為,你可以創造出一種蜂群武器,它能夠在搜索目標時保持分散狀態,然后根據敵人的行為迅速集中到一個、兩個、三個或數百個目標上(圖2)。在聯合作戰原則中,這種脈沖能力整合了機動性和質量原則,以便在深度和廣度上攻擊敵人。下面將論證這一概念是可行的,并可能在未來十年內對戰場產生顛覆性影響。

圖2. 蜂群武器。由作者創建。

方法論

要使蜂群武器在未來十年內為戰場提供作戰優勢,必須在技術上的可行性和提供作戰優勢的使用概念之間建立聯系。為了建立這種聯系,下面的章節將回答三個子問題。

首先,在未來十年,蜂群武器在技術上是可行的嗎?為了將科幻小說與現實區分開來,第1節將首先確定蜂群武器在技術上是否可行,以及它們可以提供哪些能力。為了回答這個問題,本文將審視今天的可能性,并推測十年內的可能性。所用的時間線是十年,因為它涉及到更多的近期能力和威脅。它還可以更準確地預測蜂群技術的可用性及其影響。對于這項研究工作來說,要考慮未來十年內技術上可行的東西,它必須是一種已證明的能力。因此,本分析沒有考慮理論技術。第一部分的產品將是一個蜂群武器的能力表,這些能力在今天或十年內是可行的。

第二個問題是軍隊應該如何利用蜂群武器的概念來獲得戰場上的作戰優勢?為了回答這個問題,本分析將從軍事和戰爭理論入手,以確定軍隊如何利用蜂群武器來發揮其優勢。盡管蜂群武器有成千上萬種用途,但本文將以軍事理論為基礎,提出蜂群武器的概念。第2節,將通過介紹建立在軍事理論基礎上的就業概念來回答這個問題。它將利用該軍事理論來論證蜂群武器提供了一種目前尚不存在的能力。

最后一個問題是,現有技術是否能夠提供第2節所述的能力,以及這種能力是否會帶來作戰優勢?為了回答這個問題,這項研究工作將開發一種蜂群智能算法,利用蜂群技術實現這一軍事理論,在十年的時間框架內是可行的。本節將通過計算機模擬來分析這種蜂群智能算法提供所需能力的能力(圖3)。蜂群中的每個代理將實施蜂群智能算法來攻擊這個敵方系統,目標是在120分鐘內盡可能多地找到并摧毀200個分散的目標。為了分析結果,這項研究工作將使用模擬技術來比較沒有蜂群的1000個智能體的質量和有蜂群的800個智能體的質量。如果其中任何一個能夠找到、固定并摧毀超過50%的指定目標,那么根據陸軍理論,本分析將認為敵方系統不具備作戰能力或作戰無效。使用這種方法,本文將比較每一個,以確定蜂群武器是否能夠在未來十年內提供這些能力。

圖3. 蜂群武器兵棋推演截圖。肖恩-威廉姆斯,用于模擬系統攻擊的蜂群武器戰爭游戲模擬軟件,Java,2017年

付費5元查看完整內容

【背 景】

北約SCI-341研討會的主要科學目標是概述有關自主系統群體 (AS) 中態勢感知 (SA) 問題的最新技術,并確定未來發展與北約行動的相關性。在廣泛的領域研究了態勢感知:太空、海洋、網絡、社交媒體、特大城市。

這項研討會的想法源于關于將自動化和基于人工智能的系統集成到無需人工直接監督即可運行的系統和集群系統。我們知道,就人類而言,良好的 SA 水平是成功執行任務的重要先決條件。因此,我們詢問自動化系統和群體是否也是如此,以及群體的新興使用如何影響人類 SA。

研討會期間提交了所有八篇常規論文,除論文外,美國空軍前首席科學家 Mica Endsley 博士發表了一篇主題演講。

演講分為三個部分:1)自主和態勢感知,2)人類作為一個循環系統,3)群體智能和態勢感知。第一場會議討論了用于機器人和自主系統建模和仿真的群體控制方法、氣象情報和合成環境。第二場會議討論了如何通過群體展示、異常檢測和可解釋的人工智能為人類操作員提供更好的 SA。第三場討論了通過群體任務分配的群體智能、使用合成環境的群體性能評估以及群體與群體之間的交互

【8篇論文】

  • Session 1: 態勢感知與自主性——3篇論文

  • Session 2: 人在循環系統中——2篇論文

  • Session 3: 群體智能與態勢感知——3篇論文

Paper #1:

A Comparison of Distributed and Centralized Control for Bearing Only Emitter Localization with Sensor Swarms(分布式和集中式控制在單方位輻射源定位和傳感器群定位中的比較)

傳感器群具有增強態勢感知的潛力。如果傳感器群中多個資產協同工作,則存在兩個挑戰:優化傳感器部署和同時最大限度地減少操作員的工作量。如果管理單個資產的傳感任務使操作員超負荷,傳感器需要自動調整其行為。如何實現控制結構有多種可能性。

本文提供了對路徑規劃的調查。要完成的任務是使用兩個僅承載傳感器的平臺定位多個目標。作者認為,“通過目標分配算法解決路徑規劃問題特別有趣,因為存在解決分布式系統上的線性分配問題的方法,僅通過動態通信圖連接”。作者比較了六種不同的控制策略:分布式樹搜索 (DTS)、分布式優化器 (DO)、分布式迭代計劃交換 (DIEP)、中央樹搜索 (CTS)、中央優化器 (CO) 和中央分配 (CA)。比較考慮了兩個方面:一個場景中的所有目標都被本地化的時間,以及必要的計算時間。

中央控制意味著評估所有傳感器/平臺承載傳感器的聯合動作空間,并將最佳動作分配給每個單獨的傳感器載體。這種方法需要強大的計算能力,因為必須解決高維問題。作者建議在本地為每個平臺規劃行動。通過這種分散的方法,可以實現多個傳感器的聯合任務的協調行為,其中每個平臺計算自己的控制向量并將其發送給其他平臺。重復此過程,直到解決方案收斂。分散的方法通常不能提供最佳的聯合解決方案。

在評估中,目標被認為是威脅;因此,平臺需要與當前目標估計保持威脅距離。此外,不同算法的規劃范圍(h 總動作數,I 步數,具有恒定控制輸入)是不同的(由作為首字母縮略詞后綴的數字表示,例如 DTS3)。下圖顯示了三種評估場景:角度和水平/垂直、Circle-4 和 Circle-8。使用了兩種不同的起始配置(相同和相反)。所有模擬都使用了 100 次蒙特卡羅運行。論文(Schily, H., Hoffmann, F., Charlish, A. A Comparison of Distributed and Centralized Control for Bearing Only Emitter Localization with Sensor Swarms. STO-MP-SCI-341)的第2章提供了詳細的評估設計。

結果如下。總體而言,CA3 顯示出可喜的結果:它在角度、水平/垂直、Circle-4 和 Circle-8-Same 場景中表現最好。對于 Circle-8-Opposite,“CA 算法很難找到最佳分配。這是因為平臺在決定是按順時還是逆時針訪問目標時并不相鄰。”對于這種情況,DIEP 和 CP3 表現最好。DIEP 的表現與具有相同時間范圍的中央規劃者相似。由于它需要較低的計算成本,因此它被認為是路徑中央規劃的有趣替代方案。對于每種方法,較長的規劃范圍對結果是有益的。

作者認為 CA 算法“似乎在集中式和分布式規劃方法之間實現了很好的折衷。在所進行的實驗中,它唯一的弱點是同時定位許多目標,這些目標相對于傳感器平臺的起點在各個方向上均勻分布(第 8 圈)。”

Paper # 2:

AI-Powered High Resolution Weather Intelligence Platform(AI驅動的高分辨率天氣智能平臺)

天氣對 UxV(無人駕駛車輛)的運營安全和效率有重大影響。風、湍流、極端溫度、濕度、閃電、云、結冰和降水只是許多局部天氣現象中的一小部分,這些現象決定了 UxV 在給定區域可以做什么或不可以做什么,我們對這些微觀現象的理解實時和預測對于任務成功至關重要。當考慮成群的 UxV 時,挑戰甚至更大,其中每輛車的態勢感知 (SA) 都嚴重依賴于另一輛車。在當今的戰場上,天氣的影響以及我們預測和應對天氣的能力,可以決定任務的成敗。

Tomorrow.io 由軍事飛行員創立,是世界上發展最快的氣象技術公司。在短短的時間內,Tomorrow.io 已成為軍事、航空和無人駕駛航空系統 (UAS) 行業的領先氣象解決方案,客戶包括主要航空公司、武裝部隊以及無人機和無人機行業的領導者。Tomorrow.io 的團隊由 100 多名科學家、工程師、產品和業務經理組成。憑借在數值天氣預報、人工智能和大規模并行計算以及航空、國防、產品開發和用戶體驗/用戶界面 (UX/UI) 方面的豐富經驗,Tomorrow.io 具有獨特的資質,可以實現范式轉變氣象行業。

大多數天氣預報在全球范圍內都存在同樣的運營差距。缺乏數據源,特別是在武裝部隊行動的偏遠地區,以及沒有雷達和氣象站的地區,以及這些地區公開可用模型的粗分辨率,是缺乏準確性和細節的主要原因提供的數據和預測。此外,原始的、不可操作的天氣信息的輸出使最終用戶(如 UxVs 操作員)的決策過程和 SA 支持變得更加困難。

Tomorrow.io 開發了一種整體方法來解決特定于 UxV 的天氣挑戰。相關的 Tomorrow.io 功能集成了新穎的傳感技術、全面而靈活的數據同化引擎、定制的建模框架、機器學習技術以及用于靈活交付數據和見解的現代云原生軟件架構的組合。

對于高質量的天氣預報,觀測(地面、空中、衛星)、模型(全球、大陸)和高性能(數值天氣預報、大規模并行計算)計算是必要的。在大量 UxV 運行的地區,氣象站或雷達站可能不可用,或者可能在相關空域上方進行采樣。此外,這些地區的天氣模型也可能不可用。該貢獻通過提出高分辨率天氣情報平臺解決了這個問題;下圖顯示了用戶界面。數據來自各種“傳統和非傳統傳感技術”。這些模型能夠攝取不同的數據源,包括 UxVs 傳感器。這樣做,可以提供“以亞公里空間分辨率實時飛行條件的完整圖片”以及高頻時間更新。在數據稀疏的地區,UxVs可以創建一個獨立的天氣觀測“網絡”。使用綜合定制大氣模型 (CBAM),可以預測長達 14 天。提議的系統為 UxVs 操作提供了幾個好處,包括快速更新、多傳感器 UxVs 天氣分析和高分辨率歷史基線分析和預測。UxVs 跟蹤和提取原位數據支持人類操作員進行實時決策。此外,從高分辨率數據中獲得的洞察力和警報可以在必須快速做出決策的情況下為操作員提供支持。開發和發布時間表計劃從 2019 年到 2025 年。

Paper #3:

Synthetic Environment for Robotics and Autonomous Systems(機器人與自主系統的合成環境)

在未來的軍事作戰環境中使用機器人自主系統(RAS)和機器人群將成為現代戰爭的主要挑戰之一。自 2016 年以來,北約建模與仿真卓越中心 (M&S COE) 一直在開發用于概念和能力開發的機器人研究 (R2CD2) 項目,以分三個年度階段交付開放、可擴展、模塊化、基于標準的 M&S 工具原型架構,用于 RAS 和 Robotic Swarms 的實驗。具體來說,它側重于將 C2SIM 標準擴展到無人自主系統 (UAxS) 的實驗,以便在指揮與控制 (C2) 和仿真系統之間交換命令和報告。R2CD2 第二代架構實現了戰術網絡模擬和網絡效果功能,以支持軍事通用作戰圖片 (COP) 表示中公認的網絡圖片層的實驗和概念驗證,以擴展和改進 RAS 和集群態勢感知在戰術和操作層面。該實驗于 2020 年進行,通過多個互操作性標準證明了在三個不同位置的不同系統之間進行復雜交互的可行性。

該架構的最后一代,名為 R2CD2 EVO,引入了虛擬模擬、用于真實和模擬無人機系統 (UAS) 的真實地面控制站 (GCS) 和提供包括網絡層的 RAS/Swarm COP 的 C2 系統。該平臺使我們能夠研究、分析和對抗 RAS 系統和群體,根據任務任務和模擬系統的動態姿態,突出描述對來自建模傳感器的外部刺激作出反應的過程的行為。平臺數據設置場景是基于未來特大城市模型 (WISDOM) 實施的城市環境開發的,并將兵棋推演概念擴展到 RAS,充當訓練測試場,不僅用于在軍事期間使用 RAS 系統人員的標準培訓任務,也可作為能力發展的態度訓練算法。作為研究和開發活動的結果,R2CD2 EVO 被提議作為開發 RAS 合成環境的基石,以支持北約和各國在多域 UAxS 上的概念開發、實驗、培訓和演習活動。

Paper #4:

Swarm View: Situation Awareness of Swarms in Battle Management Systems(群體視角:戰斗管理系統中群體態勢感知)

多架無人機(UAV)的使用意義重大。因此,人機交互及其交互設計變得越來越重要,特別是在戰場上的軍事偵察中。然而,無人機群規模的不斷擴大帶來了許多需要解決的挑戰,例如具有高動態性的復雜情況增加了對用戶的需求。

作者解決了人機交互的人體工程學顯示問題,重點關注戰斗管理系統中的集群。隨著無人機群規模的增加(例如,多達數千個戰術無人機),情況可能很快變得復雜和混亂。因此,需要仍然能夠為群體的所有者提供 SA 以避免信息過載的解決方案。

首先,該貢獻提供了文獻調查的結果。一方面,作者提取了單個人類操作員必須監控大群體時可能出現的挑戰:復雜的操作畫面、高動態、信息過載以及對用戶的需求不斷增加。另一方面,它們為符合人體工程學的顯示器設計提供了現有的指導方針。基于此,作者設計了四種不同的面向應用的原型布局,針對鼠標、鍵盤和觸摸輸入進行了優化:

基于領導者的呈現:群體分成團隊;可視化一個團隊的領導機器人。 基于群體的呈現(下圖):將整個群體作為一個單元;整個群體的可視化,單一機器人可分解。 基于區域的呈現:區域、POIs等的可視化;與環境的交互。 基于縮放的呈現:縮放級別而定的可視化;信息級別由用戶決定。 所有布局都包含六個主要組件,這些組件適用于各自的布局。地圖 (1),基于谷歌地圖 (2021) 是基礎并位于顯示中心。它提供縮放、小地圖、帶有附加信息的藍軍和紅軍、未知對象以及區域和興趣點 (POI) 選項等功能。區域管理 (2) 允許用戶創建例如操作區域 (AO) 或 POI。任務管理 (3) 包含一個時間表,其中包含所有計劃的、當前的和已完成的任務,并允許為群體或部分群體計劃新任務。狀態信息 + 直播 (4) 顯示集群或無人機的狀態。直播的顯示尺寸(來自選定的無人機或區域)是可變可調的。Red Force 信息 (5) 在單獨的列表中顯示未知和已知對象(除了地圖顯示)。輔助系統優先考慮支持用戶決策的傳入對象。對話框 (6) 顯示傳入的警報、警告和消息。 這四種布局將很快與德國陸軍偵察部隊的焦點小組進行評估。根據來自特定軍事角色和層級的反饋,將迭代調整布局。進一步的開發/實驗將確定 SA、用戶體驗和直觀性(實驗室和現場測試),并為交叉設計和群體交互用戶界面提供建議。

Paper #5:

Anomaly detection and XAI concepts in swarm intelligence(群體智能中的異常檢測和XAI概念)

對于群體智能中的人類操作員來說,關鍵情況下的決策支持至關重要。自主系統共享的大量數據很容易使人類決策者不堪重負,因此需要支持以智能方式分析數據。為此,使用了用于評估情況和指示可疑行為或統計異常值的自主系統。這增強了他們的態勢感知能力并減少了工作量。因此,在這項工作中,我們強調為檢測監視任務中的異常而開發的數據融合服務,例如在海事領域,可以適應支持集群智能的運營商。此外,為了使人類操作員能夠理解群體的行為和數據融合服務的結果,引入了可解釋的人工智能 (XAI) 概念。通過為某些決策提供解釋,這使得自主系統的行為更容易被人類理解。

作者解決了由于自主系統共享大量數據而導致的信息過載問題。為了緩解這個問題,他們建議通過兩種智能數據分析方式來幫助人類操作員。第一種方法是自動異常檢測,這可能會加強人類操作員的 SA 并減少他們的工作量。第二種方法是可解釋的人工智能 (XAI) 概念;它們有可能使群體行為以及異常檢測結果更易于理解。

作者認為,控制一群無人機仍然具有挑戰性。一方面,(半自動化)群體代理“必須決定行動方案”;另一方面,人類操作員必須決定他們的行動,例如與群體互動。提出的建議力求改善人在循環中。考慮到海上監視的應用,使用非固定代理的動態方法具有幾個優點。首先,某些場景只能使用動態方法進行管理;其次,與固定監視傳感器相比,代理更便宜;第三,在多個地點靈活使用代理可以減少操作群體所需的人員數量。然而,情況評估仍然需要知情的操作員。

作者認為,在海洋領域用于船舶分析的異常檢測算法可能適用于引入以下場景的群體。“假設我們有一個群體來支持海上船只,這些船只不僅會收集它們自己的傳感器系統可用的數據,還會收集所有資產的數據。所有來源收集的信息都需要融合成一幅連貫的畫面。這不應僅限于 JDL 數據融合的第一級,而應包括更高級別的數據融合過程,以獲取有關附近所有對象的可用信息。” 數據驅動方法能夠應對這種情況。文獻提供了三種檢測位置和運動異常的方法:統計解釋為與正常行為相比的異常值;聚類分析聚類相似的軌跡和確切的路線;用于建模正常移動模式的深度學習方法。為了應對更復雜的場景,包括船舶周圍環境(基礎設施、地理、天氣等)在內的算法是必要的。在某些復雜異常的情況下,區分正常和異常行為需要基于規則、基于模糊、多智能體或基于概率圖形模型的算法。對于所有提到的算法類別,作者都指出了大量的示例算法。

一些算法是黑盒模型,因此,它們的解釋對于人類操作員來說是復雜的。XAI 概念可以幫助緩解這個問題。XAI 概念旨在“提供道德、隱私、信心、信任和安全”,并努力在“它已經做了什么、現在正在做什么以及接下來會發生什么”中明確決策。,從而提高了人工操作員的 SA。考慮到 XAI 模型,模型特定方法(僅限于某些數學模型)可以與模型無關(適用于任何類型的模型)方法區分開來。

在目前的貢獻中,重點是與模型無關的方法。考慮到這些,局部解釋方法(解釋整個模型的單個預測結果)可以與全局解釋方法(解釋整個模型的行為,例如以規則列表的形式)區分開來。此外,作者使用特征屬性、路徑屬性和關聯規則挖掘來區分方法。通過特征屬性,“用戶將能夠了解他們的網絡依賴于哪些特征”;方法示例是提供全局和局部可解釋性的 Shapley Additive Explanations (SHAP) 和指示“模型在進行預測時考慮的輸入特征” 的局部可解釋模型無關解釋 (LIME)。路徑集成梯度(PIG,使用局部解釋)等路徑屬性提供了對模型預測貢獻最大的特征,從而深入了解導致決策的推理。關聯規則挖掘(ARM)是另一種使用全局解釋的方法,發現大型數據集中特征之間的相關性和共現。ARM 方法使用簡單的 if-then 規則,因此被認為是最可解釋的預測模型。可伸縮貝葉斯規則列表 (SBRL)、基尼正則化 (GiniReg) 和規則正則化 (RuleReg) 技術被認為適用于監視任務。

作者認為,使用這樣的 XAI 概念,人類操作員(決策者)可以更好地理解、更好地控制和更好地與一群自主代理進行通信,尤其是在具有挑戰性的環境中。總而言之,將異常檢測和 XAI 概念這兩種方法應用于人類在環、用戶對群體智能的理解和信任可能會得到改善。

Paper #6:

A New Swarm Collection Tasking Approach for Persistent Situational Awareness(一種基于群體集合任務的持續態勢感知方法)

涉及移動自組織傳感器代理的群技術應用越來越多,并且可擴展到多個軍事問題領域,例如戰術情報、監視、目標獲取和偵察 (ISTAR)。在 ISTAR,一組半自主傳感器協同完成收集任務和執行,以彌合信息需求和信息收集之間的差距,以保持持續的態勢感知。最先進的貢獻在很大程度上暴露了多維問題的復雜性。由于傳感器平臺資源容量和能量預算有限,它們通常采用特定的規定傳感器行為,導致過度保守的連接約束、有偏見的決策和/或融合解決方案結構。這些可能會任意傳達顯著的機會成本并對整體績效產生不利影響。

作者介紹了一種用于 ISTAR 中移動 ad hoc 代理(情報、監視、目標獲取和偵察)的群體收集任務的方法。目標是利用代理來增強持續的態勢感知,代理彌合信息需求和信息收集之間的差距。為此,半自主代理必須協同完成收集任務和執行。盡管板載處理能力和能量預算有限,但要實現這一目標是一項挑戰。

下圖(左)顯示了一個典型的收集任務上下文:“它定義了一個網格認知圖表示,反映了對特定感興趣區域的態勢感知,捕獲了關于單元占用和目標行為的先驗知識、信念和/或已知概率分布”。

所提出的群體收集任務分配方法提出了集中收集計劃,由群體領導者偶爾調解;然而,計劃的執行是分散的。簡而言之,“該方法結合了一種新的緊湊圖表示和一個合理的近似決策模型來執行傳感器代理路徑規劃優化,受周期性連接的影響,以實現信息共享、融合、態勢感知和動態重新分配/規劃”。

用于收集計劃的帶有反饋決策的新開環模型(下圖,右)可在后退的時間范圍內最大化收集價值。周期性群連接支持匯節點的觀測傳播、數據/信息融合、情況評估和重新規劃。向匯節點的周期性最大收集傳播考慮到能量約束。傳播集合的通信規劃/路由方案利用最小生成樹來最小化能量消耗。有關包括相關數據在內的詳細信息,請參閱論文第 3 章中的大量論文部分。

由于作者,所提出的方法擴展了群體的能力,以更好地滿足任務需求,并允許顯著擴展觀察區域。“如果使用精確的問題解決方法,新的問題表述也為解決方案最優性的可計算上限鋪平了道路”。

Paper #7:

A Framework Based On Deep Learning Techniques For Multi-Drone ISR Missions Performance Evaluation In Different Synthetic Environments(不同合成環境下基于深度學習技術的多無人機ISR任務性能評估框架)

本研究旨在關注當今模擬器的合成環境如何與應用于視頻分析的神經網絡和深度學習協同作用,特別是使用多無人機/集群系統執行 ISR 任務。事實上,用于模擬和游戲的現代虛擬引擎已經達到了讓不那么專心的觀察者感到困惑的真實水平。因此,自發出現的問題是,即使是人工智能也可以被“欺騙”,從而改變無人機上的行為和決策,從而改變機隊的最終行動。也就是說,用更科學的術語來評估無人機搭載的自動學習系統(例如神經網絡)的特征類型和數量是否可以從合成圖像中提取并反映在具有顯著優勢的連續環境中。訓練過程的精細和/或昂貴的階段,例如數據集創建和運動前測試。事實上,能夠隨意對模擬世界中的元素進行建模,可以可靠地再現甚至在現實生活中無法再現的情況和場景(例如,用于檢測閃電或爆炸的網絡),從而允許創建根據現代深度學習方法,數據集大小一致,并減少了恢復這些圖像的物理時間,同時還考慮了機載計算能力和容量的限制。此外,在降維過程中,由于真實場景的離散化導致的次要細節是否可以在某些情況下充當數據集預處理中的主成分分析 (PCA) 過濾器,這是值得詢問的。

所提出的研究方法將是實驗性的,并將預見到應用的雙重方向。在第一階段,我們想了解在真實數據集上訓練的神經網絡在一架或多架無人機上如何在不同的合成環境中表現。將檢查三個不同的模擬器,即 VRForces、ROS Gazebo 和 VBS4,以了解圖形細節的增加將如何影響準確度和精確召回曲線。擬議論文中提出的研究涉及人工智能對象識別和跟蹤領域,特別關注定位問題,因此檢測特定類別的對象,如人和車輛。在我們研究的第二階段,網絡將準備好部署,考慮到可能準備使用 COTS 或定制自動駕駛儀的硬件,使用協作和智能機隊模擬 ISR 任務的真實場景的無人機。在這個階段,我們集中在一個名為 SWARM 的項目上:一個大型工業研發 Vitrociset 項目。它是一個啟用人工智能的指揮和控制 (C&C) 系統,能夠執行和審查異構無人機小型/微型協作機隊的 ISR 任務。SWARM 將用作所提出框架的測試平臺,在不同的合成環境中測試和評估多無人機 ISR 任務的深度學習技術。

下圖(左)顯示了仿真系統架構。實驗框架包含三個合成環境。對于 VBS4,實現了一個使用一個或多個無人機生成合成場景的插件。每架無人機都配備了能夠生成視頻流的虛擬攝像頭。對于 ROS Gazebo,“圖像是使用配備 IMU 和可通過文件配置并作為 C++ 插件實現的 Iris 無人機相機獲取的”。為 VR-Forces 環境實現了類似的插件。使用針孔模型對三種環境的場景視圖進行標準化,以實現相同的觀看特性。

單獨使用合成圖像可能會引入新的偏見。因此,作者應用經典的計算機視覺和圖像處理方法來識別在 VISDRONE 數據集(真實)圖像中檢測到的對象與在三個模擬器中識別的對象之間的差異。與真實數據相比,將人和車輛的輪廓提取為對象類顯示信息丟失。

評估場景使用城市環境,包括人、車輛、道路、房屋和植被。飛行計劃包括低速(1-3 m/s)、5-30 m 的地面高度和靜止的天氣條件。有效載荷視頻流的采集使用 30 fps 的幀速率。生成了三個版本的 TFRecords(標準張量流數據格式)(過濾應用于邊界框的區域:非、100 像素和 200 像素)。所有三個測試集都包含 6 個對象類別(人、汽車、貨車、卡車、公共汽車、電機)。

考慮了 11 個 DNN 模型,使用 Tensorflow 作為 AI 框架。大型數據集 COCO、KITTI 和 VISDRONE 被視為預訓練數據集。使用 Fastern RCNN Resnet(在 VISDRONE 數據集上預訓練)獲得了最好的結果。VBS4 擁有三種模擬環境中最好的圖形引擎,是最接近現實的一種(下圖右)。總體而言,合成環境被證明是在現實世界中訓練的神經網絡的良好測試平臺(最佳情況下準確率約為 80%)。

Paper #8:

Interacting Swarm Sensing and Stabilization(交互群感知與穩定化)

最近,在生物學和物理學中研究的群體理論已被應用于機器人平臺,包括將群體應用于防御。雖然相關工作側重于單個群體行為,但這一貢獻將調查擴展到多個相互作用的群體及其產生的模式。作者提供了一種理論方法來研究具有非線性相互作用的兩個群體的碰撞。目的是預測在什么情況下兩個群體在兩個群體碰撞后可以結合形成一個新引擎(mill)。這個問題的背景是在某些軍事場景中需要重定向或捕獲一個群體。

下圖(左)顯示碰撞后的狀態取決于碰撞角度以及耦合強度。下圖(右)顯示了一個示例,其中兩個群體(最初處于植絨狀態)接近融合狀態。這種行為的原因是,“當兩個群體接近時,每個智能體開始感知智能體內部群體的力量,導致兩個群體圍繞彼此旋轉,同時保持接近恒定的群體間密度。隨著時間的推移,這兩個群體慢慢地放松到由來自兩者的均勻分布的智能體組成的充分混合的融合狀態”。

應用的分析方法依賴于這樣的假設,即在碰撞時,兩個群體在一個極限循環附近振蕩,每個群體圍繞另一個群體旋轉,同時保持近似恒定的密度。使用確定極限圓狀態穩定性的剛體近似,可以做出僅取決于物理群參數的預測。這為小碰撞角的臨界耦合提供了一個下限。對于對稱群體(具有相同的數量和物理參數),從分散到融合的過渡點類似于逃逸速度條件,其中臨界耦合與每個群體的平方速度成比例,與每個群體中的智能體數量成反比。

使用包含 5-8 個 Crazyflie 微型無人機的混合現實設置,在初步碰撞群實驗中證實了理論預測。實驗考慮了 8 個真實機器人 + 8 個模擬機器人、5 個真實機器人 + 45 個模擬機器人和 50 個模擬機器人的場景。對于所有情況,都觀察到固定融合。初步結果表明,我們可以根據選擇的物理參數讓一個群體捕獲另一個群體。此外,基于已知的參數和群體大小,它還應該是可預測的,當碰撞群體不會形成融合狀態時,即一個群體無法捕獲另一個群體。未來的工作將解決如何進入散射狀態或保持聚集狀態,以及將通信延遲或內部和外部噪聲效應的影響納入理論。

付費5元查看完整內容

低速、慢速和小型 (LSS) 飛行平臺的普及給國防和安全機構帶來了新的快速增長的威脅。因此,必須設計防御系統以應對此類威脅。現代作戰準備基于在高保真模擬器上進行的適當人員培訓。本報告的目的是考慮到各種商用 LSS 飛行器,并從不同的角度定義 LSS 模型,以便模型可用于LSS 系統相關的分析和設計方面,及用于抵制LSS系統(包括探測和中和)、作戰訓練。在北約成員國之間提升 LSS 能力并將 LSS 擴展到現有分類的能力被認為是有用和有益的。

【報告概要】

在安全受到威脅的背景下考慮小型無人機系統 (sUAS)(通常稱為無人機)時,從物理和動態的角度進行建模和仿真遇到了一些獨特的挑戰和機遇。

無人機的參數化定義包括以下幾類:

  • 類型學,指的是無人機可以飛行的模式;
  • 用于制造無人機的材料;
  • 飛行性能;
  • 螺旋槳種類;
  • 分類;
  • 導航系統;
  • 遠程控制器特性(如果有);
  • 有效載荷,考慮自身傳感器和可能的危險;
  • 通信系統。

描述無人機飛行動力學的分析模型在數學上應該是合理的,因為任務能力在很大程度上取決于車輛配置和行為。

考慮到剛體在空間中的運動動力學需要一個固定在剛體本身的參考系來進行合適的力學描述,并做出一些假設(例如,剛體模型、靜止大氣和無擾動、對稱機身和作用力在重心處),可以為 sUAV 的飛行動力學開發牛頓-歐拉方程。

在檢測 sUAS 時,必須考慮幾個現象,例如可見波范圍內外的反射、射頻、聲學以及相關技術,如被動和主動成像和檢測。

由于需要多個傳感器檢測 sUAS,因此有必要考慮識別的參數以便針對不同類型的檢測器對特征進行建模。此外,對多個傳感器的依賴還需要在信息融合和集成學習方面取得進步,以確保從完整的態勢感知中獲得可操作的情報。

無人機可探測性專家會議表明了對雷達特征以及不同無人機、雷達和場景的聲學特征進行建模的可能性,以補充實驗數據并幫助開發跟蹤、分類和態勢感知算法。此外,雷達場景模擬的適用性及其在目標建模和特征提取中的潛在用途已得到證實。

然而,由于市場上無人機的復雜性和可變性以及它們的不斷增強,就其物理和動態特性對無人機簽名進行清晰的建模似乎并不容易。

sUAS 特性的復雜性和可變性使得很難完成定義適合在仿真系統中使用的模型的任務。這是由于無人機本身的幾個參數,以及考慮到無人機的所有機動能力和特性所需的飛行動力學方程的復雜性。

此外,sUAS 特性的復雜性和可變性不允許定義用于評估相關特征的參數模型。

圖1 無人機類別與其他類別/參數的關系(part 1)

圖2 無人機類別與其他類別/參數的關系(part 2)

圖3 參考坐標系

【報告目錄】

付費5元查看完整內容
北京阿比特科技有限公司