威脅評估和武器分配應用是在海戰場景中取得成功結果的一個組成部分,無論是在保衛自身資產還是摧毀敵方目標方面都是如此。為了幫助應對日益復雜和快速變化的作戰環境,作戰人員需要獲得基于優化技術的實時決策輔助工具,以支持決策過程。本報告記錄了用于確定、開發和評估 "武器目標分配 "動態規劃算法的方法,經過更嚴格的測試后,該算法可用作概念演示器和實時作戰情況下的輔助決策工具。
圖 4-1 決策樹圖,顯示了五個目標、四種武器動態規劃場景下的目標階段(從左到右)和可能的武器狀態(從上到下)。
對作戰系統操作員來說,對海軍資產面臨的潛在威脅進行快速實時評估,并據此分配武器,已成為一項日益復雜和精密的任務。
隨著威脅評估和武器分配(TEWA)任務變得越來越復雜、變化越來越快,以及在時間緊迫的條件下需要處理的數據和信息量越來越大,研究能夠提供半自動化實時決策支持的優化技術變得更加迫切。TEWA 問題通常分為 TE 和 WA 兩部分。本報告只涉及武器分配問題,或按傳統術語稱為武器目標分配(WTA)。武器目標分配的目的是確定分配給特定目標的特定武器類型的數量,以便在現實限制條件下將總體目標威脅降至最低。
這項工作的目的是確定、開發和評估優化程序,以確定一種高效、實時的方法,優化海上場景中針對目標威脅的武器響應分配。從最簡單的靜態 WTA 環境開始,到確定性動態 WTA 的 "射擊-觀察-射擊 "分階段序列,介紹了 WTA 問題的幾個層次。為此,在 MATLAB 環境中開發了一種確定性動態算法。通過重現結果,例如以前在 Microsoft EXCEL 中處理過的問題,對算法進行了令人滿意但有限的驗證。要嚴格驗證該算法,并根據澳大利亞海上戰術程序調整其輸入和輸出,還需要開展補充工作。此外,還打算將成熟的 WTA 算法納入 DST 小組的軟件測試平臺,以便進一步測試和評估。
澳陸軍研究與發展請求 (ARDR) 16/0054 要求對自主化和自動化在整個戰斗勤務支援 (CSS) 功能中的應用機會和相關影響進行研究。本報告概述了范圍界定研究、主題專家討論和研討會以及 CSS 自動化和自主系統用例開發的結果。范圍界定研究包括關鍵概念和趨勢、技術掃描以及后勤行動潛在應用的識別。與陸軍總部人員舉行的研討會的成果包括對入圍技術進行優先排序,選出前四項技術進行進一步研究:預測分析、最后一英里后勤無人機系統、便攜式聯網健康診斷技術和半自動化車隊。進一步的討論確定了所選技術的關鍵信息要求和界限。報告接著介紹了兩種相關技術的詳細使用案例:半自主護航和最后一英里物流無人機系統,包括一個加強戰傷護理的使用案例。
圖 1:自動和自主系統分類的三維框架
自動化和自主化領域的技術發展是影響當今軍事行動的最重要技術趨勢之一。本報告是對陸軍研究與發展請求(ARDR)16/0054 的貢獻,研究了自動化和自主系統在戰斗勤務支援(CSS)中的潛在用途。本報告還借鑒了技術合作計劃(TTCP)陸地小組第 6 技術小組就供應和分配中的自主性所開展的工作。
本文件的第一部分概述了初步范圍界定研究的主要結果,包括概念模型的開發、主要趨勢的研究、不同類型自動化和自主系統的詳細技術掃描,以及這些系統在陸地后勤中潛在應用的映射。
概念模型考慮了問題空間的關鍵方面。這包括屬于自動化和自主化范疇的技術類型: 物流信息系統 (LIS)、各種無人系統和蜂群、人力增強系統、電力和能源管理系統以及各種新興的健康技術。這些系統的應用領域被映射到供應、運輸、衛生、工程和維護、指揮與控制(C2)以及能力生命周期管理等廣泛的后勤功能中。該模型進一步考慮了社會、技術、環境、經濟、政治和軍事部門的內部和外部驅動因素,以及不同任務類型和環境的作戰背景。
對關鍵方面的考慮有助于突出自動化和自主系統面臨的主要挑戰。這些挑戰包括:數據管理和安全;決策和信任的平衡;處理復雜環境的能力;技術成熟度和具體的物理限制;導航對全球定位系統的依賴;組織整合和人機界面;以及缺乏監管生態系統。這些系統在軍事環境中的一般理想特性包括:監管負擔低、優雅退化、低成本、穩健性、多功能性、模塊化和適應性。
技術掃描強調了后勤領域的大量潛在應用。通過審查軍事技術報告和與澳大利亞國防軍后勤官員的討論,本研究將其縮小到后勤功能中的具體應用概念:
本報告的第二部分涉及在陸軍總部與陸軍后勤專題專家(SMEs)開展的研討會活動,旨在完善進一步的研究方向。研討會的討論內容包括支持和反對使用特定技術的論據、技術優先級排序工作、特定信息要求和技術判別因素的討論,以及對選定使用案例的審查。研討會的結果是,從范圍界定研究的龐大清單中篩選出了 CSS 最感興趣的四項技術:
在討論選擇技術的關鍵特征時,重點強調了部隊保護、改善 CSS 的交付、系統脆弱性和擁有成本等主要因素。其他考慮因素包括跨域效應、與項目和作戰概念的兼容性以及用戶接受度。
報告接著概述了在分配任務和戰斗傷亡管理中使用無人機系統以及半自主車隊的詳細用例。這些用例是利用系統工程原理開發的,并在主題專家研討會上進行了完善。詳細審查用例后發現的共同問題包括確立價值主張,即考慮在哪些情況下使用該技術是合適和有必要的。一個重要的共同要求是在資產所有權和戰術/操作控制方面制定明確的 C2 框架。技術考慮因素包括通信范圍、網絡安全問題以及與組織流程的整合。從使用案例中得出的其他問題包括資產保護和簽名、任務分配的靈活性和替代用途,以及對總體法律、條令和監管框架的要求。
在識別和分析新興技術、建立進一步發展使用技術概念的共同框架以及使用情景方面,為正在進行的工作提出了建議。建議進行建模和模擬,以開發可靠的商業案例。再次強調任何新的網絡系統都需要詳細的數據管理和利用戰略。
本論文探討了支持分布式海上作戰(DMO)的兩種不同通信架構的選項。這兩種架構分別是星形網絡和無線網狀網絡。為本研究開發場景模型的目的是幫助讀者更好地理解緊密結合的數據類型、數據速率和所需網絡功能對網絡設計的影響。本研究針對需要視頻、語音和數據鏈路組合的場景中的各種資產,對每種架構進行了評估。它深入分析了每種設計所固有的信息傳遞延遲,并評估了每種網絡的可靠性。研究發現,利用機載路由功能的低地球軌道衛星星形和網狀網絡可提供最低的定時延遲。研究還發現,通過專用通道提供視頻饋送時,網絡抖動最小。最后,網狀網絡的可靠性略高于傳統的星形網絡,這是因為數據鏈路具有冗余性,而且缺少一個可能易受攻擊的中心樞紐。因此,利用特設無線網狀通信網絡將支持在分布式海上作戰進行有限的進攻性聯合火力打擊期間部署自適應部隊包。
圖 1. 星形網絡拓撲(左)和全網狀拓撲(右)。
在任何戰斗環境中,良好的通信都是取得勝利的關鍵。即使是在擁有堅實通信基礎設施的地理位置,如果戰地指揮官不能及時收到來自戰地資產的正確信息報告,也會造成混亂。在海戰中,尤其是在近海,通信基礎設施充其量也是微乎其微。
為響應美國防部長關于改進聯合火力(JF)行動的號召,本畢業設計探討了支持分布式海上行動(DMO)的兩種不同通信架構的選項。這兩種架構分別是星形網絡和無線網狀網絡。
為本研究開發情景模式的目的是幫助讀者更好地理解緊密耦合的數據類型、數據速率和所需網絡功能對網絡設計的影響。這有助于突出已實施網絡的設計限制。模擬結果用于定義基準參考和可追溯數據要求,以支持為 JF DMO 設計的戰術網絡。
A. 戰術通信網絡拓撲結構
網絡設置通常用拓撲結構來描述,拓撲結構是網絡內節點排列和通信的物理方式(美國陸軍工程部,1984 年,7)。本研究評估了圖 1 左側所示的傳統星形網絡和圖 1 右側所示的多層網狀通信網絡,并量化了這些鏈路的排列可能對操作產生的影響。
1.星形網絡
最廣泛使用的無線網絡拓撲結構是星形幾何模式。星形拓撲結構包括一個中心節點,所有信息都通過該節點流動。在星形格式中,所有信息都必須從每個參與資產發送和接收,并通過中心樞紐路由。這種配置中的中心節點是單點故障。如果中央節點離線,整個網絡就會癱瘓。
2.無線網狀網絡
多層戰術無線網狀網絡是指在網絡內共享信息的過程。網狀網絡描述了一種配置,其中每個節點都具有通信能力,可以相互發送和接收信息。在網狀網絡中,節點是自組織的,可根據需要通過路由算法自動建立(Shillington 和 Tong,2011 年)。
B. 結論
本研究的設計要求側重于網絡配置、對信息定時延遲的影響、網絡抖動和可靠性。研究發現,使用具有機載路由功能的低地球軌道(LEO)衛星的星形和網狀網絡可提供最低的定時延遲。研究還發現,在提供視頻饋送專用通道時,網絡抖動最小。最后,網狀網絡的可靠性略高于傳統的星形網絡,這是因為數據鏈路具有冗余性,而且沒有潛在的易受攻擊的中心樞紐。因此,在分布式海上行動的有限進攻性聯合火力打擊中,利用特設無線網狀通信網絡將支持部署自適應部隊包。
傳感器信息推薦系統是一個概念驗證應用程序,用于測試強化學習算法在推薦軍事分析員當時可選擇的正確信息源方面的有效性。該系統有多種方式向用戶傳播數據并向推薦服務器提供反饋。本報告介紹了傳感器信息推薦系統,該系統由數據源、推薦服務器、戰術突擊工具包服務器和安卓團隊感知工具包實例組成。本報告介紹了在獨立環境中部署這些組件以進行測試和開發的步驟。
系統架構如圖 1 所示。推薦服務器從部署的傳感器接收數據,并通過 TAK 服務器將傳感器推薦的信息對象發送給 ATAK。
圖 1 傳感器信息推薦系統工作流程中的 TAK 服務器
本綜述旨在介紹統計和統計分析在軍事搜索探測技術評估和報告中的應用。目標受眾是參與軍事搜索能力開發的人員,他們以前可能沒有接受過統計分析方面的培訓,但其他需要做出以證據為基礎的能力開發決策的人員也可能會發現一些介紹性概念是適用的。本介紹旨在利用軍事搜索中使用的技術的技術評估中常見的例子,讓讀者熟悉統計分析的基本概念和語言,因此敘述直接指向具體的討論和概念,而繞過了在學術性更強的綜述中會考慮到的大型重要數學主題。因此,本導論并不力求詳盡,而是為感興趣的讀者提供參考,介紹業界使用的通用語言和概念,并就如何以合理的統計方式報告結果以及解釋他人提供的結果提出建議。
雖然承擔能力開發任務的軍事人員往往擁有多年的經驗和作戰洞察力,但并非所有人都接受過足夠的科學或技術培訓,使他們能夠在整個能力發展過程中從容應對要求他們進行的顯性或隱性風險效益評估中的統計和概率方面的問題。作為技術評估工作的一部分,他們需要將軍事要求轉化為技術要求,確定并分離出相關的物理參數進行測試,設計并執行實驗試驗,進行分析并解釋數據,最終做出以證據為基礎的能力發展決策,這些決策將在未來數年內影響國家能力。這可不是一項小任務。
面對預算和資源有限的壓力,同時又要負責以同樣不斷變化和改進的各種戰備等級的成套技術來應對快速發展的威脅,我們有強烈的動機來確保用于評估軍事技術有效性和局限性的資源能夠產生足夠高質量的證據,為投資和能力發展決策提供可靠的依據。此外,通過開發和應用完善的科學和統計方法,技術評估所投入的努力也能為更廣泛的盟軍能力發展社區提供支持。為確保分析的科學性、客觀性和統計有效性而付出的更多努力,將增加合作伙伴之間的信任,從而使報告的結果可以被有信心地接受,從而限制多余的工作,利用國家投資,促進相互依賴和互操作性的目標。
監視和通信中繼任務對無人駕駛飛機的可用能源供應提出了要求。自主飛行算法和太陽能光伏系統都提供了一種從環境中(分別從熱上升氣流和太陽輻射中)提取能量的方法,以延長飛機儲存能量極限之外的續航時間。此外,多架飛機可以通過共享信息提高飛行成功率。本報告介紹了一個由多架協調飛行器組成的演示系統,每架飛機都具有自主飛行算法和集成的太陽能光伏發電系統。計劃用兩架飛機進行飛行測試,以量化同時使用自主飛行和太陽能系統時的任務性能。
本研究旨在開發一種區塊鏈數據結構和原型,以跟蹤美國防部(DoD)各部門之間資金流動的預算編制情況。該項目的目標是提高對交易的洞察力,以實現購置資金的靈活性,并為美國防部的規劃、管理和宏觀平衡提供更好的支出跟蹤信息。該報告總結了區塊鏈技術可以加強的一系列解決方案和用例。區塊鏈技術尚未解決預算跟蹤問題。其他領域的現有解決方案只是將區塊鏈作為一種服務來使用。它們沒有考慮如何利用圖分析和機器學習等技術來改進基于區塊鏈的解決方案。不恰當的區塊鏈設計可能會導致系統的數據冗余急劇增加,這可能會導致大規模系統(如政府基礎設施)的系統維護成本居高不下。此外,由于基于區塊鏈的系統數據量大,我們需要一些工具,如與區塊鏈相結合的圖分析,來從數據中提取新的信息和模式。因此,基于區塊鏈和圖分析的混合設計已被用于國防部的預算跟蹤。
在本項目中,借助圖分析概念,提出了組織區塊鏈數據結構的原型。由于難以獲得國防部(DoD)預算管理的真實世界數據,我們利用了基于本項目期間提供的樣本的高級數據結構,作為更真實數據集的替代。在制定了初步路線圖和展示國防部資金轉移的圖表網絡后,我們提出了七個新穎的使用案例,以展示該解決方案的適用性。對于每個用例,我們都確定了所針對的問題、如何應用所建議的設計,以及所建議的解決方案設計如何帶來益處。使用案例涵蓋了與預算管理、數據操作和安全優化有關的幾個問題,以及與成本和成本效益有關的問題。
本項目的成果突出了以下幾點:
該項目按以下步驟進行:
由于本項目關注的是一個新穎的概念,而基于區塊鏈的預算管理系統此前并無設計,因此我們將重點放在設計問題上,提出了一個原型來支持這一概念,作為概念驗證。我們根據提供的數據樣本調整了設計。建議的用例很有可能被用作本項目的擴展。它們包括
本報告重點討論與人工智能系統可能缺乏可預測性而導致的有關風險--被稱為可預測性問題--及其對國家安全領域人工智能系統治理的影響。人工智能系統的可預測性表明人們可以在多大程度上回答這個問題:人工智能系統會做什么?可預測性問題既可以指人工智能系統的正確結果,也可以指不正確的結果,因為問題不在于這些結果是否符合系統工作的邏輯,而是在部署時是否有可能預見到這些結果。
人們越來越擔心,使用不可預測的人工智能系統為高風險決策提供信息可能會導致災難性的后果,這將破壞公眾對部署這些系統的組織的信任,并可能侵蝕政府的聲譽。在國家安全領域,人工智能的使用引入了一個新的不確定性來源,可能會阻礙風險管理程序,并可能使責任鏈變得混亂。在這個領域,可預測性問題的影響可能導致關鍵基礎設施的安全風險、個人權利和福祉的風險、沖突升級或外交影響。
在本報告中,我們首先從技術和社會技術的角度分析了可預測性問題,然后集中討論了英國、歐盟和美國的相關政策,考慮它們是否以及如何解決這個問題。從技術角度來看,我們認為,鑒于人工智能系統的設計、開發和部署的多層面過程,不可能考慮到所有的錯誤來源或可能產生的新行為。此外,即使在理想的情況下,在設計或開發階段沒有錯誤可以假設或檢測,一旦部署了人工智能系統,仍然可能發展出形式上正確的(但不想要的)結果,這在部署時是無法預見的。
我們通過關注人機編隊(HMT-AI)來分析可預測性問題的社會技術影響。人機編隊代表了一種越來越普遍的人工智能系統部署模式。在HMT-AI中,人類咨詢、協調、依賴、發展并與人工智能代理交換任務。由于HMT-AI結合了人類和人工的自主性,它們通過增加人工和人類代理及其環境之間的互動的數量和類型而加劇了可預測性問題。在這種情況下,我們發現可預測性問題的三個主要來源:人機交互、人員培訓和(過度)信任。人機交互可能會助長不可預測的結果,因為它們可以掩蓋、扭曲或過分詳細地描述人工智能系統的工作原理,而培訓計劃可能沒有考慮到人工智能技術的學習能力和HMT-AI的長期慣例建設。同樣,在HMTAI中,人類代理人不加批判地接受AI系統的結果,這種過度信任的動態也可能導致無法預測的結果。
在確定了可預測性問題的一些根本原因之后,我們分析了英國、歐盟和美國的政策,以評估這些原因是否在相關的政策文件中被涵蓋,如果是的話,如何以及在何種程度上被涵蓋。我們確定了四個主要主題和一個缺口。它們是:控制、監督和價值調整;資源提升的方法;可信賴人工智能的發展;以及缺乏對風險管理措施的關注,以遏制可預測性問題的影響。
我們的政策分析包括八個建議,以減輕與可預測性問題有關的風險。關鍵的建議是將治理方法集中在HMTAI上,而不僅僅是AI系統,并將可預測性問題概念化為多維度的,解決方案集中在HMT-AI組成的共同標準和準則上。在這些標準和準則中,可信人工智能的要求是特別相關的,應該與評估人工智能系統的可預測性的標準和認證計劃以及審計HMT-AI的程序結合起來。支持在國家安全中使用HMT-AI的決定的成本效益分析和影響評估應該考慮到可預測性問題及其對人權、民主價值的潛在影響,以及意外后果的風險。為了確保在部署潛在的不可預測的人工智能系統時進行充分的風險管理,我們建議調整ALARP原則--在合理可行的情況下盡量降低--作為制定HMT-AI中可預測性問題的人工智能特定風險評估框架的基礎。
擬議的基于ALARP的框架將提供有用的實際指導,但僅僅是這樣還不足以識別和減輕可預測性問題所帶來的風險。需要額外的政策、指導和培訓來充分考慮人工智能可預測性問題帶來的風險。人工智能系統支持的決策的影響越大,設計、開發和使用該系統的人的謹慎責任就越大,可接受的風險門檻也越低。這些分析和建議應該被理解為可操作的見解和實用的建議,以支持相關的利益相關者在國家安全背景下促進社會可接受的和道德上合理的人工智能的使用。
建議1. 政府應撥出研究經費,發展公私合作,對HMT-AI進行縱向研究。這項研究應側重于HMT-AI中的新舊決策模式,以評估編隊協議建設和培訓對績效和控制措施的影響。重點應放在為HMT-AI的具體動態定義新的培訓協議,以及加快風險管理標準和HMT-AI績效評估的發展。
建議2. 應該建立一個專門的HMT-AI認證計劃,以促進行業對為HMT-AI設計的AI系統的設計要求和評估的共識。任務之間的通用性、有效的溝通、性能的一致性以及對新隊友的適應性都應該包括在這樣一個認證計劃中。在開發不足的ISO標準的基礎上,這個認證計劃還應該擴展到過程的可追溯性和決策的問責制,以及評估HMT-AI信任程度的審計機制。這對于抑制HMT-AI中的過度信任和自滿態度是必要的,這種態度維持或擴大了可預測性問題。
建議3. 對國家安全領域的可預測性問題的政策反應應該側重于管理HMT-AI團隊,而不是單獨的AI系統。
建議4. 國家安全領域的HMT-AI的成本效益分析(CBA)應該包括對AI系統的可預測性以及技術和操作層面的相關道德風險的評估。為了促進各安全機構之間的一致評估,應該定義一個評估人工智能系統可預測性的標準量表,在這個量表上,使用(或不使用)人工智能的選擇應該根據上下文的CBA以及考慮公眾對風險和相關利益的態度來證明。這個尺度的定義應屬于獨立的第三方行為者的職權范圍,即與部署HMT-AI的公共機構不同。
建議5. 與其說是 "更多 "或 "更少 "的可預測性,政策建議應側重于可預測性的權衡,明確具體建議旨在解決可預測性問題的哪個方面,以何種方式解決,以及它們有可能加劇哪些方面,哪些緩解措施將被落實到位。政策應該認識到,可預測性是一個多維度的概念,在一個層面上可預測性的收益可能會以另一個層面的損失為代價。
建議6. 關于國家安全中人工智能可預測性問題的政策應該在正式和操作層面上解決可信度和不可預測性之間的聯系。例如,應該給人工智能系統一個可修正的可預測性分數,這應該包括在對系統的可信任度的評估中。人工智能系統的可信賴性應包括成本效益分析,以評估不想要的行為在不同部署背景下可能帶來的風險。
建議7. 應該為不可預測的人工智能建立風險閾值,這些閾值將圍繞不可預測行為的風險嚴重程度映射到其自身的可預測程度(例如,劃分為已知的已知因素、已知的未知因素等)。這些閾值反過來將為風險管理過程的發展提供信息,允許根據風險的可預測性及其影響對其進行優先排序。
建議8. 應該制定一個基于ALARP的框架,以評估不可預測的人工智能和HMT-AI的風險,并為任何給定的環境確定可接受的最大程度的不可預測性。這個框架應該包括:
本報告記錄了通過利用深度學習(DL)和模糊邏輯在空間和光譜領域之間整合信息,來加強多模態傳感器融合的研究成果。總的來說,這種方法通過融合不同的傳感器數據豐富了信息獲取,這對情報收集、數據傳輸和遙感信息的可視化產生了積極的影響。總體方法是利用最先進的數據融合數據集,為并發的多模態傳感器數據實施DL架構,然后通過整合模糊邏輯和模糊聚合來擴展這些DL能力,以擴大可攝入信息的范圍。這項研究取得的幾項進展包括:
出版物[1, 2, 3, 4, 5]進一步詳細介紹了取得的進展。
專門用于下馬士兵系統的國防資金是有限的,而且必須在多個部分之間進行分配。決定正確的組合可能是困難的--一些技術提高了殺傷力和保護力,另一些則提高了安全性能。同時,這些技術可能會增加認知和身體負荷。本報告提出了一種方法來進行跨越這一明顯的鴻溝,并找到技術的最佳組合。提出了一個數學戰斗模型,該模型考慮了態勢感知、殺傷力和保護設備在預期挽救生命方面的聯合效應。因此,該模型可以用來設計一個最佳的下馬士兵系統,一個可以拯救人生命的系統。
本方法依賴于在任何時候都將決策者表現為一個最佳的決策者。然而,該決策者必須在不確定性和時間限制下做出決定。隨著認知負擔的增加,模型中可能會發生幾個變化:決策之間的時間可能會增加,每個決策中考慮的信息量可能會減少,或者規劃范圍可能會縮短,導致更多的短視決策。模型中的每一個杠桿都能靈活地代表決策的退化,以及SA,同時仍然假設指揮官是在做出盡可能好的決策,但在困難的約束下。在技術上,我們的模型是基于兩個支柱。首先,戰斗被建模為連續時間馬爾可夫鏈(CTMC)。其次,指揮官被模擬為部分觀測馬爾可夫決策過程(POMDP)中的決策者。POMDP是通過動態規劃解決的順序決策問題。它們很難解決,因為與完全可觀察的馬爾可夫決策過程(MDPs)相反,一些狀態變量是隱藏的。幸運的是,先進的計算方法已經被開發出來以解決它們。
本文實施了一個概念驗證,基于一個下馬的戰斗場景,其中一個由12名士兵組成的小組必須確保一個隧道的入口。在任何時候,指揮官都可以根據當時的信息改變路線,或放棄行動。在這個場景中,還包括一個區域傳感器,例如,它可以是一個無人駕駛飛行器(UAV)。展示了如何在增加士兵的傳感能力和增加無人機的能力之間找到最佳權衡。還展示了如何在增加士兵的感知能力和增加他們的殺傷力和個人保護設備之間找到最佳的平衡。最后,展示了如何通過增加模型中決策的時間間隔,來模擬認知負擔的增加,從而增加預期的生命風險。
該模型在采購、能力發展、國防科技和學術領域具有開發潛力。這種廣泛的潛力要歸功于POMDPs的靈活性,它可以根據需要做得很抽象,或者很詳細。提出了幾個擴展模型實現的途徑:整合貝葉斯信念網絡(在CTMC和/或觀察模型中),結合情景階段的序列,并探索其他表示認知負擔的方法。
圖 2-1:戰斗中SA的概念概述。
機器人是一個具有挑戰性的領域,需要軟件和硬件的融合來完成所需的自主任務。任何工作流程的關鍵是在部署到生產環境之前對軟件進行自動構建和測試。本報告討論了美國陸軍作戰能力發展司令部陸軍研究實驗室(ARL)的無人自主車輛軟件研究平臺MAVericks的軟件開發過程中使用的持續集成/持續交付工具的重要性和創建情況。這個工具在ARL進行的快速研究和開發中起著至關重要的作用--包括模擬和嵌入式硬件目標的自動構建測試,以及驗證軟件在環模擬中的預期行為。
持續集成/持續交付(CI/CD)是軟件開發中常用的工具,用于自動構建、測試和部署代碼。這個工具對于提高研究的速度和效率至關重要,同時確保在增加或改變新功能時功能不受阻礙。在CI/CD之前,軟件開發過程是具有挑戰性的,隨著越來越多的合作者修改代碼庫,任何新的開發都有可能破壞現有的功能--比如代碼不再構建,自主行為和故障保護裝置不再按預期工作。
本報告重點關注美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)的MAVericks無人自主飛行器(UAV)軟件平臺的CI/CD集成,該平臺建立在開源平臺ROS2和PX4之上。ROS2是一套用于構建機器人應用的軟件庫和工具,而PX4是一個強大的無人機飛行控制軟件。利用這兩個平臺,MAVericks是一個專注于敏捷飛行的大型合作項目,在模擬和機器人平臺上都能發揮作用。MAVericks的目標是在ModalAI的VOXL和RB5硬件平臺上運行,因為它提供了尺寸、重量和功率,同時也是藍色無人機項目的合作伙伴,這意味著他們得到了國防創新部門的資助,以符合2020年國防授權法第848條的規定。
合作者包括美國軍事學院的西點軍校,作為分布式和協作式智能系統和技術項目的一部分;加州大學伯克利分校,作為規模化和穩健的自治項目的一部分;以及馬里蘭大學的人工智能和多代理系統的自治項目--而且這個名單一直在增加。此外,ARL一直在尋求提高其算法的穩健性和成熟的能力,以過渡到DEVCOM和國防部的其他組織。隨著許多合作者加入MAVericks,重要的是要確保每次修改后有最低限度的可用功能,以鼓勵快速加入和貢獻。MAVericks是一個由一百多個軟件包組成的大型研究平臺,重要的是每個軟件包都能可靠地構建和運行。通常情況下,合作者只關心幾個軟件包,他們可以很容易地進行修改和添加,而不需要對不相關的問題進行排查,這一點至關重要。由于這種不斷增長的社區,很容易偶然地引入錯誤或破壞不相關的功能。因此,CI/CD是一個很好的解決方案,它將為不同的用戶群體提高平臺的可靠性和可用性。
CI/CD管道實現了許多簡化開發的功能。它可以完全構建整個平臺,確保新用戶的依賴性安裝成功,在模擬環境中運行和測試平臺,以確保自主行為正常工作,并快速構建壓縮的工作空間,以防止在無人機上構建。
在自主系統的軟件開發中,一個有問題的情況是,用戶修改了幾個包,但只構建和測試了一個特定包。這樣,代碼就被合并到了生產中,而沒有驗證它對其他人是否有效。如果未經測試的修改被合并,依賴這些修改的包可能不再構建或通過所有的測試案例。
從用戶的角度來看,CI/CD是由用戶創建代碼合并請求(MR)來觸發的,將他們的修改添加到主分支。這就啟動了CI/CD,建立了一個管道。該管道包括四個階段:構建-依賴、構建-完整、測試和部署。對于每個階段,可以并行地運行多個作業來完成該階段。在每個作業中,流水線首先將合并后的變化復制到一個新的環境中,并完成一個特定的任務。在流水線的最后,一個完全構建的版本被上傳,并準備在無人機上閃現。如果任何步驟失敗,其余的管道階段將被中止,并通知用戶到底是什么地方出了問題,以便他們能夠解決任何問題。管線的概述見圖1。
在本報告中,描述了MAVericks CI/CD的基礎,然后詳細介紹了管道中的每個階段,以及所克服的幾個挑戰。