本報告提出一種基于“機器人操作系統(ROS)2”的新型仿真框架,旨在促進自主導航堆棧的開發與測試。報告詳述了導航堆棧的核心組件,包括“激光雷達里程計”“同步定位與建圖(SLAM)”及“前沿探索”。該導航堆棧的關鍵特性包括“實時性能”與“可擴展架構”。仿真成果已應用于實體機器人,使其成功實現建筑物內部自主測繪,并生成環境“二維占據柵格圖”與“三維點云”。
本報告響應《美陸軍多域情報:2021-2022財年科技重點領域》(陸軍副參謀長辦公室,2020年)設定的研究方向。具體而言,本研究契合以下論述:“戰爭將以超高速和大規模形式進行,由機器人及自主系統(RAS)、機器學習(ML)和人工智能(AI)等技術主導,這些技術已廣泛可用、集成封裝并具備即用性”(第5頁)。采用ROS 2確保開發框架的先進性與安全性,相較于ROS 1,其具備“跨平臺兼容性”“更優性能”及“增強的服務質量(QoS)”。
生成高質量標注合成圖像數據的能力,是構建和維護機器學習數據集的關鍵工具。然而,確保計算機生成數據質量達標極具挑戰性。本報告旨在評估并改進"虛擬自主導航環境系統與環境傳感器引擎"(VANE::ESE)生成的合成圖像數據,同時記錄為處理、分析VANE::ESE圖像數據集并基于其訓練模型所開發的全套工具集。研究還呈現多項實驗結果,涵蓋對可解釋AI技術應用的探索,以及在不同合成數據集訓練的多模型性能對比分析。
虛擬自主導航環境(VANE)是由軟件工具與虛擬場景構成的自動駕駛建模與仿真系統集合。其環境傳感器引擎組件(VANE::ESE)專用于在虛擬環境中高精度模擬車輛傳感器物理特性(涵蓋攝像頭、激光雷達、毫米波雷達等)(Carrillo et al. 2020)。本報告聚焦評估、優化VANE::ESE仿真引擎在生成合成圖像數據方面的性能——該類數據用于訓練機器學習(ML)計算機視覺模型,以執行目標檢測與圖像分類任務。合成數據生成能力的核心價值體現在兩方面:首先,因數據基于預設場景生成,可為每個圖像樣本實現自動標注,能零成本構建超大規模數據集;其次,可構建特定虛擬場景生成數據,有效覆蓋現實采集難以企及的高危邊界場景(例如戰損建筑或車輛的圖像數據)。快速生成特定場景的標注數據集對機器人與自主系統等廣泛領域具有重要價值。
然而,利用合成數據訓練ML模型仍面臨雙重挑戰:其一,海量合成數據集存在標注準確性保障及多格式標簽轉換等通用問題;其二,彌合真實數據與合成數據之間的差異尤為困難。現有研究提出多種解決方案——包括通過全域自適應技術改進模型(Wang and Deng 2018)、采用生成對抗網絡轉換圖像(Pfeiffer et al. 2019),以及直接提升仿真圖像的視覺真實感。真實圖像數據存在巨大差異(即便同類物體樣本間亦如此),要在保留準確標注的前提下復現這種差異性與真實度極具挑戰。本研究采用務實性操作路徑優化VANE::ESE圖像數據:接收生成數據集→運用本報告記錄的多重方法與工具分析→向開發團隊反饋優化建議→迭代提升后續數據集質量。
本工作的核心目標是提升VANE::ESE合成圖像數據在目標檢測與分類神經網絡訓練中的泛化能力,次要目標是開發并完整記錄用于處理分析VANE::ESE數據集的軟件工具集。
本報告展示了為美陸軍2024年機動支援與防護集成實驗(MSPIX)演示準備的模擬研究成果。本研究旨在開發并測試一套面向復雜環境的自主導航系統,通過先進算法使機器人實現障礙物規避與安全高效路徑規劃。報告詳述了自主導航系統的開發與測試方法,包括利用仿真評估性能,并通過模擬測試結果凸顯該導航方案的有效性。
本報告響應《美陸軍多域情報:2021-2022財年科技重點領域》(陸軍副參謀長辦公室,2020年)設定的研究方向。具體而言,本研究契合“戰爭將以超高速和大規模形式進行,由機器人及自主系統(RAS)、機器學習(ML)和人工智能(AI)等技術主導,這些技術已廣泛可用、集成封裝并具備即用性”(第5頁)的論述。通過引入虛擬邊界、多航點設置及暫停導航堆棧功能,本系統達成構建更高效自主解決方案的目標。
本報告提出了一項關于人類自主交互(HAI)任務5: 有人-無人編隊協同作戰(MUM-T)的決策支持系統(DSS)人機交互(HMI)需求的正式研究。描述了系統可信性概念模型和 MUM-T 可信系統的正式模型。探討了適用于 MUM-T 的多模態人機交互技術,并闡述了適用于 MUM-T 的可信 HMI/DSS 集成。討論了 MUM-T 技術路線圖的前景。
本報告提出了一系列新穎的理論和方法。值得信賴的自主系統(AS)理論包括形式化的信任模型、定量的可信度模型,以及對 “待”/“做”/“依賴 ”三類可信度的測量。多模態人機交互理論包括人機交互中人為因素和機器角色的認知模型、多模態系統的數據融合理論和多模態系統的系統融合理論。可信決策(DM)理論包括自主決策理論、MUM-T 中的混合決策理論和理性決策的認知過程模型。
本報告不僅探討了 MUM-T 操作和支持系統的技術要求,還為 MUM-T 和 AS 制定了嚴格的可信度測量和分析框架。報告涵蓋了用于混合系統建設的多模式和容錯技術,其中涉及人類和機器智能的實時協作和交互,以實現支持 MUM-T 系統的可信 AS。
在理論和技術發展的基礎上,提出了實現 MUM-T 和 AS 的路線圖的觀點。其中許多理論已通過算法和應用技術得到證明,可用于解決 MUM-T 和 AS 國防系統中的挑戰性問題。
本報告由兩部分組成,第二部分旨在介紹根據小型航行器自動目標識別(SCATR)數據集建立的雷達截面(RCS)預測模型。本部分提供了用于開發 RCS 模型的自適應機器學習策略的路線圖。介紹了分別基于五個自適應特征、兩個真實特征和四個全球定位系統(GPS)特征的 RCS 模型的八個變體。此外,每個 RCS 模型還考慮了 26 個子變體。這些模型子變體涵蓋了大量流行的回歸方法,我們的目標是找到一個最忠實地代表反合成孔徑雷達(ISAR)數據集的回歸器,用于 RCS 預測。性能結果以判定系數和均方根誤差表示。高斯過程回歸在 RCS 建模方面表現突出。報告末尾提出了重要的意見和結論。
加拿大政府(GoC)為其最新的監視衛星星座 RADARSAT Constellation Mission (RCM) 投資超過 15 億美元。國防部/加拿大武裝部隊(DND/CAF)極地 Epsilon 2 (PE2) 資本項目利用從加拿大的三顆 RCM 衛星獲得的合成孔徑雷達 (SAR) 圖像,對海上航道進行全天候監視,以完成其主要國防任務之一。從一開始,加拿大空軍就對其專用的 RCM 船舶探測模式 (SDM) 的性能質量提出了嚴格要求,以履行其保障加拿大海上進場的運行任務。PE2 目前的運行要求是在五級海況下探測大于 25 米的船只,對于大型船只的 RCS,存在相當簡單的半經驗模型,通常用于設計和評估 C 波段專用廣域 SDM 的性能。目標的 RCS 以物理單位平方米(m2)或相對于平方米的分貝(dBsm)為單位,用于衡量反射回雷達的能量大小。盡管 RCS 會因目標屬性(包括尺寸、方向、形狀、入射角、結構和材料等)的不同而產生數量級的變化,但所提出的簡單模型包含一個僅取決于艦船長度的平均值,而忽略了所有其他因素。
未來的下一代系統將面臨更嚴格的要求,例如,DND/CAF 最新版本的《天基監視要求文件》(SBS-RD)中[要求 400.7]規定的對小至 5 米的船只的探測。SBS-RD 正式確定了未來天基監視系統的設計和開發所需的 UNCLASSIFIED 監視要求,代表了整個 CAF 的業務和職能當局所確定的需求,為繼續研究和開發(R&D)提供了信息,并旨在影響未來任務中實施的設計。然而,對于此類小型艦艇而言,簡單的模型無法移植到其他同頻或異頻雷達上,而且任何射頻(RF)都不存在可靠的 RCS 模型。文獻[3]首次嘗試將文獻[1]中的簡單模型適用于 5 至 15 米的小型船只,但仍然只考慮了船只的長度。
本科學報告中的工作旨在向更復雜的 RCS 模型邁出一步,該模型包含多個相關的目標屬性,可用于行業設計符合更嚴格要求的特定 SDM,并評估小型船只的探測性能。這種 RCS 模型可用于可靠地預測未來雷達傳感器的性能和針對小型船只探測進行優化的模式,例如,為 DND/CAF 主要資本國防空間監視增強項目(DESSP)所設想的模式。
本報告介紹了美國陸軍研究實驗室內容理解處的研究人員在 2023 財年為采用增強型戰術推理(ETI)框架所做的工作。ETI 的開發旨在支持多智能體環境(數據源智能體、推理模型智能體和決策者智能體)中人工推理研究的實驗和演示。在本報告中,ETI 被用于在跨現實環境中演示基于不確定性的決策推薦功能。從模擬場景的數據開始,再加上額外的外部環境,ETI 智能體對態勢感知信息中的不確定性進行推理,為決策者提供建議選擇。最后,ETI 的產品被轉化為跨現實可視化,以探索新的人機交互模式。
增強戰術推理(ETI)框架的設計和創建是為了支持人工推理研究的實驗和演示。ETI 目前的結構包括三個主要智能體:數據源智能體、推理模型智能體和決策者智能體。數據源智能體分為幾大類:信息(圖像、音頻、文本)、設備、網絡和可視化。數據源智能體可以捕獲數據并將數據傳輸給其他智能體。其他信息系統也可以向這些智能體提供數據。推理模型智能體執行不同方面和不同層次的推理。推理智能體的輸出將有助于生成建議的決策。決策者智能體負責做出最終決策。這些 ETI 智能體可以是模塊化的,允許串行或并行處理,以及獨立或相互依存。在這項工作中,ETI 發揮著決策輔助工具的作用。主要的推理模型是信息不確定性(UoI)模塊。該 UoI 模塊可在決策建議中考慮任何信息的不確定性。ETI 的另一項功能是實現與人類的互動,包括未來的可視化和協作環境。我們在跨現實(XR)環境--運籌、研究與分析加速用戶推理(AURORA)中進行了演示。與 AURORA 等系統集成后,可以探索智能系統與人類交互的新模式。在本報告中,將詳細介紹我們的演示開發過程,包括將模擬環境中的數據映射到可視化環境中,將決策點和 ETI 建議納入行動方案中,以及用 "假設 "情況來增強場景,以探索基于推理的框架的影響。
這項研究的目標是開發、整合和演示基于推理的決策框架。ETI 框架的決策建議被用于師演習訓練和審查系統(DXTRS)中的模擬場景,并在 XR 環境 AURORA 中實現可視化。下文將介紹 DXTRS、場景和 AURORA 可視化的背景情況。
在該場景中,藍軍(BLUFOR)的目標是向東推進,穿過阿塞拜疆名為阿格達姆區的地區,同時與部署在河東的對方部隊(OPFOR)交戰并將其消滅。(見圖 1)
隨著任務的展開,BLUFOR 將遇到一條阻礙他們前進的河流,他們需要在那里進行濕空隙穿越。(見圖 2)
為了探索可視化和與 ETI 的交互,DXTRS 場景和相關的 ETI 推理信息在 XR 環境中顯示。該環境由美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)開發,名為 AURORA。AURORA 為安全、聯網、多設備跨現實信息調解和交互提供了一個通用作戰框架。為了便于可視化,將場景數據集合映射為 AURORA 可以處理的目標光標(CoT)信息。本報告第 3 部分將詳細解釋映射過程。圖 3 和圖 4 顯示了AURORA環境中的場景截圖。
如前所述,ETI 的設計是利用各種推理模型作為模塊,允許不同的推理配置。本次工作的推理模型是用戶體驗模塊。UoI 的概念包括產生或捕捉一個值,并用描述符對不確定值進行分類。這為決策者提供了不確定性的上下文信息,并支持對由此產生的建議進行推理。描述符基于格申論文中提出的不完全信息的性質。目前,該分類法包括不一致、損壞、不連貫、不完整、不精確、復雜和可疑。它們共同描述了特定信息源不確定性的原因和類型。
當前版本的UoI表達式是一個加權和,如式1所示。
公式 1. UoI 計算,其中 dp 為決策點,D 為變量,表示可能是任務關鍵因素的決策組成部分,W 為與這些組成部分的重要性相關的權重,T 為分類權重類別(相當于 G),S 為數據來源類別。UoI 值表示數據源和因素對所分類的不確定性的貢獻。
以下是分類法中七個術語的描述:
本報告描述了Draper團隊作為DARPA能力感知機器學習(CAML)項目的一部分,根據HR0011-20-C-0032號合同所開展的研究。Draper與分包商UT Austin、ASU和CU Boulder合作,開發了ALPACA(能力感知的概率和抽象自主學習),這是一個能力感知自主智能體的一般框架,特別是那些基于強化學習(RL)的智能體。ALPACA提供了對RL智能體能力的洞察力,并使用戶能夠檢查和約束智能體行為,促進與人類隊友建立信任,并極大地提高現實世界應用的安全性。
一個支持ALPACA的自主智能體可以:
ALPACA通過兩種方式進行能力交流:
1.一般能力聲明描述了以前觀察到的智能體的策略、性能和行為狀況。
2.具體的能力評估預測智能體在特定場景下的策略和表現,包括任務前和在線的情況。這些評估對用戶的興趣有反應,可以解決新的場景,并且可以在線更新。
為了實現DARPA CAML計劃的目標,Draper ALPACA團隊開發了以下關鍵技術進展:
Draper ALPACA團隊在兩個基于模擬的RL應用系統上研究、演示和評估了這些進展:推土機機器人操縱任務和多變天氣下的無人機飛行任務。內部和第三方的核查和驗證表明,該團隊能夠實現DARPA為CAML項目制定的所有目標指標。
本報告是在 FA9453-19-1-0078 資助下編寫的。首先,提出了兩種數值方法來解決通信和導航中產生的非線性優化問題。其次,開發了兩個關于機器學習模型的解決方案質量和安全性的結果。
該研究項目的目標是開發高效的大規模非線性優化算法,以解決通信和導航方面的數據分析問題。這些問題被公認為在數學上具有挑戰性,并與空軍的利益直接相關。
在資助期間,我們成功研究了兩個研究方向。首先,我們設計了大規模非線性優化問題的最佳一階方法。在這個方向上,我們提出了兩個一階方法,可以對決策變量進行近似梯度更新。這兩種方法都可以解決分散通信的多Agent優化所產生的非線性優化問題。通過將多代理優化重新表述為約束性問題,我們開發的方法可以以最佳梯度/操作者評估復雜度來解決問題。我們開發的方法也可用于解決圖像重建問題。
第二,我們分析了機器學習模型中的解決方案質量和安全問題。在這個方向上,我們完成了兩個研究結果。我們的第一個成果是關于在多集群環境下,從二元結果的條件邏輯回歸模型中計算出來的估計值的屬性。我們表明,當每個單獨的數據點被無限次復制時,來自該模型的條件最大似然估計值漸進地接近最大似然估計值。我們的第二個結果是關于安全的矩陣乘法問題,我們設計了一種準確和安全地進行分布式矩陣乘法的方法。我們的安全協議可以確保在進行這種矩陣乘法的通信過程中沒有任何信息被泄露。
機器人是一個具有挑戰性的領域,需要軟件和硬件的融合來完成所需的自主任務。任何工作流程的關鍵是在部署到生產環境之前對軟件進行自動構建和測試。本報告討論了美國陸軍作戰能力發展司令部陸軍研究實驗室(ARL)的無人自主車輛軟件研究平臺MAVericks的軟件開發過程中使用的持續集成/持續交付工具的重要性和創建情況。這個工具在ARL進行的快速研究和開發中起著至關重要的作用--包括模擬和嵌入式硬件目標的自動構建測試,以及驗證軟件在環模擬中的預期行為。
持續集成/持續交付(CI/CD)是軟件開發中常用的工具,用于自動構建、測試和部署代碼。這個工具對于提高研究的速度和效率至關重要,同時確保在增加或改變新功能時功能不受阻礙。在CI/CD之前,軟件開發過程是具有挑戰性的,隨著越來越多的合作者修改代碼庫,任何新的開發都有可能破壞現有的功能--比如代碼不再構建,自主行為和故障保護裝置不再按預期工作。
本報告重點關注美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)的MAVericks無人自主飛行器(UAV)軟件平臺的CI/CD集成,該平臺建立在開源平臺ROS2和PX4之上。ROS2是一套用于構建機器人應用的軟件庫和工具,而PX4是一個強大的無人機飛行控制軟件。利用這兩個平臺,MAVericks是一個專注于敏捷飛行的大型合作項目,在模擬和機器人平臺上都能發揮作用。MAVericks的目標是在ModalAI的VOXL和RB5硬件平臺上運行,因為它提供了尺寸、重量和功率,同時也是藍色無人機項目的合作伙伴,這意味著他們得到了國防創新部門的資助,以符合2020年國防授權法第848條的規定。
合作者包括美國軍事學院的西點軍校,作為分布式和協作式智能系統和技術項目的一部分;加州大學伯克利分校,作為規模化和穩健的自治項目的一部分;以及馬里蘭大學的人工智能和多代理系統的自治項目--而且這個名單一直在增加。此外,ARL一直在尋求提高其算法的穩健性和成熟的能力,以過渡到DEVCOM和國防部的其他組織。隨著許多合作者加入MAVericks,重要的是要確保每次修改后有最低限度的可用功能,以鼓勵快速加入和貢獻。MAVericks是一個由一百多個軟件包組成的大型研究平臺,重要的是每個軟件包都能可靠地構建和運行。通常情況下,合作者只關心幾個軟件包,他們可以很容易地進行修改和添加,而不需要對不相關的問題進行排查,這一點至關重要。由于這種不斷增長的社區,很容易偶然地引入錯誤或破壞不相關的功能。因此,CI/CD是一個很好的解決方案,它將為不同的用戶群體提高平臺的可靠性和可用性。
CI/CD管道實現了許多簡化開發的功能。它可以完全構建整個平臺,確保新用戶的依賴性安裝成功,在模擬環境中運行和測試平臺,以確保自主行為正常工作,并快速構建壓縮的工作空間,以防止在無人機上構建。
在自主系統的軟件開發中,一個有問題的情況是,用戶修改了幾個包,但只構建和測試了一個特定包。這樣,代碼就被合并到了生產中,而沒有驗證它對其他人是否有效。如果未經測試的修改被合并,依賴這些修改的包可能不再構建或通過所有的測試案例。
從用戶的角度來看,CI/CD是由用戶創建代碼合并請求(MR)來觸發的,將他們的修改添加到主分支。這就啟動了CI/CD,建立了一個管道。該管道包括四個階段:構建-依賴、構建-完整、測試和部署。對于每個階段,可以并行地運行多個作業來完成該階段。在每個作業中,流水線首先將合并后的變化復制到一個新的環境中,并完成一個特定的任務。在流水線的最后,一個完全構建的版本被上傳,并準備在無人機上閃現。如果任何步驟失敗,其余的管道階段將被中止,并通知用戶到底是什么地方出了問題,以便他們能夠解決任何問題。管線的概述見圖1。
在本報告中,描述了MAVericks CI/CD的基礎,然后詳細介紹了管道中的每個階段,以及所克服的幾個挑戰。
由于無人駕駛系統(包括無人機、自動駕駛汽車、倉庫機器人等)的增長和前景,多Agent路徑尋找(MAPF)是一項重要性迅速擴大的挑戰,也是一項受益于新型計算技術的挑戰。
本案例研究的工作是在有限的時間窗口內測試不同的技術來解決MAPF問題。主要結論是MemComputing公司開發的虛擬記憶計算機(VMM)在競爭中優于專門為MAPF問題類開發的基于A*的CBS搜索算法,以及更多的整數線性規劃問題的通用求解器,如CPLEX。正如預期的那樣,CPLEX的表現比CBS差,因為CBS是一種解決MAPF問題的專門方法。這些結果表明,VMM,也就是MemComputing,很適合有效地解決MAPF這樣的組合優化問題。
隨著問題規模的擴大,VMM的加速度也在增加。VMM是唯一能找到所有20個Agent方案和大部分30個Agent方案的解決方案的求解器,也是唯一能找到40個Agent方案的求解器。作為一個通用的ILP求解器,VMM更加靈活,能夠擴大MAPF問題的范圍。使用更長的運行時間(超過10分鐘)將使VMM能夠繼續改進其結果。
一句話。這些發現支持將MemComputing概念,包括VMM,應用于多Agent人工智能優化應用的優勢。
進一步思考:雖然沒有包括在這個案例研究中,但MemComputing解決方案可以進一步加速。例如,我們已經探索了MAPF問題的非線性類型的實現,我們估計可以在VMM上提供超過100倍的加速。最終,MAPF問題最好在VMM上運行,在FPGA上實現,或者最好是基于MemComputing的特定應用集成電路(ASIC)。在幕后,VMM是對電子電路的模擬,因此,將VMM一直發展到專門的ASIC是我們的產品路線圖。一個MemComputing ASIC將為幾乎不確定規模的MAPF問題提供一個接近實時的解決方案。
由于技術的進步和創新應用,人工智能(AI)正在迅速發展。從虛擬助手到自動駕駛汽車,人工智能正在被部署到幾乎每一個行業。然而,在開發先進的人工智能方面仍然存在著巨大的計算挑戰。
一個被充分研究的問題被稱為多Agent路徑尋找(MAPF)問題[1]。MAPF問題支持倉庫自動化、交通優化、包裹運送、機器人和自主車輛的應用。Agent通常指的是移動自主系統,如無人機、機器人或其他自主車輛。這個問題的目標是尋找路徑,使許多Agent能夠安全有效地從各自的起始位置同時導航到各自的目的地。此外,這些Agent必須不阻擋、不碰撞或以其他方式相互干擾,而且它們的路徑必須是最優的,這使得這個問題在計算上具有挑戰性。以最優或接近最優的方式解決這個問題有巨大的好處,因為它將提高運行效率和節省大量成本,從而推動戰略競爭優勢。
像亞馬遜和阿里巴巴這樣的全球電子商務巨頭在他們的自動化倉庫中每天都面臨著MAPF問題,機器人在其中發揮了關鍵作用。機器人每周7天每天24小時運行,自動執行客戶履約任務,如在他們的大型倉庫中揀選、運輸和放置貨物,這些倉庫有許多城市街區大小。
在這個案例研究中,我們展示了我們基于云的虛擬計算機(VMM)是如何為洛克希德-馬丁公司解決一個復雜的MAPF問題的,該公司是世界上最大的航空航天和國防承包商之一。該用例的靈感來自于假設Agent是一群無人機,每架無人機都有自己的特定任務。然而,無論Agent的類型或目的如何,該問題都廣泛適用。
由于這個問題的難解性[2],目前的方法,甚至是亞馬遜和阿里巴巴使用的方法,都依賴于只能提供近似解決方案的啟發式方法。然而,近似值會導致Agent必須采取回避行動來避免彼此,或者在某些情況下會一直陷入僵局的情況。這肯定會導致災難的發生。在這里,我們將展示如何使用我們的VMM在戰術上相關的時間范圍內解決這個問題和類似的問題。
對于這個案例研究,我們解決多Agent路徑尋找(MAPF)問題[1],并考慮到Agent可以是無人機群。從空中偵察到破壞敵方通信,甚至與敵方部隊交戰,戰斗管理者非常需要開發先進的無人機群技術。無人機的協調規劃和規模分配可以帶來顯著的作戰優勢,并大大增強作戰人員的能力。
讓我們回顧一下MAPF問題的基本原理,以及為什么它如此難以解決。同樣,目標是為環境中的多個Agent找到飛行計劃,而不互相干擾,同時為每個無人機提供最佳路徑。
行進的地圖由一個圖來描述。例如,一個二維地圖可以被編碼為一個二維網格,其邊緣連接最近的鄰居,沿心線有四個連接,如果包括對角線路徑,則有八個連接。每條邊都可能有一個相關的穿越成本。通常情況下,這個成本是旅行時間,但也可以是為任務定義的其他成本。
為了給一組Agent找到一個可行的解決方案,我們必須考慮在規劃期間可能出現的沖突。如果任何兩個單一代理人的計劃之間沒有沖突,那么MAPF解決方案被認為是有效的。在本案例研究中,我們考慮了一些潛在的沖突:
額外的沖突可以很容易地被添加到模型中,例如:
多Agent尋路是一個組合優化問題。也就是說,當Agent數量線性增加時,避免碰撞的復雜性可以比多項式地增長[2,3]。下一節將描述MAPF問題的一個簡單示例。
為了讓大家了解這個問題的難度,讓我們考慮在一張小地圖上只有兩個Agent。必須為Agent1和Agent2找到最佳路徑,以便從他們的起始位置移動到他們的目的地。他們每個Agent都有許多可能的路線來到達目的地。因為兩者必須避免相互沖突,一個Agent的路線選擇取決于另一個Agent的路線選擇,此外,不能假設Agent在地圖上以最短路徑線性移動。
該案例研究是由洛克希德-馬丁公司和MemComputing公司合作進行的。洛克希德-馬丁公司的科學家是使用優化和專門算法處理MAPF問題的專家。他們在內部應用的開發和測試以及一些學術研究項目方面有很長的歷史。