普渡大學團隊的提案只針對技術領域(TA)1,該領域側重于使用機器學習模型檢測社會工程信息。普渡大學團隊加入了由伯克利大學和密歇根大學領導的團隊,組成了學習自動抵御社會工程(LASER)團隊。普渡團隊開發了針對社會工程電子郵件的分類模型訓練技術,并參與了模擬運行和評估。共開發了三個模型。兩個模型分析主題和正文中的文本。一個詞頻-反向文檔頻率(TF-IDF)模型使用標準的詞頻信息。第二個模型從文本中提取動機特征,以識別信息作者的意圖(如獲取信息、訪問社交網絡)。第三個模型是知識和圖模型,從發送者和接收者信息中提取相關特征。集合模型匯總了三個模型的輸出結果以進行預測,由邏輯回歸模型和神經網絡(NN)模型組成。該團隊對不同的模型、訓練技術及其對準確性的影響進行了廣泛的探索。
異常檢測對于許多不同的使用案例都至關重要,例如識別安全隱患以防止潛在災難的發生。開發人類-機器人團隊提出有針對性問題的能力對于快速識別違反協議的情況并迅速采取行動糾正這種情況至關重要。在本報告中,試驗了如何利用視覺問題解答算法和一組精心設計的問題來檢測虛擬制造空間和真實世界小巷中的異常情況。我們的探索結果表明,與隨機基線相比,該算法的性能有所提高,還討論了未來工作面臨的挑戰。
圖 1 兩種視覺刺激:虛擬創客空間(左)和現實世界的小巷(右)。向 VQA 提出的問題是 "滅火器周圍是否有任何東西阻擋地面?"VQA 對兩個刺激分別做出了 "是 "和 "否 "的正確回答。
由人類引導的機器人探索有助于在偏遠地區收集信息,特別是那些由于危險條件或自然災害而可能過于危險、荒涼或人類無法進入的地區。現場條件可能是未知的,而且在不斷變化;因此,讓機器人對不斷變化的情況進行可視化監控和報告,將有助于人類伙伴決定機器人下一步應采取什么行動或進一步調查什么。當某一場景違反安全協議或預期時,具有自動檢測功能的機器人或許能實現這一目標。
之前的研究已經在單個實體層面(如一塊布料上的一個洞)、與特定任務相關的場景層面(如自動駕駛汽車的避障)和事件層面(如視頻過程中的意外移動)對異常情況的檢測進行了探索。我們將我們的工作置于場景層面,并在人類-機器人團隊中加入了異常檢測的互動元素。
在本報告中,我們圍繞安全協議和隨后的違規檢測設計了一種視覺場景分析范例。我們收集有關特定領域預期(創客空間安全協議)的背景知識,然后向系統提出有關環境快照的問題,以評估其是否異常。我們的方法將視覺問題解答(VQA)算法的最新進展應用于視覺感官異常檢測的重點研究。我們為研究確定了兩組視覺刺激:一組是虛擬創客空間,我們操縱它違反我們策劃的安全協議;另一組是現實世界中的小巷,它顯示出異常的配置和屬性。兩個領域、問題和 VQA 答案如圖 1 所示。
在這項工作中,提出了以下研究問題: 提出有針對性的問題是否能比要求對圖像進行一般描述(例如,從圖像標題算法中)更準確地識別和評估視覺異常?
貢獻如下: 1) 從安全協議中設計了異常分類,以指導環境設計和 VQA 算法的提問路線;2) 評估了最先進的 VQA 在非典型和非領域環境中的表現。在概念驗證實驗中,以 VQA 為目標的提問方法對創客空間圖像中的異常情況的準確率達到了 70%,而使用標題生成和純描述基線的隨機性為 50%,準確率為 0%。討論了通過提問來評估異常情況的潛力,并介紹了擴大測試規模的未來工作。
該項目是為了支持美國國防部高級研究計劃局(DARPA)的 "開放世界新奇事物的人工智能與學習科學"(SAIL-ON)計劃。在第二階段基期工作中,我們推進了第一階段 TALONS 框架的理論和實施,并收集了智能體在新奇事物生成器生成的新奇事物上的基線性能的初步實證結果。在第二階段的選擇階段,我們將基礎階段的工作擴展到更廣泛的新奇事物生成和實施形式。
這項工作的主要成果包括:完成了新奇事物生成器的開發;對來自 3 個不同 SAIL-ON TA1 團隊的新奇事物進行了性能分析;開發了自動且可最大程度減少人為偏差的新奇事物生成與實施流程;將我們的新奇事物生成流程應用于 Monopoly、Vizdoom 和 Blocksworld 領域,從而證明我們的新奇事物生成器與領域無關;以及為 SAIL-ON 計劃提供支持。下面的項目總結和后續報告將更詳細地介紹這些成就。
目前最先進的人工智能可以在已知已知甚至未知的情況下穩健運行。然而,人工智能仍無法可靠地檢測、描述和適應開放世界中的新奇事物。隨著研究界不斷努力實現先進的自主性,我們需要有科學依據的方法來評估人工智能體在開放世界環境中的表現。
PacMar Technologies(PMT)和 Parallax 高級研究公司開發了一套獨立于領域的理論、原則性技術和軟件工具,用于生成、描述和評估新穎性。這些理論和技術涵蓋了與領域無關的新穎性。在合同基期內,我們開發了一個測試平臺,用于評估智能體在自動駕駛汽車領域對新奇事物的反應性能,我們還在南加州大學 SAIL-ON 團隊提供的大富翁領域中實施了由我們的軟件工具自動生成的新奇事物。
我們的新奇事物生成器方法使用原則性技術自動生成新奇場景。這些場景被加載到模擬環境中,與給定的第三方人工智能體對接,以收集該智能體的性能數據。然后評估智能體在各種不同情況下處理各類新奇事物的能力。
我們將新奇定義為環境中的變化。簡而言之,變化可以是過渡函數的變化,也可以是狀態空間的變化。我們的方法有能力在過渡函數(包括行動和事件)、狀態空間定義和觀察函數中生成新穎性。精確生成新穎性的計算方法可分為兩種類型的轉換,其方式與創造性系統框架(Wiggins,2006 年)一致。我們方法的關鍵在于從八個維度對新穎性進行表征,從而支持將情景生成的重點放在可能挑戰智能體魯棒性的情況上。
我們的方法目標如下
1.為新奇性的特征描述奠定科學基礎。 2.開發生成可用于評估智能體的新情景的技術。 3.確定這些技術的可行性及其在各領域的適用性。
本報告旨在清晰地描述我們的方法,包括新穎性生成、模擬和評估的方法。將我們的方法應用于 CARLA 的自動駕駛汽車領域、Monopoly、VizDoom 和海洋領域,有助于進一步發展理論和測試平臺軟件。最后,我們對本報告進行了總結,并提出了進一步研究的思考和啟示。
在第一階段的工作中,我們開發了一個基于新穎性多維表征的新穎情景生成框架。我們正式規定了這一多維表征、收集受測智能體數據的指標,以及評估智能體對不同類型新穎性的魯棒性的方法。在使用轉換生成新穎性的過程中,我們定義了 24 個函數簽名,并計算了應用這些簽名生成新穎性的上限復雜度。我們的研究表明,根據我們對新穎性的多維表征,使用這兩種類型的變換來改變場景生成,我們能夠顯著減少新穎場景的空間。為了支持新穎性的精確生成,我們構思了 TALONS 模擬器抽象語言(T-SAL)來描述環境和這些環境中的各個場景。我們利用這些概念來支持第三方智能體對新奇事物的魯棒性評估。
在第二階段基期工作中,我們推進了 TALONS 框架的理論和實施,并收集了智能體在新奇事物生成器生成的新奇事物上的基線性能的初步實證結果。我們制作了三個源代碼庫,詳見基礎階段最終報告,其中包含以下內容的實現:(1) TSAL 語言;(2) 新穎性生成器(實現 R 變換);(3) 使用 CARLA 自動駕駛汽車模擬器的評估框架。從理論角度來看,我們利用第一階段工作中開發的新穎性維度理論對新穎性進行了初步分析研究,并正式定義了 R 變換,然后利用這些定義正式定義了新穎性層次結構級別。
我們在第二階段選擇期內做出的獨特貢獻包括以下內容:
威斯康星大學(UW)在 2017 年 6 月至 2021 年 5 月期間得到了國土安全部(DHS)網絡風險與信任政策和分析信息市場(IMPACT)計劃的支持。技術專題領域 #1 數據提供者 (DP) 和 #2 決策分析即服務 (DASP) 的研發工作已經完成。這些活動的方法是從網絡協議棧的不同層收集和組合數據集,以提供關于網絡安全風險、降低風險的機會、用戶行為以及網絡安全研究和企業所有者和運營商感興趣的事件的取證調查的獨特和重要的視角。
我們的數據提供商活動主要集中在擴展和增強互聯網 Atlas 存儲庫和門戶網站上,這些存儲庫和門戶網站最初是在上一代 IMPACT 計劃/防御網絡威脅基礎設施保護存儲庫 (PREDICT) 計劃期間開發的(參見第 8 節中的參考文獻 #22)。除 Internet Atlas 外,威斯康星大學還開發并分發了其他幾個數據集,包括 DShield 入侵檢測系統 (IDS)/ 防火墻日志、邊界網關協議 (BGP) 更新日志、網絡時間服務器日志和網絡抓取日志。
我們的 "決策分析即服務"(decision-analytics-as-a-service)工作重點是開發基于網絡時間協議(NTP)數據實時識別互聯網事件(包括中斷、攻擊、路由變化等)的能力,這些數據是從 14 臺 NTP 服務器收集的,它們在整個執行期間提供數據。我們還致力于開發各種方法和工具,將協議棧不同層的數據融合在一起,以深入了解性能、連接性和風險,這在其他情況下是不可能實現的。我們還花費大量時間開發了一個系統,用于從愿意提供數據的用戶那里收集網絡瀏覽數據。我們與威斯康星大學機構審查委員會 (IRB) 和法律部門合作,確保這些活動獲得適當授權。
在執行期間,我們向研究界分發了數百個數據集。在 17 年 6 月至 21 年 5 月期間,互聯網 Atlas 門戶網站的頁面訪問量超過 2.7 萬次,來自世界各地的獨立訪客超過 1.6 萬人。提供了 21 個詳細訪問 Atlas 的賬戶。同期,根據通過 IMPACT 門戶網站(impactcybertrust.org)提出的請求,提供了 117 個數據集(主要是互聯網長途基礎設施數據)。
除了分發數據集和開發決策分析即服務功能外,我們的研究工作還在高質量刊物上發表了 15 篇論文,2 篇論文已發布到 arxiv.org 公共檔案庫并將提交發表,另有 4 篇手稿正在準備中,不久將提交發表。這些正在準備的論文的主題包括:域名系統(DNS)的實證分析、基于端到端延遲測量的互聯網連接識別新方法、停電對美國互聯網客戶端可用性的影響分析以及互聯網路由超圖的地理定位方法。第 8 節提供了該資助項目發表的論文、arXiv 論文和正在準備的論文的完整清單。我們還做了 25 場與這些研究論文和數據集相關的技術演講。最后,我們的互聯網地圖集及相關地圖和研究成果已成為技術和大眾媒體上眾多文章的主題。
本資料基于國土安全部和空軍研究實驗室 (AFRL) 贊助的研究,協議編號為 FA8750-18-2-0036。
圖 1:BigBen 的系統架構。測量組件位于每個提供數據的遠程 NTP 服務器上,其余組件在云基礎設施中運行。(csv - 逗號分隔值,OWD - 單向延遲,RPCA - 強健主成分分析,API - 應用程序編程接口)
本最終技術報告總結了 2018 年 9 月至 2022 年 9 月期間 AFRL 項目 "嵌入式深度學習和高級計算 "的研發工作。該項目涉及兩個重要的技術趨勢:使用深度神經網絡(DNN)的深度學習正迅速成為許多機器學習應用的首選方法,而網絡邊緣的嵌入式設備正變得越來越廣泛。通過這兩種技術的融合,我們可以看到新一代嵌入式設備的出現,它們可以執行智能任務,如學習未知環境和感興趣的目標、周圍環境的三維映射、執行數據分析以及根據本地數據進行預測。這些設備構成了所謂的人工智能物聯網(AIoT)[1]。
本研究項目研究的基礎技術可促進未來嵌入式深度學習的高效訓練和推理計算系統。研究的主要方法包括 (1) 使用隨機舍入的可變精度分塊浮點;(2) 采用術語量化,將浮點數量化為 2 次冪術語,而不是傳統的均勻量化;(3) 使用特定領域詞匯對預訓練語言模型進行調整;(4) 通過使用恒定帶寬塊的調度最大限度地減少內存訪問;(5) 在算法的協同設計中應用全棧優化、 (6) 為可穿戴計算拆分神經網絡,(7) 設計用于檢測輸入到 DNN 的非分布式輸入的算法,(8) 為高效的 DNN 系統陣列實現打包稀疏 DNN,(9) 為 DNN 的 3DIC 實現設計內存邏輯架構和系統構建模塊,以及 (10) 在內存計算中利用位級稀疏性。
卷積神經網絡(CNN)等深度神經網絡(DNN)實現了深度學習。它們具有多層非線性特征轉換,每增加一層就能提取出越來越好的特征。然而,訓練一個大型 DNN 并在這樣的網絡上執行推理需要耗費大量的時間和精力。對于大型語言模型(LLM)和生成式對抗網絡(GAN)等大型深度網絡來說,訓練成本很高。由于小型人工智能物聯網(AIoT)設備在處理能力、內存占用和功耗預算方面存在嚴格的資源限制,因此在這些設備上進行訓練和推理更具挑戰性。有必要共同設計算法、模型和硬件參數,以便在這些嵌入式設備上執行高效的訓練和推理。在為嵌入式設備訓練復雜的深度模型時,并行處理、管理內存訪問時間表和利用數據稀疏性等高級計算技術至關重要。
本項目旨在針對嵌入式深度學習和推理中的關鍵挑戰開展廣泛研究。例如,我們探索了嵌入式深度學習與基于并行和分布式計算的高級計算之間的相互作用。該項目利用了 PI 在相關領域的經驗,包括他早期在系統陣列以及分布式和嵌入式神經網絡架構方面的工作。我們將在本報告的其余部分重點介紹我們已發表的部分成果。
這個項目的主要目標是為無人駕駛飛行器(UAVs)設計、開發和制作一個自動化和自組織控制框架的原型。通過結合軟化和抽象原則、優化和人工智能(AI)成功地實現了目標,能夠開發出一個原型,能夠理解網絡操作者的目標,適應網絡參數和功能,以應對不斷變化的環境條件并保證高性能。
智能無人駕駛飛行器(UAVs)作為提供新功能、擴展無線網絡基礎設施和使網絡更靈活的工具,已經獲得了發展勢頭[1-4]。由于其獨特的特點,如快速部署、高機動性、處理能力和縮小的尺寸,無人機是未來眾多無線應用的一項有利技術。其中,增加網絡覆蓋面和為用戶提供情境感知的網絡服務是顯著的例子。
盡管有上述優勢,但如何部署能夠自適應和自組織的無人機群,以提供可靠、高性能和無處不在的服務并不是一件容易的事。事實上,網絡的無線和分布式性質使無人機暴露在干擾、障礙物和不斷變化的信道條件下,可能會對網絡運行產生負面影響(或者在最壞的情況下完全阻止)。這些挑戰在成功取決于無人機、移動終端用戶、基站、運營中心等之間無線通信的可靠性和效率的應用中更為重要。在這個項目中,我們通過設計、開發和原型驗證SwarmControl,推進了無人機網絡群的技術水平,這是一個新的軟件定義的無人機群控制框架,其目標是實現網絡操作的自動和智能重新配置,以保證高性能并適應不斷變化的網絡條件。SwarmControl結合了各種優化和數據驅動工具、軟件定義無線電(SDR)和分布式網絡控制原則,為網絡操作者提供了一個統一的網絡和飛行控制功能的抽象。有了SwarmControl,操作員可以通過在一個集中的抽象上指定無人機網絡的高級控制指令和要求來定義和實施復雜的網絡控制問題。SwarmControl(i)構建網絡操作員指令的網絡控制問題表示;(ii)將其分解為一組分布式子問題;以及(iii)自動生成數據驅動和分布式優化解決方案算法,在各個無人機上執行。
在下文中,我們將詳細介紹我們在該項目中所進行的研究活動,具體重點是描述SwarmControl從基于優化的框架[2-4]到數據驅動的框架[3]的演變,強調我們的原型設計工作和相應的實驗結果如何幫助我們證明其有效性。
這個項目在兩個不同的階段中發展。第一階段涉及基于模型的優化,其中無人機通過傳統的優化工具調整其位置和網絡功能[2,4,5]。第二階段則涉及優化工具被無模型人工智能解決方案所取代的研究活動,其中網絡的底層模型是由一組合作代理(即無人機)學習的,它們協調其移動性和網絡操作以滿足網絡操作者的目標[3]。
該項目第一階段開展的研究活動主要是為無人機群開發一個網絡操作系統,利用分解和分布式優化理論來實現網絡操作者的目標。為此,我們開發了圖1所示的系統。
該系統包括兩個關鍵部分:控制框架和無人機可編程協議棧(DPPS)。
如圖1所示,該組件負責(i)為網絡操作者提供控制接口,以指定所需的網絡行為;(ii)構建網絡操作者指令的數學網絡控制問題(NCP)表示;以及(iii)將NCP分解為一組獨立的子問題,并將其分配給各個無人機。
控制界面。與網絡操作者的互動是通過一個控制界面實現的。通過控制界面上的幾個輸入字符,網絡操作員可以指定所需的網絡行為、要實現的網絡協議和節點特定的約束。高層指令的例子包括通過最大化網絡吞吐量來提高網絡性能,通過最小化能源消耗來延長無人機網絡壽命,通過指定最小速率約束來確保QoS要求,以及覆蓋一個特定的空中空間,等等。控制接口為網絡操作者提供了一個無人機網絡的抽象,隱藏了低層網絡功能和底層網絡架構的細節,如無人機的數量以及它們的計算能力和電池水平等。通過SwarmControl,控制無人機網絡變得非常簡單,只需在預定義的控制模板中進行選擇,選擇首選的網絡協議,并指定單個節點的約束。
網絡控制問題的構建。一旦網絡控制問題被定義,SwarmControl將網絡操作員的指令和要求轉化為一組數學表達式,然后將其合并并重新排列成一個NCP。由此產生的NCP是網絡操作員通過控制接口定義的高級網絡行為的集中表示,它跨越了網絡和飛行控制領域,涉及多個節點和協議棧的所有層。
分布式解決方案算法生成。通過網絡控制問題構建得到的NCP的跨層性質以及其變量之間的耦合性,使得它很難以分布式方式計算出一個理想的解決方案。為了應對這一挑戰,SwarmControl采用了水平和垂直分解理論,將具有跨層和跨節點依賴關系的NCP解耦為一組分布式子問題,每個子問題只涉及一個網絡節點和協議棧的一個層。對于所產生的每個子問題,SwarmControl以自動化的方式生成一個分布式數字解決方案算法,然后將其轉發給各個無人機,并在網絡運行時根據本地網絡狀態信息執行。
無人機可編程協議棧(DPPS)。如圖1所示,DPPS安裝在每個單獨的無人機上,以分布式和自動化的方式解決從控制框架收到的數值解算法。DPPS跨越了網絡協議棧的所有層次,并與飛行控制器固件緊密互動。DPPS為復雜的跨層和跨域網絡協議的原型化提供了必要的構件和基元,允許在協議棧的所有層對網絡、傳感和運動參數進行完全控制。
SwarmControl DPPS接收將在各個無人機上執行的分布式數值解算法(如運動解算法、傳輸率解算法),并在其決策平面上運行,如圖2所示。這個平面有一個協議庫,包含不同網絡協議和運動策略的軟件實現(如TCP、Bellman-Ford路由算法),以及運行調度腳本的數學求解器。
決策平面監督分布式優化算法的實時運行,使用最新的網絡狀態和運動信息作為輸入參數(例如,噪音功率、隊列狀態、與其他無人機的距離)。這些信息從注冊平面檢索,注冊平面也被用來存儲計算的數值解決方案。DPPS在運行時根據計算出的數值解配置數據平面中包含的網絡和飛行控制操作參數(例如,根據優化的路由表改變當前無人機的位置,根據注入網絡的優化應用層速率配置TCP窗口大小)。
該平面實現了一個完全可編程和可重新配置的協議棧,橫跨所有網絡層和運動層,并通過SDR和飛行控制器驅動器與無線電和運動前端接口,如圖2下部所示。
數據平面對無線電前端(由軟件定義的無線電和運動前端實現)以及協議棧功能都有完全的控制權;它負責將實際的網絡狀態和無人機位置信息反饋給注冊平面。如圖2所示,網絡狀態信息和計算的數字解決方案都存儲在寄存器平面的專用查找表(LUT)中。
每個DPPS層在寄存器平面都有一個專門的網絡狀態LUT,用于存儲所有與層相關的網絡狀態參數(例如,物理層L1 LUT中的信號干擾加噪聲比(SINR)和鏈路容量;網絡層L3 LUT中的鄰居集合和它們的距離;運動層L0 LUT中的物理位置和附近的障礙物)。數值解決方案以類似的方式存儲在專用的數值解決方案LUT中,每個DPPS層一個(例如,傳輸層L4 LUT中的TCP窗口大小;網絡后期L3 LUT的路由表;物理層L1 LUT的位置)。
對SwarmControl進行評估的第一個挑戰是缺乏具有SDR的商用現成無人機平臺。為了解決這個問題,我們設計并建立了一個定制的無人機網絡節點平臺,稱為Dron-SDR,將Ettus Research通用軟件無線電外圍設備(USRP)B205mini-i SDR安裝在英特爾航空即興飛行無人機上,如圖3所示。
圖3 帶有SDR的SwarmControl原型:(左)原型的圖片;(右)結構
英特爾Aeros的飛行自主權超過20分鐘,輪轂到輪轂的對角線長度為360毫米,基座到頂部的高度為222毫米,具有高度的便攜性和可操作性。同樣,B205mini-i SDR是市場上最緊湊、最輕、最低功耗的SDR設備。英特爾航空容納了一塊計算板,提供足夠的計算能力來運行Ubuntu 16.04和SDR開發框架,如GNU Radio。飛行管理、電機控制和傳感器融合在直接連接到計算板的Pixhawk 4飛行控制單元(FCU)上進行。所有FCU的參數和命令(例如,遠程控制和傳感器讀數)都是通過MAVLink路由器的UDP通信來訪問。與傳統的無人機不同,SwarmControl無人機節點被賦予了一個DPPS運動層(圖3中的L0:運動),它承載了基于Pymavlink的控制實現,允許每個節點自主地執行飛行控制操作。
值得指出的是,SwarmControl完全依賴于開源軟件。具體來說,DPPS完全由高級腳本語言(即Python)實現,并在原生的Linux操作系統上運行,它與FCU和GNU Radio直接對接。這使得SwarmControl與所有基于MAVLink的可編程無人機接口(如Pymavlink、DroneKit)兼容。圖3顯示了Dron-SDR原型的概況、其結構和硬件設計。
在項目的第一階段,我們已經展示了SwarmControl如何通過優化理論提升網絡性能并利用自動化和分布式控制來適應當前的網絡條件。然而,第一代SwarmControl框架依賴于基于模型的優化,當環境過于復雜,無法用一個可行的模型來捕捉時,可能會導致不準確的近似。事實上,基于模型的優化方法的性能往往受到通過凸優化或類似技術解決無人機網絡控制問題所需的近似和放松的準確性以及所使用的信道網絡模型的準確性的限制。為了應對這些挑戰,該項目第二階段的重點是開發一個新的架構框架,以控制和優化基于無模型的深度強化學習(DRL)的無人機網絡。為了克服基于模型的優化的局限性,我們還開發了一個虛擬化的、"即用即飛 "的模擬環境,以生成訓練DRL算法所需的大量無線數據痕跡,這些數據在電池供電的無人機網絡上是很難生成和收集的。訓練環境將項目第一階段開發的DPPS與CORE/EMANE仿真工具結合起來,對無人機網絡進行精確仿真。
我們設計了一個由控制框架和DRL DPPS組成的兩層架構。網絡運營商使用控制框架來決定分布式無人機網絡的預期行為。我們的解決方案自動生成一組DRL代理(即一組神經網絡(NN)形式的政策),這些代理在控制框架內的虛擬環境中進行訓練。訓練完成后,NN配置經過測試并自動分發到各個網絡節點,在那里它們將被用來控制DRL DPPS中的網絡和運動參數。通過這種方式,各個無人機通過實時優化其網絡性能,分布式地實現網絡運營商的目標。
通過一次分配NN配置,并在網絡的邊緣節點執行所需的網絡控制政策,這種方法不會受到集中式控制系統所特有的陳舊信息檢索和延遲命令的影響。此外,由于使用了可編程的運動和射頻前端,擬議的基于NN的政策設想了飛行和無線網絡參數的全堆棧和跨層優化。
新開發的SwarmControl框架通過DRL解決了無人機網絡控制問題。我們考慮了一個多智能體的DRL方案,每個無人機都是一個不同的智能體,并在虛擬環境中為特定的飛行任務集體訓練復雜的無人機出動。訓練完成后,我們測試并向各個無人機分發適合任務的NN配置。這些用于計算網絡和運動策略,以通過適應動態網絡條件來實現網絡運營商的預期網絡行為。
與基于模型的優化相比,我們的數據驅動方法解決了不準確的建模表述和優化近似。與優化方法不同,DRL智能體不受優化求解器延遲的影響,可以以O(1)的復雜度推導出策略。
為了收集電池供電的無人機網絡的大量性能數據,我們開發了一個極具代表性的仿真虛擬環境。我們重新審視了第一階段開發的DPPS,并將其與深度強化學習(DRL)的功能相結合,將其稱為DRL DPPS。我們將DRL DPPS與CORE/EMANE仿真工具整合在一起,以獲得一個高保真的虛擬環境,同時捕捉到運動、無線信道和高層協議棧的互動。我們系統地使用我們的 "可飛行 "虛擬環境來收集大量高保真網絡性能數據。最終,這種整合工作產生了一個具有高度代表性的模擬環境,使我們能夠擴大學習時間,并以高度的真實性訓練我們的DRL智能體。
圖4報告了DRL無人機可編程協議棧(DRL DPPS)架構的概況。DRL DPPS用于單個無人機,在協議棧的所有層進行運動和無線操作,也用于控制框架的學習引擎,以訓練和測試特定任務目標的NN策略制定。在后者中,物理層和運動操作由虛擬化的CORE/EMANE環境執行,而在前者中,這些操作通過硬件運動和射頻前端實現。
通過在控制框架的學習引擎中采用整個DRL DPPS架構(不包括硬件前端),我們獲得了一個真實的模擬環境,這是我們高保真性能數據收集和有效的DRL訓練的關鍵。
我們對項目第一階段開發的DPPS進行了擴展,用新的DRL平面取代了決策平面,但仍保持其架構功能;以跨層的方式一次性優化網絡和運動控制參數。具體來說,控制邏輯是通過采用一種叫做Q-learning的DRL變體來實現的,其目的是優化我們試圖最大化的目標函數(即網絡運營商的目標)的估計值(稱為Q函數)。DRL采用的NN是一個深度Q網絡(DQN),它使用隨機梯度下降法(SGD)來近似Q函數。
本項目的主要貢獻之一是將DRL DPPS與CORE/EMANE仿真工具相結合。
這項整合工作的目標有兩個方面:
開發一個高保真仿真環境,捕捉實時無線信道現象(如路徑損耗、延遲傳播、干擾)和協議棧各層的網絡操作(如分組、分段、重傳、流量突發、處理延遲),這些都是很難或很昂貴的模型,只能在仿真中近似地進行;
為研究人員提供一個可重新配置的仿真工具,以設計不同的無人機網絡配置和拓撲結構,并大規模地收集高保真無人機網絡性能數據。這項工作是對收集電池供電的無人機網絡實驗性能數據的有效替代,因為后者既費時又費力。
同時,這個仿真工具可以在實驗實施前用于測試無人機網絡配置。
圖5說明了DRL DPPS和CORE/EMANE之間的架構整合。在控制框架的學習引擎中,虛擬訓練環境和虛擬測試環境都使用了相同的架構。此外,圖6描述了DRL智能體(即嵌入SwarmControl的DRL DPPS的無人機)之間的互動,其中我們展示了多個DRL代理如何與CORE/EMANE中模擬的同一環境進行互動。值得一提的是,盡管每個DRL智能體在一個單獨的容器中執行,但它們都通過所有DRL智能體共享的同一個CORE/EMANE容器進行交互。
這項研究的目的是討論目前最先進的在點云數據上執行的機器學習算法的方法。所進行的研究將應用于三維激光雷達可視化和開發(3DLIVE)團隊的內部工作,其主要目標是為目標坐標測量(TCM)創建一個可視化和與點云數據互動的新系統。所提出的機器學習方法與三維點云和計算機視覺的機器學習的三個主要課題有關,每個課題都有自己研究的論文部分。這些主題是分割、分類和目標檢測,所選的論文是最近的研究,取得了最先進的性能。這項研究的結果是選定的幾種方法,它們向3DLIVE團隊展示了最有希望的結果和有效性。有效性在很大程度上取決于算法對3DLIVE使用案例的可擴展性和適用性,以及其準確性和精確性。
在傳統的計算機視覺問題中,二維數據一直是用于推理的主要信息形式。隨著近來價格低廉且廣泛使用的3D傳感器(如蘋果深度相機、Kinect和飛行時間相機)的發展,3D數據已經變得非常豐富,并為解決計算機視覺問題提供了許多優勢。也就是說,它包含了更多的拓撲信息(深度維度、形狀和比例信息),這些信息對場景的理解至關重要,并提供了一個更自然的世界表現。由于這一技術層面的原因,將三維數據應用于自動駕駛、機器人、遙感和醫療等領域已經成為近期研究的重點,并將繼續擴展到其他領域[1]。
三維數據可以有很多格式,包括網格、深度圖像、體積網格和點云。場景理解應用中最常見的格式是點云-結構化數據,因為這種數據形式保留了三維空間中的原始幾何信息,沒有任何離散化損失。在進行分析之前,需要對點云進行定義:點云是一組數據點(x,y,z),通常代表一個(多個)三維物體的外表面,由合成或三維掃描器產生。三維數據面臨的一個挑戰是存儲要求--三維場景比二維的同一場景需要多出幾個數量級的存儲。點云解決了這個問題,因為它不需要存儲多邊形網格,因此提高了性能并降低了開銷--這是對時間敏感的應用的關鍵考慮[2]。
三維LiDAR可視化和開發(3DLIVE)項目旨在為目標坐標測量(TCM)和三維分析創建一個新系統。目前的TCM方法使用立體圖像,利用英偉達3D視覺眼鏡以及專門的GPU和顯示器來查看重疊的二維圖像,給人一種三維的感覺。然而,這種方法很難訓練,而且會造成眼睛疲勞;此外,它所使用的英偉達軟件和硬件已經達到了使用壽命的終點,不再得到支持或生產。因此,需要開發一種新的3D數據開發解決方案。
用于TCM的3DLIVE方法旨在利用主要由LiDAR傳感器收集的3D點云。然后使用游戲引擎Unity將這些數據可視化。此外,由于上述數據可以通過Octree格式有效地加載到Unity中,因此可以使用大規模的數據集。點的元數據信息可以在查看器中查看和分析,用戶可以在整個大的地理區域內導航并選擇點進行分析。有多種方法可以與數據互動,從在某一地點投放一個感興趣的點到測量距離、長度和面積。
有多種模式可以與3D點云數據互動。它們包括標準的鼠標和鍵盤、虛擬現實和增強現實(使用Hololens 2)。增強現實的互動是3DLIVE團隊的主要開發重點,因為它使用戶沉浸在數據中,同時仍然類似于立體眼鏡的方法。我們目前還在尋求使用機器學習(ML),使我們能夠自動獲得這些點云數據集中的物體信息,例如它們是什么物體,在空間內有什么界限,并進行自動目標識別(ATR)。
在過去的10-20年里,大多數深度學習計算機視覺研究都集中在2D圖像上,但隨著更多可用的3D數據的興起,最近的研究著眼于將傳統的深度學習技術應用于計算機視覺的3D數據。這項新的研究使得場景理解的場景有了重大的進展,但是在將模型從二維過渡到三維的過程中,仍然存在著一些障礙。具體到點云,數據是非結構化和無序的,這意味著以點云為輸入的深度學習網絡不能直接應用標準的深度學習方法,如卷積神經網絡(CNN)[1]。相反,必須開發定制的解決方案,使其具有包絡不變性,通常用對稱函數實現。另一個挑戰是從點云中捕捉局部和全局結構信息。通過單個點來評估點云會失去點與點之間的局部和整體結構信息,因此網絡在設計時必須通過查看鄰近的數據來考慮這一點。由于直接處理點云的困難,許多方法將點云數據轉化為一種中間格式,如將點云投影到二維圖像中,這樣就可以應用傳統的深度學習方法[1]。最后,從三維傳感器收集的點云數據并不完美--由于傳感器的局限性,采集設備的固有噪聲,以及被采集表面的反射性質,往往存在噪聲污染和異常值,會破壞數據采集[1]。從上面可以看出,在點云數據上應用深度學習方法并不簡單,需要對現有的技術進行重新設計,以便在網絡中使用,但是三維點云比二維數據的描述能力的提升超過了負面因素。
計算機視覺任務通常被分成3個不同的類別:分類、目標檢測和分割。對于點云,這些類別通常被定義為: 三維形狀分類,三維目標檢測和跟蹤,以及三維點云分割[1]。
三維形狀分類方法試圖通過首先學習每個點的嵌入,然后使用聚合方法從整個點云中提取一個全局形狀嵌入,來對點云中的物體進行分類(標記)。這個全局嵌入被輸入到幾個完全連接的層中以實現分類[1]。
三維目標檢測和跟蹤方法可以分為3類: 1)目標檢測,2)物體跟蹤,以及3)場景流估計。對于目標檢測方法,它們在每個檢測到的物體周圍為輸入的點云產生定向的三維邊界盒。接下來,三維物體跟蹤的目的是預測物體的狀態,因為它以前的狀態。與物體跟蹤相關的是三維場景流估計,即給定同一場景在兩個不同時刻的兩個點云,描述每個點從第一個點云到第二個點云的運動[1]。
與目標檢測和跟蹤一樣,三維點云的分割也可以根據所需的粒度分為三類。這些類別從最普遍到最不普遍:語義分割(場景級別)、實例分割(物體級別)和部分分割(部分級別)。給定一個點云,三維點云語義分割的目標是根據點的語義將點云分成幾個子集(例如,將場景中的所有椅子涂成相同的顏色)。更低一級的是三維點云實例分割,它比語義分割更具挑戰性,因為它需要對點進行更準確和精細的推理。實例分割不僅需要區分具有不同語義的點,還需要區分具有相同語義的獨立實例(例如,給每把椅子涂上不同的顏色,而不是所有椅子都是同一顏色)。最后,在最細微的層面上,部分分割試圖將具有相同語義的物體的各個部分分開(例如,給椅子的各個部分涂上不同的顏色),由于具有相同語義標簽的形狀部分具有較大的幾何變化和模糊性,因此這項任務特別困難[1]。
3DLIVE努力的目標之一是創建一個系統(利用機器學習),該系統接收一個地理區域的點云,將具有類似屬性的點分組為對象,并為每個組成對象和結構貼上標簽,使數據更容易使用和分析。在我們著手實現這些目標之前,我們確定研究當前點云數據集的分割和分類技術狀況將是有價值的。Guo等人在2019年完成了一項關于點云的深度學習方法的調查[1]。我們的目的是確認研究中提出的信息仍然是準確和相關的(針對點云數據集的ML是一個快速發展的領域),進行我們自己的研究并創建一個類似的調查,并決定在研究的分類、分割和目標檢測的方法中,哪些是最適合我們的使用案例的。AFRL RIEA/RIED內部研究小組(IHURT)被召集起來,與3DLIVE團隊一起做這項研究,并回答以下研究問題:
目前3D點云分割和分類的技術水平如何,哪些方法對3DLIVE的工作最有效?我們能否開始為我們打算使用的大規模三維城市點云的分割、分類和目標檢測奠定框架并制定行動方案?
這項研究的結果將使3DLIVE團隊能夠推進ML點云的分析工作。我們希望最終能復制出性能最高、最相關的分割、分類和目標檢測方法,并將其用于NGA地理空間存儲和數據管理(GRID)服務器的地理3D點云數據。此外,3DLIVE團隊已經開發了一種生成大規模合成城市點云數據集的方法,我們可以利用這種合成數據作為我們創建和使用的模型的額外訓練數據。這項研究將為3DLIVE團隊使用ML創建額外的工具來幫助作戰人員分析和衡量三維數據奠定基礎。這將最終實現上述目標,即創建一個新的TCM系統,供目標人員(如第363 ISR聯隊和其他目標部門的人員)使用,用一種利用越來越多的本地3D數據的替代技術取代目前已被淘汰的技術。
圖2. RPVNet的概述。它是一個具有多種交互作用的三分支網絡,其中體素分支和范圍分支共享類似的Unet架構,而點分支只利用每點的MLPs。
FAST項目(基于智能體的系統基礎技術)是一項為期三年的研究和開發工作,與位于紐約州羅馬的空軍研究實驗室簽訂合同。該項目從一開始就由美國海軍贊助,在項目的后期,美國空軍也做出了額外的貢獻。
該項目的主題是探索新的建模方法和基于模型的軟件生產技術,以提高所開發軟件的質量,同時縮短開發時間,提高設計的可重復使用性。在模型驅動的軟件和系統開發,以及海軍的任務工程有很大的相似性。傳統上,這兩個過程都是以自下而上的方式開發,而自上而下的方法則更有針對性和前景。這種自上而下的方法的最初步驟必須是一個概念模型,概述基于一組給定事實達到預期目標所需的所有(概念)決策。對于任務工程來說,這個決策建模器有助于確定所有需要做出的關鍵決策,以及相應的任務,以便規劃和執行一個成功的任務。對于軟件或系統工程師來說,決策建模器概述了設計中的系統的關鍵語義和相應結構。雖然存在對系統工程的建模支持,在某種程度上也存在對軟件工程的建模支持,但沒有任何工具支持將決策建模器作為系統或軟件設計模型的一個完全集成部分來建立。因此,由于其根源在于系統建模語言(SysML),任務工程也缺乏決策建模能力。
我們通過為統一建模語言(UML)建模工具MagicDraw(又名Cameo)開發決策建模器能力,作為一個可加載的插件,與商業上可用的插件,如SysML、UAF等兼容,縮小了這一差距。決策建模器實現了決策模型和符號OMG標準所定義的決策需求圖的增強型變體,但在其他方面偏離了OMG標準,以提供更復雜的決策表達建模、決策仿真能力,以及與SysML(v1.x)的無縫集成能力。為了在更大的仿真場景中進行協作,我們為MagicDraw開發了第二個插件(名為SimCom),允許決策建模器的仿真能力與外部仿真系統(如高級仿真、集成和建模框架(AFSIM))之間進行實時協作。SimCom插件實現了一個受 "高級架構"(HLA)仿真協議啟發的輕量級協議。我們用決策建模器和AFSIM之間的協作場景展示了這種能力。
雖然決策建模器的工作使我們偏離了開發時間和空間(4D)、基于模式建模方法的最初計劃,但我們的深入合作和對SysML v2的貢獻,在很大程度上彌補了這一點,提交給OMG。SysML v2已經達到了與我們最初計劃的相似的4D特征。在SysML v2環境下重建決策建模器將是一項有趣和有益的任務。除了參與SysML v2的工作,該項目還在其他幾個OMG標準的開發中起到了主導作用。
許多建模方法包括隱含或嵌入的決策制定。這些建模案例有流程圖、活動圖、業務流程模型等等。決策建模作為一門專門的學科是比較新的。對象管理小組創建了決策建模和符號(DMN)規范,最初是為了使BPMN1業務流程模型中的決策更加明顯,并支持更詳細的決策過程。這段歷史的缺點是,DMN現在與BPMN的關系非常緊密,尤其是在元模型層面。因此,DMN,不能直接與UML或SysML集成。為了使DMN風格的決策建模與UML和SysML模型協作,特別是使現有的UML建模工具能夠進行DMN風格的決策建模,必須創建一個決策建模UML配置文件,與DMN元模型密切相關。
決策建模器的開發和目標部署平臺是MagicDraw 19.0 SP4版本。MagicDraw(也被稱為Cameo)是一個UML建模工具,由No Magic公司開發和銷售。No Magic最近被Dassault Systèmes收購,Dassault Systèmes將繼續進一步開發和銷售這個工具,可能會用不同的名字。
MagicDraw是一個用Java實現的UML建模工具。它支持并使用一個插件架構來擴展其建模能力,涵蓋其他基于UML的建模語言和方法,如SysML、UAF和其他。一個OpenAPI工具箱可以用來支持自定義插件的開發。
圖 2 - MagicDraw(又名 Cameo)環境中的決策建模器
決策建模器和SimCom通信引擎是由FAST項目為MagicDraw開發的兩個定制插件。SimCom插件沒有任何先決條件,而決策建模器插件的功能需要SysML和Alf插件的存在。由于UAF是基于SysML的,決策建模器也可以用于基于UAF的企業模型。決策建模器和SimCom插件的安裝程序都與MagicDraw資源管理器一致。
雖然在整個FAST項目中開發的技術是朝著符合相關標準的方向做出的最大努力,像OMG規范的元對象設施(MOF)、統一建模語言(UML)、系統工程建模語言(SysML)等;或者像世界網絡聯盟(W3C)開發的網絡本體語言(OWL)、資源描述符框架(RDF)或其他,但我們自己也大力參與了新標準的開發,即在對象管理小組內。
雖然標準的制定是繁瑣的工作,但它的回報是許多好處。某一主題的標準化要求它處于該主題發展的第一線。這項工作通常是在研究實驗室或高級開發部門的隱蔽處進行的。然后,標準化要求開發人員開放并與世界各地同行討論該主題,這在所有案例中都是有益的。
在FAST項目期間,我們參與了對象管理小組的幾個標準化任務。所有這些任務都是在FAST項目之前的某個時間開始的,但這些任務的持續工作和討論為FAST項目提供了重要的投入和科學效益。我們所參與的任務是: MOF到RDF的轉換,元模型擴展設施,系統工程建模語言第二版,智能體和事件元模型,以及不確定性建模的精確語義學。另見本文件后面的標準化活動一章,以及項目技術報告(CDRL A010)中的相應章節。
決策模型由兩類元素組成:主動和被動元素。
主動元素是決策元素,它在模型執行過程中影響模型結果的整體結果(最高目標值)。根據OMG DMN規范,這些主動元素被定義: Decision、DecisionService和BusinessKnowledgeModel。
被動元素不包含任何決策邏輯,因此不直接影響模型的結果。它們可能需要協助連續的活躍元素之間的信息流,或者注釋決策模型。OMG DMN規范定義了以下兩個被動元素: InputData和KnowledgeSource。
我們決策模型的所有元素,無論是主動還是被動,都有相同的基本結構:它們將接受一個到多個輸入,稱為 "輸入事實",并產生一個單一的輸出,稱為 "結果事實"。所有的事實都可以是單值或復值,在這種情況下,它們是單值的結構。
普渡團隊的提案只針對TA1,其重點是使用機器學習模型來檢測社交工程信息。普渡團隊加入了由伯克利和CMU領導的團隊,組成了LASER團隊。普渡大學團隊開發了訓練社交工程郵件分類模型的技術,并參與了模擬運行和評估工作。我們開發了三個模型。兩個模型分析了主題和正文中的文本。一個TF-IDF(術語頻率-反向文檔頻率)模型使用標準術語頻率信息。第二個模型從文本中提取動機特征來識別信息作者的意圖(例如,獲取信息,訪問社交網絡)。第三個模型是一個知識和圖形模型,從發送者和接收者的信息中提取關系特征。一個集合模型將三個模型的輸出匯總起來進行預測,它由邏輯回歸模型和神經網絡模型組成。該團隊廣泛地探索了不同的模型、訓練技術以及它們對準確性的影響。
這個項目的目標是開發在具有挑戰性的多目標環境中自主分布式傳感器管理和融合所需的基礎方法。這涉及到開發能夠自動跟蹤多個目標的算法,根據從具有數據關聯不確定性和高誤報率的多個平臺收到的信息進行分類并分配資源。在研究者最近在多目標跟蹤和分布式傳感器融合方面的發展基礎上,該工作方案開發了能夠在大規模多傳感器多目標跟蹤應用中基于信息理論標準實現自主傳感器分配的方法。這是通過重新評估信息理論中的關鍵工具來實現的,這些工具適用于基于點過程理論的多目標監視的挑戰,該理論旨在適應單個目標的狀態和目標數量的不確定性。所開發的信息理論方法被應用于多傳感器問題,使人們能夠決定如何分配傳感器資源,以及完善對場景的認識。所開發的工具將有助于減少監測單一傳感器饋電的勞動密集型負擔,并能做出適應性決定,以優化多模式網絡的運行,并增強對監測區域的整體認識。對多目標跟蹤情景的信息理論表述的關注,將使人們能夠驗證傳感器饋電是否能夠可靠地融合,以避免數據損壞的可能性。該項目在智能傳感方面提供了關鍵的先進技術,以實現動態環境中的連續和適應性監視。這些將是可擴展的,可用于從多個分布式傳感器對許多目標進行大規模跟蹤。
該項目的總體目標是研究和開發基于信息理論原則的分布式多傳感器多目標系統的自主傳感器控制的新策略:
為大規模系統的多目標跟蹤開發可擴展的解決方案。
開發基于信息論原理的多傳感器融合的分布式解決方案。
確定多傳感器多目標跟蹤系統可以交換多少信息。
該項目為多傳感器多目標跟蹤開發了基本的解決方案:
對許多目標進行大規模跟蹤。問題的規模越來越大,因此解決方案需要可擴展,跟蹤許多目標需要減輕組合復雜性的算法。多目標跟蹤的低復雜度解決方案將被開發出來,并在復雜環境中進行測試。開發了一種用于穩健地跟蹤大量目標的方法,該方法在目標數量和測量數量上是可擴展的,這使得數百萬目標可以被跟蹤。
確定多傳感器多目標跟蹤系統的信息含量。在具有高密度信息的傳感器網絡中,帶寬可能是多傳感器多目標跟蹤的一個制約因素。這個項目得出了確定用于多目標跟蹤的傳感器網絡的信息含量的結果。預計這將有助于評估傳感網絡的效率和有效性,并與發送數據的數量和頻率相平衡。
來自多個傳感器的數據的分布式整合。操作員需要根據來自多個跟蹤系統的信息做出決定,以提高整體的態勢感知。為多傳感器集成開發了一種分布式多傳感器多目標跟蹤的新方法,該方法可減輕來自不準確或誤導性數據源的損壞。
對多目標監視應用中的威脅進行評估。對許多物體的大規模跟蹤能夠識別直接威脅。然而,有些威脅可能比其他威脅更有針對性。開發了一種新的對抗性風險的表述,為操作人員提供態勢感知,以幫助確定傳感資產的優先次序。
目標跟蹤估計器的性能界限。費舍爾信息的倒數,即克拉默-拉奧約束,為參數的估計器提供了一個約束,是統計分析的基礎。它為一個參數提供了一個可實現的最小方差或協方差。根據量子場理論的數學概念,為點過程推導出克拉默-拉奧約束,將這一概念推廣到具有空間變量的變量。
2019 年的項目提案征集產生了 10 個項目,共包含 15 個研究工作流。這些項目涉及 140 多名教職員工、研究人員和學生,他們隸屬于麻省理工學院校園和麻省理工學院林肯實驗室的 20 多個不同的組織單位。所有項目團隊都涉及空軍人員,他們嵌入研究團隊并充當項目與國防部利益相關者之間的聯絡人。這些項目于 2020 年 1 月開始,推進了廣泛領域的人工智能研究,包括天氣建模和可視化、培訓計劃優化以及增強自主性以增強和放大人類決策。人工智能加速器的研究活動已成功擴展,包括與海軍研究生院和美國太空部隊合作的種子研究項目,以及于 2021 年 1 月啟動的人工智能教育研究項目。總共11個項目 。
Guardian Autonomy for Safe Decision Making
Air Guardian 旨在通過開發用于增強和放大人類決策的算法和工具來推進人工智能和自主性。AI Guardian 通過使用過去的數據建議行動并融合來自傳感器和信息源的輸入來幫助人類。AI Guardian 系統的支持在出現意外和復雜情況時特別有用。Guardian 的端到端機器學習算法向專家學習如何在高度動態和令人驚訝的情況下以常識推理做出反應。我們的目標是使代理能夠感知其環境,識別短期風險,對其操作員以及其他合作和對抗代理的意圖和行為進行推理,以確定最佳行動方案。
該項目旨在開發一種新的框架和算法類別,使無人機系統能夠在模擬器環境中學習復雜的多智能體行為,然后將其知識從模擬無縫轉移到現實世界的現場環境中。該團隊設想了一個急救系統,在該系統中,一群自動駕駛飛機接受了虛擬訓練,了解如何在新的災區模擬中導航和合作。然后,系統將在模擬中獲得的學習轉移到真正的自主飛機群中。一架飛機部署了一個大型“母艦”地面站,該地面站釋放這些訓練有素的自主飛機,以自動執行時間緊迫、勞動密集型的任務,例如勘測災區以及定位和識別幸存者。
合成孔徑雷達 (SAR) 是一種能夠產生高分辨率景觀圖像的雷達成像技術。由于能夠在所有天氣和光照條件下生成圖像,與光學系統相比,SAR 成像在人道主義援助和救災 (HADR) 任務中具有優勢。該項目旨在通過利用來自相關模式(例如,EO/IR、LiDAR、MODIS)、模擬數據和基于物理的模型的補充信息,提高 SAR 圖像的人類可解釋性、SAR 目標檢測和自動目標識別 (ATR) 的性能. 項目結果和產生的技術將在整個政府企業中共享,以便在 HADR 問題空間中受益,跨服務的多個合作伙伴可能能夠利用已開發的技術。
為了改善人工調度飛機航班的極其復雜和耗時的過程,該項目旨在實現飛機航班調度的自動化,以提高調度效率和在存在不確定性的情況下的魯棒性。這將優化培訓飛行計劃,同時提供可解釋性并消除決策中的孤島。該技術使調度人員能夠在快速變化的環境中快速有效地重新構建調度,從而大大加快計劃和決策周期。雖然最初專注于飛機航班調度,但該技術適用于許多部門的所有復雜資源分配任務。
大量標記數據、新算法和計算機性能的可用性使人工智能革命成為可能。但漫長的計算機在環開發周期阻礙了人類發明和部署創造性的人工智能解決方案。此外,摩爾的終結削弱了半導體技術提供性能的歷史能力。AI 性能越來越依賴于硬件架構、軟件和算法。Fast AI 項目專注于為快速構建 AI 解決方案奠定基礎,在現代和傳統硬件平臺上實現性能和可移植性。我們在編程語言、編譯器技術、綜合儀器、分析生產力工具和并行算法等領域進行創新。
人工智能技術成功的核心要求是高質量的數據。讓系統做好“AI 就緒”的準備工作包括收集和解析原始數據以供后續攝取、掃描、查詢和分析。該項目將開發 ML 增強數據庫技術,以降低存儲和處理成本,同時實現各種數據庫孤島之間的數據共享。此外,我們將開發一個異常值檢測引擎來識別來自多個來源的復雜事件流中的時間異常。
AI Accelerator 自然語言處理項目旨在推進平面/文本圖像數據和空軍任務中的會話代理、知識表示和預測算法。隨著人工智能領域的進步,隨著我們在數據中記錄更多的工作,并在我們的家中找到更多的設備,人們能夠以有意義的方式與技術交互至關重要——就像人類一樣,語言很重要——尤其是在發現關于數字系統的信息。目標是通過對話交互和知識提取來推進人工智能社區,以進行開放域對話和非結構化信息。
AI加速器自然語言處理外語項目專注于構建個性化的外語教育框架,其中包括要獲得的語言知識模型。這項工作利用當前的外語,根據學習者在課程作業各個階段的預期知識水平量身定制,并制定標準化的能力測試措施。該模型將有助于個性化學習體驗,并闡明學習結果何時和/或何處對學生不利。
用于天氣和氣候的地球情報 (EI) 引擎包括一個新穎的 AI 測試平臺,以支持美國空軍的快速、有效決策和長期戰略規劃和運營。人工智能的進步有助于縮小人工智能研究人員與可用地球系統數據之間的差距,通過一個連接數據和模型的平臺、新穎的算法和圖像填補任務,將低質量的天氣和氣候數據集與高質量的天氣和氣候數據集聯系起來。EI引擎將為美國空軍提供改進的異常檢測算法;對集中式地球情報數據的關鍵遠程訪問;用于任務支持的地球智能的直觀超級計算機可視化;改進任務行動的臨近預報天氣預報;以及受氣候變化影響的戰略位置識別,以加強資源配置。
盡管機器學習模型的性能令人難以置信,但它們仍然難以理解——我們不明白它們是如何或為什么得出結論的。因此,我們不可能對模型的決策充滿信心,并在它們出現故障時對其進行調試。這種“黑盒”性質限制了我們部署和節約維護機器學習系統的能力,尤其是在高風險的環境中。該項目以全新的思維方式處理機器學習的可解釋性:將機器學習和人機交互方法相結合,使實際用戶的可操作性成為主要目標。目標是確定可解釋機器學習的標準,從而能夠開發具有與人類和任務一致的數據表示和決策界面的模型。
人工智能技術已被證明在許多關鍵應用中非常成功,例如對象識別、語音識別等。然而,這些成功依賴于收集大量數據集和仔細的手動注釋。這個過程成本高、耗時長,而且在很多情況下,沒有足夠的數據可用。遷移學習通過利用機器看到的過去數據僅使用少數帶注釋的示例來解決未來問題,從而為這些問題提供了解決方案。這項研究側重于遷移學習中的挑戰,旨在開發可以從根本上從多個異構任務中學習的算法,超越低級任務相似性,以實現跨不同任務的更廣泛遷移。此類算法將在包括計算機視覺和自然語言處理在內的多個領域具有普遍適用性,并將大大減少對大量注釋數據的依賴,從而降低部署和維護人工智能系統的成本和時間。
人工智能和機器學習 (ML) 方法已為美國空軍展示了巨大的前景。然而,當數據輸入或任務目標與算法訓練期間遇到的目標發生變化時,許多現有的 ML 算法通常會發生災難性的失敗。這種缺乏可靠性以及現代 ML 技術的不透明性使得無法在關鍵任務環境中自信地部署機器學習系統。此外,模型無法適應不斷變化的環境,這意味著每當環境發生變化時都需要(通常是昂貴且困難的)模型重新調整。本研究將側重于以魯棒性為中心的方法來開發 ML 算法。強大的 AI 開發環境 (RAIDEN) 優先考慮 ML 的可靠性、多功能性和適應性。我們努力提供的模型、框架和算法將簡化真正可靠和高效的機器學習系統的部署。
該項目匯集了生物醫學儀器、信號處理、神經生理學、心理物理學、計算機視覺、人工智能 (AI) 和機器學習 (ML) 方面的專家以及空軍飛行員,以開發和測試基于人工智能的多模式用于客觀性能預測和優化的生理傳感器融合方法。該項目將利用身臨其境的虛擬環境來訓練飛行員并不引人注目地測量性能預測指標。從該計劃開發的一系列挑戰數據集將用于參與社區。該團隊與多個政府研究工作以及空中教育和培訓司令部的無數飛行員培訓單位合作,尋求通過明顯加快飛行員培訓時間表來提供概念驗證,從而更快地培養“更好的飛行員”。
國防部和民用部門正在研究幾種不同的 GPS 替代方案,以解決 GPS 替代方案;但是,每種替代方案都會帶來額外的成本和用例。磁導航提出了一種替代 GPS 系統,該系統依賴于地球的磁共振——一個眾所周知且不變的系統——進行導航。磁導航當前的一些問題涉及 1) 減少系統上的多余噪聲,例如飛機本身的磁輸出,2) 以與軍事系統一致的實時速度或速度確定位置,以及 3) 與其他系統相結合系統來展示一個完全替代的 GPS 系統。目前的項目著眼于使用魯棒的神經微分模型來解決磁導航的缺點并提供 GPS 的可行替代方案。
該項目旨在應用人??工智能來增強美國空軍檢測、識別和地理定位未知射頻 (RF) 信號的能力,同時提供自適應干擾緩解和智能頻譜分析工具。這些能力增強了空軍情報監視和偵察 (ISR) 任務、通信、信號情報 (SIGINT) 和電子戰。結果將提高帶寬利用效率和頻譜共享,提高空軍在高干擾環境中的通信性能,產生更高質量的射頻信號情報,并提高系統對對抗性攻擊和干擾的魯棒性。
KAL 是一個探索性研究項目,旨在推進教育研究活動,為具有不同角色和教育背景的學習者(從空軍和國防部 (DoD) 人員到公眾)大規模促進最大的學習成果。項目團隊將研究和評估與在各種現有課程中培訓空軍人員人工智能主題相關的各種教學實踐和學習效益,繪制教育需求和能力的格局,并試點實驗學習經驗,目標是盡早概述用于創新技術支持的培訓和學習的原型。