適應性記憶(AC)是作為一種查找表(LUT)通用技術新推出的。它由一系列生成模型組成,其設計方式是學習每種算法的輸出。在本報告中,我們重點介紹基于條件生成對抗網絡(cGAN)的 AC 改進版。與之前的結構相比,新開發的生成式結構具有多項優勢。從本質上講,它不需要生成模型陣列。相反,兩個適當制作的生成模型就足夠了,從而大大縮短了整體寫入時間。此外,它還能在感興趣的區域提供更好的抑制水平。最后,它還能在抑制水平性能和損失函數衡量的生成保真度之間做出選擇。
認知雷達(CR)是當前雷達理論研究中一個引人注目的趨勢。盡管不同學者對這一概念的定義大相徑庭[11],但這些定義都有其主要內容。例如,[12]、[10]和[6]認為從環境和經驗中學習是認知雷達的主要特征,而[10]則認為具有適應復雜情況的能力。認知雷達與完全自適應雷達的區別還在于,認知雷達應 "學會調整操作和處理參數,并能在較長時間內做到這一點"[1]。因此,學習和存儲知識是一個必備要素[13, 15]。
與此同時,Gurbuz 等人[11] 綜述了與認知雷達有關的 83 種期刊和 238 篇會議論文。他們發現,大多數研究至少涉及某種形式的波形選擇、優化或設計。在這些研究中,通常使用收集到的認知來決定哪種波形適合當前環境。一種突出的方法是利用在時頻觀察到的雜波認知[5, 21,18, 20]。由于雷達界廣泛使用模糊函數(AF)來表示時頻景觀,因此幾乎所有此類研究都涉及設計或塑造發射波形的模糊函數。在本報告中,我們給出了一種基于 AF 塑造研究的深度學習方法,它可以復制任何迭代算法的結果。我們首先在文獻[7]中以容納記憶(AM)的名稱引入了這一概念,然后在本報告中對其進行了優化和改進。
下面,我們首先回顧一下它在學習方面提出的條件生成對抗網絡。接著,我們在第 2 節中提出了認知接收波形,并觀察到為了最小化總干擾功率(PTD),應基于雜波認知設計離散時間模糊函數。然后,我們提出了一種基于 cGAN 的雙生成深度結構,它可以學習信號-AF 對并對其進行再生。這里我們將最小平方損失函數和 Wasserstein 損失函數作為模型損失函數。第 3 節專門報告給定方法的實證結果,其中我們研究了名為條件部分的特定結構超參數的影響。最后。第 4 節是本報告的結尾。
根據項目工作計劃,本進度報告概述了項目第二年開展的技術活動。更具體地說,它包括
回顧全偏振三維InISAR 算法及其通過偽代碼的實現。
3D InISAR 算法的性能分析。在這方面,提出并比較了兩種不同的方法,即基于相干的方法和基于跨度的方法。利用模擬數據和真實數據強調了這兩種方法的優缺點。事實上,模擬數據可以對三維重建精度進行數值量化,但也有一定的局限性,因為模擬數據無法忠實再現不同角度下的偏振目標散射機制。另一方面,真實數據是真實的(即使是在受控幾何條件下獲取的),但不能用于對重建精度進行數值量化。
兩種 ATR 算法的設計和初步實施(用于初步驗證),將在項目的第三年進行全面測試。
圖 2.1: 使用基于 Pol-InISAR 的擬議方法進行三維目標形成的總體框圖。
該項目正在按照工作計劃進行。提出并比較了利用全偏振數據估算目標高度的兩種方法。通過定義合適的指標,對已實施的方法進行了仔細深入的分析。結果表明,與單偏振算法相比,在形成三維 InISAR 圖像時使用偏振信息非常有效。這些算法在模擬數據和真實數據上都進行了測試。通過模擬數據,我們可以對所建議方法的準確性進行數值量化。真實數據證明了算法在真實數據上的有效性,并證明了基于 SPAN 的算法相對于基于相干性的算法的局限性。最后,我們提出并初步實施了兩種 ATR 算法,以驗證其可行性。其中一個屬于模板匹配方法的分支,第二個屬于機器學習的分支。這項工作將繼續進行,最終實施和完善分類算法及其性能評估。
在本項目中,我們從多個方面研究了無人機自組織網絡的通信和安全挑戰:i) 我們為特設無人機網絡開發了一種新的路由協議,以處理此類網絡的高度動態性。我們的研究表明,所提出的路由算法在流量成功率、吞吐量和流量完成時間方面都優于所有知名基準;ii) 我們研究了自組織無人機網絡的安全挑戰,并表明現有的基于預分配的密鑰管理協議容易受到合作攻擊。我們設計了一種基于區塊鏈的密鑰交換算法,以提高網絡抵御此類攻擊的能力。
本文介紹了一種正在開發的方法,利用機器學習技術對大型 X 射線圖像數據集進行異常和/或缺陷檢測分析。異常和/或缺陷的特征可通過圖像分類(監督學習--卷積神經網絡)或異常檢測(非監督學習--自動編碼器)模型的性能精度來確定。每種學習技術都有獨特的超參數和設計架構,以幫助創建穩健的模型,針對不同方向、亮度和對比度的 X 射線圖像進行預測。這種方法是對傳統的高能材料/組件特性測試套件的有力補充,特別是在熔融澆注爆炸物、與性能相關的設計意圖、安全性和/或與性能相關的缺陷檢測方面。對于安全或性能相關的缺陷檢測,該方法可在開發新的次規模測試和基于物理的模型時將缺陷作為反饋回路,以更好地了解和預測高能失效模式,這是美國陸軍DEVCOM 軍備中心正在開發的一種能力,稱為高能缺陷表征(EDC)。
圖5:彈藥異常
目前和未來對火炮彈藥的能量要求都超過了傳統的火炮和炮管設計以及飛行環境。這意味著今天的非關鍵缺陷在未來可能會成為嚴重缺陷。有缺陷的火炮已造成火炮發射時的災難性故障、人員傷亡和平臺損壞(Ismay; Kumar; Singh)。預防和減少這些潛在的重大缺陷是美國陸軍的首要任務。雖然目前已有檢測缺陷的流程,但這些方法耗時長、成本高,而且已經過時。現在是建立未來檢測方法的時候了。考慮到這項任務的影響,美國陸軍作戰能力發展司令部-軍備中心正在努力開發和演示現代缺陷檢測能力。
能力開發工作--高能缺陷表征(CDE - EDC)是由位于皮卡廷尼兵工廠的美國陸軍作戰能力開發司令部軍備中心資助的一項新的能力開發計劃。該項目旨在開發實驗和計算能力,對有缺陷的能量學進行評估和預測,特別是針對增強型彈藥(LRPF)。除了設在皮卡廷尼兵工廠的工作組外,還與北約工作組和技術合作計劃(TTCP)開展了國際合作。此外,分析人員還與西點軍校的學員開展合作。CDE - EDC 由三個核心分組組成: 實驗分組、數據分析分組和計算分組均設在發展司令部--航空航天中心(DEVCOM-AC)。三個分組之間的關系見圖 1。本報告重點介紹數據分析分組完成的工作。憑借這三個分組的綜合技術專長,DEVCOM-AC 正努力為缺陷檢測、表征和緩解提供最新的能力和指導。
實驗測試分組隸屬于高能物理、彈頭和制造技術局,其任務是確定和量化可能導致缺陷高能物理意外點火的基本物理和化學機制。為收集這些數據,該分組正在完成各種物理測試。這項任務的一部分包括改進物理測試的現實缺陷復制。
數據分析分組隸屬于系統分析部,其任務是利用機器學習來標記和描述異常和缺陷檢測圖像。通過使用這些模型獲得的知識將有助于實驗分組和計算分組完成其任務。
計算分組隸屬于能量學、彈頭和制造技術局,其任務是對能量學缺陷進行建模,以評估是否可能過早點火。該分組模擬給定能量參數的火炮發射,以確定缺陷的影響。該分組使用 Abaqus 和 STAR-CCM+ 等模型。計算分組將模型輸出與實驗分組的物理測試輸出進行比較。因此,它在很大程度上依賴于實驗分組,反之亦然。
這項工作的成果將是一個獨立預測工具,可供檢查人造彈藥的放射線研究者使用。本報告將重點介紹機器學習部分。
模型構建工作流程將由三部分組成,如圖 13 所示。每一層都像一個漏斗,將有缺陷和無缺陷的圖像分開。
為了解決如何利用現有數據的增長來建立有用的模型的問題,一個自動發現模型和管道的方法是有序的,它可以利用這些數據。我們已經探索了自動發現模型和管道所需的許多方面:建立一個模型知識庫和基于推薦系統方法的模型排名,通過數據集的圖形表示進行模型推薦,通過擴展基于樹的管道優化工具(TPOT)和基于強化學習的方法進行管道生成。我們探索了一種預算意識到的超參數調整算法和神經網絡的不確定性估計。我們探索了不同的訓練方法,包括無梯度優化、零點學習和持續學習。我們還解決了神經網絡架構的問題。我們將所有這些結合起來,形成了一個模塊化的自動機器學習(AutoML)系統,該系統支持廣泛的任務類型,在項目評估中一直處于前三名。
本報告記錄了通過利用深度學習(DL)和模糊邏輯在空間和光譜領域之間整合信息,來加強多模態傳感器融合的研究成果。總的來說,這種方法通過融合不同的傳感器數據豐富了信息獲取,這對情報收集、數據傳輸和遙感信息的可視化產生了積極的影響。總體方法是利用最先進的數據融合數據集,為并發的多模態傳感器數據實施DL架構,然后通過整合模糊邏輯和模糊聚合來擴展這些DL能力,以擴大可攝入信息的范圍。這項研究取得的幾項進展包括:
出版物[1, 2, 3, 4, 5]進一步詳細介紹了取得的進展。
專門用于下馬士兵系統的國防資金是有限的,而且必須在多個部分之間進行分配。決定正確的組合可能是困難的--一些技術提高了殺傷力和保護力,另一些則提高了安全性能。同時,這些技術可能會增加認知和身體負荷。本報告提出了一種方法來進行跨越這一明顯的鴻溝,并找到技術的最佳組合。提出了一個數學戰斗模型,該模型考慮了態勢感知、殺傷力和保護設備在預期挽救生命方面的聯合效應。因此,該模型可以用來設計一個最佳的下馬士兵系統,一個可以拯救人生命的系統。
本方法依賴于在任何時候都將決策者表現為一個最佳的決策者。然而,該決策者必須在不確定性和時間限制下做出決定。隨著認知負擔的增加,模型中可能會發生幾個變化:決策之間的時間可能會增加,每個決策中考慮的信息量可能會減少,或者規劃范圍可能會縮短,導致更多的短視決策。模型中的每一個杠桿都能靈活地代表決策的退化,以及SA,同時仍然假設指揮官是在做出盡可能好的決策,但在困難的約束下。在技術上,我們的模型是基于兩個支柱。首先,戰斗被建模為連續時間馬爾可夫鏈(CTMC)。其次,指揮官被模擬為部分觀測馬爾可夫決策過程(POMDP)中的決策者。POMDP是通過動態規劃解決的順序決策問題。它們很難解決,因為與完全可觀察的馬爾可夫決策過程(MDPs)相反,一些狀態變量是隱藏的。幸運的是,先進的計算方法已經被開發出來以解決它們。
本文實施了一個概念驗證,基于一個下馬的戰斗場景,其中一個由12名士兵組成的小組必須確保一個隧道的入口。在任何時候,指揮官都可以根據當時的信息改變路線,或放棄行動。在這個場景中,還包括一個區域傳感器,例如,它可以是一個無人駕駛飛行器(UAV)。展示了如何在增加士兵的傳感能力和增加無人機的能力之間找到最佳權衡。還展示了如何在增加士兵的感知能力和增加他們的殺傷力和個人保護設備之間找到最佳的平衡。最后,展示了如何通過增加模型中決策的時間間隔,來模擬認知負擔的增加,從而增加預期的生命風險。
該模型在采購、能力發展、國防科技和學術領域具有開發潛力。這種廣泛的潛力要歸功于POMDPs的靈活性,它可以根據需要做得很抽象,或者很詳細。提出了幾個擴展模型實現的途徑:整合貝葉斯信念網絡(在CTMC和/或觀察模型中),結合情景階段的序列,并探索其他表示認知負擔的方法。
圖 2-1:戰斗中SA的概念概述。
強大的統計模型可以從大量數據中有效地學習,目前正在徹底改變計算機視覺。這些模型具有豐富的內部結構,反映了特定于任務的關系和約束。本教程向讀者介紹計算機視覺中最流行的結構化模型類。我們的重點是離散無向圖模型,我們詳細介紹了概率推理和最大后驗推理的算法。我們分別討論了最近在一般結構化模型中成功的預測技術。在本教程的第二部分中,我們將描述參數學習的方法,其中我們將經典的基于最大似然的方法與最新的基于預測的參數學習方法區分開來。我們著重介紹了增強當前模型的發展,并討論了核化模型和潛變量模型。為了使教程具有實用性并提供進一步研究的鏈接,我們提供了計算機視覺文獻中許多方法的成功應用實例。 //www.nowozin.net/sebastian/papers/nowozin2011structured-tutorial.pdf
盡管近年來深度學習取得了巨大進展,但訓練神經網絡所帶來的爆炸式經濟和環境成本正變得不可持續。為了解決這個問題,已經有大量關于算法高效深度學習的研究,這些研究旨在通過改變訓練程序的語義,而不是在硬件或實現級別上降低訓練成本。本文對該領域的研究進行了系統、全面的綜述。首先,我們將算法加速問題形式化,然后我們使用算法高效訓練的基本構建塊來開發分類。我們的分類強調了看似不同的方法的共性,并揭示了當前的研究差距。接下來,我們將介紹評估最佳實踐,以實現對加速技術的全面、公平和可靠的比較。為進一步幫助研究和應用,討論了訓練管道中的常見瓶頸(通過實驗說明),并為它們提供分類緩解策略。最后,我們強調了一些尚未解決的研究挑戰,并提出了有希望的未來方向。 //arxiv.org/abs/2210.06640
在過去的幾年里,深度學習(DL)在廣泛的應用領域取得了顯著的進展,如蛋白質結構預測(AlphaFold [Jumper et al。2021])、文本到圖像合成(DL - e [Ramesh et al。2021])、文本生成(GPT-3 [Brown等人。2020a])等。實現這些性能提升的關鍵策略是將DL模型擴展到非常大的規模,并對它們進行大量數據的訓練。對于大多數應用程序,可訓練參數的數量至少每18至24個月翻一番——語言模型以4至8個月的翻倍時間領先(Sevilla and Villalobos 2021)。大規模人工智能模型的著名例子包括:用于視覺應用的Swin Transformer-V2 [Liu等人2022a],用于語言建模的PaLM [Chowdhery等人2022],用于內容推薦的波斯[Lian等人2021],具有100萬億參數。
盡管擴大DL模型正在實現前所未有的進步,但訓練大型模型已經變得極其昂貴。例如,GPT-3訓練成本估計為165萬美元,使用谷歌v3 TPU[Lohn和Musser 2022],且transformer 模型的低效/幼稚開發將產生相當于5輛汽車終生碳足跡的二氧化碳(CO2) [Strubell等人,2019]。值得關注的是,DL仍然沒有達到許多應用所要求的性能水平:例如,在現實世界中部署全自動駕駛汽車需要人類水平的性能,但還沒有達到。不斷增長的模型和數據規模以達到所需的性能將使當前的訓練策略在金融、環境和其他方面不可持續。事實上,根據目前的趨勢推斷,2026年最大的人工智能模型的訓練成本將超過美國的GDP總量(Lohn and Musser 2022)。此外,DL對計算的高度依賴引發了人們對財務資源有限的用戶(如學者、學生和研究人員(特別是來自新興經濟體的人)的邊緣化的擔憂[Ahmed and Wahed 2020]。我們將在附錄A中更詳細地討論這些關鍵問題。考慮到其計算負擔的不可持續增長,DL的進步需要更多的計算效率訓練方法。一個自然的方向是消除學習過程中的算法效率低下,以減少DL訓練的時間、成本、能量和碳足跡。這種算法高效的深度學習方法可以通過多種方式改變訓練過程,包括:改變數據或樣本呈現給模型的順序;調整模型的結構;改變優化算法。這些算法改進對于實現有效深度學習訓練所需計算負擔的估計下界至關重要,目前的做法導致的負擔大大超過了該下界[Thompson等人,2020]。
此外,這些算法增益與軟件和硬件加速技術相結合[Hernandez和Brown 2020]。因此,我們相信算法高效的邏輯學習提供了一個巨大的機會來增加邏輯學習的收益并降低其成本。雖然最近涌現的算法效率論文支持了這一觀點,但這些論文也表明,算法效率方法的研究和應用受到碎片化的阻礙。不同的指標被用來量化效率,這產生了不一致的加速方法的排名。評估是在狹窄或特征不佳的環境中執行的,這將導致不正確或過于寬泛的結論。在討論算法效率方法時,缺乏反映它們的廣度和關系的分類法,這使得人們很難理解如何遍歷加速環境,將不同的方法結合起來并開發新的方法。因此,本文的核心貢獻是組織算法效率文獻(通過受[Von Rueden等人2019]啟發的分類法和調研),以及對影響報告和實現加速的實際問題的技術描述(通過評估和實踐指南)。我們的討論始終強調這兩個重點的關鍵交集:例如,算法效率方法是否會導致實際的加速確實取決于方法(通過我們的分類法可以理解)和計算平臺(通過我們的從業者指南可以理解)之間的交互。
我們的貢獻總結如下:
有了這些貢獻,我們希望改進算法效率的研究和應用,這是計算效率深度學習的關鍵部分,需要克服現有研究面臨的經濟、環境和包容相關的障礙。本文主要分為四個部分:第2節概述了DNN訓練和效率度量以及算法加速問題的形式化。第3節使用廣泛適用的加速方法的構建塊以及它們影響的訓練管道組件來開發我們的分類法。第4節根據我們的分類法對加速文獻進行了全面的分類,并討論了研究機會和挑戰。第5節和第6節分別討論了比較不同方法的最佳評估實踐和選擇合適的加速方法的實際建議。最后,第7節總結并提出了算法效率領域的開放問題。
常見的圖像編輯方法側重于低級特征。在本論文中,我利用機器學習使圖像編輯在更高的概念層次上運行。從根本上說,所提出的方法旨在通過結合通用的視覺知識,從可能被編輯的信息中提取出必須在編輯過程中維護的視覺信息。因此,新方法可以以人類可理解的方式轉換圖像,比如將一個物體轉換為另一個物體,將照片程式化到特定藝術家的畫作中,或將日落加到白天拍攝的照片中。我們探索在不同的設置和不同數量的監督設計這樣的方法: 逐像素標簽,逐圖像標簽,和沒有標簽。首先,利用逐像素監督,我提出了一種新的深度神經網絡架構,可以從場景布局和可選目標風格合成逼真的圖像。其次,使用每個圖像監督,我探索了域翻譯的任務,其中一個類的輸入圖像被轉換為另一個類。最后,我設計了一個框架,可以從一組未標記的圖像中發現結構和紋理的分離操作。我們在廣泛的應用中提供令人信服的視覺效果,包括交互式照片繪圖工具、對象變形、虛擬和真實環境之間的域間隙減少,以及圖像紋理的逼真操作