亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

這項工作研究了使用深度神經網絡(DNN)來進行武器交戰區(WEZ)最大發射距離的估算。WEZ允許飛行員確定一個空域,在這個空域中,可用的導彈有更大的概率成功地攻擊一個特定的目標,即一個假想的飛機周圍的區域,在這個區域中,對手容易被擊中。我們提出了一種方法,使用50,000次不同條件下的模擬發射來確定一個特定導彈的WEZ。這些模擬被用來訓練一個DNN,它可以預測飛機在不同發射條件下的WEZ,其決定系數為0.99。它提供了有關前述研究的另一個步驟,因為它采用了一個非具體化的模型,即它一次性考慮了WEZ的所有方向,這在以前是沒有的。此外,建議的方法采用了一種實驗設計,允許較少的模擬運行,提供更快的模型訓練。

在模擬的計算環境中,軍事系統必須與真實相似,其保真度要達到一定程度,才能得出有用的結論[15]。這是通過使用可靠的計算模型來實現的,這些模型被認為包含了它們所代表系統的主要特征[16]。

在處理空戰時,需要建模的最關鍵部分之一是導彈。關于導彈系統本身和何時使用它的決定,即開火,都是如此。在考慮超視距(BVR)空戰時,這一點甚至更為關鍵,因為這一決定必須只根據態勢感知系統顯示給飛行員的內容來做出[11]。

在建設性模擬的背景下,飛機的行為是自主的,有必要為其控制算法提供類似于真正的飛行員會收到的數據,以便執行一致[9]。飛行員可以用來決定是否向對方飛機發射導彈的一個最重要的方面是武器交戰區(WEZ),簡單地說,它代表武器的射程[10]。這個定義將在第2.1節中進一步深入討論。然而,這個范圍的確定不是一個簡單的任務,因為它受到射手和目標的一系列變量的影響。此外,它自然也取決于導彈本身。在這項工作中,我們提出了一種方法,利用一系列不同條件下的模擬發射來確定特定導彈的WEZ。這些模擬被用來訓練一種機器學習算法,當飛機發現自己處于不同的發射條件時,可以預測WEZ。以前的工作已經采用了一些類型的人工神經網絡(ANN),如小波神經網絡(WNN)[29]和帶有貝葉斯正則化人工神經網絡(BRANN)的多層感知器(MLP)[4],對WEZ進行預測,也是基于模擬數據進行預測。文獻內也有純粹的數學方法,如[14]和[23],但它們提供了考慮固定導彈射程的不切實際的導彈模型和基于仿真的更復雜模型之間的中間步驟。

公司和政府內部可能已經開展了更多關于WEZ確定的研究[5],但這仍然很少公開。這項工作的貢獻是采用了深度神經網絡(DNN)和一個新的非離散模型,即該模型同時考慮了WEZ的所有方向,而不是像我們所知的那樣離散了off-boresight角度(圖5)。此外,它使用的實驗設計允許較少的模擬運行次數,這提供了一個更快的模型訓練。

本文的其余部分組織如下。第2節提供了背景,更深入地解釋了WEZ的概念,并介紹了所采用的特定導彈模型和所使用的實驗設計。在第3節中,詳細介紹了所提出的方法,而在第4節中介紹和分析了由此產生的結果。最后,第5節闡述了該工作的主要結論,并提出了一些未來的發展建議。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

自從網絡空間被鞏固為第五個戰爭維度以來,國防部門的不同行為者開始了一場實現網絡優勢的軍備競賽,研究、學術和工業利益相關者從雙重角度做出了貢獻,這主要與民用網絡安全能力的大量和異質的發展和采用有關。在這種情況下,加強對背景和戰爭環境的感知,網絡威脅的風險和對動能行動的影響,成為軍事決策者正在考慮的一個關鍵的規則改變。獲得以任務為中心的網絡態勢感知(CSA)的一個主要挑戰是動態推斷和評估從支持任務的信息和通信技術(ICT)發生的情況的垂直傳播,直到它們在軍事戰術、作戰和戰略上的相關性。為了在獲得CSA方面做出貢獻,本文解決了網絡防御領域的一個主要差距:在以任務為中心的背景下動態識別關鍵網絡地形(KCT)。因此,擬議的KCT識別方法探討了指揮官作為評估標準的一部分所定義的任務和資產之間的依賴程度。這些與作戰網絡上的發現以及在支持任務發展過程中發現的資產漏洞相關聯。該建議作為一個參考模型,揭示了以任務為中心的KCT分析的關鍵方面,并通過包括一個說明性的應用案例來支持其執行和進一步執行。

網絡空間被定義為由所有相互連接的通信、信息技術和其他電子系統、網絡及其數據組成的全球領域;最近被合并為現代戰區的第五個領域,加入了陸地、海洋、空中和太空[1]。在那里,聯合功能(JFs),如網絡演習、火力、指揮和控制(C2)、情報、信息、維持或部隊保護,在防御性網絡空間行動(DCOs)和/或進攻性網絡空間行動(OCOs)的背景下實施;支持或被動能領域的行動支持。盡管有這些依賴性,網絡空間與動能領域完全不同,主要是因為它是人造的,部分是非物理的(數字),不受傳統地理邊界的限制[2]。它被描述為CIS(通信和信息系統)資產的高可及性,對網絡行動路線(CoAs)的短時間影響與它們的大量準備時間相比,它們的影響越來越不對稱(通常是垂直/傳播到附帶的混合層面),或者它們的無形性;后者使得網絡損害評估計算變得困難[3]。

與最先進的兩用網絡安全使能器相比,適合軍事行動的原始網絡防御效應器應采用以任務為中心的愿景,其中網絡評估和決策必須與軍事行動背景相適應,包括網絡行動所針對的任務目標和任務、其相互依賴性、階段性、聯合/合并行動、技術、戰術、行動和戰略層面之間的垂直傳播等。這就要求在對通信和信息系統(CIS)維度的原始影響(通常是保密性、完整性和可用性)與任務層面的影響之間進行清晰的轉換,后者的例子是可能導致任務執行的延遲、有益因素的喪失,或減少指揮官做出新決定和規劃CoA的敏捷性[4]。

因此,支持網絡防御行動的能力的一個重要方面是他們能夠考慮哪些任務依賴性是必要的,以便充分評估/評價每個控制論或程序性資產,并隨著任務的進展動態地改變評價結果。在這種情況下,關鍵網絡地形(KCTs)被定義為構成、監督和控制網絡空間的系統、設備、協議、數據、軟件、程序、網絡角色和其他網絡實體[4],構成軍事優勢,如果受到危害,有可能導致任務失敗[5]。但是,盡管KCT概念的相關性,它被研究界模糊地公開探討,文化和跨領域的誤解導致了模糊和誤解,通常從過度的民用角度來處理;并且大多忽略了其以任務為中心的影響。

為了促進以任務為中心的KCT發現和評估的研究,本文回顧并深入分析了KCT概念及其影響。這是從網絡態勢感知(CSA)的角度進行的,并假設其相關性將日益增長,以實現準確的跨域共同作戰圖像(COP)[6]。所進行的研究擴展了在[7]中向研究界和網絡防御從業人員初步介紹的工作,匯編了廣泛收到的反饋,并將其原始范圍從原始技術方面增加到KCT任務的影響。鑒于其引起的高度興趣,本文加強了所介紹的KCT概念化,擴展了KCT發現和評估參考模型,詳細說明了其以任務為中心的影響,并提供了分析和經驗評估的擴展描述。下面列舉了所進行的研究的主要貢獻。

  • 本文深入回顧了當前網絡防御和以任務為中心的網絡風險管理的情況,強調了現有的KCT分析工作。

  • 提出了一個動態識別網絡空間關鍵資產的參考框架,它揭示了可能指導進一步研究行動的關鍵支柱的子集。

  • 探討了廣泛采用的動能地形因素與它們在網絡空間軍事行動中的可追溯性。

  • 該提案審查了KCT評估相關能力發展的DOTMLPF-I(理論、組織、訓練、物資、后勤、人員、設施和互操作性)層面。

  • 討論了KCT分析在進攻和防御性軍事思維中的應用。

  • 該建議已被實例化,并在一個說明性用例下進行了分析驗證,其中詳細說明了所有需要的數據處理活動。

本文分為七個部分,其中第一部分是本導論。第二部分回顧了以任務為中心的網絡防御和KCT評估方面的技術現狀。第三節介紹了所進行的研究設計原則。第四節介紹了一種新型的動態KCT識別方案。第五節分析了可預見的KCT評估能力發展層面。這一節還討論了提案在進攻和防守兩方面的應用。第六節詳細介紹了該建議在一個研究案例中的應用。最后,第七節介紹了所取得的結論和對未來工作的建議。

付費5元查看完整內容

在可視范圍內執行空戰,需要飛行員在接近1馬赫的飛行速度下,每秒鐘做出許多相互關聯的決定。戰斗機飛行員在訓練中花費數年時間學習戰術,以便在這些交戰中取得成功。然而,他們決策的速度和質量受到人類生物學的限制。自主無人駕駛戰斗飛行器(AUCAVs)的出現利用了這一限制,改變了空戰的基本原理。然而,最近的研究集中在一對一的交戰上,忽略了空戰的一個基本規則--永遠不要單獨飛行。我們制定了第一個廣義的空戰機動問題(ACMP),稱為MvN ACMP,其中M個友軍AUCAVs與N個敵軍AUCAVs交戰,開發一個馬爾可夫決策過程(MDP)模型來控制M個藍軍AUCAVs的團隊。該MDP模型利用一個5自由度的飛機狀態轉換模型,并制定了一個定向能量武器能力。狀態空間的連續和高維性質阻止了使用經典的動態規劃解決方法來確定最佳策略。相反,采用了近似動態規劃(ADP)方法,其中實施了一個近似策略迭代算法,以獲得相對于高性能基準策略的高質量近似策略。ADP算法利用多層神經網絡作為價值函數的近似回歸機制。構建了一對一和二對一的場景,以測試AUCAV是否能夠超越并摧毀一個優勢的敵方AUCAV。在進攻性、防御性和中立性開始時對性能進行評估,從而得出六個問題實例。在六個問題實例中的四個中,ADP策略的表現優于位置-能量基準策略。結果顯示,ADP方法模仿了某些基本的戰斗機機動和分段戰術。

付費5元查看完整內容

近日,美國智庫蘭德發布《用博弈論和人工智能洞悉太空競爭和沖突動態》,講述了通過博弈論和人工智能方法開發對太空競爭和沖突動態進行評估的模型過程。

報告指出

大國競爭經常在太空上演。隨著太空日益軍事化,了解這些國家在太空安全方面的投資以及投資的用途變得具有重要戰略意義。2014年,蘭德公司開始開發一種博弈論模型,以評估美國和競爭對手太空投資所產生的戰略影響。在此后的項目中,蘭德公司的研究人員在傳統博弈論的基礎上,對這些投資如何發揮作用進行了評估。雖然以前使用這一模型探索了投資對阻止地面戰爭升級到太空的影響,但在這里側重于評估太空競爭的動態。他們盡可能描述戰略互動模式;它們產生的條件;以及投資會如何塑造這些條件。但是,多數情況下,還沒有發現這些條件與由此產生的動態和戰略互動模式間的相關性。

為了對太空競爭進行深入評估,研究人員使用復雜的人工智能(AI)方法開發了一個更為復雜的模型。雖然發現這種復雜性增加了評估投資產生的可能情況,但也妨礙了他們隔離不同戰略互動模式條件的能力。這份報告不僅會對太空政策決策者提供參考,也會有助于使用人工智能模型進行探索性研究的人員。

研究問題

  • 假設太空領域意識(SDA)提高了一個國家防御動態攻擊的能力,那么這些提高的防御能力能阻止敵人攻擊嗎?它們會改變沖突的結果嗎?

  • 對對手進攻能力的誤解是穩定還是不穩定?這些誤解會改變沖突的結果嗎?

  • 當太空沖突發生時,各國是否會采取不同的攻擊策略,類似于在國際象棋比賽或其他戰略競賽中觀察到的策略?

研究發現

  • 提高對防御能力只是改變對手的戰術,而并非其戰略。如果攻擊太空資產實對手長期戰略意圖,降低他們首選攻擊對象的成功概率僅僅意味著他們將轉向下一個攻擊目標。

  • 當對手認為處于不利地位,或處于不利地位的對手被認為是對手時,錯誤認知就一直會延續。

  • 決定是否披露或隱藏攻擊能力的投資或實際程度并不容易,特別是考慮到并非所有潛在的空間對手都是同行競爭者。

在競爭中有三種戰略互動模式,在這些模式中,威懾失去作用,但沒有達到全面失效程度。

  • 在作戰早期形成階段,攻擊發生在地面沖突之前兩年或更久。

  • 在武器消耗戰中,雙方都將攻擊保留到地面戰爭開始之前或同時,雙方的攻擊主要集中在削弱對手的進攻能力。

  • 在橫向升級游戲中,攻擊是在地面沖突開始后很久進行的,并且集中于在對手從太空投射力量的能力上制造可利用的缺陷。

研究建議

  • 在博弈論模型中更好地理解因果關系,有助于描述構建沖突中起作用的力量。使用類似的博弈論方法可以進行有針對性的檢查,以闡明其中的因果關系。

  • 對太空中的戰略互動進行更針對性研究,可以幫助確定有利戰術,即使對手長期戰略保持不變。

  • 其他工作可以利用類似但更簡單的游戲模型,以及蘭德和其他人在戰略信息方面的現有工作,來確定感知的不確定性如何影響沖突結果和戰略互動模式。

報告目錄

第一章 介紹

第二章 方法學

第三章 防御性投資的戰略價值和進攻性投資的考慮因素

第四章 表征戰略互動模式

第五章 總結和對未來工作的建議

附錄A 項目階段概述

附錄B 游戲結構和方法

付費5元查看完整內容

美國陸軍工程研究與發展中心(ERDC)的研究實驗室目前正在開發仿真工具,以協助開發可選擇的載人、遠程操作和完全自主的車輛,重點是地形與車輛的交互,特別是在冬季地形條件下。其他ERDC實驗室與地面車輛系統司令部(GVSC)一起,重點研究保證位置、時間和導航,該司令部正在進行開發可選擇的載人和自主平臺的研究,主要集中在車輛內部的硬件和軟件,很少強調外部安裝的地形傳感器或冬季操作環境。美國陸軍寒冷地區研究和工程實驗室(CRREL)在冬季和極端環境下進行車輛機動性研究,這在模擬和開發可選的載人和自主車輛方面是需要的。這項工作的范圍是調查人工智能和機器學習對冬季條件下運行的軍用車輛的適用性。本文描述了實現這一目標的初步努力。

自主車輛在民用方面的應用正在成為現實。在智能駕駛輔助方面,第三級車輛自主性(智能巡航控制、行人識別、自動剎車、盲區傳感器、罕見的交叉交通警報、避免碰撞等)已在商業和私人車輛上使用多年。第四和第五級自主性(有監督的自主性和完全無監督的自主性)目前正在試驗中。盡管在民用領域取得了重大進展,但軍用車輛的自主性仍然是一項相當具有挑戰性的任務。軍用自主車輛的主要區別是:非公路運行、未知地形的運行,以及在開放空間完全重新規劃路線的可能性。這種環境要求智能自主控制算法和環境感知與工業界的民用應用不同。具體來說,需要解決先進的和當前的地形感知、檢測無法通行的路線、確定可通行的替代路線和車輛在空地上的改道,以及針對特定地形條件和車輛的最佳車輛控制等任務。提交的工作描述了在解決其中一些挑戰方面的最新進展。結果表明,其中一些挑戰可以通過機器學習和人工智能算法成功解決,從而為軍用車輛的人工駕駛提供實質性幫助。

研究方法

絕大多數關于自主車輛的文獻都是在城市條件下的駕駛。非公路車輛沒有道路指引其軌跡,也沒有一致的駕駛地面,還必須考慮不平坦的三維地形、三維方向。這主張使用更復雜的人工智能方法,如PilotNet卷積神經網絡,最近通過攝像機記錄72小時在不同城市條件下的成功駕駛,并使用這些數據作為訓練集,來教車輛自我轉向(Bojarski等人,2017)。另一方面,在不使用神經網絡的情況下,收集了大量關于傳統自動車輛控制的知識。例如,DARPA 2005年挑戰團隊的獲勝者沒有使用神經網絡,而是依靠更傳統的自動控制算法來自動控制他們的機器人斯坦利(Thrun等人,2006)。為了利用這些知識,同時又與越野作業的挑戰性要求相關,我們建議實施一種混合方法,將人工智能和經典控制方法結合起來。

具體來說,我們建議使用神經網絡來持續確定和更新車輛行駛的地形類型,以及車輛的 "臨界值",即車輛沿途必須遵守的行動限制,如允許的最大速度、最大的加速和減速率,以及車輛的范圍和最大的轉向率。將使用兩種人工智能算法。一個用于自動地形分類,另一個用于預測由第一個算法確定的地形類型的關鍵控制值。通過使用神經網絡來預測臨界值,車載自主控制系統不需要專門考慮所有的地形類型和方向,而是適當地定制,以便根據當前的駕駛條件實時調整。圖3概述了模型的結構。當前的地形估計、地形類型和條件、期望的軌跡和車輛狀態將被用來預測速度、最大加速/減速率和轉向的關鍵約束。這些值將作為傳統的剎車/油門的比例積分衍生(PID)控制器和轉向的模型預測控制(MPC)控制器的目標值。然后,實際的車輛狀態將被評估,地形、臨界值和路線將被相應地更新,直到車輛到達預期的目的地。

圖3. 擬議的混合自主控制方法的結構:使用神經網絡預測給定地形類型、車輛方向、地形和表面條件的臨界值,并設置為自適應MPC或PID控制器的目標。

付費5元查看完整內容

本文介紹了一個使用人工神經網絡的人工智能模型,該模型提供了改善超視距(BVR)空戰飛行員態勢感知的參數。在這種作戰方式中,有必要根據來自傳感器(主要是雷達)的信息做出決策。此外,由于有關敵機系統的信息有時是未知的,而飛行員的決策通常是基于對手的。所提出的模型建議處理這些特征,為在建設性模擬環境中的實體進行行為生成,即模擬人操作系統。我們創建了兩架飛機之間的BVR空戰模擬,每架飛機只有一枚導彈,通過拉丁超立方采樣(LHS)來選擇輸入變量,幾乎均勻地覆蓋所有的范圍。這些飛機有類似的行為,它們的參數只在模擬開始時發生變化。仿真環境生成一萬個空戰場景,改變了三十六個輸入參數,用于案例研究中提出的分析。從這些數據中,我們可以創建監督機器學習模型,大大提高BVR空戰飛行員對進攻情況的態勢感知能力,在這種情況下,參考飛機使用導彈攻擊目標或防御陣地,而不是參考飛機試圖避免敵人導彈向其方向發射。進攻型和防御型模型的準確度分別為0.930和0.924,F1分數為0.717和0.678。因此,這項工作的貢獻是使用機器學習算法來產生有關戰術狀態的反應,以提高飛行員的態勢感知,從而改善飛行中的決策過程。

源代碼說明

  • 1-EDA.ipynb:探索性數據分析。
  • 2-Feature-Selection.ipynb:使用ANOVA-f統計和互信息統計的特征選擇技術。
  • 3-ANN-分類-攻擊.ipynb:使用人工神經網絡對攻擊數據進行分類模型的訓練和評估。
  • 4-ANN-分類-防御.ipynb:使用人工神經網絡對防御數據的分類模型進行訓練和評估。
付費5元查看完整內容

美國海軍和國防部(DOD)正在優先考慮在各戰爭領域迅速采用人工智能(AI),以保持對美國有利的技術優勢。機器學習(ML)是最近人工智能發展的基礎,它存在著一個持續的、沒有得到充分解決的關鍵缺陷:對抗性樣本。自2013年發現以來,在深度神經網絡(DNN)分類器中出現了許多新形式的對抗性樣本攻擊,并提出了許多狹義和特殊的防御措施。這些防御措施都沒有經受住反測試。一些研究人員提出,這種易受攻擊性可能是不可避免的。到目前為止,還沒有發現有效的、可計算的、通用的方法,可以加固DNN,使其免受這種和相關的泛化問題的影響。我們的前提是,ML模型對所有對抗性樣本的魯棒性與抵抗力,可以通過將模型分類空間數據密集區之間的數據點稀疏的潛在空間,作為障礙隔離來改進。我們研究了兩種不同的方法來實現這種對基于對抗性樣本的攻擊防御,測試這些防御對最有效的攻擊,并將結果與現有的技術狀態的防御進行比較。

第一章 引言

人工智能(AI)已被提出來作為推進國防部能力的一個關鍵推動因素。人工智能國家安全委員會在其最終報告中寫道:"如果我們的武裝部隊不加速采用人工智能,他們的軍事技術競爭優勢可能會在未來十年內喪失",建議 "美國現在必須采取行動,將人工智能系統投入使用,并在人工智能創新方面投入大量資源,以保護其安全,促進其繁榮,并保障民主的未來" [1]。鑒于人工智能或更具體地說,深度神經網絡(DNN)中的機器學習(ML)最近在科學和工業領域取得了廣泛的突破,這種關注無疑是恰當的。然而,在國防應用中利用ML和其他現代 "深度學習 "方法并非沒有其固有的附加風險。

最近的人工智能主張已經近乎夸大其詞;當然,在與軍事和文職領導層的高層溝通中,也發生了一些夸大其詞的情況。作為這種夸張的例子,參考一下《2019年美國總統經濟報告》是如何向美國領導人介紹機器視覺方面的人工智能狀況的。在第343頁題為 "2010-17年人工智能和人類的圖像分類錯誤率 "的圖表中,它顯示了 "人類分類 "錯誤率與機器分類錯誤率將在2015年超過人類圖像分類能力。對這一說法仔細考慮并對參考研究甚至是當前最先進研究進行檢查,顯示這一特殊的發展仍然是一個遙遠的、尚未達到的里程碑。

1.1 深度學習的突破

即使ML仍然存在挑戰,近年來,機器學習在科學、工業和商業領域的成功應用也在急劇增加。深度神經網絡已經在自然語言處理、天文學、癌癥診斷、蛋白質折疊、語音識別和機器視覺等不同領域取得了巨大的進步[2]-[8]。因此,這類系統的潛在軍事應用同樣比比皆是:分析頻譜上下的聲學和電磁傳感器數據、機器視覺、尋找-修復-跟蹤和瞄準對手的飛機、地下、水面和陸地戰斗人員、人類語言處理、語音識別、自主空中/地面/地下/陸地車輛、信息戰、情報、監視和偵察(ISR)整合、機器人技術、網絡防御、網絡攻擊、戰術決策輔助,等等。

1.2 深度學習的脆弱性

盡管這項技術帶來了巨大進步,但目前的ML分類方法創建的模型在其核心上是有缺陷的,因為它們非常容易受到對抗性樣本攻擊和相關欺騙技術的影響[9]。廣義上講,文獻中定義的這類攻擊有三類:探索性攻擊、逃避性攻擊和中毒性攻擊。在本報告中,我們主要關注防御我們認為最關鍵的需求,即逃避攻擊。為了提供背景,我們簡要地概述了這三種攻擊。探索性攻擊,對手并不試圖實現錯誤分類,而是試圖通過精心設計輸入來獲得模型的知識,這些輸入的結果將提供關于模型內部狀態的信息,其目的是減少模型的不確定性,以支持未來的攻擊。中毒攻擊試圖在訓練期間修改模型,以偷偷地完成模型的一些未被發現的行為變化。最后,在逃避攻擊中,攻擊者不知不覺地修改了人工制定或模型的輸入,以產生分類的變化,從良性的或最初設定的類別到一些其他的、欺騙性的不真實的類別[10]。這最后一類是我們防御的重點,從這一點出發,我們把這些簡單地稱為對抗性樣本攻擊[11]。

自從2013年最初發現DNN分類器中的對抗性攻擊(逃避)以來,已經出現了許多種這樣的攻擊,并且至少提出了同樣多的狹義的特定防御措施作為回應。不幸的是,到目前為止,所提出的防御措施沒有一個能經受住反測試和適應性攻擊[12]。一些研究人員提出,這種易感性可能是空間中問題表述的一個不可避免的特征[13]。目前,還沒有發現一種有效的、計算上可接受的、通用的方法,可以支撐DNN對抗類似的相關的泛化問題[12], [14]。

1.3 國防部(DoD)的影響

在國防部的范圍內,大家都承認欺騙在戰爭中起著核心作用。因此,戰爭系統必須被設計成對欺騙有高度的適應性[15]。馬基雅弗利在“Prince”中寫道:"......雖然在任何行動中使用欺騙都是可憎的,但在發動戰爭時,它是值得稱贊的,并能帶來名聲:用欺騙征服敵人與用武力征服敵人一樣受到稱贊。" 對孫子來說,這甚至是更重要的因素,"所有的戰爭都是基于欺騙"。在國防應用中,至關重要的是,不僅系統在戰斗開始時就如設計之處那樣工作,而且它們應該具備有彈性對狡猾的、有同樣資源和動機的對手的潛在計劃。

誠然,ML在民用和科學方面已經取得了巨大的成功。盡管民用工業技術領域與軍事技術需求有很大的內在交集,但應該注意到,后者并不是前者的完美子集。也就是說,戰爭的現實要求其技術必須為虛假信息和故意欺騙的行動、展示和通信做好準備。這兩個領域之間的這些不同假設意味著,在一個領域已經準備好的東西,在另一個領域可能還沒有準備好。在整個國防部,納入這些技術的系統正在被考慮、開發,在某些情況下已經被采用,目的是增強或取代我們一些最關鍵的國家安全能力。在軍事應用中,特別是武器系統和殺傷鏈內的系統,必須消除或至少減少對抗樣本,并對其進行補償,使故障呈現最小的風險。其余的風險必須被明確指出、發現并被作戰人員充分理解。不仔細和充分地解決這個問題是不可想象的,否則我們就有可能采用脆弱性技術,將災難性的漏洞引入我們關鍵戰爭系統。

1.4 增強防御措施

在防御基于機器學習技術的系統不受欺騙的潛在戰略背景下,我們介紹了一種防御措施。我們的前提是,ML模型對所有對抗性樣本的魯棒性與抵抗力,可以在模型分類器的分類空間數據密集區之間的數據點稀疏潛在空間中插入一個 "填充 "或 "屏障 "的方法來提高[13], [16]。我們相信,通過統計學插值或采用變分自動編碼器(VAE)[17]或生成對抗網絡(GAN)[18]來插值和投射到這個空間的模型可以創建人工填充類樣本來增加數據集,所產生的模型將能夠成功地區分合法數據點和對抗性樣本,同時保持與最先進分類方法相稱的準確性。

付費5元查看完整內容

摘要

拒絕和欺騙(D&D)技術利用錯誤信息和對手的認知偏差,長期以來一直是混合作戰的一部分。這種戰術給傳統上由人類分析員制作的情報、監視和偵察(ISR)產品帶來了不確定性和懷疑。在一個由人工智能(AI)擴散主導的未來戰斗空間中,算法生成的ISR產品數量可能會增加。因此,D&D戰術將越來越多地被顛覆人類而非機器推理的需要所驅動。對抗性機器學習(AML)的發展,即對欺騙性人工智能的研究,對未來混合作戰空間中的實踐狀態有重大影響。**本文回顧了對抗性機器學習技術之間的關鍵區別,以及它們對敵方對作戰人工智能的了解和訪問做出的假設。然后,我們總結了我們團隊最近與混合作戰有關的幾個對抗機器學習研究方向:對成像系統的物理對抗性攻擊,數據中毒攻擊,以及AML與設計強大的人工智能系統的相關性。

引言

混合戰爭指的是使用顛覆性的、非軍事的手段來推進民族國家的利益,特別是俄羅斯近年來采用的技術,在不訴諸公開的、常規的軍事行動的情況下占領領土并影響各國的政治和政策[1]。所采用的混合戰術包括網絡攻擊、動員智能體團體采取行動、施加經濟影響以及其他秘密措施。由于混合作戰存在于常規軍事沖突和平民生活之間的 "灰色地帶",因此戰術上采用了拒絕和欺騙(D&D),通過利用民眾或敵對勢力的認知偏差來迷惑、威懾或影響理想的行為。D&D戰術在常規戰場上的歷史使用是有據可查的[3]。有效的D&D技術通過對依賴人類專家分析的軍事情報、監視和偵察(ISR)產品產生懷疑而獲得成功。在混合軍事行動中,情況不一定如此,在混合軍事行動中,D&D也可能試圖影響平民的看法。此外,隨著人工智能(AI)成為國家軍事投資戰略的重點(如[4]和[5]),以及商業信息技術部門越來越多地采用人工智能[6],人工智能在未來的 "灰色地帶 "可能會無處不在。因此,我們必須考慮在未來由人工智能的使用主導的混合戰斗空間中可能存在的D&D威脅。

當前的人工智能能力是由機器學習的進步所帶來的,特別是在深度學習這個子領域,在過去的10年里。機器學習(ML)涉及將系統的輸入映射到預測結果的問題,例如,將車輛的圖像映射到一個類別的標簽。通常情況下,這是在大型數據集中通過統計模式識別實現的。深度學習具體涉及到多層神經網絡的使用,它是具有數百萬自由參數的高度非線性回歸模型,作為模式識別的統計模型。雖然深度網絡在各種任務上的表現優于人類(最著名的是圖像分類[7]),但在諸如[8]和[9]等作品中觀察到它們容易被愚弄之后,對抗性機器學習(AML)領域作為一個活躍的研究領域出現了。許多作者指出,ML算法所犯的錯誤可能會在民用領域產生嚴重后果[10]-[15]。我們也認為必須提出類似的擔憂,即軍事人工智能系統在常規戰場和混合戰斗空間中的脆弱性。

本文的其余部分組織如下:第2.0節將提供關于對抗性機器學習的進一步背景介紹,以及我們認為目前在解決其與混合軍事行動的相關性方面存在的差距。在第3.0節中,我們描述了約翰霍普金斯大學應用物理實驗室(JHU/APL)目前正在進行的三項研究工作,以解決這些知識差距。最后,我們在第4.0節中做了總結性發言,并總結了我們到目前為止的發現。

圖1. 使用深度學習模型將貓的圖像識別為 "鴕鳥 "的對抗性實例的例子

圖 6. AI 開發周期(圓形流程圖)和采用機器學習的典型算法步驟(橙色大框)。

付費5元查看完整內容

摘要

步兵模擬(IWARS)是一個實體級的戰斗模擬,通常用于估計使用不同裝備(包括手榴彈和榴彈發射器)造成的作戰效能差異。當一枚模擬手榴彈在IWARS中爆炸時,對附近人員的影響是通過查詢一個高分辨率模型預先計算出的喪失能力的概率值來確定的。這個值取決于許多因素,因此需要一個大的查詢表,可能會超過數據庫的最大容量。為了解決這個問題,創建了一個神經網絡輸入選項,讓分析師有機會使用高度壓縮的數據而不犧牲準確性或運行時間。以前的壓縮技術要么不太準確,要么提供較低的壓縮率。
這項研究是在2019財年進行的,是題為 "機器學習技術協助生成項目級性能估計,用于班級和士兵級作戰評估 "的研究的一部分。該研究的另一半將在另一份報告中討論。在這一半的研究中,梯度增強的決策樹被用來成功地預測人類主題專家(SMEs)的代理決定。(當所要求的系統沒有數據時,一個類似的系統通常被用作代用。) 訓練有素的決策樹模型可以用來為未來的數據請求建議代理,減少滿足這些請求所需的時間并提高所提供數據的準確性。

簡介

背景

步兵模擬(IWARS)是一個實體級的戰斗模擬,重點是下馬的士兵、班和排,通常被陸軍用來估計使用不同裝備造成的作戰效率的差異。特別是,IWARS被用來比較不同手榴彈和榴彈發射器的有效性[1, 2, 3],幫助指導這些系統的開發和采購。

問題陳述

當一個模擬的手榴彈在IWARS中爆炸時,對附近人員的影響是通過查詢一個高分辨率模型預先計算出來的喪失能力的概率(P(I))值來確定的。P(I)值取決于許多因素,包括目標的姿態、防彈衣和任務(攻擊或防御),以及彈藥的下落角度、爆炸高度、爆炸到目標的范圍、爆炸到目標的方位角和爆炸后的時間。由于有這么多的因素,P(I)查詢表可能非常大。事實上,一個高分辨率的查詢表往往太大,無法裝入IWARS數據庫的最大容量約150兆字節。
為了解決這個問題,分析人員可以將IWARS數據庫分成更小的部分。例如,對12種新型空爆手榴彈的分析可以通過建立12個IWARS數據庫來進行,每種手榴彈一個數據庫。如果描述一種手榴彈的殺傷力數據太大,或者在特定情況下需要一種以上的手榴彈,但只有一種手榴彈的殺傷力數據可以放入一個數據庫,那么這種策略就會失敗。此外,即使這種策略是可行的,也有缺點:任何額外的數據庫變化都必須被鏡像12次,而且數據庫的大小會降低IWARS和數據庫編輯工具的速度。
另外,分析人員可以通過使用低分辨率的P(I)數據來規避數據庫的大小限制。這通常是通過刪除某些突發高度和突發到目標的范圍,并將突發到目標的方位角組的P(I)值平均化來實現的。這降低了模擬的準確性,也降低了對結果的信心。

目的

本文的目的是記錄這個問題的一個新的解決方案,這個方案在所有情況下都有效,而且幾乎沒有精度損失或模型運行時間的增加。它可以描述如下:
1.訓練人工神經網絡來學習P(I)值。然后,神經網絡的參數值將對原始P(I)數據進行編碼,從而對其進行壓縮。
2.在IWARS中重新創建這些神經網絡,以便在需要時估計P(I)值。

圖1:具有三個隱藏層的人工神經網絡的圖形和代數表示。
付費5元查看完整內容

美國的空中優勢是美國威懾力的基石,正受到競爭對手的挑戰。機器學習 (ML) 的普及只會加劇這種威脅。應對這一挑戰的一種潛在方法是更有效地使用自動化來實現任務規劃的新方法。

本報告展示了概念驗證人工智能 (AI) 系統的原型,以幫助開發和評估空中領域的新作戰概念。該原型平臺集成了開源深度學習框架、當代算法以及用于模擬、集成和建模的高級框架——美國國防部標準的戰斗模擬工具。目標是利用人工智能系統通過大規模回放學習、從經驗中概括和改進重復的能力,以加速和豐富作戰概念的發展。

在本報告中,作者討論了人工智能智能體在高度簡化的壓制敵方防空任務版本中精心策劃的協作行為。初步研究結果突出了強化學習 (RL) 解決復雜、協作的空中任務規劃問題的潛力,以及這種方法面臨的一些重大挑戰。

研究問題

  • 當代 ML 智能體能否被訓練以有效地展示智能任務規劃行為,而不需要數十億可能情況組合的訓練數據?
  • 機器智能體能否學習使用攻擊機、干擾機和誘餌飛機的組合來對抗地對空導彈 (SAM) 的策略?干擾機需要離地空導彈足夠近才能影響它們,但又要保持足夠遠,以免它們被擊落。誘餌需要在正確的時間分散 SAM 對前鋒的注意力。
  • 是否可以建立足夠泛化的表示來捕捉規劃問題的豐富性?吸取的經驗教訓能否概括威脅位置、類型和數量的變化?

主要發現

RL 可以解決復雜的規劃問題,但仍有局限性,而且這種方法仍然存在挑戰

  • 純 RL 算法效率低下,容易出現學習崩潰。
  • 近端策略優化是最近朝著解決學習崩潰問題的正確方向邁出的一步:它具有內置約束,可防止網絡參數在每次迭代中發生太大變化。
  • 機器學習智能體能夠學習合作策略。在模擬中,攻擊機與 SAM 上的干擾或誘餌效應協同作用。
  • 經過訓練的算法應該能夠相當容易地處理任務參數(資產的數量和位置)的變化。
  • 很少有關于成功和不成功任務的真實數據。與用于訓練當代 ML 系統的大量數據相比,很少有真正的任務是針對防空飛行的,而且幾乎所有任務都取得了成功。
  • 對于涉及使用大型模擬代替大型數據集的分析,所需的計算負擔將繼續是一個重大挑戰。針對現實威脅(數十個 SAM)訓練現實能力集(數十個平臺)所需的計算能力和時間的擴展仍不清楚。
  • 建立對人工智能算法的信任將需要更詳盡的測試以及算法可驗證性、安全性和邊界保證方面的根本性進步。

建議

  • 未來關于自動化任務規劃的工作應該集中在開發強大的多智能體算法上。RL 問題中的獎勵函數可以以意想不到的方式徹底改變 AI 行為。在設計此類功能時必須小心謹慎,以準確捕捉風險和意圖。
  • 盡管模擬環境在數據稀缺問題中至關重要,但應調整模擬以平衡速度(較低的計算要求)與準確性(現實世界的可轉移性)。
付費5元查看完整內容

當前的海軍作戰要求水手們根據動態作戰環境中的不確定態勢信息做出時間緊迫和高風險的決策。最近的悲慘事件導致了不必要的傷亡,海軍行動中涉及決策復雜性,并特別突出了 OODA 循環(觀察、定向、決策和評估)中的挑戰。涉及使用武器系統的殺傷鏈決策是 OODA 循環中一個特別緊張的類別——具有難以確定的意外威脅、縮短的決策反應時間和致命的后果。有效的殺傷鏈需要正確設置和使用船上傳感器;未知接觸者的識別和分類;基于運動學和智能的接觸意圖分析;環境意識;以及決策分析和資源選擇。

該項目探索了使用自動化和人工智能 (AI) 來改進海軍殺傷鏈決策。該團隊研究了海軍殺傷鏈功能,并為每個功能制定了特定的評估標準,以確定特定 AI 方法的功效。該團隊確定并研究了 AI 方法,并應用評估標準將特定的 AI 方法映射到特定的殺傷鏈功能

圖:利用人工智能改進海軍殺傷鏈的作戰概念

總結

當前的海軍行動通常是快節奏的、關鍵的,并且需要做出高風險的決策,這些決策有時基于非常動態的戰區中的不確定信息。許多例子強調了提高決策效率的必要性以及減輕觀察團隊負擔的必要性。缺乏上述情況的例子包括 2017 年的菲茨杰拉德號航空母艦 (DDG 62) 和 MV ACX Crystal相撞,以及 2009 年皇家港口號航空母艦 (CG 73) 的擱淺。一些根本原因是相關人員缺乏經驗、疲勞和壓力.

上述事故展示了軍事行動的難度,并展示了 OODA(觀察、定向、決策和評估)循環中的挑戰(Jones 等人,2020 年)。人為錯誤、人的認知限制和海軍作戰固有的決策復雜性導致了 OODA 循環中的挑戰,更具體地說,是殺傷鏈過程中的挑戰。

現代戰斗空間由來自常規陸地、空中和海洋等多個領域以及來自太空和網絡空間的大量數據組成。決策者需要考慮許多因素,包括交戰規則 (ROE)、要使用的武器、傳感器和意圖評估。發現、修復、跟蹤、瞄準、參與、評估 (F2T2EA) 殺傷鏈模型緩解了該過程的一些困難(參謀長聯席會議,2013 年)。人工智能 (AI) 和機器學習 (ML) 可以通過分析備選方案和使用評估標準將 AI 方法映射到殺傷鏈功能,從而幫助海軍在戰術領域做出殺傷鏈決策。這是在本報告的五個章節中分三個階段完成的。

本報告利用了數百個資源,主要利用了美海軍研究生院 AI-OODA 團隊在其 Capstone 報告(2020 年)中進行的先前研究,“利用人工智能 (AI) 進行空中和導彈防御 (AMD):以結果為導向的決策援助。”他們將他們的工作與 John Boyd 的觀察、定向、決定和行動決策框架相結合。作為他們分析的初步步驟,AI-OODA 團隊將特定的 OODA 功能明確且緊密地耦合到特定的 F2T2EA 功能。然而,本報告斷言 OODA 循環是一個決策循環,它嵌套在殺傷鏈的每個功能中,而不是在高壓力或低壓力情況下專門映射到一個或多個殺傷鏈功能。團隊基于 F2T2EA 模型開發了一組 28 個殺傷鏈功能。

在制定將 AI 方法映射到殺傷鏈的評估標準時,很難確定一個好的決策,這對于決策評估至關重要。在評估決策時,必須考慮選擇行動時的知識意識狀態以及解釋能力。使用了幾種對決策進行評分的方法,從定義和優先考慮感興趣的“武器-目標”到制定評分標準和報告評估結果,以供其他人審查。

目前,人工智能的狀態非常廣泛,必須對其進行解釋,以了解人工智能對殺傷鏈中功能的適用性。本報告討論了所選 AI 方法的高級概述,并突出顯示了部分最流行的方法。首先,沒有普遍接受的定義,這很難定義人工智能。其次,人工智能與機器學習 (ML) 存在差異。 ML 允許在準確性和可預測性方面取得增量收益; AI 接收數據并通過算法提供輸出。人工智能的歷史從 1940 年代艾倫·圖靈 (Alan Turing) 的加密機器到 1980 年代美國政府在戰略計算計劃中的使用,再到今天在聯合人工智能中心 (JAIC) 中的人工智能戰略五個支柱,從領先的人工智能人力到安全和倫理。美國國防高級研究計劃局 (DARPA) 在 3-wave 框架中描述了 AI 的發展方向,分為手工知識 (Wave 1)、統計學習 (Wave 2) 和上下文推理 (Wave 3) 在 1-4 個維度內情報參數的屬性(Launchbury 2017)。這些屬性包括感知、推理、抽象和學習。

人工智能涉及可以根據輸入值預測結果的監督學習。有幾種使用監督學習進行學習的技術。包括線性回歸和分類。此外,許多數值方法可以分析發生的學習有效性,例如 F-score 和 Accuracy score。人工智能還可以使用無監督學習,它使用算法來發現未標記數據集中的數據模式或分組。在分析未知(y)響應以揭示標記(x)數據中的模式時,無監督學習是有益的。數據分析界的一個著名例子是鳶尾花(Iris flower)數據集。僅使用標記的數據,可以看到響應聚集在一起,并且可以確定響應中存在模式(花的種類)。無監督學習的方法包括聚類和 K-means,但還有其他方法。強化學習有一個代理能夠接收來自環境的反饋并理解基本目標。此外,正如 Sutton 和 Barto 在(2018 年)中解釋的那樣,探索和開發之間存在權衡。最后,生成對抗網絡 (GAN) 利用無監督學習和強化學習,通常用于神經網絡 (NN)。神經網絡是機器學習算法的極好來源,它有大量的輸入,而這些輸入又會產生大量的計算。 NN 非常適合用于模擬、自然語言處理、博弈論和計算機視覺。 NN 只是一種將輸入映射到輸出的簡單方法,可以在此過程中進行學習。然而,NN 可以被描述為一種“黑盒”學習技術,因為很難解釋正在發生的事情,并且通常需要一種可解釋的 AI (XAI) 技術。 XAI 的三個主要組成部分是可解釋模型、解釋界面和解釋心理學(Gunning 2019)。數據安全必須與“大數據”一起考慮,“大數據”是指非結構化、復雜和大型數據集,具有五個 v 特征:數量、速度(數據量隨時間變化的增加)、多樣性、真實性和價值。其他理論包括決策理論、模糊邏輯和效用函數

使用上述文獻綜述,該團隊開發了一個框架,用于將 AI/ML 映射到 AMD(空中導彈防御)殺傷鏈。采取了四個步驟:1) 建立模型框架,2) 確定決策點,3) 應用 AI/ML 方法,以及 4) 分析結果。該團隊確定了以下用于殺傷鏈映射分析的 AI/ML 方法:線性回歸、邏輯回歸、聚類、關聯、隨機森林、神經網絡、GAN 和樸素貝葉斯。評估標準被稱為“決策點”并提出四個問題:(1)所需輸出的類型是什么,(2)所需的學習類型是什么,(3)可解釋性(XAI)是什么水平需要,以及 (4) 需要多少個預測變量?該團隊通過基于一組決策點和評分過程評估每個殺傷鏈功能的每種方法來執行映射。對于被認為非常適合某項任務的方法,得分為+1,如果該方法適合但次優,則為0,如果該方法不適合該任務,則為–1。

該團隊進行了映射分析,根據與殺傷鏈的 28 個功能中的每一個功能相關的評估標準(決策點)分析 AI 方法。該團隊使用評分方法來確定每個殺傷鏈功能的最佳整體 AI/ML 分數。團隊的映射顯示為 0。

該團隊的 AI/ML 映射到殺傷鏈功能為國防部和海軍提供了兩個關鍵好處。首先,映射本身是設計和開發支持殺傷鏈決策的人工智能戰術決策輔助工具的重要起點和基礎。其次,該團隊將 AI 方法映射到殺傷鏈的分析過程可用于了解 AI 在許多其他軍事和非軍事領域的應用。識別適當的人工智能方法、制定評估標準和評分過程以及制定過程功能以進行分析映射的過程對于支持許多不同人工智能系統的工程具有深遠的潛力。

表1:AI/ML方法到殺傷鏈的映射

付費5元查看完整內容
北京阿比特科技有限公司