亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

本文介紹了海軍戰斗管理系統(CMS)的架構,該系統考慮了電子戰(EW)與人工智能(AI),以應對現代高超音速和低可觀測性威脅的戰斗環境,在這種環境下,反應時間可能很短,需要自動化。它使用一個反制案例研究作為數據需求,通過拍賣傳感器任務分配、人工智能流程和數據融合實現認知復合傳感。論文還強調了已發布的關鍵認知電子戰能力,以證明該架構的合理性。該架構的目標是用高反應時間的自動化人工智能認知決策器(DM)取代人類決策者。

在電子戰(EW)中應用人工智能(AI)時,它不僅要有助于決策者(DM)的態勢感知(SA),還要滿足點、面、區防御以及反目標活動的需要。電磁頻譜非常密集,有許多通信和雷達發射器。因此,將人工智能應用于能夠滿足 DM 需求的預警系統是一項挑戰。因此,它必須能夠分揀出感興趣的信號(SoI),如部隊信號和與指定任務無關的信號。這項工作的基礎是 “常規戰爭 ”中的反導反應,以便與傳統交戰進行更直接的比較。影響反艦導彈(ASM)成功與否的一些主要因素包括雷達截面(RCS)、紅外截面(IRCS)、視覺和紫外線(UV)特征。因此,目標艦艇的特征是決定被動軟殺傷反導措施(也稱為伎倆)性能的重要因素。不過,反艦導彈也可以使用主動雷達尋的來瞄準和跟蹤。因此,射頻(RF)和微波(MW)的截面特征以及光學輻射量子(或光子)、縱橫角和機動中的縱橫率都非常重要,并對其產生戰術影響。因此,現代作戰環境在處理電磁頻譜方面面臨挑戰,而人工智能自動化和自主化是應對這一挑戰的理想方式。

A. 動機、方法和局限性

本文描述了一種結構,其中包括使用箔條和干擾器的軟殺傷;使用導彈、火炮和火控系統的硬殺傷;以及用于跟蹤目標并協調軟殺傷和硬殺傷反應的指揮控制系統。本文僅限于假設反艦導彈在海上滑行時使用射頻主動雷達尋的進行瞄準和跟蹤。因此,這項工作的重點是信號管理、大型目標艦艇的規避機動、艦載被動型誘餌系統(如箔條和反射器)在反艦導彈跟蹤方案和交戰環境(包括風速和風向)方面的作戰性能。擊敗導彈威脅的一個基本因素是反應時間;隨著高超音速時代的到來,時間因素成為反應殺傷鏈的決定性因素。潛在導彈平臺的識別標準至關重要;它們將使精確打擊成為可能,并迅速讓反導系統消除發射平臺的威脅。由于反導彈連鎖反應的時間很短,人腦無法在短時間內計算大量信息并決定反應的類型,要么硬殺傷,要么軟殺傷,要么兩者兼而有之。因此,人類 DM 條令理論無法在遙遠的未來背景下使用,因為它要求對情況的分析速度、識別速度、對威脅的即時反應速度,以及在人類頭腦的指揮鏈中進行計算和決策,因此無法提供所需的反應時間。本文的最后一部分介紹了有助于加快平臺保護速度的體系結構,以定義 CMS 中的設備連接,以及一些已公布的關鍵技術。

B. 論文結構

第 1 節是引言、動機、方法和論文結構。第 2 節提供了需要架構支持的硬殺傷和軟殺傷的常規條令示例戰術和反制方法。第 2 節還介紹了軟殺傷反制方法的主動、被動和組合方法。此外,第 3 節是一個使用箔條和機動的交戰實例,展示了所需的關鍵數據。第 4 節介紹了所提出的人工智能/預警技術架構。最后,第 5 節是結論。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

在 2023 年 10 月于荷蘭舉行的 “弗里斯蘭旗幟 ”大型演習中,由虛擬戰斗機和建設性實體組成的合成環境被整合到演習中,以增強場景效果。虛擬飛行模擬器與實戰環境的整合是通過超高頻無線電和實用戰術數據鏈路完成的。本文介紹了用于實現集成的技術架構、互操作性和數據協議,并討論了該方法的瓶頸和潛力。此外,還探討了為實現(空中)培訓目的而對實時和虛擬資產進行更標準化整合的潛在改進和要求。

“弗里斯蘭旗幟”演習是每年在荷蘭舉行一次的 LSE 演習。該演習由荷蘭皇家空軍在呂伐登空軍基地主辦,向伙伴國開放北海上空歐洲最大的訓練區域之一,為期兩周。FF'23 的總體目標是在國際背景下進行合作訓練。演習場景要求規劃、協調和執行比一般日常訓練演習規模更大的任務。參加者來自鄰國和海外國家,帶來了各種第四代和第五代戰斗機,既有藍軍也有紅軍。任務包括防御性和進攻性變體,涉及空對空和空對地交戰組合。荷蘭皇家海軍、直升機中隊(攻擊和運輸)和特種部隊(SOF)也參與了多領域任務。LVC 試驗的具體目的是在實戰演習中注入虛擬和建設性實體,以增強場景效果。在訓練中,其作用是通過增加需要現場飛行員協調和溝通的參與者來增加任務的復雜性。簡而言之,虛擬實體的加入豐富了場景,增加了場景的培訓價值。它是對典型實戰演習的補充,因此模擬器飛行員的培訓相對于實戰飛行員的培訓是次要的。

圖 2.4. LVC 實驗的解決方案架構。虛線框表示相關功能,通常部署在相同的硬件或網絡上。藍色和紅色方框表示與特定部隊相關的能力。黃色表示 UHF 實時無線電網絡的存在。灰色表示提供通信功能(語音、數據、轉換)的硬件組件或獨立軟件工具。

付費5元查看完整內容

配備先進傳感器的無人平臺的集成有望提高態勢感知能力,緩解軍事行動中的 “戰爭迷霧”。然而,管理這些平臺涌入的大量數據給指揮與控制(C2)系統帶來了巨大挑戰。本研究提出了一種新穎的多智能體學習框架來應對這一挑戰。該方法可實現智能體與人類之間自主、安全的通信,進而實時形成可解釋的 “共同作戰圖景”(COP)。每個智能體將其感知和行動編碼為緊湊向量,然后通過傳輸、接收和解碼形成包含戰場上所有智能體(友方和敵方)當前狀態的 COP。利用深度強化學習(DRL),聯合訓練 COP 模型和智能體的行動選擇策略。展示了在全球定位系統失效和通信中斷等惡劣條件下的復原能力。在 Starcraft-2 模擬環境中進行了實驗驗證,以評估 COP 的精度和策略的魯棒性。報告顯示,COP 誤差小于 5%,策略可抵御各種對抗條件。總之,貢獻包括自主 COP 形成方法、通過分布式預測提高復原力以及聯合訓練 COP 模型和多智能體 RL 策略。這項研究推動了自適應和彈性 C2 的發展,促進了對異構無人平臺的有效控制。

圖:從學習到的交流中預測 COP 的框架概覽。在決策過程中確定并使用 COP。使用 QMIX作為 COP 集成的 MARL 方法示例。

配備先進傳感器的無人平臺的集成為減輕 “戰爭迷霧 ”和提高態勢感知能力帶來了希望。然而,管理和傳播來自此類平臺的大量數據對中央指揮與控制(C2)節點的信息處理能力構成了巨大挑戰,特別是考慮到隨著平臺數量的增加,數據量也會呈指數級增長。目前的人工處理方法不適合未來涉及無人平臺群的 C2 場景。在本研究中,我們提出了一個利用多智能體學習方法來克服這一障礙的框架。

我們考慮的框架是,智能體以自主方式相互通信(以及與人類通信),并以數據驅動的方式訓練這種通信功能。在每個時間步驟中,每個智能體都可以發送/接收一個實值信息向量。該向量是智能體感知或視場(FoV)的學習編碼。這些向量不易被對手解讀,因此可以實現安全的信息傳輸。

在接收方,必須對信息進行解碼,以恢復發送方的感知和行動。此外,還應將信息整合(隨時間匯總)到 “共同作戰圖像”(COP)中。與編碼器一樣,解碼器也是以數據驅動的方式學習的。在本文中,我們將 COP 的定義簡化為戰場上每個友方和敵方智能體的當前狀態(位置、健康狀況、護盾、武器等)。我們認為,COP 對決策智能體至關重要。

近年來,以數據驅動方式進行端到端訓練的人工智能/人工智能方法大有可為。在數據驅動型自主 COP 的背景下,一個優勢是無需對傳感器和執行器中的噪聲、對手的動態等做出建模假設。通過充分的訓練,我們的數據驅動方法將產生高度精確的 COP。

不過,ML 模型可能對訓練數據或訓練場景的偏差很敏感。這與陸軍 C2 場景中通常假設的 DDIL(拒絕、中斷、間歇和有限影響)環境形成了鮮明對比。我們的實驗強調評估對霧增加、全球定位系統失效和通信中斷(如干擾)的適應能力。

我們使用深度神經網絡(DNN)的深度學習實現了編碼器和解碼器的數據驅動端到端訓練。將 DNN 應用于 COP 形成的一個挑戰是通信中缺乏人類可解釋性。人類可解釋性對于人類操作員有效控制蜂群至關重要。例如,通過解釋通信,操作員可以理解蜂群用于(自主)決策的特征。我們的方法具有人機互換性,這意味著人類操作員可以解碼傳入的信息,并將自己的感知編碼,與蜂群進行交流。由此產生的 COP 使人類能夠指揮蜂群。

在實踐中,COP 被大量用于任務執行,例如,確保協調運動。我們假設,將 COP 納入自主決策智能體將產生彈性多智能體策略(例如,對敵方變化的彈性)。我們在實驗中將有 COP 和沒有 COP 的多智能體策略學習與多種最先進的方法進行了比較,并驗證了這一假設。

接下來,我們總結一下我們的方法。我們首先描述了我們的深度學習方案,其中每個智能體將其感知和行動編碼成緊湊向量并進行傳輸。各智能體共享底層嵌入向量空間,以實現對態勢的共同理解。每個智能體都要訓練一個編碼器-解碼器,以生成本地 COP。本地 COP 應與智能體的感知一致,并能預測行動區域內所有單元的狀態(包括位置)。

在不同的模擬場景、初始部隊配置和對手行動中,使用深度強化學習(DRL)對 COP 和智能體策略進行端到端訓練。訓練的輸出是一個編碼器-解碼器神經網絡(NN)和一個跨智能體共享的策略 NN。可通過多種方式對訓練進行配置:最小化帶寬、最大化對干擾(如信道噪聲、數據包丟失、GPS 干擾等)的恢復能力。該方法可用于協調信息收集任務。

實驗在星際爭霸-2(SC2)多智能體環境中進行。在 SC2 中模擬的多個藍方與紅方場景中,通過經驗觀察了方法的有效性。具體來說,在具有挑戰性和現實性的 TigerClaw 場景(圖 1)中測試和評估了方法,該場景由 DEVCOM 陸軍研究實驗室(ARL)和陸軍主題專家(SMEs)在美國佐治亞州摩爾堡的上尉職業課程中開發。

圖 1:(左)Tigerclaw場景中的狀態示例。(右)每個智能體的感知(本地觀察)和它們之間的通信聯系。

對 COP 的準確性和幻覺進行評估,以揭示有趣的訓練動態。在整個模擬過程中,方法生成的 COP 高度準確,誤差小于 5%(與地面實況相比)。為了測試策略的魯棒性,我們將我們的方法與多種最先進的多智能體 RL 方法和基線進行了比較。結果表明,我們的方法所制定的策略能夠抵御視覺范圍下降、通信能力下降、GPS 被拒絕以及場景變化等因素的影響。

總之,這項研究通過數據驅動的 COP 形成,實現了人在環內的異構自主平臺的指揮和控制,推動了自適應和彈性 C2 領域的發展。其貢獻如下:

  • 實時自主形成可解釋的共同行動圖像(COP)的方法,包括預測整個行動區域的敵方位置。

  • 由于利用智能體間的通信進行分布式 COP 預測,因此展示了對可視范圍和 GPS 拒絕的更強的應變能力。

  • 通過聯合訓練 COP 模型和多智能體 RL 策略,提高整體任務成功率。

付費5元查看完整內容

本文介紹了一種為戰場環境量身定制的動態三維場景感知創新系統,該系統利用配備雙目視覺和慣性測量單元(IMU)的無人智能體。該系統處理雙目視頻流和 IMU 數據,部署先進的深度學習技術,包括實例分割和密集光流預測,并通過專門策劃的目標數據集加以輔助。通過集成 ResNet101+FPN 骨干進行模型訓練,作戰單元類型識別準確率達到 91.8%,平均交叉比聯合(mIoU)為 0.808,平均精度(mAP)為 0.6064。動態場景定位和感知模塊利用這些深度學習輸出來完善姿態估計,并通過克服通常與 SLAM 方法相關的環境復雜性和運動引起的誤差來提高定位精度。

在模擬戰場元環境中進行的應用測試表明,與傳統的 ORB-SLAM2 立體方法相比,自定位精度提高了 44.2%。該系統能有效地跟蹤和注釋動態和靜態戰場元素,并利用智能體姿勢和目標移動的精確數據不斷更新全局地圖。這項工作不僅解決了戰場場景中的動態復雜性和潛在信息丟失問題,還為未來增強網絡能力和環境重建方法奠定了基礎框架。未來的發展將側重于作戰單元模型的精確識別、多代理協作以及三維場景感知的應用,以推進聯合作戰場景中的實時決策和戰術規劃。這種方法在豐富戰場元宇宙、促進深度人機交互和指導實際軍事應用方面具有巨大潛力。

付費5元查看完整內容

首先介紹了美軍和北約數據鏈系統的發展情況,然后將未來智能數據鏈的發展趨勢歸納為集成化、通用化、多功能化和高安全性。提出了基于全局作戰云的單元級作戰系統架構,能夠實現全局作戰資源的靈活調度和整體作戰效能的最大化。智能數據鏈是該方案的重要組成部分,為未來城市單元級作戰提供了強有力的信息支撐。

基于作戰云的單元級系統架構

基于上述思考,我們聚焦城市單元作戰場景,提出了基于數據鏈支撐的全球作戰云的單元級系統架構,整體結構如圖 2 所示。

整個架構處于典型的單元級城市作戰場景,由地面無人協同單元、各類無人飛行器、機載高低軌衛星組成的星鏈、全球作戰云組成。在單元內部,各作戰單元通過自組網、現有5G/6G基站、星鏈等方式構建單元網絡,不同網絡鏈之間優勢互補、冗余備份、信息互通,共同構建單元級通信互聯網絡。

云的特點是資源虛擬化、管理彈性化、共享靈活化,將作戰資源有機聚合成作戰資源池,成為作戰云。本架構中的全局作戰云是一種云資源池,包含各類戰場信息、作戰資源和服務。具體來說,全局作戰云包含整個戰場的全局態勢信息、指揮員完成的實時決策信息、通信網絡資源、運算資源、基礎數據資源以及可調用的各類服務等。

在該架構中,每個作戰單元都是作戰云的一部分,將自身的作戰資源(包括武器裝備資源、戰場態勢感知等)上傳到作戰云構成資源池,同時還能夠通過作戰云實時了解戰場其他區域的實時態勢和可用資源,實現對戰場態勢的全局全知。更進一步,各作戰單元能夠通過作戰云調用所需的服務,如火力打擊支援、更高的通信帶寬資源等。因此,基于作戰云的架構,每個作戰單元都能獨立完成偵察、指揮、打擊中的一項或多項功能,最終實現群體智能實現作戰目標。

為了實現上述架構,需要一些關鍵技術。例如,整體作戰管理系統的設計、架構內通信網絡的構建、不同軍種作戰能力的整合方法等。其中,通信系統作為整體構架的通信保障和信息基礎,是構架作戰效能不可或缺的條件。

智能數據鏈作為通信系統的組成部分,在上述作戰云系統中發揮著非常重要的作用。各作戰單元與作戰云之間的裝藥信息、彈藥信息、打擊結果等作戰資源信息的傳輸,都將通過數據鏈完成。因此,數據鏈路系統必須順應未來智能化戰爭發展的趨勢和需求,形成空地融合、功能豐富、安全可靠的通信鏈路。

付費5元查看完整內容

本文概述了一種評估和量化與集成大型語言模型(LLMs)生成海軍作戰規劃有關風險的方法。其目的是探討大型語言模型在這方面的潛在優勢和挑戰,并提出一個全面風險評估框架的方法。

大型語言模型(LLM)是一種先進的人工智能系統,它在龐大的數據集上經過訓練,可以處理和生成文本,使其能夠執行從簡單的問題解答到復雜的內容創建等各種任務。大型語言模型,如 ChatGPT 和 Bard,在理解、解釋和生成人類語言方面已顯示出非凡的能力。它們在海軍作戰中的潛在用途可提供顯著的戰略優勢,如增強決策支持、情景分析和作戰計劃效率。然而,在敏感的軍事環境中部署這些先進的人工智能技術會帶來一些關鍵的風險問題,包括潛在的偏見、作戰安全問題以及人工智能生成戰略的可靠性。

這項研究的意義在于其重點關注大型語言模型在海軍作戰計劃生成中的整合。通過研究潛在風險并制定評估這些風險的框架,本研究旨在促進在這些海軍作戰環境中安全、戰略性地使用人工智能技術,同時使技術進步與作戰安全和有效性保持一致。

對現有文獻的回顧顯示,專門針對軍事應用中大型語言模型的全面風險評估框架存在空白。有關大型語言模型的研究主要集中于其技術能力和在民用環境中的應用。然而,軍事行動的獨特挑戰,尤其是在海軍環境中,需要一種專門的風險評估方法。本研究試圖通過開發一種基于海軍作戰計劃的具體要求和復雜性的方法來彌補這一差距。

研究方法

本研究的理論框架以貝葉斯網絡為基礎,貝葉斯網絡提供了一種結構化方法,用于模擬與 LLM 部署相關的各種風險因素之間的復雜關系。由于貝葉斯網絡能夠處理不確定性和概率關系,因此特別適合用于這一目的,使其成為評估海軍行動中 LLM 集成的多方面風險的理想工具。

本研究吸收了 Lauría 和 Duchessi(2007 年)概述的方法論中的見解,采用類似的結構化方法來構建貝葉斯網絡,并以實證數據收集和分析為基礎。我們的方法首先是編制和管理一份調查問卷,其答復將作為初始數據源,用于確定與海軍作戰計劃風險相關的變量之間最有可能存在的關系。這一過程為我們的貝葉斯網絡中每個節點的條件分布設置了后續參數。通過這種方法,我們旨在建立一個穩健的貝葉斯網絡模型,以準確反映與 LLM 生成的作戰計劃相關的風險的復雜相互依存關系和概率性質,并在分析更多作戰計劃和整合更多經驗數據時進一步完善我們的模型。

本研究的方法包括以下幾個關鍵步驟

  • 問卷編制與管理

  • 數據收集與分析

  • 貝葉斯網絡建模

  • 風險分類和評估

  • 問卷編制和管理 將設計一份詳細的調查問卷,以便從海軍人員、人工智能專家和軍事戰略家等廣泛的利益相關者那里收集信息。問卷將包含各種海軍作戰計劃,其中一些由 LLM 生成,另一些則由作戰規劃人員編寫,以確定這些計劃中的潛在風險途徑。

  • 數據收集與分析 將收集和分析調查問卷的答復,以確定海軍作戰計劃的關注領域。這一分析將為確定與作戰計劃相關的關鍵風險因素以及由 LLM 生成的計劃所特有的風險因素奠定基礎。

  • 貝葉斯網絡建模 將使用貝葉斯網絡對確定的風險因素進行建模,以了解其相互依存關系和這些風險的概率性質。該模型將作為一種動態工具,用于評估和直觀顯示這些生成的業務計劃的復雜風險狀況。

  • 風險分類和評估 通過調查問卷和貝葉斯網絡模型確定的風險將根據其對海軍行動的潛在影響進行分類和評估。這一步驟包括對每個風險因素進行全面評估,同時考慮其可能性和嚴重性。

分析

研究的分析階段包括對大型語言模型生成的假設計劃和人類戰略家創建的計劃進行比較研究。這種比較旨在突出 LLM 生成的計劃的優勢、局限性和潛在風險。此外,研究還將探討降低已識別風險的策略,如納入制衡機制、提高透明度和確保持續驗證 LLM 的產出。

這項研究預計將產生幾項重要成果:

  • 從利益相關者反饋和貝葉斯網絡分析中得出的與海軍作戰規劃中使用大型語言模型相關的風險因素綜合清單。
  • 評估已確定風險的結構化框架,為決策者評估和減輕將大型語言模型納入作戰規劃的潛在挑戰提供依據。
  • 對大型語言模型生成的計劃和人工創建的計劃進行比較分析的結果,為了解大型語言模型在業務規劃方面的能力和局限性提供了寶貴的見解。
  • 降低已識別風險的建議,確保在將大型語言模型納入實際行動時,既能實現最大效益,又能將潛在弊端降至最低。

初步結果

在此,使用 ChatGPT 生成了一個基于以下指揮官意圖的虛構作戰計劃樣本: "我的意圖是支持菲律賓武裝部隊在菲律賓中部受災地區開展人道主義援助和災難響應(HA/DR)行動。我們將提供一切可用的援助,以減輕人類痛苦并恢復正常狀態"(圖 1)。

圖1:ChatGPT生成的行動計劃

LLM 為菲律賓中部地區虛構的 HA/DR 行動制定的行動計劃展示了該模型構建全面響應戰略的能力。不過,它也凸顯了與 LLM 生成的計劃相關的幾個潛在風險。

該計劃概述了在帕奈島建立一個前沿行動基地,但沒有考慮該島目前支持此類行動的能力或對當地社區的潛在影響。這種疏忽可能會使當地資源緊張或擾亂地方當局正在進行的恢復工作。

使用無人機進行即時空中勘測的假設是,可以快速、準確地確定最需要幫助的地區。然而,這種方法可能無法考慮快速變化的天氣條件或評估后出現的新緊急情況,從而可能導致資源分配不當。

如果出現不可預見的技術問題,或同時需要直升機執行多項緊急任務,那么依靠海軍直升機在公路無法到達的地區進行空投可能會出現問題。這凸顯出可能會過度依賴特定資產,而不考慮替代或后備交付方法。

恢復階段建議協助恢復關鍵基礎設施,但沒有詳細說明參與范圍或開始撤出海軍資產的標準。這種不具體的做法可能導致過早撤離或超出海軍行動能力的長期參與,影響恢復工作的整體效果。

對這個由 LLM 生成的作戰計劃的審查不僅說明了人工智能在提高作戰計劃能力方面的潛力,而且也表明了我們為 LLM 生成的海軍作戰計劃開發綜合風險模型的研究工作的必要性。識別人工智能方法中固有的特定風險因素--如對當地基礎設施能力的假設、對技術的依賴以及計劃執行和完成標準的模糊性--表明需要一個能夠有效評估這些風險的框架,以便在使用這些工具時能夠考慮到這些風險。研究旨在通過使用方法來評估、分類和管理與在復雜作戰環境中部署大型語言模型相關的風險,從而彌補這些差距。通過整合這些風險模型,我們可以更好地確保負責任地利用大型語言模型的創新能力,提高作戰計劃的有效性和可靠性。

Palantir AIP(人工智能平臺)是將人工智能系統(包括許多依賴大型語言模型的能力)整合到運營環境中的尖端方法。雖然利用這些先進的工具可以讓組織利用人工智能系統的大型能力,但在 Palantir AIP 等平臺中使用大型語言模型清楚地表明,亟需對所有潛在的相關風險因素進行全面研究。隨著這些人工智能驅動的系統被部署到運營規劃的越來越多的重要方面進行協助和自動化,人工智能生成的內容的特殊細微差別成為重要的關注領域。

展望大型語言模型在海軍行動中的部署,會暴露出另一個風險途徑,特別是在支持此類技術所需的基礎設施方面。大型語言模型需要大量的計算和數據傳輸,還需要實時數據處理和無縫通信,以執行人工智能驅動的作戰計劃,這就要求網絡基礎設施不僅要有彈性,還要有很強的適應性。這就是軟件定義網絡(SDN)的潛在整合意義所在。SDN 以其靈活性和可配置性著稱,是一種先進的網絡框架,有可能支持 LLM 部署的要求。然而,SDN 的引入也帶來了關于現有海軍網絡基礎設施是否已準備好適應此類先進技術的問題,這突出了我們在海軍行動中引入人工智能能力時需要考慮的另一個領域。

本研究的預期結果對大型語言模型的戰略整合對未來海軍行動具有重大影響。通過提供一個全面的風險評估框架,本研究旨在促進在海軍行動中明智決策和負責任地使用人工智能技術,為在更廣泛的軍事背景下負責任地使用人工智能技術奠定基礎。此外,這項研究填補了文獻中的重要空白,有助于加深對海軍行動中整合 LLM 所帶來的挑戰和機遇的理解。

本研究概述了評估將大型語言模型納入海軍作戰計劃相關風險的綜合方法。通過開發結構化風險評估框架并探索部署 LLM 的潛在益處和挑戰,本研究旨在為在軍事行動中負責任地、有效地使用人工智能技術做出貢獻。未來的研究方向包括根據實證研究結果完善風險評估框架,探索大型語言模型在更廣泛軍事環境中的其他應用,以及制定在敏感作戰環境中合乎道德地使用人工智能的指導方針。

付費5元查看完整內容

為了真實地再現軍事行動,嚴肅的戰斗模擬要求建模實體具有合理的戰術行為。因此,必須定義作戰戰術、條令、交戰規則和行動概念。事實證明,強化學習可以在相關實體的行為邊界內生成廣泛的戰術行動。在多智能體地面作戰場景中,本文展示了人工智能(AI)應用如何制定戰略并向附屬單元提供命令,同時相應地執行任務。我們提出了一種將人類知識和責任與人工智能系統相結合的方法。為了在共同層面上進行交流,人工智能以自然語言下達命令和行動。這樣,人類操作員就可以扮演 "人在回路中 "的角色,對人工智能的推理進行驗證和評估。本文展示了自然語言與強化學習過程的成功整合。

RELEGS:針對復雜作戰情況的強化學習

為了獲得模型架構的靈感,我們研究了 DeepMind 的 AlphaStar 架構,因為它被認為是復雜 RL 問題領域的最先進架構。通過我們的架構(如圖 2 所示),我們提出了一種靈活、可擴展的行動空間與深度神經網絡相結合的適應性新方法。觀察空間的設計基于如何準備戰場的軍事經驗。通常使用地圖和可用部隊表。因此,模擬觀測被分為標量數據(如可用坦克數量及其彈藥)。同時,基于地圖的輸入作為視覺輸入提供給空間編碼器。

標量數據用于向人工智能提供幾乎所有場景細節的建議。其中包括有關自身部隊及其平臺的數據,以及有關敵方部隊的部分信息。輸入并非以絕對數字給出,而是采用歸一化方法來提高訓練效果。編碼器可以很容易地寫成多層感知器(MLP);不過,使用多頭注意力網絡可以大大提高訓練后智能體的質量,因此應予以采用(Vaswani 等人,2017 年)。

為了理解地理地形、距離和海拔高度的含義,人工智能會被輸入一個帶有實體編碼的地圖視覺表示。顏色方案基于三通道圖像,這使我們能夠輕松地將數據可視化。雖然使用更多通道會給人類的圖形顯示帶來問題,但人工智能能夠理解更多通道。不同的字段類型和實體會用特殊的顏色進行編碼,以便始終能夠區分。這種所謂的空間編碼器由多個卷積層組成。最初,我們嘗試使用 ResNet-50 (He 和 Zhang,2016 年)和 MobileNetV3 (Howard 等,2019 年)等著名架構,甚至使用預先訓練的權重。然而,這并沒有帶來可接受的訓練性能。因此,我們用自己的架構縮小了卷積神經網絡(CNN)的規模。

為了測試和優化這一架構,我們使用了一個自動編碼器設置,并使用了模擬中的真實樣本。我們能夠將參數數量從大約 200 萬減少到大約 47000。此外,我們還生成了一個預訓練模型,該模型已與模擬的真實觀測數據相匹配。這一步極大地幫助我們加快了 RL 進程。

一個可選元素是添加語言輸入,為人工智能定義任務。雖然一般的戰略人工智能不使用這一元素,但計劃將其用于下屬智能體。這些智能體將以自然語言接收來自戰略人工智能的任務,并使用雙向門控遞歸單元(GRU)編碼器對其進行處理。

視覺數據、任務數據和標量數據的編碼值被合并并輸入核心網絡。根據 Hochreiter 和 Schmidhuber(1997 年)的介紹,核心主要是一個擁有 768 個單元的長短期記憶(LSTM)組件。在軍事場景中,指揮官必須了解高價值資產的長期戰略規劃。在本模擬中,人工智能可以請求戰斗支援要素,這些要素在影響戰場之前需要長達 15 分鐘的時間。因此,人工智能必須了解未來任務的時間安排和規劃。在 RL 中使用 LSTM 網絡相當困難,因為它需要大量的訓練時間,而且會導致上面各層的梯度消失。因此,我們決定在 LSTM 上添加一個跳過連接,以盡量減少新增層的負面影響。

動作頭由一個自然語言處理(NLP)模型組成。這是一個非常簡化的動作頭模型,包含一個小型 LSTM 和一個額外的密集層,共有約 340000 個參數。其結果是一個尺寸為 8 x 125 的多離散動作空間。

除主模型外,還有一個單獨的價值網絡部分。價值網絡使用核心 LSTM 的輸出,并將對手信息串聯起來傳遞給 MLP。然后,MLP 可以精確預測價值函數。通過對手信息,價值網絡對模擬有了一個上帝般的地面實況視圖。由于該網絡只與訓練相關,因此可以在不干擾訓練完整性的情況下進行。

付費5元查看完整內容

近年來,槍支暴力事件急劇增加。目前,大多數安防系統都依賴于人工對大廳和大廳進行持續監控。隨著機器學習,特別是深度學習技術的發展,未來的閉路電視(CCTV)和安防系統應該能夠檢測威脅,并在需要時根據檢測結果采取行動。本文介紹了一種使用深度學習和圖像處理技術進行實時武器檢測的安防系統架構。該系統依靠處理視頻饋送,通過定期捕捉視頻饋送中的圖像來檢測攜帶不同類型武器的人員。這些圖像被輸入一個卷積神經網絡(CNN)。然后,CNN 會判斷圖像是否包含威脅。如果是威脅,它就會通過移動應用程序向保安人員發出警報,并向他們發送有關情況的圖像。經過測試,該系統的測試準確率達到 92.5%。此外,它還能在 1.6 秒內完成檢測。

付費5元查看完整內容

人工智能在空戰領域正變得越來越重要。目前,大多數空戰研究都假定所有飛機信息都是已知的。但在實際應用中,由于現實限制和傳感器誤差,一些飛機信息,如位置、姿態、速度等,可能是不正確的,或者是不可能獲得的。在本文中,我們提出了一種基于深度強化學習的框架,用于開發一種能夠在信息不足的部分可觀測馬爾可夫決策過程(POMDP)條件下執行可視范圍(WVR)內空對空作戰的模型。為了穩健地應對這種情況,我們使用了遞歸神經網絡,并應用了軟評價器(SAC)算法,以有效應對現實限制和傳感器誤差。此外,為了提高學習效率和效果,我們還應用了課程學習技術來限制狀態空間的探索范圍。最后,模擬和實驗結果表明,所提出的技術能夠在嘈雜的環境中處理傳感器限制和誤差引起的實際問題,同時還能高效地減少學習的訓練時間。

圖 2 顯示了本研究提出的空戰模型學習框架概覽,該框架由矢量化空戰模擬環境和包括重放緩沖器在內的循環 SAC 模塊組成。環境中有兩個動態模型:己方和目標。它們分別從 SAC 模塊的角色和基于規則的行為模型中獲得動作 at 和 atarget,并輸出飛機狀態 sownship 和 starget。模擬器根據這些狀態生成獎勵 rt 和觀測值 ot,同時考慮到配置的傳感器特性。軌跡(ot、at、rt)被存儲在重放緩沖區中,固定長度的軌跡序列將被采樣用于批判。

付費5元查看完整內容

陸軍分析中心(CAA)開發了戰略競爭和危機(SC2)兵棋,以解決美國陸軍在競爭和危機期間戰略規劃的不足。在兩年的時間里,該頂點項目加強了SC2兵棋。去年,畢業設計開發了一個動態的、基于視角的信譽模型,旨在將其集成到SC2中。今年,頂點計劃將該模型整合到一個更高效、以目標為中心的兵棋中,以優化高級軍事領導人的戰略學習。在前一年工作的基礎上,該畢業設計將系統決策過程的工具與國防和戰略研究部門的理論框架相結合,創建并實施了一個改進的產品。對游戲原始框架的分析發現了三個改進領域,分別涉及游戲的各個組成部分:以戰略為重點的玩家指南、逼真的談判配對過程以及通過玩家控制面板進行的實時反饋。

付費5元查看完整內容

本文描述了九個不同機構與海軍信息戰中心研究人員之間的合作成果,在美國海軍2019年三叉戟勇士演習的背景下,利用物聯網(IoT)在海軍艦艇上創建基于傳感器的態勢感知,部署、測試和展示隱私保護技術。在DARPA通過Brandeis項目的資助下,該團隊建立了一個綜合的物聯網數據管理中間件,名為TIPPERS,通過設計支持隱私,并整合了各種隱私增強技術(PET),包括差分隱私、加密數據的計算和細粒度的策略。我們描述了TIPPERS的架構及其在創建智能艦船方面的應用,該艦船提供物聯網支持的服務,如占用分析、跌倒檢測、檢測未經授權進入空間以及其他態勢感知場景。我們描述了創建物聯網空間的隱私影響,這些空間收集的數據可能包括個人數據(如位置),并分析了在這種情況下支持的PETs的隱私和效用之間的權衡。

TIPPERS物聯網平臺

TIPPERS是一個用于智能空間的新型傳感器數據收集和管理系統,它結合了各種智能空間的應用。TIPPERS架構的一個關鍵設計特點是,它與空間、傳感器和任務無關,允許它作為即插即用的技術來創建智能空間。此外,TIPPERS體現了一種隱私設計的架構,它能夠整合不同的隱私增強技術(PET)。特別是,在DARPA Brandeis項目的背景下,各種PET已經被整合,包括安全計算、隱私政策和DP(關于這些PET的更多信息,見附錄1(補充材料))。

TIPPERS設計

如圖 1 所示,TIPPERS 架構包括幾個決策,以支持設計隱私的目標。首先,TIPPERS通過在物聯網設備的世界(即傳感器、執行器、原始觀測值等)和人的世界(即人、空間、現象等的互動)之間進行轉換,提供底層傳感器基礎設施的抽象。該系統基于代表這兩個世界的領域模型,使用戶/開發者能夠與高層次語義的概念進行互動。還包括基于本體的翻譯算法,將高級用戶請求(例如,"降低入住率大于75%的房間的溫度")轉換成具體的底層設備基礎設施上的行動。其主要優點是,它簡化了智能應用的開發,并促進了它們在不同空間的可移植性,因為它們是建立在高級概念上,而不是建立在物聯網設備上。其次,它簡化了隱私策略的定義,因為用戶可以專注于他們想要保護的東西(例如,"當我在工作時間與約翰在一個私人空間時,不要捕捉我的位置")。TIPPERS使用這樣的隱私策略來指導其數據收集、存儲和共享行為。

圖1:TIPPERS架構

作為實現這種將原始數據轉化為更高層次的語義解釋的機制,TIPPERS支持虛擬傳感器,其中傳感器數據流可用于創建這種推斷的數據流。例如,虛擬傳感器可以將連接數據(例如,來自WiFi AP的日志,包含關于哪些設備連接到它們的信息)轉化為不同空間沿時間的占用情況。這使TIPPERS能夠納入進一步的PETs。例如,傳感器數據流在傳遞給運營商時,可以洗掉個人身份信息(PII)。

最后,TIPPERS架構包含一個調解模塊,將傳感器數據適當地存儲在相應的數據庫/存儲技術中(例如,允許使用不同的基礎數據庫系統)。這種調解包括三個部分,涉及TIPPERS模式、數據和查詢與數據庫系統之間的具體映射任務。這使得TIPPERS可以根據數據的特點、安全要求以及需要在數據上運行的查詢類型,將數據存儲在不同的系統中。利用這一功能,TIPPERS系統進一步包括安全的數據存儲技術,可以維護加密的數據并對這些加密的數據進行計算。

在TIPPERS中集成隱私增強技術(PET)

TIPPERS支持兩種方式將PETs整合到傳感器數據管理中。首先,TIPPERS支持的虛擬傳感器技術可以被利用來修改/擾亂與應用程序共享的傳感器數據流。這種修改可以包括洗刷敏感數據(例如,從圖像中刪除人臉或從傳感器數據中刪除標識符),添加噪音,取消數據的鏈接等。使用虛擬傳感器的一個很好的例子是整合PGS,使占用的數據流不同程度的私有化。

其次,TIPPERS支持系統和底層存儲機制之間的調解。例如,TIPPERS與PULSAR支持的FSS和MPC技術,以及Jana支持的確定性加密、保序加密和基于秘密共享的技術進行調解。這樣,TIPPERS可以被配置為在PULSAR中存儲低級別的傳感器數據(如WiFi連接),這樣,插入可以是快速的,聚集(例如,占用水平)可以被快速確定。當政策取決于誰在一個特定的空間或有多少人在里面時,這對實時政策執行至關重要。相比之下,可能需要更復雜操作的數據(例如,結構化查詢語言(SQL)連接操作,以結合傳感器數據和元數據)可以存儲在Jana中,它支持不同的加密技術,支持更完整的復雜SQL操作。

圖2說明了TIPPERS中的數據流和在海軍驅逐艦中部署的綜合PET的樣本,附錄1(補充材料)對此有更詳細的描述。

圖2:TIPPERS數據流

付費5元查看完整內容
北京阿比特科技有限公司