在當代戰爭中,數據科學對于軍隊實現信息優勢至關重要。在這項研究中,通過綜合的、半系統的文獻綜述,對158篇同行評議的文章進行了分析,以獲得對該主題的概述。該研究考察了文獻在多大程度上關注數據科學在軍事決策中的機會或風險,并按戰爭級別(即戰略、戰役和戰術級別)進行區分。
在社會科學文獻中觀察到對數據科學風險的關注相對較多,這意味著政治和軍事決策者受到對數據科學軍事應用的悲觀看法的影響過大。然而,在正式科學文獻中,幾乎沒有涉及到數據科學的感知風險。這意味著對數據科學軍事應用的擔憂并不是針對能夠實際開發和增強數據科學模型和算法的受眾。對軍事數據科學的機會和風險的跨學科研究可以解決觀察到的研究差距。
考慮到戰爭的級別,與其他兩個級別相比,觀察到對戰役級別的關注相對較少,這可以說是一個研究空白。軍事數據科學的機會大多出現在戰術層面。相反,對戰略問題的研究大多強調了軍事數據科學的風險。因此,對軍事戰略數據科學應用的特定領域要求幾乎沒有表達。在當今的戰爭中,缺乏這樣的應用可能最終導致次優的戰略決策。
如今,數據科學和相關概念吸引了大眾的關注。然而,分析數據以支持決策并不新鮮。考慮一下歷史文明中著名的人口普查的例子,可以追溯到巴比倫帝國(公元前4000年)。巴比倫人利用人口普查來調節糧食庫存,以確保整個人口有足夠的食物[1]。然而,相對較新的是捕捉一切事物和每個人的數據的傳感器的數量,產生的數據量不斷增加。結合計算能力的急劇增加,這為廣泛的行業帶來了分析的機會,例如癌癥研究[2]、金融[3]和公共服務[4]。對軍隊來說也是如此。除了這些機會之外,決策者也面臨著由于數據量不斷增加而帶來的挑戰。僅舉幾個例子。如何在決策過程中整合所有相關數據?我們使用哪些算法,為什么?我們是否被允許將所有可用的數據用于所有目的?然而,在競爭環境中,主要的挑戰和決定勝負的因素之一可能是比競爭對手更快地處理更可靠和詳細的數據的能力。在商業上,這相當于贏得或失去金錢或市場份額;在政治上,這可能最終導致地方或全球范圍的權力轉移。因此,軍隊--作為政治的工具--必須努力爭取權威的信息地位,這一點也得到了政策制定者的認可,例如[5],[6]。
為了實現這種信息優勢,有必要處理所謂的戰爭迷霧,即與戰爭密不可分的不確定性。在當代信息環境中,數據科學對實現這一地位至關重要。換句話說,數據科學既是利用大數據機會的前提,也是回答那大量數據帶來的挑戰的前提。
隨后,關于戰爭行為中的信息優勢有大量的研究,例如[7]、[8]、[9]、[10]。有關軍事決策中的數據科學的研究大多集中在軍事行動的戰術層面上的數據科學機會,例如[11]、[12]、[13],而關于軍事戰略決策中的數據科學的研究卻很少。那些針對戰略層面的研究主要關注算法決策的風險而不是機會,例如[14]、[15]、[16]。據我們所知,目前還沒有關于數據科學在各級軍事決策中的機會和風險的廣泛文獻調查。為彌補這一空白,我們重點關注以下研究問題:
問題1:關于軍事決策中的數據科學的學術文獻在多大程度上集中于機會或風險?
問題2:這種關注點是否因研究集中的戰爭級別而不同?如果是的話,這意味著什么?
問題3:在安全研究學科之外,有哪些關于數據科學的研究可以在理論上加強軍事決策?
我們對數據科學在軍事決策中的作用進行了綜合的、半系統的文獻回顧,對目前關于這一主題的研究進行了嚴格的評估,并確定了未來研究的差距。在社會科學文獻中,我們發現人們對數據科學在軍事上的效用持相對悲觀的態度,在戰略層面的懷疑程度最高。因此,我們建議加強對軍事數據科學的跨學科研究。
本研究的主要貢獻是對有關在軍事決策中使用數據科學的知識體系進行了廣泛評估。此外,還指出了一些未來研究的機會。除了豐富學術討論外,這也有助于改善實踐中的軍事戰略決策。
本文的其余部分結構如下。為了把我們的研究放在一個更廣泛的角度,第2節概述了先前關于軍事決策中的數據科學的研究,我們還提供了數據科學的定義和軍事決策發生的戰爭級別。第3節描述了研究方法,解釋了為本文獻綜述尋找相關文章的過程,我們在第4節介紹并討論了我們的主要發現。在結論部分,我們概述了本文獻綜述的理論和實踐意義,以及我們研究的局限性。
為了在信息時代保持競爭優勢,軍隊必須利用數據和計算能力來獲得權威的信息地位[5]。然而,數據科學在軍事決策中的應用還沒有得到充分的發揮。我們對軍事決策中的數據科學進行了綜合的、半系統的學術文獻回顧,以獲得對該主題的概述,并對其進行批判性評估。此外,我們還分析了文獻在多大程度上關注了數據科學的機會或風險,以及這與研究集中在的戰爭層面有什么關系。我們在文獻回顧中包括了158篇文章。在這個結論部分,我們概述了我們研究的理論和實踐意義以及局限性。
首先,社會科學文獻顯示出對數據科學風險的相對關注。由于我們假設對軍事決策感興趣的政策制定者很可能主要是由社會科學文獻提供信息,這意味著政治和軍事政策制定者受到對數據科學在軍事領域應用的悲觀看法的影響過大。
同時,在正式的科學文獻中,幾乎沒有涉及數據科學的感知風險。這意味著對數據科學在軍事上的應用的擔憂并沒有針對那些能夠實際開發和加強數據科學模型和算法的受眾。這表明,這些模型的進一步發展不會適合所有具體的軍事決策需求。我們相信,對軍事數據科學的機會和風險的跨學科研究可以解決所觀察到的研究差距。
當我們放大軍事決策時,我們觀察到與其他兩個層面相比,戰爭的操作層面的關注度相對較低,這表明在軍事操作數據科學方面存在研究空白。
軍事數據科學的機會大多出現在戰術層面。相反,強調軍事數據科學風險的研究往往主要集中在戰略層面,其中核威懾最引人關注。因此,軍事戰略數據科學應用的特定領域要求幾乎沒有被表達。在當代信息環境中,缺乏軍事戰略數據科學可能會導致次優的戰略決策。這本身就是一個道德問題。因此,進一步研究軍事戰略數據科學的機會對軍隊來說是非常有價值的。
我們為這種未來的工作提供了一些建議,主要來自非軍事文獻,再次強調了跨學科研究在加強軍事決策方面的價值。數據科學可以改善這種決策。顯然,這并不是說數據科學應該在決策過程中完全取代人類,但我們至少應該探索各種可能性,為決策提供最佳參考。
對軍事數據科學的進一步研究(特別是在戰略和行動層面)不僅是學術責任。我們同意梅茨的觀點,這也需要培養未來的戰略領導力,注重創業精神[61]。畢竟,只有當數學、計算機科學和商業知識齊頭并進的時候,數據科學才會成功。而后者又取決于商業領袖如何設想他們的未來。
首先,由于我們在廣泛的領域中進行了跨學科的文獻回顧,不可能選擇所有的相關文獻。因此,我們對與各學科相關的期刊進行了初選。鑒于現有期刊的總數,這種選擇本身可能會影響我們研究的有效性。為了盡量減少這種影響,我們又進行了一次電子搜索,如我們的方法論部分所述。
第二,我們只審查了學術文獻。未來的研究可能會受益于包括關于數據科學在軍事決策中的應用的非學術來源。
總而言之,盡管對某些文章是否強調數據科學的風險或機會的分類可能被認為是未定的,但我們相信,仔細閱讀最后一組論文的結果與所提出的評估類似。
盡管在評估5G技術對軍事事務的影響方面已經有了很多論述(見Gambuzzi, 2019; Bijlsma, 2022; Bussagli, 2022),但本信息快報(IF)試圖通過澄清這一新型技術對軍事決策的影響來為這一蓬勃發展的文獻作出貢獻。鑒于現有的數據,本報告將主要關注美國(US)軍隊的努力。本綜合報告首先將對5G的及其一般軍事應用進行簡要概述。隨后,將討論5G在軍事決策中的作用這一核心問題。
一般來說,5G或第五代無線寬帶網絡技術,顧名思義,代表了4G寬帶技術的技術進步。這種技術進步包括兩個相互關聯的要素:速度和延遲(Halpern, 2019)。根據5G的一些支持者的說法,這項新技術將比其前身快一百倍。這種速度的提高預計將 "減少,甚至可能消除指示計算機執行命令和執行命令之間的延遲"。在不迷失于太多技術細節的情況下,重要的是要注意到,5G技術依賴于 "高頻、短波長頻譜",正是這種所謂的 "毫米波",允許超過每秒1Gbps的前所未有的速度(Gambuzzi, 2019)。自然,5G以及它所承諾的進步,對消費者、工業和軍事都有很高的期望。特別是,5G被看作是經濟發展的驅動力。預計到2035年,將有多達 "12萬億美元 "的資金以5G技術的名義投資于全球經濟。這種對全球經濟的巨大現金注入預計會發生,不僅僅是因為5G將提高信息交流的速度,還因為它將產生重大的連鎖反應,特別是在物聯網方面。5G被認為能夠實現 "自主設備的互聯,如智能家居、自動駕駛汽車、精準農業系統、工業機械和先進機器人"(Hoehn & Sayler, 2022)。5G技術的這一方面被稱為mMTC(大規模、機器類型通信)。雖然mMTC經常被 "忽視",但它確實是革命性的,因為它將允許 "每平方公里多達一百萬臺設備的互連"(Gambuzzi,2019)。
關于軍事問題,5G有大量潛在的非民應用。5G可能會大大改善現有的情報、監視和偵察(ISR)系統。此外,它將允許采用新的指揮和控制(C2)方法,并使后勤管理的方法更加精簡。這種改進有賴于5G "在地理上分散的系統中近乎實時地分享更大量的數據"(Medin & Louie, 2019, p.21)。不僅更多的數據將被共享--更快--跨越遙遠的距離,而且5G還將 "通過機載或基于衛星的5G系統 "將戰術通信的范圍擴展到以前被剝奪的領域(Bastos等人,2019年,第4頁)。幸運的是,5G預計也會有明顯的成本效益。因此,軍隊將能夠以相對較低的成本大規模部署5G技術。正如美國國防部(DoD)相關咨詢機構--國防創新委員會2019年的一份研究報告指出。"由5G促成的未來的戰斗網絡將越來越多地包括大量更便宜、連接更緊密、更具彈性的系統(Medin & Louie, 2019, p. 21)。
5G的一個特別有前途的應用將是它與無人駕駛飛行器(UAVs,即無人機)的整合。無人機已經被證明是現代戰爭的一個重要部分,盡管有爭議,特別是在反叛亂運動中(見Walsh, 2013, passim)。一旦配備了5G技術,無人機將能夠 "與C2中心和參戰部隊實時傳輸和分享4K圖像"(Gambuzzi, 2019)。這種新的能力將允許"增強目標探測,更快的數據處理",并全面提升偵察能力。根據無人機的設備和操作參數(如交戰規則),4K圖像傳輸,以及5G技術,可能會在動能任務中實現更高的瞄準精度(Walker等人,2021)。除了傳輸速度的改進,5G技術還允許各種自主車輛(包括陸地車輛)配備云存儲功能。將云存儲整合到自動駕駛汽車中可以因此 "潛在地規避車載數據處理的限制"(Hoehn & Sayler, 2022)。這種規避本身就很可取,而且還有可能實現 "新的軍事行動概念",例如 "蜂群",它指的是車輛之間的自主合作,為特定任務服務。
然而,5G的應用并不限于空間、陸地和空中領域,也適用于海上行動。在海上行動方面,5G有可能極大地 "加強船與船、船與兩棲和船與岸的連接"(同上,第6頁)。例如,這可以改善受影響的船只和軍事資產以及各國軍事資產之間對海盜活動的反應時間[1]。特別是,提高通信速度可能有利于國際軍事任務的船只之間的協調,如現已解散的亞特蘭大號(見EUNAVFOR, 2022),以及鄰近國家的各自海軍。這種協調是國際海事法所要求的。海軍資產可以在國際水域追擊海盜,甚至可以進入相鄰國家的專屬經濟區(距海岸370公里),但他們不能進入一個國家的領海(距海岸22公里)(UNCTAD, 2014, p. 10; see also Ahmad, 2020)。因此,如果海盜船逃入領海,追擊的海軍資產必須迅速與鄰近國家的海軍或海岸警衛隊協調反海盜活動。
如上所述,5G技術極大地提高了數據傳輸的速度和數量,這對軍事通信的效率有巨大的影響。軍事規劃人員希望利用這種速度(≈1≥Gbps)和容量的急劇增加來提高決策的速度,從而提高執行的速度。這種速度的大幅提高是必要的,因為 "未來的沖突可能需要在幾小時、幾分鐘或可能幾秒鐘內做出決定,而目前分析[原文如此]作戰環境和發布命令的過程需要數天時間"(Hoehn, 2022)。實現這種理想的決策速度增長的方法之一是利用5G的力量,為提高部隊的內部操作性服務。基本想法是,5G支持的通信技術將允許美國武裝部隊的所有部門以更大的速度交換信息、數據和情報。這種通信、數據和情報共享的增加將使C2決策得到簡化。
圖1 JADC2視覺可視化[Hoehn, 2022]。
目前,美國國防部正試圖通過其全域聯合指揮與控制(JADC2)概念實現更大的部隊內部可操作性(見圖1)。JADC2概念試圖完成一個單一的傳感器網絡,并取代以前的方法,即每個軍種 "傳統上開發自己的戰術網絡,與其他軍種的網絡不兼容。" 以前的沖突已經說明了一個軍隊在其各軍種之間實現和保持高水平的內部操作性的能力的重要性。特別是,在1982年(未宣布的)福克蘭群島戰爭期間,阿根廷軍隊不同部門之間缺乏協調是英國成功的一個重要因素。英國福克蘭群島戰役的官方歷史學家勞倫斯-弗里德曼爵士在最近一次皇家聯合服務研究所的活動中指出,阿根廷軍隊的三個部門似乎在 "打三場不同的戰爭"(RUSI, 2022)。
為了充分解釋5G對未來軍事決策的意義及其與JADC2等概念的關系,將這些發展置于更廣泛的地緣政治背景中至關重要。目前,華盛頓特區的政策制定者和軍事規劃者正專注于他們所描述的近距離競爭者所帶來的威脅(Vergun, 2020)。從本質上講,"近鄰競爭者 "指的是中國和俄羅斯等國家,它們越來越被認為是未來的潛在對手。一個在華盛頓圈子里穩步發展的相關概念是大國競爭(Dei?ner & Fehrenbach, 2020)。其必然結果是,美國不再滿足于為小規模戰爭和反叛亂做準備,比如在伊拉克和阿富汗。相反,美國官員擔心他們將很快不得不面對像中國這樣的行為體,其軍事能力更接近于他們自己。特別令人擔憂的是,"潛在的對手已經發展了復雜的反介入/區域拒止(A2/AD)能力,如電子戰、網絡武器、遠程導彈和先進的防空設施"(Hoehn,2022)。因此,軍事領導人表示,在未來的沖突中,涉及 "潛在的近同行對手,需要采取多領域的方法。" 這種多領域方法被編入JADC2概念中,只有5G技術,特別是數據傳輸速度和容量的進步才使其可行。
即使在更微觀的層面上,參與開發和測試支持5G的軍事通信技術的軍事官員也敏銳地意識到了這種情況。美國陸軍指揮、控制、通信-戰術(PEO C3T)項目執行官羅伯特-柯林斯少將和美國陸軍網絡跨職能小組主任杰斯-雷伊準將最近在今年的C4ISRNET會議上就這個話題發表了講話。柯林斯將軍和雷伊將軍強調,5G技術的發展和部署不應完全從技術發展本身的角度來理解,還應該理解為與敵對行為者構成的 "威脅保持同步"(C4ISRNET,2022)。
然而,5G技術的發展和部署不僅對遏制潛在對手帶來的威脅至關重要,而且其本身也可能成為不安全的一個重要來源。就5G成為不安全的來源而言,必須考慮兩個因素。首先,戰術環境和指揮部之間的每一次通信都會有一個簽名。當通信量急劇增加時,就像引進5G技術那樣,那么排放物可能會上升到對手很容易在戰場上定位美軍的程度。柯林斯將軍指出,排放控制是一個關鍵問題,軍事領導人需要 "小心和注意 "這項技術的潛在威脅增強(C4ISRNET, 2022)。因此,5G技術必須通過 "士兵主導的實驗 "進行開發和測試。此外,軍方和其行業伙伴之間需要有適當的反饋渠道。其次,5G網絡可能容易受到網絡攻擊,甚至來自非國家行為者。同樣,5G網絡從一開始的設計就需要考慮到網絡威脅。然而,幸運的是,5G技術依靠的是短程信號,更難截獲(Gambuzzi,2019)。
最后,正如雷伊將軍所強調的,JADC2下給軍事決策帶來的變化也對軍事互操作性產生了重大影響。雷伊表示,美軍 "將不再單獨作戰"(C4ISRNET,2022)。因此,互操作性問題從一開始就包括在關鍵項目中,如22號融合項目,這些項目旨在實現JADC2。在 "融合項目2022"的背景下,雷伊說,重點是 "數據共享行動同步以及與我們的聯盟伙伴整合"。此外,JADC2還將包括美國軍隊與其聯盟伙伴之間更正式的軍事互操作性機制。在這個意義上,合作將不再是偶發的,相反,5G還將為一個 "持續的持久環境 "來交換互操作性接口標準。
C4ISR是指為國防和戰略決策者執行指揮和控制指令提供可操作情報的技術。最近在系統、技術和工藝方面的進步使得態勢感知(SA)得到加強,并能深入了解對手的能力。這種增強的態勢感知將有助于最大限度地減少從最初感知威脅到隨后決決策減輕威脅的時間,從而提高C4ISR能力。本文對可用于改善決策和SA的當前和即將到來的技術進行了回顧。
軍隊的 "神經系統",即用于最佳利用實時態勢感知(SA)的子系統的集合,被稱為C4ISR--指揮、控制、通信、計算機、情報、監視和偵察。 C4ISR是任何防御行動的骨干,確保戰場的透明度。它從各種來源收集和組織數據,對其進行分析,然后將其傳播給所有相關機構,以便采取協調和迅速的行動。
C4ISR的價值正在從靜態的決策過程中急劇轉變,以前指揮官是根據預先確定的標準進行決策,而現在則是動態的決策過程,其靈活性是建立在系統中的,使各指揮部的指揮官能夠更有效地進行近實時的互動,并在必要時進行中期修正。
由于電子、IT、通信、計算能力等方面的進步,數據的質量有了巨大的增長,而且這種趨勢將繼續下去。由于這些進步,產生了大量的數據,這可能會給分析帶來壓力,使其能夠將許多來源的數據關聯起來,評估它們,并幾乎實時地交流有用的發現。
C4ISR中使用的信息將來自各種來源和數據類型,包括衛星和航空圖像、圖片、文本、音頻和視頻、傳感器數據等。在實施C4ISR過程中需要考慮的方面有:
本文討論了當前和新興技術的設計,以保持C4ISR對國家的相關性和實用性。
C4ISR從各種來源接收數據,包括服務和情報組織。在這種情況下,所有這些利益相關者可能不愿意披露他們的內部架構,包括數據和應用程序,這是一個重要的考慮。因此,應建立聯合網絡中心架構,允許所有機構在必要時或應要求分享已確定的數據,同時對其他數據進行保密。
每個機構都有自己的安全網絡,就像一個 "島"。C4ISR實施中的網絡架構必須被設計成包括各種'網絡島',并有安全的整合點。一個 "網絡島 "內的自主性和幾個 "網絡島 "之間的安全互操作性是需要實現的關鍵原則。每個 "網絡島 "都有一個信息交換網關(IEG),通過數據二極管連接。這個IEG將只包含已經確定的數據,然后通過不同的數據二極管與劇院共享數據中心(TSD)共享。然后,這個TSD將把數據傳輸到中央共享數據中心(CSD)。一個組織/機構的IEG不會同時連接一個'網絡島'和一個TSD,保護'網絡島'存儲的私人數據。
C4ISR可以在集中式或聯合式架構中實施。圖1描述了一個集中式架構,其中所有的TSD數據被集中存儲、分析,并在客戶/服務器(C/S)模型中發布。
在集中式架構中,如果與CSD的網絡通信失敗,所有實體都將失去ISR支持。這些組織/機構將繼續在獨立的垂直筒倉中運作,它們之間的整合只有在CSD層面才可以想象。
圖 1:C4ISR 的集中式架構
圖2描述了一個聯合架構,在這個架構中,各 "網絡島 "的TSD以點對點模式連接。任何組織或機構的IEG將通過點對點連接的TSD從其他組織收集數據。每當建立與數據二極管的連接時,IEG就會與其安全的'網絡島'同步數據。由于資源的分配,冗余和生存能力在聯合架構中是更好的。
此外,C4ISR架構將在 "需要知道 "的基礎上滿足執行者的信息推送模式,在 "知道所有 "的基礎上滿足決策層指揮官的信息牽引模式。
圖 2:C4ISR 的聯合架構
該架構的子系統應該有適當的維持模式,考慮到可集中管理的操作系統、計算要求、可擴展的存儲、可靠的網絡和網絡安全。
應用構成了SA的核心。過去十年中的各種技術創新導致了安全保障能力的提高。無論是在服務或機構層面,還是在中央指揮和控制中心,都部署了應用程序以滿足要求,提高性能,并幫助及時和適當的決策能力。下面詳細介紹了一些改善SA的技術:
在以網絡為中心的戰爭中,C4ISR的大量數據的開發正在加速進行,增加了數據流的速度。這是由于技術的進步、更多傳感器的部署、向數字數據的轉換以及其他因素造成的。來自衛星和航空平臺、物聯網傳感器、監視資產和其他來源的高分辨率、高頻率數據以圖像、視頻、音頻、無線電信號和其他類型的數據形式提供了大量的數據。這種大量的數據不僅帶來了高效處理方面的挑戰,而且還需要高性能的計算系統來提供近乎實時的檢索和分析基本數據,以便做出合適和及時的決策。
數據有各種類別和格式。一些用于改善SA的數據類型是:
數據目錄,如時空資產目錄(STAC),為不同環境下的數據源的語義分類、索引和組織,以及用元數據充實原始數據,提供了一個很有前景的解決方案。包含數據描述的數據目錄可以作為網絡服務提供。RESTful API的實施在應用中發現和使用數據,以提高SA。
地理空間技術是C4ISR應用的骨干。它提供地理空間圖像和地圖分析能力。它還為用戶提供了了解地貌、事件發生地、部隊部署及其范圍、可及性、時間和地點的變化等的能力。
圖3:地理空間服務
三維地形可視化。三維景觀可視化使指揮官在遠離行動的情況下,也能更好地欣賞真實世界的場景。采用現代三維投影儀/AR-VR/全息投影,而不是沙盤模型,增強了他們做出明智決策的能力。地形分析包括許多表面分析功能,如定位最高點和最低點,評估能見度,確定視線,生成視線棚,路徑剖面的構建,高程剖面的查看,陰影浮雕的創建,最陡峭路徑的計算,為高程/坡度/方面創建彩色編碼圖像,顯示坡度輪廓和箭頭,切割和填充量分析,規劃戰術部署,以及3D飛越可視化。
變化檢測。對多時空的衛星和航空照片進行檢查,以檢測戰略特征的變化。在給定的參考圖像中確定的特定物體與目標圖像中發現的特征進行比較,以檢測物體的出現、消失或位置的變化。變化檢測為了解對手的行為和意圖提供了有用的洞察力。變化檢測的自動化過程目前正處于開發階段。自動化將使其更容易快速分析眾多圖像。
機器人和人工智能(AI)是技術和認知智能的結合,用于模擬、處理信息和知識,在機器中建立模仿人類行為的能力3。無人系統預計將在未來的戰爭中占據主導地位,而人工智能將是一個關鍵因素。2022年7月11日,印度國防部長在新德里舉行的 "國防中的人工智能"(AIDef)研討會上,推出了75種新開發的人工智能產品/技術。為了使國防服務和戰略機構現代化,目前正在努力充分利用AI的潛力。從這個角度來看,下面探討了各種基于人工智能的應用。
NLP搜索、語言支持和情感分析。自然語言處理(NLP)使用深度學習(DL)來理解詞語之間的含義和關系。情報專家在NLP中采用HUMINT、OSINT和其他類型的情報數據,以獲得相關的主題發現、序列映射和生成式總結。NLP將在C4ISR的背景下提供SA,并將改善決策。
帶有地理空間技術的NLP可以幫助各機構理解和欣賞事件在時間和空間上的協調和關聯性。
對一種語言形式、其意義和環境的技術研究和檢查被稱為語言學。人工智能在解釋計算機背景下的語言學方面起著關鍵作用,這將有助于智能的發展。語言AI模型可用于各種任務,如翻譯、音譯、語音轉文字、文字轉語音、圖像轉文字等。
通過印刷品、電子和社交媒體流通的信息對情報機構非常有價值。對這些數據的分析可能為情報機構提供對某些群體和/或公眾的暗流和情緒的重要洞察力。組織可以使用NLP來評估公眾情緒,監測社交媒體、新聞等,并根據悲傷、悲痛、喜悅、憤怒等情緒對在線互動進行分類。NLP可以用來發現風險,關注行為,并防止危機的發生。
圖像中的物體識別和分類。在地理空間圖像中,被識別的物體類型、其類別及其隨時間的相對變化,為C4ISR指揮官規劃其戰略提供了關鍵信息。人工智能是一種解決問題的久經考驗的技術。當然,圖像和/或照片的比例與物體的分類有很大關系。物體應在圖像或照片中清晰可見,以便進行分類。卷積神經網絡(CNN)是用來分析地理圖像的最常用技術之一。大多數現代人工智能檢測系統已被訓練為識別預先定義的物體。未來屬于預訓練的模型,它將通過自動分類和識別防御對象并協助決策來改善SA。
面部識別。面部識別是一種生物識別解決方案,是專門為識別人臉而創建的,沒有任何身體接觸。它可以幫助提高任何組織或重要設施的安全性。面部識別的主要目標是識別、分類、確認,并在必要時消除任何確定的威脅。
視頻流中的自動事件識別。來自無人機、物聯網設備和閉路電視攝像機的視頻流是監控和SA的關鍵來源。來自不同來源的自動視頻數據分析可以幫助及時分析大量的數據并提高輸出質量。隱馬爾科夫模型(HMMs)和CNNs需要大量的訓練數據來配置網絡以識別事件。相反,當訓練視頻數據不足時,貝葉斯網絡可用于事件識別。
超級分辨率。在國防應用中,主要挑戰之一是從低分辨率圖像中提取信息。超級分辨率可以解決這個問題。超級分辨率(SR)是通過對低分辨率(LR)圖像應用一種算法來獲得高分辨率(HR)圖像的過程。一般來說,SR需要多個不同分辨率的圖像來生成HR圖像。在國防應用中,很多時候很難獲得多張圖像。單一圖像超分辨率(SISR)具有基本的低水平視覺問題。SISR旨在從單一的低分辨率圖像中恢復高分辨率的圖像。
在衛星圖像上采用超分辨率將提高C4ISR系統對國防目標的識別、分類和變化檢測的分析能力。
先進應用。國防部隊和情報機構的現代化正朝著自動化方向發展,配備強大算法的機器人分析現有數據,應用人工智能技術,并做出決策。
信息融合。監控應用使用了大量的傳感器,如運動探測器、接近傳感器、生物識別傳感器,以及一系列的攝像機,如彩色攝像機、夜視成像攝像機、熱成像攝像機等,從不同的角度和分辨率監控國防目標。信息融合通過幫助從觀察到的數據中提取有洞察力的知識,對SA有很大貢獻。SA結合了低層次的信息融合(跟蹤和識別),高層次的信息融合(基于威脅和場景的評估),以及用戶完善(物理、認知和信息任務)。信息融合將不同傳感器捕獲的數據之間的冗余度降到最低,例如,不同攝像機捕獲的相同或相似的景象。此外,信息融合還有助于在攝像機之間進行交接,當被其中一個攝像機跟蹤的物體從其視野中移出并進入另一個攝像機的視野中時。在霧/邊緣計算范式中,傳感器/物聯網節點的信息融合減少了傳輸到服務器的數據。
自動圖像注冊/正射矯正。具有特定地理位置的信息提取始于多時空和/或多傳感器圖像的圖像注冊。然而,該程序是時間和勞動力密集型的。由于進入的數據量越來越大,需要將從衛星和其他航空圖像中近乎實時地提取有意義的信息的程序自動化。
圖像登記和正交化被用于國防和安全應用,如目標檢測、識別和跟蹤、車輛導航和監視等。
物聯網和傳感器。隨著新技術的發展,新的傳感器被開發并用于國防。士兵健康監測傳感器、自主車輛傳感器、槍聲傳感器和其他技術正在被開發,以實現國防系統的現代化。它們以各種格式向指揮和控制中心提供一系列數據,以便快速分析和決策。
無人機/UAV數據處理。無人駕駛飛行器(UAVs)/無人機可以極大地幫助加強SA,因為它們能夠在被認為沉悶、不干凈或危險的情況下收集情報。由于技術的發展,下一代無人機將處理收集的數據,進行信息融合,并在機上進行高級分析。帶攝像頭的上下文感知無人機能夠對視頻中看到的場景進行高水平的描述,并準確指出潛在的危險情況。在和平時期的灰色地帶戰爭中,以新穎的方式應用無人機的勢頭很好。電子產品的微型化、新一代導航工具和快速計算機導致了智能武器的發展,具有遠距離的卓越傳感器和精確的終端引導。最初作為反輻射無人機而開發的徘徊彈藥,已被證明比武裝無人機更危險。
網絡戰是指一個民族或國家或國際組織利用計算機病毒或拒絕服務攻擊,攻擊并試圖傷害另一個國家的計算機或信息網絡的行動。網絡戰可以采取許多不同的形式,包括間諜活動、破壞活動、拒絕服務攻擊、對電網的攻擊、宣傳、經濟破壞和突襲網絡攻擊。關于最新的網絡威脅、網絡攻擊和零日事件的威脅情報必須被獲取和跟蹤,因為它們是網絡戰的基本知識。網絡戰的組成部分包括連接到對手的網絡和防止進入自己的網絡。
技術的進步是一個動態現象。為了保持系統的更新,應該把時間、金錢和資源放在研究新興/未來的技術上。為了獲得對對手的優勢,信息技術的發展應該以跟上全球進步的速度發展。以下是一些新興技術,對國防很重要。 -ISAR。逆向合成孔徑雷達(ISAR)是一種微波數據處理技術,使用雷達成像來生成目標的二維高分辨率圖像。它類似于傳統的合成孔徑雷達,只是ISAR技術使用目標的運動而不是發射器來創造合成孔徑。ISAR雷達在海上巡邏機上有重要作用,它為它們提供雷達圖像,用于識別目標,如船舶和其他物體。在其他雷達只顯示一個無法識別的明亮移動像素的情況下,ISAR圖像往往足以區分各種導彈、軍用飛機和民用飛機。
兩個或多個系統組件之間的互操作性的觀點包括信息交換、信息理解和系統元素之間的協作協調。系統的互操作性因素,如架構的合理性、信息交換環境的安全性、運行效率、管理維護等,是需要考慮的幾個觀點。
整合各國防/戰略機構采用的各種國防設備制造商的不同平臺是C4ISR中一個重要的互操作性問題。
互操作性可以從不同層面來看,如設備互操作性、網絡互操作性、語法互操作性、語義互操作性和平臺互操作性。這些層次與互操作性方法、開放性、連接性、應用協議和安全/隱私指標相結合,是處理C4ISR互操作性問題的必要條件。
在每個組件中遵循國防/工業標準是實現完全互操作性的關鍵。隨著技術的發展,過時的硬件和軟件有可能無法使用新的數據格式和接口。當硬件、軟件或應用程序升級時,現有的數據不應丟失,應準備好重新使用。通過遵守ISO、OGC等標準,可以實現向后兼容。
建議各機構與專業機構合作,以研究和開發高質量的應用。與學術機構的長期合作將保證未來的技術研究,而與政府實驗室和企業的合作將通過提供尖端的應用來推動C4ISR的發展。
在沖突中,部隊對敵人及其活動區域的了解通常決定了他們的成敗。在20世紀70年代,蘇聯軍事戰略家發明了 "偵察打擊綜合體 "這一短語來解釋一個網絡系統,該系統包含了通過將一系列傳感器連接到許多射手而在空中產生 "殺傷鏈 "的現代概念。這些傳感器和網絡所需的大部分計算能力今天已經可以獲得。此外,更多的信息可以通過云計算獲得并輸入人工智能系統,從而產生新的可獲得的和可負擔的觀察方式,以及匯集和分析所收集的數據并在需要時呈現信息的技術。人工智能系統還可以解決隱身、電子戰、網絡攻擊和其他形式的欺騙,這些都是隱藏者可以用來保持不被發現的。因此,偵察-打擊綜合體已經變得越來越復雜。現代架構師們正在融合各種技術,以開發一個能夠快速消除大量潛在目標的系統,同時將有關這些目標的信息傳遞給重要地點。
這篇論文探討了美陸軍信息戰令人困惑的歷史,以了解為什么持久的信息條令被證明是如此難以捉摸。論文認為,陸軍信息條令的發展分為三個階段,每個階段都對應著一系列獨特的戰略、組織和技術挑戰。內部的組織動態,而不是外部的戰略一致性,是決定信息學說在歷史上任何特定時刻的成敗的主要因素。未來的信息條令,包括目前的ADP 3-13草案的未來迭代,必須以認可陸軍組織利益的復雜性方式來解決陸軍的核心戰略挑戰,而且必須通過一個概念來實現,其有效性是可見的、可衡量的和令人信服的。
盡管學術界和政策文獻對信息戰爭,特別是對陸戰的重要性有越來越多的共識,但對美軍如何建立其與信息有關的作戰概念,或對這些概念何時、如何以及為什么會改變的研究卻很少。對于一個自誕生以來就幾乎不斷變化的領域來說,了解是什么推動了條令的變化尤為重要,信息作戰就是如此。本研究報告所包含的歷史將填補我們理解上的這一空白。重要的是,它將試圖區分條令變化的有效原因--例如為應對不斷發展的技術或合法的外部威脅而進行的轉變,以及任意的原因--例如那些源于內部組織政治或外部政治關切的原因。這樣一來,它將更好地使政策制定者對未來信息作戰概念的適當方向做出正確的決定。
這項研究還將產生第一部關于陸軍信息條令演變的權威性歷史。最近的公開評論表明,陸軍高級領導人并不了解他們所要塑造條令的歷史。這種對歷史的短視有可能鼓勵在舊的不充分的前提下,不斷產生實際上并不新的 "新 "術語和概念。如果說,本研究對信息條令歷史的探索揭示了陸軍最早的許多信息相關概念的先見之明--這本身就引出了一個問題:為什么這些概念未能獲得制度上的支持。因此,這項研究將對那些試圖在信息和網絡空間領域找到自己發展方向的決策者產生直接影響。
最后,本論文希望對以下問題提供一個答案:鑒于三十年的條令先例,信息戰的想法仍然在體制上被邊緣化,盡管高級領導人對信息戰的假設越來越感興趣,但卻無法更有力地宣稱自己是一種輔助功能。本論文認為,在不斷變化的戰略條件、相互競爭的組織利益和 "信息 "一詞固有的復雜性的共同作用下,長期以來缺乏理論上的一致性,導致該領域無法成為一個邊緣概念。
第一章介紹了美陸軍信息條令的歷史,為論文的其余部分提供了理解的基礎。本論文的主要研究問題是 "為什么陸軍一直在努力創建一個持久的信息作戰條令框架?" 其余各章將回答這個問題
第二章將介紹陸軍信息條令的歷史學。它將總結和描述關鍵文本,確定學說拐點的主要內容,并強調歷史趨勢。本章將專門關注書面條令的演變,而將相關組織、培訓途徑和人員實踐的變化保留在分析章節中。第三章將討論本文的研究方法。
第四章至第六章將分析第二章中概述的歷史的主要階段,重點解釋導致條令變化的具體決策點。第四章將探討從越南的 "電子戰場 "到1991年波斯灣戰爭的信息作戰的早期起源。第五章將研究隨后的信息行動時期,它從1991年的 "信息戰 "概念開始,在1996年過渡到 "信息行動",并以1990年代末在巴爾干地區的行動結束。第六章從9/11恐怖襲擊開始,描述了隨之而來的2000年代中后期向更注重認知的 "信息和影響 "理念的轉變。第七章是結論,在回顧研究的主要發現和討論其實際意義之前,將總結從2016年到2021年這五年的動蕩時期。
過去的決策是如何做出的,其驅動力、戰略和理由是什么?關于組織應該如何從過去的經驗中學習以幫助在未來做出更好的決策,這句老話是正確的。目前的第一階段研究著眼于美國防部(DOD)如何灌輸機構企業記憶。具體來說,該研究對如何開發一個透明的決策選項登記冊(DOR)綜合智能數據庫系統進行測試并提出建議,其中DOR有助于捕捉國防部(DOD)內部項目的所有歷史決策(假設、數據輸入、約束、限制、競爭目標和決策規則)。這個DOR中的信息將與元語義搜索和數據科學分析引擎兼容。DOR用于對未來的決策方案進行建模,以便在不確定的情況下做出決策,同時依靠過去的最佳實踐,使高級領導層能夠做出可辯護的、實用的決策。目前第一階段的研究使用程式化的數據和例子來說明推薦的方法。
這項研究采用先進的定量建模方法(隨機模擬、投資組合優化),加上人工智能(AI)和機器學習(ML)算法(數據搜刮、文本挖掘、情感分析)和企業風險管理(ERM)程序,實施行業最佳決策分析。DOR將部分基于使用風險登記冊的ERM方法,其中不同的風險元素被細分為不同的GOPAD組,或目標(軍事能力、成本節約、新技術、未來武器能力、公共安全、政府優先事項、指揮偏好,等等。 )、組織(空軍、陸軍、海軍、海軍陸戰隊)、計劃(采購、商業現貨、聯合產業、混合等)、活動(庫存、替換、新開發、研究和開發等)和領域(空中、海上、網絡等)類別。
多個相互競爭的利益相關者(例如,國防部長辦公室、海軍作戰部長辦公室、美國國會和平民)有其特定的目標(例如,能力、效率、成本效益、競爭力和殺傷力,以及替代方案和權衡)、約束(例如,時間、預算、進度和人力)和基于任務的領域需求(例如,平衡網絡安全、網絡反恐、反潛戰、反-飛機戰或導彈防御)。
這項研究采取了多學科的方法,來自先進分析、人工智能、計算機科學、決策分析、國防采購、經濟學、工程和物理學、金融學、期權理論、項目和計劃管理、隨機建模的模擬、應用數學和統計學的方法被應用。最終的目標是為決策者提供可操作的情報和對未來決策選項或靈活的真實選項的可見性,以及導致某些可比較決策的假設。
推薦的方法包括使用監督和無監督的AI/ML情感文本分析、AI/ML自然語言文本處理以及AI/ML邏輯分類和支持向量機(SVM)算法,再加上更傳統的高級分析和數據科學方法,如蒙特卡洛模擬、隨機組合優化和項目選擇、使用財務和經濟指標的資本預算,以及PROMETHEE和ELECTRE等詞匯學排名方法。
介紹了案例應用、代碼片段和模擬的DOR,并以典型的數據來說明其能力。目前的研究成果將為下一階段的多年研究提供基礎,將建立原型,實際數據可以通過規定的分析引擎運行。
這項擬議研究的目的是生成一個透明的決策選項登記冊(DOR)綜合智能數據庫系統,該系統有助于捕捉所有未來的歷史決策,包括其假設、數據輸入、約束、限制、競爭目標和國防部(DOD)的決策規則。該DOR中的信息將與元語義搜索和數據科學分析引擎兼容。DOR用于對未來的決策選項進行建模,以實施和實現在不確定的情況下做出決策,同時依靠過去的最佳實踐,并允許高級領導層做出可辯護的和實用的決策。
DOR是基于私營企業的企業風險管理(ERM)實踐,通常會列出過去、現在和未來擬議項目的風險和經驗教訓。建立一個決策歷史的文件數據庫是至關重要的。如果沒有曲線,就沒有學習曲線,而沒有任何數據或信息就不可能有曲線。有了目前這項研究中推薦的DOR和相關方法,我們可以通過觀察新項目的特點,以歷史數據為參考,計算出新項目的成功和失敗的概率,從而預測結果。當然,有必要對成功與失敗進行操作和定義。僅僅因為一個項目低于預算,按時完成,幾乎不需要返工,達到了所有要求的規格和技術發布水平,這是否意味著它是成功的?我們還可以用什么其他的指標來確定明確的成功或明確的失敗,以及在這兩者之間的所有其他層次呢?我們需要確定可用的數據以及差距,以使我們有一個堅實的決策選項登記冊。我們在操作上定義的成功和失敗的一些統計學上的重要預測因素是什么?另一個問題是減輕風險和戰略靈活性。
這項研究將展示業界最佳的決策分析和企業風險管理(ERM)程序。DOR將部分基于使用風險登記冊的ERM方法,其中不同的風險元素被細分為不同的GOPAD組,或目標(軍事能力、成本節約、新技術、未來武器能力、公共安全、政府優先事項、指揮偏好,等等。 )、組織(空軍、陸軍、海軍、海軍陸戰隊)、計劃(采購、商業現成的、聯合產業、混合等)、活動(庫存、替換、新開發、研究和開發等)和領域(空中、海上、網絡等)類別。
多個相互競爭的利益相關者(如國防部長辦公室、海軍作戰部長辦公室、美國國會和平民)有其特定的目標(如能力、效率、成本效益、競爭力和殺傷力,以及替代方案和權衡)、限制(如。時間、預算、時間表和人力),以及基于任務的領域要求(例如,平衡網絡安全、網絡反恐、反潛戰、防空戰或導彈防御中的數字化轉型需求)。當需要考慮新的決定時,這些因素是至關重要的。一個保存機構知識和記憶的DOR數據庫將有助于這種努力,并為決策注入信任。
這項研究將采取多學科的方法,我們將應用先進的分析方法、人工智能、計算機科學、決策分析、國防采購、經濟學、工程和物理學、金融、期權理論、項目和項目管理、隨機建模的模擬、應用數學和統計學。最終的目標是為決策者提供可操作的情報,以及對未來決策選項或靈活的真實選項的可見性,并提供導致某些可比決策的假設。
在法律糾紛中,法院在決定案件的結果時使用先例。先例的使用已經有200多年的歷史,通常是為了上訴或推翻以前的判決。然而,基于先例的決策是工業界和政府還沒有完全接受的東西。由于人力資本的波動和外流,以及雇員離開或被重新分配到其他地方時機構知識的流失,包括國防部在內的各組織往往記憶短暫。目前的研究旨在包括對基于先例的決策技術現狀的相關研究是如何進行的,什么可能被認為是技術現狀,以及其目前的局限性是什么。
該研究應用了多種新穎的方法,以提高其在生成一個強大的、可搜索的DOR數據庫方面的成功率。建議將包括關鍵參數、假設、輸入數據、保存的模型和計算、做出的決定、領導的輸入和重寫、約束和限制、最終目標和其他相關信息,然后可以使用機器學習的情感分析,加上刮削算法和自定義詞匯集的文本挖掘來挖掘。該系統的用戶將能夠把基于先例的洞察力應用于他們當前和未來的項目。此外,在可能的情況下,預測值將由隨著時間推移捕獲的實際值來補充。這允許對以前的項目進行事后分析,并提供一路走來的經驗教訓。掌握關鍵決策的歷史將有助于高級領導層做出更可信和可辯護的決定,這可能最終導致國防部的法律和法規變化。
擬議的方法將允許收集可應用于各種領域的數據,包括但不限于綜合風險管理?方法,其中可以運行蒙特卡洛模擬、隨機組合優化等隨機分析,以及高級數據分析方法、人工智能和數據科學方法。隨著時間的推移,可以應用回溯分析來更新DOR,使其更接近國防部的需求。該系統應該能夠收集不同類型的經濟數據(總生命周期成本、總擁有成本、采購成本、成本遞延、以及進度和風險成本);后勤數據(例如。固有可用性、有效可用性、任務可靠性、操作可靠性、平均停機時間、平均維護時間、后勤延遲時間、實現可用性、操作可用性、任務可用性、實戰能力、創造性和新穎技術的李克特水平以及其他指標);定性的主題專家估計(戰略價值、對社會的價值、指揮部優先事項、法律和監管影響得分等);以及市場可比性,以操作國防部利益的各種要素。在適當的時間間隔內,可以采用非線性判別分析、神經網絡、分布式擬合、有限因變量、路徑依賴的偏最小二乘法等反擬合分析,以找出導致一個項目或采購中某些決策成功或失敗的關鍵成功因素。
目前的研究是重要的,因為它將在國防部的決策過程中創造一個重大的差異。國防部一直在為決策分析、資本預算和投資組合優化尋找更好的、理論上合理的、定量上嚴格的分析方法。具體的興趣在于如何識別和量化每個項目對軍隊的價值,并優化選擇正確的項目、系統和能力組合,使一些軍事價值(戰略、作戰或經濟)最大化,同時受到預算、成本、進度和風險限制。這項研究應用了私營部門和行業的最佳實踐,再加上先進的分析方法和模型,以幫助創建這些方法來做到這一點。然而,國防部的獨特性要求我們做更多的工作,以確定對軍隊的價值概念,同時考慮競爭的利益相關者的需求。國防部在其投資回報中需要有可辯護的、量化的、強有力的軍事價值概念,以做出最佳的資金決策,如在哪里投資、投資多少、投資多長時間。在國防部的非經濟環境中進行替代方案分析和平衡成本效益權衡時,這些決策選擇(戰略順序復合實際選擇、最佳時機選擇、增長選擇和其他選擇,以擴大、收縮和放棄)是至關重要的。國防部將提供歷史上保存下來的關于假設的各種替代性未來、模擬的替代方案以及為什么做出某些決定的見解。
人工神經網絡(NN)是一個數據驅動的、無分布的非參數方法系列,可用于非線性模式識別、預測建模和預測。神經網絡經常被用來指代生物神經元的組合網絡電路。該術語的現代用法通常也指 "人工神經網絡",包括在軟件環境中重新創建的人工神經元,或節點。這種人工網絡試圖模仿人類大腦中的神經元或神經元節點的思維方式,識別模式,以及在我們的情況下,識別模式來預測時間序列數據。NN方法可用于行為良好的時間序列以及混亂的物理系統。當用于大數據(BD)并與機器學習(ML)方法結合使用時,它可以被視為半監督的人工智能(AI)系統的一個交叉點。NN仍然被認為是半監督的,因為神經網絡需要一個多層次的訓練過程作為激活函數的一部分。例如,一旦系統中的激活被觸發,神經節點的權重和交互式卷積就可以自主地運行。在多層神經元節點中,第一個節點層的結果將成為后續節點層的輸入。
本文提議增加一個內部優化過程,以迭代運行的方式不斷訓練節點,使其最小化一系列的誤差測量,如標準化的誤差平方和,同時平衡和約束Akaike信息準則、Bayes準則和Hannan-Quinn準則。此外,這里的建議是在組合中加入組合模糊邏輯方法,以產生盡可能好的預測。模糊邏輯一詞來自模糊集合理論,用于處理近似而非精確的推理。相對于脆性邏輯,二元集有二元邏輯,模糊邏輯變量可能有一個真值,范圍在0和1之間,不受經典命題邏輯的兩個真值的限制。這種模糊加權模式與組合方法一起使用,可以得到時間序列的預測結果。
Augur(2016)對數據科學的歷史做了一個很好的總結。根據他的研究,"數據科學 "一詞最早出現在1974年,當時Peter Naur發表了題為 "計算機方法簡明調查 "的文章,并將其定義為:"處理數據的科學,一旦它們被建立起來,而數據與它們所代表的關系被委托給其他領域和科學。" 這個詞花了一段時間才流行起來,直到2010年才完全融入白話。數據科學家 "一詞通常歸功于2008年Facebook和LinkedIn的Jeff Hammerbacher和D. J. Patil。在2011年和2012年之間,"數據科學家 "的職位列表增加了15,000%,重點是與大數據的工作。到2016年,數據科學開始在人工智能領域根深蒂固,特別是在機器學習和深度學習的子領域。
當代和新出現的安全威脅以及從最近的軍事行動中吸取的教訓已經證明,為了在傳統的物理領域(陸地、空中、海上、太空)實現作戰目標,確保在非物理領域的主導地位至關重要,即網絡空間、電磁環境(EME)和信息環境。因此,除了物理作戰領域之外,在非物理領域取得優勢的能力對于實現戰役的軍事和非軍事目標具有決定性意義。
作戰人員將面臨消除沖突,協作,同步和整合行動的挑戰,以實現并發揮協同效應以應對多種威脅,其中可能還包括來自每個作戰領域對手的武裝沖突閾值以下的行動,包括非物質的。
本文探討了作戰環境聯合情報準備 (JIPOE) 作為支持聯合作戰規劃、執行和評估的主要工具的作用和意義,從而有助于多域作戰 (MDO) 的同步和協調。在這方面,基于政治、軍事、經濟、信息、基礎設施-物理、時間(PMESII-PT)方法,不可能將對當代作戰環境(OE)的分析局限于物理領域及其與非物理領域的關系。相反,作者們相信,確定一種合適的方法來關注在非物理領域單獨或聯合進行的活動影響,它們在PMESII-PT所有領域的相互融合和實際操作領域的相關性,將大大有助于友軍識別和評估對手的重心(COG)、關鍵弱點、意圖和行動路線(COAs)的能力,包括各自的指標。JIPOE將為聯合部隊指揮官(JFC)提供OE的整體視圖,將與戰術層面密切合作、共享和開發,通過結合不同領域的能力,應該能夠壓倒對手的部隊。這種集中控制和分散執行的方法將有助于在作戰和戰術層面之間產生協同效應。
未來的軍事行動將以物理和非物理層面的融合為特征,眾多不同的行為者將在其中運作。任何部隊都需要適應極其復雜的作戰環境和大量的作戰變量,需要適應性地使用一系列武器系統來產生致命和非致命的效果。因此,除了物理作戰領域(即陸地、空中、海上和太空),在非物理領域(網絡空間、EME、信息環境)取得優勢的能力將對實現戰役的軍事和非軍事目標具有決定性意義[1, p.280]。
OE是影響能力運用和影響指揮官決策的條件、環境和影響因素的綜合體[2, p.3]。了解OE的因素和條件不僅是所有計劃活動,特別是行動設計的關鍵前提,也是友軍保護和許多其他相關任務的關鍵前提[3, p.41]。
JIPOE代表了一種系統的方法,用于分析有關OE和對手的信息。它可以應用于全部的軍事行動。指揮官和參謀部在危機背景、根本原因和具體動態方面,對戰區形成共同的理解和整體的看法。它使指揮官能夠直觀地看到問題的程度,以及他們如何塑造和改變OE,使之成為他們的優勢,這將為他們的決策提供信息[2, p.3-5]。
JIPOE產品極大地促進了聯合(即作戰)層面的軍事行動的規劃和執行。現代軍隊,特別是北大西洋公約組織(NATO)內的軍隊,幾十年來在討論跨領域(陸、海、空)的協調行動時一直使用聯合這一術語。如今,由于全球安全環境的巨大變化以及俄羅斯和中國日益增長的野心,為了挑戰潛在的同行對手,需要采取多領域的方法。在傳統的戰爭門檻下,盟國及其合作伙伴已經受到了跨越物理和非物理領域的持續攻擊[4, p.2]。MDO一詞不同于聯合行動,因為它旨在關注跨越多個領域的行動,而不考慮服務的歸屬,不一定是由多個部門進行的行動[5,p.49]。
圖1:支持聯合行動的當前JIPOE流程的可視化。
圖2:提出支持MDO的JIPOE過程方案。
美國國防部(DOD)報告稱,人工智能(AI)是一項革命性的技術,有望改變未來的戰場和美國面臨的威脅的速度。人工智能能力將使機器能夠執行通常需要人類智能的任務,如得出結論和做出預測此外,人工智能機器可以以人類操作員無法企及的速度操縱和改變戰術。由于AI具有廣泛用途的潛力,國防部將其指定為頂級現代化領域,并投入大量精力和資金開發和獲取AI工具和能力,以支持作戰人員。在2022財年,國防部為科學和技術項目申請了147億美元,以及8.74億美元用于直接支持其人工智能努力。根據國防部2018年的人工智能戰略,未能將人工智能能力納入武器系統可能會阻礙戰士保護我們的國家抵御近同行對手的能力其他國家正在這一領域進行大量投資,這可能會削弱美國的軍事技術和作戰優勢。
美國國防部(DOD)正在積極追求人工智能(AI)能力。人工智能指的是旨在復制一系列人類功能,并不斷在分配的任務上做得更好的計算機系統。GAO之前確定了三種AI類型,如下圖所示。
國防部認識到開發和使用人工智能不同于傳統軟件。傳統軟件的編程是根據靜態指令執行任務,而人工智能的編程則是學習如何改進給定的任務。這需要大量的數據集、計算能力和持續監控,以確保功能按預期執行。支持國防部作戰任務的大部分人工智能能力仍在開發中。這些能力主要集中在分析情報,增強武器系統平臺,如不需要人工操作的飛機和艦船,并在戰場上提供建議(如將部隊轉移到哪里)。
當獲取依賴于復雜軟件的新能力時,國防部一直面臨著挑戰,例如長時間的獲取過程和熟練工人的短缺。GAO發現,它繼續面臨這些挑戰,同時還面臨人工智能特有的其他挑戰,包括有可用的數據來訓練人工智能。例如,人工智能探測對手的潛艇需要收集各種潛艇的圖像,并標記它們,這樣人工智能就可以學會自己識別。國防部還面臨著將訓練有素的人工智能集成到非為其設計的現有武器系統中的困難,以及在其人員中建立對人工智能的信任。國防部發起了一系列努力,如為人工智能和人工智能特定培訓建立一個跨服務的數字平臺,以應對這些挑戰,并支持其對人工智能的追求,但現在評估有效性還為時過早
【導讀】分布式機器學習Distributed Machine Learning是學術界和工業界關注的焦點。最近來自荷蘭的幾位研究人員撰寫了關于分布式機器學習的綜述,共33頁pdf和172篇文獻,概述了分布式機器學習相對于傳統(集中式)機器學習的挑戰和機遇,討論了用于分布式機器學習的技術,并對可用的系統進行了概述,從而全面概述了該領域的最新進展。
?論文地址: //www.zhuanzhi.ai/paper/161029da3ed8b6027a1199c026df7d07 ?
摘要 在過去的十年里,對人工智能的需求顯著增長,而機器學習技術的進步和利用硬件加速的能力推動了這種增長。然而,為了提高預測的質量并使機器學習解決方案在更復雜的應用中可行,需要大量的訓練數據。雖然小的機器學習模型可以用少量的數據進行訓練,但訓練大模型(如神經網絡)的輸入隨著參數的數量呈指數增長。由于處理訓練數據的需求已經超過了計算機器計算能力的增長,因此需要將機器學習的工作負載分布到多臺機器上,并將集中式的學習任務轉換為分布式系統。這些分布式系統提出了新的挑戰,首先是訓練過程的有效并行化和一致模型的創建。本文概述了分布式機器學習相對于傳統(集中式)機器學習的挑戰和機遇,討論了用于分布式機器學習的技術,并對可用的系統進行了概述,從而全面概述了該領域的最新進展。
1. 引言
近年來,新技術的快速發展導致了數據采集的空前增長。機器學習(ML)算法正越來越多地用于分析數據集和構建決策系統,因為問題的復雜性,算法解決方案是不可行的。例如控制自動駕駛汽車[23],識別語音[8],或者預測消費者行為[82]。
在某些情況下,訓練模型的長時間運行會引導解決方案設計者使用分布式系統來增加并行性和I/O帶寬總量,因為復雜應用程序所需的訓練數據很容易達到tb級的[29]。在其他情況下,當數據本身就是分布式的,或者數據太大而不能存儲在一臺機器上時,集中式解決方案甚至都不是一個選項。例如,大型企業對存儲在不同位置的[19]的數據進行事務處理,或者對大到無法移動和集中的天文數據進行事務處理[125]。
為了使這些類型的數據集可作為機器學習問題的訓練數據,必須選擇和實現能夠并行計算、數據分布和故障恢復能力的算法。在這一領域進行了豐富多樣的研究生態系統,我們將在本文中對其進行分類和討論。與之前關于分布式機器學習([120][124])或相關領域的調查([153][87][122][171][144])相比,我們對該問題應用了一個整體的觀點,并從分布式系統的角度討論了最先進的機器學習的實踐方面。
第2節深入討論了機器學習的系統挑戰,以及如何采用高性能計算(HPC)的思想來加速和提高可擴展性。第3節描述了分布式機器學習的參考體系結構,涵蓋了從算法到網絡通信模式的整個堆棧,這些模式可用于在各個節點之間交換狀態。第4節介紹了最廣泛使用的系統和庫的生態系統及其底層設計。最后,第5節討論了分布式機器學習的主要挑戰
2. 機器學習——高性能計算的挑戰?
近年來,機器學習技術在越來越復雜的應用中得到了廣泛應用。雖然出現了各種相互競爭的方法和算法,但所使用的數據表示在結構上驚人地相似。機器學習工作負載中的大多數計算都是關于向量、矩陣或張量的基本轉換——這是線性代數中眾所周知的問題。優化這些操作的需求是高性能計算社區數十年來一個非常活躍的研究領域。因此,一些來自HPC社區的技術和庫(如BLAS[89]或MPI[62])已經被機器學習社區成功地采用并集成到系統中。與此同時,HPC社區已經發現機器學習是一種新興的高價值工作負載,并開始將HPC方法應用于它們。Coates等人,[38]能夠在短短三天內,在他們的商用現貨高性能計算(COTS HPC)系統上訓練出一個10億個參數網絡。You等人[166]在Intel的Knights Landing(一種為高性能計算應用而設計的芯片)上優化了神經網絡的訓練。Kurth等人[84]證明了像提取天氣模式這樣的深度學習問題如何在大型并行高性能計算系統上進行優化和快速擴展。Yan等人[163]利用借鑒于HPC的輕量級概要分析等技術對工作負載需求進行建模,解決了在云計算基礎設施上調度深度神經網絡應用程序的挑戰。Li等人[91]研究了深度神經網絡在加速器上運行時對硬件錯誤的彈性特性,加速器通常部署在主要的高性能計算系統中。
與其他大規模計算挑戰一樣,加速工作負載有兩種基本的、互補的方法:向單個機器添加更多資源(垂直擴展或向上擴展)和向系統添加更多節點(水平擴展或向外擴展)。
3. 一個分布式機器學習的參考架構
圖1 機器學習的概述。在訓練階段,利用訓練數據和調整超參數對ML模型進行優化。然后利用訓練后的模型對輸入系統的新數據進行預測。
圖2 分布式機器學習中的并行性。數據并行性在di上訓練同一個模型的多個實例!模型并行性將單個模型的并行路徑分布到多個節點。
機器學習算法
機器學習算法學習根據數據做出決策或預測。我們根據以下三個特征對當前的ML算法進行了分類:
反饋、在學習過程中給算法的反饋類型
目的、期望的算法最終結果
方法、給出反饋時模型演化的本質
反饋 訓練算法需要反饋,這樣才能逐步提高模型的質量。反饋有幾種不同類型[165]:
包括 監督學習、無監督學習、半監督學習與強化學習
目的 機器學習算法可用于各種各樣的目的,如對圖像進行分類或預測事件的概率。它們通常用于以下任務[85]: 異常檢測、分類、聚類、降維、表示學習、回歸
每一個有效的ML算法都需要一種方法來迫使算法根據新的輸入數據進行改進,從而提高其準確性。通過算法的學習方式,我們識別出了不同的ML方法組: 演化算法、隨機梯度下降、支持向量機、感知器、神經網絡、規則機器學習、主題模型、矩陣分解。
圖3所示:基于分布程度的分布式機器學習拓撲
4. 分布式機器學習生態系統
圖4所示。分布式機器學習生態系統。通用分布式框架和單機ML系統和庫都在向分布式機器學習靠攏。云是ML的一種新的交付模型。
5 結論和當前的挑戰
分布式機器學習是一個蓬勃發展的生態系統,它在體系結構、算法、性能和效率方面都有各種各樣的解決方案。為了使分布式機器學習在第一時間成為可行的,必須克服一些基本的挑戰,例如,建立一種機制,使數據處理并行化,同時將結果組合成一個單一的一致模型。現在有工業級系統,針對日益增長的欲望與機器學習解決更復雜的問題,分布式機器學習越來越普遍和單機解決方案例外,類似于數據處理一般發展在過去的十年。然而,對于分布式機器學習的長期成功來說,仍然存在許多挑戰:性能、容錯、隱私、可移植性等。