這項研究測試了Oreg和Bayazit(2009)的認知偏見分類法。使用469名美國陸軍士兵的樣本和代表擬議分類的六種偏見,進行了各種分析以確定分類法的有效性,目的是推進理論和對認知偏見的理解。然而,幾乎沒有發現支持該分類法的證據。具體來說,盡管驗證和簡化偏見與同一類別的偏見的關系比與其他類別的偏見的關系更為密切,但在調節偏見方面卻沒有一個明確的模式。此外,Oreg和Bayazit(2009)提出的個體差異(如神經質)基本上不能有意義地預測啟發式和偏見的任務表現。總的來說,如果關于認知偏差的研究要務實并具有現實世界的應用,那么認知偏差作為一個結構需要被更好地定義。此外,對認知偏差的測量需要包括主體間和主體內的測量,并且應該重新審視評分方法。
需要一個有意義的分類方法來推進認知啟發式方法和認知偏見的研究。Oreg和Bayazit(2009)提出了一個分類系統,根據偏見的共同基本機制(即個體差異)和動機終點來組織偏見。然而,Oreg和Bayazit(2009)的主張在很大程度上仍然是理論性的。因此,本研究的目的是測試Oreg和Bayazit(2009)提出的分類法的有效性和效用。本研究的目的是:(1)檢驗認知偏見是否集中在所提出的三個類別中;(2)調查偏見是否有共同的基本機制。
為了評估分類法及其命題的有效性,我們進行了一些分析以積累證據。具體來說,我們評估了零階相關,進行了探索性因素分析,并評估了基本機制(即個體差異)與每個啟發式和偏見類別之間的關系。最終的樣本由469名駐扎在美國的現役美國陸軍軍官和士兵組成。數據的收集是在課堂上使用紙筆調查問卷進行的。
根據Oreg和Bayazit(2009年)提出的分類法,可以發現支持個體差異和認知偏見之間關系的證據微乎其微。偏見類別之間的經驗關系與提議的分類法并不一致,個體差異和偏見之間的假設關系大多沒有得到支持。一些令人鼓舞的發現確實出現了。一個類別內的偏見之間的關聯模式比不同類別的偏見之間的關聯模式更強烈的正向。這些結果不應該被視為意味著分類法是無效的;由于我們的研究只代表了一個單一的研究,所以現在確定分類法結構是不充分的或沒有用的還為時尚早。
如果改進測量的努力未能發生,本研究的最小發現可以作為未來認知偏見研究的預示。本文可以指導未來的偏見研究領域,特別是關于為推動該領域的發展而需要采取的強化測量工具。此外,研究結果還指出要把偏見理解為一種認知過程,而不是基于特質的個體差異。未來的測量應該考慮傳統心理測量評估的替代方法,以實時評估這一過程。
基于深度神經網絡的機器學習方法已經取得了長足的進步,并在許多具有挑戰性的應用領域中表現出最先進的水平,包括計算機視覺、自然語言處理、語音識別和強化學習等等。這些結果通常是通過使用非常深入的神經網絡訓練的大型標記數據集獲得的,這些網絡以分層的方式學習原始數據特征的高度非線性抽象。此外,這些方法經常通過神經結構設計的方式納入歸納偏見,以限制可能的解決方案的集合。例如,卷積神經網絡(CNN)廣泛使用具有小感受野的卷積,在一定程度上模仿靈長類動物視覺系統的神經結構。事實上,已經證明,通過CNN學習的表征與從靈長類視覺系統學習的表征相比更有優勢。由于這些成功,神經網絡方法常常被視為在這些領域建立模型時的事實上的方法。
即使在多個應用領域取得了這些進展,神經網絡方法應用于表格數據的可行性仍有一些不確定性。表格數據包括以(行,列)表格式存儲的數據,其中行包含獨立的實例,列包含不同的特征。此外,表中的每一列/特征可能有不同的可能數據類型(例如,二進制與連續與分類),代表了一種高度異質的數據格式。麥肯錫公司最近的一項研究,調查了19個不同行業的400多個應用領域,顯示這種類型的表格數據是工業中最常用的數據格式之一。在表格數據上建立機器學習分類模型的標準方法一般是以決策樹(DTs)的形式出現,這是一個有監督的機器學習模型系列,它建立了一個樹狀圖,節點代表我們挑選特征子集的地方,并根據這些特征提出決策規則/閾值(例如。如果性別=男性和年齡>40歲,對于一個包含性別和年齡特征的表格數據集);邊代表這個決策規則的結果;葉子代表輸出,可以是另一個具有另一組輸入特征的決策節點,也可以是預測的感興趣的類別標簽。
基于DT的方法有很多好處,包括它們的基本形式具有很強的可解釋性(例如,通過跟蹤決策節點的層次流),這在許多現實世界的應用中是一個重要的關注點,而且它們的訓練計算速度很快。然而,DT方法也有幾個缺點:1)它們容易過度擬合,導致泛化效果差;2)它們對輸入數據的微小擾動非常敏感(在不同的數據子集上訓練時,可能會學到非常不同的樹);3)它們很難對非常復雜、高度非線性的決策規則建模。這些缺點開啟了使用神經網絡方法的可能性,因為它們有能力對高度非線性關系進行建模,并且對輸入數據的微小偏差具有更好的魯棒性,這一點在其他幾個應用領域中得到了證明。然而,由于之前提出的神經網絡架構并不適合于表格數據,缺乏適當的歸納偏差往往導致它們無法為表格數據找到最佳解決方案。
在過去的幾年里,人們對構建用于表格數據的神經網絡方法的興趣越來越濃厚。特別是,最近的一項研究比較了幾種不同的神經網絡架構和基于DT的方法,發現在對40個不同的表格式數據集進行評估時,神經網絡方法與基于DT的方法具有競爭力,這些數據集具有不同數量的實例(690-418,000)和特征(5-2000)。在許多情況下,這些神經網絡方法的表現超過了基于DT的方法,這表明現在有可行的神經網絡方法可以應用于表格數據。
在這份報告中,我們描述了我們對表格神經網絡方法進行評估的初步結果,該方法使用可穿戴生理傳感器技術,如心電圖(ECG)和皮膚電化學反應(GSR)進行人類情感狀態分類(如壓力、喚醒)。情感狀態分類是人機交互(HCI)界日益關注的領域,因為模擬和預測人類情感狀態的能力開辟了新的研究方向,側重于改善人類與自主智能系統的互動和團隊。
情感狀態分類的最大挑戰之一是跨個體的穩健表現,在這個領域之前沒有多少工作。然而,在這一領域,由于需要進行人體測試,以及個體間潛在的情感狀態存在很大程度的變異,所以很難收集大量的標記數據集。我們假設,在低標簽數據制度下,對預先提取的特征進行訓練的表格神經網絡方法可能是一種可行的替代方法,可以完全替代傳統上需要大量標簽數據集才能有效訓練的深度神經網絡的端到端訓練(即沒有任何先驗的特征處理)。為了測試這一假設,我們使用了模型框架AutoGluon-Tabular,它是一個易于使用且高度準確的Python庫,用于構建表格數據的神經網絡。本報告總結了我們使用三個公開可用數據集的發現。認知負荷、情感和壓力 認知負荷、情感和壓力(CLAS)、ASCERTAIN和AMIGOS。 我們最初的分析集中在這三個數據集內部和之間的主體間分類,因為這仍然是情感狀態分類的關鍵挑戰之一。
因果推理一直是科學的一部分,從牛頓定律到毀滅性的COVID-19大流行病,因果思想已經定義了基本科學。原因解釋了 "為什么",而結果則描述了"什么"。這個領域本身包含了大量的學科,從統計學和計算機科學到經濟學和哲學。最近機器學習和人工智能系統的進步,使人們對從大量可用的觀察數據中識別和估計因果關系重新產生了興趣。這導致了各種新的研究,旨在提供識別和估計因果推斷的新方法。我們包括一個詳細的因果推斷框架、方法和評價的分類法。還提供了關于安全因果關系的概述。闡述了公開的挑戰,并描述了評估因果推斷方法的穩健性的措施。本報告旨在對此類因果關系的研究進行全面綜述。我們對因果關系框架進行了深入審查,并描述了不同的方法。
因果概念,也被稱為因果關系,自科學本身誕生以來就定義了基礎科學。因果關系仍然是任何科學發現的核心,其中原因解釋了 "為什么",結果描述了 "什么"。因果關系經常被錯誤地與相關關系交替使用,盡管相關關系并不意味著因果關系。盡管相關關系對科學來說至關重要,但將相關關系錯誤地表述為因果關系會產生不利影響。例如,Covid-19和一些藥物之間的相關性導致未經證實的關于可能治療疾病的理論傳播開來。相關性指的是兩個具有特定趨勢的變量之間的關系,而因果性是指因果關系,即因要對果負責,而果在一定程度上依賴于因。因此,因果學習是指從數據中產生因果關系的過程。因果關系在我們的日常生活中也發揮著重要的、無所不在的作用。我們做出的每一個決定都有一個因果變量,決定了我們的生活方式。因此,假設因果學習是任何人工智能(AI)或機器學習(ML)系統的關鍵組成部分,無論其在商業和軍事應用中的用途如何,都是至關重要的。因果學習在過去20年內的研究活動有所增加,每年的出版物反映了因果研究的快速上升(圖1)。
圖 1 因果推理和因果關系的年度出版物(數據來自 Scopus)
過去十年中,人工智能/機器學習系統的最新進展使人工推理系統成為許多行業的前沿。隨著AI/ML系統有望自主行動并顯示出類似人類的智慧,仍然存在一些基本的挑戰,如穩健性、可遷移性、可解釋性和因果關系。雖然AI/ML系統在預測的準確性和精確性方面取得了巨大的成就,但它們本質上仍然是黑盒模型,因此缺乏對系統如何得出預測結果的解釋。這給這類系統的使用帶來了不必要的問題,有偏見的預測影響了人類的生活。這就產生了可解釋人工智能(XAI),它被視為黑盒問題的解決方案,人工智能/ML系統能夠向最終用戶解釋其決策過程。開發XAI系統的目標之一是,不僅要減輕來自模型本身的偏見,還要減輕來自用于預測的傳入數據的偏見。算法/模型的偏差可以通過各種技術來識別和緩解,但數據本身的內在偏差則更難緩解。因此,因果關系對于識別和緩解人工智能系統的數據偏差至關重要。根據Judea Pearl博士的說法,因果關系可以讓人工智能/ML系統 "編排其環境的解析和模塊化表征,審問該表征,通過想象力的行為扭曲它,并最終回答'如果'類型的問題"。關于XAI的進一步閱讀,我們建議讀者回顧詳細的調查,如Rawal等人、Gunning等人、Xu等人和Arrieta等人。
盡管有關于因果關系的相關調查和基礎研究,如Judea Pearl、Morgan等人、Yao等人和Gianicolo等人的調查提供了很好的概述,但也需要一個最新的調查,不僅對因果關系,而且對其與AI/ML有關的目標和評價指標進行更全面的考察。本調查報告旨在通過提供一個全面的調查來填補文獻的空白,該調查研究了因果關系從開發到評估的所有方面,并強調了最近在因果關系AI/ML系統方面取得的一些突破和進展。這項調查的主要貢獻包括以下幾點:
我們通過關注該領域從設計和開發到評估的所有方面,對因果關系進行了詳細的概述。
我們總結了因果關系的設計/開發和評估的綜合分類法(第17頁)。
我們提供了因果關系學習方法的比較。
我們提供了對網絡安全使用因果關系的見解,并強調了最近在因果安全方面的一些進展。
我們對該領域仍然存在的挑戰進行了公開討論,并對解決這些挑戰的建議提出了看法。
本報告的結構如下。第2節介紹了分類法和對因果推斷水平的見解。第3節對利用因果推理和因果發現的設計和開發方法進行了簡要調查。第4節描述了用于測量因果AI/ML系統有效性的技術。第5節簡要介紹了網絡安全的因果關系。第6節討論了因果關系研究中的公開挑戰和當前趨勢。第7節為總結性意見。
美國陸軍作戰能力發展司令部陸軍研究實驗室的目的是 "創造和利用科學知識以實現轉型超配"(CCDC ARL 2020)。在這里,轉型超配的最佳解釋是軍事能力(部分通過創造和利用科學知識實現)大大超過了對手的相關能力,以至于美國陸軍在追求創新、轉型的作戰方式方面獲得了選擇。
大約兩年前,在準備一次公開演講時,我(作者,以下同)決定尋找一些鼓舞人心的例子,在這些例子中,陸軍科學家創造和/或利用了科學知識,從而實現了變革性的超配。我推斷,彈道研究實驗室(BRL)的歷史,特別是它對第二次世界大戰(WW2)的貢獻,將是這類例子的最佳來源。
事實上,BRL是DEVCOM陸軍研究實驗室(以及其他幾個實驗室)的一個顯著的雛形。到90年代中期,當DEVCOM ARL通過合并先前存在的幾個實驗室而形成時,BRL可能是這些實驗室中最大、最古老和最有成就的。而二戰是一個合適的歷史時期,可以尋求一個鼓舞人心的例子:它是人類歷史上最具破壞性和令人恐懼的沖突,是過去100年中美國與同行對手作戰的唯一重大沖突,也是美國最偉大的一代的崇高勝利。
考慮到這一切,我決定對現有文獻進行研究,尋找BRL在二戰期間表現出的明顯的超常發揮的科學工作。為了研究的目的,我只關注一個組織--BRL,原因如前所述。我的研究也只集中在一個特定的歷史時期--從1930年代中期到二戰結束,這也是出于前面所說的原因。在資料來源方面,我從兩本專門記錄BRL歷史的出版物開始(BRL 1995),以及其上級組織--軍械部(Green 1955)。我用其他可能找到相關信息的文獻來充實這些關鍵資料;見第5節。毋庸置疑,我將資料來源限制在公共領域的信息。雖然這種方法可能會忽略一些對超配的重要貢獻,但我沒有看到證據表明缺失的部分(如果有的話)是如此之大,以至于改變了我的發現和結論。
這項研究的目的有兩個方面。第一個目的是找出二戰期間BRL的科學努力和成就導致超額完成任務的例子。在每一個案例中,我都確保不會不加批判地接受關于這種成就的說法。我問自己,"我們是否有客觀、切實的支持,以及它是否真的代表了科學對二戰中公認的軍事超越的貢獻?" 特別是,即使BRL的技術報告中描述了某項研究工作,我也要尋找單獨的文件證據,證明該研究的結果確實對超額完成任務有所貢獻。第二,我想尋找可能為此類軍事科技組織的未來工作提供參考的見解和經驗教訓。
雖然我的一些發現是鼓舞人心的,但其他的發現并不完全令人欣慰。然而,我確實認為,它們值得公開和真實地討論。坦率地審視過去的挑戰有助于我們應對未來的此類挑戰。
本報告是我對這項研究的發現和結論的總結。本報告的其余部分組織如下。在第2節中,我討論了支持和反對選擇不同時間段和不同方法進行這種研究的論點。在第3節中,我回顧了BRL的多項成就,這些成就本可以是對軍事能力的不可或缺的貢獻,而且在許多情況下,實際上是對軍事能力的不可或缺的貢獻,包括二戰期間美國軍隊的超強能力。接下來是第4節的意見和結論。
美國陸軍未來司令部的士兵致命性(SL)跨職能小組(CFT)正在研究通過頭戴式和武器式能力的組合來增強下馬步兵的新方法。根據SLCFT的指示,美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室的研究人員探索了加強輔助目標識別能力的技術,作為陸軍下一代智能班組武器計劃的一部分。
敵對環境中涉及潛在目標的復雜決策必須由下馬的士兵做出,以保持戰術優勢。這些決定可能是人工智能(AI)技術的強大信息,如AI支持的火力或指揮和控制決策輔助工具。例如,一個士兵發射武器是一個明確的跡象,表明該地區有一個敵對的目標。然而,一個士兵在環境中追蹤一個潛在的目標,然后放下他們的武器,這是一個模糊的、隱含的跡象,表明該目標受到關注,但最終被該士兵認為不是一個直接的威脅。在近距離作戰的環境中,與士兵狀態相關的隱性標記數據(如光電視頻、位置信息或火力行動)可用于輸入決策輔助工具,以得出真實的戰場背景。然而,需要對這些行動進行更徹底的檢查。此外,來自單個士兵的突發非交流行為在整個班級中的匯總可以增強戰術態勢感知。盡管它們有可能產生戰術影響,但這些狀態估計或行為指標往往不能以立即可用的形式獲得。
DEVCOM陸軍研究實驗室(ARL)的研究人員調查了一種通過機會主義感應來進行下馬士兵狀態估計的方法--一種不需要人類明確行動就能收集和推斷關鍵的真實世界數據的方法。在通過正常使用武器追蹤和攻擊移動和靜止目標時,連續獲得數據以解釋士兵的行為。這項工作中使用的士兵-武器行為分類方法主要來自人類活動識別(HAR)研究。然而,在這項工作中,為了提高行為結果的生態有效性,在眼球追蹤文獻中經常使用的實驗范式被反映出來,將眼球運動和認知推理聯系起來。具體來說,眼動跟蹤研究的一個子集的目標是收集和解釋與公開的視覺注意力有關的眼動事件(即固定、囊狀運動和追逐),這可以揭示認知過程和關于環境的客觀內容。在戰斗中,士兵們可能會將他們的目標停留在一個靜態的目標上(固定),當出現新的目標時迅速轉換目標點,有潛在的目標出現(囊狀運動),或者在潛在目標移動時跟蹤他們的目標點(平滑追擊)。
目前,頭戴式眼動跟蹤技術正在開發用于戰斗。然而,與校準誤差有關的凝視數據中的噪聲使其難以有效地使用這些數據。一個更突出的解決方案可能存在于士兵和他們的武器之間的互動中,這項工作使用傳統的HAR技術進行。執行HAR的主要方法是在一個人進行一些身體活動時,使用慣性測量單元收集時間序列數據。然后使用機器學習技術來訓練分類模型,根據數據信號預測行動。這種方法可以擴展到包括在人類與物體互動時對其運動的分類。在這種情況下,當近距離作戰的士兵與潛在的威脅進行互動時,武器的運動特征被伺機獲得,這為這些士兵在這種環境中做出的復雜決定提供了一個窗口。
論文中記錄并發表了對這一評估的全面分析。對來自動態士兵狀態估計的運動數據進行建模和分析以實現對形勢的理解。
美國陸軍最近制定了一項關于未來陸軍如何作戰的戰略以及實現這些軍事能力的相關現代化和研究重點。以高超音速飛行為基礎的遠程精確射擊對于確保美國能夠對任何競爭對手實施其意志至關重要。要實現一個有效的未來美國軍隊,必須克服許多障礙。其中一些差距是對高超音速飛行器空氣熱力學的理解,從而促使對基礎研究的需求。本報告的目標是定義一個經典的、與陸軍相關的配置,適合于基礎研究,以允許與適當的主題專家的關鍵數量的集中合作。從這種開放的幾何構型研究中獲得的數據和知識可能會受到更多的限制性分配。
美國陸軍最近制定了一項關于未來陸軍如何作戰的戰略以及實現這些軍事能力的相關現代化和研究重點。以高超音速飛行為基礎的遠程精確射擊對于確保美國能夠對任何競爭對手實施其意志至關重要。
要實現一個有效的未來美國軍隊,必須克服許多障礙。其中一些差距是對高超音速飛行器空氣熱力學的理解,從而促使對基礎性研究的需求。缺乏對高超音速飛行器周圍發生的復雜物理和化學的預測性知識,抑制了及時的、優化的多部件設計。對邊界層過渡和沖擊-邊界層相互作用等具體現象了解不多。不能正確地對現象進行建模,會產生一些不確定的特征,如表面壓力分布和熱通量,這對飛行器技術,包括穩定性、控制和熱負荷管理,都有負面影響。
幸運的是,有一個先例,即通過定義政府基準飛行器來促進全社會的科學討論,這些飛行器包含功能相關的工件,但對具體的發展計劃不敏感(見陸軍-海軍基本芬納導彈、空軍改良基本芬納導彈、陸軍-海軍旋轉火箭、國家航空航天飛機和NASA研究)。本報告的目標是定義一個典型的、與軍隊相關的配置,適合于基礎研究,以便與足夠數量的適當的主題專家進行重點合作。從這個開放的幾何構型的研究中獲得的數據和知識可能會受到更多的限制性分配。
摘要:基于能力的規劃作為國防規劃的一種方法,是一個幾乎無限復雜的工程系統,有無數的節點和相互依賴的層次,受到國家和非國家的外交活動、信息、軍事和經濟行動的影響,產生次要和第三秩序的影響。基于能力的規劃的主要產出是實現預期最終狀態所需的一套能力要求。一種振興的定性技術使我們能夠深入了解軍隊中的非結構化和模糊的問題,這就是兵棋推演--其最簡單的形式就是手工戰爭演習。同時,人們一直在推動將計算機輔助引入這種兵棋推演,特別是支持裁判員的裁決,并更普遍地走向兵棋推演中人類因素的完全自動化。然而,兵棋推演中的計算機輔助不應該不計成本地被推向量化技術。一個問題的客觀復雜性往往不允許我們以必要的保真度來復制作戰環境,以獲得可信的實驗結果。本文討論了一個發現實驗,旨在驗證在計算機輔助兵棋推演中應用定性專家系統來開發能力要求的概念,以減少裁判員的偏見和與他們的決定相關的風險。這里的創新在于,在設計構成專家系統核心的能力發展理論模型時,應用了系統動力學建模和仿真范式。這種新的方法可以對不同的能力要求建議進行定性比較。此外,專家系統使我們能夠揭示預算削減對擬議的能力要求解決方案的影響,而公斷人以前在比較單個解決方案時,僅僅依靠自己的知識是無法闡明這種影響的。兵棋推演中的玩家驗證了所提出的概念,并提出了該研究可能向前發展的方式:即使用戶能夠定義他們自己的能力,而不是被預先定義的能力集所限制。
關鍵詞:計算機輔助兵棋推演;基于軍事能力的規劃;兵棋推演;能力要求;專家系統
通過數據處理收集信息并將其轉化為知識是決策中的一個重要方面[1,2]。當前復雜的環境,由于多維作戰、武器系統的多樣性、國家理論的差異、領導層的個性以及無處不在的信息而變得更加復雜,這就更加需要減少克勞塞維茨的戰爭 "摩擦"[3]。減輕這種摩擦的一種手段是通過增加定量分析來支持決策,同時又不失去決策過程中以人為核心的主要優勢。因此,在實現軍事信譽的同時,實現數學的嚴謹性以支持決策過程是一項持續的努力。創新來自于知識的發現[4]。因此,指揮官需要有能力研究和重新研究產生非結構化問題的復雜系統,以發現創新的方法,從而形成對對手的比較優勢[5]。
研究問題的定性和定量方法形成了兩個基本的方法系列,可以相互受益[6]。無論是定性還是定量,每種方法都包含了獲取問題信息的具體技術。本文主張在分析復雜系統時使用一種定性方法;軍事防御規劃;一種建立在使用專家系統來裁決兵棋推演的方法。
下一部分首先描述了作為研究主體的軍事防御計劃的現狀,其次闡述了作為研究的主要應用定性方法的兵棋推演。接下來是對應用于國防規劃或相關領域的定量方法的文獻的回顧,展示了其目前的局限性。
在一般的戰爭經驗中,各國已經認識到,為保護國家利益而提前做好準備是具有資源和時間效益的。國防規劃是這樣做的一種方式。20世紀60年代初,美國國防部在面臨尋找滿足美國政治指導的軍事力量結構的挑戰時,討論了這個領域的規劃[7]。同樣的目標也是北約主要機構之一--國防規劃委員會(DPC)的任務[8]。從[7,8]中我們可以得出結論,國防規劃的產出規定了對軍事力量的要求,以涵蓋各自國家或國際國防組織的政治野心。在《長期國防規劃手冊》中,我們發現了國防規劃的其他特點,特別是它的長期方向、戰略層面和多學科的特點[9]。Breitenbauch和Jakobsson,以及Stojkovic和Dahl強調了國防規劃的相同特點[10,11]。這使得國防規劃成為需要解決的最復雜的軍事非結構化問題。此外,不確定的作戰環境使國防規劃變得更加復雜[12]。
拋開冷戰時代,北約決定更多地參與危機應對行動,并重建其防御能力,以完成相應的軍事以及非軍事任務。這一轉變的實際結果體現在北約防御規劃進程(NDPP)中,這一進程的產出是一套能力要求,而不是所需部隊的清單[13]。這種方法被稱為基于能力的規劃(CBP)[14]。
盡管北約國家及其合作伙伴一直被鼓勵將他們的程序與NDPP同步,即以能力規劃而非武力規劃為導向,但仍有一些國家的國防規劃仍然主要集中在武力規劃上[15]。CBP國防規劃方法為其用戶提供了一個共享的規劃平臺,用于制定整個軍事和非軍事活動的必要工具要求。CBP與它的載體的通用能力一起工作,它為內部以及外部的商業或國有載體提供一個共同的平臺。此外,CBP比部隊規劃更有效地將國防規劃和行動規劃聯系起來。
北約將軍事能力定義為通過采用一套綜合的方面來創造效果的能力,這些方面可分為理論、組織、訓練、物資、領導力發展、人員、設施和互操作性[16]。欣格將軍事能力定義為在特定作戰環境中實現預期效果的能力[17]。在這項研究中,引入了一個能力的理論模型,描述了能力隨時間變化的特征。能力是由其范圍和效果來描述的,例如。"能夠在極端炎熱和寒冷的天氣條件下進行聯合和聯合遠征作戰和戰術部署,并能在大多數地形的惡劣條件下作戰"。
圖1是由Hodicky和Melichar提出的,描述了CBP過程的概述和它在國家層面上的階段性應用[18]。
圖1. 基于能力的規劃循環過程,由國家政治指導和戰略分析提供能力發展計劃開始[18]。
國家政治指導,與預測20年范圍內的政治和軍事氣候的戰略分析同時進行,啟動了國家方案編制過程,并在戰略層面形成了描述未來作戰環境的情景。選定的場景為兵棋推演提供了刺激,產生了涵蓋所有潛在威脅和國家政治野心的能力要求。在現有力量和所需能力之間進行比較,產生能力差距。能力發展計劃包含每個能力發展的里程碑,推動所有中長期軍事投資。能力發展評估通過反映能力發展中必要變化的最新政治指導,向中央政治局提供反饋。
Spiegeleire具體說明了基于能力的規劃的趨勢,明確闡述了在未來復雜的作戰環境中,需要對國防規劃過程有更多的洞察力[19]。
定性調查方法涉及開放式問題和個人定義或解釋,以描述或理解一個事件[20]。在軍事領域,一種能夠獲得洞察力的重振的定性技術是兵棋推演--其基本形式是手動兵棋推演。近年來,美國軍方和北約重新發現了兵棋推演,認為它是探索日益困難的問題的有效途徑[21]。此外,兵棋推演的使用不僅限于軍事領域,其使用和價值的例子存在于不同的領域[22],盡管它們超出了本文的范圍。
從歷史上看,兵棋推演是一種軍事上的主要工具。公元前5世紀,孫子將 "圍魏救趙 "作為理解孫子兵法概念的基本工具。然而,兵棋推演最重要的進步是由于喬治-海因里希-魯道夫-約翰-馮-賴斯維茨的努力,他在他的kriegsspiel[23]中開創了現實主義。
以下關于兵棋推演的定義使我們能夠制定其基本要素并幫助我們理解研究方法。
佩拉將兵棋推演定義為。"使用規則、數據和程序的戰爭模型或模擬,不涉及實際的軍事力量,其中事件的流程受到代表敵對雙方的玩家的影響,并反過來影響他們在這些事件過程中做出的決定[23]"。
北約(2015)將兵棋推演定義為。"通過任何手段,使用特定的規則、數據、方法和程序,對軍事行動進行的模擬[24]。
紅隊指南(2013)將兵棋推演定義為:"基于場景的戰爭模型。"一種基于場景的戰爭模型,其中的結果和事件的順序會影響到玩家的決定,并受到其影響[25]"。
即使這些定義強調了兵棋推演的不同要素,它們共同構成了軍事兵棋推演的基本要素。兵棋推演(WG)的場景是玩家的開場白。它是對場景的詳盡描述,它包含了關于行動區域的地緣政治信息,描述了政治、軍事、經濟、社會、信息和基礎設施(PMESII)因素。WG的作戰命令(ORBAT)包含自己部隊的能力及其特點。WG地圖和圖表創建了場景和玩家之間的界面。它是場景的一個額外的附加物,使玩家沉浸在作戰環境中。WG時鐘是游戲流程的驅動力。它應該反映目標和玩家的需要。WG的規則和數據為玩家的行動和決策過程創造了界限,并在游戲中由裁判員執行。WG玩家賦予了兵棋推演動態的品質。他們管理計劃和決策過程。通常情況下,有兩組選手--藍色和紅色。WG分析員研究兵棋推演的執行結果,制定論據以支持裁判員的決定,并提出分析性問題。WG公斷人對選手的執行計劃進行裁決。裁判員是兵棋推演中成功認知子階段的主要推動者。他負責制定單一兵棋推演周期執行過程中的成就、挫折和限制。關于軍事領域的兵棋推演要素和兵棋推演生命周期的進一步閱讀,請參考《兵棋推演手冊》[26]。關于游戲機制的詳細設計,并非專門針對軍事兵棋推演領域,請參考Adams和Dormans[27]。
上述關于WG的定義有一個共同點--使用建模和仿真(M&S)。每個工作組都需要以最大限度接近現實的方式復制作戰環境。建模過程創建了一個操作環境的模型,模型的行為在模擬中通過模型的及時執行而被仔細檢查。仿真刺激了玩家:兵棋推演環境首先迫使他們在兵棋推演計劃階段發揮他們的創造力,其次迫使他們在游戲的認知階段進行學習。
沒有一種單一的兵棋分類被兵棋推演界所接受。了解和實施國防實驗指南》根據模擬類型的形式對WG進行了分類[28]。《紅隊指南》手冊將兵棋推演分為兩個大家族[25]。第一個家族屬于決策支持領域,第二個家族屬于培訓/教育領域。Purnele將兵棋推演按其裁決方式進行分類:研討會(非裁決)、矩陣、專家和剛性[29]。推動這項研究的WG分類闡明了在模擬作戰環境中所代表的WG元素的自動化水平[21]。圖2描述了WG分類的基本理念,它將WG問題的客觀復雜程度(定義為問題/系統元素/對象的數量及其關系的函數)[30]、WG元素的自動化程度和WG中代表的人類行為的保真度放在一起。我們根據我們對操作的觀察創建了圖2。
手動WG(MWG)沒有任何計算機手段參與執行WG。人工環形模擬代表了人工WG,其中作戰環境、行動方案和效果都是由人類完全控制的。MWG分析代表復雜系統的非結構化問題,對人類行為的保真度很高,因為它不取代任何WG的人類元素。完全自動化的WG(FAWG)有所有的WG人類角色,如裁判員、球員和分析員完全自動化。帶有自動分析員的閉環模擬表示FAWG。FAWG中沒有人類干預,就作者所知,目前還沒有這樣的解決方案。如果使用最先進的人工智能技術來實現FAWG,它對人類行為的保真度會很低。計算機輔助WG(CAWG)將特定的WG人類行為元素自動化。隨著CAWG中更多的人類行為元素被自動化,人類行為的保真度就會下降。
圖2. 在定量和定性技術格局中的WG分類(手工WG、計算機輔助WG和全自動WG)[21]及其與WG問題的客觀復雜性水平、WG要素的自動化水平和WG中人類行為的保真度水平的關系
因此,MWG傾向于采用更多的定性技術來發現信息,運用高水平的創造力;相反,FAWG代表了一種定量的方式,通過假設測試來分析問題。通過降低復雜程度,我們能夠使用更多的定量方法來研究一個問題,反之亦然。
下面的例子描述了與國防規劃或相關軍事問題有關的定性和定量技術的現狀。
一些定量方法的例子旨在將資源分配給不同的武器,以便通過優化單一目標函數,如有效性或利潤,有效地消除來自敵對國家的威脅。Gu at al.通過最大化預期效益實現了一個武裝部隊結構的規劃模型[31]。H?kenstad at al.比較了一組選定國家的長期防御規劃系統,并得出結論,大多數國家的目標是提高自己的利潤[32]。Zhang等人提出了一個模型,根據給定的作戰要求,通過武器系統的組合使能力差距最小化[33]。Wan等人引入了約束性非線性優化問題--武器發展規劃是通過最小化敵人造成的威脅作為目標函數來解決的[34]。這些研究[31-34]的主要缺點是缺乏人類行為因素,因為它們沒有任何兵棋推演的形式。因此,它們在基于能力的防御規劃方法中的適用性和結果的可信度是值得懷疑的。此外,模型中的實體被簡化為適合優化任務的形式,因此,與現實相比,這些模型的分辨率非常低(例如,在[33]中,作戰環境被簡化為傳感器、決策、影響者和目標等節點,屬性有限)。
Zhuang等人認識到,兵棋推演結構的復雜性使得任何分析得出的解決方案都是不可能的[35]。在他們對叛亂行動的決策研究中,Zhuang等人試圖改進決策啟發式的發展。這一努力始于對六人工作組行為的研究。該小組將一個MWG研討會游戲轉變為CAWG,玩家和裁判員完全自動化。自動化是通過簡單的規則完成的,這些規則決定了玩家如何實施基于PMESII的選項:政治(P)、軍事(M)、經濟(E)、社會(S)、基礎設施(I1)和信息(I2)。該研究與FAWG很接近,盡管沒有分析員是自動化的。該研究的局限性在于,自動化選手只能使用團隊編程的那套啟發式方法,而且模擬的作戰環境沒有達到完整的防御規劃的復雜性--它以叛亂行動為中心,這主要與軍隊的作戰和戰略決策水平有關。
Hernandez等人結合之前的努力[35],將有自動裁判員的CAWG自動化,變成有自動裁判員和球員的CAWG,然后在CAWG的指定 "回合 "應用實驗和修改的決策啟發式方法[36]。該小組從實際的HITL CAWG中得出了他們最初的決策啟發式方法,并在操作社區內驗證了這些規則。該研究承認,啟發式方法需要適應情況的動態變化和參與的參與者。因此,作為階段性實驗的分階段決策啟發法被引入,它允許使用一套不同于原始兵棋推演的規則。在CAWG的每一回合中,都會創建一個新的起始決策點,玩家按照CAWG的起始點進行決策。這就為CAWG的每個回合創建了玩家的決策樹,然后對其進行編碼,并通過具體的實驗設計對CAWG進行考察。在CAWG中使用的模擬和平支援行動模型(PSOM)限制了研究。由于它是作為對戰略層面的社會經濟問題的回應而開發的,并且面向非常不對稱的行動,因此它涵蓋了國防規劃中合理的軍事行動的有限范圍。
Najgebauer等人提出了定量方法,旨在評價所需的能力,評估現有的能力,并確定能力差距,以反映為一個國家確定的情景。該研究的主要限制是驗證部分和可信的軍事行動的范圍。用于驗證的離散模擬工具只能驗證射擊、機動和移動等能力。雖然這種方法因此在目前的軍事模擬中在作戰層面得到了很好的實施,但其余的效果--特別是戰略層面的剖析--并沒有詳細說明,也無法進行驗證。此外,所提出的解決方案是基于閉環模擬,因此它屬于有自動選手和裁判的CAWG系列。在尋找能力需求方面缺少人的因素[37]。
聯合防御規劃分析和需求工具集(JDARTS)支持北約防御規劃過程。它由相互關聯的應用程序組成,通過北約防務規劃驅動防務規劃人員。兩個基本的應用程序,即國防規劃任務研究工具(D-MIST)和國防規劃能力分配邏輯計算器(D-CALC),構成了北約國防規劃的哲學方法。D-MIST開發并存儲任務類型,然后組成作戰方案。最底層的任務分解是以任務為導向的,它們共同創造了D-CALC的刺激物。D-CALC開發并運行產生能力要求的腳本。這些腳本可以接受任何輸入,復制已實施的北約學說[38]。這個解決方案是有限的,因為在內部它不包含任何模擬,以驗證所提出的能力要求與作戰場景的關系。這可以從外部進行,結果可以轉移到腳本中,然而,在實踐中,如果你的目標是以高水平的模擬保真來涵蓋所有可能的軍事行動方案,這是不可行的。通常只采用簡單的經驗法則或靜態模型,這意味著能力生命周期的動態方面不能以這種方式隱含反映。
如[39]所述,挪威已經接受了JDARTS,并為其國防規劃過程進行了修改。盡管如此,前面提到的缺點仍然存在。
其他國家的努力涉及啟動國防規劃項目,有一個明確的基于能力的規劃架構,由各種決策支持工具支持,如知識管理、能力工程支持、概念開發和實驗以及模擬[12]。這項研究描述了整體框架,但沒有介紹擬議的決策支持工具的復雜實施細節。
Bychenkov at al.提議實施一個量化的專家系統,同時將能力分成功能組[40]。該研究描述了基于一個被稱為 "參與 "的單一功能組的專家系統的設計。這個功能組在轉移到能力載體層面時,相對容易通過眾所周知的單位位置、彈藥或軍事行動效力的定量參數來描述。然而,其余的功能組,將其能力轉化為能力載體,以及量化參數都沒有描述。
通過這次審查,我們得出的結論是 (1) 定量技術盡管適用,但給作戰環境帶來了高度的簡化;(2) MWGs應得到其要素自動化的支持,以達到分析的嚴格性;(3) 目前采用定量技術的CAWGs不能在不損失可信度的情況下處理解決問題的高度客觀復雜性。
本文的主要貢獻是驗證了使用定性專家系統來支持CBP的CAWG中的裁決的概念,作為防御規劃的一個選定方法。這里的創新在于,在設計構成專家系統核心的能力發展理論模型時,應用了系統動力學建模和仿真范式。系統動力學方法有利于在管理復雜系統行為時的政策確定過程[41]。這種新方法能夠對不同的擬議能力要求集進行定性比較。
本文的組織結構如下。第2節闡述了問題陳述和研究限制。第3節描述了旨在證明CAWGs支持CBP概念的發現實驗的方法。第4節列出了研究結果和討論,然后是第5節的結論。
保持技術優勢是美軍作戰方式的一個關鍵組成部分。向大國競爭(GPC)的轉變重新強調了保持技術領先。然而,絕大多數所謂的幫助美國保持領先優勢的技術戰略都將這一概念作為一份文件,簡單地回答 "軍隊應該開發或采用什么技術 "的問題。這種狹隘的技術戰略觀幾乎沒有將手段(技術獲取決策)與戰略目的聯系起來,而且往往將技術的發展本身視為目的--這種錯誤的概念可能導致不適應或停滯的戰略和資源的浪費。本論文試圖通過定義一個技術戰略的概念和框架來幫助提高技術決策的效率和重點,將技術的強調和獲取作為手段,將戰略效果作為目的。
這種方法對技術戰略是描述性的,而不是規定性的。其產出可作為認識、分析和構建技術戰略的基礎。
第一個關鍵發現是,當軍事技術決策導致從戰爭方式范式到作戰概念,然后到所需能力組合,最后到技術獲取(技術戰略)、組織結構和理論創新("DOT三要素")的選擇時,它們就是戰略性的。至少,技術戰略的內容通過確定作戰概念中所需要的技術能力、獲取方法和主要的技術重點來指導關于獲取、開發和/或改進武器、運載和信息技術的決策。
第二個關鍵發現是形成兵力開發戰略的分類法。了解每個層次是技術戰略制定和分析的關鍵。該分類法在圖1中顯示,并在后面進一步解釋。
圖1. 擬議的技術戰略分類法
實現層對技術和DOT三要素的追求按其設計的時間范圍進行分類,以滿足其戰略最終狀態。將技術戰略(和其他DOT組件)的實現時間與作戰概念的預期實現時間同步是這一層次的主要目的。
交戰概念層顯示了范式和概念之間的聯系,并按照大戰略中的戰略目的來組織技術追求(即技術如何在戰略環境中創造效果)。作戰概念是軍方對在特定情況下如何進行戰爭的設想,以及軍方將如何進行戰爭(例如,馬賽克戰爭或空地戰)。
能力組合是所有DOT三要素及其DOTMLPF-P對應物的組合,以實現作戰概念中的能力(例如,自主飛機或蜂群無人機以支持馬賽克戰爭概念中的JADC2能力)。以這種方式看待技術及其伴隨的DOT戰略的主要好處是,它使DOT決策與特定的概念相聯系,從而與它的預期戰略效果相聯系。
戰略形式層面(圖2)描述了戰略家滿足能力的技術要求方式。技術戰略形式作為一種模式或模板,描述了戰略家用來實現所需能力的方法。這些是技術戰略的模板,與人們可能認為的戰略類型(如費邊延遲戰略)的方式有相似之處。下面顯示的三種原型,對技術戰略的形式進行了分類。風險與效率,平價驅動,以及基于進攻和防守的形式。
圖2. 觀察到的和推導出的技術戰略形式
購置方式層面確定了該戰略將指導用于滿足能力組合要求的技術購置方式。這些選擇對戰略形式有很大影響。有四種類型的方法被確認。模仿性獲取方式側重于復制其他國家已經在使用的技術。發展性獲取方法側重于新技術的發明,對新興技術的利用,和/或對已有的(但不強調的)技術進行重新構想。創新性方法涉及到購買技術,并將其與軍隊自己的或其他購買的技術相結合,以創造新的東西。監測方式假定軍隊至少有一些手段和理由來追求技術變革,但選擇繼續沿著目前的路線進行典型升級。戰略形式和方法層面是技術戰略家的主要關注領域。
最后的關鍵發現是,對技術戰略的明確描述和結構化突出了一系列的陷阱:比較陷阱(鏡像);冰山(暗示高度的隱蔽能力);交叉點(挪用技術發展);機會成本(每一個是也是對其他東西的否定);戰爭和技術關系(技術發展可以改變戰爭和沖突的特征);重點發展(試圖為所有任務建立一種技術),以及果斷的投資者行為(戰略上錯位的技術追求)。這一小部分的經驗教訓可能只是從不斷研究和完善技術戰略概念中獲得的豐富知識的開始。在一個競爭激烈的時代,我們必須在技術追求上集中精力,深思熟慮,并具有戰略性。本研究提供的意見和建議可能有助于這種努力。
由于傳感器數量和人工智能(AI)應用快速增多,未來的作戰環境將以豐富的信息和機器速度的決策為特征。因此,美國陸軍指揮官和他們參謀人員將需要有能力篩選大量的信息,更快地做出決策。商業人工智能系統有可能提供這種能力,但美國陸軍不能指望"開箱即用"的商業人工智能系統具有通用能力,因為這種系統需要針對美國陸軍的情況進行充分的訓練。此外,還需要進行研究,以了解軍隊中的人工智能目前可以做到什么和不可以做到什么。總的來說,人工智能往往擅長于主要通過模式識別來解決的任務,以及可以從任務數據中進行預測的任務,如圖像識別、醫療診斷和文本轉錄。然而,目前還不知道人工智能是否可以用于提高美國陸軍信息收集效率。因此,在目前的研究中,探討了以下問題:人工智能能否用于提高美國陸軍任務指揮過程中的信息收集效率?
為了回答研究問題,本文使用了一個商業人工智能應用系統,它反映了軍隊任務指揮部人工智能應用原型的首次開發工作。在這項研究工作中,比較了這個為軍隊量身定做的人工智能系統和其他兩種信息收集方法的參與者在信息收集任務中的表現:傳統的信息收集方法(在計算機文件夾中搜索PDF文件)和非軍隊量身定做的人工智能系統版本。軍隊定制的系統使用軍隊相關的知識來幫助搜索(例如,它知道 "MDMP "等同于 "軍事決策過程"),而非軍隊定制的系統則沒有。我們在以下方面比較了這三種搜索方法:1)參與者找到準確的搜索結果所需的時間,2)參與者搜索結果的準確性,3)參與者對其搜索結果的信任程度,4)參與者對使用該系統工作負荷的看法,5)參與者對該系統可用性的看法。
參與者在使用人工智能系統時比使用傳統搜索方法時既不快也不準確。當使用人工智能系統而不是傳統方法時,參與者對他們的搜索結果也沒有更多信任。然而,在使用軍隊定制的人工智能系統而不是非軍隊定制的系統時,參與者的搜索速度更快,但準確性也更低。最后,在不同的搜索方法之間,參與者對工作負荷和可用性的感知沒有明顯的差異。
這項研究是確定人工智能系統對信息收集效率影響的第一步。總的來說,我們的研究結果表明,人工智能系統可能不會大幅提高美國陸軍任務指揮過程中的信息收集效率,至少不會立即提高。雖然這項研究的重點是在受控實驗室中的無關要害任務(即尋找戰術情況下的理論解決方案),但未來計劃的使用將不會那么無害,這表明需要未來研究來測試假設。對人工智能的投資應該伴隨著對培訓和研究的投資,以獲得人工智能的全部優勢并減少風險。假設人工智能系統是銀彈是不審慎的,事實上,這項研究表明人工智能系統需要被充分審查。
戰爭正變得越來越復雜。陸軍指揮官需要考慮在地面、空中和海上的戰斗,以及在信息和網絡環境中的戰斗(美陸軍部,2017)。隨著社交媒體的出現和計算機的日益強大,在這些環境中的行動可能會導致地緣政治損失,而在過去,只有通過更傳統的行動,如地面攻擊、空中打擊和海上轟炸才能實現。此外,美陸軍指揮官不僅應該期待來自其他民族國家部隊的復雜和有影響的打擊,而且還應該期待看起來不復雜的對手,因為網上零售商使人們很容易購買到過去難以獲得的產品(包括合法的和非法的),如無人機、夜視鏡和槍支。在這一切之上,陸軍指揮官需要在一個前所未有的水平上做出準確和及時的決策,因為人工智能(AI)正在許多軍事職能和領域中實施,如網絡戰、航空和信息收集。這些因素加在一起,為陸軍指揮官創造了復雜的作戰環境。
為了在復雜的環境中有效運作,陸軍指揮官及其參謀人員需要有能力從不同的來源收集大量的數據,并迅速處理收集到的信息,以便及時對信息采取行動。例如,如果對手正在準備一次大規模的作戰行動,信息環境、網絡環境和物理環境中新的但微妙的多變量模式可能會出賣對手的意圖。然而,為了及時發現這些模式,陸軍指揮官和他們的參謀人員將需要有能力快速匯總和分析從各個環境傳來的數據。此外,為了根據這些數據迅速采取行動,陸軍指揮官及其參謀人員需要有能力迅速找到相關的陸軍和聯合理論,以實施戰術和戰略,并吸取經驗教訓,以利用曾面臨類似情況的指揮官經驗。對于這兩項任務--檢測模式和根據模式采取行動--人工智能可能被證明是一個非常有用的工具。
正如其名稱所暗示的那樣,人工智能是由機器而非人類或動物等非人工實體所展示的智能。在這種情況下,智能包括通常與人類相關的認知功能,如推理、計劃、學習和感知。因此,人工智能的主要目的是取代或增強人類的某些任務,如駕駛、飛行和圖像識別(例如,自動檢測和識別人群中的面孔)。例如,谷歌和優步等公司目前正在自動駕駛汽車中使用人工智能,人工智能充當了車輛的駕駛員,因此是使自動駕駛汽車自動化的實體。此外,美國陸軍目前正在探索將人工智能用于自動車輛識別。
人工智能主要通過兩種方式實現 "智能化"。一種方式是通過編程使人工智能的軟件接受某些輸入并根據輸入做出某些輸出。例如,視頻游戲中的人工智能競爭者可能被編程為在玩家向右移動(輸入)時向左移動(輸出),或者在玩家攻擊時進行阻擋。這種方法使用簡單的算法--人工智能要遵循的規則--除了最基本的任務外,其他都是低效的,因為人工智能的軟件程序員必須思考并手動編程每個規則。這樣做很快就會變得不方便,因為許多任務需要許多規則和嵌套的規則--其他規則中的規則(例如,如果接近一個讓行標志,如果有另一輛車出現,則要讓行,但只有當另一輛車在附近時)。此外,思考一項任務的每一個可能的規則很快就會變得困難,即使是人類認為很容易的任務(如駕駛)。
使人工智能智能化的更好方法是使用機器學習,這是一個從數據中創建統計模型的過程,以提高預測和決策的準確性。機器學習不是明確地告訴人工智能系統如何應對其環境中的某些事件,而是允許人工智能系統從其環境中的行動中學習。更簡單地說,機器學習允許人工智能系統從經驗中學習。例如,谷歌通過向人工智能系統提供組成游戲顯示屏的像素,并允許人工智能系統通過游戲控制器對這些像素進行操作,從而訓練人工智能系統成功地玩視頻游戲Atari Breakout(Leo Benedictus,2016)。人工智能系統的程序很簡單,就是通過游戲控制器的動作來最大化其游戲分數,并使用游戲分數來確定一個動作是否有益。起初,人工智能系統在游戲中做出看似隨機的行動,但一段時間后,它開始獲得得分點,并最終學會了一種人類玩家從未使用過的有用技巧。
機器學習讓人工智能在日常生活中變得非常普遍,以至于人工智能被一些人認為是 "新電"(Lynch, 2017)。人工智能傾向于擅長那些主要通過模式識別就能解決的任務。因此,人工智能擅長于圖像識別、醫療診斷和轉錄等任務。像駕駛這樣的任務給人工智能帶來了更大的難度,因為目前自動駕駛汽車上的傳感器無法檢測到標記模糊的道路上的模式(例如,被雪覆蓋的道路)。人工智能對于從數據中進行預測是異常有用的。例如,醫生可以使用人工智能來幫助醫療診斷,因為人工智能能夠處理病人的所有數據,將這些數據與已知的醫療條件進行比較,并從比較中產生醫療診斷。人工智能在視覺搜索方面也很有用。一家公司使用人工智能系統搜索航拍圖像,以尋找住宅區內水浪費的證據(Griggs, 2016)。該人工智能系統能夠通過使用游泳池的存在、灌木的數量和大小以及房屋周圍草地的綠色程度等因素,準確判斷一個家庭是否在浪費水。該人工智能系統能夠以每秒208張航空圖像的速度完成這項任務。
信息收集是人工智能具有潛力的另一項任務。信息收集是指從一個來源,如文件庫或互聯網上提取所需信息的過程。通過使用自然語言處理--人工智能的一個分支,用于處理自然語言數據--人工智能可以從非結構化數據中提取信息,而非結構化數據占世界數據的80%(High, 2012)。與結構化數據不同,結構化數據是以預先定義的方式組織的,包括電子表格和日志,非結構化數據不是以預先定義的方式組織的。非結構化數據包括文本文件、照片、視頻和音頻記錄。人工智能可以用來從非結構化數據中提取相關信息和意義,并以各種方式利用這些信息和意義。例如,美國陸軍和美國空軍正在探索使用人工智能,從車輛維護和車載系統日志中預測車輛故障(Osborn,2017;Vincent,2018)。此外,未來的人工智能任務指揮系統可能會不斷挖掘從眾多來源流入的數據,包括社交媒體、新聞頻道和衛星數據,并使用這些數據來預測戰略競爭對手的行動。這種方法將通過利用過去的非結構化數據(維護日志、社交媒體帖子等),并確定這些數據的哪些特征可以預測車輛故障和競爭者的行動。例如,人工智能系統可能會發現車輛運行溫度和車輛故障之間的關系,并利用這種關系來預測未來的故障。像這樣的關系將形成一個數學模型,當新的數據出現時,人工智能系統將持續更新。
通過使用自然語言處理,人工智能也可能有助于從陸軍條令和經驗教訓中提取所需信息。陸軍有許多條令出版物,指揮官和他們的工作人員經常需要在一個以上的出版物中尋找信息。例如,如果計劃進行一次接觸行動,指揮官可能不僅需要參考作戰條令,還需要參考與指揮官所在梯隊相關的條令;如果指揮官的部隊要通過一個人口中心,還需要參考民政條令;如果指揮官要使用網絡能力,還需要參考網絡戰條令。此外,指揮官可能還需要快速找到相關條令,特別是在面臨對手的意外行動時。在計劃一項行動時,指揮官也可能會查閱陸軍的經驗教訓集,以利用過去進行過類似行動的指揮官的經驗。
也許有可能使用人工智能來幫助指揮官及其參謀人員在條令和經驗教訓中找到所需的信息。要做到這一點,必須采取一些步驟。首先,必須為人工智能系統建立一個語料庫,將條令和經驗教訓的出版物加載到人工智能系統中。從這個語料庫中,人工智能系統可以學習相關的語言,包括術語,并使用自然語言處理建立一個詞庫。然后,人工智能系統可以通過建立索引和元數據對數據進行預處理,使其更有效地處理數據。最后,人類主題專家必須訓練人工智能系統,以使人工智能系統提供更精確的答案和識別模式。訓練可以通過向人工智能系統上傳問題和答案對形式的訓練數據來完成。這種訓練數據不會為人工智能系統提供每個可能問題的答案,但這些數據將幫助人工智能系統學習相關領域的語言模式。一旦人工智能系統被部署,該系統可以通過與用戶的持續互動進一步學習。
通過使用上述方法創建人工智能系統,指揮官及其參謀人員可能會比沒有人工智能系統可供使用時更快、更準確地從條令和經驗教訓中收集所需信息。如果沒有人工智能系統,指揮官將不得不通過手動搜索每個可能與所需信息有關的條令或經驗教訓出版物來尋找所需信息。這種手工搜索是一個耗時的過程,可能不會產生最佳的信息產品,特別是當進行搜索的人有時間壓力的時候。事實上,人類經常會搜索信息,直到達到一個可接受的閾值(例如,做出決定所需的最小信息量),以避免花費太多的認知資源和精力去尋找一個完美的結果(Simon, 1955; 1956; 1957)。然而,通過使用這種方法,人類可能會產生不那么充分的結果。此外,Simon還觀察到,這種方法不太可能產生一個最佳的結果,因為人類通常不會搜索足夠長的時間來找到這樣一個結果。然而,試圖找到最佳結果可能并不理想,因為這樣做需要時間,而當找到最佳結果時,結果可能已經不再有用。因此,如果指揮官試圖找到一個最佳的結果,指揮官可能無法進入對手的決策周期;指揮官需要平衡尋找結果的時間和結果的質量。另一方面,人工智能信息收集系統可能更有可能找到最佳結果,而且人工智能系統可能更有可能在比人類花費更少的時間內找到最佳結果。
盡管在人類信息處理能力有限的情況下,人工智能系統在尋找條令和經驗教訓中的所需信息方面可能比人類更有效率(Baddeley,1992),但這一結果是以人工智能系統經過充分訓練以識別條令和經驗教訓出版物中的語言模式為前提。如果人工智能系統沒有經過充分的訓練,那么人工智能系統的使用者可能會發現次優的結果,并因此對人工智能系統感到失望,最終使人工智能系統被廢棄。此外,人工智能系統只有在人工智能系統的人類用戶適當地校準他們對系統的信任時才會有用(Hancock等人,2011;de Visser, Pak, & Shaw, 2018)。許多人工智能系統由于各種原因,包括環境背景、用戶錯誤和不同背景下的訓練不一致,導致其性能不一致(Rovira, McGarry, Parasuraman, 2007)。例如,一個人工智能系統產生與火力作戰功能相關的準確結果,與機動作戰功能相比,可能產生不太準確的結果。如果人工智能系統的人類用戶完全信任該系統的結果,可能會出現性能下降(Hancock等人,2011)。訓練人類用戶了解人工智能系統何時可能準確,何時不可能準確是至關重要的(de Visser, Pak, & Shaw, 2018)。相反,如果人工智能系統的人類用戶對人工智能系統缺乏信任,那么該系統很可能會被廢棄。因此,人工智能系統不會提高指揮官尋找信息的效率,即使該系統本身在這方面表現出色(Hancock等人,2011)。
盡管人工智能往往擅長于主要用模式識別來解決的任務,以及可以從任務數據中進行預測的任務,如圖像識別、醫療診斷和轉錄,但目前還不知道人工智能是否可以用于提高美國陸軍背景下的信息收集效率,特別是在陸軍指揮官及其參謀人員需要在陸軍條令中尋找信息的背景下。因此,在目前的研究中,我們探討了以下問題:人工智能能否用于提高美國陸軍任務指揮過程中的信息收集效率?為了回答這個問題,我們使用了一個商業人工智能應用系統,這反映了陸軍任務指揮部人工智能應用原型的首次開發工作。在這項研究工作中,我們比較了這個為陸軍量身定做的人工智能系統和其他兩種信息收集方法的參與者在信息收集任務上的表現:一種傳統的信息收集方法(在計算機文件夾中搜索PDF文件),以及一種非陸軍量身定做的人工智能系統。
記錄一個系統或集成系統內所有信息變化的出處,這提供了關于正在做出的決定和促使這些決定的重要信息。從取證的角度來看,這可以用來重新創建決策環境。然而,出處也可以為其他兩個重要功能服務。收集的數據可以支持組件的整合,而生成的圖形數據結構可以通過解釋、總結和告警來支持操作員進行態勢感知。混合戰爭將必然匯集不同決策支持能力,因為決策者必須在多個戰爭領域運作。自主代理將可能在計劃和執行過程中發揮作用,有時能夠在沒有人類干預的情況下做出決定,但人類決策者必須意識到這一點。事實證明,證據圖可以轉化為修辭結構圖(RSG),使代理能夠用自然語言甚至多模態交流,向人類解釋他們的行動。證據還被證明可以加強對計劃執行監控,并可用于向人類或自主代理提供通知,當計劃中使用的信息發生變化時,可能需要重新考慮計劃。隨著我們朝著智能機器在復雜環境中支持人類決策者團隊的方向發展,跟蹤決策及其輸入的需要變得至關重要。
出處是關于實體、活動、代理以及這些概念之間關系的信息[1]。這些信息不僅僅解釋了發生了什么,它還回答了關于實體如何被操縱、何時發生以及誰參與了這個過程的問題。我們很可能熟悉關于追蹤藝術作品出處的新聞和虛構的故事。任何實體的創造、破壞或修改的出處都可以被追蹤。在本文中,我們將重點討論軍事系統內的信息。在指揮與控制(C2)內,信息出處對于記錄行動背后的決策過程是必要的,特別是當自主和人工智能(AI)代理深入參與時。參與某一過程的 "誰 "可能是人類或人工智能代理。
信息出處有幾個目的。在取證方面,出處追蹤提供了參與決策的人和代理,以及數據是如何演化為該決策的。美國公共政策委員會指出,數據出處是算法透明度和問責制的一個明確原則[2]。完整記錄的出處可以闡明數據的依賴性、責任流,并幫助解釋為什么采取某些行動。隨著人工智能和自主代理繼續自動化進程,它們在做出關鍵決策時已變得更加不可或缺[3]。