北約人為因素與醫學(HFM)研究任務組(RTG)HFM-297 的成立是為了支持 "評估用于提高人體性能的增強技術"。RTG 成員在 2017 年至 2022 年期間舉行了會議。在此期間,小組定期舉行會議(面對面和虛擬會議),以確定其將考慮的增強技術的范圍。這包括制定一個框架,以指導根據一套與人類性能和任務成果相一致的定義指標對增強工具和方法進行受控評估。目標之一是分析增強技術所支持的人類性能的相對優點,并確定跨領域主題,用于建立建議的最佳做法。這包括為繼續應用和研究增強技術以支持人類在軍事環境中的表現提出建議。在開展這些活動的同時,還經常與軍事領域專家和需求持有者以及研究和行業主題專家進行接觸。
為了管理分析中考慮的增強技術范圍,RTG 決定主要關注 "增強 "任務環境和任務過程的技術(如合成環境、界面技術),而不是直接針對操作者的技術(如外骨骼、神經植入)。盡管有這樣的區別,但要嚴格區分 "環境 "和 "操作員 "之間的增強仍具有挑戰性。盡管如此,在確定了范圍之后,RTG 297 著手開發一個框架來分析這些技術,并將研究文獻中的證據與操作要求相結合。這項調查所采用的框架包括應用 "優勢-劣勢-機會-威脅"(SWOT)分析方法。本報告通過正式的 SWOT 分析,按照從部隊組建到行動再到行動后總結經驗教訓的行動時間表,對以下五個性能領域進行了細分:
對各性能領域進行 SWOT 分析后,發現所有任務領域和人類性能要求都有一些共同的主題。這些主題包括
人類性能前端考慮因素和人為因素原則是成功應用增強技術的核心;
在有效實施這些技術的過程中,對數據和信息技術基礎設施的固有依賴性,以及在制定數據標準和總體數據戰略方面持續投資和努力的必要性,以確保互操作性和可擴展性;
隨著增強技術越來越多地被軍事組織采用,安全、可靠性、隱私和道德方面的考慮將在增強技術中發揮決定性作用;
這些技術本身和可應用這些技術的任務集都具有非常動態(快速發展)的性質,這對系統評估這些技術的有效性和價值提出了重大挑戰,特別是對 RTG 研究中典型的傳統報告形式而言;
盡管如此,RTG 審查的證據表明,一些增強技術在培訓(如自適應教學系統、視覺合成環境)和作戰(如增強現實)環境中已經有了良好的記錄;以及
一些不斷發展的技術(如機器學習、性能監測、虛擬現實的觸覺界面)在近期和遠期應用中大有可為,可支持軍事人類性能和訓練,但在實際應用之前還需要進一步的研究。
考慮到 RTG 在確定研究范圍、分析框架以及與主題專家合作以確保研究的相關性方面所面臨的挑戰,該小組成員建議北約 STO 考慮采用更具動態性和響應性的流程和格式(例如,利用社區提供的信息進行基于網絡的報告輸出),以便對快速發展的技術領域(如用于人類表現和訓練的增強技術)進行研究。
圖1-2:支持感覺和認知增強的增強模型
美國國家科學、工程和數學研究院為空軍研究實驗室編寫了一份共識報告,其中記錄了各軍種對支持人-人工智能(Al)團隊合作的普遍和日益增長的愿望。Sonalysts 已經開始了一項內部計劃,探索人類-人工智能團隊的培訓。這項工作的第一步是開發一個能夠促進人-人工智能團隊研究的合成任務環境(STE)。決定將 "聯合全域指揮與控制"(Joint Al-Domain Command and Control,JADC2)作為開發 STE 的重點,因為 JADC2 概念中的大量傳感器輸入和決策選項可能需要使用輔助系統才能及時做出決策。有鑒于此,我們聘請了多位具有指揮與控制經驗的主題專家(SMEs),以深入了解如何開發能體現與 JADC2 相關的團隊挑戰的 STE。本報告記錄了我們與這些利益相關方的初步接觸。我們制作了一份包含兩類問題的調查問卷。第一類問題要求受訪者報告他們是否同意我們預計在以 JADC2 為重點的測試平臺中可能非常重要的 STE 功能。第二類問題要求主題專家回答開放式問題,探討任務域、性能評估方法、通信方法和自主隊友的特征等測試平臺特征。研究小組確定了 13 名具有軍事背景和指揮與控制經驗的 Sonalysts 員工(內部稱其為合作伙伴),并邀請他們參與調查。12 名受訪者完成了調查。然后,研究小組對他們的回答進行了分析,以確定出現的主題和需要進一步分析的話題。結果表明,我們的主題專家可以接受使用與軍事環境中類似的任務進行研究,只要這些任務要求團隊處理大量數據以做出復雜決策。主題專家認為,測試平臺應支持代表矩陣式組織的 "體系團隊",并應支持口語、基于文本和面對面通信的強大陣列。
2021 年,美國空軍研究實驗室(AFRL)人類性能單元(Human Performance Wing)要求美國國家科學、工程和醫學院(NASEM)編寫一份共識報告,以審查人工智能(Al)的軍事作用,特別是作為人機團隊的一部分。這項工作的目標是使美國空軍后勤部能夠更好地支持未來系統的設計,在這些系統中,人類與智能體聯手實現任務目標。
NASEM報告在更廣泛的人機協作領域確定了九個重點領域:
1.訓練人機團隊
2 人工智能的透明度和可解釋性
3 人機團隊互動
4 信任人工智能隊友
5 人-AI團隊合作過程與成效
6 人機協作方法與模式
7 人-AI團隊中的態勢感知
8 人類-人工智能團隊中偏見的識別與緩解
9 人機系統集成流程與人機團隊協作和績效的衡量標準
Sonalysts 已開始在內部探索人-AI團隊中的第一個領域--人AI團隊培訓。表 1 轉載了 NASEM 報告的部分內容,其中作者將六項研究需求分為三個階段。
研究計劃的第一步是開發合成任務環境 (STE),為人機團隊提供一個經過驗證的研究環境。為了提出一套能夠最大限度地提高我們的研究適用性的要求,Sonalysts 正在與該領域的主要搜索人員和分部門專家(SMEs)進行接觸。本報告總結了與軍方 SME 進行的首次外聯工作的結果。
雖然各軍種多層次都對人機協同感興趣,但新出現的聯合全域指揮與控制(ADC2)概念提供了一個聚焦視角。JADC2 概念設想將所有軍種和所有領域(如空中、海上、陸地、太空、網絡空間)的傳感器連接成一個龐大的網絡,以便快速使用這些軍種和領域的資產來實現任務效果。為了加快行動速度,同時考慮更多的數據和潛在行動方案(COA),人類決策者很可能要比過去更廣泛地與 AI 隊友合作。此外,我們認為這將是真正的 "團隊合作"。我們的研究將假定,智能體最終將能夠作為同伴/隊友而不僅僅是工具與人類合作。為了實現這一目標,我們設想人類-AI團隊將包括使用AI或類似技術在指定領域內做出決策和/或采取行動的自主系統,這些系統將能夠應對新的性能挑戰,同時與隊友協調和合作。當達到這些里程碑時,我們就可以開始將該系統視為自主隊友,它不僅能夠獨立行動,還能相互依賴。
本報告探討了 GHOSTS 框架的非玩家角色(NPC)客戶端生成的活動(包括軟件使用)與 GHOSTS 的默認行為和大型語言模型(LLM)生成的活動之間的比較。還探討了基本結果在復雜性和情感方面的比較。在研究中,利用了生成式人工智能(AI)系統的高級自然語言處理能力,特別是 LLMs(即 OpenAI 的 GPT-3.5 Turbo 和 GPT-4)來指導 GHOSTS 框架中的虛擬智能體(即 NPC),GHOSTS 框架是一種在計算機上模擬現實人類活動的工具。設計了一種配置,通過使用 LLM 使活動完全自動化,其中文本輸出成為可執行的智能體指令。初步研究結果表明,LLM 可以生成指令,從而在模擬環境中產生連貫、逼真的智能體行為。然而,某些任務的復雜性和指令到行動的轉換帶來了獨特的挑戰。這項研究對于提高模擬的逼真度和推動類人活動建模中的人工智能應用具有潛在的意義。建議開展進一步研究,以優化智能體對 LLM 指令的理解和響應。
網絡靶場是一個模擬環境,里面有各種登錄到計算機和網絡上的 NPC。這些 NPC 在組織內執行其角色所應執行的任務。現有的 GHOSTS 框架采用客戶機-服務器安裝方式,客戶機安裝在不同的操作系統(OS)上,執行所模擬角色的預期活動。服務器組件收集已執行活動的日志,并能根據一系列可用數據為每個智能體的新活動提供指導。
每個智能體在執行活動時都有各種考慮因素,包括智能體的特定參數、智能體過去的活動以及環境因素。固定參數包括姓名、身體特征、教育程度、工作經歷等。智能體還可能具有可變的特征,如偏好、信念、動機以及隨時間演變的過去活動歷史。
標準的 GHOSTS 配置提供了一套合理的默認值,可以充分隨機化這些考慮因素,以達到 T&E 的目的。團隊成員和其他人(如研究人員、培訓/練習用戶)都使用過這些隨機化策略;我們認為這種方法已經成熟,足以應對大多數情況。例如,模擬運營部門角色的智能體可能會在工作日每 20 分鐘創建一份文檔,同時交替使用互聯網瀏覽時間,以模擬文檔創建與必要的相關研究相結合的情況。
將 OpenAI 開發的不同 LLM 集成到 GHOSTS Animator [SEI 2023b]中,以便其他研究人員和網絡練習社區能夠繼續嘗試我們在本報告中討論的功能。每個 LLM 都充當了智能體的決策功能,生成文本輸出,我們將其轉化為智能體活動的指令。
為了實現這一整合,開發了一個系統,用于解釋 LLM 的輸出,并將其映射到 GHOSTS 框架中智能體可以執行的潛在行動上。該系統考慮到了語言解釋的可變性和智能體可用行動的限制。在將范圍廣泛的可能 LLM 輸出映射到更具體的智能體行動集時,我們面臨著獨特的挑戰。(我們將在下面的章節中描述這些挑戰。)這種集成方法能夠為我們的研究目的提供最廣泛的 LLM 響應,而不管它們與 GHOSTS 的執行是否相關。
為了在 GHOSTS NPC 中模擬更復雜的行為,將人類推理和行為的幾個方面整合到了智能體的決策過程中。這些方面都是在每次系統迭代或周期中執行的詢問過程中考慮的。在這種情況下,詢問是 LLM 分析智能體屬性和過去活動以決定下一步行動的機會。
每個 tick 或周期的持續時間是可配置的,可以是每個 CPU 周期所需的時間,也可以是更長的持續時間,如五分鐘。在每個 tick 期間,服務器會隨機選擇幾個智能體,并詢問它們以確定潛在的行動。這些行動可以包括學習新信息、與其他智能體建立聯系或執行一項活動。
這些詢問使用我們現有的隨機化策略。其中一些策略涉及純粹的隨機決策,而另一些則依賴于基于真實世界數據的預定義范圍或概率內的隨機化。目前實施的策略圍繞四個關鍵概念:
動機: 為了更準確地模擬智能體參與特定內容或執行特定操作的原因,我們需要了解他們的動機。在現實世界中,個人目的、目標和興趣往往是個人活動的驅動力。通過將動機納入模擬,我們可以模擬真實用戶的各種目標驅動行為。為此,我們采用了史蒂文-雷斯博士(Steven Reiss)設計的心理評估工具--雷斯動機檔案(Reiss Motivational Profile,RMP)[Reiss 2012]。RMP 根據人類的 16 種基本欲望來確定個人的核心價值觀和動機:權力、獨立、好奇、接受、秩序、節約、榮譽、理想主義、社會接觸、家庭、地位、復仇、浪漫、飲食、體育鍛煉和寧靜。通過模擬智能體對這些 RMP 欲望的獨特組合,我們模擬出了在整個演習過程中促使他們做出某些決定的內在動機。因此,這種理解揭示了智能體的行為傾向,有助于以更接近人類的方式指導其模擬行動。
關系: 人際關系對人類行為的影響是毋庸置疑的,它塑造了我們在社交圈中的學習、決策和互動方式。為了在模擬中更好地模擬這些關系的動態變化,我們在智能體的框架中加入了關系紐帶。這種方法包括在智能體之間建立聯系,考察它們之間關系的深度,以及研究它們對彼此的影響。這種方法使我們能夠模擬大量的社會互動,例如智能體向其信任的同伴尋求建議、與同事分享內容或參與各種話題的討論。這一特點不僅增強了智能體互動的真實性,還促進了智能體之間的知識獲取過程,這與人類在家庭、工作或公共場所從社交互動中學習的方式如出一轍。因此,在我們的模擬框架中引入關系可以增強智能體行為的真實性,更好地反映現實世界中人類互動的復雜性和細微差別。
知識: 人類用戶的一個顯著特點是他們在不同領域的知識廣度和深度。根據這一特點,我們為每個智能體配備了一個獨特的知識庫,以幫助塑造他們的模擬交互。這些知識庫為智能體如何尋求信息、分享專業知識或參與討論提供了信息,而所有這些都會受到他們對特定主題的理解的影響。智能體之間的動態知識獲取過程在我們的模擬中也發揮著至關重要的作用。知識獲取不僅增強了智能體互動的真實性,還通過潛在的內部威脅識別為模擬提供了額外的深度。例如,智能體知識庫中的異常變化可能表明其未經授權獲取了敏感信息,或者其關注點轉向了可能出于惡意目的而感興趣的主題。因此,將知識及其動態獲取納入智能體框架不僅能豐富模擬互動,還能增強內部威脅檢測和預防模擬的潛力。
信念: 個人持有的不同信念體系是其網絡行為的基礎,包括個人價值觀、觀點以及對爭議問題的立場。這些信念左右著互動和對話,往往會影響討論的動態。為了在智能體中模擬這種信念系統,我們將貝葉斯模型集成到智能體的推理過程中,使其能夠受到觀察到的支持某種信念的證據的影響。這種整合使智能體能夠就各種問題表達自己的立場,為自己的觀點辯護,甚至參與辯論,從而模擬現實世界中的人類行為。在社交媒體的背景下,對智能體的信念進行建模有助于表現分歧話題上的兩極分化觀點,使模擬更能代表真實世界的社會動態。
總之,通過將動機、關系、知識和信念整合到智能體推理框架中,我們成功地在 NPC 中創建了更全面、更真實的人類行為模擬。有了上述這么多組合的優勢,團隊就可以配置豐富的決策詢問,以確定任何智能體可能采取的行動方案。下一步是將這些詢問完全外包給 LLM,并比較結果,以便在大多數 T&E 場景中使用。
為了嚴格控制系統對 LLM 的訪問,我們設計了一種方法,即只有 GHOSTS 的服務器組件與人工智能進行交互。然后,服務器將人工智能生成的結果傳播給相關客戶端。這一過程的執行過程如下:
1.智能體(即 NPC)根據其默認配置,利用我們現有的隨機化方法啟動并執行一項任務,如文檔創建和網頁瀏覽。
2.智能體每隔幾分鐘向服務器報告其完成的活動。
3.同時,在這五步過程中,服務器作業每輪都會詢問一個隨機的智能體子集。至關重要的是,在每一輪開始時,步驟 2 中的活動歷史記錄都是可用的,并且可以作為代理下一步應該執行什么活動的決策因素。
4.服務器將新確定的活動傳達給客戶端,然后由客戶端執行。
5.該過程循環往復。如果智能體已經在運行,它只需尋找下一個要執行的活動。
在步驟 3 中,目標是將決定智能體活動的任務委托給 LLM,同時考慮 (A) 有關智能體的具體信息和 (B) 已執行活動的歷史記錄。考慮到 LLM 可能需要處理大量信息所帶來的成本影響,我們將 (A) 中的信息限制為最相關的細節,如個人數據、教育和組織歷史以及軟件賬戶。(B) 中的活動信息及其執行參數則用于提供智能體已完成任務的歷史記錄。
許多 LLM 應用程序編程接口(API)會根據系統或用戶直接輸入信息的不同來區分信息提示。我們使用系統級提示,以便對我們傳輸的信息和預期響應進行更嚴格的控制。這種方法使我們能夠以更精確、更可控的方式引導 LLM 的行為。
該項目是為了支持美國國防部高級研究計劃局(DARPA)的 "開放世界新奇事物的人工智能與學習科學"(SAIL-ON)計劃。在第二階段基期工作中,我們推進了第一階段 TALONS 框架的理論和實施,并收集了智能體在新奇事物生成器生成的新奇事物上的基線性能的初步實證結果。在第二階段的選擇階段,我們將基礎階段的工作擴展到更廣泛的新奇事物生成和實施形式。
這項工作的主要成果包括:完成了新奇事物生成器的開發;對來自 3 個不同 SAIL-ON TA1 團隊的新奇事物進行了性能分析;開發了自動且可最大程度減少人為偏差的新奇事物生成與實施流程;將我們的新奇事物生成流程應用于 Monopoly、Vizdoom 和 Blocksworld 領域,從而證明我們的新奇事物生成器與領域無關;以及為 SAIL-ON 計劃提供支持。下面的項目總結和后續報告將更詳細地介紹這些成就。
目前最先進的人工智能可以在已知已知甚至未知的情況下穩健運行。然而,人工智能仍無法可靠地檢測、描述和適應開放世界中的新奇事物。隨著研究界不斷努力實現先進的自主性,我們需要有科學依據的方法來評估人工智能體在開放世界環境中的表現。
PacMar Technologies(PMT)和 Parallax 高級研究公司開發了一套獨立于領域的理論、原則性技術和軟件工具,用于生成、描述和評估新穎性。這些理論和技術涵蓋了與領域無關的新穎性。在合同基期內,我們開發了一個測試平臺,用于評估智能體在自動駕駛汽車領域對新奇事物的反應性能,我們還在南加州大學 SAIL-ON 團隊提供的大富翁領域中實施了由我們的軟件工具自動生成的新奇事物。
我們的新奇事物生成器方法使用原則性技術自動生成新奇場景。這些場景被加載到模擬環境中,與給定的第三方人工智能體對接,以收集該智能體的性能數據。然后評估智能體在各種不同情況下處理各類新奇事物的能力。
我們將新奇定義為環境中的變化。簡而言之,變化可以是過渡函數的變化,也可以是狀態空間的變化。我們的方法有能力在過渡函數(包括行動和事件)、狀態空間定義和觀察函數中生成新穎性。精確生成新穎性的計算方法可分為兩種類型的轉換,其方式與創造性系統框架(Wiggins,2006 年)一致。我們方法的關鍵在于從八個維度對新穎性進行表征,從而支持將情景生成的重點放在可能挑戰智能體魯棒性的情況上。
我們的方法目標如下
1.為新奇性的特征描述奠定科學基礎。 2.開發生成可用于評估智能體的新情景的技術。 3.確定這些技術的可行性及其在各領域的適用性。
本報告旨在清晰地描述我們的方法,包括新穎性生成、模擬和評估的方法。將我們的方法應用于 CARLA 的自動駕駛汽車領域、Monopoly、VizDoom 和海洋領域,有助于進一步發展理論和測試平臺軟件。最后,我們對本報告進行了總結,并提出了進一步研究的思考和啟示。
在第一階段的工作中,我們開發了一個基于新穎性多維表征的新穎情景生成框架。我們正式規定了這一多維表征、收集受測智能體數據的指標,以及評估智能體對不同類型新穎性的魯棒性的方法。在使用轉換生成新穎性的過程中,我們定義了 24 個函數簽名,并計算了應用這些簽名生成新穎性的上限復雜度。我們的研究表明,根據我們對新穎性的多維表征,使用這兩種類型的變換來改變場景生成,我們能夠顯著減少新穎場景的空間。為了支持新穎性的精確生成,我們構思了 TALONS 模擬器抽象語言(T-SAL)來描述環境和這些環境中的各個場景。我們利用這些概念來支持第三方智能體對新奇事物的魯棒性評估。
在第二階段基期工作中,我們推進了 TALONS 框架的理論和實施,并收集了智能體在新奇事物生成器生成的新奇事物上的基線性能的初步實證結果。我們制作了三個源代碼庫,詳見基礎階段最終報告,其中包含以下內容的實現:(1) TSAL 語言;(2) 新穎性生成器(實現 R 變換);(3) 使用 CARLA 自動駕駛汽車模擬器的評估框架。從理論角度來看,我們利用第一階段工作中開發的新穎性維度理論對新穎性進行了初步分析研究,并正式定義了 R 變換,然后利用這些定義正式定義了新穎性層次結構級別。
我們在第二階段選擇期內做出的獨特貢獻包括以下內容:
這項工作由 Calian 和 C3 人因咨詢公司根據加拿大國防研究與發展-多倫多研究中心(DRDC TRC)任務 20 "未來自主系統集成的人機協作研究路線圖 "進行,是更大的人機交互(HAI)任務授權合同(TAC;合同:W7719- 185397/001/TOR)的一部分。人機交互任務授權合同的總體目標是設計、開發、實施和評估人機協作(HAT)概念、方法和技術,以提高加拿大兵力(CAF)人機系統(HMS)的整體性能。
當前項目的目標是制定一個研究路線圖,以指導未來自主系統(AS)的研發工作及其在加拿大武裝部隊中的集成。具體來說,路線圖將指導未來對部署自主系統的心理、倫理、道德、社會和文化影響的調查。為實現這一目標,加利福尼亞空軍和災難恢復與發展中心的利益相關者參與了一項 HAT 調查。該調查由 13 個涉及 HAT 研究問題的問題組成,使用 Survey Monkey 進行在線管理。調查圍繞四個研究主題展開:了解國防部/加拿大空軍目前正在考慮的人工智能賦能的自動系統類型;根據這些系統的分類法識別風險因素并確定其優先次序;加拿大空軍不同服務部門在使用和應用這些系統方面的異同;以及 DRDC 和加拿大空軍利益相關者之間的一致程度。
這項研究的參與者包括 DRDC 和 CAF 的主題專家 (SME),他們目前都活躍在與自主相關的項目中(例如,AS 項目中的 CONOPS 工作組)。代表作戰和研究界不同組織的 50 多名受訪者完成了 HAT 調查。調查結果顯示:
1.總體而言,CAF 和 DRDC 利益相關者的主要關注點在于擁有非致命能力的半自主(S-A)系統。這些系統廣泛應用于情報、監視和偵察(ISR)以及指揮與控制(C2)行動。對這些系統至關重要的基礎技術包括計算機視覺、機器人技術和高級數據分析;
2.與加拿大皇家海軍(RCN)和加拿大陸軍(CA)相比,加拿大皇家空軍(RCAF)有不同的優先事項,因為其對完全自主(F-A)系統以及具有致命能力的 S-A 和 F-A 系統的需求有所增加;
3.所有利益相關方都表達了對軍事自主系統的一系列風險考慮。這些問題包括系統有效性、人類系統集成(HSI)和人工智能脆弱性等各個方面。值得注意的是,對具有致命能力的系統的關注程度明顯更高,尤其是與道德、倫理和法律因素相關的風險;
4.關于人因專家確定的九個 HAT 研究主題,它們都被評為關鍵主題,亟需研究關注。在這些主題中,信任、權力轉移和系統透明度/可解釋性被列為最重要的研究課題;以及 5.
5.CAF 和 DRDC 的受訪者在自主系統研究(包括其應用和基礎技術)的精力分配方面達成了顯著共識。但是,在致命自主武器系統領域存在明顯差距,研究界似乎落后于作戰界。
2019年,美國空軍(USAF)要求美國國家科學、工程和醫學研究院進行一項研究,以審查與未來戰術邊緣數據驅動行動能源需求有關的挑戰和機會。因此,國家研究院在其空軍研究委員會(AFSB)的主持下,成立了美國空軍未來數據驅動行動的能源挑戰和機遇委員會。該跨學科委員會的成員都是志愿者,他們被任命為代表這一高度專業化課題的相關學術、研究和操作經驗。本報告是該委員會的工作成果。
正如《2020年國防未來工作組報告》所指出的,"人工智能、生物技術、量子計算以及空間、網絡和電子戰等方面的進步正在使傳統戰場和邊界變得越來越不重要"。報告中的一個重要發現是,需要取得重大進展,通過利用信息技術日益增長的力量,如人工智能(AI)和機器人技術,提高國家安全和競爭力。
美國空軍(USAF)內部正在進行重大努力,以做到這一點。正在研究和試驗產品和工藝技術,并將其納入未來作戰概念和計劃。這一工作的一個重要部分集中在整合行動上,從戰略到戰術,跨越所有的工作。在考慮這些未來作戰概念時,必須提出的一個問題是:實現以知識為基礎的未來的設備將如何供電?
更確切地說,離穩定和永久地點最遠的設備將如何管理其能源需求?和平時期作戰環境的豐富能源供應,在沖突期間可能無法在部隊預測的最遠處--戰術邊緣--輕易獲得。了解與戰術邊緣的持續數據收集、處理、存儲、分析和通信相關的能源挑戰是制定滿足未來戰場競爭的計劃的重要部分。
委員會咨詢了學術界、政府和工業界的技術專家,以確定與戰術邊緣的能源需求有關的挑戰和問題,以及未來為幫助解決這些挑戰而考慮的任何潛在解決方案。為了理解、解決和常規化將能源因素納入作戰能力,需要進行近期、中期和長期努力。本文件中的建議涉及理解這些需求和不滿足這些需求的連帶效應,將數據處理的能源需求納入任務和單位準備評估,以及研究產品和工藝技術以解決節能計算、彈性、互操作性和戰術邊緣能源管理的替代解決方案。這些建議總結如下。
這些建議的核心問題是,在戰術邊緣的數據處理和支持作戰行動的功能上需要多少能源。從根本上說,這個問題的答案目前還沒有全面的了解。有理由認為,一個明顯的建議是系統地分析和記錄與支持這些任務的數據處理有關的能源需求。
在全面分析與戰術邊緣數據處理相關的能源需求的同時,重要的是了解能源可用性和質量對這些功能的影響,以及如果能源需求完全或及時得不到滿足,對更大的任務功能和武器系統會產生什么影響。必須了解戰術邊緣的數據能力暫時或持續失去電力對行動的影響,包括從后勤、管理到對目標的有利影響。單位執行任務要求的能力可能會因為無法收集、處理、分析和交流關鍵數據而大打折扣,從而影響到單位和任務的準備。
實地演習和培訓通常假定在任何時候和任何需求下都有電源。這也是對通信系統、網絡和其他支持性基礎設施的一個標準假設。在前線部署的情況下或在有爭議的戰斗空間中,應該預計到電力和其他基礎設施將成為攻擊的目標,因此將不會持續提供或斷斷續續。損失可能來自于現有的不良商業基礎設施或敵人的拒絕;缺乏維護;缺乏燃料;或人為錯誤。為了模擬一個現實的未來環境,美國空軍必須在訓練和演習中包括 "熄燈 "情況。這些針對戰術單位和動態基地的拔掉插頭的演習可以揭示出與對戰術邊緣任務的數據可用性預期相關的依賴性。
建議3:美國空軍應該對所有現實的實地演習進行“拔掉插頭的演習”,對戰術邊緣數據預期的影響應該被記錄下來并轉達給任務計劃制定者。
建議4:關于戰術邊緣數據能力“拔掉插頭的演習”的結果應被用于修訂和更新任務準備度評估。
目前,計算支持的能源需求,無論是內部還是外部,目前在任何主要武器系統或任務簡介中都沒有定義。先進的信息技術(IT)能力,如人工智能,以及大規模分布的小型設備和通信節點的使用,影響了戰術邊緣的能源需求,并對任務和武器系統的作戰準備和性能產生影響。這些能源需求必須被定義為所有任務和系統的要求。
建議5:美國空軍應將與數據預期有關的能源需求,包括支持和任務或系統內部的能源需求,作為所有任務和系統的明確要求。合同的條款和條件應包括要求具體和完整描述能源需求、類型以及與后勤支持的兼容性的語言。
建議6:美國空軍應明確解決戰術邊緣信息環境的能源最小化、功耗監測和能源生成問題,包括所有小型設備和物聯網能力。
支持與分散在戰術、作戰和戰略層面的計算/存儲功能相關的能源需求所需的人力技能是非常重要的,是成功實施數據驅動行動的一個障礙。美國空軍不具備管理、領導、監督或解決與數據驅動行動相關的能源消耗挑戰的有機人力(已經在組織內的人力)。如果沒有了解整個能源需求的有機人力,包括高度專業化的領域,如射頻(RF)工程,美國空軍可能永遠不會實現加強其行動目標的解決方案,而會使自己遭受大量的戰術、行動和戰略風險。這一人力挑戰包括招募、教育、培訓和優化承包商/軍隊的混合,以及對教育的激勵。
建議7:美國空軍應建立一個人力計劃,招募、教育、分配和培訓軍事和文職人員,以應對與數據驅動行動相關的能源挑戰。
建議8:美國空軍應激勵能源工程師,特別是天線和無線電頻率工程師等專家。
雖然在外國部署的美國部隊的技術互操作性是一個眾所周知的問題,但在開發或采購新的電源或分配系統時,這些問題必須是一個具體的考慮。理想情況下,新系統應該自動適應并與外國環境互操作,很少或沒有機械切換或重新配置。
向部署的部隊提供能源的挑戰因物流而變得復雜,物流往往傾向于簡單而不是復雜,大用戶而不是小用戶。在戰術邊緣,小型用戶在全域聯合行動(JADO)概念下的數據收集、分析和通信方面可能有更大的作用,這將使他們成為大型單位作戰準備的依賴。這對需要分析的聯合或多軍種行動有影響,包括所有軍種在戰略制定上的合作。
建議9:美國空軍應該開發一個經濟效益模型,探索不同能源輸送模式的效用、機會成本、風險和效益。
建議10:美國空軍應探索在戰術性野外演習中實施車聯網(V2G)的相關選擇。
建議11:美國空軍應從能源交付的成本效益和與單一能源來源相關的運營成本的角度考慮能源類型和交付方式的后勤尾巴(例如,使用無人機向小用戶交付電池,而不是傳統的燃料車隊)。
建議12:美國空軍在設計電力系統(超過變壓器)時,應考慮與外國電力系統和伙伴軍事部隊(如北大西洋公約組織)的互操作性,包括某些元素的標準化和 "即插即用 "能力。
隨著數據驅動的行動對作戰概念變得更加關鍵,能源影響應明確成為規劃過程的一部分,包括研究如何減少能源使用、能源來源暴露于敵對活動,以及提高能源復原力。
減少能源消耗的算法和應用空間已被證明是非常有前途的。已經進行了研究,在操作系統層面和應用層面創建能源消耗意識的算法,看來這一工作路線對于減少在戰術邊緣運行的計算系統的能源需求有很大潛力。雖然眾所周知,聰明的算法設計可以產生能源節約,但仍有更多的研究需要進行,以產生實用的和部署的能源意識算法。需要的研究包括將理論算法轉換為實際可部署的軟件。此外,還需要進一步研究近似技術的作用,以減少能源使用,同時不影響準確性。人們還知道,系統如何架構,包括天線類型和傳輸策略等細節,會對能源使用產生全面影響,這意味著對能源的系統性使用的研究將是有益的。這些研究工作可以支持減少信號發射和熱信號的操作安全目標。
建議13:美國空軍應投資于未來與減少能源使用相關的產品和工藝技術的研究,最大限度地減少能源物流風險,并提高與戰術邊緣數據操作相關的能源復原力。
建議14:美國空軍應投資研究在實際可部署的軟件中使用能源意識算法。
建議15:美國空軍應投資開發軟件算法中的近似技術,在不影響精度的情況下有效降低能耗,達到不可接受的水平。
建議16:美國空軍應在現實場景中開展實驗活動,包括各種系統和戰術邊緣單位的部署特點,以指導研究方向和實施潛力。
這些建議為美國空軍提供了一種將能源需求納入未來戰場規劃的方法。如果不對能源需求進行明確的規劃并將其納入作戰準備評估,就有可能發生關鍵的故障,從而對整個相連的戰場產生連帶影響。通過建議來執行所描述的議程將是具有挑戰性的,但其結果將大大改善成功部署下一代技術到戰術邊緣的可能性。
美國防部增材制造戰略(2021年)和陸軍指令2019-29(2019年)(通過先進制造業實現戰備和現代化)表明,軍方正在努力將增材制造融入軍事系統。這項定性研究的目的是探索增材制造技術的進展,以評估增材制造部件在陸軍旋翼飛機上關鍵安全應用的可行性。本研究概述了陸軍飛機關鍵安全項目的鑒定過程,回顧了美國防部和陸軍的增材制造政策,詳細解釋了粉床聚變和定向能處置增材制造工藝,并回顧了一個案例研究。增材制造技術需要嚴格的材料和工藝控制,以及重要的鑒定檢查和測試,以支持陸軍航空的關鍵安全應用。然而,增材制造技術已經成熟,現在該技術已經準備好為關鍵應用生產高質量的復雜旋轉翼零件。
本研究的概念框架定義了研究過程的目標。首先,本研究將提供一個陸軍航空CSI資格認證過程的概述。本研究將簡要討論與AM和航空有關的陸軍和國防部政策,以便為AM在陸軍航空中的相關性提供背景。然后,本研究將提供適用于陸軍旋翼飛機關鍵應用的金屬部件制造的AM工藝研究。最后,本研究將以一個案例來結束,該案例提供了一個陸軍旋轉翼飛機上使用AM部件的鑒定過程的例子。圖1顯示了生產增材制造關鍵安全項目的研究的概念框架圖。
2022年7月,喬治敦大學安全與新興技術中心(CSET)和斯坦福大學網絡政策中心的地緣政治、技術和治理項目召開了一次專家研討會,研究人工智能系統的漏洞與更傳統類型的軟件漏洞之間的關系。討論的主題包括:人工智能漏洞在多大程度上可以根據標準網絡安全程序進行處理,目前阻礙準確分享人工智能漏洞信息的障礙,與人工智能系統的對抗性攻擊有關的法律問題,以及政府支持可以改善人工智能漏洞管理和緩解的潛在領域。
參加研討會的人員包括擔任網絡安全和人工智能紅隊角色的行業代表;具有進行對抗性機器學習研究經驗的學者;網絡安全監管、人工智能責任和計算機相關刑法方面的法律專家;以及負有重要人工智能監督職責的政府代表。
本報告旨在完成兩件事。首先,它提供了一個關于人工智能漏洞的高層次討論,包括它們與其他類型的漏洞不相似的方式,以及關于人工智能漏洞的信息共享和法律監督的當前狀況。其次,它試圖闡明研討會上大多數與會者所認可的廣泛建議。這些建議分為四個高層次的主題,具體內容如下:
1.主題:為人工智能漏洞擴展傳統的網絡安全
1.1. 建議:構建或部署人工智能模型的組織應使用一個風險管理框架,解決整個人工智能系統生命周期的安全問題。
1.2. 建議:惡意機器學習研究人員、網絡安全從業人員和人工智能組織應積極嘗試擴展現有的網絡安全流程,以涵蓋人工智能漏洞。
1.3. 建議:對抗性機器學習領域的研究人員和從業人員應與處理人工智能偏見和穩健性的人員以及其他具有相關專業知識的社區進行磋商。
2.主題: 改善信息共享和組織安全心態
2.1. 建議:部署人工智能系統的組織應追求信息共享安排,以促進對威脅的理解。
2.2. 建議:人工智能部署者應強調建立一種安全文化,在產品生命周期的每個階段都嵌入人工智能開發中。
2.3. 建議:高風險人工智能系統的開發者和部署者必須將透明度放在首位。
3.主題:澄清人工智能漏洞的法律地位
3.1. 建議: 擁有網絡安全權力的美國政府機構應澄清基于人工智能的安全問題如何適應其監管結構。
3.2. 建議: 目前沒有必要修改反黑客法來專門解決攻擊人工智能系統的問題。
4.主題: 支持有效研究以提高人工智能安全
4.1. 建議: 攻擊性機器學習研究人員和網絡安全從業人員應尋求比過去更緊密的合作。
4.2. 建議: 促進人工智能研究的公共努力應更多地強調人工智能安全,包括通過資助可促進更安全的人工智能開發的開源工具。
4.3. 建議: 政府政策制定者應該超越標準的制定,提供測試平臺或促成審計以評估人工智能模型的安全性。
北約科學技術組織(STO)人因和醫學(HFM)探索小組(ET)對緩解和防御認知戰爭(CogWar)所需的科學和技術進行了評估。ET-356提出了一個科學和技術(S&T)路線圖,以指導北約和盟國伙伴在未來的研究活動和投資。
為了使北約有能力獲得并保持對其對手和整個沖突范圍的決策和認知優勢,需要有基于科學的知識來支持和提高北約應對認知戰爭的行動準備。CogWar不一定是新的,但它的出現是許多技術進步的整合和匯合的產物,并且隨著信息和技術的可獲得性增加而出現。CogWar通過試圖改變和塑造人類思考、反應和決策的方式,將眾所周知的戰爭方法提升到一個新的水平。由于其入侵性、侵入性和不可見性,以及其目標是利用認知的各個方面來擾亂、破壞、影響或修改人類的決定,"認知戰"的出現充滿了安全挑戰。
CogWar代表了廣泛的先進技術與人類因素和系統的融合,如人工智能(AI)、機器學習(ML)、信息通信技術(ICT)、神經科學、生物技術和人類強化,這些技術正被北約的對手在21世紀的戰斗空間中有意使用。CogWar在經濟、地緣政治、社會、文化等各個層面給全球防務和安全帶來了重大風險,同時也威脅著人類的決策。
ET-356的任務完全集中在識別和建議防御性科技,以加強聯盟對CogWar的威懾力,提高北約和國家的復原力,這對北約維護盟國、社會和共同價值觀的核心任務至關重要。
CogWar使對手有能力塑造人類的認知、感知、感覺、態勢感知和各個層面的決策。故意(誤)用數字網絡中的信息并在社交媒體等各種平臺上進行全球傳播的能力,為對手帶來了新的工具和方法。CogWar還旨在破壞關系,并針對個人和國家層面的人類脆弱性,如信任和認知偏見,其影響遍及所有作戰領域。本報告概述了減輕和抵御 "邏輯戰爭 "所需的關鍵科技領域。
建議的科技路線圖是基于ET-356開發的 "房屋模型(House Model)",并與觀察、定向、決定和行動(OODA)決策周期相聯系。房屋模型代表了七個主要的科技知識領域和使能因素,這些知識領域和使能因素是交叉的、相互關聯的支柱:認知神經科學、認知和行為科學、社會和文化科學;態勢感知、認知效果、操作方式以及技術和力量倍增器。這七個領域為北約科技組織及其小組和團體的研究討論提供了基礎。
本報告為北約科技組織內部的未來研究、盟國和國家科技投資提供了指導,以防御當前和未來的認知戰爭,并加強北約的技術優勢和對抗認知戰爭的戰略優勢。HFM ET-356的工作支持了北約作戰頂點概念及其認知優勢的戰爭發展倡議,以及2022年北約馬德里峰會上宣布的新的北約戰略概念。
CogWar房屋模型旨在通過挑戰我們認為已經知道的東西和探索我們知道的不知道的東西,來指導提供超越傳統思維的科學成果。通過明確的研究目標,反映跨領域的模型架構,我們可以學習如何支持北約作戰人員感知CogWar,并在它已經發生和/或已經產生效果時理解它。只有當正確的工具(認知和技術)在北約安全和防務、NWCC、法律和道德框架(ELSEI)內運行,或在其邊緣運行,沒有對手的干擾,才能在預測和制定反措施或反效果方面找到 "追趕 "和 "領先 "的方法。這將確保我們的感知足夠精確和及時,我們的態勢感知(SA)是由可信的輸入數據形成的。
圖2-1:開發的房屋模型
所有電力驅動的自主平臺都擁有一個系統,將電力分配給平臺的所有重要部件。在美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL),幾個項目正在使用無人駕駛航空系統(UAS)作為平臺。一些正在使用的無人機系統被歸類為第一組,這意味著它們的重量低于20磅。ARL進行研究的第一組無人機系統是非常快速和靈活的四旋翼飛機。這種四旋翼飛機通常有四個旋翼和輕型有效載荷,可以非常迅速地加速,毫不費力地達到每小時100公里以上的速度。為了做到這一點,這些四旋翼飛機可以在30直流電壓下突擊消耗高達400安的電流。為了滿足這些要求,相對于無人機系統的尺寸,電機/螺旋槳組合需要大量的功率。
到目前為止,ARL的無人機系統一直在使用商業現成的配電板(PDB)來滿足配電需求。定制的PDB將滿足美國防部在國內采購更多UAS組件的愿望,因為它將是美國設計和制造的,這對這種類型的UAS組件來說是獨一無二的。
本報告考慮了PDB設計的所有方面,包括形狀、尺寸、組件、成本、電壓調節器、外圍設備等等。本報告以一個特定的ARL項目所需的定制設計的PDB為背景探討了這些問題,但可以作為正在從事半自主和完全自主車輛項目的ARL工程師的起點。
爆炸超壓研究(BOS)工作試圖了解和減輕爆炸超壓事件對軍隊的影響,特別是解決與腦部創傷有關的問題。這個特殊項目的目標是更好地理解數據分析,以改善軍隊在BOS方面的作戰醫學。同樣令人感興趣的是如何對這些數據進行編目,并提供給追求這一主題的研究人員。評估的數據通常包括血液中生物標志物的濃度、國防自動神經行為評估指標和參與者自我報告的癥狀。幾個Python工具被用來重現文獻中存在的分析,包括Spearman等級相關、方差分析和四分位數范圍評估。還探索了機器學習中常見的其他分析方法,看是否能找到有用的關聯。這項工作顯示了擁有一個結構化的數據存儲和訪問方法的優勢,同時也強調了普通的開源工具,如Python和各種統計和機器學習軟件包,能夠產生有意義的分析結果。
超壓事件產生的壓力波超過大氣壓力。暴露在爆炸超壓下會對人和他們的認知健康產生嚴重的、累積的和長期的負面影響。例如,參與突破事件的士兵,如使用炸藥在墻壁或柵欄等結構上打洞的士兵,通常會暴露在超壓下。靠近武器系統的士兵也會遭遇超壓。暴露在超壓事件中往往會導致類似于腦震蕩或輕度創傷性腦損傷(mTBI)的癥狀。
首先,由于在報告輕度創傷性腦損傷或腦震蕩的癥狀以及診斷這種傷害時存在變異性和不確定性,有必要開發和探索分析,使這項任務更加容易。這個項目的第一個目標是創建一個用戶可以加載、編輯和分析數據的單一平臺。這樣一個可以作為真理來源參考的系統將通過減少使用多個平臺或在研究小組之間傳輸數據時可能發生的錯誤來提高研究的可重復性。此外,讓數據接近高性能的計算資源,并能夠輕松地將其用于大型分析工作流程,將促進以前不可行的新型研究。我們開發了一個軟件棧,其中包含一個攝取工作流程、數據存儲、數據處理引擎和一個用戶界面(UI),使用湖心島架構。一旦數據被攝取,以后就可以使用多種方式進行分析,包括基于標準查詢語言(SQL)的探索,基于Python的探索,以及人工智能(AI)/機器學習(ML)算法。此外,所有的迭代、變化和新得出的數據都記錄在資源庫中,因此很容易看到數據是如何被改變的。歸屬和數據出處在這個模型中得到了加強。
第二,在這個研究過程中,離群點檢測和移除的話題變得相當重要。多年來,有許多方法被研究和實施。在人類健康領域發表的許多論文都使用了一種自動方法,將人類對離群點識別的判斷從這個過程中剔除。這種方法可以在一個商業軟件包中找到,算法的作者在一篇論文中討論了整個方法。我們用Python實現了這個方法,因為我們的研究表明它還沒有在這種計算機語言中實現。有了這種方法,也就可以在大規模的超級計算機上對這種方法進行研究和應用的可重復性。
最后,這個項目的最后一個主要目標是表明Python和額外的統計和ML方法可以用來重現和擴展這個領域的常見分析。通過建立在數據科學界開發和測試的既定模型和程序上,解決問題的時間可以相對較快,而且可以沿途進行大量定制。
為了更好地了解這一研究領域所做的處理和分析類型,并確定應用和/或開發什么工具和程序來進行這種分析,我們專注于兩個不同的數據集。第一個包括總共29個受試者,有血液生物標志物數據、人類神經認知性能數據和爆炸壓力數據。這是我們使用mTBI社區的傳統技術進行分析和關注的第一個數據集。這個分析也突出了識別和去除離群點的重要性,這對小數據集來說更為關鍵。如前所述,這就需要一種專門的方法,這種方法在市場上可以買到,但據我們所知,還沒有一種更通用的軟件方法可以使用或實施。本報告對這種方法進行了描述。
在此之后,通過與沃爾特-里德陸軍研究所(WRAIR)的合作,我們獲得了更多的數據,包括來自8個隊列的218名受試者,這使我們能夠更加專注于新興的數據科學方法,如深度神經網絡,以尋找模式和因果關系。我們對這個數據集的經驗構成了本敘述的后半部分。這些方法的總和提供了一種使用開源工具和技術的方法,以便為創傷性腦損傷研究進行定制和深入的數據科學處理。