亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

美國國家科學、工程和數學研究院為空軍研究實驗室編寫了一份共識報告,其中記錄了各軍種對支持人-人工智能(Al)團隊合作的普遍和日益增長的愿望。Sonalysts 已經開始了一項內部計劃,探索人類-人工智能團隊的培訓。這項工作的第一步是開發一個能夠促進人-人工智能團隊研究的合成任務環境(STE)。決定將 "聯合全域指揮與控制"(Joint Al-Domain Command and Control,JADC2)作為開發 STE 的重點,因為 JADC2 概念中的大量傳感器輸入和決策選項可能需要使用輔助系統才能及時做出決策。有鑒于此,我們聘請了多位具有指揮與控制經驗的主題專家(SMEs),以深入了解如何開發能體現與 JADC2 相關的團隊挑戰的 STE。本報告記錄了我們與這些利益相關方的初步接觸。我們制作了一份包含兩類問題的調查問卷。第一類問題要求受訪者報告他們是否同意我們預計在以 JADC2 為重點的測試平臺中可能非常重要的 STE 功能。第二類問題要求主題專家回答開放式問題,探討任務域、性能評估方法、通信方法和自主隊友的特征等測試平臺特征。研究小組確定了 13 名具有軍事背景和指揮與控制經驗的 Sonalysts 員工(內部稱其為合作伙伴),并邀請他們參與調查。12 名受訪者完成了調查。然后,研究小組對他們的回答進行了分析,以確定出現的主題和需要進一步分析的話題。結果表明,我們的主題專家可以接受使用與軍事環境中類似的任務進行研究,只要這些任務要求團隊處理大量數據以做出復雜決策。主題專家認為,測試平臺應支持代表矩陣式組織的 "體系團隊",并應支持口語、基于文本和面對面通信的強大陣列。

背景

2021 年,美國空軍研究實驗室(AFRL)人類性能單元(Human Performance Wing)要求美國國家科學、工程和醫學院(NASEM)編寫一份共識報告,以審查人工智能(Al)的軍事作用,特別是作為人機團隊的一部分。這項工作的目標是使美國空軍后勤部能夠更好地支持未來系統的設計,在這些系統中,人類與智能體聯手實現任務目標。

NASEM報告在更廣泛的人機協作領域確定了九個重點領域:

1.訓練人機團隊

2 人工智能的透明度和可解釋性

3 人機團隊互動

4 信任人工智能隊友

5 人-AI團隊合作過程與成效

6 人機協作方法與模式

7 人-AI團隊中的態勢感知

8 人類-人工智能團隊中偏見的識別與緩解

9 人機系統集成流程與人機團隊協作和績效的衡量標準

Sonalysts 已開始在內部探索人-AI團隊中的第一個領域--人AI團隊培訓。表 1 轉載了 NASEM 報告的部分內容,其中作者將六項研究需求分為三個階段。

研究計劃的第一步是開發合成任務環境 (STE),為人機團隊提供一個經過驗證的研究環境。為了提出一套能夠最大限度地提高我們的研究適用性的要求,Sonalysts 正在與該領域的主要搜索人員和分部門專家(SMEs)進行接觸。本報告總結了與軍方 SME 進行的首次外聯工作的結果。

概述

雖然各軍種多層次都對人機協同感興趣,但新出現的聯合全域指揮與控制(ADC2)概念提供了一個聚焦視角。JADC2 概念設想將所有軍種和所有領域(如空中、海上、陸地、太空、網絡空間)的傳感器連接成一個龐大的網絡,以便快速使用這些軍種和領域的資產來實現任務效果。為了加快行動速度,同時考慮更多的數據和潛在行動方案(COA),人類決策者很可能要比過去更廣泛地與 AI 隊友合作。此外,我們認為這將是真正的 "團隊合作"。我們的研究將假定,智能體最終將能夠作為同伴/隊友而不僅僅是工具與人類合作。為了實現這一目標,我們設想人類-AI團隊將包括使用AI或類似技術在指定領域內做出決策和/或采取行動的自主系統,這些系統將能夠應對新的性能挑戰,同時與隊友協調和合作。當達到這些里程碑時,我們就可以開始將該系統視為自主隊友,它不僅能夠獨立行動,還能相互依賴。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

美國國防部和合作組織正在開發先進的機器系統,這些系統將與人類合作完成任務。鑒于這些人機團隊(HMT)從未經歷過測試與評估(T&E),本簡報有助于指導評估人員應對 HMT 帶來的新挑戰。它定義了人機協作,描述了評估 HMT 所面臨的挑戰,并提供了對 HMT 的測試與評估非常重要的指標分類框架。

人機協作比個體系統完成任務的簡單行為更為廣泛。它涉及人與系統之間的廣泛互動,因為他們要共同努力實現一個集體目標。鑒于人機協作的高度協作性,僅僅衡量機器和人是不夠的。我們還需要衡量團隊本身,而且這些衡量標準必須與任務相關、定量且客觀。

在評估 HMT 時會遇到一些獨特的挑戰,包括如何處理不透明的心智模式,以及機器指揮通信、自我任務或人類任務的情況。例如,考慮一個人機搜救小組,在這個小組中,一架自主無人機在空中飛行,尋找倒塌建筑中的幸存者,當發現幸存者時,它會向地面上的機器人發出警報。然后,機器人將幸存者從廢墟中拉出,送到人類醫護人員那里接受治療。如何評估無人機決定搜索地點的過程?或者如何與機器人溝通?機器人對這些通信的反應又如何?醫護人員決定如何治療幸存者以及治療順序如何?無人機、機器人和醫護人員如何合作并優先救治傷勢最嚴重的幸存者?它們如何協調其他工作?他們如何應對不斷變化的環境所固有的困難?顯而易見,團隊成員之間的互動是關鍵。

該框架概述了 HMT 評估的主要類別,包括能力(團隊具備哪些能力?)、互動(團隊如何合作和協調行動以實現目標?它強調團隊的衡量標準以及人與機器之間衡量標準的協調。因此,如果要評估人類的認知能力(即注意力和判斷力),就需要同時評估機器的認知能力(即信息處理架構和決策算法)。

該框架還提供了一種結構,用于確定和選擇評估團隊效率的適當指標。所有這些衡量標準都來自于先前的科學研究。

首先,考察人和機器的能力,因為其中任何一項能力都可能是團隊合作失敗的原因。對人的培訓和經驗、心理特征、體能、態度、認知資源、腦力勞動負荷或疲勞等進行評估。考慮與機器的認知結構和硬件組件相關的因素,如程序化任務知識、操作系統和其他軟件,以及物理傳感器和平臺。

其次,檢查可能導致交互失敗的關鍵領域。其中包括機器的態勢感知、資源分配和不同情況下的資源使用。例如,機器在使用傳感器尋找新的幸存者時需要多少電力,會影響到機器是否可以協助滿足團隊的其他需求。這些關鍵領域還包括人類的視角和決策過程。例如,人類對情況的理解會影響他們在這種情況下的行為,以及他們是否信任與之合作的機器。

最后,考慮潛在的漏洞。哪些威脅可能會阻礙團隊完成目標?如果團隊失敗會有什么后果?失敗可能會引發哪些其他問題?重要的是要找出任何問題,以便在今后的工作中加以緩解或解決。

最后,本簡報為 T&E 界提供了兩個重要啟示:

  • 評估 HMT 所面臨的挑戰與評估使用工具或系統的人類所面臨的挑戰不同。團隊中的人類和機器(稱為智能體)必須追求相同的目標,影響當前的問題狀態,并相互協調行動;這些互動因素使團隊面臨新的漏洞和更多的故障點。
  • 不能僅憑任務結果來識別潛在的系統漏洞。智能體之間的互動增加了評估的問題空間。

付費5元查看完整內容

美國空軍越來越關注人工智能(AI)在增強作戰各方面能力方面的潛力。在這個項目中,空軍要求蘭德公司的研究人員考慮人工智能無法做到的事情,以了解人工智能在作戰應用中的局限性。

研究人員沒有試圖確定人工智能的一般限制,而是選擇并調查了四個具體的作戰應用作為潛在用例:網絡安全、預測性維護、兵棋推演和任務規劃。選擇這些應用是為了代表各種可能的用途,同時突出不同的限制因素。在可以獲得足夠數據的三個案例中進行了人工智能實驗;剩下的兵棋推演案例則廣泛探討了如何應用或不能應用人工智能。

本報告是五卷系列中的第一卷,總結了所有應用案例的研究結果和建議。報告面向政策制定者、采購專業人員以及對將人工智能應用于作戰普遍感興趣的人員。

研究問題

  • 哪些作戰應用可作為潛在用例?
  • 訓練和測試人工智能系統需要哪類數據?
  • 人工智能算法有哪些局限性?

主要結論

  • 要識別適應性威脅,數據必須是最新的。分布偏移會降低模型性能,這是無法避免的,尤其是對于高維數據。
  • 不能依靠人工智能分類算法來學習沒有教過的東西。人工智能無法預測或識別新型網絡攻擊。
  • 數據必須可訪問且條件良好。相關的物流數據保存在多個數據庫中,通常條件不佳。如果沒有自動化的數據管道,就無法獲取足夠的數據來實現人工智能。
  • 和平時期的數據不能替代戰時數據。人工智能無法彌補適當數據的匱乏。
  • 數字化必須先于人工智能的發展。大多數兵棋推演不是在數字化環境中進行的,也不會生成電子數據。數字化是人工智能數據管道的先導。
  • 需要新型數據。要實現人工智能,就需要人機交互(HCI)技術來捕捉兵棋推演中目前尚未捕捉到的方面。
  • 人工智能遠未達到人類智能水平。因此,它不能代替人類,也不能應用人類的判斷。
  • 要應對適應性威脅,數據必須是最新的。必須根據最新情況刷新模型,才能在動態威脅面前生存下來。
  • 人工智能在戰術上很聰明,但在戰略上卻很幼稚。它往往通過進入對手的 "觀察、定位、決策、行動 "循環而取勝,而不是通過提出一個巧妙的大戰略。
  • 與傳統優化方法相比,人工智能的準確性較低。但它的解決方案可能更穩健,也能更快達成。

建議

  • 空軍部(DAF)應進行數據集細分測試,以確定人工智能系統分布偏移的重要性,并確定大致的衰減率和人工智能保質期。
  • DAF 應進行人工智能試驗,以改進戰備備件包 (RSP) 的需求預測,并將概念驗證模型擴展到所有飛機。這可能需要在逐個部件、逐個平臺的基礎上進行。
  • DAF 應考慮使用人工智能來解決更大的運籌問題,即選擇將哪些部件發送到哪里。
  • DAF 應建立一個數據操作管道,以便對多個部件和平臺的飛機維護和 RSP 進行有效的回顧性分析。
  • DAF 應將用于開發兵棋推演 AI 應用的資源集中在最有前途的領域:那些調查替代條件或用于評估有明確標準的領域;那些已經納入數字基礎設施(包括人機交互技術)的領域;以及那些定期重復的領域。
  • 發展議程應更多地使用數字游戲基礎設施和人機交互技術,特別是在為系統探索和創新而設計的游戲中,以收集數據支持人工智能的發展。
  • DAF 應更廣泛地利用人工智能能力來支持未來的兵棋推演工作。
  • 國防和安全部隊應考慮如何利用人工智能為面臨突發狀況的無人機制定快速反應政策。
  • DAF 應投資開發工具,將強化學習應用于現有的任務規劃模型和模擬中,如仿真、集成和建模高級框架(AFSIM)。
付費5元查看完整內容

Sonalysts 正在開展一項計劃,通過開發該領域的原創性研究,將我們目前在團隊合作方面的專業知識擴展到人類-人工智能(AI)團隊。為了給這項研究奠定基礎,Sonalysts 正在調查合成任務環境 (STE) 的開發情況。在上一份報告中,我們記錄了最近一次外聯工作的結果,在這次外聯工作中,我們請軍方主題專家(SME)和人類-人工智能團隊領域的其他研究人員確定他們最看重的測試平臺的品質。這次外聯活動的一個驚人發現是,一些受訪者建議我們的團隊研究現有的人類-人工智能協同測試平臺,而不是創建新的測試平臺。根據這一建議,我們對相關情況進行了系統調查。在本報告中,我們將介紹調查的結果。在調查結果的基礎上,我們制定了測試平臺評估標準,確定了潛在的測試平臺,并對候選測試平臺進行了定性和定量評估。在評估過程中,我們提出了五個候選測試平臺供研究團隊考慮。在接下來的幾個月中,我們將評估各種備選方案的可行性,并開始執行我們的研究計劃。

背景

美國國家科學、工程和數學研究院(National Academies of Sciences, Engineering, and Mathematics)為空軍研究實驗室(Air Force Research Laboratory,AFRL)編寫的一份共識報告記錄了各軍種對支持人類-人工智能團隊合作的普遍和日益增長的愿望(NASEM,2021 年)。Sonalysts 已經開始了一項內部計劃,探索如何最大限度地提高人類-人工智能團隊的性能。為了給我們的研究奠定基礎,Sonalysts 正在探索可作為測試平臺的合成任務環境 (STE) 選項。

基于最近對主題專家(SMEs;McCarthy & Asiala,2023a)和人類-人工智能團隊領域研究人員(McCarthy & Asiala,2023b)的調查結果,我們將在本報告中探討我們將重點關注的測試平臺質量,確定潛在的 STE,并對候選 STE 進行定量比較。

理想試驗臺的特征

在本節中,我們將概述研究人員在選擇 STE 時可能需要考慮的一系列特性,并確定我們的計劃將重點關注的特性。首先,我們將介紹研究人員可用于組織各種測試平臺的概念分類法,然后探討可能需要的特定 STE 功能。最后,我們將簡要討論我們將重點支持該計劃的科技教育維度和特征。

2.1 試驗臺分類法

通過與該領域的多位研究人員討論(例如,M. Steinberg,2023 年),我們創建了圖 1 所示的 STE 分類法。在該分類法的概念中,維度包括團隊成員(人類和智能體)之間的相互依賴程度、測試平臺內任務的相關性以及填充測試平臺的智能體的復雜性。

其中,相互依賴程度可能是最重要的維度。相互依賴程度反映了團隊成員在完成集體任務時對他人的依賴程度。幸運的是,我們可以通過早期的研究來操作這一維度。首先,請看 Saavedra、Early 和 Van Dyne(1993 年)的研究。在以商業為重點的 "小組工作 "領域,這些研究人員引用了湯普森(1967 年)和范德文等人(1976 年)的早期研究成果,討論了圖 2 所示的相互依賴范圍。在一個極端(集合工作流)中,幾乎不存在相互依賴關系;每個人都獨立完成分配的任務,"團隊產品 "是個人努力的總和(例如,某個呼叫中心的工作人員)。在順序工作流程中,個人負責生產自己的工作產品,并將其交給下一個團隊成員進一步處理(即典型的 "流水線 "流程)。在這種配置中,信息、資源、工作成果等都是單向流動的。其余兩種情況的相互依賴程度更高。在互惠模式中,"相鄰 "工人之間存在雙向流動。與順序模式中的單向流動相比,這種 "取與舍 "需要更高水平的協調與合作。最后,在團隊模式中,信息、資源、工作成果等是多向共享的。團隊中的每個成員都可以與團隊中的任何其他成員一起參與 "取與舍"(另見,Singh, Sonenber, & Miller, 2017)。

2.2 理想特征

在開發主題專家和研究人員調查問卷之前,Sonalysts 進行了相當廣泛的文獻綜述。結合我們在一系列建模和仿真工作中積累的經驗,我們預測出了一系列我們認為可能有用的任務領域特征。在調查中,我們要求受訪者指出他們在多大程度上同意或不同意我們的假設,即哪些具體特征在 STE 中會很重要。我們還通過開放式問題對李克特項目進行了補充,使調查對象能夠就 STE 中可能有用的其他功能提出建議。

為了支持這項工作,研究小組重新審視了調查結果,以確定我們可以用來描述和區分候選環境的特征。我們首先將研究人員的調查回復作為確定試驗臺特征的基礎。在對調查回復進行初步分析期間,我們對開放式問題的回復進行了專題分析。我們的目標是識別所有答案中重復出現的觀點,而不管受訪者使用了什么術語或措辭。我們將主題分析結果合并成一份針對每個問題的主題共識列表,然后由研究團隊將各個回復與列表中的條目進行映射。為了創建 STE 特征主列表,我們將共識列表中的條目與假設的特征相結合,假設的特征以李克特(Likert)風格的條目形式呈現,以獲得一致評分。這一分析得出了 289 個條目。

然后,我們將候選特征排序為上位特征描述。我們這樣做是為了識別和解釋開放式問題回答中提到的特征與李克特式問題中的特征之間的重疊。例如,有一個李克特式問題要求參與者對 "STE 應作為'開源'工具實施 "這句話的同意程度進行評分。除了普遍同意這一條外,還有六位受訪者在回答調查中的其他問題時提到 STE 應具有 "開源架構"。我們將這些條目歸入了 "STE 應該是'開源'的 "這一上位特征類別。

上位特征分類過程產生了一百多個上位特征類別。為了創建一個更合理的特征集,我們刪除了開放式回答和李克特風格項目合并少于三個的類別,并合并了幾個概念高度重合的類別。這樣,特征列表就縮小到了 23 個。由于用于評估和比較測試平臺的單個標準仍有 23 個之多,因此我們進一步將上位類別合并為表 1 中列出的八大標準。與每項標準相關的小標題反映了相關的細粒度特征。我們將在第 4 節介紹這些標準對測試平臺量化評估工具的貢獻。

表 1:重要的 STE 特征

付費5元查看完整內容

該項目是為了支持美國國防部高級研究計劃局(DARPA)的 "開放世界新奇事物的人工智能與學習科學"(SAIL-ON)計劃。在第二階段基期工作中,我們推進了第一階段 TALONS 框架的理論和實施,并收集了智能體在新奇事物生成器生成的新奇事物上的基線性能的初步實證結果。在第二階段的選擇階段,我們將基礎階段的工作擴展到更廣泛的新奇事物生成和實施形式。

這項工作的主要成果包括:完成了新奇事物生成器的開發;對來自 3 個不同 SAIL-ON TA1 團隊的新奇事物進行了性能分析;開發了自動且可最大程度減少人為偏差的新奇事物生成與實施流程;將我們的新奇事物生成流程應用于 Monopoly、Vizdoom 和 Blocksworld 領域,從而證明我們的新奇事物生成器與領域無關;以及為 SAIL-ON 計劃提供支持。下面的項目總結和后續報告將更詳細地介紹這些成就。

項目總結

目前最先進的人工智能可以在已知已知甚至未知的情況下穩健運行。然而,人工智能仍無法可靠地檢測、描述和適應開放世界中的新奇事物。隨著研究界不斷努力實現先進的自主性,我們需要有科學依據的方法來評估人工智能體在開放世界環境中的表現。

PacMar Technologies(PMT)和 Parallax 高級研究公司開發了一套獨立于領域的理論、原則性技術和軟件工具,用于生成、描述和評估新穎性。這些理論和技術涵蓋了與領域無關的新穎性。在合同基期內,我們開發了一個測試平臺,用于評估智能體在自動駕駛汽車領域對新奇事物的反應性能,我們還在南加州大學 SAIL-ON 團隊提供的大富翁領域中實施了由我們的軟件工具自動生成的新奇事物。

我們的新奇事物生成器方法使用原則性技術自動生成新奇場景。這些場景被加載到模擬環境中,與給定的第三方人工智能體對接,以收集該智能體的性能數據。然后評估智能體在各種不同情況下處理各類新奇事物的能力。

我們將新奇定義為環境中的變化。簡而言之,變化可以是過渡函數的變化,也可以是狀態空間的變化。我們的方法有能力在過渡函數(包括行動和事件)、狀態空間定義和觀察函數中生成新穎性。精確生成新穎性的計算方法可分為兩種類型的轉換,其方式與創造性系統框架(Wiggins,2006 年)一致。我們方法的關鍵在于從八個維度對新穎性進行表征,從而支持將情景生成的重點放在可能挑戰智能體魯棒性的情況上。

我們的方法目標如下
 1.為新奇性的特征描述奠定科學基礎。 2.開發生成可用于評估智能體的新情景的技術。 3.確定這些技術的可行性及其在各領域的適用性。

本報告旨在清晰地描述我們的方法,包括新穎性生成、模擬和評估的方法。將我們的方法應用于 CARLA 的自動駕駛汽車領域、Monopoly、VizDoom 和海洋領域,有助于進一步發展理論和測試平臺軟件。最后,我們對本報告進行了總結,并提出了進一步研究的思考和啟示。

在第一階段的工作中,我們開發了一個基于新穎性多維表征的新穎情景生成框架。我們正式規定了這一多維表征、收集受測智能體數據的指標,以及評估智能體對不同類型新穎性的魯棒性的方法。在使用轉換生成新穎性的過程中,我們定義了 24 個函數簽名,并計算了應用這些簽名生成新穎性的上限復雜度。我們的研究表明,根據我們對新穎性的多維表征,使用這兩種類型的變換來改變場景生成,我們能夠顯著減少新穎場景的空間。為了支持新穎性的精確生成,我們構思了 TALONS 模擬器抽象語言(T-SAL)來描述環境和這些環境中的各個場景。我們利用這些概念來支持第三方智能體對新奇事物的魯棒性評估。

在第二階段基期工作中,我們推進了 TALONS 框架的理論和實施,并收集了智能體在新奇事物生成器生成的新奇事物上的基線性能的初步實證結果。我們制作了三個源代碼庫,詳見基礎階段最終報告,其中包含以下內容的實現:(1) TSAL 語言;(2) 新穎性生成器(實現 R 變換);(3) 使用 CARLA 自動駕駛汽車模擬器的評估框架。從理論角度來看,我們利用第一階段工作中開發的新穎性維度理論對新穎性進行了初步分析研究,并正式定義了 R 變換,然后利用這些定義正式定義了新穎性層次結構級別。

我們在第二階段選擇期內做出的獨特貢獻包括以下內容:

  • 提供更新的 TSAL 解釋器 - 基于 python 的庫,可將 TSAL 語言文檔轉換為 python 類實例。其功能包括讀取、寫入和修改 TSAL 語言文檔。在選擇期內,我們為 TSAL 問題文件文檔解析組件添加了目標表示。
  • 修訂了 T-SAL 規范定義。
  • 完成了新穎性生成器的開發--這是一個基于 python 的庫,使用 R 變換和 T 變換生成新的 TSAL 領域和問題文件。功能包括
    • 用戶可以選擇要考慮的 R 變換,從而集中搜索特定類型的新穎性。
    • 初始 T 變換包括生成隨機情景和從種子情景生成情景,種子情景具有可選規格,可防止某些謂詞類型在新情景中發生變化。
    • 我們實現了與領域無關的過濾功能,以確定新穎性是否相關--如果不處理新穎性,智能體將會看到性能降低。
  • R 變換的正式定義
  • T 變換的正式定義
  • 更新了大富翁領域的 TSAL 領域文件,并為 Vizdoom 領域、Blocksworld 領域和一個海事領域創建了 TSAL 領域文件。
  • 在 Monopoly、Vizdoom 和 Blocksworld 域中進行了評估,以完善新穎性生成器的操作,并證明它可用于多個域。
  • 為 Blocksworld 領域添加了 T 變換情景生成器示例
  • 使用我們的新穎性維度對來自 SAIL-ON TA1 團隊(WSU、UTD 和 ISI)的新穎性進行了分析。
  • 我們提供了嚴格定義的 SAIL-ON 創新水平邏輯定義。這些定義可用于檢驗新穎性是否屬于某一特定級別。
  • 正式定義了發現有價值新奇事物的三個條件,我們將這些條件稱為 "可學性條件",因為它們反映了智能體是否有望 "學會 "一個新奇事物:相關性、可注意性、可控性。
  • 我們創建了一個 "人在回路中 "的流程,開發人員可以使用我們的新奇事物生成器在其他模擬器中創建新奇事物,這些模擬器是在 TSAL 之外定義的,例如 Monopoly 和 Vizdoom。
  • 在整個執行期間出版了 4 份討論我們工作的出版物
  • 支持第 36 個月和第 42 個月的 SAIL-On 會議,包括在這兩次會議上介紹我們的工作。

付費5元查看完整內容

這項工作由 Calian 和 C3 人因咨詢公司根據加拿大國防研究與發展-多倫多研究中心(DRDC TRC)任務 20 "未來自主系統集成的人機協作研究路線圖 "進行,是更大的人機交互(HAI)任務授權合同(TAC;合同:W7719- 185397/001/TOR)的一部分。人機交互任務授權合同的總體目標是設計、開發、實施和評估人機協作(HAT)概念、方法和技術,以提高加拿大兵力(CAF)人機系統(HMS)的整體性能。

當前項目的目標是制定一個研究路線圖,以指導未來自主系統(AS)的研發工作及其在加拿大武裝部隊中的集成。具體來說,路線圖將指導未來對部署自主系統的心理、倫理、道德、社會和文化影響的調查。為實現這一目標,加利福尼亞空軍和災難恢復與發展中心的利益相關者參與了一項 HAT 調查。該調查由 13 個涉及 HAT 研究問題的問題組成,使用 Survey Monkey 進行在線管理。調查圍繞四個研究主題展開:了解國防部/加拿大空軍目前正在考慮的人工智能賦能的自動系統類型;根據這些系統的分類法識別風險因素并確定其優先次序;加拿大空軍不同服務部門在使用和應用這些系統方面的異同;以及 DRDC 和加拿大空軍利益相關者之間的一致程度。

這項研究的參與者包括 DRDC 和 CAF 的主題專家 (SME),他們目前都活躍在與自主相關的項目中(例如,AS 項目中的 CONOPS 工作組)。代表作戰和研究界不同組織的 50 多名受訪者完成了 HAT 調查。調查結果顯示:

1.總體而言,CAF 和 DRDC 利益相關者的主要關注點在于擁有非致命能力的半自主(S-A)系統。這些系統廣泛應用于情報、監視和偵察(ISR)以及指揮與控制(C2)行動。對這些系統至關重要的基礎技術包括計算機視覺、機器人技術和高級數據分析;

2.與加拿大皇家海軍(RCN)和加拿大陸軍(CA)相比,加拿大皇家空軍(RCAF)有不同的優先事項,因為其對完全自主(F-A)系統以及具有致命能力的 S-A 和 F-A 系統的需求有所增加;

3.所有利益相關方都表達了對軍事自主系統的一系列風險考慮。這些問題包括系統有效性、人類系統集成(HSI)和人工智能脆弱性等各個方面。值得注意的是,對具有致命能力的系統的關注程度明顯更高,尤其是與道德、倫理和法律因素相關的風險;

4.關于人因專家確定的九個 HAT 研究主題,它們都被評為關鍵主題,亟需研究關注。在這些主題中,信任、權力轉移和系統透明度/可解釋性被列為最重要的研究課題;以及 5.

5.CAF 和 DRDC 的受訪者在自主系統研究(包括其應用和基礎技術)的精力分配方面達成了顯著共識。但是,在致命自主武器系統領域存在明顯差距,研究界似乎落后于作戰界。

付費5元查看完整內容

人工智能和增強認知(AI;包含兩者)已經為美國空軍(USAF)的重要職能提供了指導。到 2030 年,人工智能將滲透到空軍的所有任務領域。正如美國空軍明確指出的,對美國空軍科學至關重要的是,"未來不會自己發明自己"。據此,本報告的目標是幫助設想和指導美國空軍發明未來的人工智能。因此,需要的是充分利用人工智能并推動其發展的研發工作,以及如何提升空軍在所有任務領域保護國家的能力。

美國空軍豐富的技術歷史可追溯到幾十年前(如 McCulloch & Pitts,1943 年;Rosenblatt,1958 年;Rummelhart 等人,1985 年;Hopfield,1988 年),但隨著計算能力的進步,許多技術已迅速發展(LeCun 等人,1998 年;Hassabis 等人,2017 年),它們已經或即將在作戰環境中無處不在。2030 年,它們很可能成為美國空軍武器裝備的核心。從自主無人機到人類可穿戴設備,智能機器及其與人類的接口正在接近徹底改變我國空軍兵力作戰環境的臨界點。我們將這一最新趨勢稱為 人工智能加速。

必須認識到的是,美國不一定在所有相關技術方面都處于領先地位。這是一個重大弱點,也是一個需要克服的差距。我們的對手和盟友都注意到了人工智能加速的趨勢。例如,俄羅斯總統弗拉基米爾-普京曾指出,"誰成為這一領域的領導者,誰就將成為世界的統治者"。(美國有線電視新聞網,2017 年 9 月 2 日)。法國總統埃馬紐埃爾-馬克龍(Emmanuel Macron)承諾法國將進行新的重大投資,"為......人工智能研究提供資金"(Rabesandratana,2018 年)。在中國,人工智能研發得到了精心培育,與此同時,中國對外國企業轉讓科學數據制定了逐步限制性措施(Ding,2018 年)。國家主席習近平說 "我們要加快把中國建設成為先進制造業強國,推動實體經濟同互聯網、大數據、人工智能等先進技術深度融合"。(路透社,2017 年 10 月 18 日)。

為了彌補這一差距,100 多位頂尖的學術界、工業界和政府科學家為這項研究做出了貢獻,強調了'人工智能加速'可能如何塑造 2030 年的美國空軍。這些專家在 2018 年第二季度以 "NSF Ideas Lab "的形式進行了在線討論,其中一部分專家(本報告的作者)還進行了面對面的討論,這種形式由 Knowinnovation(KI)促成,該組織在通過面對面和虛擬互動促進創新和跨學科科學進步方面擁有豐富的經驗。

本報告整合了這些跨學科互動中產生的想法,并以美國空軍及其作戰人員為背景,重點關注三個關鍵領域:機器、人機和人類。下面我們將對這些術語進行操作性定義,并在圖 1(第 16 頁)中加以說明。

圖 1:各層次人機交互示意圖(報告的概念性組織結構)

機器

顯然,我們需要開發能夠自主運行、降低風險、與人類并肩作戰,并能在空中和太空極端環境中長期運行的機器和算法。機器將取代并在某些情況下改變現有的能力。為了應對快速發展、高度動態的賽博空間可能帶來的范式轉變破壞,美國空軍需要采取積極主動的姿態,包括在政府和私營部門研究投資的基礎上,不斷螺旋式發展新系統。專家們一致認為,變化不會沿著現有的趨勢線發生。賽博空間正在迅速發展,因此高度動態的環境和快速變化很可能會打破人們的預期。專家們一致認為,關鍵是要投資研究,開發適應性強、靈活、穩健、使用安全和不受威脅的系統,并評估哪些系統對于在美國采購至關重要。

人機

在 2030 年的地平線上,美國空軍在人工智能加速組織結構突變的精心領導下,有可能實現人機協同的變革性增強,從而大幅提高作戰人員的認知和協作能力,包括但不限于態勢感知、決策速度、作戰和組織靈活性。這將包括盡早采用先進的人機和腦機接口;普遍集成可穿戴、微型和納米電子傳感器,用于生理、心理和神經監測、反饋和閉環實時干預,這些傳感器將與特定機器或更廣泛的指揮系統相連接,在極端環境中尤為寶貴; 人類與信息或機器人機器之間的團隊合作一體化;創建映射網絡空間的虛擬世界,允許人類以空間和信息直觀的方式進行部署;以及與專家數字助理、云連接信息系統的日常互動,這些系統具有自然語言處理能力,大大縮短了人類與他們業務所需信息之間的距離。在這些主題中,大家對人機協作的幾大主題達成了共識。

I) 人機融合提高個人績效:這一領域提出了提高人類績效的新興技術,包括認知、行為和健康。

II) 人機協同:這一領域指出了人機混合團隊協同工作的新興模式。

III) 對人機協作性能的全系統監控:這一領域強調了對這些新技術進行仔細、持續和動態監督的重要性。

人類

專家組一致認為,人類特工是美國空軍所有任務領域取得成功不可或缺的組成部分。到 2030 年,在美國空軍的所有行動中,從后勤到維護或控制作戰機器,人類都將理所當然地與人工智能互動。此外,將有大量空軍兵力人員在神經技術進步帶來的增強認知模式下履行職責。人工智能的加速發展無疑將塑造未來的勞動力隊伍。鑒于作戰環境的快速演變,專家組重點關注的是,2030 年所需要的軍官屬性可能與 20 世紀所看重的屬性大不相同。

大家一致認為,必須建立對如何在開發和采用人工智能加速技術方面培訓和培養當前和下一代空軍兵力的認識。這需要系統層面的整合,以及現役人員與研發和采購界之間的互動。例如,通過讓現役人員參與人工智能系統的設計,可以在一定程度上實現有效采用。空軍人員應征入伍后,必須接受相關技能培訓,以應對未來美國兵力的挑戰。因此,了解如何在人工智能滲透的作戰環境中提高和保持人的性能,如耐力、巔峰認知、保持任務狀態等,對于為 2030 年的作戰做好準備至關重要。

橫切問題

該小組確定了許多貫穿各領域的關鍵問題。這些問題包括美國空軍面臨的戰略突襲、道德、法律、社會和能源挑戰。就戰略出其不意而言,本報告的挑戰范圍僅限于可以預見到對手會出現的人工智能技術進步。在倫理、法律和社會問題方面,人們明確認識到,美國空軍自愿采取的限制措施很可能不會成為其他國家的限制。最后,大家一致認為,能源供應和 "質量 "可能是人工智能進步的一個重大制約因素,特別是在美國空軍必須在動態和偏遠環境中工作的情況下。

建議

美國空軍應與其他聯邦科學機構(如國家科學基金會)以及美國國防部和情報部門的其他部門協調其在人工智能加速領域的研發投資。

美國空軍應在全球范圍內掃描研發投資,以深入了解可能代表未來作戰挑戰的外國政府計劃和能力。

美國空軍應組織一個由來自學術界和工業界的頂尖研究人員組成的人工智能加速咨詢委員會,隨著科學基礎各學科的不斷進步,為美國空軍領導層提供信息和建議。

美國空軍應通過構建平臺技術、數據架構、算法和集成能力,為解決方案搭建支架,為人工智能應用奠定基礎。

美國空軍應設立執行數據架構師職位,以監督人工智能的整合,以及從設備到后勤和人力資產的集中信息資源的收集和安全化。

結論

人工智能加速將塑造美國空軍(USAF)2030 年的戰備態勢。專家組達成的共識是,空軍應加快開發和采購計算與神經技術方面的系統系列,從而在整個相關作戰環境中實現指揮、控制、通信、計算機和情報(C4I)方面的巨大進步。這一系列系統分為三個方面: 1)追趕現有的商業技術(采用);2)對最相關的技術突破(如人工智能)進行核心投資;3)對填補前者突出所留下的空白的技術(如量子計算)進行外圍投資。

這樣的未來美國空軍將需要能夠卸載或放大人類性能的機器、人機和人機界面。這不僅包括意圖,還包括對來自傳感器流的反饋做出響應的能力,即使是在高級別作戰環境所產生的極端條件下。整個人工智能生態系統將需要為無人機和代理(包括蜂群)提供真正的自主操作,其操作領域既包括美國空軍熟悉的領域,也包括迄今為止美國空軍從未經歷過的領域。這不僅包括大氣層,還包括 "內部空間"(即網絡領域),更重要的是,甚至包括更高層次的大氣層以及低地軌道和深空。此外,還需要應對這些環境中隨之而來的能源限制。最后,這個系統之系統需要具備足夠的防御能力(也許是生物啟發),以抵御同行競爭對手的退化和攻擊。

美國空軍能否在 2030 年的軍事環境中取得成功,不僅取決于人工智能的加速,還取決于指揮和控制能否靈活應對戰略突襲。這種臨界點可能出現在空間技術領域(如太空電梯),也可能出現在人工智能領域的顛覆性發展。例如,"通用人工智能"(定義為能夠對任何智力任務進行人類水平認知的人工智能)的成功開發和實施掌握在國內同行競爭者手中,將使美國空軍處于明顯的劣勢。這種進步的軍事抵消將取決于美國空軍對技術前景的持續認識--不僅在航空航天領域,而且在認知與計算的交叉領域,因為它適用于人工智能。

付費5元查看完整內容

人工智能是下一個競爭領域;第一個開發出人類水平人工智能的國家將產生類似于原子彈開發的影響。為了維護美國及其人民的安全,美國國防部資助了人工智能及其應用的發展研究。本研究使用強化學習和深度強化學習方法作為當前和未來AI智能體,并評估開發中的潛在問題。在兩個游戲和一次遠足中對智能體的表現進行了比較: 分別是貨物裝載、河內塔和背包問題。據觀察,深度強化學習智能體能處理更廣泛的問題,但表現不如專門的強化學習算法。

付費5元查看完整內容

人工智能(AI)是一個創新的引擎,正在推動科學發現和經濟增長。它正日益成為解決方案的一個組成部分,這些解決方案將影響到從日常例行任務到社會層面的挑戰,最終服務于公共利益。同時,也有人擔心人工智能可能會產生負面的社會和環境后果。為了實現人工智能的積極和變革潛力,必須利用美國所有的聰明才智,以解決社會挑戰的方式推進該領域,為所有美國人服務,并維護民主價值觀。

然而,目前人工智能前沿的進展往往與獲得大量的計算能力和數據有關。今天,這種機會往往僅限于那些資源豐富的組織。這種巨大且不斷擴大的資源鴻溝有可能限制和不利于人工智能研究生態系統。這種不平衡威脅著國家培養人工智能研究社區和勞動力的能力,以反映美國豐富的多樣性和利用人工智能來推動公共利益的能力。

如本報告所述,一個可廣泛使用的人工智能研究網絡基礎設施,匯集了計算資源、數據、測試平臺、算法、軟件、服務、網絡和專業知識,將有助于使美國的人工智能研究和開發(R&D)景觀民主化,使所有人受益。它將有助于創造途徑,擴大參與人工智能的研究人員的范圍,并使人工智能的方法和應用增長和多樣化。這種網絡基礎設施也有助于為所有科學領域和學科的進步開辟新的機會,包括在人工智能審計、測試和評估、可信的人工智能、減少偏見和人工智能安全等關鍵領域。反過來,更多的機會和多樣化的視角可以帶來新的想法,否則就不會實現,并為開發設計上具有包容性的人工智能系統創造條件。

作為《2020年國家人工智能倡議法》的一部分,國會成立了國家人工智能研究資源(NAIRR)工作組,以 "調查 "NAIRR作為國家人工智能研究網絡基礎設施的可行性和可取性,并 "提出詳細說明[如何建立和維持NAIRR]的路線圖。" 最近的《2022年CHIPS和科學法案》加強了民主化使用國家人工智能研究網絡基礎設施的重要性,通過投資加速先進計算的發展--從下一代圖形處理單元到高密度內存芯片--以及采取措施積極吸引廣泛和多樣化的美國人才參與前沿科學和工程,包括人工智能。

這份最終報告是特別工作組歷時18個月,為建立NAIRR制定愿景和實施計劃的最終成果。它建立在工作組2022年5月發布的臨時報告中的調查結果和建議的基礎上,提供了一個實現NAIRR目標的實施計劃:以保護隱私、公民權利和公民自由的方式,加強美國的人工智能創新生態系統并使之民主化。

NAIRR的建立應考慮到四個可衡量的目標,即(1)刺激創新,(2)增加人才的多樣性,(3)提高能力,以及(4)推進值得信賴的人工智能。NAIRR應該通過支持來自不同背景的研究人員和學生的需求來實現這些目標,這些研究人員和學生正在從事基礎性的、受使用啟發的和轉化性的人工智能研究。這些用戶應以美國為基地或隸屬于美國的組織,包括學術機構、非營利組織和初創企業或小型企業。

NAIRR應包括一套來自不同供應商的計算、數據、測試平臺和軟件資源,以及技術支持和培訓,以滿足這一目標用戶群的需求。NAIRR的具體設計、實施和評估應圍繞四個關鍵目標進行,并應支持收集數據以評估系統性能的關鍵指標和實現這些目標的成功。

NAIRR的管理和治理應遵循合作管理模式,即由一個聯邦機構作為NAIRR運作的管理機構,由聯邦機構的負責人組成的指導委員會負責推動NAIRR的戰略方向。行政機構內的項目管理辦公室應該為一個獨立的運營實體提供資金和監督,以管理NAIRR的日常運營。由國家人工智能倡議辦公室(NAIIO)共同主持的指導委員會將在NAIRR的管理中納入聯邦各機構的利益和觀點。這些機構也應直接支持資源提供者,他們的資源聯合起來將構成NAIRR。應通過用戶委員會、科學咨詢委員會、技術咨詢委員會和道德咨詢委員會向運營實體提供建議,挖掘多樣化的觀點和專業知識,為NAIRR的運營提供信息。

NAIRR應通過一個綜合門戶網站提供計算和數據資源、測試平臺、軟件和測試工具以及用戶支持服務的聯合組合。計算資源應包括傳統服務器、計算集群、高性能計算和云計算,并應支持訪問邊緣計算資源和人工智能研發的測試平臺。開放的和受保護的數據應在分層訪問協議下提供,并與計算資源共處一地。運營實體本身不應操作構成NAIRR的全部計算機硬件;相反,計算以及數據、測試和培訓資源應作為服務由通過聯邦機構或多機構資助機會選擇的合作伙伴資源提供者提供。當全面實施時,NAIRR應同時滿足人工智能研究界的能力(支持大量用戶的能力)和能力(訓練資源密集型人工智能模型的能力)需求

NAIRR必須能被各種用戶廣泛使用,并提供一個可用于教育和社區建設活動的平臺,以降低參與人工智能研究生態系統的障礙,增加人工智能研究人員的多樣性。NAIRR的訪問門戶和公共網站應提供目錄以及搜索和發現工具,以促進對數據、測試平臺以及為各種經驗水平服務的教育和培訓資源的訪問。

NAIRR應該通過設計和實施其管理程序,為負責任的人工智能研究設定標準。NAIRR必須從一開始就通過整合適當的技術控制、政策和治理機制,積極主動地解決隱私、民權和公民自由問題。運營實體應與道德咨詢委員會合作,制定標準和機制,從隱私、民權和公民自由的角度評估擬納入NAIRR的研究和資源。應根據白宮科技政策辦公室在2022年10月發布的《人工智能權利法案藍圖》,要求定期培訓,以建立NAIRR用戶對人工智能研究中與隱私、民權和公民自由有關的權利、責任和最佳做法的認識。

NAIRR應根據既定的指導方針實施系統保障措施。這些準則包括美國國家標準與技術研究所(NIST)制定的準則和五個安全框架:安全項目、安全人員、安全設置、安全數據和安全產出。運營實體應將NAIRR網絡基礎設施設計成由多個層次組成,首先是兩個主要區域:一個開放的科學區域 "NAIRR-開放 "和一個安全區域 "NAIRR-安全"。每個區域都應該聯合計算、網絡和數據資源,按照安全和訪問控制政策運行,這些政策在區域內是統一的,但在區域之間是不同的,反映了用戶和資源運營商的不同優先級和需求。NAIRR-Open應采用開放科學界20多年來形成的最佳做法;與聯邦開放數據、開放政府和研究安全政策保持一致;使用單點登錄認證和運營實體管理的資源分配機制管理訪問。NAIRR-Secure應該由一個或多個安全飛地組成,遵守一套共同的安全控制,并有能力支持受法律保護的數據所產生的安全要求。

NAIRR的實施應分四個階段,在本報告發表后立即開始。在第一階段,國會應授權并撥款建立NAIRR。行政機構和NAIIO應該協調指導委員會的成立,并建立一個項目管理辦公室,然后準備對運營實體的招標,并管理選擇過程。

圖:階段性NAIRR實施時間表

在第二階段,運營實體應確立其活動,并監督NAIRR門戶網站和用戶界面的創建,建立適當的技術和政策控制。該架構應支持收集關鍵績效指標,以評估NAIRR的進展。資源提供者應通過協調的、多機構的籌資機會來選擇,最好是在運營實體最初授予的6個月內發布。

在第三階段,NAIRR應達到初步的運作能力,運營實體也應正式確定政策、程序和初步的技術資源,提供給人工智能研究人員。最初的能力包括:(1)一個門戶網站和用戶支持資源;(2)一個混合的計算資源提供者;(3)一個分配和身份系統;(4)一個數據發布系統。在第四階段,活動應從建立NAIRR過渡到建立穩定的運作,以及根據用戶的吸收和需求對NAIRR資源進行計劃的演變。

最后,工作組還提出了一個實施NAIRR的試點方案,該方案將與上述階段同時啟動,以加快向人工智能研發界提供NAIRR資源。

按照設想,NAIRR的影響將是巨大而深遠的,使研究人員能夠解決從常規任務到全球挑戰的各種問題。為了實現其愿景和目標,特別工作組估計NAIRR的預算在最初的六年期間為26億美元。這筆投資的大部分(22.5億美元)用于資助通過NAIRR獲得的資源,通過向多個聯邦機構撥款。工作小組根據先進的計算資源以及數據、培訓和軟件資源的近期成本、滿足人工智能研發界當前需求的使用水平估計,以及人工智能研發界的預期增長來估計這一預算。資源提供者應每兩年上線一次,使用壽命為六年,這樣每兩年就會有7.5億美元的新投資,以確保NAIRR的資源保持最先進的水平。運營實體每年將需要5500萬至6500萬美元來支持NAIRR活動的協調和管理。每年還有500萬美元的預算用于對運營實體和NAIRR績效的外部評估。

本報告中提出的NAIRR的愿景旨在滿足國家對增加獲得最先進的資源的需求,以推動人工智能創新。實現這一愿景的路線圖建立在現有的聯邦投資之上;設計了對隱私、民權和公民自由的保護;并促進了多樣性和公平的使用。如果成功,國家人工智能研究資源將改變美國國家人工智能研究生態系統,并通過加強和民主化參與美國的基礎性、使用性和轉化性人工智能研發,促進解決社會層面問題的能力

付費5元查看完整內容

為了跟上美國防部(DOD)人工智能(Al)戰略的步伐,美國陸軍在2018年啟動了人工智能集成中心(Al2C)。他們的任務是--與美國各地的公司和大學的人工智能社區溝通,目的是通過人工智能的整合來改善和提高軍隊的能力。

這個頂點項目盡可能地分析了當前美陸軍部(DA)對人工智能的要求狀況,以及它們對人類系統集成(HSI)的包含。該小組審查了發布在獎勵管理系統(SAM)網站上的人工智能合同機會和適用的文件,包括績效工作聲明、工作聲明或目標聲明。第一步是確定這些合同機會中包含的要求是否符合人工智能的定義,即計算機系統有能力執行通常需要人類智慧的任務。如果需求符合人工智能的這一定義,那么分析工作就會繼續進行,并側重于納入HSI,以確保為人類(即操作員、士兵、用戶等)提供便利。研究小組還采訪了主題專家(SMEs),以深入了解軍隊開發和獲取人工智能需求的過程。

在2003年至2022年期間發布到SAM的機會中,只有16%(238個中的40個)在開發過程中足夠成熟,可以考慮進行評估。在這40個被認為足夠成熟的采購開發過程中,只有16個發布的信息包含了相關的文件,可以根據團隊既定的人工智能和HSI標準進行評估。從那里,只有6個帖子符合AL的定義,4個被寬泛地判斷為包括一些對HSI或人為因素的參考。該小組的綜合評估確定,陸軍的人工智能指導還處于起步階段,需要進一步發展和完善。評價還強調,盡管國防部和陸軍指導將HSI納入所有要求,但仍然缺乏對HSI的納入。

這個頂點項目建議,所提出的結果和結論應被用來進一步制定人工智能需求的采購指南,并特別注重納入HSI。我們還建議,未來的研究應納入機密需求以及由其他交易機構通過財團管理的需求。

付費5元查看完整內容

隨著當前海軍戰爭的趨勢轉向自動化作戰武器系統,美國海軍正將其戰略重點放在人工智能(AI)能力上,以減少作戰人員行動時間。這個系統工程(SE)項目使用約翰-博伊德的觀察、定向、決策和行動(OODA)概念和海軍陸戰隊規劃過程(MCPP)(Angerman 2004;美國海軍部2016)來代表人類-人工智能決策過程。空中和導彈防御(AMD)的殺傷鏈是通過簡化聯合目標定位理論“JP 3-60”(參謀長聯席會議2018)來體現的。殺傷鏈過程中提高操作動化水平被證明可以大大減少執行時間,如果進一步發展和實戰化,將為海員和海軍陸戰隊提供防空的戰術優勢。通過使用專家系統和人工智能加速殺傷鏈將大大縮短交戰時間,有效地擴大戰斗空間。

該項目開發了用于防空和導彈防御的人工智能(AI-AMD)架構,該架構旨在通過對威脅進行優先排序并在人類用戶的最小介入下采取行動來改善作戰決策。該項目專注于理解和評估空空導彈防御(AMD)的殺傷鏈,通過確定使用AI-AMD可以更快地執行行動。項目組確定并評估了與應用于殺傷鏈過程中各個步驟的AI-AMD自動化水平相關的風險。該小組進行了建模和模擬(M&S)分析,以比較低水平自動化("無 "人工智能)的殺傷鏈和高水平自動化("有 "人工智能)的殺傷鏈,根據節省的時間來評估改進。

該團隊在M&S分析的基礎上開發了高度自動化的AI-AMD決策輔助作戰能力的概念,并確定了有可能應用于未來AI-AMD架構的現有和未來人工智能方法。該團隊按照美國防部的架構框架(DODAF)進行了架構分析,以確定AI-AMD的操作過程。該小組采用基于模型的系統工程(MBSE)方法,使用SE工具Innoslate來開發概念架構。架構分析結合了藍軍(BLUFOR)防空傳感器、武器裝備和聯合網絡,創建了一個OV- 5b/6c行動圖,描述了AI-AMD決策輔助輸出與JP 3-60聯合目標定位程序步驟協同應用,以消除敵人的威脅(參謀長聯席會議2018)。為了完成其任務,BLUFOR系統(SoS)執行36項業務活動:AI-AMD內部的17個決策點和外部系統的19個功能(包括傳感器行動和網絡通信)。該團隊使用實驗設計(DOE)、離散事件和隨機模擬分析了架構分析的結果,發現在目標定位過程中高壓力的AMD場景需要完全自動化水平,而低壓力的AMD場景需要最低水平的自動化。該團隊開發了一個決策風險矩陣,顯示出高壓力情況下的風險可以通過完全的自動化水平來降低。目標定位過程中17個步驟中的每個步驟的風險評估都被分為四類:低、中低、中和高。團隊制定了一個相關的風險值來進行風險評估確定。團隊利用Parasuraman的自動化水平(1-10級)來進行風險評估,將決策風險與目標定位過程中各個步驟的自動化水平聯系起來(Parasuraman, Sheridan, and Wickens 2000)。該小組開發并使用了一條效用曲線來幫助確定每個自動化水平所節省的時間。自動化程度越高,節省的時間就越多。

該項目側重于單一威脅的交戰,以了解殺傷鏈過程中AI-AMD的時機。該小組進行了M&S分析,以證明AI-AMD架構的能力。該小組使用Innoslate MBSE工具和Microsoft Excel進行了離散事件模擬。在大量投資于行動圖之前,團隊使用Excel來評估元模型。仿真的主要重點是建立AI-AMD在不同壓力水平下的時間性能,如低、中、高。次要目標是將該模型發展為可交付的設計工具,在NPS用于未來研究。該小組從公開來源的威脅數據中選擇了三個有代表性的交戰:低壓力情景(時間軸為58.65分鐘),中度壓力情景(時間軸為9.72分鐘),以及高壓力情景(時間軸為1.51分鐘)。該小組的M&S分析結果顯示,在低壓力情景下,僅由人類做出的決策(自動化水平1)導致對飛入時間為58分鐘或以上的敵方威脅的AMD殺傷率達到100%。對于中度威脅情景(代表AI-AMD對每個作戰活動決策節點的不同自動化水平(如6到10)),1000次隨機運行的數據結果顯示所有交戰的平均完成時間為8.08分鐘。當AI-AMD系統被設置為較高的自動化水平時,該系統在中等威脅情況下成功地進行了AMD防御。高壓力場景的分解時間線允許每個作戰活動決策節點有0.09分鐘。該小組將人工智能-AMD系統設置為在高壓力情景下僅由人工智能進行決策(自動化水平10)。高壓力場景的結果表明,在自動化程度為10級的情況下,有可能成功應對敵人的威脅。該小組進行了敏感性分析,以探索替代的基本代表分布(基線、對稱變量擴散和高度傾斜)的影響。雖然分布形狀的變化確實影響了結果,但在每一種情況下,只有在人工智能支持的節約率超過97%的情況下,才會在高壓力場景中取得成功。

該項目研究了人工智能方法如何應用于AMD決策,以提高自動化水平,減少人類-人工智能團隊的執行時間(人工智能輔助決策)。該團隊自上而下地分析了AMD殺傷鏈:從OODA到尋找、固定、跟蹤、目標、參與和評估(F2T2EA)。該小組確定了17個關鍵決策點,在這些決策點上,提高自動化水平可以提高AMD的決策速度。潛在的自動化水平與每個不同步驟相關的風險進行了平衡。該小組使用M&S來評估人工智能-AMD系統在低水平的自動化("無 "人工智能)到高水平的自動化("有 "人工智能)下的決策的及時性。由此產生的AI-AMD概念架構的高層次能力被記錄下來,隨著系統技術的成熟,建議利益相關者考慮。該團隊確定了現有和未來的人工智能方法及其在AMD殺傷鏈中的潛在應用。該小組已經確定了未來人工智能-AMD的迭代需求,以研究整個戰場上具有多種威脅和參與的更復雜的情況。

付費5元查看完整內容
北京阿比特科技有限公司