午夜剧场成年免费视,国产女做A性色精品视频免费,日日噜噜噜夜夜爽狠狠视频

風險評估是復雜的，而且往往是有爭議的。它來自于危險呈現，它的特點是可能發生的不理想事件及其結果的不確定性。很少有像核戰爭和核恐怖主義這樣不受歡迎的結果。幾十年來，關于可能影響核戰爭和核恐怖主義風險的特定情況、政策和武器，已經寫了很多。這些問題的性質和用于評估的風險分析方法隨著時間的推移有了很大的變化。

認識到核戰爭和核恐怖主義帶來的風險，2020財年國防授權法案指示美國國防部與美國國家科學、工程和醫學研究院簽訂合同，進行一項研究，探討風險分析方法的性質及其在評估核戰爭和核恐怖主義風險中的應用。

本報告是該研究的第一階段，它討論了風險，探索了風險評估文獻，強調了風險評估方法的優點和缺點，并討論了一些公開的、支撐美國安全戰略的假設，這些都是在核戰爭和核恐怖主義的背景下進行的。研究的第二階段將擴大重點，包括分析風險分析中的假設和方法在美國安全戰略中可能發揮的作用。第二階段的研究將產生一份保密報告和一份非保密的摘要。表S-1詳細介紹了委員會的工作。

值得注意的是，該研究在其兩個階段的工作中都不包括進行風險分析。本報告也不會涉及當前的地緣政治事件，如俄羅斯2022年對烏克蘭的入侵，盡管這些事件說明了在國際沖突中了解核風險的重要性。

美國政府和國際社會已投入大量資源和時間，試圖了解和減少核戰爭和核恐怖主義的風險。美國戰略司令部的現任指揮官以及核裁軍運動者都斷言，核戰爭的風險仍然非常真實。對于核和放射性恐怖主義的風險，也有類似的說法。此外，隨著新技術和新對手的出現，這些風險正變得更加復雜。

為了確定與核恐怖主義和核戰爭有關的威脅和后果，分析人員在對核戰爭或核恐怖主義進行風險分析時將面臨許多挑戰。委員會確定了可能導致核戰爭的七類情況：預防性的、先發制人的、升級性的、催化性的、意外的、未經授權的和誤報的。委員會還確定了三類可能導致核恐怖主義的情況：簡易核裝置、放射性散布裝置或放射性暴露裝置，以及對核設施的破壞。這些類別的情景并不是相互排斥的，因為各類別之間也可能發生其他互動，例如意外和誤報情景之間。這些依賴性必須反映在任何風險評估中。委員會確定的情景類別在此作為例子，并不是全部；然而，分析人員必須包括他們能夠設想到的所有情景類別，以便風險結果不會被低估。對使用核武器造成的直接物理后果的估計，依賴于基于核物理學、過去的經驗、核試驗數據和其他可用信息的數學模型。關于核武器的一些物理影響（如對傷害和死亡的直接估計），人們已經知道了很多，盡管有些影響（如火災、現代城市環境的破壞、電磁脈沖影響和氣候影響，如核冬天）還不是很清楚或難以量化（弗蘭克爾等人，2015）。評估使用核武器的社會、心理和長期影響的方法在很大程度上依賴于人類應對其他災難性事件的行為的代用數據。使用這些方法的分析通常包含巨大的不確定性和強烈的相互依賴性。

委員會研究了與核戰爭和核恐怖主義有關的風險評估和分析的歷史，包括探討歷史上為了解核戰爭和核恐怖主義的風險所做的嘗試，以及在評估核戰爭和核恐怖主義的總體風險時所涉及的重要不確定性來源。來自歷史文獻的關鍵見解反映在本報告中，但一個明顯的差距是缺乏對核武器的物理影響不太了解的知識，以及對使用核武器的心理、社會和政治后果的評估和估計。

在做出各種決定時，風險信息可以成為決策者的重要投入，包括確定優先事項、制定新的政策或程序，以及分配資源或時間。在自然和工程系統中，特別是當統計數據可用且可靠時，基于事件樣本頻率的風險分析可以很容易產生對未來風險的估計。然而，正如美國國家科學院以前的研究報告所指出的，將傳統的風險方法用于核戰爭和核恐怖主義--直接證據有限；背景的不確定性很大；以及智能的、適應性強的對手（NASEM 2016；國家研究委員會2008，2011）--是一個重大挑戰。在許多假設中，對這種情況下的風險評估必須考慮到行為者的意圖和利益、他們的能力、他們可用的信息和情報，以及他們的適應性反應--所有這些都可能難以評估。

委員會認為，風險指的是四個關鍵問題：

1.會發生什么？具體而言，什么會出錯？

2.這些事件發生的可能性有多大？

3.如果這些事件發生，有什么潛在的后果？

4.這些事件可能發生的時間范圍是什么？

風險分析可以是一個強大的工具，用于澄清假設；對復雜的、相互關聯的因素進行結構化和系統化的思考；描述不確定性；并確定可能需要哪些進一步的證據或信息來為將要作出的決定提供信息。然而，使用風險分析方法來評估核戰爭和核恐怖主義的總體風險是困難的，原因有幾個。

除了本報告正文中詳述的具體結論（并在第8章中列出）外，委員會還得出了三個總體結論。

1.過去核戰爭和核恐怖主義的例子很少。因此，幾乎沒有什么直接的證據可以用來對兩者的概率進行經驗性的估計。

分析師們試圖通過應用不同的方法和使用多種信息來源來描述由此產生的不確定性，以補充這個有限的證據體系。同樣地，歷史記錄中包含了有限的核或放射性恐怖主義企圖的例子，對核恐怖主義風險的分析也常常借鑒這些例子。有限的直接證據所帶來的不確定性，由于人類的意圖、觀念和動機所發揮的重要作用而變得更加復雜。鑒于所涉及的重大不確定性和決策者可能采取的不同風險態度，整體風險分析的政策相關性并不明確。

雖然人們對核武器和放射性武器的物理后果有很多了解，但對其間接后果的了解并不充分。這包括社會、經濟、政治、基礎設施、氣候和心理方面的影響，這些影響受到這些武器的直接物理影響。

這些因素之間的動態相互作用是復雜的，對它們的分析方法也不太發達。關于這些影響的直接證據很少，這對評估國家或恐怖分子使用核武器的后果是一個挑戰。即使是廣島和長崎的轟炸也只提供了關于涉及現代核武器的沖突的可能性和后果的有限信息。

從專家那里獲得的信息往往是評估與核戰爭和核恐怖主義有關的一些風險的全部資料。分析師和決策者需要意識到這些信息的來源，意識到專家可能在分析中引入的偏見和限制，以及這些信息對風險結果的影響。盡管核戰爭和核恐怖主義的某些方面可能對充分應用這些方法構成挑戰，但可以從其他風險分析學科中借鑒專家征詢的最佳做法。

2.可能導致核戰爭和核恐怖主義的情況很多，涉及許多相互依賴的因素，對其風險的評估往往取決于許多專家和行為者的能力、價值觀、看法和意圖。

核戰爭和核恐怖主義的風險部分取決于威懾的有效性，它反映了所有相關方的能力、信念、動機、意圖、預期戰略和信息。在危機的陣痛中，信息的不可得性和不準確性可能會增加侵略者和防御者所面臨的風險。核戰爭和核恐怖主義情景的風險因有關國家或行為者的理由或發起原因、使用的武器類型和數量以及目標等許多其他高度相互依賴的因素而有所不同。由于存在大量的情景可能性，它們通常被歸類，并作為具有一些關鍵共同因素的情景類別進行分析。

評估核戰爭和核恐怖主義的總體風險涉及不同情景的可能性和后果的巨大不確定性。對這些不確定性的評估和溝通對管理這些風險所必需的政策決定至關重要。然而，風險分析的價值并不僅僅在于評估整體風險。風險分析可以為許多與核戰爭和核恐怖主義有關的較小規模的問題提供寶貴的意見。許多分析旨在確定各類情況的相對或比較風險（例如，核設施被破壞的風險與放射性暴露裝置的風險相比較；或確定與不同投資或設計變化相關的風險降低），或解決決策者面臨的具體問題，如：：一個特定國家的核儲備的可靠性是什么？汽車邊境口岸的某一型號的探測器檢測到特定水平的輻射的概率是多少？哪些核設施應該被檢查，多久檢查一次？對于涉及重大不確定性和需要做出資源限制的決策的風險管理問題，評估與不同選項相關的風險變化有助于為決策提供信息。

分析師在風險分析中不可避免地要進行假設，包括對風險問題的定義和框架的假設；哪些模型可以有效使用；數據的可靠性；以及對手的能力、意圖和潛在行動。戰略假設可以幫助界定風險問題的界限。一些戰略假設涉及風險的性質或程度，風險驅動因素的影響，政策或行動是否增加或減少風險，美國面臨的威脅的性質和種類，以及最可能發生的情況。戰略假設還包括美國境外的核戰爭風險。

3.不同的風險評估方法或多或少適合于不同的情況和目標。

委員會確定了以下與分析這些風險有關的方法，并審議了這些方法的適用性和局限性：

第一擊穩定性分析比較了在核戰爭似乎迫在眉睫的危機中先發制人對雙方的好處。
概率風險評估可以探索適應性對手之間的相互作用，盡管從定量輸出中提取定性的數值可能會掩蓋一些細微的結果。
數量級的估計為核事件的概率設定了極端界限，然后可以逐步縮小。
博弈論可用于模擬智能對手之間基于其偏好和能力信息的潛在行動及其結果。
對抗性風險分析可用于評估一個智能對手或少數對手的可能選擇。
基于還能提的模型可以在給定的規則和不確定性的情況下估計個人的行為。
多屬性模型根據決策者偏好的不同屬性中的定義和加權標準，評估不同場景下結果的不同要素（屬性）。
網絡模型使用網絡分析，在代表從開始到結束的路徑中的關鍵事件和情景的節點上探索多種選擇。
核和常規力量交換模型可以通過量化潛在的核或常規攻擊的結果來幫助評估威懾力。

正如風險分析中的結構、參數和假設可能會給風險分析的結果帶來色彩一樣，風險信息的評估、框架或呈現方式對該信息在決策中的理解和使用有很大影響。當產生風險分析結果的方法和假設是明確的，過程是可復制的，對分析過程的信任是建立的，結果是針對決策者所面臨的真正的問題或決定時，風險分析結果是最寶貴的。

風險信息可能是對決策的一種有價值的輸入，但它不會也不可能支配決策，因為決策還取決于偏好和風險態度。除了風險之外，還需要考慮其他因素，如法律、政治或預算的后果和限制。新興技術，如新的武器系統和人工智能的進步，正在迅速改變風險和威懾的格局。美國的核態勢隨著時間的推移而演變，考慮到了新的威脅、涉及不同美國對手的發展威懾戰略、技術進步、核軍備條約和不斷變化的地緣政治環境。美國對核恐怖主義風險的評估也同樣隨著時間的推移而變化，考慮到了新的威脅和新興技術。

隨著有關核戰爭和核恐怖主義決策的背景繼續演變，風險評估將繼續成為分析家和決策者的一個寶貴工具。

付費5元查看完整內容

建議

建議1. 政府應撥出研究經費，發展公私合作，對HMT-AI進行縱向研究。這項研究應側重于HMT-AI中的新舊決策模式，以評估編隊協議建設和培訓對績效和控制措施的影響。重點應放在為HMT-AI的具體動態定義新的培訓協議，以及加快風險管理標準和HMT-AI績效評估的發展。

建議2. 應該建立一個專門的HMT-AI認證計劃，以促進行業對為HMT-AI設計的AI系統的設計要求和評估的共識。任務之間的通用性、有效的溝通、性能的一致性以及對新隊友的適應性都應該包括在這樣一個認證計劃中。在開發不足的ISO標準的基礎上，這個認證計劃還應該擴展到過程的可追溯性和決策的問責制，以及評估HMT-AI信任程度的審計機制。這對于抑制HMT-AI中的過度信任和自滿態度是必要的，這種態度維持或擴大了可預測性問題。

建議3. 對國家安全領域的可預測性問題的政策反應應該側重于管理HMT-AI團隊，而不是單獨的AI系統。

建議4. 國家安全領域的HMT-AI的成本效益分析（CBA）應該包括對AI系統的可預測性以及技術和操作層面的相關道德風險的評估。為了促進各安全機構之間的一致評估，應該定義一個評估人工智能系統可預測性的標準量表，在這個量表上，使用（或不使用）人工智能的選擇應該根據上下文的CBA以及考慮公眾對風險和相關利益的態度來證明。這個尺度的定義應屬于獨立的第三方行為者的職權范圍，即與部署HMT-AI的公共機構不同。

建議5. 與其說是 "更多 "或 "更少 "的可預測性，政策建議應側重于可預測性的權衡，明確具體建議旨在解決可預測性問題的哪個方面，以何種方式解決，以及它們有可能加劇哪些方面，哪些緩解措施將被落實到位。政策應該認識到，可預測性是一個多維度的概念，在一個層面上可預測性的收益可能會以另一個層面的損失為代價。

建議6. 關于國家安全中人工智能可預測性問題的政策應該在正式和操作層面上解決可信度和不可預測性之間的聯系。例如，應該給人工智能系統一個可修正的可預測性分數，這應該包括在對系統的可信任度的評估中。人工智能系統的可信賴性應包括成本效益分析，以評估不想要的行為在不同部署背景下可能帶來的風險。

建議7. 應該為不可預測的人工智能建立風險閾值，這些閾值將圍繞不可預測行為的風險嚴重程度映射到其自身的可預測程度（例如，劃分為已知的已知因素、已知的未知因素等）。這些閾值反過來將為風險管理過程的發展提供信息，允許根據風險的可預測性及其影響對其進行優先排序。

建議8. 應該制定一個基于ALARP的框架，以評估不可預測的人工智能和HMT-AI的風險，并為任何給定的環境確定可接受的最大程度的不可預測性。這個框架應該包括:

對特定人工智能系統和HMT-AI的可預測程度的定量評估；
對導致部署人工智能系統的設計、開發和/或采購步驟的可追溯性的評估；
對部署條件的評估，例如，HMT-AI、操作員（或HMT-AI成員）的培訓水平、交互的透明程度、人類對AI系統的控制水平；
對部署該系統的潛在風險和預期收益進行成本效益分析（根據建議4）；
對假設情況的分析，以考慮風險暴露或緩解措施的有效性如何隨部署情況而變化；
人為推翻系統的協議和補救機制。

付費5元查看完整內容

AI與軍事 · 數據融合 · 美國空軍研究實驗室（AFRL） · 軍事推理決策 ·

2023 年 3 月 31 日

[付費5元查看完整內容]《動態數據融合中的可靠推理》美空軍研究實驗室23頁報告

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

長期目標

在決策或推理網絡中進行適當的推理，需要指揮官（融合中心）對每個下屬的輸入賦予相對權重。最近的工作解決了在復雜網絡中估計智能體行為的問題，其中社會網絡是一個突出的例子。這些工作在各種指揮和控制領域具有相當大的實際意義。然而，這些工作可能受限于理想化假設：指揮官（融合中心）擁有所有下屬歷史全部信息，并且可以假設這些歷史信息之間具有條件統計獨立性。在擬議的項目中，我們打算探索更普遍的情況：依賴性傳感器、（可能的）依賴性的未知結構、缺失的數據和下屬身份被掩蓋/摻雜/完全缺失。對于這樣的動態融合推理問題，我們建議在一些方向上擴展成果：探索數據源之間的依賴性（物理接近或 "群體思維"），在推理任務和量化不一定匹配的情況下，采用有用的通信策略，甚至在每個測量源的身份未知的情況下，采用無標簽的方式--這是數據關聯問題的一種形式。

我們還認識到，對動態情況的推斷是關鍵目標所在。考慮到一個涉及測量和物理 "目標 "的傳統框架，這是一個熟悉的跟蹤問題。但是，來自目標跟蹤和多傳感器數據關聯的技術能否應用于提取非物理狀態（物理狀態如雷達觀察到的飛機）？一個例子可能是恐怖主義威脅或作戰計劃--這些都是通過情報報告和遙測等測量手段從多個來源觀察到的，甚至可能被認為包含了新聞或金融交易等民用來源。這些都不是標準數據，這里所關注的動態系統也不是通常的運動學系統。盡管如此，我們注意到與傳統的目標追蹤有很多共同點（因此也有機會應用成熟的和新興的工具）：可能有多個 "目標"，有雜波，有可以通過統計學建模的行為。對于這種動態系統的融合推理，我們的目標是提取不尋常的動態模式，這些模式正在演變，值得密切關注。我們特別建議通過將雜波建模為類似活動的豐富集合，并將現代多傳感器數據關聯技術應用于這項任務，來提取特征（身份）信息。

目標

研究的重點是在具有融合觀測的動態系統中進行可靠推理。

方法

1.決策人身份不明。在作戰情況下，融合中心（指揮官）很可能從下屬那里收到無序的傳感器報告：他們的身份可能是混合的，甚至完全沒有。這種情況在 "大數據 "應用中可能是一個問題，在這種情況下，數據血統可能會丟失或由于存儲的原因被丟棄。前一種情況對任務1提出了一個有趣的轉折：身份信息有很強的先驗性，但必須推斷出身份錯誤的位置；建議使用EM算法。然而，這可能會使所有的身份信息都丟。在這種情況下，提出了類型的方法來完成對局部（無標簽）信念水平和正在進行的最佳決策的聯合推斷。

2.動態系統融合推理的操作點。在以前的支持下，我們已經探索了動態事件的提取：我們已經開發了一個合理的隱馬爾科夫模型，學會了提取（身份）特征，有一個多伯努利過濾器啟發的提取方法 - 甚至提供了一些理論分析。作為擬議工作的一部分，將以兩種方式進行擴展。首先，打算將測量結果作為一個融合的數據流，這些數據來自必須被估計的未知可信度的來源。第二，每個這樣的信息源必須被假定為雜亂無章的 "環境 "事件（如一個家庭去度假的財務和旅行足跡），這些事件雖然是良性的，可能也不復雜，但卻是動態的，在某種意義上與所尋求的威脅類似。這些必須被建模（從數據中）和抑制（由多目標追蹤器）。

3.數據融合中的身份不確定性。當數據要從多個來源融合時，當這些數據指的是多個真相對象時，一個關鍵的問題是要確定一個傳感器的哪些數據與另一個傳感器的哪些數據相匹配："數據關聯 "問題。實際上，這種融合的手段--甚至關聯過程的好方法--都是相當知名的。缺少的是對所做關聯的質量的理解。我們試圖提供這一點，并且我們打算探索傳感器偏差和定位的影響。

4.具有極端通信約束的傳感器網絡。考慮由位置未知、位置受漂移和擴散影響的傳感器網絡進行推理--一個泊松場。此外，假設在這樣的網絡中，傳感器雖然知道自己的身份和其他相關的數據，但為了保護帶寬，選擇不向融合中心傳輸這些數據。可以做什么？又會失去什么？我們研究這些問題，以及評估身份與觀察的作用（在信息論意義上）。也就是說，假設對兩個帶寬相等的網絡進行比較；一個有n個傳感器，只傳輸觀察；另一個有n/2個傳感器，同時傳輸數據和身份。哪一個更合適，什么時候更合適？

5.追蹤COVID-19的流行病狀況。誠然，流行病學并不在擬議研究的直接范圍內，但考慮到所代表的技能以及在目前的健康緊急情況下對這些技能的迫切需要，投機取巧似乎是合理的。通過美國和意大利研究人員組成的聯合小組，我們已經證明，我們可以從當局提供的每日--可能是不確定的--公開信息中可靠地估計和預測感染的演變，例如，每日感染者和康復者的數量。當應用于意大利倫巴第地區和美國的真實數據時，所提出的方法能夠估計感染和恢復參數，并能很準確地跟蹤和預測流行病學曲線。我們目前正在將我們的方法擴展到數據分割、變化檢測（如感染人數的增加/減少）和區域聚類。

付費5元查看完整內容

AI與軍事 · 端到端學習 · 美國空軍研究實驗室（AFRL） · 自動機器學習 · 神經結構搜索 ·

2023 年 3 月 25 日

[付費5元查看完整內容]《通過端到端學習和用戶交互的復雜管道自動合成》美國空軍研究實驗室39頁報告

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

由于多種因素的影響，自動機器學習（AutoML）這些年一直在快速發展，數據科學家需要創建機器學習管道原型來決定如何進行解決，并為非專業人士提供解決方案。已經創建了一些AutoML框架，但它們受到能解決的問題類型、機器學習原語的數量、管道表示語言和嚴格數據描述的限制。這些限制大多是由相當大的工程量造成的。D3M項目旨在擴大AutoML的范圍，提供創建AutoML系統所需的工具，使其能夠解決超出大部分框架的問題類型，并為用戶提供工具，使機器學習工具不需要太多的專業知識。此外，該項目還致力于實現AutoML組件的標準化，以便對不同的框架進行公平的比較，并通過開源共享該項目期間創建的基礎設施來幫助研發界改善該領域。

本文在D3M上的工作主要集中在兩個方面：在D3M小組內創建標準化AutoML工具，以及創建具有不同目的的AutoML系統和框架。在這份報告中，將介紹對該項目的主要貢獻以及AutoML系統的演變。在該項目中，創建了評估AutoML系統的工具，開發了三個AutoML系統，開發了被多個系統廣泛使用的原型，設計了測試原型的自動化框架，并通過創建AutoKeras對AutoML研發界產生了巨大影響。

付費5元查看完整內容

AI與軍事 · 人工智能 · 可解釋人工智能 · 聯合國裁軍研究所（UNIDIR）） · 致命性自主武器 ·

2023 年 3 月 4 日

[付費5元查看完整內容]《揭開黑盒：軍事人工智能的可預測性和可理解性》40頁報告

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

"可預測性 "和 "可理解性 "被廣泛認為是人工智能系統的重要品質。簡單地說：這種系統應該做他們被期望做的事情，而且他們必須以可理解的理由這樣做。這一觀點代表了關于致命性自主武器系統（LAWS）和其他形式軍事人工智能領域新興技術辯論的許多不同方面的一個重要共同點。正如不受限制地使用一個完全不可預測的致命性自主武器系統，其行為方式完全無法理解，可能會被普遍認為是不謹慎的和非法的，而使用一個完全可預測和可理解的自主武器系統--如果存在這樣的系統--可能不會引起許多核心的監管問題，這些問題是目前辯論的基礎。

這表明，最終為解決致命性自主武器系統和其他形式的人工智能在軍事應用中的使用而采取的任何途徑，都必須考慮到有時被稱為人工智能的 "黑盒困境"。事實上，遵守現有的國際人道主義法（IHL），更不用說假設的新法律，甚至可能取決于具體的措施，以確保致命性自主武器系統和其他軍事人工智能系統做他們期望做的事情，并以可理解的理由這樣做。然而，在關于致命性自主武器系統和軍事人工智能的討論中，可預測性和可理解性尚未得到與如此重要和復雜的問題相稱的那種詳細介紹。這導致了對人工智能可預測性和可理解性的技術基礎的混淆，它們如何以及為什么重要，以及可能解決黑匣子困境的潛在途徑。

本報告試圖通過提供有關這一主題的共同知識基線來解決這些模糊不清的問題。第1節和第2節解釋了說一個智能系統是 "可預測的 "和 "可理解的"（或者相反，是 "不可預測的 "和 "不可理解的"）的確切含義，并說明有各種類型的可理解性和可預測性，它們在重要方面有所不同。第3節描述了可預測性和可理解性將成為致命性自主武器系統和其他軍事人工智能在其開發、部署和使用后評估的每個階段的必要特征的具體實際原因。第4節列出了決定每個階段所需的適當水平和類型的可預測性和可理解性的因素。第5節討論了為實現和保證這些水平的可預測性和可理解性可能需要的措施--包括培訓、測試、標準和可解釋人工智能（XAI）技術。結論是為政策利益相關者、軍隊和技術界提出了進一步調查和行動的五個途徑。

本報告的主要要點

人工智能的不可預測性有三種不同的意義：一個系統的技術性能與過去的性能一致或不一致的程度，任何人工智能或自主系統3的具體行動可以（和不能）被預期的程度，以及采用人工智能系統的效果可以被預期的程度。
可預測性是一個系統的技術特征、系統所處的環境和對手的類型以及用戶對它的理解程度的函數。
可理解性是基于一個系統內在的可解釋性以及人類主體的理解能力。一個智能系統可以通過多種方式被 "理解"，并不是所有的方式都建立在系統的技術方面或人類的技術素養之上。
可預測性不是可理解性的絕對替代品，反之亦然。高可預測性和高可理解性的結合，可能是安全、謹慎和合規使用復雜的智能或自主軍事系統的唯一最佳條件。
可預測性和可理解性是自主武器和其他形式的軍事人工智能的必要品質，這在其整個開發、使用和評估過程中有著廣泛的原因。
這些系統中可預測性和可理解性的適當水平和類型將因一系列因素而大不相同，包括任務的類型和關鍵性、環境或輸入數據的種類，以及評估或操作系統的利益相關者的類型。
在軍事人工智能系統中實現并確保適當的可預測性和可理解性的潛在方法可能會涉及與培訓、測試和標準有關的工作。建立XAI的技術研究工作也提供了一些希望，但這仍然是一個新的領域。

付費5元查看完整內容

AI與軍事 · 社交媒體 · 網絡戰 · 美國海軍研究生院 ·

2023 年 2 月 17 日

[付費5元查看完整內容]《從社交媒體上協調的敵對信息活動中預測集體暴力》2022.12最新103頁論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

在沖突發生前預測沖突的能力可以幫助阻止集體暴力的爆發，避免人類痛苦。現有的方法使用統計學和機器學習模型，甚至社會網絡分析技術；然而，它們通常局限于特定區域的長期預測，并且只基于少數語言。從社交媒體中多種或混合語言的信號中理解集體暴力仍然沒有得到充分研究。在這項工作中，我們構建了一個多語種語言模型（MLLM），可以接受社交媒體中任何語言的輸入，這個模型在本質上是語言無關的。這項研究的目的有兩個方面。首先，它旨在從存檔的Twitter數據中收集一個多語言暴力語料庫，使用一套擬議的啟發式方法，說明過去和未來暴力事件周圍的空間-時間特征。其次，它試圖比較傳統機器學習分類器與深度學習MLLMs在預測與過去和未來暴力事件發生有關的消息類別方面的性能。我們的研究結果表明，MLLMs在預測準確性方面大大超過了傳統的ML模型。我們工作的一個主要貢獻是，軍事指揮部現在有了一個工具來評估和學習所有人類語言中的暴力語言。最后，我們公開了數據、代碼和模型。

如今，敵對信息的傳播在互聯網上越來越普遍，尤其是在社交媒體上，這個問題正成為一個全球性的風險。事實證明，"社交媒體的滲透范圍 "對集體暴力的爆發有積極影響（Warren 2015, p. 297），這意味著社交媒體可能為即將發生的暴力信號提供有用的來源。在這篇論文中，我們構建了一個模型，可以接受來自以任何語言編寫的社交媒體信息的輸入，并學習將話語形式與集體暴力事件的時間和地點聯系起來。通過研究以語言無關的方式運作的多語言語言模型（MLLM），我們產生了矢量嵌入，以捕捉更可能出現在暴力事件之前和之后的時期的語義元素。我們的目的是提供一個有用的暴力話語表征，這可能被證明有利于通過社交媒體預測暴力。使用MLLMs的主要動機是它們能夠進行零距離的跨語言遷移學習，在這種情況下，"在一種語言上進行了微調的模型可以應用于其他語言，而不需要任何進一步的訓練"（Tunstall等人，2022，第87頁）。這種能力在社交媒體分析中證明是特別有益的，因為社交媒體分析必須涵蓋廣泛的語言多樣性，以便擴展到全球分析。

我們工作的目的是比較三種MLLMs--LaBSE、smallerLaBSE和XLM-T--的性能，它們被訓練來預測與過去和未來發生的暴力事件有關的消息類別。LaBSE是谷歌開發的一個多語言嵌入模型，它在從維基百科和Common Crawl語料庫（CC）中提取的語料中進行了109種不同語言的預訓練（Feng等人，2020）。Smaller-LaBSE只是LaBSE的一個小版本，參數較少，針對15種語言（Ukjae 2021）。相比之下，XLM-T是一個專門針對100種語言的Twitter數據訓練的MLLM（Barbieri等人，2020）。所有這些模型都可以在Hugging Face Hub上找到，這是一個用于分享自然語言處理（NLP）研究社區開發的模型的開源庫。

我們的實驗結果產生了四個值得注意的發現。第一個發現證實了我們的假設，即推文中的暴力前信號在未來暴力事件發生的地點附近更強。隨機森林（RF）分類器的標簽式接收器操作特征（ROC）圖顯示，接收器操作特征曲線（ROC）--ROC曲線下的面積（AUC）得分隨著空間距離的增加而減少，這表明集體暴力信號的存在在暴力事件發生地附近更強。第二個發現是，在我們的基準中使用的七個不同指標中，集合多標簽分類器是表現最好的傳統機器學習（ML）模型。此外，使用問題轉換方法訓練的合集模型不僅比它們的問題適應性更好，而且計算速度也更快。同樣，從XLM-T中提取的特征比LaBSE和更小的LaBSE產生更好的性能。因此，表現最好的傳統ML算法是在XLM-T特征上訓練的隨機森林（RF），ROC-AUC分數為0.6028。

第三個發現表明，當前饋分類器在較小的LaBSE、LaBSE和XLM-T的基礎上進行訓練時，它們在ROC-AUC得分方面產生了相似的表現，每個得分大約為0.73。在內存占用方面，由于較小的詞匯量和較少的可訓練參數，smaller-LaBSE是表現最好的模型。最后，第四個發現，也就是前兩個發現，深度學習MLLMs比傳統ML模型的表現要好得多，通過ROC-AUC分數顯示，樣本外的預測準確性要高13%。這最后一個證據表明，在預測哪些形式的話語與集體暴力關系最密切方面，深度學習MLLMs比傳統ML模型表現更好。

我們的結果表明，社交媒體內容和過去的集體暴力事件之間存在著預測關系，無論對話中使用的是什么語言。我們認為，我們的研究可以作為軍隊中有用的決策輔助工具，在戰爭的作戰和戰略層面上預測全球范圍內的暴力。我們工作的一個主要貢獻是，軍事指揮部現在有一個工具來評估和學習所有人類語言中的暴力語言，從而減少社交媒體中敵對信息運動的負面影響。最后，我們將代碼、數據和模型公開在//huggingface.co/m2im/，希望這能幫助研究界推進其在沖突預測方面的努力，此外還能使我們的作戰人員將該模型作為一種工具來加強對信息環境的理解。

付費5元查看完整內容

AI與軍事 · 北約 · 研究、概念開發和實驗 ·

2023 年 1 月 7 日

[付費5元查看完整內容]《防御分析、概念開發和實驗：面向未來的創新》北約387頁技術手冊

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

盟軍最高司令部轉型的能力發展局的一項關鍵任務是推動北約的創新。這是通過挑戰現狀，克服組織思維定式，審視變革的長期利益，以及審查哪些變革是可能的及其相關的效果和影響的長期視角來實現的。有大量的工具可以用來點燃創新，如研究、概念開發和實驗（CD&E），以及增加與來自不同國家、學術界和工業界的專家的聯系。

世界范圍內日益具有挑戰性和快速發展的安全環境，再次強調了測試和實驗新能力的重要性，以便迅速向用戶提供這些能力，或者盡早失敗。本卷介紹了一些發人深省的章節，并闡述了廣泛主題的CD&E經驗。

第一章是重點是CD&E的誕生和需求；探討了CD&E的想法是如何演變的，它作為一項政策和一個過程的意義是什么，以及CD&E目前是如何應用的。在第二章中，強調了旨在克服 "無政府狀態 "問題的CD&E方法的要求，并討論了CD&E定義中 "分析 "的遺漏。它描述了瑞典武裝部隊在實施改革期間對該方法的經驗。這一章指出了科學方法在更復雜的情況下進行實驗的局限性。它提出了一種不同的方法，說明了文化和認知上的差異，此外還建立了對知識的積累和使用的另一種看法。將心理學的見解帶到CD&E過程中，努力減少參與該方法的工作人員的各種限制，并使后者更加有效和富有成效。

還介紹了國家的觀點，如Van Hoeserlande中校講述了比利時在CD&E方面的經驗，作者將能力和概念發展的應用與一種新文化的出現聯系起來，在這種文化中應該啟動和闡述這一過程。馬佐中校提供了一個北約的例子，他闡明了作戰分析和作戰試驗在北約行動后勤鏈管理（OLCM）計劃中的作用，以及他們對建立統一的業務流程模型（U-BPM）的貢獻。對CD&E的評估進行了概述，作為一種可審計的證據線索，重新思考經常被視為次要事件鏈的CD&E的評估。

隨后，介紹了各種技術和分析方法。向讀者介紹了桌面實驗（TTE）的適用性和有用性，解釋了它們的結構、目標以及它們在特定的軍事和科學背景下確定能力要求的總體效果。埃里克先生和帕林博士的章節通過介紹英國 "城市戰士5號 "實驗的具體情況，強調了單個模擬設計的優勢和劣勢，對桌面實驗中使用的測試和方法這一主題做出了貢獻。介紹了概念測試方法，并強調其重要性、廣泛的適用性，并概述了構成概念測試成功過程的主要特征。補充了概念測試和桌面實驗的重要性，強調了CD&E過程和三種不同類型的桌面評估游戲的價值："能力評估游戲"、"顛覆性技術評估游戲"、"概念發展評估游戲"。著重介紹了形態分析克服傳統簡化系統所具有的弱點，為國防決策帶來的優點。強調了對CD&E進行更多實證研究的必要性，這將填補文獻中存在的空白。此外，這些研究提供了一種被稱為 "防御估計成本模型 "的方法，實驗中的專業人士可以在不同部門的分析中使用。

本卷的最后一章加強了CD&E對國防規劃過程的意義，劃定了哪些要素使CD&E成功，并討論了這種方法在充滿挑戰的當代世界的未來。

付費5元查看完整內容

AI與軍事 · 美國陸軍研究實驗室（ARL） · 人機協作 · 內聚性 ·

2022 年 12 月 1 日

[付費5元查看完整內容]《人類-自主團隊的內聚力：未來研究的一種方法》美國陸軍2022最新58頁報告

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

內聚力是團隊的一個重要屬性，它可以影響個人隊友和團隊成果。然而，在包括自主系統作為隊友的團隊中，內聚力是一個未被充分探索的話題。我們研究了關于人類團隊內聚力的現有文獻，然后在此基礎上推進對人類-自主系統團隊的內聚力的理解，包括相似性和差異性。我們描述了團隊的內聚力，各種定義、因素、維度以及相關的好處和壞處。我們討論了當團隊包括一個自主性的隊友時，該元素可能會受到怎樣的影響，并進行了逐一描述。最后，我們確定了可能與內聚力有關的人類-自主性互動的具體因素，然后闡述了對推進有效的人類-自主性團隊的科學至關重要的未來研究問題。