特警力量全集免费观看,精品自在线观看影片天天看

**2025 年 8 月 7 日，OpenAI 發布《GPT-5 System Card》（下稱 Card）。這是一份 50+ 頁的“白皮書”——既是模型能力的答卷，也是安全治理的藍圖。相比以往系統卡，GPT-5 在 架構形態、推理范式、安全框架 上都有質的躍遷，足以成為 AI 產品經理、技術決策者與政策觀察者的必讀材料

統一系統架構：GPT-5是一個整合了快速響應模型、深度推理模型和實時路由模型的統一系統，可根據對話類型、復雜度等自動選擇最優模型，未來計劃整合為單一模型。
安全訓練革新：從傳統的“硬拒絕”（直接拒絕風險請求）轉向“安全完成”（在符合安全政策的前提下最大化有用性），大幅提升雙用途場景（如生物、網絡安全）的安全性和有用性。
關鍵能力提升：在減少幻覺（ factual errors）、降低諂媚行為（sycophancy）、抵御越獄攻擊（jailbreaks）、增強指令層級遵守能力等方面取得顯著進步，尤其在健康、多語言處理等領域表現突出。
嚴格外部評估：通過超過400名外部測試者和專家的紅隊測試（累計超9000小時），在暴力攻擊規劃、提示注入等風險場景中驗證了安全性，多個外部機構（如Microsoft AI Red Team、Pattern Labs）評估其安全性優于前代模型。
生物與網絡安全防護：將GPT-5-thinking列為“高生物與化學風險”等級，實施多層防護措施（模型訓練、系統級監控、賬戶級 enforcement、API訪問控制等），并通過第三方紅隊和政府機構測試驗證有效性。

付費5元查看完整內容

相關內容

GPT-5

關注 0

AI與軍事 · 蛛網行動 · 反無人機 ·

7 月 23 日

[付費5元查看完整內容]《蛛網行動分析及反無人機作戰的經驗啟示-印度視角》最新36頁報告

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

短短25天內接連發生的兩場重大行動——印度次大陸的"辛杜爾行動"與歐亞戰場的"蛛網行動"，共同昭示著同一教訓：無論目標縱深、距離或性質如何，低成本無人機的威脅已呈無孔不入之勢。反無人機系統（C-UAS）網格由此不再是尖端技術的展示品，而成為保護軍事、政府及民用關鍵資產的絕對必需品。C-UAS威脅在2023年俄烏戰爭期間隨著易組裝的"第一人稱視角（FPV）無人機"問世呈幾何級放大。這些近乎手工制造的巡飛彈藥支持者自2023年起不斷重申同一信條："大不再美"。然而全球多數軍隊既未讀懂亦未準備接受這一新威脅的復雜性。當俄軍戰略空軍基地針對大型空中威脅嚴陣以待時，烏軍卻以低成本小型無人機創新性規避所有現役防御手段，對三年來造成數千烏克蘭傷亡的戰略轟炸機群實施精確打擊。

本簡報將深入剖析代號"蛛網行動"——這場基于FPV無人機、最具不對稱性與技術復雜性的精確打擊突襲行動——的策劃與執行過程，系統梳理普適性經驗教訓，并著重研判其對印度反無人機網格建設的啟示。本簡報對"蛛網行動"的詳細分析獲反無人機專家帕萬·卡卡爾（Jugapro公司首席執行官兼創始人）及蘇霍拉科技公司地理空間情報（GEOINT）團隊的技術支持。

付費5元查看完整內容

AI與軍事 · 無人水面航行器 ·

6 月 14 日

[付費5元查看完整內容]《水域智能平臺母艦系統》24頁最新手冊

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

本基礎手冊展示前所未有的創新性海上軍事防御系統。推出首款水域智能平臺母艦系統（Hydronescarrier）及其配套的多型水域智能平臺，這些構成Hydronescarrier軍事裝備體系的核心組件。本手冊旨在全面闡述該新型軍事防御系統的特性與功能，其可高效遂行攻防作戰任務。Hydronescarrier集成人工智能系統、自主防御系統、能源系統及智能控制系統，形成復雜動態防御體系，能為戰略區域（包括遠距離目標）提供即時高效防護。出于國家安全考量，部分技術參數不予公開。此外，本手冊將介紹“神經元無人機決策盒”（NeuronDrone-Box）與“超級神經元無人機決策盒”（MegaNeuronDrone-Box）：涵蓋硬件架構、核心算法及新型特種軍用“水域無人機”（Hydrone）。特別說明：本手冊所有算法均基于“混沌理論”與“經濟地形學”。后續將展示突破性原型系統：MAR107X水域智能平臺、MAR107Y水域智能平臺及MAR107Z水域智能平臺，三型平臺的技術特性與應用場景詳見本技術報告。實際上，我們主張在軍用無人機系統決策盒（The NeuronDrone-Box）中應用“全自主人工智能”攻防決策體系，以控制接入該系統的Hydronescarrier——該系統通過神經元無人機決策盒實現攻防決策全自主化。

Hydronescarrier系統導論

本手冊作為國家海洋平臺防御系統（NSPD-System）組成部分，推出首款水域無人機母艦原型Hydronescarrier。該新型海上防御概念依托大型平臺構建（寬65英尺/長100英尺/高15英尺）。平臺甲板精確劃分區域，部署水域智能平臺、雷達、天線、導彈、艦炮、散熱風扇及分布于不同艙位的電池與充電設備（詳見下方8幅圖庫及1部視頻）。頂層甲板設置五條大型可旋轉盤式軌道：軌道1配置8臺MAR107X型水域智能平臺，執行快速打擊偵察與搜救；軌道2配置16臺MAR107Y型水域智能平臺，承擔軍需物資輸送；軌道3部署31臺MAR107Z型水域智能平臺（含自殺式攻擊型與輕型火炮型），執行攻防任務。各軌道可高速運轉實現多型平臺集群化起降。同步配置四部升降機用于停放平臺，另四部專司平臺出動。每條軌道下方設微型運輸車軌道系統，保障平臺起降安全。

平臺頂層通過旋轉軌道部署55臺戰備水域智能平臺，停泊區另置10臺。8部升降機在平臺起降前將其轉運至獨立隔艙，另有8部升降機可同時運送16臺平臺實施高效快速投送。所有水域智能平臺均搭載人工智能系統，配備輕型彈藥、導彈及高威力炸彈（詳見下方8幅圖庫及1部視頻）。各層設有多處應急通道，支持電力或手動控制以應對緊急狀況。為深化理解新型水域智能平臺群組，本手冊第四章提供詳細說明。每臺平臺均配置專屬神經元無人機決策盒（NeuronDrone-Box），使其能基于艦載高功率雷達/天線（位于母艦四角）及衛星圖像信號實施自主攻防。

Hydronescarrier主體結構采用輕質高強特種材料，中部配置兩組持續接受太陽能充電的超級電池組，為大型電機、平臺充電樁（自動為泊位平臺充電）、照明系統、計算機系統、散熱風扇、雷達及母艦“主控中樞”供能。該中樞系統由70臺水域智能平臺通過超級神經元無人機決策盒（Mega-NeuronDroneBox）協同操控，本手冊以數學建模與圖形化方式闡述其編程邏輯。超級神經元無人機決策盒統管內部系統（自動駕駛、推進動力、雷達、指令集、母艦定位、能源管理）及外部系統（水域智能平臺集群）。

艦體配置兩臺大型風扇維持恒溫環境，尾部雙電機推進器確保持續航速，保障這座搭載70臺水域智能平臺的巨型結構在各類海況下保持穩定平衡。需著重說明：所有平臺均由軍用無人機“全自主人工智能攻防決策系統”統一管控。

本報告詳述Hydronescarrier原型機的突破性軍事特性與應用場景：主張通過戰略布局將裝備與平臺集成至母艦主體結構；作為國家海洋平臺防御系統創新設計載體，配備五套導彈系統——兩套跨洲際遠程導彈、一套洲際中程導彈及百枚五公里射程近程導彈（貯于艦體內部）。人工智能系統實施預先縝密評估，保障導彈全天候全域高效作戰。秉持可持續發展理念，母艦搭載太陽能板持續為雙電機、無人機充電設備及計算機系統供能。Hydronescarrier可同時運載七十臺水域智能平臺、重型彈藥、炸彈及五型導彈系統，其多功能特性使其成為遂行多樣化軍事與國家緊急任務的必備裝備。

付費5元查看完整內容

AI與軍事 · LINK 22 ·

2024 年 12 月 26 日

[付費5元查看完整內容]《北約改進型Link Eleven (NILE) LINK 22：信息指南（CIG）》39頁報告

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

本《NILE/Link 22 客戶信息指南》（CIG）由北約改進型Link Eleven（NILE）項目管理辦公室（PMO）代表 NILE 指導委員會（SC）提供，以幫助有意通過獲取 NILE 產品來獲得 Link 22 能力的潛在第三方銷售（3PS）國家。加拿大、法國、德國、意大利、西班牙、英國和美國政府簽署了一份諒解備忘錄（MOU），共同開發和維護必要的核心產品，以滿足北約對 Link 22 的要求。這七個國家被稱為 “NILE 國家”。荷蘭是諒解備忘錄的最初參與者之一，因此對最初在該項目中開發的一些知識產權擁有合法權利。Link 22 目前已在幾個 NILE 和Link 22 伙伴國投入使用，國際測試和實施工作仍在繼續。根據 NILE 諒解備忘錄和 NILE 3PS 文件，所有參與方（即 NILE 國家）都有權在其他參與方一致同意的情況下，向第三方出售或轉讓 NILE 前沿信息（NILE 項目開發的軟件、硬件和/或文件）。第三方(3P)是指其政府或其實體不是 NILE 諒解備忘錄參與方的任何個人或其他實體。潛在 "3PS 國家是有興趣申請獲得 NILE 產品的國家/實體。3PS國家是指已獲NILE國家和荷蘭批準接收NILE產品，但仍在根據美國FMS程序進行COMMSEC審批和/或尚未支付所有征稅和BCR費用的國家/實體。鏈接 22 伙伴國是指已獲準接收 NILE 產品和美國 FMS 程序規定的 COMSEC，并已支付所有征稅和 BCR 費用的國家。第 3 節將詳細討論所需費用。本文件概述了 “Link 22”，并就如何獲得由NILE國家資助并由NILE項目管理辦公室管理的NILE產品（附件B，第一部分）提供了指導。

本《NILE/Link 22 客戶信息指南》（CIG）簡要介紹 Link 22 系統的技術概況，更詳細的信息可參閱《Link 22 指南》。

Link 22 的設計采用了分層通信堆棧方法，以產生一個開放式系統架構，各組件之間有明確定義的接口。這種方法最大限度地擴展了系統，并使多個供應商都能作出貢獻。下圖 1 中的灰色內框表示 NILE 通信設備（NCE）系統組件，由以下部分組成：

a. 系統網絡控制器（SNC）；

b. Link 22 現代化鏈路級 COMSEC（LLC 7M）；

c. 信號處理控制器 (SPC)；以及

d. 無線電。

圖 1 中綠色外框所示的 “Link 22 ”系統由 NCE 和數據鏈路處理器（DLP）的 “Link 22 ”部分組成。在 DLP 中，Link 22 系統包括與 SNC 的接口，以及處理系統在數據鏈路上收發的戰術信息。ATDLP-5.22 中定義了戰術信息。DLP 連接到戰術數據系統 (TDS)，也稱為 NILE 單元 (NU) 的主機系統，或者說是 TDS 的一部分，TDS 處理接收到的戰術信息，并根據單元的國家要求生成用于傳輸的戰術信息。此外，還需要一個符合 Link 22 要求的時間（TOD）源。

所有 NILE 接口規范和 SNC 均由 NILE國家共同定義、設計和開發。美國完成了 LLC 7M 的開發，國家安全局（NSA）于 2016 年 2 月對該單元進行了認證。開發或購買所有其他 Link 22 子系統，包括 TDS/DLP、TOD、SPC 和無線電，以及集成所有子系統以獲得可運行的 Link 22 系統，都是國家負責。

Link 22指南第 1 章詳細比較了Link 22與北約和非北約國家在全球實施的另外兩條戰術數據鏈路（TDL），即Link 11和Link 16。關于Link 22的一個重要說明是，它的設計和建造是為了取代Link 11和補充Link 16。具體而言，Link 22的主要改進包括

a. 無需衛星，通過高頻（HF）和超高頻（UHF）視線（LOS）即可進行視線外（BLOS）通信；

b. 對于超高頻媒體，有兩種不同的傳輸模式：固定頻率（FF）或電子保護措施（EPM）模式下的跳頻，提供抗干擾功能；

c. 多種波形，在彈性和吞吐量之間提供不同的折衷，以適應各種傳播條件；

d. 利用現有網絡在超級網絡中的所有 NILE 單元（NU）之間進行自動中繼，無需空中中繼；

e. 一個超級網絡最多可有 8 個網絡和 125 個單元。超級網絡中的每個網絡可使用任何媒體和傳輸模式組合；

f. 每個單元最多可同時參與四個網絡；

g. 網絡管理高度自動化，相對簡單，包括動態帶寬分配等功能；

h. 不使用網絡控制站（NCS）。設計上沒有單點故障；

i. Link 22報文是 J 系列（特別是 F 和 F/J 報文）的一部分。與 Link 11 相比，Link 22 使用與 Link 16 相同的數據字典，因此翻譯和轉發相對容易；

j. 通過使用與 Link 16 相同的數據字典，數據項的范圍和粒度得到了改進；例如大地測量（緯度/經度/高度）；

k. 無節點時分多址（TDMA），無網絡時間參考（NTR）；

l. 用于擁塞管理的動態時分多址（DTDMA）；

m. 采用 LLC 7M COMSEC，使用完整性和基于時間的加密技術確保安全；

n. 速率：單個 UHF 網絡高達 12,666 bps/單個 HF 網絡高達 9,600 bps；2 個 UHF 和 2 個 HF 網絡高達 44,532 bps；傳輸距離超過 1000 nm；

o. LNE （晚入網）功能；

p. 尋址機制（即全播、鄰播、任務區子網（MASN）、2 至 5 單元動態列表或點對點）；

q. 傳輸請求 (TR) 優先級，以減少重要信息的擁塞延遲；以及

r. 根據鏈路質量自動重傳，提供所要求的信息接收概率。

付費5元查看完整內容

AI與軍事 · 指揮與控制 ·

2024 年 11 月 13 日

[付費5元查看完整內容]《指揮與控制協作沙盤 (C2-CST) -美海軍創新科學與工程 (NISE) 項目》66頁報告

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

美太平洋海軍信息戰中心（NIWC Pacific）的海軍創新科學與工程（NISE）微型基金項目 “指揮與控制協作沙盤（C2-CST）”研究了一種新的商用現貨（COTS）產品--微軟 HoloLens。該項目旨在為具有協作分類級別的指揮與控制 (C2) 系統研究一種新的人機界面。微型基金項目是一個小型資助項目，可快速周轉，用于探索科技（S&T）創意。這些想法將在很短的時間內得到實施，并產生最終的技術演示、概念驗證、原型或報告，具有高風險和高回報的潛力。

被選為評估人機界面的 C2 系統是采用自適應協作/控制技術的智能多 UxV 規劃系統（IMPACT），這是三軍研究實驗室之間的一個自主研究試點計劃（ARPI）項目。建立 IMPACT 的目的是展示戰術決策、任務管理和控制的靈活性，其關鍵要素是使異構無人飛行器 (UxV) 團隊能夠成功管理 “戰爭迷霧 ”及其固有的復雜、模糊和時間挑戰條件。IMPACT 的應用研究以監督控制和戰術機器學習為基礎，結合了靈活的戰術召喚、雙向人機互動、“全局 ”合作控制算法和 “局部 ”自適應/反應能力。

微軟 HoloLens 是一種增強現實設備，它有一個通向現實世界的透視鏡，上面疊加了計算機圖形。該設備的操作者可以通過注視、手勢和語音進行交互，同時在任何定義的演示空間中將基于 C2 的虛擬場景可視化。這種新的用戶界面模式為研究人機界面的有效性提供了前提，如附加或替代現有的 C2 人機界面。

C2-CST 項目概念通過增強現實設備平臺與 IMPACT 系統連接和互動。IMPACT 系統是一個研究原型，展示了人類對多個自主無人駕駛車輛的監督控制，因此是開發和測試高級用戶界面的理想 C2 系統終端目標。其目標是允許人與人之間、人與機器之間進行協作，以便對模擬的多無人異構自主飛行器進行態勢感知、決策以及 C2 規劃和執行。先進的用戶界面允許多名操作員通過共享的全息沙盤（用于軍事規劃和戰爭游戲的地形模型）進行協作，同時控制多輛無人駕駛車輛。我們利用多個網絡框架來卸載車輛自主性和規劃算法的計算，同時讓微軟 HoloLens 作為人機界面元素運行得更加流暢。此外，還研究了偽分類信息過濾的概念。這允許在微軟 HoloLens 界面中對每個用戶應用分級，同時共享相同的虛擬環境或全息表示。這一概念在共享環境中展示了 “需要知道 ”的分類前提。可視化、互動、人與人、人與機器之間的協作，以及具有過濾分類級別的共享空間，都決定了這種先進的用戶界面在 C2 系統中的潛在優勢。

付費5元查看完整內容

AI與軍事 · 戰區支援導彈 · 大國競爭 ·

2024 年 10 月 1 日

[付費5元查看完整內容]《一種戰爭武器：常規戰區支援導彈常態化的戰略價值》50頁報告

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

本專著探討了在戰場上重新引入戰區支援導彈 (TSM)——射程在 500 至 5,500 公里之間的地對地導彈。《中程核力量條約》于 2019 年失效，這為將這種以前被禁止的導彈納入美國軍事戰略提供了依據。然而，TSM 的潛在復蘇對大國的影響并不相同，美國、俄羅斯和中國將采取不同的管理方式。因此，本專著評估了常規武裝型號的常態化（使導彈成為公認的戰爭工具）是否為美國提供了相對于其競爭對手的相對戰略優勢。反過來，本研究概述了 TSM 常態化的理論基礎，研究了美國當前的導彈發展計劃，最后分析了美國部署這些導彈將如何影響歐洲和太平洋戰區。總體而言，本專著的結論是，雖然歐洲的 TSM 常態化并不能為美國提供相對于俄羅斯的相對戰略優勢，但太平洋戰區 TSM 常態化的利大于弊，并為美國提供了相對戰略優勢。

盡管美國在戰術上可以從 TSMs 正常化中獲益--美國似乎正沿著這條道路狂飆突進--但這并不是沒有具體的地區注意事項和無形的戰略風險，美國必須加以考慮。因此，本專著通過對特定地區進行精確分析，強調了歐洲戰區和太平洋戰區的對比情況。進而得出結論，雖然在歐洲實現 TSM 正常化并不能為美國提供相對于俄羅斯的戰略優勢，但在太平洋戰區實現 TSM 正常化的好處大于風險，并能為美國提供相對戰略優勢。未來，最后一節將為美國提供建議，利用導彈正常化的理論基礎來降低不必要的升級風險，并對其正常化論述產生積極影響。

假設美國決定繼續走TSM正常化道路。在這種情況下，決策者須考慮利用相關理論來減輕核升級的風險，并掌控國際敘事。雖然本專著中介紹的不同理論并非詳盡無遺，但通過對雙重用途困境、核禁忌和內涵的應用進行研究，我們可以就 TSM 正常化提出切實可行的建議。

首先，也是最緊迫的是雙重用途困境，因為它是導彈正常化的主要障礙。導彈的模糊性不僅可能限制美國的戰略選擇，還可能導致沖突升級。雖然解決軍民兩用難題的最直接方法是外交協議，但這一解決方案仍然依賴于信任--在戰爭期間，信任是一個具有挑戰性的概念。因此，除外交途徑外，研究識別飛行中的導彈是否為核導彈的技術手段的可行性也很有價值。雖然從表面上看，這種解決方案似乎無法實現，但技術解決方案可能是克服雙重用途困境的唯一手段，值得投入資金。

其次，與雙重用途困境帶來的挑戰相比，美國可以利用核禁忌來支持 TSM 正常化。雖然美國已經通過在其擁護的政策中強調使用核武器的后果來加強核禁忌，但即將發布的《國家核戰略計劃》（NPR）提供了一個闡述或修改其核戰略的場所。具體來說，如果國防規劃者認為常規 TSMs 有可能大幅改變常規威懾，那么美國不首先使用核武器政策的缺失就值得重新評估。如果美國宣布不首先使用核武器的政策，或者甚至朝這個大方向邁進，將表明美國對核禁忌的承諾，并能部分緩解雙重用途困境所帶來的挑戰。反過來，這一決定也將加強任何TSM正常化論述的可信度。

美國面臨的最后一個理論挑戰是改變 TSM 的核內涵。然而，雖然軍民兩用的困境和核禁忌可以通過實際行動來解決，但改變國際社會對導彈的看法卻是一項更加模糊的工作。美國可將新型導彈納入一項更廣泛的戰略，以打破冷戰烙印并解決認知問題。在這種情況下，軍方可以首先將常規 TSMs 的作用編入其理論，并將新型導彈納入多國演習。此外，刻意避免使用 “中導射程”、“不符合中導標準 ”等喚起冷戰記憶的語言，甚至只是將這些武器重新定義為火箭而非導彈，都有可能使 TSM 克服內涵問題，成為一種新的能力而非卷土重來的能力。

未來，上述研究結果提出了值得進一步研究 TSM 正常化的問題。首先，美國軍方必須研究新出現的理論在多大程度上依賴于新的遠程火力技術--由常規裝備的 TSM 所取代。假設這種新興理論的核心是用地對地導彈擊敗 A2/AD 系統。在這種情況下，美軍必須考慮采用其他可能的非動能手段來解除這些系統的作戰能力，尤其是在歐洲戰場。反過來，美軍未來的理論也不能依賴于那些假定可隨時用于突發事件的技術，而實際上，國家可能會將其降級為威懾作用。其次，繼續走正常化道路的決定會對歐洲和太平洋戰場產生直接的政策影響。鑒于俄羅斯等各國都不希望美國發展和部署裝備常規武器的 TSMs，因此必須進行分析，以確定針對上述正常化的讓步（如果有的話）能為美國提供什么籌碼。具體而言，此類研究須考慮到俄羅斯與烏克蘭之間不斷惡化的局勢等安全因素。最后，必須對正常化行動方案的可行性進行評估。與本專著類似，對兩個戰區的詳細研究可以闡明美國導彈的潛在部署地點，以及每個東道國在支持有爭議的武器系統長期部署方面將面臨的挑戰。

總體而言，TSM 常態化是美國已經開始實施的行動方案。因此，如果與對手的反應相平衡，這是一條能為美國帶來戰略利益的道路。就歐洲戰場而言，美國須重新考慮與俄羅斯達成禁止部署 TSM 的協議，因為其正常化并不能為美國帶來相對優勢。重要的是，這種外交行動可以挽救該地區的類似現狀。在太平洋戰區部署常規 TSMs 則會極大地改變軍事形勢，提升美國的地位。反過來，只要新型導彈的部署是平衡的，不會過度與大國對立，那么常規 TSMs 在太平洋戰區的逐步引入就為美國提供了相對于其崛起的競爭對手的戰略優勢。

付費5元查看完整內容

AI與軍事 · B-52H “同溫層堡壘” ·

2024 年 9 月 29 日

[付費5元查看完整內容]《B-52H “同溫層堡壘”核能力轟炸機：指南》最新241頁報告

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

本報告的主要目的是提供B-52H “同溫層堡壘”轟炸機可靠、權威和透明的信息，說明美國空軍現役機隊（截至 2024 年中期）的 76 架 B-52H 飛機中，哪些能夠運載核武器，哪些只能運載常規、非核武器。

對于 B-52 東道國的政府和公民來說，獲得有關引進具備核能力的運載平臺和核武器本身的權威、易獲取的信息，對于負責任的決策和問責至關重要。迄今為止，在公共領域還沒有關于這兩方面的系統、可靠和透明的信息。

具備核能力的運載平臺的存在是任何國家引進遠程戰略核武器的必要條件，但顯然不是充分條件。如果一個國家在引進核武器方面沒有公開的政策或法律障礙，那么接納一個盟國的核能力運載平臺就幾乎等同于部署核武器，并為參與核武裝行動創造了可能性。

B-52 和 B-2 轟炸機是美國核三要素中唯一經常定期部署到美國以外盟國東道國領土上的機型。雖然所有 B-2 “幽靈”轟炸機都能同時裝備核武器和常規武器，但美國空軍現役 B-52H 機隊由 46 架具備雙重能力的飛機和 30 架僅裝備常規武器的飛機混合組成，使其部署的戰略影響更加模糊。

由于美國的長期政策是既不確認也不否認美國艦艇、潛艇或飛機上核武器的存在，因此與美國結盟的政府及其公眾無法獲知他們是擁有嚴格限于常規戰略行動的 B-52 轟炸機，還是擁有可能使其國家卷入美國核任務的雙重能力飛機。

美國空軍計劃在澳大利亞最北部的廷德爾空軍基地前沿基地部署多達六架 B-52H 飛機。

雖然 B-52 轟炸機和其他美軍飛機已經定期訪問澳大利亞，但計劃在廷德爾空軍基地部署的同時，還將進行前所未有的基礎設施擴建項目，這標志著現有的以聯合訓練演習和加強互操作性為中心的空中合作安排將轉向以戰略行動和從澳大利亞領土發起的潛在空戰任務為重點，其中可能包括核任務。

付費5元查看完整內容

OpenAI o1 · 大模型 · 強化學習 ·

2024 年 9 月 15 日

[付費5元查看完整內容]《OpenAI o1大模型》中英文技術報告，44頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

北京時間 9 月 13 日午夜，OpenAI 發布 o1 系列模型，旨在專門解決難題。OpenAI o1 在數學、代碼、長程規劃等問題上取得了顯著提升，而背后的成功最重要離不開后訓練階段 (Post-Training Stage) 中強化學習訓練和推理階段思考計算量的增大。新的擴展律 —— 后訓練擴展律（Post-Training Scaling Laws）已經出現，并可能引發社區對于算力分配、后訓練能力的重新思考。

技術原理：

大規模強化學習算法 OpenAI 使用了一種大規模的強化學習算法，來訓練 o1-preview 模型。該算法通過高效的數據訓練，讓模型學會如何利用“思維鏈”（Chain of Thought）來生產性地思考問題。模型在訓練過程中會通過強化學習不斷優化其思維鏈，最終提升解決問題的能力。 OpenAI 發現，o1 模型的性能會隨著強化學習時間（訓練時計算量）和推理時間（測試時計算量）的增加而顯著提高。這種基于推理的訓練方式與傳統的大規模語言模型（LLM）預訓練方式不同，具有獨特的擴展性優勢。

o1 性能在訓練時間和測試時間的計算中都平穩提升思維鏈（Chain of Thought） o1-preview 模型通過思維鏈推理顯著增強了其在復雜推理任務中的能力。思維鏈的基本理念類似于人類思考困難問題的過程：逐步分解問題、嘗試不同策略并糾正錯誤。通過強化學習訓練，o1-preview 能夠在回答問題前進行深入思考，逐步細化步驟。這種推理方式大幅提升了 o1-preview 在復雜任務中的表現。例如，o1-preview 能夠通過思維鏈識別問題中的關鍵步驟并逐步解決。這種推理模式特別適用于需要多步驟推理的任務，如復雜的數學問題或高難度編程任務。舉例說明： * 在某些復雜問題上，o1-preview 能夠逐步打破問題的難點，最終找到正確解答。這與人類面對挑戰性問題時逐步分析的思維方式非常相似。

中文版：

付費5元查看完整內容

全球空中作戰計劃（GCAP） · AI與軍事 ·

2024 年 7 月 23 日

[付費5元查看完整內容]《“全球空中作戰計劃”（GCAP）分析》

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

“全球空中作戰計劃”（GCAP）旨在建立持久的防務關系，加快先進軍事能力和技術優勢的發展，深化科技合作，整合供應鏈，進一步加強三國的國防工業基礎。雖然 GCAP 是一項雄心勃勃的計劃，也是聯合安全架構的偉大政策，但需要記住，世界各地的此類戰斗機項目都面臨著各種問題，比較接近的是印度-俄羅斯的第五代戰斗機（FGFA）計劃或法國、德國和西班牙的未來戰斗航空系統（FCAS）。本文簡要分析了 GCAP 的范圍和挑戰，以及它能否成為一個成功的項目，而不是變成一個失敗的項目。

啟動GCAP的原因

GCAP 是一項三邊飛機研發計劃。三國都有自己獨特的安全關切和要求以及外交政策目標。日本希望與項目時間框架與日本部署戰斗機的時間框架相匹配的國家開展聯合合作。因此，日本選擇了英國 BAE 系統公司作為合作伙伴，而不是美國洛克希德-馬丁公司，因為 F-X 和 “狂風 ”項目的發展時間表是一致的。預計到 2035 年，GCAP 項目將取代日本航空自衛隊（JASDF）現有的 F-2 戰斗機。

日本希望以較低的成本研制出一種更先進的飛機，能夠與美國的 F-35 相媲美，并具備先進的傳感器和網絡能力。為了保持空中優勢，日本希望獲得一種大型多用途隱形戰斗機，它具有較長的巡航距離和雙引擎，導彈裝載能力極強。其次，研發新型戰斗機的成本巨大，單靠一個國家難以承擔。因此，通過與英國和意大利合作來降低研發和技術成本是合理的。

此外，日本希望在未來的改裝中獲得一定程度的自由。因此，日本希望獲得源代碼，以便對武器、控制系統等進行本地化的獨立升級。這也將有助于其未來根據東南亞國家的要求出口該噴氣機的計劃。日本的這一決定是對其通過的三項重要政策的補充，即國家安全戰略（NSS）、國防計劃指南（NDPG）和中期防衛計劃（MTDP），后者涵蓋了五年內的國防開支。鑒于俄羅斯、朝鮮等的威脅，日本首相岸田文雄和他的政府誓言增加國防開支和能力，包括獲得反擊能力，使日本能夠對攻擊日本的國家在其領土上的基地和設施進行報復。

在歐洲方面，英國和意大利正在聯合開發 “狂風”，作為未來空中作戰系統（FCAS）的一部分，其中包括與無人機（UAV）和創新數據系統合作的計劃。作為一個海洋國家，英國希望獲得與日本所要求的類似的性能，包括發射高超音速導彈和定向能武器（DEW）的能力。GCAP 預計將在 2040 年后取代英國和意大利現有的歐洲戰斗機 “臺風 ”機隊。

GCAP 的范圍

GCAP 計劃在許多方面都是史無前例的。這是日本首次選擇美國以外的合作伙伴，這在二戰后日本選擇完全作為和平主義國家與美國達成安全安排以來極為罕見。此前，日本在研制固定翼戰斗機方面沒有任何可信的經驗，因為日本的整體安全依賴于美國。由于美國承包商洛克希德-馬丁公司早些時候與日本合作開展了 F-X 戰斗機項目，因此出現了延誤問題，損害了日本的安全。拖延的原因是洛克希德-馬丁公司沒有共享源代碼，以及美國拒絕技術轉讓的一貫政策。這已經影響到日本早期的 F-2 和 F-15 戰斗機機隊。F-X 戰斗機的研發時間表實際上已經被打亂。因此，該計劃將努力補充這些戰斗機的力量。

2011年，日本選擇了美國的F-35戰斗機，而不是英國的歐洲戰斗機。因此在 2017 年，日本得到了與英國共同開發先進戰斗機的更好提議。協議規定，兩國將交流先進航空技術信息。為了對抗美國，英國還在沖壓式噴氣動力超視距（BVR）空對空導彈領域幫助日本。此外，英國還表示愿意幫助將日本的射頻（RF）尋的器技術整合到歐洲流星 BVR 空對空導彈中。該項目被稱為聯合新型空對空導彈（JNAAM）。這將有助于日本本土工業的發展。日本的主要承包商是三菱重工（MHI）、三菱電機（Mitsubishi Electric）和石川島播磨重工（IHI）公司。預計他們將從該項目中獲得大量技術知識。

從英國的角度來看，該項目是從經濟、外交和安全的角度進行規劃的。英國脫歐之后，由于政治動蕩，英國的經濟受到了很大影響。失業、通貨膨脹、工業產出放緩等問題層出不窮。普華永道會計師事務所前幾年的一份報告指出，到 2050 年，英國在戰斗航空系統中發揮核心作用，平均每年可支持 21000 個工作崗位，并為經濟做出約 262 億英鎊的貢獻。正如國防大臣本-華萊士所言：“與意大利和日本合作制造和設計下一代戰斗機，是我們各國共享尖端國防技術和專業知識的最佳合作，將為整個行業提供高技能的工作崗位，并為英國和我們的盟國提供長期安全保障”。這一觀點也得到了英國首相的贊同。英國國防工業在先進的航空航天工程領域已經處于世界領先地位。例如，在 BAE 系統公司位于蘭開夏郡的新 “未來工廠”，該公司正在率先在軍用飛機上使用先進的 3D 打印和自主機器人技術。參與 GCAP 的其他承包商還有勞斯萊斯和 MBDA。

在外交政策方面，除傳統的北約盟友美國外，該計劃還允許英國與新的合作伙伴接觸。目前，由于經濟問題，英國在任何類型的戰斗機項目上都存在資金問題。在唐納德-特朗普總統任期內，美國提醒英國和其他北約國家將至少 4% 的 GDP 用于本國的安全需求。因此，如果英國與另一個中等強國聯手，就能解決資金問題，而日本似乎是正確的選擇。英國似乎也急于向世界展示它在國防領域，特別是歐盟仍然是一個重要的大國，因為俄羅斯已經攻擊了烏克蘭，而英國從一開始就支持烏克蘭。該項目將向北約盟國發出信號：如果將來有需要，北約可以選擇美國以外的合作伙伴。根據英國政府的說法，GCAP 與英國與國際盟國的其他防務合作并行不悖，包括 AUKUS 伙伴關系和北約--英國仍然是北約的主要歐洲派遣國。

就意大利而言，日本和英國是其重要的關鍵戰略伙伴。意大利已經在 “暴風雨 ”計劃中與英國進行了接觸。與英國和日本一樣，意大利致力于維護自由開放、以規則為基礎的國際秩序。日本是 2023 年七國集團主席國，意大利支持烏克蘭反對俄羅斯的侵略。意大利梅洛尼總統今后將把 GCAP 視為確保歐洲和日本盟友安全的一項舉措。這將提升梅洛尼總統的形象，因為她在保障意大利安全方面被反對黨認為過于女性化。意大利的主要承包商有萊昂納多公司、航空航天公司和以為 “狂風 ”計劃開發先進通信系統而聞名的 Elettronica 公司。

在技術方面，預計意大利將通過開發先進的機載電子設備（稱為綜合傳感和非動能效應（ISANKE）和綜合通信系統（ICS））來領導 GCAP。根據一份新聞稿，"ISANKE 將包括一個完全集成的傳感、融合和自我保護能力，利用每個平臺上的蜘蛛網傳感和效應節點。作為各國更廣泛的多領域系統的一部分，ICS將使ISANKE能夠在有機組人員和無機組人員的飛機編隊中作為一個網絡運行。日本采購、技術與后勤局 GCAP 開發部主任 Masaki Oyama 少將說："對于飛行員來說，如果飛機能像他們身體的一部分一樣移動，ISANKE/ICS 將是理想的選擇。ISANKE 和 ICS 可以提供遍布整個飛機的傳感器的綜合信息，在確保機動自由的同時保持出色的態勢感知能力"。三菱電機防務系統部高級總經理 Masahiko Arai 解釋說："ISANKE 和 ICS 是 GCAP 的先進電子設備，旨在為飛行員提供更好的態勢感知，告訴他們周圍發生了什么，并將這些信息轉化為他們可以比對手更快、更多地加以利用的信息。

今年 3 月，在國際防務與安全設備（DSEI）會議期間，強調了工作的總體分配和協作。BAE 系統公司、MHI 公司和萊昂納多公司將繼續密切合作，共同致力于 GCAP 的下一步工作，實現聯合工業安排的共同目標。羅爾斯-羅伊斯公司、IHI 和 Avio Aero 將制定條款，據此匯集各自的專業技術，設計、制造和測試全尺寸未來戰斗發動機驗證機。三菱電機公司、萊昂納多英國公司、萊昂納多公司和 Elettronica 公司將組成一個特殊領域，開發先進的機載電子設備，為機組人員提供信息優勢和先進的自我保護能力。

付費5元查看完整內容

多模態大模型 · Gemini · 大型語言模型 · 大模型 ·

2023 年 12 月 7 日

[付費5元查看完整內容]超越GPT-4？Google60頁《Gemini-高性能多模態大模型》報告，詳解技術測試等細節，附中英文版

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

12 月 6 日，谷歌 CEO 桑達爾?皮查伊官宣 Gemini 1.0 版正式上線。這次發布的 Gemini 大模型是原生多模態大模型，是谷歌大模型新時代的第一步，它包括三種量級：能力最強的 Gemini Ultra，適用于多任務的 Gemini Pro 以及適用于特定任務和端側的 Gemini Nano。

現在，谷歌的類 ChatGPT 應用 Bard 已經升級到了 Gemini Pro 版本，實現了更為高級的推理、規劃、理解等能力，同時繼續保持免費。谷歌預計在明年初將推出「Bard Advanced」，其將使用 Gemini Ultra。

谷歌 DeepMind CEO 和聯合創始人 Demis Hassabis 代表 Gemini 團隊正式推出了大模型 Gemini。 Hassabis 表示長久以來，谷歌一直想要建立新一代的 AI 大模型。在他看來，AI 帶給人們的不再只是智能軟件，而是更有用、更直觀的專家助手或助理。今天，谷歌大模型 Gemini 終于亮相了，成為其有史以來打造的最強大、最通用的模型。Gemini 是谷歌各個團隊大規模合作的成果，包括谷歌研究院的研究者。特別值得關注的是，Gemini 是一個多模態大模型，意味著它可以泛化并無縫地理解、操作和組合不同類型的信息，包括文本、代碼、音頻、圖像和視頻。谷歌表示，Gemini 還是他們迄今為止最靈活的模型，能夠高效地運行在數據中心和移動設備等多類型平臺上。Gemini 提供的 SOTA 能力將顯著增強開發人員和企業客戶構建和擴展 AI 的方式。

目前，Gemini 1.0 提供了三個不同的尺寸版本，分別如下：

Gemini Ultra：規模最大、能力最強，用于處理高度復雜的任務；
Gemini Pro：在各種任務上擴展的最佳模型；
Gemini Nano：用于端側（on-device）任務的最高效模型。

谷歌對 Gemini 模型進行了嚴格的測試，并評估了它們在各種任務中的表現。從自然圖像、音頻和視頻理解，到數學推理等任務，Gemini Ultra 在大型語言模型研發被廣泛使用的 32 個學術基準測試集中，在其中 30 個測試集的性能超過當前 SOTA 結果。另外，Gemini Ultra 在 MMLU（大規模多任務語言理解數據集）中的得分率高達 90.0%，首次超越了人類專家。MMLU 數據集包含數學、物理、歷史、法律、醫學和倫理等 57 個科目，用于測試大模型的知識儲備和解決問題能力。針對 MMLU 測試集的新方法使得 Gemini 能夠在回答難題之前利用其推理能力進行更仔細的思考，相比僅僅根據問題的第一印象作答，Gemini 的表現有顯著改進。在大多數基準測試中，Gemini 的性能都超越了 GPT-4。

**Gemini 高性能多模態大模型Gemini: A Family of Highly Capable Multimodal Models

這份報告介紹了一種新的多模態模型系列——Gemini，它在圖像、音頻、視頻和文本理解方面展現出非凡的能力。Gemini系列包括Ultra、Pro和Nano三種尺寸，適用于從復雜推理任務到設備內存受限用例的各種應用。在一系列廣泛的基準測試中的評估顯示，我們最強大的Gemini Ultra模型在這些基準測試的32項中的30項中推進了最新技術水平——特別是它是首個在廣受研究的考試基準MMLU上達到人類專家表現的模型，并且在我們檢查的所有20項多模態基準測試中提升了最新技術水平。我們相信，Gemini模型在跨模態推理和語言理解方面的新能力將使各種用例成為可能，我們討論了將它們負責任地部署給用戶的方法。

我們在Google開發了一系列高性能的多模態模型——Gemini。我們對Gemini進行了聯合訓練，覆蓋圖像、音頻、視頻和文本數據，旨在構建一個在多種模態上都具有強大的通才能力，并在各自領域內具有先進的理解和推理性能的模型。 Gemini 1.0，我們的首個版本，有三種尺寸：Ultra用于高度復雜的任務，Pro用于提升性能和大規模部署能力，Nano用于設備上的應用。每種尺寸都專門針對不同的計算限制和應用需求進行了優化。我們在一系列內部和外部基準測試上評估了Gemini模型的性能，涵蓋了廣泛的語言、編程、推理和多模態任務。 Gemini在大規模語言建模（Anil等，2023；Brown等，2020；Chowdhery等，2023；Hoffmann等，2022；OpenAI，2023a；Radford等，2019；Rae等，2021）、圖像理解（Alayrac等，2022；Chen等，2022；Dosovitskiy等，2020；OpenAI，2023b；Reed等，2022；Yu等，2022a）、音頻處理（Radford等，2023；Zhang等，2023）和視頻理解（Alayrac等，2022；Chen等，2023）方面推進了最新技術。它還基于序列模型（Sutskever等，2014）、深度學習基于神經網絡的長期研究（LeCun等，2015），以及機器學習分布式系統（Barham等，2022；Bradbury等，2018；Dean等，2012）來實現大規模訓練。我們最強大的模型，Gemini Ultra，在我們報告的32個基準測試中的30個中取得了新的最新技術成果，包括12個流行的文本和推理基準測試中的10個，9個圖像理解基準測試中的9個，6個視頻理解基準測試中的6個，以及5個語音識別和語音翻譯基準測試中的5個。Gemini Ultra是首個在MMLU（Hendrycks等，2021a）上達到人類專家表現的模型——一個通過一系列考試測試知識和推理的著名基準測試——得分超過90％。除了文本，Gemini Ultra在挑戰性的多模態推理任務上也取得了顯著進展。例如，在最近的MMMU基準測試（Yue等，2023）上，該測試包含了關于圖像的多學科任務，需要大學級別的主題知識和深思熟慮的推理，Gemini Ultra取得了62.4％的新最新技術成績，比之前最好的模型高出5個百分點以上。它為視頻問答和音頻理解基準測試提供了統一的性能提升。定性評估展示了令人印象深刻的跨模態推理能力，使模型能夠本地地理解和推理音頻、圖像和文本輸入序列（見圖5和表13）。以圖1中描繪的教育場景為例。一位老師畫了一個滑雪者下坡的物理問題，一位學生對其進行了解答。使用Gemini的多模態推理能力，模型能夠理解凌亂的手寫字，正確理解問題的構成，將問題和解決方案轉換為數學排版，識別學生在解決問題時出錯的具體推理步驟，然后給出問題的正確解決方案。這為教育領域開辟了激動人心的可能性，我們相信Gemini模型的新多模態和推理能力在許多領域都有重大應用。大型語言模型的推理能力展示了構建能夠解決更復雜多步驟問題的通才型代理的前景。AlphaCode團隊構建了AlphaCode 2（Leblond等，2023），一種新的由Gemini驅動的代理，它結合了Gemini的推理能力、搜索和工具使用，擅長解決競賽編程問題。AlphaCode 2在Codeforces競賽編程平臺上排名前15%，比其最先進的前輩排名前50%有了大幅提升（Li等，2022）。與此同時，我們通過Gemini Nano推進了效率的前沿，這是一系列針對設備上部署的小型模型。這些模型擅長于設備上的任務，如摘要、閱讀理解、文本完成任務，并在推理、STEM、編碼、多模態和多語言任務方面相對于它們的大小展示了令人印象深刻的能力。在接下來的部分，我們首先提供模型架構、訓練基礎設施和訓練數據集的概述。然后，我們詳細評估了Gemini模型系列，涵蓋了廣泛研究的基準測試和跨文本、代碼、圖像、音頻和視頻的人類偏好評估——包括英語性能和多語言能力。我們還討論了負責任部署的方法，包括我們對影響評估的過程、開發模型政策、評估和在部署決策前減少傷害的方法。最后，我們討論了Gemini的更廣泛影響，它的局限性以及其潛在應用——為AI研究和創新的新時代鋪平道路。

付費5元查看完整內容

AI與軍事 · 英國國防部（MoD） · 報告 ·

2022 年 6 月 13 日

[付費5元查看完整內容]中文版-英國國防部《競爭時代的防務》76頁報告

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

英國國防部2021年發布報告《競爭時代的防務》。報告主要圍繞戰略背景、未來戰爭形勢、戰略方針、全球防務合作、人才發展、軍隊現代化、工業界合作等內容展開。闡述了不斷變化的戰略環境及未來戰場形勢，重新規劃了2021—2030年實現英軍全面轉型的戰略框架和國防戰略方針。報告還明確了英國防部在培育未來優勢、聯合盟友、有效利用人才、全面發展現代化軍事力量、鞏固行業關系、改變管理方式等6個方面的目標與計劃，明確了英軍發展的優先事項以及實現路徑。不可否認，這份報告是英國防部對本國軍事定位最徹底的一次重新評估，將成為英軍未來建設的戰略指南，也將成為提升英軍作戰能力的基本遵循。

報告概括出英國未來國家安全和國際環境的四個主要趨勢，分別是地緣政治環境變化、價值觀主導的系統性競爭、快速的技術變革、跨國挑戰等。在此背景下，英國軍隊擔負守衛國家安全的使命任務，是打造“全球英國”的國家形象的必要支撐。