亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

本文開發了基于充分統計量的方法,用于設計二元分類任務中的人機協作決策機制。該方法允許AI預測用于全自動化決策,或選擇性輔助人類決策,同時兼容決策者的內生偏倚信念與努力擠出效應,無需構建人類決策的結構性模型。本方法經在線事實核查實驗驗證:人類對AI預測存在反應不足現象,且當AI呈現高置信度預測時會降低自身努力程度。這種不足反應主要源于人類對自身信號精度的過度自信,而非低估AI能力。最優策略為:AI高置信度時自動化處理,不確定性案例委托給人類并完整披露AI預測。自動化雖具價值,但利用AI預測輔助人類的額外收益微乎其微。

人工智能工具性能近年顯著提升,諸多預測工具已媲美甚至超越人類(Kleinberg等, 2017; Agrawal等, 2018; Lai等, 2021)。該進展引發兩大關注點:AI輔助如何影響人類表現(Brynjolfsson等, 2025);以及如何設計人機協作系統以確定案例應自動化處理,或交由人類決策(無論是否輔以AI預測)(Raghu等, 2019; Mozannar與Sontag, 2020)。

設計人機協作面臨的核心挑戰在于:可行方案空間龐大,且人類對設計方案的反應難以預測。人類可能對AI預測展現信念更新偏誤(Agarwal等, 2023),而AI預測可能擠出人類獲取或處理信息的努力——這種現象被稱為算法規避(Dietvorst等, 2015)、自動化偏倚(Skitka等, 1999)或“行車時打盹效應”(Dell’Acqua, 2022)。響應行為的復雜性疊加協作方案的高維特征,使通過實驗或結構建模尋求最優方案困難重重。

本文針對二元分類任務開發充分統計量方法,要求對多個案例輸出分類結果a ∈ {0, 1}。充分統計量V(x)定義為:當人類決策者觀測到經校準的AI評估值x∈[0,1](表示正確分類為1的概率)時,其正確分類案例的概率。該方法兼容任何基于自身評估選擇性自動化分類任務,或在披露(可能不完美的)評估信號同時委派任務給人類的AI系統。在V函數不隨信息披露策略改變的假設下,信息設計理論(Dworczak與Martini, 2019)證明:V函數可被用于求解該空間內的最優設計方案。這意味著——在給定V的條件下——最優設計獨立于人類信息處理、行為偏誤或努力響應等其他人機交互因素。V函數可直接利用向決策者完整披露AI評估值x時的決策準確率數據估算,此類數據可源自實驗(如本研究)或歷史觀測。

該充分統計量方法相較于兩種傳統方案具顯著優勢。方案一需估計人類行為與信念更新的完整結構模型并求解最優設計,此過程需更強行為假設且估計所需數據(不同AI評估值x下的準確率)與直接估計V函數所需數據相同。方案二需通過實驗測試大量設計尋找最優方案,但因設計空間巨大而不具實操性,且仍需理論論證所獲最優解是否全局最優。

我們在激勵性在線事實核查實驗中實施并驗證本方法。參與者需判斷陳述真偽,此場景對人機協作研究具典型價值:公共陳述真實性受高度關注,人類與AI核查員均被廣泛應用。盡管媒體、獨立機構與數字平臺長期依賴專業人類核查員(國際事實核查網絡, 2023),待核查陳述數量的激增促使各方關注公眾參與事實核查(Allen等, 2021; X社區筆記, 2025)及自動化核查(Guo等, 2022; 國際事實核查網絡, 2023)。完善人機協作系統對提升事實核查效能具有現實意義。

事實核查亦是理想的實驗場景:任務易于闡釋且可由未經訓練者執行;利用含基準真值標簽的陳述數據庫(如實驗采用的FEVEROUS庫(Aly等, 2021))可便捷測量準確率;該任務還表征了醫療診斷(Agarwal等, 2023)、司法保釋決定(Kleinberg等, 2017)、簡歷篩選(Li等, 2020)等典型二元分類場景。

實驗分兩階段推進:第一階段通過測量不同AI評估值下的分類準確率估計充分統計量V,求解最優及近似最優設計。因社會往往偏好人類保留最終決策權(事實核查可能屬此情形),我們同時考慮允許自動化和完全人類決策的設計。第二階段在參與者內實驗中實施五種基于第一階段估計的方案,通過比較兩階段預測準確率與實際結果檢驗充分統計量方法。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

分層多智能體系統(HMAS)通過層級化結構組織智能體集群,有效管理復雜性與規模擴展。此類層級架構雖能簡化協調流程,卻常伴隨隱性權衡。本文提出五維分類體系:控制層級、信息流、角色任務委派、時間分層及通信結構,其核心價值在于提供跨方案比較框架而非指定"最優"設計。該分類法關聯具體協調機制——從經典任務分配的合同網協議到新興分層強化學習研究,并以電網、油田作業等工業場景佐證框架實用性:生產層、維護層與供應層智能體通過協同實現油井故障診斷或能源需求平衡。案例表明層級結構可在保障局部自主性前提下達成全局效率,但平衡點極為微妙。文末提出開放挑戰:實現人類可解釋的層級決策、超大規模智能體集群擴展、以及大語言模型等學習型智能體安全融入分層框架的可行性評估。本論文首創融合結構、時間與通信維度的分層MAS統一設計框架,構建經典協調機制與現代強化學習及大語言模型智能體的理論橋梁。

人工智能的現代應用常需多智能體在復雜環境中協同作業。分層多智能體系統(HMAS)通過層級化組織架構協調大規模智能體集群,已成為高效的系統設計范式。在HMAS中,高層智能體(或智能體團隊)通常監管協調低層智能體,形成類人類組織層級的指揮鏈。該架構優勢體現在三方面:首先解決可擴展性問題——當智能體數量激增時,純扁平化(完全去中心化)結構易受通信開銷與全局一致性制約,而通過中間"領導者"智能體實施分治策略可有效管理復雜度。分層機制賦予特定智能體更高責任權重,實現任務需求靈活適配與大規模MAS高效管控。例如自動駕駛領域提出的"區域領導者"架構:頂層智能體優化路網全局目標,區域領導者協調局部交通流。其次支持差異化抽象層級與時間尺度的決策:高層智能體執行寬時間跨度的抽象規劃(如任務規劃),低層智能體實施精細動作控制(如運動控制),提升系統整體一致性。第三促進結構化協調與沖突消解:明確權責關系(指揮鏈)與通信路徑,規避完全平等型團隊常見的決策遲滯或振蕩現象。正如Malone與Crowston經典論述所指:協調本質是管理活動間依存關系——當存在結構化監督機制時該過程顯著簡化(Malone and Crowston, 1994)。

分布式AI與多智能體系統的早期研究已證實組織設計對性能的影響。學界通過分析層級、團隊、聯盟、全息及市場等組織范式權衡優劣,尤其揭示層級組織(常通過管理者-工作者模式或樹狀拓撲實現)能以部分魯棒性為代價提升全局效率;而完全去中心化的"團隊"組織雖最大化韌性平等性,卻在大規模群體中效率受限。最新研究凸顯混合架構的復興趨勢——融合分層與去中心化協調機制以兼取二者優勢。行業投資數據佐證該趨勢:2024年Q1多智能體系統領域通過超1100筆交易獲122億美元融資,彰顯醫療、交通、金融及國防等千億級市場對MAS變革潛力的持續信心(Aalpha, 2025)。Sun等人2025年的深度研究指出"分層與去中心機制的混合策略"是實現可擴展性與適應性平衡的關鍵路徑,印證本文分類方法的科學價值。事實上層級結構在自然界(如具工蜂-蜂后層級的昆蟲社會)與人類社會(企業組織架構)普遍存在,表明精心設計的層級可顯著增強多智能體AI系統的協調效能。

除結構優勢外,HMAS更契合人機交互需求。在能源運營、軍事指揮等任務關鍵型領域,人類監督員管理AI智能體、智能體再管控底層自動化流程的分層模式,既映射現實管理結構,又為人機協作提供意圖注入節點。通過明確定義人類操作員(戰略決策者)與自主智能體(戰術執行者)角色,層級架構促進人機高效協作。但該集成亦引發新挑戰——系統需向上提供可解釋性(確保人類理解智能體決策)并建立信任機制保障可靠委派。

面對多智能體應用規模與復雜度的持續增長(從含數百分布式能源的智能電網,到自動駕駛車隊,再到自適應供應鏈),亟需建立分層多智能體系統的系統性分類與設計指南。現有MAS分類法(如按團隊規模、通信拓撲、智能體異構性劃分)基礎上,本文提出聚焦層級組織模式及其協調機制的升級版分類體系。該研究融合經典框架(如Smith 1980年提出的任務分配合同網協議及MAS組織理論)與前沿成果(分層多智能體強化學習、大語言模型智能體),以多維視角勾勒HMAS設計空間,明晰系統架構師的抉擇與權衡。分類體系植根現實應用(尤以作者深耕的能源與運營領域為典型),通過油田監測分層MAS、微電網控制等工業案例實證設計范式的實用價值。文末指出現代AI能力與層級結構交叉衍生的研究議題:如何在深度分層系統中維持全局透明度?如何將大語言模型智能體的推理能力融入傳統層級架構?本成果貢獻了橫跨控制、信息流、角色/任務委派、時間分層、通信結構五維度的統一分類法,并顯式關聯協調機制與工業部署,為研究者與系統架構師提供超越既有綜述的實用設計透鏡。

付費5元查看完整內容

隨著機器人技術日益精進,亟需發展能與人類隊友及其他機器人交互協作的智能系統。本研究旨在探索多智能體(含人類與機器人)協同框架,聚焦智能體間交互層級與隊友信息推斷機制。首先在協同導航范疇內研究單人-單機器人協作,該場景需直接人機交互與隊友狀態推斷。考慮人機需穿越環境抵達共同目標的情境,提出兩種觸覺引導系統:通過力反饋向人類提供避障與路徑建議,各具計算效率與路徑最優性優勢。解析與實驗證明該方法能同步保障避障與目標引導功能。

首項工作解決雙智能體協作后,后續研究轉向多智能體協作——該場景下人機交互有限且隊友信息層級各異。針對異構多智能體團隊(各機器人具不同感知/資源能力),提出控制策略以實現復雜動態任務分配,使團隊能適應任務變化與成員變動。分布式架構支持大規模應用,分析表明策略可在動態環境中收斂至最優解,仿真與硬件實驗驗證其性能媲美基準算法。

核心貢獻

第三章3.2節提出地面機器人協同遙操作觸覺引導算法,僅提供必要反饋。融合避障功能(障礙物排斥力)與路徑引導功能(建議路徑吸引力),建議路徑由非完整約束快速擴展隨機樹(RRT*)算法生成。突破傳統觸覺遙操作范式,首次提供避障安全性解析證明(用戶遵循力反饋時可規避碰撞)。

第三章3.3節將RRT采樣樹融入控制李雅普諾夫函數(CLF)框架,生成運動學可行路徑的觸覺建議。為保障安全,引入控制屏障函數(CBF)提供防撞指引而無需重采樣RRT樹。解析證明當用戶遵循力反饋時,CLF驅動力可引導機器人從環境任意點抵達共同目標。

第四章實現多機器人團隊持久自適應覆蓋控制,服務于動態異構任務需求(可泛化至各類資源補給算法)。通過解析證明區位成本最小化與需求輸入-狀態穩定性。為確保持久性,提出分布式補給算法——兼容異構團隊并利用需求與資源水平預測,顯著降低服務中斷率。

第五章構建多機器人響應離散異構事件框架:通過任務執行建立個體信譽度,據此生成加權維諾分區。采用核密度估計(KDE)動態更新事件密度函數以適應需求變化,證明維諾生成器收斂于加權區位成本臨界點。針對時限任務,提出蟻群系統(ACS)啟發的任務排序算法,證明其高概率收斂至最優解(該解在最小化機器人能耗同時,優先保障緊急時限任務)。

全文結構

第二章闡述符號體系與數學基礎;第三章詳述兩種人機協同導航方法;第四章提出多資源分配覆蓋控制策略;第五章以智能體信譽度為核心構建時限/非時限任務服務機制;第六章總結并展望。附錄A收錄符號索引。

圖1·2:本論文研究協同自主性的三種實現形態。第四章與第五章探討多智能體協同團隊(上圖),第三章解析人機協同導航(下圖)。

付費5元查看完整內容

可采取多樣化反混合威脅措施以防御低于常規軍事閾值的敵對行動。然而因混合威脅的模糊性、跨域性及反制措施如何影響對手行為的不確定性,這些措施的成效尚不明晰。本文提出通過貝葉斯網絡(概率建模技術)構建模型,模擬反制措施對混合威脅行為的影響。該模型綜合權衡反制成本、威懾對手執行混合威脅的能力及減輕威脅影響的潛力。基于半合成場景運行1000次變體模擬,推演攻擊方A與防御方B圍繞關鍵基礎設施網絡攻擊的戰略互動,評估五類反混合威脅措施的有效性。反制措施涵蓋強化韌性、剝奪對手執行混合威脅能力至以懲罰威脅實施威懾等范疇。分析聚焦評估反混合威脅措施的整體特性,旨在歸納措施普適有效性而非孤立歸因。同時探討政策關聯性并規劃未來研究方向。

圖1:反混合威脅建模的貝葉斯網絡架構。深藍色背景層標注確定性變量集合,灰藍色層表示概率性變量集合。黑色箭頭顯示概率性關聯關系,灰色箭頭顯示確定性關聯關系。

技術發展加速、經濟深度融合及社會數字化重構了當代國家間競爭,為修正主義國家提供在武裝沖突閾值下追求戰略目標的新型工具。在歐洲,"混合威脅"被廣泛定義為"協調同步運用暴力與非暴力手段"的行為——通常難以探測歸因,旨在武器化民主進程并施加影響力。盡管常被混用,"混合沖突"概念有別于美國學者所述的"灰色地帶"戰略:后者指準持續性國家間沖突的特殊狀態,即利用法律外衣掩蓋侵略行動以脅迫對手達成有限目標,其操作低于探測歸因閾值。但二者均指代沖突閾值下的侵略行為,包括信息心理戰、政治外交脅迫、經濟壓制、進攻性網絡行動及利用代理人顛覆對手。

當前各國致力制定反混合政策以提升韌性并對抗手施加成本,從而威懾此類行為。然相較于常規與核領域的公開侵略行為,混合行動因不透明與跨域特性構成獨特挑戰,其威懾防御難度顯著。傳統威懾通過"剝奪對手達成目標能力"(拒止威懾)或"威脅行動后施加代價"(懲罰威懾)來"阻止國家采取非期望行動"。常規與核威懾理論公認"認知"是威懾成功關鍵——對手須感知"行動潛在代價超過收益"。有效威懾需滿足明確性、相稱性與可信度:明確性要求清晰傳達防御方響應措施;相稱性指威懾手段與防御目標的匹配度;可信度則植根于威懾方應對外部侵略的能力與意愿。

經典威懾的適用條件在混合威脅背景下嚴重受限。首先,灰色地帶侵略行為非單純軍事對抗,而是軍事與非軍事、公開與隱蔽操作的復雜混合,涉及經濟脅迫、虛假信息戰、進攻性網絡行動乃至武裝團體部署。其次,混合威脅引發兩大緊迫問題:灰色地帶活動持續發生且常難溯源特定對手,致使威懾實施愈發復雜。

傳統領域內的懲罰與拒止策略雖具部分適用性,卻不足以應對灰色地帶復雜互動。傳統威懾策略需進化為復合型跨域策略——除成本威脅與收益剝奪外,更需融合對敵方的保證激勵措施(assurance)、推動國際合作與規范構建(norms)、利用經濟與系統性相互依賴(entanglement)以影響對手行為。鑒于灰色地帶持續緊張狀態,威懾努力應具"累積性":防御方需將反混合策略視為"長期過程——單次違規不意味失敗,而需通過協同努力塑造對手行為"。此背景下,學者建議采用更廣泛的"勸止"(dissuasion)策略應對混合威脅。勸止被理解為涵蓋懲罰與拒止響應的統領性戰略,通過政治、外交和經濟關系杠桿實施高級反制措施。因此,灰色地帶勸止對手需戰略部署外交-信息-軍事-經濟金融-情報-執法(DIMEFIL)全譜系國家力量工具,同時管控升級動態與潛在報復風險。

然而實踐中,制定成功跨域響應的原則、指標或指南尚未達成共識,比例失衡與行為模糊風險始終存在。因威懾與勸止植根于認知,反混合策略有效性取決于對手真實動機與核心利益認知——包括其進攻傾向及需保護的脆弱點。但決策者常缺乏關鍵信息:對手在灰色地帶的戰略目標、驅動低于戰爭閾值行動的決策機制與收益計算模型、以及反混合政策如何影響威脅行為(尤其因大量混合威脅發生于探測溯源閾值之下)。故評估現實反混合政策效能極為困難。

部分學者嘗試用博弈論模擬混合威脅動態以克服信息匱乏;另一些則將稀缺數據源融入貝葉斯建模技術以優化領域知識。本文基于后者提出貝葉斯網絡建模法——將反混合政策深層不確定性(如威脅探測、溯源及跨域效應)建模為概率關系。模型設定攻擊方A與防御方B兩類國家行為體:防御方面臨混合攻擊并通過反制措施實施勸止。攻擊方A執行混合攻擊的決心受防御方B既有反制措施影響。執行攻擊的決策及其潛在破壞均以概率建模,分別考量威懾關聯的認知心理維度及混合威脅影響的不確定性。混合行動潛在破壞與反制成本共同構成防御方B的收益矩陣,最優反制措施通過最大化預期收益值計算得出。

為驗證模型,設計網絡威脅場景進行仿真推演(見附錄A)。進攻性網絡行動是武裝沖突閾值下混合威脅的典型代表——因網絡空間技術/物理/邏輯層特性及網絡技術日常生活滲透,近年網絡攻擊愈發普遍。從伊朗"震網"(2009)、沙特"沙蒙"(2012)到全球60余國"諾佩提亞"(2017),網絡攻擊可造成重大物理破壞。基于此,本研究綜合現實惡意網絡行動案例設計合理網絡攻擊場景。解析網絡攻擊響應時,聚焦域內響應(網絡空間措施)與域外響應(執法、規范構建、公共外交及經濟制裁等)。通過累積性威懾視角,部分反混合措施旨在減輕敵對網絡攻擊破壞,另一些則通過提高成本收益比勸止侵略行為。

為此征詢政策專家意見并梳理文獻,量化評估各反制措施的成本、減損能力與威懾效能。這些變量以概率分布形式呈現,以兼容文獻分歧、專家差異及混合威脅不可預測性。通過整合文獻綜述與專家洞見,設計總計1000組獨立實驗。實驗結果生成反混合措施排序,用以評估不同場景下措施效能,并回答核心研究問題:

? 在1)措施勸止攻擊效能 2)措施減損攻擊影響效能均存不確定性的前提下,反混合威脅措施的哪些特性最有效助力防御方B應對攻擊方A對關鍵基礎設施的網絡威脅?

本文結構如下:第二章介紹建模方法,闡述如何將文獻與專家見解轉化為概率分布輸入模型;第三章詳述混合威脅場景及關聯跨域反制措施;第四章解析實驗結果;第五章反思研究發現的政策關聯性并指明未來研究方向。

付費5元查看完整內容

態勢感知(SA)是通過感知、理解與預測環境要素的連續過程,構成復雜系統的重要組件。環境信息接收具有持續性與多模態特性,人工智能技術通過將SA目標拆解為數據融合、表征、分類及預測等任務,提供更高效穩健的支撐。本文系統綜述應用于各類環境與場景中構建、增強及評估SA的AI與多模態方法,重點聚焦感知完整性與持續性提升。研究表明人工智能與多模態方法的融合顯著增強了復雜系統的感知與理解能力,但在未來態勢預測與多模態信息有效融合方面仍存研究缺口。本文總結AI與多模態技術實現SA的應用案例與實踐經驗,并提出未來展望與挑戰,包括更全面的預測能力、更強的可解釋性及更先進的視覺信息處理技術。

圖1所示。基于人工智能和多模態技術的態勢感知系統概述。

付費5元查看完整內容

多機器人協同與協作是提升團隊能力并實現自主建造、農業及未知大區域持續作業等應用場景新型任務的關鍵行為。本研究以“多機器人資源分配問題”為背景探究此類行為,該問題要求將機器人分配至待服務區域。我們尤其關注適用于大規模多機器人團隊的“容錯性方法”。我們引入一種基于圖的建模框架用于多機器人資源分配問題,該框架在表征“區域間關系”與“獎勵模型”方面具有前所未有的豐富性。首先,針對“多智能體覆蓋控制問題”,通過圖神經網絡(GNN)引入“基于圖的計算方法”,其利用學習型智能體間通信策略,在性能與可擴展性上顯著提升。隨后,研究需要顯式協同的“復雜多任務場景下多機器人任務分配問題”,提出一種“基于網絡流的規劃方法”,可在數秒內為大規模問題生成高質量解。進一步將該方法擴展至在線場景,支持任務失敗與意外觀測時的動態重規劃。實證研究表明,這些建模方法與算法通過挖掘多機器人問題中的本質圖結構特征,實現了性能突破并推動領域技術前沿發展。

圖:任務圖(底部)展示任務間優先關系。高亮部分為任務子集,顯示“聯盟職能”(紅色)與“優先關系”(藍色)。例如,在執行“運輸建筑材料”任務前,機器人需在布滿碎片的工地“尋路或清障”。路徑質量直接影響團隊運輸效率;而運輸表現(如材料損毀情況)將決定后續“施工任務”的執行速度與質量。?

第一章將本研究置于“多機器人資源分配”領域框架內。首先,提出多機器人資源分配領域內的問題分類體系,沿著“任務表征抽象度”維度梳理問題模型及其對應研究方法。隨后,深入綜述與“多機器人覆蓋控制”及“多機器人任務分配”密切相關的文獻,這些成果為本研究提供了核心理論支撐。??

??第二章《基于圖神經網絡的多機器人系統覆蓋控制》提出一種創新方法,解決“感知半徑受限條件下的多機器人覆蓋控制”問題。相較于文獻常用基準控制器,該方法通過智能體間通信機制顯著提升控制器的性能與魯棒性。為實現這一目標,在機器人間通信網絡上部署圖神經網絡(GNN),訓練其預測集中式全知控制器的輸入指令,從而生成能夠通過智能體通信應對復雜覆蓋控制場景的控制器。實驗證明,該控制器性能顯著超越基準方法,且具備優異的可擴展性與泛化能力。首次構建基于全球城市真實興趣點特征的覆蓋控制問題數據集,并用于算法驗證。這是圖神經網絡學習型控制器在多機器人覆蓋控制領域的首次應用,展現出巨大潛力。??

??第三章《具有任務優先關系的多機器人協同與協作》針對“多機器人任務分配(MRTA)”問題提出新型建模框架與求解方法體系。首次將“優先級約束”與“多機器人任務”納入MRTA問題,構建名為“任務圖”的建模框架——以圖節點表示任務,邊表示任務間優先級關系。該框架包含的“獎勵模型”能通過豐富函數空間表征關聯任務性能間關系及任務分配聯盟規模與任務績效間關系。基于此模型,開發出利用網絡流優化的任務分配解決方案,其求解速度較現有方法提升數個量級,且計算復雜度與任務執行機器人數量無關,可擴展至無限規模團隊。實驗表明,該方法在保證解質量的同時實現計算效率突破,為任務分配建模框架作出根本性貢獻。?

在第四章中,拓展了多機器人任務分配(MRTA)方法,提出《在線環境下的多機器人優先關系協同與協作》。本章沿用相同“任務圖”模型與“基于流網絡的求解方法”,將其置于在線框架以提升系統魯棒性與性能,并通過高保真仿真器驗證方案有效性。核心在于,在原有MRTA問題中引入“不確定性”考量——任務可能隨機失敗或產生求解器未預期的隨機獎勵。依托流網絡方法的高速求解優勢,以迭代方式重構求解流程,使系統能夠基于已完成任務的獎勵觀測實時重規劃。該方法顯著提升了存在環境不確定性時的規劃性能,甚至因解空間擴展在零誤差條件下進一步優化結果。在高保真城市環境多智能體仿真器中驗證了該在線方法及離線流網絡方法,其中任務獎勵基于仿真器內物理現象量化。實驗表明,該建模方法能有效預測高不確定性復雜任務的性能表現,且相較文獻方法具有顯著優勢。在線框架為原有方案注入魯棒性,并將性能提升至接近最優水平,為任務分配領域持續研究提供了極具前景的框架。?

付費5元查看完整內容

本文開發了一種充分統計量方法,用于在二分類任務中設計人機協作決策策略(AI預測可被用于自動化決策或選擇性輔助人類)。該方法允許內生性偏誤信念與努力擠出效應,而無需構建人類決策的結構化模型。我們通過在線事實核查實驗驗證該方法的有效性,發現人類對AI預測存在響應不足,且在AI高置信度預測下降低努力投入。AI響應不足更多源于人類對自身信號精度的過度自信,而非低估AI能力。最優策略對AI置信案例實施自動化,將不確定案例委派人類并完整披露AI預測。盡管自動化具有價值,但通過AI預測輔助人類帶來的邊際效益微乎其微。

近年來人工智能工具性能快速提升(Maslej等,2024),諸多預測工具達到或超越人類水平(Kleinberg等,2017;Agrawal等,2018;Lai等,2021)。相應引發對AI輔助如何影響人類績效(Noy和Zhang,2023;Brynjolfsson等,2025)及人機協作系統設計的廣泛關注(Raghu等,2019;Mozannar和Sontag,2020;Agarwal等,2023)。

設計人機協作的挑戰在于潛在協作模式空間龐大且人類響應難以預測。人類可能對AI信息呈現信念更新偏誤(Agarwal等,2023),AI信息可能擠出人類信息獲取或處理努力(表現為算法厭惡、自動化偏誤或"自動駕駛效應")。這些復雜響應與高維設計空間使得通過實驗或結構建模尋找最優方案面臨困難。

本文針對二分類任務開發充分統計量方法(每個案例需分類為a∈{0,1})。充分統計量V(x)表示當人類決策者觀察到經校準的AI評估(正確分類概率為x∈[0,1])時的正確分類概率。允許任何基于AI評估選擇性自動化分類任務或向人類委派任務(同時披露可能不完美的評估信號)的系統。在V函數不依賴信息披露策略的假設下,信息設計文獻結論(Dworczak和Martini,2019)表明V可用于尋找最優設計,即條件于V的設計問題不依賴人機交互其他要素(如人類信息、行為偏誤或努力響應)。

相較兩種傳統方案,充分統計量方法具顯著優勢:其一,通過估計人類行為與信念更新的全參數模型求解最優設計(需更強行為假設且數據需求相似);其二,實驗測試多設計方案(因設計空間龐大而不具實操性,且無法保證全局最優)。

我們在事實核查激勵實驗中實施與驗證該方法。參與者需核查聲明真實性。事實核查是研究人機協作的重要場景(涉及公共利益且人機核查廣泛應用),同時便于實驗操作:任務易解釋、非專業參與者可完成、準確性易度量(采用FEVEROUS數據庫標注真偽聲明)。該場景也代表醫療診斷、司法保釋決策、簡歷篩選等二分類任務。

實驗分兩階段:第一階段通過不同AI預測下的分類準確率估計V函數并求解最優與近似最優設計(考慮允許自動化與強制人類決策方案);第二階段在第一階段估計基礎上實施五種設計,通過組內實驗驗證充分統計量方法的預測準確性。

第一階段結果揭示:1)估計V函數呈凸性(全披露AI預測對委派案例最優),與部分披露更優的既往結論(Athey等,2020;Dell’Acqua,2022)相異;2)AI高置信度時人類準確率顯著低于自動化(V(x)<max{x,1?x}),需自動化處理;3)AI不確定預測對人類增益有限(最優策略為AI自信案例自動化+不確定案例無輔助委派人類)。

最優設計預測顯示:允許自動化時FDA策略(全披露+自動化)最優,其準確率與NDA策略(無披露+自動化)近似;禁止自動化時FDNA策略(全披露+無自動化)最優且顯著優于NDNA(無輔助),與SL策略(三色信號提示)效果相近。

第二階段實驗驗證五類策略表現:所有預測誤差小于1.6個百分點(1%水平不顯著),定性預測均成立(FDA與NDA無統計差異最優;FDNA與SL無差異且顯著優于NDNA),證明充分統計量假設的有效性。

機制分析發現:1)信念更新誤差導致至少7.7%AI輔助錯誤分類;2)AI響應不足主因人類對自身信號精度過度自信(相對貝葉斯基準過度敏感但AI響應適當);3)精確AI信息擠出人類努力但對信號精度影響微弱。

付費5元查看完整內容

多機器人協調與協作是提升團隊能力、實現自主建造、農業及廣域未知環境長期作業等新任務的關鍵行為。本研究聚焦多機器人資源分配問題背景下的此類行為,即機器人需被分配至服務區域。我們特別關注適用于大規模機器人集群的容錯方法,引入一種基于圖建模的多機器人資源分配框架,該框架在表征區域間關系與獎勵模型方面具備前所未有的豐富性。首先解決多智能體覆蓋控制問題,通過圖神經網絡(GNN)實施基于圖的計算,利用學習型智能體間通信策略實現性能與可擴展性提升。隨后針對需顯式協調協作的復雜多任務場景,提出基于網絡流的規劃方法,可在數秒內生成大規模問題的高質量解。我們將此方法擴展至在線環境,實現任務失敗與意外觀測條件下的動態重規劃。實驗證明,這些建模方法與算法通過挖掘多機器人問題中的基礎圖結構,推動技術前沿的進步。

第一章
 本章將研究工作置于多機器人資源分配領域進行定位。首先提出多機器人資源分配問題的分類體系,沿任務表征抽象維度梳理問題建模與對應方法(1.3節)。隨后深入綜述推動本研究中覆蓋控制與任務分配工作的核心文獻(1.5與1.6節)。

第二章:基于圖神經網絡的多機器人覆蓋控制
 本章提出一種新型有限感知半徑多機器人覆蓋控制方法,相比傳統基線控制器,通過智能體間通信提升性能與魯棒性。我們在機器人通信網絡上部署圖神經網絡(GNN),訓練其預測中心化全知控制器的控制指令,從而獲得能通過智能體間通信應對覆蓋控制難題的控制器。實驗驗證該方法在性能、擴展性與泛化能力上的優勢。2.6節展示基于全球城市特征數據構建的覆蓋控制數據集,用于算法驗證。本研究首次將GNN學習控制器應用于多機器人覆蓋控制,展現該路徑的廣闊前景。

第三章:具備任務優先級關系的多機器人協調協作
 本章以新型建模框架與解法體系解決多機器人任務分配(MRTA)問題。提出"任務圖"建模框架:將任務抽象為圖節點,任務間優先級關系抽象為邊;構建包含任務關聯性能與編隊規模-任務效能關系的獎勵模型。該框架啟發基于網絡流優化的機器人任務分配解法,實驗表明其求解速度較現有方法提升數倍,且計算復雜度與機器人數量無關——可擴展至無限規模團隊。本研究對任務分配建模框架作出基礎性貢獻,實現求解速度的量級突破。

第四章:在線環境下的多機器人協調協作
 本章將任務圖模型與流解法擴展至在線環境,提升系統魯棒性與性能,并通過高精度仿真驗證。核心在于處理含不確定性的MRTA問題:任務可能隨機失敗或產生預期外獎勵。利用流解法的高速求解特性,建立迭代重規劃機制,依據已完成任務的獎勵觀測動態調整方案。實驗證明該方法在不確定性環境中顯著提升規劃性能,零誤差條件下亦因解空間擴展而優化。通過高精度城市多智能體仿真驗證離線/在線流解法,測量仿真物理現象衍生的任務獎勵。結果表明,本建模方法在復雜不確定任務中有效預測性能,且顯著優于文獻現有方法。在線機制增強系統魯棒性,使性能逼近最優,為任務分配領域后續研究提供極具潛力的框架。

付費5元查看完整內容

本文介紹了一種在美國海軍和國防部框架內提高可操作技術(OT)系統安全性和效率的新方法。這項研究由負責作戰能源的海軍副助理部長贊助,旨在解決 OT 系統中異常檢測方面的關鍵差距。本文引入了一個綜合傳感器系統和先進的機器學習(ML)模型,用于分析各種 OT 設備的實時功耗數據。通過從模擬的小規模 OT 環境中開發獨特的非侵入式負載監控(NILM)數據集,本研究率先將成本效益高、易于部署的傳感器陣列與支持向量機、長短期記憶和卷積神經網絡算法等 ML 技術集成在一起。這種集成旨在簡化異常檢測,減輕這些 OT 系統中多種背板協議集成所帶來的復雜性。通過異常表征和定制檢測方法的制定,本文在利用 ML 識別系統故障、設備故障和潛在網絡安全威脅的早期指標方面開創了新的先例。這項工作極大地促進了獨立 OT 系統的安全性和復原力,使其能夠抵御一系列異常現象,為未來對基礎設施至關重要的安全和復原力 OT 系統的發展奠定了基礎。

付費5元查看完整內容

本文比較了幾種神經網絡架構,以逼近一些基本一維偏微分方程的解和求解算子。具體來說,研究了在物理信息機器學習中,殘差層是否比全連接層更有優勢,發現兩者在所考慮的問題上表現類似。還將流行的 DeepONet 和傅立葉神經算子方法與算子學習方法進行了比較,發現雖然兩者在線性問題上的精確度相當,但后者在存在簡單非線性的情況下能生成更精確的模型。

付費5元查看完整內容

本文是研究指揮與控制(C2)未來表現形式的四篇系列論文中的第一篇。第一篇論文通過探討未來指揮與控制(C2)系統需要在其中運行的未來作戰環境,為后續研究設定了基線。具體來說,本文探討了復雜性的驅動因素、表現形式和影響,而此前的研究表明,復雜性很可能是這一環境的特征。為此,它討論了 C2 和復雜性等關鍵術語的定義;介紹了未來運行環境中復雜性的一些驅動因素,并討論了這些因素如何對 C2 系統和組織造成新的壓力;研究了分析和理解復雜性的可能方法;并概述了 2030 年代及以后可能產生的一些實際考慮因素。由于本文旨在為本系列的后續三篇論文提供資料,因此沒有全面涵蓋未來 C2 思考的所有方面,包括提出具體建議。

研究問題

  • 根據當前的全球社會和技術趨勢進行預測,國防和合作伙伴可能面臨的持續競爭和多領域作戰的作戰環境的性質是什么?
  • 基于這種對未來的預測,未來的 C2 系統和組織將面臨怎樣的復雜性;即復雜性的可能來源是什么?
  • 考慮到未來作戰環境的這一特點,未來的 C2 系統和組織需要具備哪些條件?
  • 未來的 C2 系統和組織需要什么樣的新能力和特性才能有效應對這些需求?

有爭議的定義

C2 沒有直截了當的定義,對于該術語在當代作戰環境中的范圍和相關性也存在爭議。對 C2 傳統定義的批判來自于對 21 世紀有效領導力構成要素的更廣泛質疑。在英國、美國和北約,最近出現了大量與 C2 相關的新術語,并將重點從聯合思維轉向多領域思維。我們的研究將 C2 定義為一個動態的、適應性強的社會技術系統,因此有必要考慮組織、技術和人力要素。

同樣,復雜性也沒有一個公認的定義。學術界對復雜性的研究日益增多,涉及多個科學學科,但缺乏統一的方法或理論框架。一個有用的出發點是區分簡單系統、復雜系統、復雜系統和復雜適應系統。文獻還描述了在這些條件下可能出現的所謂 "棘手"或 "超級棘手問題"。還可以對有限博弈和無限博弈進行重要區分--這是考慮作為復雜適應系統的國家間競爭時的一個有用視角。鑒于這些爭論,我們的研究避開了對復雜性的僵化定義,而是從其關鍵屬性的角度對這一現象進行了 DCDC 式的描述。

復雜性的預計驅動因素

未來作戰環境的特征--以及國防 C2 系統和組織預計將執行的任務類型--具有很大的不確定性,因此任何預測都必須謹慎。盡管如此,文獻指出了各種政治、經濟、社會、技術、法律、環境和軍事(PESTLE-M)趨勢,預計這些趨勢將影響國際體系的演變,進而影響 2030 年及以后的國防行動。這些趨勢包括以下宏觀趨勢

  • 日益增強的互聯性、多極化和全球競爭
  • 不斷變化的氣候的影響
  • 技術變革和數字化的影響
  • 傳統和新穎領域的模糊化
  • 國際準則和價值觀的轉變。

最重要的是,沒有一個單一或主要的趨勢推動著變化或復雜性;相反,最令人擔憂的是多種因素的融合及其不可預測的相互作用。這種認識為進一步研究這些趨勢影響國際體系復雜性水平和特征的具體機制提供了基礎,從而為在這一領域開展工作的 C2 帶來了新的挑戰。

復雜性的表現

上述 PESTLE-M 趨勢為未來組織應對 C2 帶來了一系列困境和壓力,包括但不限于

  • 不確定性
  • 模糊性
  • 多義性
  • 信息超載
  • 認知偏差
  • 面對瞬息萬變的事件,決策癱瘓或節奏不足
  • 難以確保決策(包括人工智能)或信任決策所依據的數據、邏輯和假設
  • 難以調動所有必要的權力杠桿,或協調參與制定和執行特定戰略或行動計劃的大量不同參與者(如跨政府合作伙伴、行業、國際盟友、公民)。

此外,無論是理論家還是實踐者,在處理包含非線性動態的問題時,都缺乏有力的措施來衡量所做決定或采取的行動的有效性。因此,很難確切地說未來作戰環境中的復雜性是否在客觀上不斷增加(而不是以不同的形式出現),但對軍隊應處理的復雜任務的政治期望與當前 C2 方法的執行能力之間顯然存在巨大差距。當前的學術理論為決定如何在復雜環境中配置 C2 提供了一個方法工具包的初步輪廓和一些指導原則,但并沒有提供靈丹妙藥。該理論強調審議分析方法,即讓不同利益相關者參與共同設計、借鑒多學科和知識體系的見解,并在分析和決策過程中建立靈活性,以便根據反饋意見不斷迭代和改進的方法。

未來 C2 的實際考慮因素

要應對復雜的自適應系統,就必須摒棄當前的線性 C2 流程和等級結構,盡管在處理非復雜任務和問題時,更傳統的方法可能仍然有用。在競爭激烈的世界中,英國既需要培養能夠對他人施加建設性影響的特性和能力(例如,將復雜性強加給對手的 C2),也需要培養能夠增強自身駕馭復雜性能力的特性和能力。

要影響敵對行動者的觀念、決策和行為,首先要深入了解其 C2 結構、流程和文化。根據這種了解,英國國防需要一套動能和非動能杠桿,對敵方的 C2 施加建設性影響,包括施加復雜性。除了敵對行動者,英國國防部還需要進一步了解如何對 PAG、盟友、合作伙伴、工業界、學術界、公民和對 C2 采取截然不同方法的其他人施加建設性影響。

在增強英國自身應對復雜性的能力方面,未來的 C2 系統和組織必須促進靈活性、復原力以及學習和適應能力等特性。整個決策周期都需要變革。例如,傳感器和通信技術的進步為獲取更多深度和廣度的數據提供了機會,包括有關復雜問題的數據。因此,提高認知能力對于理解所有這些數據至關重要,既要利用人類和機器的優勢,又要減少各自的缺點。要改變決策方法,還需要改變領導風格,以培養更善于駕馭復雜適應系統的決策者。在做出決策或計劃后,提高跨部門或跨層級的能力,在實施階段更好地整合活動或匯聚效應,對于抵消英國的局限性(如在質量方面)至關重要。

同樣,整合也不是萬全的;如果國防缺乏足夠深度的力量和能力,無法在充滿敵意的威脅環境中采取可信行動或維持高節奏行動,那么即使是最高效的指揮控制系統也無法在未來取得成功。此外,還需要采取防御措施以及恢復和失效模式,以阻止或減輕敵方破壞 C2 系統和組織的努力所造成的影響。鑒于所面臨的威脅,以及英國國防可能需要解決的不同形式的復雜問題,很可能會同時出現多種并行的 C2 模式,而不是單一的方法。應對復雜性意味著不斷學習、適應、創新和開放求變。因此,必須從一開始就將效果衡量標準、信號和變革機制納入計劃以及 C2 系統和組織,使其能夠隨著時間的推移不斷學習和調整,以應對各種情況。至關重要的是,未來 C2 系統和組織的設計只是挑戰的一部分--它們還必須得到更廣泛的國防企業緊急改革的支持,以確保獲得所需的使能因素(人員、技術等)。從 C2 的角度來看,這本身就是一個挑戰,因為改變這個企業--一個復雜的適應性系統--本身就是一個棘手的問題。

結論和下一步行動

學術理論家和政府、軍事或工業從業人員對復雜性或復雜適應系統的理解并不全面,而這正是未來 C2 運行環境的特點。雖然文獻提供了處理復雜性的有用方法和工具,以及未來 C2 的一些初步設計考慮,但英國 C2(本身就是一個社會技術系統)的現代化和轉型將是一項高度復雜的工作。這意味著要與不斷發展的作戰環境、不斷變化的威脅和技術環境共同適應,從而進行迭代和不斷學習。因此,最緊迫的挑戰或許是,考慮到 C2 系統在未來面對復雜性時取得成功所需的轉型(技術、結構、流程、文化、教育等)的程度和性質,了解如何在一段時間內最好地引導這一過程。

自相矛盾的是,要克服實現以應對復雜性為目標的 C2 系統所面臨的障礙,可能需要英國國防部已經表現出其所尋求建立的系統的許多特征。面對這樣的循環邏輯,英國國防部可能需要某種外部沖擊來迫使其進行創造性的破壞,或者利用(或不顧)更傳統、線性的 C2 方法來啟動自身的激進改革努力,并隨著時間的推移,隨著變化的到來而進行調整。

付費5元查看完整內容
北京阿比特科技有限公司