在技術飛速進步、市場波動加劇與全球性中斷頻發的時代,有效供應鏈管理需創新方法應對不確定性、復雜性與動態變化。本研究開發并應用一系列新型智能決策支持系統(IDSS),以解決中斷環境下的大規模隨機動態供應鏈網絡問題。通過電子商務、制造業、醫療健康與可持續性等多元領域案例驗證所提系統,具體提出四類彈性IDSS框架:集成先進優化算法、機器學習、強化學習與物流仿真技術,應對重大供應鏈中斷的現實挑戰。首個系統通過移動倉庫與眾包配送優化城市末端配送,顯著降低配送時間、成本與環境影響;第二系統開發多階段隨機動態規劃模型增強全球供應鏈彈性,優化不確定性下的物流運作;第三系統聚焦公平高效疫苗分配,采用數據驅動決策降低短缺風險;第四系統設計穩健可持續的口罩分發與回收網絡,平衡成本效益、環境影響與客戶服務。研究整合精確方法(如并行化隨機對偶動態整數規劃PSDDiP)、強化學習與混合優化策略,在保障可擴展性與計算效率前提下,提升大規模供應鏈實時彈性決策能力。既有IDSS多缺乏此類集成,或未考慮中斷場景,亦未經過大規模實時驗證。實證表明彈性IDSS在提升響應速度、時間管理與成本效益方面潛力顯著。中斷事件中數據可用性缺口與決策動態適應機制的研究,為政策制定者與實踐者提供新洞見。例如,所提在線強化驅動自適應優化(ORDAO)方法,相較交互式多智能體仿真(IMAS)可減少11%配送時間完成同等訂單量。
本論文通過開發整合數據驅動模型、優化算法、仿真與機器學習的IDSS,推動大規模供應鏈物流運營的彈性與可持續性。第二章提出基于隨機建模、行程時間仿真、眾包運力深度學習與強化學習的末端配送IDSS;第三章構建含風險對沖策略的多階段隨機制造供應鏈模型及并行SDDiP算法;第四章設計醫療領域實時需求預測與動態庫存疫苗分發系統;第六章開發閉環供應鏈內口罩可持續分發與回收的魯棒-隨機模型。第五章總結成果,闡明核心貢獻,討論模型局限并展望未來方向。整體研究為行業定制IDSS提供統一框架,增強不確定性下的適應與響應能力。
復雜工程系統的早期設計決策對系統全生命周期性能、成本及可行性具有決定性影響。隨著工程系統日益呈現信息物理化、多學科交叉與高度互聯特征,基于歷史數據與專家判斷的傳統決策方法常顯不足。為應對早期設計決策挑戰并優化決策質量,模型驅動決策支持系統(DSS)作為集成仿真、優化與數據驅動模型的工具應運而生。然而在復雜工程系統語境下,社會技術性挑戰仍制約DSS的有效實施。本論文通過文獻綜述與工業實證案例研究系統化識別六大核心障礙:
1.跨粒度異構仿真模型集成面臨技術方法論雙重挑戰
2.工程領域間DSS成熟度差異限制協同環境應用
3.非專家用戶因可訪問性差與界面不直觀導致可用性不足
4.實時反饋機制缺失削弱其作為"邊界對象"的功能
5.模型成熟度與可靠性評估指標缺位引發決策誤判風險
6.底層模型演進、可追溯性及可靠性的全生命周期管理缺失
??## 結構??
本論文由7章正文與4篇附錄論文構成,各章內容如下:
??第二章 研究方法論??
論證設計研究方法論(DRM)與參與式行動研究(PAR)對本研究的適配性,繪制研究論文與DRM階段映射關系,通過"關聯貢獻域"(ARC)圖示展現研究的理論框架。
??第三章 理論基礎??
闡述復雜工程系統早期設計決策、基于模型的系統工程、決策支持系統、權衡空間探索及體系仿真范式(含離散事件仿真DES、離散元法DEM與參數化仿真方法)等核心理論。
??第四章 附錄論文綜述??
解析4篇支撐論文的研究焦點(輪式裝載機工程裝備與郵輪艙室案例)、作者在仿真開發與模型驗證中的角色及其對本論文目標的貢獻路徑。
??第五章 綜合成果??
整合實證研究成果,通過工程裝備與船舶案例闡明仿真集成、可持續性指標與復雜工程決策的交互機制。
??第六章 討論與啟示??
評述所提方法的實踐相關性,批判性分析研究局限性與學術探索中的經驗教訓。
??第七章 結論與展望??
凝練研究問題的系統性解決方案,探討工業應用前景,并規劃未來研究方向。
分層多智能體系統(HMAS)通過層級化結構組織智能體集群,有效管理復雜性與規模擴展。此類層級架構雖能簡化協調流程,卻常伴隨隱性權衡。本文提出五維分類體系:控制層級、信息流、角色任務委派、時間分層及通信結構,其核心價值在于提供跨方案比較框架而非指定"最優"設計。該分類法關聯具體協調機制——從經典任務分配的合同網協議到新興分層強化學習研究,并以電網、油田作業等工業場景佐證框架實用性:生產層、維護層與供應層智能體通過協同實現油井故障診斷或能源需求平衡。案例表明層級結構可在保障局部自主性前提下達成全局效率,但平衡點極為微妙。文末提出開放挑戰:實現人類可解釋的層級決策、超大規模智能體集群擴展、以及大語言模型等學習型智能體安全融入分層框架的可行性評估。本論文首創融合結構、時間與通信維度的分層MAS統一設計框架,構建經典協調機制與現代強化學習及大語言模型智能體的理論橋梁。
人工智能的現代應用常需多智能體在復雜環境中協同作業。分層多智能體系統(HMAS)通過層級化組織架構協調大規模智能體集群,已成為高效的系統設計范式。在HMAS中,高層智能體(或智能體團隊)通常監管協調低層智能體,形成類人類組織層級的指揮鏈。該架構優勢體現在三方面:首先解決可擴展性問題——當智能體數量激增時,純扁平化(完全去中心化)結構易受通信開銷與全局一致性制約,而通過中間"領導者"智能體實施分治策略可有效管理復雜度。分層機制賦予特定智能體更高責任權重,實現任務需求靈活適配與大規模MAS高效管控。例如自動駕駛領域提出的"區域領導者"架構:頂層智能體優化路網全局目標,區域領導者協調局部交通流。其次支持差異化抽象層級與時間尺度的決策:高層智能體執行寬時間跨度的抽象規劃(如任務規劃),低層智能體實施精細動作控制(如運動控制),提升系統整體一致性。第三促進結構化協調與沖突消解:明確權責關系(指揮鏈)與通信路徑,規避完全平等型團隊常見的決策遲滯或振蕩現象。正如Malone與Crowston經典論述所指:協調本質是管理活動間依存關系——當存在結構化監督機制時該過程顯著簡化(Malone and Crowston, 1994)。
分布式AI與多智能體系統的早期研究已證實組織設計對性能的影響。學界通過分析層級、團隊、聯盟、全息及市場等組織范式權衡優劣,尤其揭示層級組織(常通過管理者-工作者模式或樹狀拓撲實現)能以部分魯棒性為代價提升全局效率;而完全去中心化的"團隊"組織雖最大化韌性平等性,卻在大規模群體中效率受限。最新研究凸顯混合架構的復興趨勢——融合分層與去中心化協調機制以兼取二者優勢。行業投資數據佐證該趨勢:2024年Q1多智能體系統領域通過超1100筆交易獲122億美元融資,彰顯醫療、交通、金融及國防等千億級市場對MAS變革潛力的持續信心(Aalpha, 2025)。Sun等人2025年的深度研究指出"分層與去中心機制的混合策略"是實現可擴展性與適應性平衡的關鍵路徑,印證本文分類方法的科學價值。事實上層級結構在自然界(如具工蜂-蜂后層級的昆蟲社會)與人類社會(企業組織架構)普遍存在,表明精心設計的層級可顯著增強多智能體AI系統的協調效能。
除結構優勢外,HMAS更契合人機交互需求。在能源運營、軍事指揮等任務關鍵型領域,人類監督員管理AI智能體、智能體再管控底層自動化流程的分層模式,既映射現實管理結構,又為人機協作提供意圖注入節點。通過明確定義人類操作員(戰略決策者)與自主智能體(戰術執行者)角色,層級架構促進人機高效協作。但該集成亦引發新挑戰——系統需向上提供可解釋性(確保人類理解智能體決策)并建立信任機制保障可靠委派。
面對多智能體應用規模與復雜度的持續增長(從含數百分布式能源的智能電網,到自動駕駛車隊,再到自適應供應鏈),亟需建立分層多智能體系統的系統性分類與設計指南。現有MAS分類法(如按團隊規模、通信拓撲、智能體異構性劃分)基礎上,本文提出聚焦層級組織模式及其協調機制的升級版分類體系。該研究融合經典框架(如Smith 1980年提出的任務分配合同網協議及MAS組織理論)與前沿成果(分層多智能體強化學習、大語言模型智能體),以多維視角勾勒HMAS設計空間,明晰系統架構師的抉擇與權衡。分類體系植根現實應用(尤以作者深耕的能源與運營領域為典型),通過油田監測分層MAS、微電網控制等工業案例實證設計范式的實用價值。文末指出現代AI能力與層級結構交叉衍生的研究議題:如何在深度分層系統中維持全局透明度?如何將大語言模型智能體的推理能力融入傳統層級架構?本成果貢獻了橫跨控制、信息流、角色/任務委派、時間分層、通信結構五維度的統一分類法,并顯式關聯協調機制與工業部署,為研究者與系統架構師提供超越既有綜述的實用設計透鏡。
隨著機器人技術日益精進,亟需發展能與人類隊友及其他機器人交互協作的智能系統。本研究旨在探索多智能體(含人類與機器人)協同框架,聚焦智能體間交互層級與隊友信息推斷機制。首先在協同導航范疇內研究單人-單機器人協作,該場景需直接人機交互與隊友狀態推斷。考慮人機需穿越環境抵達共同目標的情境,提出兩種觸覺引導系統:通過力反饋向人類提供避障與路徑建議,各具計算效率與路徑最優性優勢。解析與實驗證明該方法能同步保障避障與目標引導功能。
首項工作解決雙智能體協作后,后續研究轉向多智能體協作——該場景下人機交互有限且隊友信息層級各異。針對異構多智能體團隊(各機器人具不同感知/資源能力),提出控制策略以實現復雜動態任務分配,使團隊能適應任務變化與成員變動。分布式架構支持大規模應用,分析表明策略可在動態環境中收斂至最優解,仿真與硬件實驗驗證其性能媲美基準算法。
第三章3.2節提出地面機器人協同遙操作觸覺引導算法,僅提供必要反饋。融合避障功能(障礙物排斥力)與路徑引導功能(建議路徑吸引力),建議路徑由非完整約束快速擴展隨機樹(RRT*)算法生成。突破傳統觸覺遙操作范式,首次提供避障安全性解析證明(用戶遵循力反饋時可規避碰撞)。
第三章3.3節將RRT采樣樹融入控制李雅普諾夫函數(CLF)框架,生成運動學可行路徑的觸覺建議。為保障安全,引入控制屏障函數(CBF)提供防撞指引而無需重采樣RRT樹。解析證明當用戶遵循力反饋時,CLF驅動力可引導機器人從環境任意點抵達共同目標。
第四章實現多機器人團隊持久自適應覆蓋控制,服務于動態異構任務需求(可泛化至各類資源補給算法)。通過解析證明區位成本最小化與需求輸入-狀態穩定性。為確保持久性,提出分布式補給算法——兼容異構團隊并利用需求與資源水平預測,顯著降低服務中斷率。
第五章構建多機器人響應離散異構事件框架:通過任務執行建立個體信譽度,據此生成加權維諾分區。采用核密度估計(KDE)動態更新事件密度函數以適應需求變化,證明維諾生成器收斂于加權區位成本臨界點。針對時限任務,提出蟻群系統(ACS)啟發的任務排序算法,證明其高概率收斂至最優解(該解在最小化機器人能耗同時,優先保障緊急時限任務)。
第二章闡述符號體系與數學基礎;第三章詳述兩種人機協同導航方法;第四章提出多資源分配覆蓋控制策略;第五章以智能體信譽度為核心構建時限/非時限任務服務機制;第六章總結并展望。附錄A收錄符號索引。
圖1·2:本論文研究協同自主性的三種實現形態。第四章與第五章探討多智能體協同團隊(上圖),第三章解析人機協同導航(下圖)。
本論文探討生成式人工智能(GENAI)——特別是大語言模型(LLMs)與小語言模型(SLMs)——對供應鏈管理(SCM)決策制定的革命性影響。傳統AI工具通常通過結構化預測分析支持SCM,而GENAI為構建更敏捷穩健的供應鏈(SC)引入了動態場景生成、實時優化及非結構化數據解析等新能力。本研究通過系統文獻綜述(SLR)識別GENAI在SCM整合中的當前應用、實施挑戰與研究缺口。一方面,SLMs在特定領域低資源需求任務中展現巨大潛力,尤其契合中小企業需求;另一方面,LLMs擅長需求預測與環境社會治理(ESG)合規等數據密集型戰略任務。為助力企業應用GENAI,本研究構建五步實施框架,支持不同數字化水平組織在SCM運營中部署GENAI。研究強調SLMs在SCM中的關鍵價值,揭示其作為促進全球供應鏈數字化轉型與可持續變革加速器的可能性。為確保技術進步與負責任創新同步,本研究深入剖析AI實施的社會、環境及倫理影響,致力于通過提供適配不同數字背景企業的定制化框架,為多元SCM場景的AI應用貢獻理論與實踐價值。
企業供應鏈(SC)是由采購、生產、物流與分銷等相互關聯活動構成的復雜系統。傳統運營依賴基于歷史數據的規則系統與確定性模型進行協調執行,確保貨物流與服務流從源頭至終端的效率。盡管近年數字化技術廣泛應用,現代供應鏈日趨復雜多變,多數企業仍固守僵化的傳統企業系統(Spanaki等,2025)。
人工智能在SCM中的應用日益廣泛,旨在提升預測精度、自動化常規任務及支持優化決策。然而傳統AI系統存在顯著局限——處理實時數據與非結構化信息能力不足。相較之下,涵蓋LLMs與SLMs的GENAI技術帶來全新能力:通過模擬現實場景、解析自然語言指令及整合多源數據,實現自主適應性決策(Dubey等,2024;Richey等,2023)。Jackson等(2024)指出,GENAI可跨多供應鏈領域提供主動決策支持,突破傳統AI僅限于預測性活動的局限。
全球供應鏈網絡對可持續性、敏捷性與韌性的迫切需求驅動本研究。地緣政治動蕩、供應短缺、需求波動及環境問題等中斷事件的頻發與加劇,持續挑戰現代供應鏈體系(Sunmola & Baryannis,2024)。企業亟需在提升運營效率的同時,具備風險預判與實時響應能力。這構成GENAI有望解決的核心命題:GENAI雖為增強供應鏈智能、提升響應能力及推動數據驅動決策創造重大機遇,但其在供應鏈場景的實施面臨嚴峻障礙(Dubey等,2024),包括高昂算力成本、強數字基建需求、隱私隱患、模型偏見及AI結果過度依賴風險(Jackson等,2024)。組織間(尤其大型企業與中小企業)數字成熟度差異進一步加劇技術可用性與可擴展性擔憂。本研究旨在識別GENAI整合入SCM的潛在效益,同時應對相關挑戰與風險,評估不同數字化階段企業如何有效利用GENAI技術增強決策能力,重點關注可持續性、可擴展性與運營效率。
盡管數字技術對SCM的重要性日益凸顯,當前供應鏈決策流程仍主要基于規則、分散化且被動響應。多數企業僅依賴電子表格、靜態企業資源規劃(ERP)系統及人力密集型工作流——這些工具在當今復雜多變的供應鏈環境中已被證實力不從心。因其無法納入非結構化數據與實時信號,此類方法難以應對預測、場景規劃及解決方案推薦等挑戰。本論文通過探討SCM運營如何從"人力主導"轉向"人機協同"決策模式填補關鍵研究空白——即人員與GENAI系統(特別是SLMs與LLMs)協作決策。相較于傳統工具,這些模型能生成新信息以模擬場景、綜合多源數據并主動支持戰略與運營決策(Zheng等,n.d.)。然而此類模型與SCM的整合面臨多重挑戰:供應鏈各環節存在數字成熟度差異、勞動力技能局限、數據基礎設施碎片化、倫理與環境風險及技術能力缺口。專家關注的模型可解釋性、互操作性及組織對GENAI輸出的信任問題,進一步加劇人機協同決策的實施難度。SLMs雖具輕量化與領域特異性優勢(Li等,2024),但其在供應鏈中的應用潛力尚未充分探索;而LLMs常需遠超中小企業承受能力的算力資源(Li等,2023)。這些動態機制引發關鍵問題:如何根據企業能力適配GENAI部署,在降低過度依賴風險、確保透明度及限制技術獲取不平等方面取得平衡。
本研究核心目標是檢驗GENAI(特別是LLMs與SLMs)對SCM可持續性與決策制定的潛在影響。通過定向文獻綜述,闡釋這些AI模型如何影響關鍵SCM運營及增強決策能力;結合系統文獻綜述評估現有指南、框架或路線圖能否指導不同數字成熟度企業實施GENAI輔助供應鏈決策。
具體目標包括:
? 論證SLMs與LLMs如何優化采購、風險管理、物流及預測等核心供應鏈運營
? 剖析不同數字成熟度企業部署GENAI的主要風險與挑戰
? 設計可擴展實施框架,通過包容性部署與風險緩釋策略實現GENAI能力與企業數字準備度的匹配
本研究旨在探究GENAI(尤其是LLMs與SLMs)如何通過增強核心供應鏈任務決策來化解相關風險與局限。通過開發契合GENAI接受度與企業數字準備度的實用可擴展框架,彌合技術能力與戰略需求間的鴻溝。本論文通過界定LLMs與SLMs在多元供應鏈環境中支持負責任創新與公平獲取AI決策的路徑,深化GENAI在SCM中的理論認知,助力企業提升運營效率、數字適應力與可持續性,為學術研究與實踐應用提供雙重價值。
態勢感知(SA)是通過感知、理解與預測環境要素的連續過程,構成復雜系統的重要組件。環境信息接收具有持續性與多模態特性,人工智能技術通過將SA目標拆解為數據融合、表征、分類及預測等任務,提供更高效穩健的支撐。本文系統綜述應用于各類環境與場景中構建、增強及評估SA的AI與多模態方法,重點聚焦感知完整性與持續性提升。研究表明人工智能與多模態方法的融合顯著增強了復雜系統的感知與理解能力,但在未來態勢預測與多模態信息有效融合方面仍存研究缺口。本文總結AI與多模態技術實現SA的應用案例與實踐經驗,并提出未來展望與挑戰,包括更全面的預測能力、更強的可解釋性及更先進的視覺信息處理技術。
圖1所示。基于人工智能和多模態技術的態勢感知系統概述。
軟件質量標準要求嚴苛,因其驅動全球眾多系統且需確保安全穩健。軟件開發意味著需遵循高標準并適應需求與依賴項的變更。所幸軟件工程的繁重任務可實現部分自動化,尤其隨著生成式人工智能的最新進展。本論文探索自動化代碼維護方法,聚焦"基于大型語言模型的軟件工程"(LLM4SE),通過模型內部優化與模型間通信推進轉換器模型在檢測修復軟件缺陷中的應用。此處"缺陷"涵蓋執行故障與源代碼錯誤,"源代碼"指軟件產品的原始代碼或程序。核心貢獻包括:開發輕量級轉換器變體用于代碼分類;提出兩套自動化程序修復框架;反思LLM4SE研究的可持續性與透明度。研究首先開發編碼器層組合方案(編碼器屬轉換器類型)用于代碼分類。實驗發現輕量剪枝版CodeBERT變體微調耗時減少至1/3.3(微調指在領域數據上訓練模型),且性能更優——缺陷檢測準確率最高提升2個百分點(滿分100),優于全尺寸模型常規用法。該結果推動語言模型在軟件工程中的能效應用,證明全尺寸模型的"通用方案"對代碼正確性分類等簡單任務并非必需。
除錯誤檢測外,本文呢聚焦生成代碼與人寫代碼的缺陷修復。所提SEIDR框架包含"合成-執行-指導-調試-排序"模塊,實現生成代碼的實時修復,彰顯LLM在"生成-修復"循環中的價值。此循環中,LLM通過代碼執行、失敗測試用例及錯誤日志獲取反饋,最終生成全功能代碼。采用Codex(基于代碼訓練的GPT-3)的SEIDR在程序合成基準測試中解決25項任務的19項,優于前沿遺傳編程算法。論文還提出新型"循環翻譯"(RTT)修復管線。與SEIDR不同,RTT專為修復已存在缺陷的生成/人寫代碼設計,通過將缺陷代碼轉譯至其他編程語言/自然語言再回譯至原語言實現修復。其理論依據是:轉譯過程可能因"均值回歸"現象消除缺陷("均值"指模型訓練數據中普遍存在的無缺陷代碼)。實驗證明:LLM驅動的RTT管線在多個基準測試中解決46個微調模型未能修復的獨特缺陷。此能力使RTT成為多智能體程序修復體系的候選方案——各智能體以不同方法協同維護無缺陷代碼。論文還綜述LLM4SE文獻,反思能效與模型復用可能性:僅27%的論文共享代碼、模型及估算訓練能耗所需完整細節,凸顯遵循開放可復現研究準則的重要性。鑒于LLM存在隨機性等局限,本研究提供實證結果而非理論保證,并討論過度使用LLM的風險(如工具依賴、生成代碼漏檢、基準測試數據污染等)。整體而言,本研究推動LLM適配軟件工程任務,為多智能體系統與多模態模型的自動化代碼修復指明方向。
論文結構
第二章從軟件開發生命周期視角綜述軟件工程自動化背景;第三章概述自然語言處理及LLM架構進展;第四章總結LLM4SE方法、進展與挑戰;第五章闡明研究范圍與機遇(5.3節詳述研究問題、挑戰及對應出版物關聯,5.4節匯總出版物與問題解答);第六章討論有效性威脅、局限、科研與產業影響及未來工作;第七章總結核心結論。為提升可讀性,各背景小節均附框內摘要,研究問題答案與關鍵發現亦作相同標注。
本研究通過評估六種標準管理方法在信息技術(IT)投資生命周期各階段的應用適配性,解決如何優化選擇方法論以應對新型IT技術的決策挑戰,從而實現核心流程的價值優化。在當前實踐中,價值無差異的成本優化常驅動企業下級營利部門及非營利機構(如國防部)的IT投資決策,根源在于通用會計、財務和經濟方法無法量化IT在核心流程中創造的價值。本研究旨在為決策者提供六種方法論指導,使其能在缺乏歷史數據預測結果的情況下,對新型IT技術實現價值感知型優化投資。面對歷史數據缺失的困境,決策者運用六種標準管理方法預測核心流程性能變化(尤其是投資回報率)面臨更大挑戰。本研究成果包括各生命周期階段最優方法論應用指南,以最大限度提升新型IT投資成效。研究以前沿遠距機器人系統強化前推部署戰地維修(FDCR)核心流程為概念驗證案例,展示了IT投資生命周期中創新機遇的實踐指導框架。
采用有效、可靠且可比的方法預測信息技術(IT)投資價值,持續挑戰著IT經濟研究者與實踐者。現有融合標準會計、財務與經濟學的評估方法,在量化優化核心流程的IT投資效益時存在顯著局限。癥結在于標準投資方法對價值度量的假設缺乏支撐或精確性(例如未在流程層面采用比率尺度價值指標),導致決策者難以預測優化核心流程的IT技術潛在效能。此類價值假設缺陷因缺乏子組織核心流程層級的比率尺度價值標準,常致使投資無法達成預期效益,在國防部等非營利機構中尤為凸顯。若決策者能精準匹配各類管理方法與IT投資生命周期階段,將極大優化IT投資決策成效——例如根據方法適用性指導流程改進,從而實現更科學的遠距機器人等新興技術投資組合管理。正如海軍作戰部長吉爾戴上將(2022)"求真務實,精益求精"戰略所強調:高效統籌財務、人力與IT資源對實現資源優化利用目標至關重要;而運用IT技術重構核心流程,可助力海軍機構通過提升流程效率實現"精益求精"目標。
本研究基于有效可靠比率尺度——以前推部署戰地維修(FDCR)核心流程生產率的價值、成本及周期時長為度量標準——攻克IT投資決策難題。這些指標通過測算投資回報率(ROI)與核心流程周期時長,為投資決策提供關鍵性能數據支撐。研究進一步驗證六種管理方法(平衡計分卡、業務流程再造、知識價值增值、掙值管理、集成風險管理、精益六西格瑪)如何引導IT投資生命周期各階段:通過在FDCR核心流程應用遠距機器人技術,驅動正向投資回報率與周期時長優化。
研究核心問題與價值 本研究聚焦如何運用六種方法論提升IT投資生命周期成效,并以FDCR流程案例實證分析。軍事領域的痛點在于:軍用裝備前推部署戰地維修(FDCR)流程未能實現效率優化,導致可用裝備數量不足而影響戰局勝利。深層癥結在于:投資決策者未有效運用六種方法論,致使FDCR核心流程IT投資未達最優,進而削弱裝備戰備狀態。本研究旨在通過FDCR場景實證,展示六種方法論如何支撐IT投資生命周期決策機制。其戰略價值在于:改進IT投資決策可使國防部在分析替代性IT實物期權組合時,更高效配置有限資源,最終提升裝備戰備水平。
本研究對照美國防部核心流程中對新型IT投資決策精準評估的普遍需求。通過遠距機器人系統投資案例,實證對比六種方法的優勢、局限與應用邊界:重點展示知識價值增值(KVA)與集成風險管理(IRM)定量分析如何預測目標模型(To-Be)相較于現狀模型(As-Is)的價值增量。目標模型構建完成后,采用實物期權組合分析法(Mun, 2024a)評估該技術方案的風險維度(即ROI指標波動性)及未來潛在價值增益——此步驟對軍事決策層至關重要,因遠距機器人投資方案需與眾多替代方案競爭預算資源。優化結果表明:遠距機器人顯著提升FDCR的投資回報率、周期時效及任務達成率。
知識貢獻與實踐價值 本研究核心知識貢獻在于:基于各類方法論的優劣勢分析,構建六種方法論與IT投資生命周期的優化映射模型。實踐價值則是建立支撐IT投資全周期的決策框架,該框架可輔助管理層評估技術方案對核心流程的價值增益潛力。在遠距機器人案例中具體映射關系如下:
上述方法長期廣泛應用于軍事決策層IT投資管理,故被選為本研究支撐框架的方法論基礎。研究特別論證KVA對FDCR現狀模型的基準構建價值:首階段提供當前流程ROI與周期時效量化分析;次階段通過同方法論預測應用遠距機器人后的目標模型性能表現。
多機器人協同與協作是提升團隊能力并實現自主建造、農業及未知大區域持續作業等應用場景新型任務的關鍵行為。本研究以“多機器人資源分配問題”為背景探究此類行為,該問題要求將機器人分配至待服務區域。我們尤其關注適用于大規模多機器人團隊的“容錯性方法”。我們引入一種基于圖的建模框架用于多機器人資源分配問題,該框架在表征“區域間關系”與“獎勵模型”方面具有前所未有的豐富性。首先,針對“多智能體覆蓋控制問題”,通過圖神經網絡(GNN)引入“基于圖的計算方法”,其利用學習型智能體間通信策略,在性能與可擴展性上顯著提升。隨后,研究需要顯式協同的“復雜多任務場景下多機器人任務分配問題”,提出一種“基于網絡流的規劃方法”,可在數秒內為大規模問題生成高質量解。進一步將該方法擴展至在線場景,支持任務失敗與意外觀測時的動態重規劃。實證研究表明,這些建模方法與算法通過挖掘多機器人問題中的本質圖結構特征,實現了性能突破并推動領域技術前沿發展。
圖:任務圖(底部)展示任務間優先關系。高亮部分為任務子集,顯示“聯盟職能”(紅色)與“優先關系”(藍色)。例如,在執行“運輸建筑材料”任務前,機器人需在布滿碎片的工地“尋路或清障”。路徑質量直接影響團隊運輸效率;而運輸表現(如材料損毀情況)將決定后續“施工任務”的執行速度與質量。?
第一章將本研究置于“多機器人資源分配”領域框架內。首先,提出多機器人資源分配領域內的問題分類體系,沿著“任務表征抽象度”維度梳理問題模型及其對應研究方法。隨后,深入綜述與“多機器人覆蓋控制”及“多機器人任務分配”密切相關的文獻,這些成果為本研究提供了核心理論支撐。??
??第二章《基于圖神經網絡的多機器人系統覆蓋控制》提出一種創新方法,解決“感知半徑受限條件下的多機器人覆蓋控制”問題。相較于文獻常用基準控制器,該方法通過智能體間通信機制顯著提升控制器的性能與魯棒性。為實現這一目標,在機器人間通信網絡上部署圖神經網絡(GNN),訓練其預測集中式全知控制器的輸入指令,從而生成能夠通過智能體通信應對復雜覆蓋控制場景的控制器。實驗證明,該控制器性能顯著超越基準方法,且具備優異的可擴展性與泛化能力。首次構建基于全球城市真實興趣點特征的覆蓋控制問題數據集,并用于算法驗證。這是圖神經網絡學習型控制器在多機器人覆蓋控制領域的首次應用,展現出巨大潛力。??
??第三章《具有任務優先關系的多機器人協同與協作》針對“多機器人任務分配(MRTA)”問題提出新型建模框架與求解方法體系。首次將“優先級約束”與“多機器人任務”納入MRTA問題,構建名為“任務圖”的建模框架——以圖節點表示任務,邊表示任務間優先級關系。該框架包含的“獎勵模型”能通過豐富函數空間表征關聯任務性能間關系及任務分配聯盟規模與任務績效間關系。基于此模型,開發出利用網絡流優化的任務分配解決方案,其求解速度較現有方法提升數個量級,且計算復雜度與任務執行機器人數量無關,可擴展至無限規模團隊。實驗表明,該方法在保證解質量的同時實現計算效率突破,為任務分配建模框架作出根本性貢獻。?
在第四章中,拓展了多機器人任務分配(MRTA)方法,提出《在線環境下的多機器人優先關系協同與協作》。本章沿用相同“任務圖”模型與“基于流網絡的求解方法”,將其置于在線框架以提升系統魯棒性與性能,并通過高保真仿真器驗證方案有效性。核心在于,在原有MRTA問題中引入“不確定性”考量——任務可能隨機失敗或產生求解器未預期的隨機獎勵。依托流網絡方法的高速求解優勢,以迭代方式重構求解流程,使系統能夠基于已完成任務的獎勵觀測實時重規劃。該方法顯著提升了存在環境不確定性時的規劃性能,甚至因解空間擴展在零誤差條件下進一步優化結果。在高保真城市環境多智能體仿真器中驗證了該在線方法及離線流網絡方法,其中任務獎勵基于仿真器內物理現象量化。實驗表明,該建模方法能有效預測高不確定性復雜任務的性能表現,且相較文獻方法具有顯著優勢。在線框架為原有方案注入魯棒性,并將性能提升至接近最優水平,為任務分配領域持續研究提供了極具前景的框架。?
配備先進傳感器的無人平臺的集成有望提高對態勢的感知能力,緩解軍事行動中的 “戰爭迷霧”。然而,管理這些平臺涌入的大量數據給指揮與控制(C2)系統帶來了巨大挑戰。本研究提出了一種新穎的多智能體學習框架來應對這一挑戰。該方法可實現智能體與人類之間自主、安全的通信,進而實時形成可解釋的 “共同作戰圖景”(COP)。每個智能體將其感知和行動編碼為緊湊向量,然后通過傳輸、接收和解碼形成包含戰場上所有智能體(友方和敵方)當前狀態的 COP。利用深度強化學習(DRL),聯合訓練 COP 模型和智能體的行動選擇策略。本文展示了在全球定位系統失效和通信中斷等惡劣條件下的復原能力。在 Starcraft-2 模擬環境中進行了實驗驗證,以評估 COP 的精度和策略的魯棒性。報告顯示,COP 誤差小于 5%,策略可抵御各種對抗條件。總之,本文貢獻包括自主 COP 形成方法、通過分布式預測提高復原力以及聯合訓練 COP 模型和多智能體 RL 策略。這項研究推動了自適應和彈性 C2 的發展,促進了對異構無人平臺的有效控制。
圖 1:(左)虎爪情景中的狀態示例。(右圖)每個智能體的感知(本地觀察)和它們之間的通信聯系。
配備先進傳感器的無人平臺的集成為減輕 “戰爭迷霧 ”和提高態勢感知能力帶來了希望。然而,管理和傳播來自此類平臺的大量數據對中央指揮與控制(C2)節點的信息處理能力構成了巨大挑戰,特別是考慮到隨著平臺數量的增加,數據量也會呈指數級增長。目前的人工處理方法不適合未來涉及無人平臺群的 C2 場景。在本研究中,我們提出了一個利用多智能體學習方法來克服這一障礙的框架。
我們考慮的框架是,智能體以自主方式相互通信(以及與人類通信),并以數據驅動的方式訓練這種通信功能。在每個時間步驟中,每個智能體都可以發送/接收一個實值信息向量。該向量是智能體感知或視場(FoV)的學習編碼。這些向量不易被對手解讀,因此可以實現安全的信息傳輸。
在接收方,必須對信息進行解碼,以恢復發送方的感知和行動。此外,還應將信息整合(隨時間匯總)到 “共同行動圖像”(COP)中。與編碼器一樣,解碼器也是以數據驅動的方式學習的。在本文中,我們將 COP 的定義簡化為戰場上每個友方和敵方智能體的當前狀態(位置、健康狀況、護盾、武器等)。我們認為,COP 對決策智能體至關重要。
近年來,以數據驅動方式進行端到端訓練的人工智能/人工智能方法大有可為。在數據驅動型自主 COP 的背景下,一個優勢是無需對傳感器和執行器中的噪聲、對手的動態等做出建模假設。通過充分的訓練,我們的數據驅動方法將產生高度精確的 COP。
不過,ML 模型可能對訓練數據或訓練場景的偏差很敏感。這與陸軍 C2 場景中通常假設的 DDIL(拒絕、中斷、間歇和有限影響)環境形成了鮮明對比。我們的實驗強調評估對霧增加、全球定位系統失效和通信中斷(如干擾)的適應能力。
我們使用深度神經網絡(DNN)的深度學習實現了編碼器和解碼器的數據驅動端到端訓練。將 DNN 應用于 COP 形成的一個挑戰是通信中缺乏人類可解釋性。人類可解釋性對于人類操作員有效控制蜂群至關重要。例如,通過解釋通信,操作員可以理解蜂群用于(自主)決策的特征。我們的方法具有人機互換性,這意味著人類操作員可以解碼傳入的信息,并將他們的感知編碼,與蜂群進行交流。由此產生的 COP 使人類能夠指揮蜂群。
在實踐中,COP 被大量用于任務執行,例如,確保協調運動。我們假設,將 COP 納入自主決策智能體將產生彈性多智能體策略(例如,對敵方變化的彈性)。我們在實驗中將有 COP 和沒有 COP 的多智能體策略學習與多種最先進的方法進行了比較,并驗證了這一假設。
接下來,我們總結一下我們的方法。我們首先描述了我們的深度學習方案,其中每個智能體將其感知和行動編碼成緊湊向量并進行傳輸。各智能體共享底層嵌入向量空間,以實現對態勢的共同理解。每個智能體都要訓練一個編碼器-解碼器,以生成本地 COP。本地 COP 應與智能體的感知一致,并能預測行動區域內所有單位的狀態(包括位置)。
利用深度強化學習(DRL)技術,在一系列不同的模擬場景、初始部隊配置和對手行動中,對 COP 和智能體策略進行端到端聯合訓練。訓練的輸出是一個編碼器-解碼器神經網絡(NN)和一個跨智能體共享的策略 NN。可通過多種方式對訓練進行配置:最小化帶寬、最大化對干擾(如信道噪聲、數據包丟失、GPS 干擾等)的恢復能力。該方法可用于協調信息收集任務。
實驗在星際爭霸-2(SC2)多代理環境中進行。在 SC2 中模擬的多個藍方與紅方的場景中,我們通過經驗觀察到了該方法的有效性。具體來說,我們在具有挑戰性和現實性的 TigerClaw 情景(圖 1)中測試和評估了我們的方法,該情景由發展司令部陸軍研究實驗室(ARL)和陸軍主題專家(SMEs)在美國佐治亞州摩爾堡的上尉職業課程中開發。
對 COP 的準確性和幻覺進行評估,以揭示有趣的訓練動態。在整個模擬過程中,我們的方法生成的 COP 高度準確,誤差小于 5%(與地面實況相比)。為了測試策略的魯棒性,我們將我們的方法與多種最先進的多智能體 RL 方法和基線進行了比較。結果表明,我們的方法所制定的策略能夠抵御視覺范圍減弱、通信能力減弱、GPS 被拒絕以及場景變化的影響。
總之,這項研究通過數據驅動的 COP 形成,實現了人在環內的異構自主平臺的指揮和控制,并推進了自適應和彈性 C2 領域的發展。其貢獻如下:
圖 3:從學習到的交流中預測 COP 的框架概覽。在決策過程中確定并使用 COP。我們使用 QMIX作為 COP 集成的 MARL 方法示例。
人工智能(AI)和機器學習(ML)為整個技術生態系統提供了新的能力。作為新技術的基礎,最終軟件產品的安全性在很大程度上取決于底層供應鏈的安全性,包括其軟件依賴性。本研究通過對精選的人工智能庫樣本的依賴關系進行漏洞映射,對人工智能/機器學習供應鏈的一部分進行了研究。我們在樣本庫的依賴樹中尋找依賴深度與相應庫供應鏈中發現的漏洞數量之間的關系。我們考慮了多種開發工具和庫及其軟件依賴關系,所有這些都是開源軟件。了解開發供應鏈中存在的潛在風險、漏洞和依賴關系將為進一步安全開發 AI/ML 產品和確保其供應鏈的安全提供參考。