亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

復雜工程系統的早期設計決策對系統全生命周期性能、成本及可行性具有決定性影響。隨著工程系統日益呈現信息物理化、多學科交叉與高度互聯特征,基于歷史數據與專家判斷的傳統決策方法常顯不足。為應對早期設計決策挑戰并優化決策質量,模型驅動決策支持系統(DSS)作為集成仿真、優化與數據驅動模型的工具應運而生。然而在復雜工程系統語境下,社會技術性挑戰仍制約DSS的有效實施。本論文通過文獻綜述與工業實證案例研究系統化識別六大核心障礙:

1.跨粒度異構仿真模型集成面臨技術方法論雙重挑戰

2.工程領域間DSS成熟度差異限制協同環境應用

3.非專家用戶因可訪問性差與界面不直觀導致可用性不足

4.實時反饋機制缺失削弱其作為"邊界對象"的功能

5.模型成熟度與可靠性評估指標缺位引發決策誤判風險

6.底層模型演進、可追溯性及可靠性的全生命周期管理缺失

??## 結構??

本論文由7章正文與4篇附錄論文構成,各章內容如下:

??第二章 研究方法論??

論證設計研究方法論(DRM)與參與式行動研究(PAR)對本研究的適配性,繪制研究論文與DRM階段映射關系,通過"關聯貢獻域"(ARC)圖示展現研究的理論框架。

??第三章 理論基礎??

闡述復雜工程系統早期設計決策、基于模型的系統工程、決策支持系統、權衡空間探索及體系仿真范式(含離散事件仿真DES、離散元法DEM與參數化仿真方法)等核心理論。

??第四章 附錄論文綜述??

解析4篇支撐論文的研究焦點(輪式裝載機工程裝備與郵輪艙室案例)、作者在仿真開發與模型驗證中的角色及其對本論文目標的貢獻路徑。

??第五章 綜合成果??

整合實證研究成果,通過工程裝備與船舶案例闡明仿真集成、可持續性指標與復雜工程決策的交互機制。

??第六章 討論與啟示??

評述所提方法的實踐相關性,批判性分析研究局限性與學術探索中的經驗教訓。

??第七章 結論與展望??

凝練研究問題的系統性解決方案,探討工業應用前景,并規劃未來研究方向。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

分層多智能體系統(HMAS)通過層級化結構組織智能體集群,有效管理復雜性與規模擴展。此類層級架構雖能簡化協調流程,卻常伴隨隱性權衡。本文提出五維分類體系:控制層級、信息流、角色任務委派、時間分層及通信結構,其核心價值在于提供跨方案比較框架而非指定"最優"設計。該分類法關聯具體協調機制——從經典任務分配的合同網協議到新興分層強化學習研究,并以電網、油田作業等工業場景佐證框架實用性:生產層、維護層與供應層智能體通過協同實現油井故障診斷或能源需求平衡。案例表明層級結構可在保障局部自主性前提下達成全局效率,但平衡點極為微妙。文末提出開放挑戰:實現人類可解釋的層級決策、超大規模智能體集群擴展、以及大語言模型等學習型智能體安全融入分層框架的可行性評估。本論文首創融合結構、時間與通信維度的分層MAS統一設計框架,構建經典協調機制與現代強化學習及大語言模型智能體的理論橋梁。

人工智能的現代應用常需多智能體在復雜環境中協同作業。分層多智能體系統(HMAS)通過層級化組織架構協調大規模智能體集群,已成為高效的系統設計范式。在HMAS中,高層智能體(或智能體團隊)通常監管協調低層智能體,形成類人類組織層級的指揮鏈。該架構優勢體現在三方面:首先解決可擴展性問題——當智能體數量激增時,純扁平化(完全去中心化)結構易受通信開銷與全局一致性制約,而通過中間"領導者"智能體實施分治策略可有效管理復雜度。分層機制賦予特定智能體更高責任權重,實現任務需求靈活適配與大規模MAS高效管控。例如自動駕駛領域提出的"區域領導者"架構:頂層智能體優化路網全局目標,區域領導者協調局部交通流。其次支持差異化抽象層級與時間尺度的決策:高層智能體執行寬時間跨度的抽象規劃(如任務規劃),低層智能體實施精細動作控制(如運動控制),提升系統整體一致性。第三促進結構化協調與沖突消解:明確權責關系(指揮鏈)與通信路徑,規避完全平等型團隊常見的決策遲滯或振蕩現象。正如Malone與Crowston經典論述所指:協調本質是管理活動間依存關系——當存在結構化監督機制時該過程顯著簡化(Malone and Crowston, 1994)。

分布式AI與多智能體系統的早期研究已證實組織設計對性能的影響。學界通過分析層級、團隊、聯盟、全息及市場等組織范式權衡優劣,尤其揭示層級組織(常通過管理者-工作者模式或樹狀拓撲實現)能以部分魯棒性為代價提升全局效率;而完全去中心化的"團隊"組織雖最大化韌性平等性,卻在大規模群體中效率受限。最新研究凸顯混合架構的復興趨勢——融合分層與去中心化協調機制以兼取二者優勢。行業投資數據佐證該趨勢:2024年Q1多智能體系統領域通過超1100筆交易獲122億美元融資,彰顯醫療、交通、金融及國防等千億級市場對MAS變革潛力的持續信心(Aalpha, 2025)。Sun等人2025年的深度研究指出"分層與去中心機制的混合策略"是實現可擴展性與適應性平衡的關鍵路徑,印證本文分類方法的科學價值。事實上層級結構在自然界(如具工蜂-蜂后層級的昆蟲社會)與人類社會(企業組織架構)普遍存在,表明精心設計的層級可顯著增強多智能體AI系統的協調效能。

除結構優勢外,HMAS更契合人機交互需求。在能源運營、軍事指揮等任務關鍵型領域,人類監督員管理AI智能體、智能體再管控底層自動化流程的分層模式,既映射現實管理結構,又為人機協作提供意圖注入節點。通過明確定義人類操作員(戰略決策者)與自主智能體(戰術執行者)角色,層級架構促進人機高效協作。但該集成亦引發新挑戰——系統需向上提供可解釋性(確保人類理解智能體決策)并建立信任機制保障可靠委派。

面對多智能體應用規模與復雜度的持續增長(從含數百分布式能源的智能電網,到自動駕駛車隊,再到自適應供應鏈),亟需建立分層多智能體系統的系統性分類與設計指南。現有MAS分類法(如按團隊規模、通信拓撲、智能體異構性劃分)基礎上,本文提出聚焦層級組織模式及其協調機制的升級版分類體系。該研究融合經典框架(如Smith 1980年提出的任務分配合同網協議及MAS組織理論)與前沿成果(分層多智能體強化學習、大語言模型智能體),以多維視角勾勒HMAS設計空間,明晰系統架構師的抉擇與權衡。分類體系植根現實應用(尤以作者深耕的能源與運營領域為典型),通過油田監測分層MAS、微電網控制等工業案例實證設計范式的實用價值。文末指出現代AI能力與層級結構交叉衍生的研究議題:如何在深度分層系統中維持全局透明度?如何將大語言模型智能體的推理能力融入傳統層級架構?本成果貢獻了橫跨控制、信息流、角色/任務委派、時間分層、通信結構五維度的統一分類法,并顯式關聯協調機制與工業部署,為研究者與系統架構師提供超越既有綜述的實用設計透鏡。

付費5元查看完整內容

軟件質量標準要求嚴苛,因其驅動全球眾多系統且需確保安全穩健。軟件開發意味著需遵循高標準并適應需求與依賴項的變更。所幸軟件工程的繁重任務可實現部分自動化,尤其隨著生成式人工智能的最新進展。本論文探索自動化代碼維護方法,聚焦"基于大型語言模型的軟件工程"(LLM4SE),通過模型內部優化與模型間通信推進轉換器模型在檢測修復軟件缺陷中的應用。此處"缺陷"涵蓋執行故障與源代碼錯誤,"源代碼"指軟件產品的原始代碼或程序。核心貢獻包括:開發輕量級轉換器變體用于代碼分類;提出兩套自動化程序修復框架;反思LLM4SE研究的可持續性與透明度。研究首先開發編碼器層組合方案(編碼器屬轉換器類型)用于代碼分類。實驗發現輕量剪枝版CodeBERT變體微調耗時減少至1/3.3(微調指在領域數據上訓練模型),且性能更優——缺陷檢測準確率最高提升2個百分點(滿分100),優于全尺寸模型常規用法。該結果推動語言模型在軟件工程中的能效應用,證明全尺寸模型的"通用方案"對代碼正確性分類等簡單任務并非必需。

除錯誤檢測外,本文呢聚焦生成代碼與人寫代碼的缺陷修復。所提SEIDR框架包含"合成-執行-指導-調試-排序"模塊,實現生成代碼的實時修復,彰顯LLM在"生成-修復"循環中的價值。此循環中,LLM通過代碼執行、失敗測試用例及錯誤日志獲取反饋,最終生成全功能代碼。采用Codex(基于代碼訓練的GPT-3)的SEIDR在程序合成基準測試中解決25項任務的19項,優于前沿遺傳編程算法。論文還提出新型"循環翻譯"(RTT)修復管線。與SEIDR不同,RTT專為修復已存在缺陷的生成/人寫代碼設計,通過將缺陷代碼轉譯至其他編程語言/自然語言再回譯至原語言實現修復。其理論依據是:轉譯過程可能因"均值回歸"現象消除缺陷("均值"指模型訓練數據中普遍存在的無缺陷代碼)。實驗證明:LLM驅動的RTT管線在多個基準測試中解決46個微調模型未能修復的獨特缺陷。此能力使RTT成為多智能體程序修復體系的候選方案——各智能體以不同方法協同維護無缺陷代碼。論文還綜述LLM4SE文獻,反思能效與模型復用可能性:僅27%的論文共享代碼、模型及估算訓練能耗所需完整細節,凸顯遵循開放可復現研究準則的重要性。鑒于LLM存在隨機性等局限,本研究提供實證結果而非理論保證,并討論過度使用LLM的風險(如工具依賴、生成代碼漏檢、基準測試數據污染等)。整體而言,本研究推動LLM適配軟件工程任務,為多智能體系統與多模態模型的自動化代碼修復指明方向。

論文結構
 第二章從軟件開發生命周期視角綜述軟件工程自動化背景;第三章概述自然語言處理及LLM架構進展;第四章總結LLM4SE方法、進展與挑戰;第五章闡明研究范圍與機遇(5.3節詳述研究問題、挑戰及對應出版物關聯,5.4節匯總出版物與問題解答);第六章討論有效性威脅、局限、科研與產業影響及未來工作;第七章總結核心結論。為提升可讀性,各背景小節均附框內摘要,研究問題答案與關鍵發現亦作相同標注。

付費5元查看完整內容

人工智能(AI)在現代國防領域已發揮關鍵作用,而數據日益成為戰略資產。用于雷達輻射信號檢測、識別與分類的信號處理技術亦不例外,但大型語言模型(LLMs)在電子情報(ELINT)領域更廣泛的適應性仍未被公開研究充分探索。面對復雜不兼容數據集、海量數據及信息過載的環境挑戰,本研究深入探究LLMs解決此類難題的可行性及實施路徑。我們提出具備結構化與非結構化數據整合能力的AI驅動型聊天機器人系統,其模塊化架構設計旨在提升透明度與可解釋性。該系統在合成數據集上接受評估,其架構與設計選擇基于該敏感領域特性設定的約束條件。單元測試結果顯示:提示分類準確率達97.8%,生成SQL查詢正確率達93.3%,較人工查詢顯著節約時間成本。系統還通過決策日志與過程溯源實現可解釋性與透明度。然而對話測試暴露出錯誤傳播、模糊輸入應對缺陷、模型能力及用戶熟練度依賴等局限。盡管多數問題可被解決,研究仍揭示系統可靠性與資源可用度的強關聯性,凸顯作戰環境中的機遇與風險。盡管模擬數據與通用假設存在局限,該原型系統證實在軍事情報環境廣泛應用LLMs具備技術可行性與應用潛力。

本文由六章節構成:第一章為緒論,第二章文獻綜述,第三章深入闡述雷達技術軍事應用、電子戰、電子情報、信號處理管線及LLMs等理論基礎,第四章介紹方法論,第五章呈現并討論實驗結果,第六章給出最終結論。

付費5元查看完整內容

隨著自主移動機器人在倉儲自動化、航空測繪等領域的廣泛應用,對可靠且具備彈性的運動規劃與控制需求日益凸顯。滿足復雜且常具時效性的任務目標需要先進運動規劃技術。時序邏輯(如信號時序邏輯STL)為此提供了嚴謹緊湊的任務規范編碼框架,涵蓋邏輯、空間與時間約束。然而,設計完全滿足這些規范的控制算法——尤其在需多智能體協作、應對突發事件及實時決策的場景中——仍面臨重大挑戰。本論文通過三大核心目標應對這些挑戰:首先,研究多智能體系統實現集體時序邏輯規范的可擴展框架,包含智能體可異步完成的"可搶占任務"。結合基于采樣的軌跡生成(如RRT*)與混合整數規劃(MIP),解決異構智能體協同任務問題。其次,探索彈性運動規劃策略,引入量化指標以最小化約束違反時的規范偏離度。該指標通過捕捉累積任務松弛量,支持動態調整STL規范結構(如修改任務時間窗或必要時移除任務)。最后,針對需快速決策的任務(如對非合作目標執行任務),基于機器人執行機構限制與優化后的STL任務序列構建控制屏障函數(CBF),實現實時STL規劃。所提框架與算法通過理論分析、仿真及實驗驗證,在復雜機器人應用中展現出卓越的可擴展性與有效性。這些成果推動時序邏輯控制研究發展,增強STL在彈性與實時運動規劃中的適用性,為在動態環境中執行復雜任務的自主移動機器人提供了核心方法與工具支撐。

第二章:介紹信號時序邏輯(STL)的基礎理論及其量化度量特性,同時討論圖論和時變控制屏障函數(TV-CBFs)的預備知識,這些內容在第四、五、六章具有關鍵應用。

第三章:本章通過引入可定義信號積分與導數相關特性的新型謂詞,擴展STL的表達能力。新謂詞通過不同時間步的信號值定義期望區間內的累積性與相對性規范,在保留STL原生功能的同時,實現對信號/軌跡局部與全局特性的廣泛控制。傳統STL及其他時序邏輯均無法描述信號值累積成功的查詢需求,因其缺乏含顯式時間邊界且關聯累積進度的算子或謂詞。我們在傳統STL基礎上提出增強語法結構,支持通過時序邏輯規范要求可搶占任務及累積屬性達成特定進度。通過二維連續空間中自主機器人的案例研究,證明新謂詞能更豐富、更具表現力地構建任務規范。本章還給出標準STL語義及新謂詞的混合整數編碼方案,該方案在第四、五章以混合整數線性規劃(MILP)形式部分應用于STL控制綜合,以生成滿足STL規范的軌跡。

第四章:研究時空規范下異構多智能體系統的軌跡協調問題。利用第三章定義的新謂詞,表達特定時間窗內目標位置需出現的智能體數量與類型;同時采用積分謂詞規定可由多智能體異步實現的累積進度目標。為生成最優軌跡,構建以最小化智能體移動量為目標的混合整數線性規劃(MILP),并引入能量約束及分層求解策略處理能量感知協調問題。在隨機能耗模型引導下,智能體在確保充電可用性的前提下運行。此類隨機能量動態特性會導致偏離標稱計劃并延遲任務完成。為此定義初步度量指標評估預期延遲(時間松弛度),該指標將在第五章深入分析。本章所提方法結合基于采樣的軌跡生成(如RRT?)與MILP優化規劃,通過積分謂詞定義團隊級共同目標,并借助STL規范部署具有特定能力與獨有動態特性的異構智能體。通過兩個案例研究(智能體在動態特性和能力如傳感器/載荷方面均存在異構性),證明相比傳統STL,該框架能更豐富、更具表現力地規劃多智能體軌跡。

第五章:提出可量化STL規范時間松弛度并支持約束不可行時彈性控制綜合的度量指標。該指標量化任務間累積松弛程度,其最小化過程通過兩種方式改變原始STL規范結構:i) 調整時間區間;ii) 必要時完全移除任務。同時提出反應式規劃算法,生成可抵御時間約束違反的彈性機器人軌跡。系統通過實時監測機器人行為,在遭遇突發事件(如潛在碰撞、需移除任務或部分滿足的環境變化)時即時決策:利用控制屏障函數啟動局部修正或重規劃軌跡以最小化時間違規。該策略旨在防止任務完成出現任意長延遲,并以最小時間松弛度促成任務達成。為在保障空間魯棒性前提下實現此目標,引入高效分層式雙軌MILP優化方案,同步最小化時間松弛度與最大化空間魯棒性。通過減少優化參數(聚焦局部與未來變量)及精簡混合整數約束數量提升計算效率。區別于現有文獻僅關注離線解和/或零違規保證,本方法提供在線反應式規劃,持續監測并調整機器人軌跡以按用戶偏好最小化違規。理論分析佐證框架有效性,移動機器人仿真驗證其性能優勢,并與現有度量方法進行對比。

第六章:提出的實時軌跡規劃問題,要求滿足含動態目標(即時變規范)的STL規范。核心挑戰在于:當機器人未知目標運動模式時,如何確保滿足針對動態非合作目標的STL規范。提出考慮機器人執行機構限制與可行STL任務序列的控制屏障函數(CBFs)。展示包含周期性任務分解及替代/冗余場景的可行序列生成流程,并基于該序列構建順序CBFs以應對目標運動的最壞邊界,實現與目標相關的邏輯、時空需求。理論證明:若目標集緊凸下近似存在可行序列,則可保證定義在緊目標集上的STL規范滿足。在此假設下,目標運動模式(隨機、預設或對抗性)不影響任務成功率。任務場景變化及目標數量激增亦不損害實時適用性。理論結果重點闡明:i) STL截止期限與任務序列可行性的關聯;ii) 周期性任務分解對序列特性的影響;iii)(子)序列可行性與CBF約束的關系;iv) 所提框架對STL規范的整體滿足能力。通過仿真與無人機實驗驗證方法優勢并分析性能。

第七章:末章總結全文研究成果,討論階段性成果并提出未來研究方向。

付費5元查看完整內容

在技術飛速進步、市場波動加劇與全球性中斷頻發的時代,有效供應鏈管理需創新方法應對不確定性、復雜性與動態變化。本研究開發并應用一系列新型智能決策支持系統(IDSS),以解決中斷環境下的大規模隨機動態供應鏈網絡問題。通過電子商務、制造業、醫療健康與可持續性等多元領域案例驗證所提系統,具體提出四類彈性IDSS框架:集成先進優化算法、機器學習、強化學習與物流仿真技術,應對重大供應鏈中斷的現實挑戰。首個系統通過移動倉庫與眾包配送優化城市末端配送,顯著降低配送時間、成本與環境影響;第二系統開發多階段隨機動態規劃模型增強全球供應鏈彈性,優化不確定性下的物流運作;第三系統聚焦公平高效疫苗分配,采用數據驅動決策降低短缺風險;第四系統設計穩健可持續的口罩分發與回收網絡,平衡成本效益、環境影響與客戶服務。研究整合精確方法(如并行化隨機對偶動態整數規劃PSDDiP)、強化學習與混合優化策略,在保障可擴展性與計算效率前提下,提升大規模供應鏈實時彈性決策能力。既有IDSS多缺乏此類集成,或未考慮中斷場景,亦未經過大規模實時驗證。實證表明彈性IDSS在提升響應速度、時間管理與成本效益方面潛力顯著。中斷事件中數據可用性缺口與決策動態適應機制的研究,為政策制定者與實踐者提供新洞見。例如,所提在線強化驅動自適應優化(ORDAO)方法,相較交互式多智能體仿真(IMAS)可減少11%配送時間完成同等訂單量。

本論文通過開發整合數據驅動模型、優化算法、仿真與機器學習的IDSS,推動大規模供應鏈物流運營的彈性與可持續性。第二章提出基于隨機建模、行程時間仿真、眾包運力深度學習與強化學習的末端配送IDSS;第三章構建含風險對沖策略的多階段隨機制造供應鏈模型及并行SDDiP算法;第四章設計醫療領域實時需求預測與動態庫存疫苗分發系統;第六章開發閉環供應鏈內口罩可持續分發與回收的魯棒-隨機模型。第五章總結成果,闡明核心貢獻,討論模型局限并展望未來方向。整體研究為行業定制IDSS提供統一框架,增強不確定性下的適應與響應能力。

付費5元查看完整內容

現實世界中諸多問題需進行序列決策,其中每個決策的結果具有概率性與不確定性,且后續行動的可選性受先前行動結果制約。生成適應不確定性、全局最優且隨狀態空間擴展仍可擴展的策略至關重要。本文提出生成最優決策樹(規定不同結果場景下的應執行動作,同時最大化策略期望收益),結合動態規劃與混合整數線性優化方法,利用問題特定信息剪除狀態空間中無收益貢獻的子集,使方案適用于大規模有限狀態空間問題。實驗證明所提方法能以線性時間復雜度(相對于探索狀態數量)找到全局最優決策樹。

序列決策是兵棋推演、醫療與網絡作戰等領域的核心問題。在此類場景中,智能體采取行動達成目標,但每項行動的產出具有離散性、概率性與不確定性,導致面對多可能未來時難以確定最優行動。此外,可用行動存在復雜條件依賴性(制約策略可能性),同時需考慮遠期收益。本文開發了一種方法,用于定義適應不同行動結果的最優決策序列,并以決策樹形式呈現。

盡管決策樹是機器學習中成熟模型,但其傳統用途為預測——預測型決策樹(DT)的每個分叉對應已知數據特征的組合(其對應結果未知)。而在行動方案(CoA)生成場景中,決策樹的應用轉向策略生成,允許基于先前行動的不確定結果定義最優行動序列。如圖1所示:CoA樹的每個節點代表系統狀態并規定一項行動,其執行結果引發狀態變遷(通過行動結果的概率性分支轉移至子節點,可觸發新行動)。樹終止于葉節點(行動預算耗盡、狀態不允許新行動或目標達成獲取收益)。

圖1:含二元分叉的最優決策樹示例(各節點為帶行動指令的狀態)

本研究核心貢獻為生成全局最優決策樹的算法與優化模型。這些決策樹在最大化策略期望收益的同時,兼顧行動與結果間的復雜依賴關系。通過動態規劃(DP)與混合整數優化(MIO)結合,利用問題特定信息剪除狀態空間無效子集,使方法可擴展至大規模狀態空間問題。雖非首個提出通過部分行動剪枝縮減狀態空間的研究(如Pinto與Fern 2014年工作),但本方法在最終決策模型中不犧牲全局最優性。通過示例驗證方法有效性,并在隨機生成測試案例中展示計算效率——尤其值得注意的是,本方法能以線性時間復雜度(相對于探索狀態數)找到最優決策樹。

所提框架可生成符合以下特征問題的全局最優決策樹:

  1. 智能體采取具離散概率結果的行動(改變環境狀態)
  2. 狀態捕獲環境所有相關信息及智能體歷史行動信息
  3. 決策空間有限,終止于目標達成或無可用行動
  4. 行動可具復雜依賴關系,例如:
    ? 先決條件:須先執行某行動并達成特定結果方可嘗試后續行動
    ? 排除條件:若執行某行動并達成特定結果則禁止嘗試其他行動

如第3節示例所示,行動間依賴關系可通過行動與結果的邏輯關系集進行數學與圖形化表達。

付費5元查看完整內容

本論文探討了如何應用有監督的機器學習技術來提高網絡控制系統(NCS)的性能和可解釋性。無人駕駛系統(UxVs)可通過覆蓋大片區域的延伸偵察任務提供快速高效的目標定位。以協作方式控制一組 UxV 是一個難題,美海軍正在開發的一個解決方案是網絡控制系統行為集成優化(BION)。BION 是一種 NCS,利用部分可觀測蒙特卡洛規劃(POMCP)算法提供接近最優的近實時編隊控制。本文旨在通過使用訓練優良的神經網絡近似關鍵功能,解決 POMCP 算法的某些局限性。神經網絡利用概率技術和顯著性圖提高了可解釋性,同時也提高了處理速度。在基于 ResNet 的不同架構上進行了實驗,并成功地將訓練良好的神經網絡集成到了 BION 中。這項研究拓展了實驗和開發 BION 的能力,從而推動了UxV 的開發和集成。

第二章將討論 BION 的核心功能,以及與神經網絡和顯著性圖譜相關的關鍵概念。第三章將討論實現過程,包括訓練和評估數據、神經網絡架構、神經網絡訓練算法以及生成顯著性圖。第四章將介紹工作成果,包括訓練統計數據和計算出的顯著性圖樣本。第 5 章總結了本文的貢獻以及未來可能的工作領域。

付費5元查看完整內容

決策輔助系統是國防指揮與控制裝置的基礎,為各級決策過程提供信息。圍繞人工智能(AI)在決策輔助系統中的應用開展的現有研究認為,人工智能是此類系統性能和應用的關鍵驅動因素。然而,很少有研究探討時間因素和中間決策的存在對決策者對此類系統信任度的影響,或者當決策由另一個人輔助時,與由人工智能輔助時的影響有何不同。現有文獻認為,對人工智能的信任不同于其他信任對象。本論文通過探究信任的產生是否更多地取決于信任的對象或來源來探索這一假設。之前的一項實驗研究了當決策支持僅由人工智能系統提供時,時間和中間判斷對信任的影響。本論文對該實驗進行了擴展,同時操縱了決策輔助的來源,即人類,而不僅僅是人工智能。通過加入人與人之間信任的基礎案例,本研究可以就中間判斷和時間對決策輔助系統信任的相對影響進行比較分析。

決策輔助系統是美國防部(DOD)指揮與控制機構的基礎,為各級決策過程提供信息。團隊是美國軍隊組織和完成任務的主要要素。美國防部打算通過將人工智能嵌入戰術、組織和戰略層面的組織結構(團隊),更快地做出更好的決策,從而獲得優勢(國防部,2022、2023a、2023b)。圍繞人工智能(AI)在決策支持系統中應用的現有研究表明,信任是此類系統性能和采用的關鍵驅動因素。

問題在于,人們尚未充分認識到若干設計參數對信任和性能的影響,這可能會延遲或抵消人工智能決策支持系統的優勢(Ashoori & Weisz, 2019; Tangredi & Galdorisi, 2021)。由于這些系統將用于做出關鍵決策,或在動態、混亂的環境中為人類提供支持,因此這些系統必須值得信賴且性能良好(Babo?,2021;人工智能特設委員會,2023)。本研究的目的是,與人工智能(AI)相比,當人類的決策過程得到人類分析師的支持時,研究自變量(中間判斷和時機)對因變量(信任)的影響。這項研究旨在促進人機系統的整合,實現有效的機器/人工智能設計并更快地應用于軍事領域,加強這些機器的穩健性和復原力,并為設計有效的人機系統提供支持理論。

之前的一項調查試圖了解在僅與人工智能輔助決策系統互動時,信任是如何隨著時間的推移而演變的(Humr 等人,2023 年)。本調查比較了當決策支持來源是人類分析師和人工智能分析師時,信任度是如何演變的。通過操縱決策支持的來源,本調查旨在比較人類和人工智能群體的信任度和表現,并分析人類和人工智能群體本身的自變量的影響。

現有文獻的基本假設是,人類決策者對人工智能決策支持系統產生信任的過程不同于決策者對提供相同決策支持的另一個人類產生信任的過程。這一假設在人工智能研究中基本上沒有受到質疑。雖然人工智能系統中信任和性能的關鍵驅動因素須要并將繼續得到確定,但值得確定的是,它們與現有的以人類之間的信任為基本情況的信任模型相比有何不同。這種調查可能會挑戰現有的假設,即人類建立信任的過程因信任對象的不同而不同。按理說,無論是人類還是人工智能,信任決定都是由人類主體做出的,可能會也可能不會受到人類所信任的對象的影響。

現有文獻表明,人類建立信任的過程更多地取決于信任的對象(被信任的人或事物),而不是信任的來源(決定信任的人類)。鑒于人工智能系統的新穎性和細微差別,以及它們與人類的生物和社會稟賦的截然不同,當決策支持、信任對象是人工智能系統而非人類時,決策背景下的信任模型會有所不同這一假設通過了表面有效性的檢驗。然而,本次調查對現有文獻中這一近乎教條的假設提出了質疑,直接探討了人類對人工智能的信任是否與人類對其他人的信任有本質區別。畢竟,人類的信任過程已經發展了數千年,而機器和人工智能的存在不過是進化過程中的一眨眼。

這項研究試圖擴展之前的一項實驗(Humr 等人,2023 年),在這項實驗中,人工智能分析師為人類決策者提供意見。在該研究中,操縱的自變量是中間判斷形式的選擇和分配的時間。因變量是信任評價,其形式是詢問受試者在與決策支持體互動后,未來將某項任務委托給人工智能的可能性有多大。這項研究重復了之前的實驗,但用人類分析師代替了人工智能分析師。其他一切保持不變,以便在人類支持組和人工智能支持組之間進行比較。

這項研究發現,在由人類與人工智能系統支持決策的受試者之間,信任評價在統計學上沒有顯著差異。這些發現與人工智能信任研究領域的傳統假設相沖突,即人工智能信任是一種與一般信任根本不同的現象,因此需要獨立表達。

雖然這些發現并不能概括所有類型的信任、人工智能的使用案例或人類可能與之互動的人工智能類型,但它確實表明,與試圖重新發現人工智能或人工智能系統中可能使其值得信任的方面相比,更努力地識別人類之間信任的關鍵驅動因素對于設計可信任的人工智能可能更有價值。本研究建議未來的實驗探索信任的另一個關鍵驅動因素,即決策支持(人工智能或人類)的性能,并將其對信任的影響與本實驗中使用的自變量進行比較。此外,本研究還建議調查選擇和時機這兩個自變量如何影響決策者的整體決策表現。畢竟,信任是影響績效的一個中介變量,因此,通過直接觀察這些自變量對績效的影響,決策支持系統的設計者就能建立盡可能好的系統。

付費5元查看完整內容

數字孿生技術以虛擬工程模型、計算機仿真和實時現場數據流為基礎,實現下一代設計和預測性維護。數字孿生是一個基于計算機的高保真模型集合,可根據運行周期、輸入特征參數和物理工廠的數據通信預測動態系統的性能。產品生命周期管理(PLM)的重要性與日俱增,它是虛擬設計流程的核心,而數字孿生工具集正好符合這一新興架構。利用數字孿生資源,產品設計流程可以得到推進,不再需要進行持續的物理原型設計、可靠性測試和過時的維護實踐,也不再需要為此付出成本。數字孿生虛擬工具可在設計周期早期改進產品性能評估,從而為組織實體節省人力。個人、企業和政府機構對移動性的需求要求對產品設計給予細致的關注。隨著地面車輛在電氣組件和推進混合方面的復雜性不斷增加,數字孿生在預測、理解和設計車輛系統方面發揮了重要作用。將流式現場數據與數字孿生估算結合起來的能力為診斷和預報方法提供了強大的工具。

在該研究項目中,探索、開發了數字孿生技術,并將其應用于越野地面車輛的設計工程研究和預測性健康維護。研究目標包括將地面車輛部件的數學模型集成到數字孿生中,將數字孿生應用于車輛設計,研究預測性維護方法,以及創建兩項調查,以衡量數字孿生技術的實用性和時間節省指標。通過在 MATLAB/Simulink/Simscape 中對輪式和履帶式車輛進行建模,可以組裝一個 14 自由度的虛擬車輛系統,該系統包括車身動力學、發動機曲線、車輪運動學、傳動系統和懸掛特性,由虛擬駕駛員和環境輸入進行駕駛。數字孿生工具為克萊姆森大學 VIPR-GS 中心的貿易空間分析研究提供了幫助。通過將 6 種異常情況播入虛擬模型,并利用基于神經網絡的統計算法,將機器學習的預測性維護應用于越野數字孿生系統。在數值研究中,預測性維護框架利用了總共 275 次模擬中的 176 個記錄信號,成功預測了 92% 的訓練驗證結果和 40% 的未測試復合異常的準確性。對克萊姆森大學國際汽車研究中心(CUICAR)校園內的 DO13/14 車輛工程團隊進行了有用性和時間節省評估指標調查,結果顯示數字孿生的有用性得到了積極的李克特量表響應,在模型組織和設計驗證方面的優勢最大。這些研究探索了數字孿生技術的優勢和機遇,并在 VIPR-GS 中心進行了部署。鑒于人們對數字工程設計方法的認識不斷提高,數字孿生代表著未來許多工作的基石。

圖 1.1: 系統工程設計流程

圖 1.3:物理和數字孿生互動與交流。

圖 2.2: 數字孿生系統與物理地面飛行器的運行配置,以及傳感器、執行器和控制系統與硬件在環實驗室系統的相似之處。

付費5元查看完整內容

大型語言模型(LLMs)在靜態、預先收集的通用數據集上的訓練取得的最近成功,已經引發了眾多研究方向和應用。其中一個方向解決了將預訓練的LLMs整合到動態數據分布、任務結構和用戶偏好中的非平凡挑戰。這個問題的主要挑戰在于平衡模型適應性和知識保存。為特定需求量身定制的預訓練LLMs經常在之前的知識領域經歷顯著的性能退化——這一現象被稱為“災難性遺忘”。雖然在持續學習(CL)社區進行了廣泛研究,但在LLMs領域呈現出新的表現形式。在這篇綜述中,我們提供了一個關于大型語言模型在持續學習背景下當前研究進展的全面概覽和詳細討論。除了介紹初步知識外,這篇綜述被分為四個主要部分:我們首先描述了持續學習LLMs的概覽,包括兩個連續性方向:垂直連續性(或垂直持續學習),即從一般到特定能力的持續適應;和水平連續性(或水平持續學習),即跨時間和領域的持續適應(第3節)。在垂直連續性之后,我們總結了在現代CL背景下學習LLMs的三個階段:持續預訓練(CPT)、領域適應性預訓練(DAP)和持續微調(CFT)(第4節)。然后我們提供了LLMs的持續學習評估協議的概覽,以及當前可用的數據來源(第5節)。最后,我們討論了有關LLMs持續學習的引人深思的問題(第6節)。這篇綜述揭示了持續預訓練、適應和微調大型語言模型這一相對未受到足夠研究的領域,表明需要社區更多的關注。需要立即關注的關鍵領域包括開發實用且易于訪問的評估基準,以及專門設計的方法論,以對抗遺忘和在不斷演變的LLM學習范式中啟用知識轉移。在這項綜述中檢查的完整論文列表可在//github.com/Wang-ML-Lab/llm-continual-learning-survey找到。

近期大型語言模型(LLMs)的進步顯示了實現人工普遍智能(AGI)的巨大潛力。研究人員觀察到,隨著參數規模的增加,多步驟推理、小樣本上下文學習和指令跟隨等復雜能力有所提高。LLMs的發展具有重大影響和革命性,促使機器學習從業者重新考慮傳統的計算范式,用于處理一些曾經具有挑戰性的人類水平任務,如問答、機器翻譯和對話系統。然而,LLMs通常在包含通用領域的靜態、預先收集的數據集上進行訓練,導致性能隨時間逐漸降低,并且在不同內容領域之間也會降低。此外,單一的預訓練大模型無法滿足每個用戶的需求,需要進一步的微調。盡管重新收集預訓練數據和根據額外的具體需求重新訓練模型是一種潛在的解決方案,但這種方法在現實世界場景中代價高昂且不切實際。為了有效地適應LLMs到下游任務,同時盡量減少對以前知識領域的性能退化,研究者采用了持續學習的方法,也稱為終身學習或增量學習。持續學習受到人類大腦中觀察到的增量學習模式的啟發,涉及按順序在一系列任務上訓練機器學習模型,期望在所有任務中保持性能。在訓練過程中,模型對以前的數據有限或無法訪問,這在保留過去知識時構成了一個挑戰,因為在當前任務學習時,來自未見過的以前數據的優化約束是不存在的。這一挑戰,被稱為災難性遺忘,自持續學習研究開始以來一直是研究的中心焦點。多年來,研究者探索了各種技術來減輕機器學習模型中的遺忘,這些技術包括基于重放的方法、參數規范化和模型架構擴展。這些技術共同顯著推進了在不同任務、模型架構和學習范式中實現零遺忘的持續學習目標。在順序訓練和適應LLMs的背景下,CL的重要性也正在發生自身的語義轉變。為了更好地突出這一持續的轉變,在這篇綜述中,我們提供了一個關于LLMs在CL背景下當前研究進展的全面概覽和詳細討論。對于持續學習LLMs的總體情況,我們將其分為兩個需要由從業者解決的連續性方向(第3節):

  • 垂直連續性(或垂直持續學習),指的是LLMs從大規模通用領域到小規模特定領域的持續適應,涉及學習目標和執行實體的轉變。例如,醫療機構可能開發專門為醫療領域定制的LLMs,同時保留其一般推理和問答能力,以服務用戶。
  • 水平連續性(或水平持續學習),指的是跨時間和領域的持續適應,通常涉及多個訓練階段和對災難性遺忘的增加脆弱性。例如,社交媒體平臺不斷更新LLMs以反映最近的趨勢,確保精確地定位下游服務如廣告和推薦,同時為現有用戶提供無縫的用戶體驗。

在圖1中,繼垂直連續性之后,我們勾畫了現代CL中LLM學習的三個關鍵階段:持續預訓練(CPT)、領域適應性預訓練(DAP)和持續微調(CFT)(第4節)。在CPT中,現有研究主要調查三種類型的分布式轉變:時間、內容層次和語言層次。每種都呈現出獨特的焦點和挑戰。在DAP中,雖然它主要被視為為下游任務準備LLMs的過程,但頻繁地使用CL評估和技術。然而,這些技術的多樣性明顯不足,考慮到傳統CL社區的成熟度。在CFT中,我們關注的是學習LLMs的新興領域,涵蓋持續指令調整(CIT)、持續模型精煉(CMR)、持續模型對齊(CMA)和持續多模態LLMs(CMLLMs)等主題。接下來,我們呈現了一系列公開可用的評估協議和基準(第5節)。我們總結我們的綜述,討論了LLMs持續學習的最新出現的特性,傳統增量學習類型和LLMs持續學習中的記憶約束的角色變化,以及這個主題的潛在研究方向(第6節)。總結而言,本文提供了一份詳盡的現有持續學習研究LLMs的綜述,顯著區別于相關主題的現有文獻。我們的綜述突出了持續開發LLMs的研究領域,特別是在持續預訓練(CPT)和領域適應性預訓練(DAP)領域的研究。我們強調需要社區更多的關注,迫切需要包括開發實用、易于訪問且廣為認可的評估基準。此外,需要定制方法來解決在新興的大型語言模型學習范式中的遺忘問題。我們希望這篇綜述能提供一個系統而新穎的持續學習視角,在迅速變化的LLMs領域中,幫助持續學習社區為開發更有效、可靠和可持續的LLMs做出貢獻。

組織結構

本文的其余部分安排如下。我們首先在第2節介紹大型語言模型和持續學習的背景和初步知識。然后我們在第3節展示了大型語言模型的現代持續學習概覽。從垂直角度來看,它可以大致分為三個階段的LLMs持續訓練,我們將在第4節逐一介紹每個階段。在4.3節中,將介紹持續微調LLMs的獨特方面,包括持續指令調整(4.3.3節)、持續模型精煉(4.3.4節)、持續模型對齊(4.3.5節)和持續多模態大型語言模型(4.3.6節)。在第5節中,我們提供了公開可用的LLMs持續學習評估協議和基準的全面介紹。最后,在第6節中,我們討論了在大型語言模型時代持續學習的角色,包括大規模持續LLMs的新興能力(6.1節)、三種類型的持續學習(6.2節)、LLMs持續學習中的記憶角色(6.3節)以及未來的研究方向(6.4節)。 持續學習與大型語言模型相遇:概覽****大型語言模型(LLMs)在多個維度上都非常龐大,包括模型參數的大小、預訓練數據集、計算資源、項目團隊和開發周期。LLMs的巨大規模為開發團隊帶來了顯著的挑戰,特別是在快速變化的環境中保持更新。舉例來說,2023年,用戶發布的新推文的平均每日流量超過5億,即使是在這么大量數據的“小”子集上進行訓練也是不可承受的。在考慮到它們對下游應用的連鎖影響時,有效且可靠地適應LLMs變得更為關鍵。下游用戶通常缺乏收集和存儲大規模數據、維護大規模硬件系統以及自行訓練LLMs的專業知識。《可回收調整》是首個明確概述現代LLM生產流水線供應商-消費者結構的先導研究。在供應商側,模型在一系列大規模未標記數據集上持續進行預訓練。每次預訓練模型發布后,消費者需要利用更新、更強大的上游模型以獲得更好的下游性能。為了提高下游消費者微調的效率,他們最初對持續預訓練的LLMs進行了幾項關鍵觀察,聚焦于模式連接性和功能相似性。此外,他們提出在上游預訓練LLM進行重大更新后,復用過時的微調組件。基于《可回收調整》引入的概念框架,我們在本綜述中提出了一個包含各種研究的現代生產流水線的全面框架,涉及持續LLM預訓練、適應和部署,如圖1所示。我們的框架與現有研究的不同之處在于融入了兩個連續性方向:垂直連續性和水平連續性。

結論

在這項工作中,我們提供了一份關于持續LLMs的綜述,從持續學習的角度總結了它們在訓練和部署方面的最新進展。我們根據它們在我們提出的現代分層持續學習LLMs的更廣框架內的位置,對問題和任務進行了分類。雖然這一領域在社區中的興趣廣泛且日益增長,但我們也注意到幾個缺失的基石,包括算法多樣性以及對大模型行為(如知識遺忘、轉移和獲取)的基本理解。通過全面而詳細的方法,我們希望這篇綜述能激勵更多從業者探索持續學習技術,最終有助于構建健壯和自我進化的人工智能系統。

付費5元查看完整內容
北京阿比特科技有限公司