亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

現實世界中諸多問題需進行序列決策,其中每個決策的結果具有概率性與不確定性,且后續行動的可選性受先前行動結果制約。生成適應不確定性、全局最優且隨狀態空間擴展仍可擴展的策略至關重要。本文提出生成最優決策樹(規定不同結果場景下的應執行動作,同時最大化策略期望收益),結合動態規劃與混合整數線性優化方法,利用問題特定信息剪除狀態空間中無收益貢獻的子集,使方案適用于大規模有限狀態空間問題。實驗證明所提方法能以線性時間復雜度(相對于探索狀態數量)找到全局最優決策樹。

序列決策是兵棋推演、醫療與網絡作戰等領域的核心問題。在此類場景中,智能體采取行動達成目標,但每項行動的產出具有離散性、概率性與不確定性,導致面對多可能未來時難以確定最優行動。此外,可用行動存在復雜條件依賴性(制約策略可能性),同時需考慮遠期收益。本文開發了一種方法,用于定義適應不同行動結果的最優決策序列,并以決策樹形式呈現。

盡管決策樹是機器學習中成熟模型,但其傳統用途為預測——預測型決策樹(DT)的每個分叉對應已知數據特征的組合(其對應結果未知)。而在行動方案(CoA)生成場景中,決策樹的應用轉向策略生成,允許基于先前行動的不確定結果定義最優行動序列。如圖1所示:CoA樹的每個節點代表系統狀態并規定一項行動,其執行結果引發狀態變遷(通過行動結果的概率性分支轉移至子節點,可觸發新行動)。樹終止于葉節點(行動預算耗盡、狀態不允許新行動或目標達成獲取收益)。

圖1:含二元分叉的最優決策樹示例(各節點為帶行動指令的狀態)

本研究核心貢獻為生成全局最優決策樹的算法與優化模型。這些決策樹在最大化策略期望收益的同時,兼顧行動與結果間的復雜依賴關系。通過動態規劃(DP)與混合整數優化(MIO)結合,利用問題特定信息剪除狀態空間無效子集,使方法可擴展至大規模狀態空間問題。雖非首個提出通過部分行動剪枝縮減狀態空間的研究(如Pinto與Fern 2014年工作),但本方法在最終決策模型中不犧牲全局最優性。通過示例驗證方法有效性,并在隨機生成測試案例中展示計算效率——尤其值得注意的是,本方法能以線性時間復雜度(相對于探索狀態數)找到最優決策樹。

所提框架可生成符合以下特征問題的全局最優決策樹:

  1. 智能體采取具離散概率結果的行動(改變環境狀態)
  2. 狀態捕獲環境所有相關信息及智能體歷史行動信息
  3. 決策空間有限,終止于目標達成或無可用行動
  4. 行動可具復雜依賴關系,例如:
    ? 先決條件:須先執行某行動并達成特定結果方可嘗試后續行動
    ? 排除條件:若執行某行動并達成特定結果則禁止嘗試其他行動

如第3節示例所示,行動間依賴關系可通過行動與結果的邏輯關系集進行數學與圖形化表達。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

復雜工程系統的早期設計決策對系統全生命周期性能、成本及可行性具有決定性影響。隨著工程系統日益呈現信息物理化、多學科交叉與高度互聯特征,基于歷史數據與專家判斷的傳統決策方法常顯不足。為應對早期設計決策挑戰并優化決策質量,模型驅動決策支持系統(DSS)作為集成仿真、優化與數據驅動模型的工具應運而生。然而在復雜工程系統語境下,社會技術性挑戰仍制約DSS的有效實施。本論文通過文獻綜述與工業實證案例研究系統化識別六大核心障礙:

1.跨粒度異構仿真模型集成面臨技術方法論雙重挑戰

2.工程領域間DSS成熟度差異限制協同環境應用

3.非專家用戶因可訪問性差與界面不直觀導致可用性不足

4.實時反饋機制缺失削弱其作為"邊界對象"的功能

5.模型成熟度與可靠性評估指標缺位引發決策誤判風險

6.底層模型演進、可追溯性及可靠性的全生命周期管理缺失

??## 結構??

本論文由7章正文與4篇附錄論文構成,各章內容如下:

??第二章 研究方法論??

論證設計研究方法論(DRM)與參與式行動研究(PAR)對本研究的適配性,繪制研究論文與DRM階段映射關系,通過"關聯貢獻域"(ARC)圖示展現研究的理論框架。

??第三章 理論基礎??

闡述復雜工程系統早期設計決策、基于模型的系統工程、決策支持系統、權衡空間探索及體系仿真范式(含離散事件仿真DES、離散元法DEM與參數化仿真方法)等核心理論。

??第四章 附錄論文綜述??

解析4篇支撐論文的研究焦點(輪式裝載機工程裝備與郵輪艙室案例)、作者在仿真開發與模型驗證中的角色及其對本論文目標的貢獻路徑。

??第五章 綜合成果??

整合實證研究成果,通過工程裝備與船舶案例闡明仿真集成、可持續性指標與復雜工程決策的交互機制。

??第六章 討論與啟示??

評述所提方法的實踐相關性,批判性分析研究局限性與學術探索中的經驗教訓。

??第七章 結論與展望??

凝練研究問題的系統性解決方案,探討工業應用前景,并規劃未來研究方向。

付費5元查看完整內容

分層多智能體系統(HMAS)通過層級化結構組織智能體集群,有效管理復雜性與規模擴展。此類層級架構雖能簡化協調流程,卻常伴隨隱性權衡。本文提出五維分類體系:控制層級、信息流、角色任務委派、時間分層及通信結構,其核心價值在于提供跨方案比較框架而非指定"最優"設計。該分類法關聯具體協調機制——從經典任務分配的合同網協議到新興分層強化學習研究,并以電網、油田作業等工業場景佐證框架實用性:生產層、維護層與供應層智能體通過協同實現油井故障診斷或能源需求平衡。案例表明層級結構可在保障局部自主性前提下達成全局效率,但平衡點極為微妙。文末提出開放挑戰:實現人類可解釋的層級決策、超大規模智能體集群擴展、以及大語言模型等學習型智能體安全融入分層框架的可行性評估。本論文首創融合結構、時間與通信維度的分層MAS統一設計框架,構建經典協調機制與現代強化學習及大語言模型智能體的理論橋梁。

人工智能的現代應用常需多智能體在復雜環境中協同作業。分層多智能體系統(HMAS)通過層級化組織架構協調大規模智能體集群,已成為高效的系統設計范式。在HMAS中,高層智能體(或智能體團隊)通常監管協調低層智能體,形成類人類組織層級的指揮鏈。該架構優勢體現在三方面:首先解決可擴展性問題——當智能體數量激增時,純扁平化(完全去中心化)結構易受通信開銷與全局一致性制約,而通過中間"領導者"智能體實施分治策略可有效管理復雜度。分層機制賦予特定智能體更高責任權重,實現任務需求靈活適配與大規模MAS高效管控。例如自動駕駛領域提出的"區域領導者"架構:頂層智能體優化路網全局目標,區域領導者協調局部交通流。其次支持差異化抽象層級與時間尺度的決策:高層智能體執行寬時間跨度的抽象規劃(如任務規劃),低層智能體實施精細動作控制(如運動控制),提升系統整體一致性。第三促進結構化協調與沖突消解:明確權責關系(指揮鏈)與通信路徑,規避完全平等型團隊常見的決策遲滯或振蕩現象。正如Malone與Crowston經典論述所指:協調本質是管理活動間依存關系——當存在結構化監督機制時該過程顯著簡化(Malone and Crowston, 1994)。

分布式AI與多智能體系統的早期研究已證實組織設計對性能的影響。學界通過分析層級、團隊、聯盟、全息及市場等組織范式權衡優劣,尤其揭示層級組織(常通過管理者-工作者模式或樹狀拓撲實現)能以部分魯棒性為代價提升全局效率;而完全去中心化的"團隊"組織雖最大化韌性平等性,卻在大規模群體中效率受限。最新研究凸顯混合架構的復興趨勢——融合分層與去中心化協調機制以兼取二者優勢。行業投資數據佐證該趨勢:2024年Q1多智能體系統領域通過超1100筆交易獲122億美元融資,彰顯醫療、交通、金融及國防等千億級市場對MAS變革潛力的持續信心(Aalpha, 2025)。Sun等人2025年的深度研究指出"分層與去中心機制的混合策略"是實現可擴展性與適應性平衡的關鍵路徑,印證本文分類方法的科學價值。事實上層級結構在自然界(如具工蜂-蜂后層級的昆蟲社會)與人類社會(企業組織架構)普遍存在,表明精心設計的層級可顯著增強多智能體AI系統的協調效能。

除結構優勢外,HMAS更契合人機交互需求。在能源運營、軍事指揮等任務關鍵型領域,人類監督員管理AI智能體、智能體再管控底層自動化流程的分層模式,既映射現實管理結構,又為人機協作提供意圖注入節點。通過明確定義人類操作員(戰略決策者)與自主智能體(戰術執行者)角色,層級架構促進人機高效協作。但該集成亦引發新挑戰——系統需向上提供可解釋性(確保人類理解智能體決策)并建立信任機制保障可靠委派。

面對多智能體應用規模與復雜度的持續增長(從含數百分布式能源的智能電網,到自動駕駛車隊,再到自適應供應鏈),亟需建立分層多智能體系統的系統性分類與設計指南。現有MAS分類法(如按團隊規模、通信拓撲、智能體異構性劃分)基礎上,本文提出聚焦層級組織模式及其協調機制的升級版分類體系。該研究融合經典框架(如Smith 1980年提出的任務分配合同網協議及MAS組織理論)與前沿成果(分層多智能體強化學習、大語言模型智能體),以多維視角勾勒HMAS設計空間,明晰系統架構師的抉擇與權衡。分類體系植根現實應用(尤以作者深耕的能源與運營領域為典型),通過油田監測分層MAS、微電網控制等工業案例實證設計范式的實用價值。文末指出現代AI能力與層級結構交叉衍生的研究議題:如何在深度分層系統中維持全局透明度?如何將大語言模型智能體的推理能力融入傳統層級架構?本成果貢獻了橫跨控制、信息流、角色/任務委派、時間分層、通信結構五維度的統一分類法,并顯式關聯協調機制與工業部署,為研究者與系統架構師提供超越既有綜述的實用設計透鏡。

付費5元查看完整內容

可采取多樣化反混合威脅措施以防御低于常規軍事閾值的敵對行動。然而因混合威脅的模糊性、跨域性及反制措施如何影響對手行為的不確定性,這些措施的成效尚不明晰。本文提出通過貝葉斯網絡(概率建模技術)構建模型,模擬反制措施對混合威脅行為的影響。該模型綜合權衡反制成本、威懾對手執行混合威脅的能力及減輕威脅影響的潛力。基于半合成場景運行1000次變體模擬,推演攻擊方A與防御方B圍繞關鍵基礎設施網絡攻擊的戰略互動,評估五類反混合威脅措施的有效性。反制措施涵蓋強化韌性、剝奪對手執行混合威脅能力至以懲罰威脅實施威懾等范疇。分析聚焦評估反混合威脅措施的整體特性,旨在歸納措施普適有效性而非孤立歸因。同時探討政策關聯性并規劃未來研究方向。

圖1:反混合威脅建模的貝葉斯網絡架構。深藍色背景層標注確定性變量集合,灰藍色層表示概率性變量集合。黑色箭頭顯示概率性關聯關系,灰色箭頭顯示確定性關聯關系。

技術發展加速、經濟深度融合及社會數字化重構了當代國家間競爭,為修正主義國家提供在武裝沖突閾值下追求戰略目標的新型工具。在歐洲,"混合威脅"被廣泛定義為"協調同步運用暴力與非暴力手段"的行為——通常難以探測歸因,旨在武器化民主進程并施加影響力。盡管常被混用,"混合沖突"概念有別于美國學者所述的"灰色地帶"戰略:后者指準持續性國家間沖突的特殊狀態,即利用法律外衣掩蓋侵略行動以脅迫對手達成有限目標,其操作低于探測歸因閾值。但二者均指代沖突閾值下的侵略行為,包括信息心理戰、政治外交脅迫、經濟壓制、進攻性網絡行動及利用代理人顛覆對手。

當前各國致力制定反混合政策以提升韌性并對抗手施加成本,從而威懾此類行為。然相較于常規與核領域的公開侵略行為,混合行動因不透明與跨域特性構成獨特挑戰,其威懾防御難度顯著。傳統威懾通過"剝奪對手達成目標能力"(拒止威懾)或"威脅行動后施加代價"(懲罰威懾)來"阻止國家采取非期望行動"。常規與核威懾理論公認"認知"是威懾成功關鍵——對手須感知"行動潛在代價超過收益"。有效威懾需滿足明確性、相稱性與可信度:明確性要求清晰傳達防御方響應措施;相稱性指威懾手段與防御目標的匹配度;可信度則植根于威懾方應對外部侵略的能力與意愿。

經典威懾的適用條件在混合威脅背景下嚴重受限。首先,灰色地帶侵略行為非單純軍事對抗,而是軍事與非軍事、公開與隱蔽操作的復雜混合,涉及經濟脅迫、虛假信息戰、進攻性網絡行動乃至武裝團體部署。其次,混合威脅引發兩大緊迫問題:灰色地帶活動持續發生且常難溯源特定對手,致使威懾實施愈發復雜。

傳統領域內的懲罰與拒止策略雖具部分適用性,卻不足以應對灰色地帶復雜互動。傳統威懾策略需進化為復合型跨域策略——除成本威脅與收益剝奪外,更需融合對敵方的保證激勵措施(assurance)、推動國際合作與規范構建(norms)、利用經濟與系統性相互依賴(entanglement)以影響對手行為。鑒于灰色地帶持續緊張狀態,威懾努力應具"累積性":防御方需將反混合策略視為"長期過程——單次違規不意味失敗,而需通過協同努力塑造對手行為"。此背景下,學者建議采用更廣泛的"勸止"(dissuasion)策略應對混合威脅。勸止被理解為涵蓋懲罰與拒止響應的統領性戰略,通過政治、外交和經濟關系杠桿實施高級反制措施。因此,灰色地帶勸止對手需戰略部署外交-信息-軍事-經濟金融-情報-執法(DIMEFIL)全譜系國家力量工具,同時管控升級動態與潛在報復風險。

然而實踐中,制定成功跨域響應的原則、指標或指南尚未達成共識,比例失衡與行為模糊風險始終存在。因威懾與勸止植根于認知,反混合策略有效性取決于對手真實動機與核心利益認知——包括其進攻傾向及需保護的脆弱點。但決策者常缺乏關鍵信息:對手在灰色地帶的戰略目標、驅動低于戰爭閾值行動的決策機制與收益計算模型、以及反混合政策如何影響威脅行為(尤其因大量混合威脅發生于探測溯源閾值之下)。故評估現實反混合政策效能極為困難。

部分學者嘗試用博弈論模擬混合威脅動態以克服信息匱乏;另一些則將稀缺數據源融入貝葉斯建模技術以優化領域知識。本文基于后者提出貝葉斯網絡建模法——將反混合政策深層不確定性(如威脅探測、溯源及跨域效應)建模為概率關系。模型設定攻擊方A與防御方B兩類國家行為體:防御方面臨混合攻擊并通過反制措施實施勸止。攻擊方A執行混合攻擊的決心受防御方B既有反制措施影響。執行攻擊的決策及其潛在破壞均以概率建模,分別考量威懾關聯的認知心理維度及混合威脅影響的不確定性。混合行動潛在破壞與反制成本共同構成防御方B的收益矩陣,最優反制措施通過最大化預期收益值計算得出。

為驗證模型,設計網絡威脅場景進行仿真推演(見附錄A)。進攻性網絡行動是武裝沖突閾值下混合威脅的典型代表——因網絡空間技術/物理/邏輯層特性及網絡技術日常生活滲透,近年網絡攻擊愈發普遍。從伊朗"震網"(2009)、沙特"沙蒙"(2012)到全球60余國"諾佩提亞"(2017),網絡攻擊可造成重大物理破壞。基于此,本研究綜合現實惡意網絡行動案例設計合理網絡攻擊場景。解析網絡攻擊響應時,聚焦域內響應(網絡空間措施)與域外響應(執法、規范構建、公共外交及經濟制裁等)。通過累積性威懾視角,部分反混合措施旨在減輕敵對網絡攻擊破壞,另一些則通過提高成本收益比勸止侵略行為。

為此征詢政策專家意見并梳理文獻,量化評估各反制措施的成本、減損能力與威懾效能。這些變量以概率分布形式呈現,以兼容文獻分歧、專家差異及混合威脅不可預測性。通過整合文獻綜述與專家洞見,設計總計1000組獨立實驗。實驗結果生成反混合措施排序,用以評估不同場景下措施效能,并回答核心研究問題:

? 在1)措施勸止攻擊效能 2)措施減損攻擊影響效能均存不確定性的前提下,反混合威脅措施的哪些特性最有效助力防御方B應對攻擊方A對關鍵基礎設施的網絡威脅?

本文結構如下:第二章介紹建模方法,闡述如何將文獻與專家見解轉化為概率分布輸入模型;第三章詳述混合威脅場景及關聯跨域反制措施;第四章解析實驗結果;第五章反思研究發現的政策關聯性并指明未來研究方向。

付費5元查看完整內容

態勢感知(SA)是通過感知、理解與預測環境要素的連續過程,構成復雜系統的重要組件。環境信息接收具有持續性與多模態特性,人工智能技術通過將SA目標拆解為數據融合、表征、分類及預測等任務,提供更高效穩健的支撐。本文系統綜述應用于各類環境與場景中構建、增強及評估SA的AI與多模態方法,重點聚焦感知完整性與持續性提升。研究表明人工智能與多模態方法的融合顯著增強了復雜系統的感知與理解能力,但在未來態勢預測與多模態信息有效融合方面仍存研究缺口。本文總結AI與多模態技術實現SA的應用案例與實踐經驗,并提出未來展望與挑戰,包括更全面的預測能力、更強的可解釋性及更先進的視覺信息處理技術。

圖1所示。基于人工智能和多模態技術的態勢感知系統概述。

付費5元查看完整內容

軟件質量標準要求嚴苛,因其驅動全球眾多系統且需確保安全穩健。軟件開發意味著需遵循高標準并適應需求與依賴項的變更。所幸軟件工程的繁重任務可實現部分自動化,尤其隨著生成式人工智能的最新進展。本論文探索自動化代碼維護方法,聚焦"基于大型語言模型的軟件工程"(LLM4SE),通過模型內部優化與模型間通信推進轉換器模型在檢測修復軟件缺陷中的應用。此處"缺陷"涵蓋執行故障與源代碼錯誤,"源代碼"指軟件產品的原始代碼或程序。核心貢獻包括:開發輕量級轉換器變體用于代碼分類;提出兩套自動化程序修復框架;反思LLM4SE研究的可持續性與透明度。研究首先開發編碼器層組合方案(編碼器屬轉換器類型)用于代碼分類。實驗發現輕量剪枝版CodeBERT變體微調耗時減少至1/3.3(微調指在領域數據上訓練模型),且性能更優——缺陷檢測準確率最高提升2個百分點(滿分100),優于全尺寸模型常規用法。該結果推動語言模型在軟件工程中的能效應用,證明全尺寸模型的"通用方案"對代碼正確性分類等簡單任務并非必需。

除錯誤檢測外,本文呢聚焦生成代碼與人寫代碼的缺陷修復。所提SEIDR框架包含"合成-執行-指導-調試-排序"模塊,實現生成代碼的實時修復,彰顯LLM在"生成-修復"循環中的價值。此循環中,LLM通過代碼執行、失敗測試用例及錯誤日志獲取反饋,最終生成全功能代碼。采用Codex(基于代碼訓練的GPT-3)的SEIDR在程序合成基準測試中解決25項任務的19項,優于前沿遺傳編程算法。論文還提出新型"循環翻譯"(RTT)修復管線。與SEIDR不同,RTT專為修復已存在缺陷的生成/人寫代碼設計,通過將缺陷代碼轉譯至其他編程語言/自然語言再回譯至原語言實現修復。其理論依據是:轉譯過程可能因"均值回歸"現象消除缺陷("均值"指模型訓練數據中普遍存在的無缺陷代碼)。實驗證明:LLM驅動的RTT管線在多個基準測試中解決46個微調模型未能修復的獨特缺陷。此能力使RTT成為多智能體程序修復體系的候選方案——各智能體以不同方法協同維護無缺陷代碼。論文還綜述LLM4SE文獻,反思能效與模型復用可能性:僅27%的論文共享代碼、模型及估算訓練能耗所需完整細節,凸顯遵循開放可復現研究準則的重要性。鑒于LLM存在隨機性等局限,本研究提供實證結果而非理論保證,并討論過度使用LLM的風險(如工具依賴、生成代碼漏檢、基準測試數據污染等)。整體而言,本研究推動LLM適配軟件工程任務,為多智能體系統與多模態模型的自動化代碼修復指明方向。

論文結構
 第二章從軟件開發生命周期視角綜述軟件工程自動化背景;第三章概述自然語言處理及LLM架構進展;第四章總結LLM4SE方法、進展與挑戰;第五章闡明研究范圍與機遇(5.3節詳述研究問題、挑戰及對應出版物關聯,5.4節匯總出版物與問題解答);第六章討論有效性威脅、局限、科研與產業影響及未來工作;第七章總結核心結論。為提升可讀性,各背景小節均附框內摘要,研究問題答案與關鍵發現亦作相同標注。

付費5元查看完整內容

本文開發了基于充分統計量的方法,用于設計二元分類任務中的人機協作決策機制。該方法允許AI預測用于全自動化決策,或選擇性輔助人類決策,同時兼容決策者的內生偏倚信念與努力擠出效應,無需構建人類決策的結構性模型。本方法經在線事實核查實驗驗證:人類對AI預測存在反應不足現象,且當AI呈現高置信度預測時會降低自身努力程度。這種不足反應主要源于人類對自身信號精度的過度自信,而非低估AI能力。最優策略為:AI高置信度時自動化處理,不確定性案例委托給人類并完整披露AI預測。自動化雖具價值,但利用AI預測輔助人類的額外收益微乎其微。

人工智能工具性能近年顯著提升,諸多預測工具已媲美甚至超越人類(Kleinberg等, 2017; Agrawal等, 2018; Lai等, 2021)。該進展引發兩大關注點:AI輔助如何影響人類表現(Brynjolfsson等, 2025);以及如何設計人機協作系統以確定案例應自動化處理,或交由人類決策(無論是否輔以AI預測)(Raghu等, 2019; Mozannar與Sontag, 2020)。

設計人機協作面臨的核心挑戰在于:可行方案空間龐大,且人類對設計方案的反應難以預測。人類可能對AI預測展現信念更新偏誤(Agarwal等, 2023),而AI預測可能擠出人類獲取或處理信息的努力——這種現象被稱為算法規避(Dietvorst等, 2015)、自動化偏倚(Skitka等, 1999)或“行車時打盹效應”(Dell’Acqua, 2022)。響應行為的復雜性疊加協作方案的高維特征,使通過實驗或結構建模尋求最優方案困難重重。

本文針對二元分類任務開發充分統計量方法,要求對多個案例輸出分類結果a ∈ {0, 1}。充分統計量V(x)定義為:當人類決策者觀測到經校準的AI評估值x∈[0,1](表示正確分類為1的概率)時,其正確分類案例的概率。該方法兼容任何基于自身評估選擇性自動化分類任務,或在披露(可能不完美的)評估信號同時委派任務給人類的AI系統。在V函數不隨信息披露策略改變的假設下,信息設計理論(Dworczak與Martini, 2019)證明:V函數可被用于求解該空間內的最優設計方案。這意味著——在給定V的條件下——最優設計獨立于人類信息處理、行為偏誤或努力響應等其他人機交互因素。V函數可直接利用向決策者完整披露AI評估值x時的決策準確率數據估算,此類數據可源自實驗(如本研究)或歷史觀測。

該充分統計量方法相較于兩種傳統方案具顯著優勢。方案一需估計人類行為與信念更新的完整結構模型并求解最優設計,此過程需更強行為假設且估計所需數據(不同AI評估值x下的準確率)與直接估計V函數所需數據相同。方案二需通過實驗測試大量設計尋找最優方案,但因設計空間巨大而不具實操性,且仍需理論論證所獲最優解是否全局最優。

我們在激勵性在線事實核查實驗中實施并驗證本方法。參與者需判斷陳述真偽,此場景對人機協作研究具典型價值:公共陳述真實性受高度關注,人類與AI核查員均被廣泛應用。盡管媒體、獨立機構與數字平臺長期依賴專業人類核查員(國際事實核查網絡, 2023),待核查陳述數量的激增促使各方關注公眾參與事實核查(Allen等, 2021; X社區筆記, 2025)及自動化核查(Guo等, 2022; 國際事實核查網絡, 2023)。完善人機協作系統對提升事實核查效能具有現實意義。

事實核查亦是理想的實驗場景:任務易于闡釋且可由未經訓練者執行;利用含基準真值標簽的陳述數據庫(如實驗采用的FEVEROUS庫(Aly等, 2021))可便捷測量準確率;該任務還表征了醫療診斷(Agarwal等, 2023)、司法保釋決定(Kleinberg等, 2017)、簡歷篩選(Li等, 2020)等典型二元分類場景。

實驗分兩階段推進:第一階段通過測量不同AI評估值下的分類準確率估計充分統計量V,求解最優及近似最優設計。因社會往往偏好人類保留最終決策權(事實核查可能屬此情形),我們同時考慮允許自動化和完全人類決策的設計。第二階段在參與者內實驗中實施五種基于第一階段估計的方案,通過比較兩階段預測準確率與實際結果檢驗充分統計量方法。

付費5元查看完整內容

大型語言模型(LLMs)的持續發展為系統工程領域(尤其是視覺問答(VQA)方向)開辟了新機遇。多模態LLMs能夠同時處理文本與圖形輸入,使其可結合基于模型的系統工程(MBSE)模型的圖形元素與配套文本描述進行綜合解析。本文探究多模態LLMs對系統建模語言(SysML)v1塊定義圖(BDDs)的理解與解釋能力。BDDs是以可視化形式精確描述系統結構元素、屬性、關系與多重性的圖表。我們采用精選的SysML BDD數據集及配套多項選擇題集,對專有與開源多模態LLMs進行評估——該數據集設計用于測試LLMs在布魯姆分類法前兩層級(記憶與理解)的表現,同時分析模型規模對準確率的影響。研究結果揭示了當前哪些LLMs能夠原生解析SysML BDD語法,為未來利用AI代理增強系統建模流程的研究提供方向。

人工智能(AI)與基于模型的系統工程(MBSE)流程的融合,為提升模型理解、驗證及支持活動提供了重要機遇。多模態大語言模型(LLMs)能夠處理文本與圖形輸入,拓展了系統建模語言(SysML)v1模型自動化解析的潛力。塊定義圖(BDDs)作為SysML v1模型的核心要素,是系統結構、屬性與關系的基礎性表征(OMG,2019)。盡管LLMs發展迅速,但其精準解析SysML建模成果的能力仍鮮有研究。現有對多模態LLMs的評估主要集中于通用圖像或圖示推理,而非SysML等特定領域圖形語言(Antol等,2015;Ishmam等,2024;Lin等,2014)。這一空白限制了對LLMs在支持依賴SysML模型解析的工程流程中的效能認知。

本文通過評估當代多模態LLMs對SysML v1.x BDDs的解析能力填補這一空白。我們構建了精選BDD數據集,并設計符合布魯姆分類法前兩層級(記憶與理解)的多項選擇題集。評估涵蓋專有與開源LLMs,分析不同規模模型的性能差異。研究結果為當前LLMs在理解形式化系統建模成果上的優勢與局限提供實證見解,并為未來增強MBSE實踐中AI驅動的支持技術指明研究方向。

付費5元查看完整內容

現有的決策計算模型往往局限于特定的實驗設置。造成這種限制的主要原因是無法捕捉決策者對情況的不確定性。本文提出了一個計算框架,用于研究神經科學和心理學中不確定情況下的決策制定。框架主要側重于決策者對世界狀況的概率評估,即他們的 “信念”。具體來說,它基于部分可觀測馬爾可夫決策過程(POMDPs),結合貝葉斯推理和獎勵最大化來選擇行動。利用感知決策和社會決策方面的各種實驗數據,證明了基于信念的決策框架的可行性。框架解釋了感知決策實驗中決策者的實際表現與他們對實際表現的信念(即決策信心)之間的關系。它還說明了為什么在許多情況下這種評估會偏離現實。這種偏差通常被解釋為次優決策的證據,或選擇和信心的不同過程。我們的框架對這些解釋提出了挑戰,它表明,一個優化收益的規范貝葉斯決策者也會產生同樣的偏差。此外,在定量預測人類在社會決策任務中的行為方面,方法優于現有模型,并提供了對潛在過程的洞察。結果表明,在涉及大型群體的決策任務中,人類采用貝葉斯推理來模擬 “群體心理”,并對他人的決策做出預測。最后,將方法擴展到關于他人的多個推理層次(心智理論層次),并將服從作為群體決策的一種策略聯系起來。這個擴展框架可以解釋人類在各種集體群體決策任務中的行為,為大型群體中的合作與協調提供了新的理論。

圖 1.1: 基于信念的決策框架。智能體通過行動、觀察和獎勵與世界互動。智能體無法完全觀測到世界的狀態,只能根據觀測結果和智能體的內部世界模型,以概率方式表示世界的狀態。智能體的目標是根據當前狀態的概率分布來制定策略,即所謂的信念

付費5元查看完整內容

本文比較了幾種神經網絡架構,以逼近一些基本一維偏微分方程的解和求解算子。具體來說,研究了在物理信息機器學習中,殘差層是否比全連接層更有優勢,發現兩者在所考慮的問題上表現類似。還將流行的 DeepONet 和傅立葉神經算子方法與算子學習方法進行了比較,發現雖然兩者在線性問題上的精確度相當,但后者在存在簡單非線性的情況下能生成更精確的模型。

付費5元查看完整內容

本書探討了在實踐中涉及隨機模型參數的優化問題。它詳細描述了魯棒最優解的計算,即對隨機參數變化不敏感的最優解,其中需要適當的確定性替代問題。基于隨機數據的概率分布,利用決策理論概念,將隨機不確定性下的優化問題轉化為適當的確定性替代問題。 由于涉及到概率和期望,本書還展示了如何應用近似解決技術。提供了幾種確定性和隨機近似方法:泰勒展開方法、回歸和響應面方法(RSM)、概率不等式、生存/失效域的多重線性化、離散化方法、凸近似/確定性下降方向/有效點、隨機近似和梯度程序以及概率和期望的微分公式。在第三版中,本書進一步發展了隨機優化方法。特別地,它現在展示了如何將隨機優化方法應用于工程、經濟學和運籌學中出現的重要具體問題的近似解。實際優化問題大多依賴于若干模型參數、噪聲因素、不可控參數等,而這些參數在規劃階段并沒有固定的量。工程和經濟學/運運學研究的典型例子有:材料參數(例如彈性模量、屈服應力、許用應力、彎矩能力、比重)、外部載荷、摩擦系數、轉動慣量、連桿長度、連桿質量、連桿重心位置、制造誤差、公差、噪聲項、需求參數、投入產出函數中的技術系數、成本因素等。由于隨機不確定性的多種類型(物理不確定性、經濟不確定性、統計不確定性、模型不確定性),這些參數必須由具有一定概率分布的隨機變量來建模。在大多數情況下,至少這種分布的某些時刻是已知的。

第一章簡要概述了隨機優化方法,包括適當的確定性替換問題的推導. 第二章介紹了隨機不確定性條件下最優控制問題的基本求解技術:用一階非線性微分方程系統對不同技術(機械、電氣、熱力學、化學等)工廠和經濟系統中出現的最優控制問題進行數學建模,該系統的狀態向量為z=z(t)。隨機最優調節器或隨機不確定性下的最優反饋控制一般只能用近似的方法得到。在第三章中,利用基本隨機開環反饋方法確定了隨機最優反饋控制。在動態系統的最優控制中,標準程序是首先離線確定一個最優開環控制,使用模型參數的一些標稱值或估計值,然后通過在線測量和控制動作糾正實際軌跡或系統性能與規定的軌跡(規定的系統性能)之間的結果偏差。第五章描述了調節器優化設計的特殊方法:調節器的優化設計通常基于給定的、固定的標稱初始條件值、外部負載和其他模型參數。

付費5元查看完整內容
北京阿比特科技有限公司