國防部門正為其工作體系推行數字化工程實踐,同時更廣泛的系統工程界致力于實現此類實踐的現代化與標準化。從傳統文檔模式向純數字化模式的轉型,需要提升對項目或產品全生命周期的數字化管理能力。然而技術發展必須通過迭代流程優化工具設計,聚焦多元用戶群體的可用性需求。現有工具技術雖多,卻常忽略工程師為同行設計工具時的可用性評估。在開發數字化工程任務解決方案時融入可用性考量,既能簡化工具操作又可擴大用戶群體。
本研究評估了12名參與者使用Stitch的表現。該定制化網絡工具支持創建系統工程建模語言第二版(SysMLv2)模型并與虛擬智能體交互。采用混合研究方法結合遙測數據與問卷調查,通過四組任務情景對組(學員與專業人員各半)構建測試框架:受試者根據源文檔構建SysMLv2模型并分析模型要素。該流程平衡傳統文件瀏覽模式與虛擬智能體輔助功能,并采用雙重視覺樣式設計。遙測數據與問卷反饋共同揭示工具可用性及虛擬智能體效能,結果表明不同群體內部及群體間存在顯著的性能與可用性差異。盡管Stitch展現出可用性且虛擬智能體有效支持建模,但參與者普遍期待增強建模輔助功能。
本文貢獻包括:1)基于用戶中心化設計方法論構建Stitch工具,通過案例研究論證虛擬智能體支持下SysMLv2建模的可行性;2)開發四組情景對組指導用戶系統學習SysMLv2建模;3)設計兩種定制模型樣式及可視化擴展機制輔助模型解讀;4)建立用戶通過虛擬智能體調取文檔的學習路徑;5)提出提升Stitch及其他數字工程工具可用性的發展建議。
系統工程(SE)向數字化工程(DE)的轉型需與新技術發展同步。硬件、軟件與基礎設施的深度融合已重塑社會各場域的工作模式。美國防部(DoD)特別是空軍部隊,正采用"引領、借力、觀察"策略吸納敏捷產品開發的商業技術[1]。在業界引領的背景下,國防部需借力哪些技術支持數字化轉型?精進技術并開發配套工具將優化項目全生命周期管理。明確DE工具需求的首要步驟是界定任務支持范疇,繼而通過工具評估定義用戶核心功能需求,最終擴展至更多應用場景。本研究聚焦SysMLv2與虛擬智能體建模場景,致力于構建任務界定與基礎功能需求的可用性基準。
政府機構在項目實施中接收的交付成果形式多樣,常包含多類型文件的數字資產。綜合產品組(IPT)成員需協作驗證這些資產,其專業知識互補形成綜合評估體系。信息關聯要求建立數字資產管理機制實現交付物文檔化與模型化。當前SE/DE領域商業建模工具可通過系統建模實現資產驗證,但復雜工具的設計門檻限制了新從業者及跨領域專家的使用。2018年美軍發布的《國防部數字化工程戰略》設定了推動轉型的多項目標[2],包括改進合同語言聚焦模型開發、制定標準及革新文化與人力體系。同年發布的《國防部云戰略》明確了向云計算轉型的實施路徑[3]。這些頂層設計與國際SE/DE界最新研究形成呼應[4][5],共同推動國防部采用系統性產品開發新技術。
由六個章節構成:第二章闡釋四大核心DE任務,結合可用性啟發原則,分析SysMLv1與SysMLv2語言構型要素,并綜述DE工具、大語言模型(LLM)與微服務技術,奠定研究理論基礎;第三章詳述Stitch設計過程,涵蓋SysMLv2參考架構應用、界面體驗開發、數據記錄、LLM集成及信息技術設計;第四章延續設計流程,闡明研究方法論、實驗設計與數據采集規程;第五章呈現可用性評估結果,深度解析各任務情景數據;第六章總結研究成果,論述應用價值并提出后續研究方向建議。
人工智能分布式部署中智能體系統的廣泛應用,對高效選擇影響智能體學習行為的參數、在復雜環境中實施機制設計,以及整合多元智能體能力實現目標結果提出了新挑戰。算法機制設計作為計算機科學、數學和經濟學的交叉領域,致力于開發引導理性智能體達成預期行為的算法,其應用涵蓋資源分配、成本分攤、定價與組合拍賣等場景。然而,傳統方法受限于計算約束與靜態假設,在充滿不確定性與動態變化的環境中效果不佳。
本論文通過融合強化學習(RL)與貝葉斯優化(BO),針對動態多智能體場景開發自適應機制以突破上述局限。我們提出多智能體強化學習(MARL)中機制設計的新框架,依托創新的BO方法高效探索潛力方案。MARL可捕捉隨機環境中多智能體動態交互的復雜性,通過求解底層馬爾可夫博弈以學習聯合策略。評估多MARL場景的計算復雜度問題通過以下方式解決:(I)擴展后繼特征至納什均衡策略的遷移學習;(II)采用BO框架限定評估預算,使問題可解。
所提機制設計框架的有效性在出租車平臺司機服務費設定、共享自然資源開發管理(社會福利最大化)、探索任務機器人集群硬件采購決策優化,以及激勵機制與招募策略設計(委托方目標最優化)等實際應用的基準研究中得到驗證。該方法在現實問題上展現的優越性,凸顯了BO與MARL融合優化復雜多智能體系統的潛力,為機制設計領域的未來研究奠定了堅實基礎。
人工智能分布式部署的代理系統日益普及,對高效選擇影響智能體學習行為的參數、復雜環境下的機制設計應用以及整合多樣化智能體能力達成預期目標提出了新挑戰。算法機制設計(這一融合計算機科學、數學與經濟學的跨學科領域)致力于開發引導理性智能體實現期望行為的算法,其應用涵蓋資源分配、成本分攤、定價與組合拍賣。然而,傳統方法受限于計算約束與靜態假設,在動態不確定環境中的有效性不足。本論文通過整合強化學習(RL)與貝葉斯優化(BO)開發動態多智能體環境中的自適應機制以突破上述局限。
本文提出多智能體強化學習(MARL)中機制設計的新框架,依托新型BO方法高效探索潛力方案。MARL捕捉隨機環境中多智能體動態交互的復雜性,通過求解底層馬爾可夫博弈學習聯合策略。評估多MARL場景的計算復雜度問題通過以下方式解決:(一)擴展"后繼特征"至納什均衡策略的遷移學習;(二)采用基于BO的框架限制評估資源,使問題可解。所提機制設計框架的有效性通過多項實際應用基準研究驗證,包括:出租車平臺司機服務費設定、共享自然資源開發管理(實現社會福利最大化)、機器人編隊勘探任務硬件采購決策優化,以及定義最優激勵與招募策略(最大化委托方目標)。實證結果表明,本方法在現實問題中優于現有技術,彰顯BO與MARL結合優化復雜多智能體系統的潛力,為機制設計未來研究奠定堅實基礎。
隨著太空探索的加速發展,以及在極端環境中工作的機器人和人類數量的增加,我們必須實施多智能體自主協調,以確保在本質上通信不友好環境中可安全操作。據所知,目前尚無多智能體調度算法能夠獨立推理通信延遲。一個必須解決的關鍵缺口是開發一種單智能體調度器,能夠在不確定的觀察下決定何時行動,這可以成為分布式多智能體調度的基礎。現有研究已經提供了關于時間推理的見解,即建模觀察不確定性和在時間約束下調度事件。我們既需要在存在不確定觀察延遲時決定何時調度事件,也需要在智能體之間進行穩健的協調。面對不確定性調度事件是一個挑戰,原因在于不可控制的外部事件、未知的觀察延遲以及智能體之間不確定的通信所導致的復合不確定性。本論文提出了一系列貢獻,最終展示了一個穩健的單智能體任務執行器,該執行器使用我們的調度器在多智能體環境中進行協調,盡管存在觀察延遲。實現這一點需要深入理解如何檢查具有不確定延遲的時間約束的可控性,定義一個對不確定觀察延遲具有魯棒性的調度器,將該調度器集成到現有的高層任務執行器中,并制定多智能體的協調策略。我們展示了該調度器具有預期的性能特征,并通過一個受人類太空飛行啟發的場景,在實驗室中進行了多智能體在不確定通信下的執行演示。
本論文的結構如下。第 2 章將提供更詳細的問題陳述,包括用于測試不確定通信的分布式協作和協調的場景描述。第 3 章將概述我們解決該問題的方法。第 4 章將提供本論文的第一項技術貢獻,首先是解決觀察延遲建模問題,然后提供一個可用于檢查具有觀察延遲的時間約束是否可滿足的程序。第 5 章介紹了延遲調度器,這是一種新穎的策略,用于決定在觀測延遲的情況下何時采取行動。在第 6 章中,我們將延遲調度器定位為可部署到實際硬件中的高級任務執行器。第 7 章最后介紹了一種用于不確定通信環境的多智能體協調架構。第 8 章中的討論為本論文畫上了句號,為本研究中的決策提供了更多背景信息。
隨著技術的進步,我們不斷被推向新的領域。當今發生的最根本的變化之一就是不斷推動無人駕駛和自主系統的發展。這些系統在日常生活中越來越普遍。無人駕駛系統的開發和部署正在改變軍事和民用領域的各種場景。從戰場到生產線,緩慢的進步是顯而易見的。即使在更微妙的方面,如商品定價和戰略信息識別,沒有人類作為主要決策驅動力的系統也在不斷進步。
隨著這一領域的發展和成熟,其自主程度也在不斷提高。也就是說,過去只能執行死板例行公事的系統,現在能夠處理越來越多的抽象任務。例如,今天的汽車已經從保持這個速度到在這條高速公路上行駛。隨著自動駕駛水平的不斷提高,我們需要新的方法來制定控制策略。隨著目標變得越來越抽象,必須考慮的邊緣情況也隨之激增。基于經典推導和規則的策略很快就會變得過于復雜,無法實際執行。
強化學習領域的最新突破有望解決這一問題。基于強化學習的系統的主要優勢在于其專注于目標驅動行為。也就是說,首先要在目標導向的框架內定義系統的行為。積極的結果,如贏得游戲、遞送包裹或識別目標,都會得到獎勵。負面結果,如撞車、錯過目標或無法完成任務,則會受到懲罰。通過探索,可以發現并完善積累積極經驗和避免消極經驗的政策。
在開發基于強化學習的策略時,建模和模擬是不可或缺的工具。可以將系統置于成本過高、危險或根本不可能重現的情景中,并對其行為進行嚴格評估。這樣就可以進行必要的探索,以確定和改進在特定環境中行之有效的政策。然而,由于在建模過程中進行了簡化,系統建模必然會在預測結果中引入認識上的不確定性。這些不確定性可能會產生復雜的影響,導致在真實系統中看不到的行為,或者抑制了細微的行為,而這些細微的行為擴大后變得更加重要。模擬與真實體驗之間的這種不匹配通常被歸結為所謂的現實差距。
整個自主系統研究的一個子領域,即 “模擬到現實”,就是試圖解決這一差距。產生能從模擬環境轉移到目標環境的政策的常見方法包括使用高保真模擬和轉移學習技術。雖然其中一些成果很有希望,但我們對建模選擇在環境間轉移中的作用的理解仍然存在差距。也就是說,目前的文獻沒有直接解決選擇在系統簡化模型中表示的現象的問題。
為了解決這個問題,我們開發了一種方法,用于比較系統模型中需要考慮的現象的相對重要性。通過將系統表示為一系列現象,可以將可能的簡化空間表示為一組需要考慮的離散模型。我們采用了一種基于抽樣的方法來探索這一空間。這種方法用于對表示系統時可能進行的簡化中具有代表性的部分進行抽樣。實驗表明,通過對空間進行相對較小的取樣,可以對各種現象進行排序,從而使完全參照模型的顯著簡化版本保持相似的傳遞特性。
通過評估各個抽樣簡化,可以量化不同現象的重要性。具體做法是將簡化分組為非排他性的集合。這些集合以個別現象為特征,并允許對集合的性能進行綜合衡量,以表示每個特征現象的重要性。結果表明,使用這種重要度量方法,可以開發出一組有序的簡化模型,其保真度也會越來越高。與其他生成類似模型集的方法相比,通過這種方法確定的模型集在較低的保真度水平上顯示出更好的轉移性。
其他實驗表明,這種方法適用于不存在完美的參照系統知識的情況。由此可見,這種方法適用于不可能對真實系統進行轉移評估的現實系統。此外,還對個別現象的取樣策略和評估指標進行了評估。最后一個實驗展示了該方法在一個常見的強化學習基準--Acrobot 系統中的應用,實驗結果表明,該方法在很大程度上是成功的,它能正確識別出一種現象,這種現象在質上改變了成功所需的控制,是最重要的。同樣,它也能將在訓練有素的策略下對系統行為影響微乎其微的干擾現象識別為最不重要的現象。更令人鼓舞的是,通過該方法識別出的一些簡化模型所產生的策略實際上優于直接在真實系統上訓練的策略。
圖 3.1: 所開發方法的概述。首先,對已識別現象的簡化空間進行采樣,以確定實驗設計。實施與該設計相關的簡化模型,并為每個模型合成和評估一個策略。然后將這些策略轉移到參考模型(可以是真實系統)并進行評估。由此產生的數據被歸類為每種現象的非排他性集合。如果簡化模型包含了某一現象,其數據也包含在這一集合中。比較每組數據的轉移統計量,得出現象的相對排序。
異構多智能體系統為解決農業、軍事、裝配和倉庫自動化等不同領域的復雜問題提供了可能,否則單個智能體是無法解決這些問題的。要有效部署異構多機器人團隊,研究必須解決不同抽象程度的四個問題:任務規劃(是什么)、運動規劃(如何)、任務分配(誰)和調度(何時)。這些問題高度相互依存,先前的工作已經證明,利用這些問題的單個解決方案之間的協同作用的系統可以提高多機器人協調的效率和效益。
本文研究了在多智能體組隊應用中使用基于特質的模型來表示單個智能體,以及如何利用基于特質的建模來實現更穩健、更高效的多智能體聯盟組建解決方案。具體來說,我們研究了如何在聯盟組建算法中使用這些技術來回答任務分配、調度、運動規劃和任務規劃這四個問題。
我們的研究表明,利用基于機器人和任務特質建模的算法可以在異構多機器人團隊中實現高效的協調,并且在時間進度、分配質量和計算效率方面優于現有方法。本論文的貢獻如下:
創建一個建模框架,使現代任務分配算法能夠推理動態特征。通過使用基于轉換的建模框架,我們創建了對以往基于特質的建模技術的擴展,以更好地推理智能體的特質如何隨時間變化。
為異構多機器人系統開發基于時間擴展特質的任務分配和路徑規劃統一框架。我們引入了一種基于搜索的方法,用于基于特質的時間擴展任務分配和運動規劃,命名為增量任務分配圖搜索(ITAGS)。
整合任務規劃、任務分配、調度和運動規劃的新型多機器人協調問題的形式化和解決方案。我們形式化了一類新的多機器人協調問題,該問題融合了這些問題中的每一個,并提出了一種解決方案(圖形遞歸同步任務分配、規劃和調度(GRSTAPS))。
為 ITAGS 的動態變體創建框架,該變體能夠進行基于特征的任務分配修復: 我們對 ITAGS 進行了擴展,使用基于特質的動態時間擴展任務分配算法,如果智能體的特質或任務要求在執行過程中發生變化,該算法可以修復任務分配。
創建一個主動學習框架,用于學習多智能體任務分配問題的特質要求: 由于理解一個聯盟的特質與該聯盟在特定任務中的表現之間的關系可能具有挑戰性,因此我們提出了一種主動學習框架來學習任務與特質之間的關系。此外,我們還提供了一種新的時間擴展任務分配算法,該算法能夠優化學習到的質量模型。
圖 2.1: 顯示各種多機器人協調問題交叉點的維恩圖。
自動化已成為現代經濟的重要組成部分。在眾多業務、任務和項目中,通過增加有限的人力,可以提高生產率。隨著自動化流程越來越多地融入日常生活,了解人類操作員與自動化之間的關系變得至關重要。過去,自動化開發依賴于操作員的反饋,而操作員對類似系統的熟悉程度和對現代技術的接受程度可能會有所不同。這一事實凸顯出缺乏一種標準化的衡量標準,可以量化個人對自動化系統的信任程度。本研究就建立了這樣一種衡量標準。自動化信任度指標是通過一個多步驟流程創建的,首先由主題專家進行 Q 排序,以確定數據集的相關項目。然后,將得到的項目發送給 145 名受訪者進行探索性因子分析 (EFA),將項目歸類為因子,并剔除表現不如預期的項目。在實施 EFA 分析結果后,又對 168 名受訪者進行了確認性因子分析 (CFA),以證實 EFA 分析結果,并找出影響個人對自動化信任程度的重要問題。這一研究過程產生了一個可應用于各種系統的八問調查,它能可靠地測量人類對機器信任的四個方面。
圖 3.1 影響對自動化信任的因素及其與性能的關系。
機器學習的最新發展以及公眾對數字個人助理態度的普遍轉變,為對話系統開辟了新的領域。然而,建立數據驅動的多領域會話智能體,使其在對話環境中發揮最佳作用,仍是一個有待解決的難題。實現這一目標的第一步是開發一種在新領域學習對話策略的有效方法。其次,必須有能力收集和利用人與人之間的對話數據來引導智能體的知識。本論文中介紹的工作展示了神經對話管理器如何通過強化學習進行微調,從而為在多個領域高效學習對話策略提供可行的方法。
論文首先介紹了一個對話管理模塊,該模塊通過互動學習,根據對話的當前上下文采取最佳行動。目前向神經、參數豐富系統的轉變并不能完全解決來自語音識別或自然語言理解組件的錯誤噪聲問題。因此,我們提出了一種貝葉斯方法,以便在沒有任何先驗數據的情況下,在直接互動中學習更穩健、更有效的策略管理。通過對模型權重進行分布,學習智能體不易過度適應特定的對話實現,因此可以采用更有效的探索策略。研究結果表明,即使在數據量較少的情況下,深度強化學習的性能也能與非參數模型相媲美,同時與之前的技術水平相比,計算復雜度大大降低。
從行業角度來看,在不對人類對話進行任何預培訓的情況下部署對話管理器并不可行。然而,可用數據的規模阻礙了統計系統(尤其是對話管理器)建設的進展。為了解決這一根本性障礙,我們引入了一種完全基于眾包的新型數據收集管道,無需聘請專業注釋員。該方法的驗證結果是收集到了多領域 Wizard-of-Oz 數據集(MultiWOZ),這是一個跨越多個領域和主題的完全標記的人與人書面對話集。擬議的數據集創建了一套新的基準(信念跟蹤、策略優化和響應生成),大大提高了分析對話的復雜性。
所收集的數據集為基于強化學習(RL)的新方法訓練多領域對話管理器奠定了基礎。我們提出了一種多行動和插槽對話智能體(MASDA)來解決一些局限性: 1) 處理復雜的多領域對話,在一個回合中同時出現多個行動;以及 2) 缺乏可解釋性,因此,如果有中間信號(如對話回合注釋),就會妨礙這些信號的使用。MASDA 利用中間信號對系統行為和插槽進行了明確建模,從而改進了基于任務的端到端框架。該模型還可以選擇單個回合中的并發行為,從而豐富生成的響應的表示形式。在處理并發行動時,所提出的框架允許對對話任務完成指標進行 RL 訓練。結果表明了 1)處理并發行動和 2)利用中間信號這兩個方面的優勢: MASDA 優于之前的端到端框架,同時還提高了可擴展性。
圖 2.1 口語對話系統的結構由六個主要部分組成。在典型的模塊化方法中,各組成部分分別進行訓練。端到端方法則將內部模塊結合在一起(灰色部分)。
現在,模擬被更頻繁地用于對現實世界或擬議系統進行實驗,以了解系統行為或評估改進策略。隨著時間的推移,大型企業越來越需要開發精密復雜的系統來與同行業競爭。而且,這些企業之間的聯系越來越緊密,就像一個網絡化的企業。這就進一步提高了開發能與其他企業互聯的越來越復雜的模擬的要求。在這方面,分布式仿真已廣泛應用于軍事領域,但在其他領域并沒有得到普及。這背后的原因是,在分布式仿真之間建立通信協議需要專業技術知識。科研行業一直在努力縮小這一差距,其中最重要的工作是制定高級架構(HLA)標準,為分布式仿真模型之間提供通用通信協議。
建模與仿真(M&S)行業也為開發人員提供了大量有關獨立仿真建模的文獻。在這種情況下,概念建模的重點是模型的準確性和效率,而不是互操作性。本研究也對此進行了詳細討論。直到最近,從業人員也一直在努力尋找對底層技術的支持。但隨著標準運行時基礎設施(RTI)和仿真開發平臺支持的引入,這一差距已經縮小。
HLA 標準承諾解決分布式仿真模型之間的互操作性問題,但只能提供語法層面的標準指南。因此,仿真互操作性標準組織(SISO)繼續開展研究,確定了從業人員在語義層面面臨的互操作性問題,并起草了一份互操作性問題清單。然而,已發布的 SISO-STD-006-2010 標準只指出了問題,卻沒有提供語義解決方案。
本研究的主要貢獻是提出了分布式仿真互操作性(DSI)框架,為《商用現成仿真包互操作性參考模型》(SISO-STD-006-2010)中列出的互操作性問題確定了語義解決方案。本研究建議將這些互操作性語義解決方案納入 HLA 對象建模模板規范。這樣做將有助于行業從業人員實現 HLA 的互操作性承諾,并使分布式仿真模型更具可重用性和可組合性。
多智能體機器人技術有望塑造工業的未來,有可能改變日常生活的許多方面。在未來十年中,它們預計將對運輸系統、軍事應用(如偵察和監視、搜救行動或太空任務)產生影響,并為急救人員提供支持。
在機器人領域最新發展的推動下,隨著新一代多智能體機器人系統變得更加智能、精確,應用領域也更加多樣化,本論文將為這些系統的發展做出貢獻。但是,為了實現這些目標,組成合作機器人系統的各個智能體需要在確保準確性和保留執行多樣化任務能力的同時,對它們所能完成的任務進行專業化。
本論文在考慮單個智能體專業化能力的特定背景下,探討了蜂群機器人技術中的任務分配問題。基于每個智能體都擁有專門的功能能力,以及分布在周圍環境中的預期任務提出了特定要求的假設,提出的任務分配機制在兩個不同的空間中制定。首先,團隊成員專業化的初級形式被表述為嵌入智能體動力學控制空間的合作控制問題。其次,定義了智能體專業化的高級表述,在專用的專業化空間中估計單個智能體的任務分配概率,這是本論文對蜂群機器人領域的進步和實踐的核心貢獻。
在專業化空間中制定的原始任務分配過程經歷了四個發展階段。首先,從概念上引入了任務特征識別階段,利用嵌入在智能體中的傳感層的輸出來驅動所提出的任務分配方案。其次,制定匹配方案,將每個智能體的專業能力與相應的檢測任務進行最佳匹配。在這一階段,智能體專業化的一般二進制定義是任務-智能體關聯的基礎。第三,將任務-智能體匹配方案擴展為創新的基于概率專業的任務-智能體分配框架,以推廣這一概念并挖掘智能體專業化考慮的潛力。第四,根據智能體的機械、物理結構和嵌入式資源對其專業化進行調制定義,進一步完善了總體框架。此外,還對原有框架進行了擴展,并引入了優先級層,以提高系統對復雜任務的響應能力,這些復雜任務的特點是基于對多個類別的識別。
在模擬和實際實驗中對所提出的基于專長的任務分配方法進行了實驗驗證,并結合潛在應用對結果進行了介紹和討論,以證明所提框架的有效性和效率。
這項工作旨在填補以往解決機器人群個體專業化問題的工作中的技術空白。本論文的成果通過開發一個創新框架,利用傳感能力來支持智能體之間專業化的概念化和實施,從而推動了蜂群機器人領域的發展。重點在于定義單個智能體的專長,并根據每個任務的特定約束條件,將其與這些單個智能體所要掌握的任務相匹配。為此,本研究打算回答以下研究問題:
問題 1:一群智能水平相對較低的機器人如何完成復雜的任務,這些任務需要單個機器人代理的專業化?
過去二十年來,多智能體系統的合作編隊控制受到了研究人員的極大關注。本論文以文獻綜述(第 2 章)中提到的方法為基礎,提出了一種解決方案,以填補機器人團隊中單個成員專業化方面的研究空白。本論文的重點是通過利用智能體的非同質性來增強蜂群的能力。為此,本論文擴展了合作蜂群的概念,并提出了一個嚴格的流程來利用單個智能體之間的專業異質性。
為了回答問題 1,我們首先進行了一項早期調查,以驗證這一概念。這一過程將機器人團隊工作空間的不同區域定義為分配給不同任務的獨立區域。所開發的解決方案可讓機器人順利安全地切換位置,并根據每個訪問區域要執行的特定任務動態調整整體隊形。它定義了如何在每個區域管理機器人群的編隊。作為一種初級的專業化形式,當智能體從一個區域轉移到另一個區域時,該框架會將智能體的領導角色從一個智能體切換到另一個智能體。在第一階段的研究中,假定一個特定的智能體(即蜂群中的一個成員)是每個區域中唯一專門執行領導任務的智能體。在任務完成之前,該智能體被指定為相關區域的專門領導者。第一部分研究的詳細情況將在第 3.4 節中報告。
問題 2:能否對最初的方法進行升級,讓專業化個體從環境中的自動目標識別中獲益,能否讓智能體之間的合作變得足夠穩健和靈活,以便在發現目標后自動將適當的專業化智能體分配到相應的任務中?
為了回答這個問題,我們進一步擴展了原有的協調系統,用于在專用機器人之間分配基于任務的領導權。通過對分布在機器人群工作空間中的專業化影響區域的定義進行演化,對問題進行了重新表述。受早期編隊方法的啟發,出現了一種有趣的解決方案。從使用機載傳感器自動識別工作區目標的假設出發,選擇有資格執行識別任務的智能體的過程應逐步經歷三個基本狀態,分別稱為搜索狀態、任務狀態和執行狀態。這種方法還可擴展到目標移動時的動態影響區域,以及多個任務共享同一區域時的動態影響區域。這更好地反映了移動機器人的實際干預場景。這方面的工作將在第 3.5 節中報告。
問題 3:為了改進蜂群的管理,能否根據智能體的專業化程度,在一定程度上適合響應給定任務的概率匹配機制中,適當定義和制定每個智能體的專業化功能?
為了解決這個問題,可以利用基于概率的建模來完善用于實現單個智能體角色專業化的框架設計。建立這樣一種智能體行為的概率表征,可以形成一種可擴展的機制。后者支持自動化流程,能夠處理任務和專業化定義中的不確定性,并應對任務約束和智能體能力之間的不完美匹配。所提出的智能體選擇方案是根據任務識別的置信度和特定智能體滿足任務特定要求的概率來制定的。所提出的基于專業的任務分配方案旨在根據所識別的任務約束條件,計算蜂群中各個智能體的匹配適合度,即任務-智能體專業匹配概率。本框架的開發過程詳見第 4.3 和 4.4 節。
問題 4:提議的框架能否應用于實際系統?
為了證明所提方法的有效性及其在現實世界中的應用潛力,我們從兩個方面對其進行了測試。首先,在仿真中對所提出的框架進行驗證,以證明其有效性。第 5 章介紹了大量的模擬實驗。然后,作為案例研究介紹了擬議方法的潛在應用,同時詳細介紹了擬議框架在真實機器人平臺上的實施情況,以驗證和檢驗基于專業的任務分配方案在實現預期協調水平方面的性能。這項工作將在第 6 章中介紹。
圖 3.12 任務執行的先后順序:(a-c)影響區重疊,操作員選擇任務 1(紅色)為優先任務,這促使紅色機器人繼續擔任領導者,直到紅色任務完成;(d-f)第二優先任務(藍色)正在執行,藍色機器人轉為領導者位置;(g-h)蜂群恢復到影響區重疊外的搜索狀態,然后搜索其他任務(綠色,然后是紅色),由相應的領導者機器人執行。
多智能體自主系統與實時規劃有關的研究日益增多,本論文就是對這一研究的貢獻。多年來,由移動智能體組成的自主系統已被證明是用于探索(如太空機器人)、軍事(如搜救行動)和工業應用(如谷歌自動駕駛汽車)的高效、穩健和多功能工具。隨著自主技術日趨成熟,部署多個自主智能體來完成復雜的任務在許多不同的應用中都受到了廣泛關注。如果單個智能體可以完成一項任務,那么多個智能體就有可能更快地完成任務。然而,引入多個智能體會使整個系統變得更加復雜,因為現在的智能體需要能夠有效地相互協作。在沒有有效協作機制的情況下隨機引入智能體,可能會對生產率產生負面影響。
本論文的研究目標是使多智能體自主系統在現實應用中無處不在。我們采用了自下而上的方法來開發算法機制,以應對我們在實現這一目標的道路上所面臨的挑戰。
對于在動態環境中運行的智能體來說,能否成功執行任務取決于它能否有效地導航到目標位置。如果我們在環境中引入更多的智能體,路徑規劃的要求就會更高,因為現在智能體之間必須把彼此當作動態障礙物來對待。路徑規劃算法不僅需要避開障礙物,還需要足夠快的速度,以便在移動智能體在導航過程中遇到意外障礙時重新規劃。此外,路徑規劃算法還需要保證智能體能夠在滿足機械約束條件的情況下穿越路徑。
我們開發了一種基于隨機優化的同步重規劃矢量粒子群優化算法(SRVPSO),通過避開靜態和動態障礙物來找出成本最優的路徑。所提出的算法通過應用同步重新規劃策略,減少了路徑規劃的計算時間。SRVPSO 算法還能在一些車輛約束條件下工作,如車輛尺寸和轉向角。此外,還開發了一種不同地形的可穿越性評估方法,以便在未知環境中進行無風險、穩健的導航,同時優化總成本。
由移動智能體群組成的自主系統需要一個有效的任務規劃器來成功完成一系列任務。任務規劃器所面臨的挑戰是如何為每個智能體確定最優化的任務數量和相關任務。為了解決多智能體自主系統任務規劃過程中的任務分解和任務分配問題,我們開發了一個折中視圖(CV)模型和一個基于最近鄰搜索(NNS)的模型。結果表明,這些模型因其反應式管理結構而非常有效,能成功完成任務。NNS 模型能有效地解決智能體的分解問題。它還具有任務切換能力。
任務規劃器的多目標優化框架可確定任務所需的智能體數量。任務規劃器利用所開發的任務分解方法,最大限度地減少完成任務的時間以及智能體的數量。多目標框架的輸出是帕累托最優值,然后將其作為決策框架的輸入,根據用戶定義的一些約束條件和優先事項確定優化的智能體數量。在測量完成任務的時間時,任務規劃器利用先前開發的路徑規劃器模擬智能體在環境中的導航軌跡,以提供最準確的估計。
然而,正在進行的任務可能會受到突發事件的影響(如一些天氣事件、智能體的意外維護要求等)。未來任務的規劃取決于正在進行的任務,因為它提供了對資源可用性的估計。需要一個現實的預測模型,利用過去任務的信息,對當前任務的完成情況進行統計估計。
我們開發了一個基于人工神經網絡的預測模型,根據以往任務的信息預測任務的完成時間。該預測模型旨在為潛在的任務規劃者提供指導。利用這一數值模型,未來的規劃者可以預測所需的資源,而無需經過優化過程。上述所有算法工具都通過大量的模擬結果和實時實驗進行了演示。