深度學習通過自動化關鍵任務并實現超越人類的準確度,已在多行業引發革命性變革。然而,這些優勢主要依賴部署于云端的巨型神經網絡,其能耗驚人。本論文提出兩類新型框架與算法,將深度學習模型部署邊界拓展至微型邊緣設備——此類設備通常在計算資源有限且環境噪聲復雜的場景下運行:
(1)高效邊緣AI新框架。開發了通過濾波器剪枝與高效網絡設計降低推理成本的方法。CUP框架提出層級濾波器聚類剪枝技術實現模型壓縮與加速;CMP-NAS框架構建視覺搜索系統,優化小型邊緣模型與大型服務器模型協同工作,在保持高精度前提下實現80倍計算成本削減。
(2)魯棒邊緣AI新方法。開發了在降低推理成本同時增強現實噪聲魯棒性的技術。REST框架擴展剪枝應用范圍,使網絡效率提升9倍、運行速度加快6倍,且具備對抗高斯噪聲與對抗樣本的魯棒性;HAR方法將多分支神經網絡的早期退出機制擴展至訓練階段,在類別不平衡最優精度,同時節省20%推理算力;IMB-NAS框架通過超網絡適配策略優化不平衡數據集的神經架構,相較從頭搜索節省5倍計算資源。
研究成果對工業界與社會產生重大影響:CMP-NAS技術支撐時尚與面部檢索服務的邊緣部署案例,在亞馬遜公司內部向數千名研發人員展示;REST技術通過手機實現居家睡眠監測功能,獲多家新聞媒體重點報道。
國防部門正為其工作體系推行數字化工程實踐,同時更廣泛的系統工程界致力于實現此類實踐的現代化與標準化。從傳統文檔模式向純數字化模式的轉型,需要提升對項目或產品全生命周期的數字化管理能力。然而技術發展必須通過迭代流程優化工具設計,聚焦多元用戶群體的可用性需求。現有工具技術雖多,卻常忽略工程師為同行設計工具時的可用性評估。在開發數字化工程任務解決方案時融入可用性考量,既能簡化工具操作又可擴大用戶群體。
本研究評估了12名參與者使用Stitch的表現。該定制化網絡工具支持創建系統工程建模語言第二版(SysMLv2)模型并與虛擬智能體交互。采用混合研究方法結合遙測數據與問卷調查,通過四組任務情景對組(學員與專業人員各半)構建測試框架:受試者根據源文檔構建SysMLv2模型并分析模型要素。該流程平衡傳統文件瀏覽模式與虛擬智能體輔助功能,并采用雙重視覺樣式設計。遙測數據與問卷反饋共同揭示工具可用性及虛擬智能體效能,結果表明不同群體內部及群體間存在顯著的性能與可用性差異。盡管Stitch展現出可用性且虛擬智能體有效支持建模,但參與者普遍期待增強建模輔助功能。
本文貢獻包括:1)基于用戶中心化設計方法論構建Stitch工具,通過案例研究論證虛擬智能體支持下SysMLv2建模的可行性;2)開發四組情景對組指導用戶系統學習SysMLv2建模;3)設計兩種定制模型樣式及可視化擴展機制輔助模型解讀;4)建立用戶通過虛擬智能體調取文檔的學習路徑;5)提出提升Stitch及其他數字工程工具可用性的發展建議。
系統工程(SE)向數字化工程(DE)的轉型需與新技術發展同步。硬件、軟件與基礎設施的深度融合已重塑社會各場域的工作模式。美國防部(DoD)特別是空軍部隊,正采用"引領、借力、觀察"策略吸納敏捷產品開發的商業技術[1]。在業界引領的背景下,國防部需借力哪些技術支持數字化轉型?精進技術并開發配套工具將優化項目全生命周期管理。明確DE工具需求的首要步驟是界定任務支持范疇,繼而通過工具評估定義用戶核心功能需求,最終擴展至更多應用場景。本研究聚焦SysMLv2與虛擬智能體建模場景,致力于構建任務界定與基礎功能需求的可用性基準。
政府機構在項目實施中接收的交付成果形式多樣,常包含多類型文件的數字資產。綜合產品組(IPT)成員需協作驗證這些資產,其專業知識互補形成綜合評估體系。信息關聯要求建立數字資產管理機制實現交付物文檔化與模型化。當前SE/DE領域商業建模工具可通過系統建模實現資產驗證,但復雜工具的設計門檻限制了新從業者及跨領域專家的使用。2018年美軍發布的《國防部數字化工程戰略》設定了推動轉型的多項目標[2],包括改進合同語言聚焦模型開發、制定標準及革新文化與人力體系。同年發布的《國防部云戰略》明確了向云計算轉型的實施路徑[3]。這些頂層設計與國際SE/DE界最新研究形成呼應[4][5],共同推動國防部采用系統性產品開發新技術。
由六個章節構成:第二章闡釋四大核心DE任務,結合可用性啟發原則,分析SysMLv1與SysMLv2語言構型要素,并綜述DE工具、大語言模型(LLM)與微服務技術,奠定研究理論基礎;第三章詳述Stitch設計過程,涵蓋SysMLv2參考架構應用、界面體驗開發、數據記錄、LLM集成及信息技術設計;第四章延續設計流程,闡明研究方法論、實驗設計與數據采集規程;第五章呈現可用性評估結果,深度解析各任務情景數據;第六章總結研究成果,論述應用價值并提出后續研究方向建議。
本文探索了在物聯網(IoT)內動態無人機網絡格局下,高效無人機控制方法的開發。隨著無人機日益融入物聯網生態系統,解決其協同中固有的復雜性和挑戰,對于確保可靠性和效率至關重要。論文始于對物聯網概念和無人機網絡的深入探討,概述了關鍵應用領域,并描述了最先進的解決方案,特別是在定位與跟蹤方面。此外,它還審視了先進的無人機航路規劃策略,強調了其帶來的機遇和所蘊含的關鍵挑戰。論文的主體部分引入了新穎的協作算法,這些算法源于確定性原理和人工智能(AI)技術。這些算法受到鳥群等自然現象的啟發,使無人機能夠協作確定其在動態物聯網環境中追蹤移動傳感器的航線。隨著這些方法有效性的證明,它們如何增強無人機合作并顯著提升跟蹤效率變得顯而易見。基于此基礎,論文接下來介紹了一種創新的深度強化學習(DRL)方案,賦予自主無人機智能體能力,使其能在物聯網網絡內高效地制定最優數據收集策略。通過利用DRL,無人機持續從其環境和行動中獲取洞見,適應變化并做出智能決策以優化其數據收集策略。該方案調整了最先進的算法,使其能有效擴展到現實世界物聯網應用中常見的高維狀態-行動空間。本研究為圍繞無人機-IoT集成的持續討論做出了貢獻,提供了無人機控制的新穎方法。這些方法的引入為在物聯網范式中創建更高效、更自主的無人機網絡開辟了新途徑,凸顯了人工智能在此背景下的未開發潛力,并為該領域的未來發展奠定了基礎。
本文后續包含五個不同的章節:一章是對該研究努力在論文背景下探索的相關文獻進行的綜述;三章——每章專門分析和解決一項既定主要研究目標;以及一章討論研究發現、評估目標達成情況并總結論文。
第2章深入探討了本工作的背景,其結構旨在為建立本論文基礎的相關研究和文獻提供詳盡的分析。該章首先全面概述了物聯網范式,確立了其在當前技術格局中的關鍵作用。然后焦點轉向無人機網絡,討論了其獨特特性、操作應用(重點關注定位與跟蹤方法),以及航路規劃優化面臨的挑戰和當前技術。這為理解當前無人機網絡的能力和局限性奠定了堅實基礎。綜述的后半部分審視了人工智能在無人機集群管理中潛在的作用。它始于評估機器學習在無人機控制中的應用,繼而探討如何使用深度強化學習技術來實現高效無人機導航。
第3章題為“新型無人機控制確定性技術的開發”,涉及在協作式無人機控制領域研究確定性方法。該章通過引入一種新確定性技術的基礎為后續內容鋪墊,隨后對其在無人機控制中的應用進行了廣泛考察。它深入分析了如何利用該技術來加強無人機在用于搜救行動中的移動IoT傳感器追蹤應用中的協作。此外,它評估了該方法的優缺點,揭示了潛在的挑戰和改進領域。本次調查的發現為后續探索人工智能在無人機控制中的應用鋪平了道路,并為不同的控制策略建立了比較框架。
第4章題為“推進無人機控制:集群形成中的深度學習”,標志著從傳統確定性技術向探索深度學習方法在無人機集群形成與群體協同范圍內應用的轉變。本章介紹了設計和實現一個能夠促進無人機集群形成的深度學習模型,重點突出了其創建高效、適應性強的群體編隊的能力,從而進一步提升了純確定性方案的移動IoT傳感器跟蹤性能。對深度學習的探索引領至研究的下一步:利用深度強化學習優化無人機航路規劃。
第5章題為“多智能體無人機航路規劃優化”,代表了本研究歷程的頂點,它整合了從前幾章獲得的認知,以應對一個不同且更復雜的問題:即在IoT情境下優化多智能體無人機航路規劃以實現高效數據收集。本章主要聚焦于引入一種新穎的深度強化學習框架,論證其能夠管理多智能體系統的動態特性,并在多重約束條件下優化無人機航線。詳細的研究和分析揭示了所提出的框架如何能夠產生高效、適應性強的無人機網絡,這些網絡具備處理錯綜復雜現實場景的能力。本章不僅強調了智能系統在無人機航路規劃優化中的重要性,也闡釋了其在物聯網基礎設施內極大推進無人機控制領域的潛力。
最后,第6章總結研究,回顧關鍵發現、其意義以及未來前景。它分析了研究成果,承認了局限性,并提出了未來的研究方向。它以強調智能無人機控制優化中未開發的潛力作結,以激勵該領域的進一步創新。
無人駕駛飛行器(UAV)日益頻繁的使用引發了安全隱患,亟需有效的反無人機系統。本文旨在通過設計和實現仿真環境,評估反無人機防御中使用的干擾器角度分配方法,從而改進現有系統。該仿真模擬真實場景:攻擊無人機被追蹤后通過干擾使其失去行動能力,為特定場景下多種干擾器分配技術的效果評估提供工具。仿真基于智能體建模技術,模擬無人機與干擾器在受控環境中的行為交互。用戶定制報告器將監測記錄關鍵性能指標以評估算法性能。該工具的預期用途是增強規劃者對干擾器分配機制的理解,輔助優化反無人機防御戰術。
當今世界技術發展使無人機開始被用作武器,推動了對抗手段的演進。反無人機系統對關鍵區域和設施保護具有重要作用。這些系統專為應對無人機威脅設計,在傳統防空系統基礎上額外提供探測、跟蹤、識別、干擾與威脅評估功能。無人機探測跟蹤通過雷達和攝像系統等傳感器實現。探測階段是確保反無人機系統有效性的首要環節——未探測到的無人機無法采取預防措施。隨后識別被探測目標并評定威脅等級。若判定存在危險且需采取對抗措施,即啟動干擾程序。干擾無人機可分為兩類:硬殺傷與軟殺傷。硬殺傷旨在物理摧毀目標,通常采用激光武器或導彈系統;軟殺傷則在不造成物理損傷前提下使無人機活動中止,包括信號干擾和頻率干擾等電子干預手段。干擾器作為軟殺傷工具,通過阻斷信號阻止無人機受控。最常見的是可實現全向信號干擾的全向干擾器。但當防護區域周邊存在需保留的日常通信信號時,則采用僅能在特定角度干擾信號的定向干擾器。
日常應用中,反無人機系統可由單名或多名操作員控制,亦可在無人工介入的自主模式下運行。自動模式下,算法根據雷達軌跡信息確定干擾器作用區域并自動下發指令。此類算法計算目標威脅優先級后通過干擾器執行操作,本質屬于威脅評估與武器分配(TEWA)問題。決策過程需快速完成,因應對威脅的可接受響應時間通常僅為數秒。
本文提出名為JASPER(干擾器分配仿真評估報告平臺)的仿真方法,用于測試評估反無人機系統中的專用威脅評估與武器分配(TEWA)算法。這些算法專注于為威脅覆蓋優化分配干擾器角度。不同算法在目標優先級設定、計算時長及設備交互方式上存在差異。為確定更適用算法及其效能,需進行額外測試。本研究旨在開發模塊化、基于代理的測試平臺以滿足該需求。算法測試平臺采用基于代理的仿真框架MASON搭建。MASON作為復雜系統仿真平臺具備高度可定制性,基于代理的仿真方法使各代理按自有規則運行,提供更真實靈活的仿真環境。本測試平臺設計用于報告特定算法在多樣化場景下的性能。在此模塊化測試環境中,用戶可自定義測試案例及需報告的關鍵性能指標(KPI),支持基于不同場景的深度性能分析。這對理解算法在真實環境中的預期表現尤為重要。
論文結構如下:第二章提供測試評估仿真、威脅評估與武器分配及基于代理仿真的背景知識與文獻綜述;隨后在該章內定義描述具體問題;第三章闡述仿真技術應用;第四章說明仿真實施細節;第五章包含研究結論與未來改進方向。
人工智能分布式部署中智能體系統的廣泛應用,對高效選擇影響智能體學習行為的參數、在復雜環境中實施機制設計,以及整合多元智能體能力實現目標結果提出了新挑戰。算法機制設計作為計算機科學、數學和經濟學的交叉領域,致力于開發引導理性智能體達成預期行為的算法,其應用涵蓋資源分配、成本分攤、定價與組合拍賣等場景。然而,傳統方法受限于計算約束與靜態假設,在充滿不確定性與動態變化的環境中效果不佳。
本論文通過融合強化學習(RL)與貝葉斯優化(BO),針對動態多智能體場景開發自適應機制以突破上述局限。我們提出多智能體強化學習(MARL)中機制設計的新框架,依托創新的BO方法高效探索潛力方案。MARL可捕捉隨機環境中多智能體動態交互的復雜性,通過求解底層馬爾可夫博弈以學習聯合策略。評估多MARL場景的計算復雜度問題通過以下方式解決:(I)擴展后繼特征至納什均衡策略的遷移學習;(II)采用BO框架限定評估預算,使問題可解。
所提機制設計框架的有效性在出租車平臺司機服務費設定、共享自然資源開發管理(社會福利最大化)、探索任務機器人集群硬件采購決策優化,以及激勵機制與招募策略設計(委托方目標最優化)等實際應用的基準研究中得到驗證。該方法在現實問題上展現的優越性,凸顯了BO與MARL融合優化復雜多智能體系統的潛力,為機制設計領域的未來研究奠定了堅實基礎。
多機器人協同與協作是提升團隊能力并實現自主建造、農業及未知大區域持續作業等應用場景新型任務的關鍵行為。本研究以“多機器人資源分配問題”為背景探究此類行為,該問題要求將機器人分配至待服務區域。我們尤其關注適用于大規模多機器人團隊的“容錯性方法”。我們引入一種基于圖的建模框架用于多機器人資源分配問題,該框架在表征“區域間關系”與“獎勵模型”方面具有前所未有的豐富性。首先,針對“多智能體覆蓋控制問題”,通過圖神經網絡(GNN)引入“基于圖的計算方法”,其利用學習型智能體間通信策略,在性能與可擴展性上顯著提升。隨后,研究需要顯式協同的“復雜多任務場景下多機器人任務分配問題”,提出一種“基于網絡流的規劃方法”,可在數秒內為大規模問題生成高質量解。進一步將該方法擴展至在線場景,支持任務失敗與意外觀測時的動態重規劃。實證研究表明,這些建模方法與算法通過挖掘多機器人問題中的本質圖結構特征,實現了性能突破并推動領域技術前沿發展。
圖:任務圖(底部)展示任務間優先關系。高亮部分為任務子集,顯示“聯盟職能”(紅色)與“優先關系”(藍色)。例如,在執行“運輸建筑材料”任務前,機器人需在布滿碎片的工地“尋路或清障”。路徑質量直接影響團隊運輸效率;而運輸表現(如材料損毀情況)將決定后續“施工任務”的執行速度與質量。?
第一章將本研究置于“多機器人資源分配”領域框架內。首先,提出多機器人資源分配領域內的問題分類體系,沿著“任務表征抽象度”維度梳理問題模型及其對應研究方法。隨后,深入綜述與“多機器人覆蓋控制”及“多機器人任務分配”密切相關的文獻,這些成果為本研究提供了核心理論支撐。??
??第二章《基于圖神經網絡的多機器人系統覆蓋控制》提出一種創新方法,解決“感知半徑受限條件下的多機器人覆蓋控制”問題。相較于文獻常用基準控制器,該方法通過智能體間通信機制顯著提升控制器的性能與魯棒性。為實現這一目標,在機器人間通信網絡上部署圖神經網絡(GNN),訓練其預測集中式全知控制器的輸入指令,從而生成能夠通過智能體通信應對復雜覆蓋控制場景的控制器。實驗證明,該控制器性能顯著超越基準方法,且具備優異的可擴展性與泛化能力。首次構建基于全球城市真實興趣點特征的覆蓋控制問題數據集,并用于算法驗證。這是圖神經網絡學習型控制器在多機器人覆蓋控制領域的首次應用,展現出巨大潛力。??
??第三章《具有任務優先關系的多機器人協同與協作》針對“多機器人任務分配(MRTA)”問題提出新型建模框架與求解方法體系。首次將“優先級約束”與“多機器人任務”納入MRTA問題,構建名為“任務圖”的建模框架——以圖節點表示任務,邊表示任務間優先級關系。該框架包含的“獎勵模型”能通過豐富函數空間表征關聯任務性能間關系及任務分配聯盟規模與任務績效間關系。基于此模型,開發出利用網絡流優化的任務分配解決方案,其求解速度較現有方法提升數個量級,且計算復雜度與任務執行機器人數量無關,可擴展至無限規模團隊。實驗表明,該方法在保證解質量的同時實現計算效率突破,為任務分配建模框架作出根本性貢獻。?
在第四章中,拓展了多機器人任務分配(MRTA)方法,提出《在線環境下的多機器人優先關系協同與協作》。本章沿用相同“任務圖”模型與“基于流網絡的求解方法”,將其置于在線框架以提升系統魯棒性與性能,并通過高保真仿真器驗證方案有效性。核心在于,在原有MRTA問題中引入“不確定性”考量——任務可能隨機失敗或產生求解器未預期的隨機獎勵。依托流網絡方法的高速求解優勢,以迭代方式重構求解流程,使系統能夠基于已完成任務的獎勵觀測實時重規劃。該方法顯著提升了存在環境不確定性時的規劃性能,甚至因解空間擴展在零誤差條件下進一步優化結果。在高保真城市環境多智能體仿真器中驗證了該在線方法及離線流網絡方法,其中任務獎勵基于仿真器內物理現象量化。實驗表明,該建模方法能有效預測高不確定性復雜任務的性能表現,且相較文獻方法具有顯著優勢。在線框架為原有方案注入魯棒性,并將性能提升至接近最優水平,為任務分配領域持續研究提供了極具前景的框架。?
多機器人協調與協作是提升團隊能力、實現自主建造、農業及廣域未知環境長期作業等新任務的關鍵行為。本研究聚焦多機器人資源分配問題背景下的此類行為,即機器人需被分配至服務區域。我們特別關注適用于大規模機器人集群的容錯方法,引入一種基于圖建模的多機器人資源分配框架,該框架在表征區域間關系與獎勵模型方面具備前所未有的豐富性。首先解決多智能體覆蓋控制問題,通過圖神經網絡(GNN)實施基于圖的計算,利用學習型智能體間通信策略實現性能與可擴展性提升。隨后針對需顯式協調協作的復雜多任務場景,提出基于網絡流的規劃方法,可在數秒內生成大規模問題的高質量解。我們將此方法擴展至在線環境,實現任務失敗與意外觀測條件下的動態重規劃。實驗證明,這些建模方法與算法通過挖掘多機器人問題中的基礎圖結構,推動技術前沿的進步。
第一章
本章將研究工作置于多機器人資源分配領域進行定位。首先提出多機器人資源分配問題的分類體系,沿任務表征抽象維度梳理問題建模與對應方法(1.3節)。隨后深入綜述推動本研究中覆蓋控制與任務分配工作的核心文獻(1.5與1.6節)。
第二章:基于圖神經網絡的多機器人覆蓋控制
本章提出一種新型有限感知半徑多機器人覆蓋控制方法,相比傳統基線控制器,通過智能體間通信提升性能與魯棒性。我們在機器人通信網絡上部署圖神經網絡(GNN),訓練其預測中心化全知控制器的控制指令,從而獲得能通過智能體間通信應對覆蓋控制難題的控制器。實驗驗證該方法在性能、擴展性與泛化能力上的優勢。2.6節展示基于全球城市特征數據構建的覆蓋控制數據集,用于算法驗證。本研究首次將GNN學習控制器應用于多機器人覆蓋控制,展現該路徑的廣闊前景。
第三章:具備任務優先級關系的多機器人協調協作
本章以新型建模框架與解法體系解決多機器人任務分配(MRTA)問題。提出"任務圖"建模框架:將任務抽象為圖節點,任務間優先級關系抽象為邊;構建包含任務關聯性能與編隊規模-任務效能關系的獎勵模型。該框架啟發基于網絡流優化的機器人任務分配解法,實驗表明其求解速度較現有方法提升數倍,且計算復雜度與機器人數量無關——可擴展至無限規模團隊。本研究對任務分配建模框架作出基礎性貢獻,實現求解速度的量級突破。
第四章:在線環境下的多機器人協調協作
本章將任務圖模型與流解法擴展至在線環境,提升系統魯棒性與性能,并通過高精度仿真驗證。核心在于處理含不確定性的MRTA問題:任務可能隨機失敗或產生預期外獎勵。利用流解法的高速求解特性,建立迭代重規劃機制,依據已完成任務的獎勵觀測動態調整方案。實驗證明該方法在不確定性環境中顯著提升規劃性能,零誤差條件下亦因解空間擴展而優化。通過高精度城市多智能體仿真驗證離線/在線流解法,測量仿真物理現象衍生的任務獎勵。結果表明,本建模方法在復雜不確定任務中有效預測性能,且顯著優于文獻現有方法。在線機制增強系統魯棒性,使性能逼近最優,為任務分配領域后續研究提供極具潛力的框架。
近年來,將AI賦能應用部署至邊緣端的訴求與能力顯著增長。然而,邊緣設備在算力、面積與功耗方面的限制,與AI應用對底層神經網絡規模、深度與能力的持續提升需求形成矛盾。此類應用通常具有數億至數十億參數的大內存占用特征,并通過矩陣運算產生高計算需求,導致其成為諸多架構問題的極端案例。為解決諸如"內存墻"等架構挑戰,計算機架構師與工程師開發了多種解決方案、框架與技術。面向內存計算架構、SIMD協處理器、神經網絡引擎等專用系統的模擬裝置已不同程度地提出與實施,但多數存在共同局限——設計時僅考慮有限實驗場景,通常僅與傳統系統進行對比。鑒于AI應用架構選擇的多樣性,孤立評估單一方案或對比融合多方案的異構系統變得極為困難。現代計算架構挑戰的復雜性及異構系統普及趨勢,使得架構設計空間探索的不可遍歷性成為未來架構發展的阻礙。
為此,本博士論文提出ALPINE框架——基于gem5-X模擬器構建的全系統級計算機架構框架,并通過集成開發的工具與方法論,支持新型異構邊緣架構的實施、建模與關鍵指標提取。該框架通過在通用系統全系統級仿真內核中集成多種新型加速器與接口建模能力,為現代神經網絡架構探索奠定基礎,并支撐未來研究。
利用ALPINE框架,我們首先實現對CPU近端模擬內存計算單元的建模,該單元通過指令集擴展接口執行恒定時間的矩陣向量乘法運算(AI應用常見瓶頸)。通過對多層感知機、循環神經網絡與卷積神經網絡等AI應用的廣泛探索,聚焦關鍵子區域分析,我們驗證了該方案的應用優勢,揭示了跨核通信這一新興瓶頸,并證明相較傳統SIMD向量化系統可實現最高20.5倍加速與20.8倍能效提升。針對通信瓶頸,ALPINE框架內建模的無線暫存器可實現核間高速數據傳輸,使測試卷積神經網絡額外獲得20%性能提升。
基于ALPINE框架的高度可擴展性,我們重構加速器模型以支持CPU近端小規模脈動陣列建模。以Transformer模型為測試案例,驗證其在全應用層面最高可實現89.5倍加速。通過ALPINE集成的脈動陣列與模擬內存計算雙模型,我們能夠在同系統中對比兩種加速方案的性能、能效與功能取舍,并與配備SIMD協處理器與大容量緩存的系統進行橫向評估。
為拓展ALPINE設計空間異質性維度,我們進一步研究基于總線傳輸接口的遠端模擬內存計算單元,并與近端方案進行對比。該探索揭示了多進程神經網絡中負載均衡與數據傳輸開銷的影響機制,通過優化先進負載均衡算法,我們在多種卷積網絡中實現額外加速與能效提升(最高超5倍)。
本論文研究表明,通過實施應用至加速器的映射、瓶頸隔離、架構工具與指標分析等方法,不僅能實現異構架構探索,更能揭示其實際效能。ALPINE框架具備充分通用性,可高效支持未來新型加速器模型、配置方案及神經網絡瓶頸的探索。
關鍵詞:全系統級仿真,計算機架構,人工智能,機器學習,深度學習,異構架構,神經網絡,推理,內存計算,加速器,多層感知機,循環神經網絡,卷積神經網絡,Transformer模型,接口。
邊緣計算的優勢在于利用網絡邊緣的遠程計算資源運行相對弱小的終端設備工作負載,而云計算則依托地理位置更遠但性能更強大的遠程設備提供計算能力。這兩大范式的融合可實現優勢互補——即某一范式的短板恰為另一范式的強項。以深度學習為例,其工作負載需要大量算力支持,而物聯網(IoT)設備等低功耗終端往往無法滿足此類需求。通過將任務卸載至云邊連續體,算力薄弱的終端可訪問強大遠程節點的計算資源,其中遠程加速器虛擬化技術正是關鍵實現手段。本論文重點研究基于深度學習推理的GPU加速器虛擬化在云邊連續體(涵蓋終端設備、邊緣節點與云端)中的應用潛力。盡管存在專用機器學習加速器(如張量處理單元TPU),但GPU憑借其普及度、可用性與技術支持成為首選方案。云邊計算的異構性(硬件與軟件多樣性)、延遲約束及節點動態可用性等問題構成了加速器虛擬化的主要挑戰,本研究通過三大核心領域貢獻實現突破。
首先,論文提出名為AVEC的透明化遠程加速器虛擬化框架。通過應用編程接口(API)攔截技術,終端設備運行的應用程序可將原定本地GPU處理的工作負載片段,經網絡重定向至配備GPU的遠程節點執行。該技術僅卸載GPU內核計算,使得本地CPU持續運行,從而降低終端計算資源壓力。本文深入探討了該框架的架構設計、功能特性與性能表現。
其次,研究探索卸載工作負載在網絡節點中的部署方式。相較于虛擬機,容器技術憑借輕量化虛擬化優勢更適用于異構云邊環境。針對節點動態失效問題,本文提出無狀態容器遷移方案,特別適用于深度學習推理任務的連續性保障。
第三,論文建立工作負載調度與部署策略體系。通過制定最優節點選擇機制,結合設備性能指標與網絡狀態參數,實現任務在云邊連續體中的智能調度。研究量化分析了設備配置、網絡帶寬等指標對系統性能的影響,并據此設計啟發式調度算法。
AVEC框架的優勢體現于輕量化透明虛擬化、特定負載執行時間縮減及多CPU架構兼容性。通過基于Caffe深度學習庫的多場景測試,驗證其在實驗室環境中最高可達7.48倍加速比(相比終端本地執行),同時保持低部署延遲與無縫遷移能力。盡管存在遠程虛擬化開銷,但性能提升效果顯著。
論文結構如下: 第一章 概述研究主題,明確待解決的核心問題與研究目標。
第二章 系統梳理領域前沿文獻,揭示當前研究空白及本論文的創新定位。
第三章 闡述相關理論基礎,定量化界定研究目標。
第四章 詳述基于API攔截的加速器虛擬化框架設計,論證其應對異構性挑戰的技術優勢。
第五章 通過容器化方案,實現工作負載快速部署與透明實時遷移,闡明功能需求的必要性。
第六章 構建云邊環境下的工作負載調度模型,建立基于多維度指標的啟發式調度機制。
第七章 通過三組測試案例,驗證虛擬化效能、部署遷移性能與調度策略有效性。
第八章 總結研究成果,展望待解決問題與未來研究方向。
高效人類團隊通過智能通信與協調策略實現協同效用最大化。受此啟發,本研究致力于開發多機器人系統智能協作的計算方法,結合經典模型驅動控制規劃與數據驅動技術(如多智能體強化學習MARL、示范學習LfD),推動機器人群體涌現協同行為。
研究首先采用模型驅動方法解決多機器人系統在不確定性下的協調控制與規劃問題,重點探究環境模型在規劃決策中的高效整合機制。通過設計集中式與分布式協調框架(涵蓋控制輸入與高層規劃層級),構建基于環境模型的多機器人協同體系。創新性成果包括:開發安全關鍵場景下的人本化多機器人網絡協調控制算法,實現主動狀態估計支撐的協同覆蓋規劃與性能概率性保障;進一步擴展方法應對機器人異質性挑戰,構建分層協調框架,使感知型與操作型機器人組成的復合團隊能在空基森林滅火等復雜任務中高效協作。
模型驅動方法雖能提供性能與穩定性保障,但對模型精度與啟發式算法質量敏感。為此,研究引入數據驅動與機器學習方法,探索群體協作行為的涌現機制。設計基于圖結構的通信模型架構,實現異構機器人團隊的高效多樣化協同;受人類心智理論啟發,開發迭代式深度決策理性模型,優化去中心化協作中的行動選擇機制。
近年來,盡管MARL廣泛應用于多機器人任務優化,但強化學習仍存在獎勵函數設計困難與高樣本復雜度等局限。因此,精確建模人類策略行為愈發重要。同時,隨著多機器人系統普及,確保機器人行為價值與人類倫理對齊至關重要。本研究提出多智能體示范學習框架MixTURE,通過混合主動多智能體學徒學習,使機器人團隊能夠從人類示范中學習協作策略,同步實現端到端自主通信協調。該框架兼具示范學習優勢,顯著降低人類示范數據需求與時間成本,提升系統可用性量表(SUS)評分與團隊協作效能,為多機器人系統人機協同開辟新路徑。
本研究核心論點在于:通過賦能機器人團隊高效通信與行動規劃推理能力,可顯著提升群體協作效能。本論文通過以下創新成果驗證該主張:
? 無人機團隊人本化動態環境主動感知協調控制框架:基于卡爾曼不確定性殘差傳播與加權多智能體網絡控制,構建雙準則目標函數,實現無人機群主動推斷野火傳播參數并監測火勢演化[5]。
? 多機器人網絡通信容錯自適應控制架構:通過模型參考自適應控制架構,設計集中式協調控制框架,使多機器人團隊在通信網絡斷續環境下仍能達成協同共識[6]。
? 服務質量保障型多無人機動態區域協同覆蓋規劃:針對空基野火監測需求,提出概率性能保障的預測式協同覆蓋框架,支持無人機群推斷潛在火勢動態,實現高危環境下的長時程協調[7,8]。
? 異構機器人分層協調框架:基于多智能體部分可觀測半馬爾可夫決策過程(MA-POSMDP)構建MA-SARTSA算法,使智能體在動態目標數量未知環境中學習協同監控策略,支持宏動作驅動的異步多智能體決策[9]。
? 高效多樣化通信模型MARL框架:提出異構策略網絡(HetNet),使異質機器人通過二進制中間語言實現零基礎自發通信學習與協作[10]。
? 有限理性下決策優化MARL框架:受認知層級理論k級推理機制啟發,開發信息策略梯度(InfoPG)方法,支持有限理性多智能體進行迭代決策優化[11,12]。
? 人機協同策略學習MA-LfD框架:構建MixTURE混合主動學徒學習框架,使機器人團隊無需人工標注數據即可學習人類專家協作策略,同步實現端到端自主通信協調。
本論文結構如下:第2章系統梳理相關領域文獻;第3章闡述理論基礎與背景知識,重點介紹基于模型的節點級多機器人協調方法[5,6]及其在無人機動態區域覆蓋中的應用;第4章擴展至高危時效敏感場景,提出性能保障型模型預測方法[7,8]與數據驅動方案[9],解決資源受限異構無人機群的環境不確定性協調問題;第6章提出端到端多智能體協同通信策略學習方法[13,10];第7章通過新型MARL架構實現協作機器人團隊的迭代推理與決策理性化[12];第8章構建MA-LfD框架,實現人類領域知識高效遷移與協作策略直接學習。
本文深入探討復雜環境下的先進導航策略,其應用場景涵蓋城市后勤至反介入/區域拒止(A2AD)背景下的軍事行動。研究聚焦于障礙密集環境下的路徑規劃挑戰,通過運用Dijkstra算法等系列算法優化路線生成。研究成果凸顯了可互換成本函數的適應性優勢——該特性對于定制化應對不同場景(無論是自動駕駛車輛的障礙規避還是軍事機動策略)具有關鍵作用。通過分析算法與成本函數的組合效能,研究揭示了若干優勢組合方案,為提升路徑規劃與作戰策略提供重要洞見。這些發現有助于提升軍民領域的安全性與運行效率。研究不僅深化了對動態環境下尋徑機制的理解,更為未來基于Python仿真與AFSIM平臺的高效導航技術發展奠定基礎。
本文通過雙重聚焦研究,深入探討最短路徑算法在軍事與民用領域的實際應用。通過構建兩篇獨立文章,本研究旨在建立統一框架以應對各領域特有挑戰。通過剖析軍事反介入/區域拒止(A2AD)環境與障礙密集的民用場景中路徑規劃的復雜性,研究致力于為多場景適應性解決方案奠定理論基礎。首篇論文(第二章)聚焦民用領域,重點研究障礙密集環境下的導航問題;次篇論文(第三章)則著力解決軍事環境中遭遇的復雜挑戰。