亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

機器人仿真、規劃、估計和控制都建立在數值優化的基礎上。與此同時,現代凸優化已經發展成為一種強大的技術,能夠在多項式時間內提供全局最優解。隨著可微優化和定制求解器的進展,這些求解器能夠生成平滑的導數,凸建模變得更加快速、可靠,并且完全可微。本論文展示了凸建模在多個領域中的有效性,如火星大氣進入引導、納米衛星空間望遠鏡指向、碰撞檢測、點云的接觸動力學、在線模型學習,以及最終一種無需導數的軌跡優化方法,該方法利用并行化仿真。在所有這些領域中,可微凸優化的可靠性和速度使得實時算法變得嚴格、高效,并且易于理解和修改。

本論文介紹了基于可微凸建模的機器人仿真、規劃和控制的新方法。通過在優化優先的框架中制定這些領域的算法,我們通常能夠簡化算法的復雜性,并將計算復雜度卸載到高度專業化和高效的求解器上。本論文重點擴展了許多現代凸建模的進展,其中求解器能夠在保持完全可微的同時,為凸優化問題提供全局最優解。由于這些求解器既快速又穩健,并且是可微的,它們可以像傳統的數值線性代數程序(如用來求解線性系統的程序)一樣使用。利用凸建模作為新算法開發的構建塊,可以實現簡單、高效且靈活的算法。

在1939年至1948年期間,Leonid Kantorovic、George Dantzig和John Von Neumann提出了線性規劃和對偶性相關的約束優化基本概念[39]。大約在同一時期,Karush-Kuhn-Tucker(KKT)條件被確立,明確了解決約束優化問題時“最優解”的含義[24]。當時,實踐者集中于在新引入的計算機上實現數值優化算法,而理論家則將注意力轉向約束優化領域的有用分類法。1983年,蘇聯科學家Nemirovski和Yudin首次正式提出,解決凸優化問題與解決一般非線性優化問題之間存在實質性的復雜度差異[22]。1980年代,穩健的內點方法開始出現,能夠在多項式時間內解決一般的凸優化問題[116]。隨著數值線性代數、算法發展和更快計算機的進步,到2000年代,凸優化已經成熟并準備好在日常應用中使用。諸如CVX [63]、CVXPY [40]和Convex.jl [179]等建模工具使得凸優化變得易于使用,它們通過將用自然數學語法描述的問題轉化為商業和開源求解器可以解決的形式,使凸優化變得更加易于應用。 在2010年代后期,[7]和[5]的研究使得能夠對針對通用問題參數的凸優化問題進行求導。如今,凸優化求解器被視為經過充分理解和可靠的可微函數,可廣泛應用于各類任務中。 第四章對一個經典的大氣進入引導框架(可追溯到阿波羅計劃)進行了更新,結合了凸優化,達到了最先進的性能。在4.2中,以一種在文獻中不常見但更適合數值優化的形式,討論了進入飛行器在任意大氣中的動力學。在此基礎上,詳細描述了基于凸優化的創新型“凸預測-修正進入引導”(CPEG)算法,該算法在4.4節中用于大氣引導。CPEG的性能在一組現實的初始條件下進行了驗證,并在4.5節中驗證了收斂性。 第五章在第四章的基礎上進行擴展,介紹了CPEG的更新變種,能夠在進入過程中直接考慮大氣不確定性。CPEG中的引導框架通過引入一個能夠進行大氣估計的估算器來增強,并對控制器-估算器堆棧進行了調整,以實現對飛行器的魯棒實時控制。該算法在現實的火星大氣條件下進行測試,消融研究驗證了大氣適應的重要性。

第六章利用基于凸優化的運動規劃器,通過加權支桿的驅動實現納米衛星空間望遠鏡的精確控制。傳統上,航天器指向控制是通過反作用輪來完成的,這些轉子通過旋轉來轉移角動量。由于這些輪子存在缺陷,振動會傳遞到望遠鏡,導致圖像質量下降。本章介紹了一種基于慢速旋轉長支桿的新型驅動策略,這一策略顯著不同于常見的快速旋轉反作用輪。在已知納米衛星軌道和地球磁場的情況下,凸優化運動規劃器能夠直接推理未來的擾動,從而僅通過支桿實現精確的姿態控制。該技術在一個精確的空間望遠鏡上得到演示,在日全食期間需要進行長時間曝光,而支桿不會超過其驅動極限。 第七章提出了一種新的碰撞檢測方法,能夠提供統一框架和光滑的可微性。傳統上,兩個凸形狀之間的碰撞檢測是通過求解兩形狀之間的最近點來完成的。這個問題對于許多常見的凸體是定義明確且容易解決的,但對于接觸的形狀,這個方法是不可微的,因此需要采用不同的算法。我們的方法利用了一個不同的框架:通過凸優化求解兩形狀之間的最小均勻縮放,從而導致它們的交集。這個問題很小,確保定義良好且沒有退化情況。結果凸優化問題的解是平滑且可微的,無論物體的配置如何,且該方法可用于指定代表性運動規劃中的碰撞避免約束。 第八章通過利用第七章相同的框架擴展了連續碰撞檢測。離散碰撞檢測檢查兩個靜態凸形狀是否發生碰撞,而連續碰撞檢測必須考慮形狀在運動時的問題。傳統上,離散碰撞檢測向連續碰撞檢測的過渡需要對算法進行大幅修改,并增加一些限制條件。相反,第七章的框架通過引入時間參數進行了擴展,利用另一個定義良好的凸優化問題來解決連續碰撞信息問題。該方法同樣是完全可微的,并且在碰撞-free運動規劃示例中得到了驗證,證明了離散碰撞檢測不足以避免接觸。 第九章詳細介紹了一種在線學習廣義線性模型的簡單而高效的框架,涉及到連接器插入問題。在這個應用中,插入公連接器到母插座中由于材料的變形、配合的緊密性以及未知的摩擦性質而成為一個難以模擬的挑戰。為了避免學習一個完整的動態仿真器,本研究僅學習控制信號、估計狀態和腕部安裝的力矩傳感器之間的關系。這個關系通過廣義線性模型表示,從而使得模型學習問題變得凸且定義明確。為了解決這個問題,提出了線性模型學習(LML)算法,通過僅使用矩陣-向量操作來遞歸地在線學習全局最優的估計模型。在沒有任何矩陣求逆的情況下,該算法在GPU上非常有效,能夠快速高效地學習大規模線性模型。 第十章探討了剛性點云上準動態仿真的性能,并擴展了常見的公式,以包括真實接觸的必要扭矩摩擦。當與剛性點云發生接觸時,單點接觸無法提供真實的扭矩摩擦,這種摩擦源自于現實中存在的接觸面補丁。為了解決這一問題,對基于優化的仿真框架進行了修改,自然地引入了與法向力成比例的扭矩摩擦項。結果的仿真步驟通過凸優化計算,因此完全可微。所得到的仿真器用于抓取具有真實接觸動力學的高保真點云。 第十一章介紹了一種軌跡束方法,用于使用黑箱仿真器、成本和約束條件進行高精度軌跡優化。現有的基于模型的軌跡優化方法能夠訪問問題中所有成本、動力學和約束函數的導數。在許多情況下,這是一個合理的假設,但對于許多具有挑戰性的機器人任務(如涉及非光滑接觸交互的任務),這些導數可能無法獲得、計算昂貴或不可靠。為了解決這個問題,軌跡束方法通過對當前迭代點進行插值來近似這些函數。這種插值的近似方法無需導數,并且其線性化不同于標準的一階泰勒級數。使用這種近似方法,提出了一個凸優化問題,最小化這些插值函數以計算步進方向,直到收斂。 通過將可微凸優化作為一種穩健的技術,本論文為機器人多個領域提供了簡單且高效的算法,并保證了可預測和安全的性能。通過將這些問題重構為優化優先的方式,得到的算法通常比傳統方法更簡單、更高效,同時具有模塊化和可配置性。

付費5元查看完整內容

相關內容

博士論文是由攻讀博士學位的研究生所撰寫的學術論文。它要求作者在博士生導師的指導下,選擇自己能夠把握和駕馭的潛在的研究方向,開辟新的研究領域。由此可見,這就對作者提出了較高要求,它要求作者必須在本學科的專業領域具備大量的理論知識,并對所學專業的理論知識有相當深入的理解和思考,同時還要具有相當水平的獨立科學研究能力,能夠為在學科領域提出獨創性的見解和有價值的科研成果。因而,較之學士論文、碩士論文,博士論文具有更高的學術價值,對學科的發展具有重要的推動作用。

三維生成建模具有創建有價值三維資產的潛力,這些資產在娛樂、工業設計和現實世界制造等多個領域中有著廣泛的應用。本論文介紹了多個創新的三維生成框架,強調不僅創建不同表現形式的獨特三維形狀,還引入了不同的控制生成過程的機制,同時展示了大規模學習三維生成模型的可能性。首先,我們提出了一個直接生成三維網格的新框架,將生成任務分解為兩個不同的子任務:拓撲形成和形狀變形。在拓撲形成階段,我們學習了一個拓撲感知的神經模板。在形狀變形階段,這個模板被變形以產生最終的網格,確保保持初始拓撲。這種方法使我們能夠靈活生成具有不同拓撲的形狀。同時,我們在潛在空間中開發了一個解耦表示,用于拓撲形成和形狀變形。這種表示使新的解耦控制成為可能,支持各種形狀生成應用,如重混三維對象的拓撲,這在以前的重建工作中是無法實現的。其次,我們提出了一個創新的生成框架,用于創建高解析度的隱式函數。該方法的主要貢獻在于將三維形狀緊湊地編碼為小波表示。這是通過一對粗糙和細節系數體積來實現的,這些系數體積通過截斷距離函數(TSDF)和多尺度雙正交小波隱式地表示三維形狀。我們然后建立了一對神經網絡:一個基于擴散模型的生成器,用于生成以粗糙系數體積形式存在的多樣形狀,以及一個細節預測器,用于生成兼容的細節系數體積。總體而言,我們的方法能夠生成具有更細節的高品質形狀,超越現有的生成框架。第三,我們擴展了基于小波的生成框架以進行形狀反映任務。目標是將三維形狀編碼為潛在表示,這可以用來準確重建原始形狀。這是通過聯合訓練一個基于擴散的生成器和一個額外的編碼器來產生這個潛在表示來完成的。我們然后引入了一個優化過程,這有助于通過優化更合適的潛在表示來提高以前未見三維對象的重建質量。使用派生的表示,我們展示了多種具有語義意義的應用,包括形狀插值。此外,我們提出了一種區域感知操作過程,能夠操作三維形狀的不同部分。最后,我們深入研究了大規模三維生成,提出了一個在一個包含1000萬個公開可用形狀的龐大數據集上訓練的新三維生成模型。我們首先提出了一個小波樹表示,這是一種改進的小波表示,用于編碼高解析度SDF形狀,損失最小。這有助于高效的存儲和流媒體,這對大規模訓練至關重要。隨后,我們提出了一種子帶系數打包方案,使基于擴散的生成成為可能,并提出了一種子帶自適應訓練策略,以確保在大規模數據集上有效訓練。我們的生成框架高度靈活,能夠根據各種輸入模態進行條件生成,如圖像、點云和體素。這種靈活性允許進行各種下游應用,包括無條件生成、補全和條件生成。總的來說,本論文介紹并強調了三維生成研究中的不同重要方面,包括表示的緊湊性、可控性和可擴展性,為三維建模研究中的不同潛在方向開啟了新可能性。//repository.lib.cuhk.edu.hk/en/islandora/object/cuhk%3A3550245/metadata

付費5元查看完整內容

自由能是自然科學中最基本的量之一,它揭示了物理和化學過程的方向、程度和速率。在本論文中,我們研究了不同類別的自由能差與蛋白質動態和功能之間的聯系,特別關注其在藥物發現中的應用。我們的計算研究基于分子動力學模擬,該方法已成為理解蛋白質功能和設計新型治療藥物的關鍵推動力。其準確性通常依賴于描述物理系統的數學函數的精確性以及構象采樣的廣度。然而,在這些要素與模擬的計算成本之間通常需要進行權衡,我們的結果在這種背景下進行展示。

在本論文的第二章和第三章中,我們探討了如何利用煉金自由能差的計算來在合成之前篩選藥物候選物。我們通過成功應用于六組具有挑戰性的蛋白質-配體系統,證明了RE-EDS多態方法的廣泛適用性。我們展示了該方法能夠通過單次模擬估計多種煉金自由能差,相比于傳統的成對方法顯著降低了計算成本。 在第四章和第五章中,我們表征了蛋白質側鏈的構象自由能景觀,并將其與它們所承載的生物學功能聯系起來。我們提出,后者可以通過模擬與實驗的結合來揭示,即通過將模擬的結構集合與核磁共振和晶體學獲得的實驗數據進行比較。我們討論了模擬與實驗之間的共生關系。

付費5元查看完整內容

物理啟發的生成模型(如擴散模型)構成了一類強大的生成模型家族。該模型家族的優勢在于相對穩定的訓練過程和強大的容量。然而,仍有許多可能的改進空間。在本論文中,我們首先將深入探討擴散模型在訓練和采樣方面的改進技術。擴散模型的訓練目標在數據分布為多模態時呈現出較高的方差。為了解決這一問題,我們提出了一種訓練目標,它推廣了傳統的去噪得分匹配方法,顯著減少了訓練目標的方差。除此之外,我們還引入了一種將可學習的離散潛變量整合到連續擴散模型中的訓練框架。這些潛變量簡化了擴散模型復雜的噪聲到數據映射的學習過程。

另一方面,擴散模型的采樣過程通常涉及求解微分方程。為加速采樣過程,我們提出了一種新穎的采樣算法,結合了之前常見的ODE和SDE采樣器的優點,大幅提升了預訓練擴散模型的性能。此外,我們的研究探索了在有限樣本中引入互斥力以促進生成過程中的多樣性。 在物理啟發的生成模型領域,許多物理過程都可以用于開發生成模型。我們將介紹一類基于靜電理論的新生成模型家族,稱為泊松流生成模型(PFGM)。PFGM在采樣穩健性上表現出色,并與領先的擴散模型相媲美。其擴展版本PFGM++將擴散模型和PFGM置于同一框架下,并引入了新的、更優的模型。我們還將提出一種系統化的方法,將物理過程轉化為生成模型。

生成模型在近年來顯著改變了人們工作的、創作的和學習的方式。其突出應用包括ChatGPT [1]、文本到圖像模型 [2]-[4]、文本到3D模型 [5]、[6] 和文本到視頻模型 [7]、[8]。這些能力可以極大地激發創造力,并提高眾多領域的工作效率,包括教育、游戲產業、社交媒體和專業編輯軟件。生成模型的訓練基于這樣一個假設,即訓練數據是從未知的數據分布中采樣的 [9]。現代生成模型通常使用深度神經網絡來基于有限的訓練數據逼近復雜的數據分布,并通過從這些建模的分布中采樣來生成新的數據點。

在生成建模中使用的各種數據類型中,高維數據由于維度詛咒而面臨著顯著的挑戰。隨著維度的增加,數據空間的體積呈指數級擴展。這一現象使得在高維空間中用有限的訓練數據有效捕獲和建模數據分布變得困難。此外,感興趣的數據分布通常高度復雜且呈多模態,進一步增加了生成建模的難度。近年來,擴散模型 [10]–[12] 以及更廣泛的物理啟發生成模型 [13],在處理高維數據的生成任務中,展現了強大的框架并取得了令人印象深刻的結果。在擴散模型之前,主要的方法包括:(i)利用對抗訓練目標的生成對抗網絡(GANs [14]);(ii)使用最大似然目標訓練的模型,如PixelCNN [15] 和正規化流模型 [16]、[17];(iii)變分自編碼器(VAEs)[18]、[19] 以及(iv)基于能量的模型 [20]、[21]。然而,每種方法都有其自身的缺點:(i)可能導致訓練不穩定和生成樣本的多樣性低;(ii)需要特定的架構設計,可能限制模型的容量;(iii)需要多個神經網絡的仔細協調;(iv)訓練和采樣速度較慢。利用自然的物理過程作為編碼器將數據轉化為噪聲,擴散模型通過逆轉這些物理過程來執行生成任務。這種方法使它們繞過了早期生成模型的許多限制。

1.1 通過逆轉物理過程進行生成建模

基于熱力學的原理 [10],擴散模型涉及兩個對立的過程:一個前向過程將數據分布逐漸轉化為一個更簡單的先驗分布,另一個反向過程通過逐步去噪從該噪聲先驗分布中生成樣本。擴散模型中的前向過程是一個簡單的布朗運動,通過逐步增加高斯噪聲來降解數據。為了逆轉這一過程,只需學習一個時間依賴的向量場,即得分函數,并迭代求解一個微分方程 [22]。與GANs和VAEs不同,擴散模型的訓練不需要多個神經網絡之間的同步,從而使訓練過程更加穩定。此外,它們在架構設計上不受限,采用類似于神經網絡串聯的迭代過程,從而增強了整體容量。這種穩定性和增強的容量使擴散模型能夠有效擴展到大規模數據集。

盡管擴散模型具有諸多優勢,但它們仍面臨一些挑戰,包括在處理多模態數據時高方差的訓練過程,以及緩慢的迭代采樣過程。此外,獨立同分布(i.i.d.)的采樣過程往往會導致重復的樣本。這些問題強調了在復雜數據集上穩定和改進擴散模型訓練方法的必要性,并且需要新技術來加速采樣過程并提高小批量樣本的多樣性。此外,擴散模型只是眾多物理啟發生成模型之一。除布朗運動外,仍有許多物理過程尚未開發,可以用來構建生成模型。這引出了一個重要問題:我們能否發現其他物理啟發的生成模型,它們展示出更好的性能?在接下來的部分中,我們將簡要總結擴散模型的改進訓練和采樣技術,并討論我們開發其他物理啟發生成模型的研究,這些將在后續章節中詳細闡述。

1.1.1 擴散模型的改進訓練技術

擴散模型的訓練利用了一種擾動-去噪方法來估計向量場。其過程是先通過高斯噪聲擾動干凈的數據,然后網絡從這些擾動樣本中重構原始數據 [12]。然而,對于復雜的多模態數據,許多干凈的數據點可能被擾動為相似的噪聲樣本,導致訓練目標不明確并引發不穩定性。

在文獻 [23] 中,我們通過多個干凈數據點的加權求和來估計真實目標,精確地指示從擾動樣本到真實向量場的方向。該新穎的訓練目標推廣了傳統的單點估計方法,顯著減少了訓練目標中的方差。因此,在各種擴散模型變體中,樣本質量得到了提高,訓練過程更加穩定,訓練速度也得到了加快。

擴散模型面臨的另一個挑戰是,需要學習一個從單峰高斯分布到多峰數據分布的非線性且高度復雜的映射。這種復雜性增加了訓練的難度,并導致生成常微分方程(ODE)[24] 軌跡呈現強烈的曲率。為解決這一問題,我們在擴散模型中引入了離散潛變量。這些離散潛變量有助于捕獲數據分布中的不同模式,而擴散模型的任務則轉變為基于給定的離散潛變量捕獲每個模式內的連續變化。離散與連續變化的分離建模顯著簡化了模型復雜的噪聲到數據映射的學習過程。這一方法有效降低了擴散模型生成ODE的曲率,尤其是在較大的擴散時間下,整體訓練損失得到了減少。

1.1.2 擴散模型的改進采樣技術

在擴散模型的采樣過程中,求解微分方程通常涉及速度和質量之間的權衡。確定性采樣器(基于ODE的)[25]–[27] 速度快,但性能達到平臺期,而隨機采樣器(基于SDE的)[27]、[28] 樣本質量更好,但速度較慢。我們的分析將這種差異歸因于采樣誤差:ODE采樣器的離散化誤差較小,而SDE中的隨機性會收縮采樣過程中的累積誤差 [29]。

基于這些見解,在文獻 [29] 中,我們提出了一種名為Restart的新采樣算法,該算法結合了ODE和SDE的優點。該方法在附加的前向步驟中加入大量噪聲,并嚴格遵循逆ODE過程。前向噪聲的引入增強了隨機性的收縮效應,而逆ODE過程的遵循則加快了采樣速度。這種將隨機性和確定性采樣過程分離的方法極為有效,Restart在標準基準(CIFAR-10和ImageNet-64)上超過了SDE和ODE采樣器的速度和質量,并在大規模文本到圖像的Stable Diffusion模型中展示了文本-圖像對齊、視覺質量和多樣性的卓越平衡。

傳統上,擴散模型從模型分布中生成獨立同分布的樣本。然而,在實際操作中,模型通常需要多次采樣以獲得一組多樣化的小批量樣本,這會帶來與采樣時間無關的成本。我們提出超越獨立樣本假設,以提高樣本的多樣性和效率。我們的方法引入了一種擴展的基于擴散的生成采樣方法,稱為粒子引導。在這種方法中,聯合粒子的時間演化勢通過在樣本(粒子)之間加入互斥力來強制多樣性。根據實驗結果,我們的框架在文本到圖像生成和分子構象生成等應用中提高了樣本的多樣性并減輕了記憶效應。

1.1.3 基于其他物理過程的生成模型

以擴散模型為顯著例子,物理啟發的生成模型包含一個前向過程,該過程將復雜的數據分布簡化為逐步的先驗分布,隨后通過一個反向過程(即采樣過程)逐步將這些先驗分布還原為原始數據分布。因此,為了定義新的物理啟發生成模型,必須確定一個合適的前向過程。該過程應自然地隨著時間簡化數據分布,并且是可逆的,同時其相關的向量場應該易于被神經網絡學習。 借助靜電學原理,我們為物理啟發的生成模型開辟了一條新路徑,并介紹了泊松流生成模型(Poisson Flow Generative Models, PFGM)[30] 及其擴展版本PFGM++ [31]。PFGM將數據解釋為增廣空間中的電荷。如圖1.1所示,當我們從數據支撐遠離足夠遠時,電荷分布坍縮為一個點電荷,電場在各個方向上呈現輻射狀。因此,可以證明這些電荷發出的電場線定義了數據分布和大半球上均勻分布之間的雙射。實驗結果表明,這一新模型家族在樣本質量、采樣速度和穩健性方面超越了擴散模型。此外,我們還探索了物理過程和生成模型之間的對偶性,旨在概念化和設計更多新的物理啟發生成模型 [13]。

1.2 論文摘要

本論文分為三個主題部分。下面簡要概述每個部分的內容。 第一部分 重點開發新技術,旨在穩定擴散模型的訓練,并在處理復雜的多模態數據集時,優化生成軌跡。

第三章 我們通過引入參考批次來解決擴散模型目標中的高方差問題,并使用參考批次計算加權條件得分,作為更穩定的訓練目標。我們展示了這一過程在具有挑戰性的中間階段中,通過減少訓練目標協方差(的跡)確實起到了幫助作用。本章基于文獻 [23]。

第四章 我們通過一個編碼器推斷可學習的離散潛變量,并對擴散模型和編碼器進行端到端訓練。離散潛變量通過降低擴散模型生成ODE的曲率,顯著簡化了其復雜的噪聲到數據映射的學習過程,并通過ODE采樣器提高了在各種數據集上的樣本質量。本章基于文獻 [32]。

第二部分 討論了加速擴散模型采樣過程的技術,以及通過施加樣本之間的互斥力來促進多樣性。所有討論的技術都不需要重新訓練,且可以直接應用于任何預訓練的擴散模型。

第五章 我們提出了一種名為Restart的新采樣算法,結合了先前ODE和SDE采樣器的優勢。Restart算法在附加的前向步驟中加入大量噪聲,并嚴格遵循逆ODE過程。實驗結果表明,Restart采樣器在速度和精度上均超過了先前的SDE和ODE采樣器。本章基于文獻 [29]。

第六章 我們提出了粒子引導,一種擴展的基于擴散的生成采樣方法,其中通過一個聯合粒子的時間演化勢來強制樣本多樣性。在條件圖像生成中,我們測試了該框架,并證明其在不影響質量的情況下增加了多樣性;在分子構象生成中,我們改進了相較于先前方法的中位誤差。本章基于文獻 [33]。

第三部分 探討了一類新型的生成模型,這些模型基于靜電理論,并與擴散模型在擴展視角下進行了統一。本部分還展望了通過物理過程構建生成模型的方法論。

第七章 我們介紹了一種新型生成模型——泊松流生成模型(PFGM),基于靜電理論。我們將數據點解釋為增廣空間中 z=0 超平面上的電荷,生成一個高維電場(泊松方程解的梯度)。我們證明了,如果這些電荷沿電場線向上流動,它們在 z=0 平面的初始分布會轉化為半徑為 r 的半球上的分布,并且在 r → ∞ 時變得均勻。我們展示了PFGM在圖像生成速度上提供了比先前最先進擴散模型更好的性能。本章基于文獻 [30]。

第八章 我們擴展了PFGM中使用的靜電理論,將擴散模型與PFGM統一起來。更有趣的是,在兩者之間的插值揭示了一個性能最優的新平衡點,達到了圖像生成的新標桿性能。我們為為什么PFGM和擴散模型都是次優解提供了理論解釋。本章基于文獻 [31]。

第九章 我們提出了一個統一的框架和算法,將物理過程轉化為平滑的密度流生成模型。此外,我們基于底層物理偏微分方程(PDE)的色散關系,提出了一種分類標準。這種理論方法可應用于各種物理PDE,從而發現新的生成模型家族。本章基于文獻 [13]。

第十章 我們總結了論文內容并討論了當前的局限性。

付費5元查看完整內容

AlphaGo和ChatGPT可能是過去十年中人工智能領域最重要的兩項突破。這些技術得益于在序列決策(例如,規劃、搜索和強化學習)以及基礎模型(例如,基于互聯網數據訓練的語言和視頻生成模型)方面的研究。本論文提出了在現實世界決策任務背景下,利用具有廣泛知識的基礎模型的新技術、算法和框架,這些研究將影響對話代理的構建、機器人控制和科學發現等應用。本論文從離線環境中的傳統決策制定開始,逐步通過表示學習和生成建模引入更廣泛的互聯網規模數據。論文強調了理論基礎與實際應用的結合。本論文的主要貢獻包括離線強化學習的算法進步、面向決策制定的表示學習改進、作為強化學習替代的全新生成建模技術,以及基于互聯網規模的生成代理和生成模擬器,所有這些都旨在增強基礎模型的決策能力,并使之相輔相成。通過廣泛的實證和理論分析,本論文表明,基礎模型在得到適當利用時,可以顯著提高決策任務的效果。這些發現為將機器學習模型與現實世界應用整合提供了新的方向,為更智能、適應性更強、效率更高的系統鋪平了道路。 在過去的十年中,人工智能(AI)領域的兩項重要突破包括2016年人工智能圍棋玩家AlphaGo擊敗人類選手李世乭 [21],以及2022年部署的人工智能聊天機器人ChatGPT [22]。這些技術進步得益于在序列決策和基礎模型方面的研究。在序列決策中,目標是讓計算機(代理)自動決定一系列動作(例如,在哪里放置圍棋子),并且讓計算機基于來自環境的反饋(例如圍棋比賽的結果)自動改進這些決策。機器學習在序列決策中的方法涉及訓練決策策略,即基于當前觀測(例如圍棋棋盤)選擇動作的策略,通過試驗和錯誤的方式進行訓練。這種方法在環境支持無限訪問的游戲場景中表現良好,但在現實世界中超越游戲場景的規模時卻難以實現,因為在現實環境中無限訪問是不切實際的。即使在游戲場景中,先前在序列決策中的工作大多集中在任務特定或“白板”設置中,缺乏先驗知識 [23]。因此,先前的序列決策工作在泛化和樣本效率方面通常表現不佳,例如解決單個Atari游戲需要7個GPU天的交互游戲時間 [24]。 最近,基礎模型(定義為使用自監督學習在大規模數據上訓練的大型機器學習模型 [25])在互聯網上的大量數據上進行了訓練。例如,自回歸語言模型 [26, 27]通過從互聯網抓取的文本數據來預測給定前述單詞(標記)后的下一個單詞(標記)。類似地,視頻生成模型 [28, 29]通過從互聯網抓取的視頻數據,在給定語言輸入和/或前述幀的情況下,預測下一幀。因此,這些模型能夠生成高度逼真的自然語言和視頻。然而,模仿互聯網內容并不是這些模型的最終目標。這些模型的最終目標是解決現實世界中的任務,如回答人們的問題和模擬現實世界的交互。為了實現這一目標,這些模型生成的內容必須由人類控制。如何引導這些模型根據用戶反饋生成理想的內容,以及如何使這些模型做出一系列決策以完成某些復雜任務(例如構建網站),是序列決策的核心問題。將基礎模型研究和序列決策研究結合起來具有巨大的優勢。一方面,基礎模型中的廣泛知識可以提高決策算法的樣本效率和泛化能力。另一方面,決策算法可以對原本與任務無關的基礎模型進行任務特定的優化。本論文研究了基礎模型在決策制定中的技術、框架和算法,并展示了如何將基礎模型中的廣泛知識有效轉化為任務特定的決策,以更好地解決廣泛的問題和應用。 本論文通過從傳統的決策制定技術開始,研究在離線數據集設置下的基礎模型在決策制定中的應用,隨后逐步引入更廣泛的數據,最終整合互聯網規模的視覺和語言數據。我們將對利用基礎模型解決序列決策問題的理論方面和實際應用方面給予高度關注。本論文的工作基于先前關于序列決策的研究思想,但新提出的方法展示了更高的全面性和可擴展性。 本章的其余部分組織如下。第1.1節介紹了基礎模型,這是一種在互聯網規模數據上訓練的機器學習模型。本節討論了訓練基礎模型的常見技術,包括表示學習和生成建模。隨后描述了基礎模型的局限性,包括指令遵循、長時間推理、多步驟規劃和多模態處理。然后概述了本論文如何通過結合決策制定技術來應對其中的一些挑戰。第1.2節描述了序列決策的典型設置和常見的決策制定算法,包括模仿學習、強化學習、搜索和規劃。接下來,本節重點介紹了序列決策的主要瓶頸,包括樣本效率和缺乏良好的視覺和文本表示。最后,簡要介紹了本論文如何通過結合基礎模型來應對這些挑戰。第1.3節闡述了本論文的貢獻,并總結了其結構。

付費5元查看完整內容

現代機器學習模型的脆弱性引起了學術界和公眾的廣泛關注。在本論文中,我們將系統研究幾種機器學習模型的理解與改進,包括平滑模型和通用表征網絡。我們特別關注表征魯棒性的研究,將其定義為給定網絡在隱含空間中的“魯棒性”(或廣義上的可信屬性)。對于通用表征網絡,這對應于表征空間本身,而對于平滑模型,我們將網絡的logits視為目標空間。表征魯棒性是許多可信賴AI領域的基礎,例如公平性和魯棒性。

在本論文中,我們發現隨機平滑的可證魯棒性是以類別不公平性為代價的。我們進一步分析了改進基礎模型訓練過程的方法及其局限性。對于通用的非平滑表征模型,我們發現自監督對比學習與監督的鄰域成分分析之間存在聯系,這自然地使我們提出了一個可以實現更高準確性和魯棒性的通用框架。此外,我們意識到當前基礎表征模型的評估實踐涉及在各種現實任務上進行大量實驗,這既耗費計算資源又容易導致測試集泄漏。為此,我們提出了一種更輕量級、保護隱私且健全的評估框架,通過利用合成數據來評估視覺和語言模型。

**1.1 研究動機

深度神經網絡對人眼難以察覺的對抗性擾動的脆弱性,自從開創性工作[170, 7]發表以來,已經引起了機器學習領域廣泛的關注。這一問題在多個機器學習領域中都是一個重要的關注點,從計算機視覺[170]到語音識別[17],無不如此。特別是在安全關鍵的應用中,如自動駕駛汽車和監控系統,幾乎無法容忍任何錯誤決策。因此,深度神經網絡中對抗樣本的存在,促使了對魯棒性量化的研究,以及旨在增強這種魯棒性的訓練算法的設計[42, 47, 95]。在本論文中,我們旨在理解和改進現代機器學習模型的表征魯棒性。

**1.1.1 機器學習模型的表征魯棒性

表征魯棒性指的是神經網絡模型中隱含空間的可靠性。這一概念在機器學習中尤為重要,因為網絡的隱藏層應該從輸入數據中捕捉到復雜的模式。在本論文中,我們將表征魯棒性定義為這些隱藏表示在面對不同輸入或擾動時,能夠維持理想的可信屬性的能力。理想的可信屬性可能包括準確性、公平性、對抗性魯棒性等。對于一個通用的表征網絡 Φ(?)\Phi(\cdot)Φ(?),隱含空間的自然選擇是表征網絡的輸出空間。這些構建的空間通過表征學習被專門訓練用于編碼關于輸入數據的關鍵信息,使網絡能夠通過一個簡單的任務特定下游網絡執行分類、回歸或生成等各種任務。另一方面,在平滑模型的背景下,平滑濾波器應用于整個基礎網絡

。因此,我們將直接將網絡的

視為評估表征魯棒性的目標空間。在這種情況下,我們特別感興趣的是基礎網絡和平滑網絡之間的不同表現。 研究表征魯棒性對于推動機器學習領域的發展至關重要,原因有以下幾點。首先,正如將在論文的后續章節中討論的那樣,對每個組件(如表征網絡、平滑操作符等)的深入理解有助于我們更加謹慎和意識到這些操作可能產生的副作用。這種理解也將為改進這些網絡設計奠定基礎。其次,隨著機器學習社區逐漸將重點轉向任務無關的預訓練和任務特定的微調,魯棒的表征變得越來越重要。在安全關鍵的應用中,由于脆弱表征導致的錯誤預測可能會產生嚴重后果。從這個角度來看,表征魯棒性是許多可信賴AI領域的基礎,因為預訓練的表征網絡將對任何基于它的機器學習系統的整體可信賴性產生貢獻。通過研究和增強表征魯棒性,可以構建更具彈性的AI系統,并防止錯誤的傳播。

付費5元查看完整內容

生成建模已經成為人工智能的一個熱門應用。然而,當生成模型被錯誤指定,或當生成模型估計器被修改以遵守差分隱私等隱私概念時,模型性能可能會受到負面影響。在本論文中,我們通過展示四項不同的研究,探討了模型錯誤指定和差分隱私下的生成建模。

我們首先介紹了生成建模的相關工作。隨后,我們深入探討了在模型錯誤指定和差分隱私挑戰下研究生成建模的必要性。

作為初步貢獻,我們考慮了用于密度估計的生成建模。處理模型錯誤指定的一種方法是放寬模型假設。我們展示了這一方法在非參數模型中也具有幫助作用。具體而言,我們研究了一種最近提出的非參數準貝葉斯密度估計器,并發現其強模型假設是有限數據集下表現不佳的原因。我們提出了一種自回歸擴展,放寬模型假設,以允許先驗特征依賴關系。

接下來,我們考慮了用于缺失值填補的生成建模。在將當前深度生成填補方法分類為Rubin [1976]引入的不可忽略缺失模型類之后,我們擴展了變分自編碼器的公式,使其根據深度生成建模文獻中尚未研究過的不可忽略缺失模型類進行分解。這些模型顯式地對缺失機制進行建模,以防止在缺失值非隨機情況下的模型錯誤指定。

然后,本論文集中于提高差分隱私下的合成數據生成。為此,我們提出了對差分隱私合成數據樣本進行差分隱私重要性采樣的方法。我們觀察到,生成模型越好,重要性采樣的幫助越大。接著,我們通過考慮差分隱私擴散模型,進一步提高數據生成質量。我們識別了顯著提高DP圖像生成器性能的訓練策略。 我們在論文的最后進行了討論,包括對所展示工作的貢獻和局限性,并提出了未來工作的潛在方向。

付費5元查看完整內容

在過去的十年里,經典機器學習與現代機器學習之間的差距不斷擴大。現代學習的預測性能不可比擬地更好,但更容易對經典學習進行分析,并保證其安全性、效率、公平性等特性。在本論文中,我探討了通過審慎和戰略性地結合經典技術,是否有可能將這些期望的特性恢復到現代機器學習中。我將經典與現代學習的結合歸納為兩種高級策略:(1)封裝,即通過經典分析技術從現代的、不透明的模型中提取可靠的性能保證,或(2)替換,即從經典的基礎構建現代模型的某些組件,以提高整體的效率、可處理性和/或表達能力。這些努力在機器學習的多個領域帶來了新的進展。本論文的最重要貢獻涉及元分析,這是一種結構化的問答形式,作為循證醫學的基礎。經典元分析技術基于隨機對照試驗,其因果效度受到信任;相比之下,現代回歸模型是在大型觀察性數據庫上訓練的,其因果效度不被信任。我展示了如何在不犧牲效度的情況下將不可信的數據納入元分析中。這涉及對完全共形預測的基本改進,這些改進具有普遍的意義。在一個更聚焦的醫療保健應用中,我推廣了經典的、手工設計的心率變異性統計,使其能夠通過監督學習進行微調,成為深度神經網絡的一部分,從而生成更準確的、生理學知情的模型。我還提出了一些可以在未來機器學習模型和算法中使用的基礎計算原語。第一個是一種算法,可以在O(log T)的并行時間內(近似)運行T步非線性RNN。該算法的關鍵創新在于通過一種證明一致的局部、可并行修正方案,用深度上的非線性替代時間上的非線性。通過這種方式,經典線性動態系統(也稱為狀態空間模型)可以堆疊起來形成快速的非線性序列模型。另一個新的計算原語是在所有正交多項式序列集合上進行基于梯度的優化。這種優化形式與信號處理和優化中的許多不同問題都有聯系。最后,我提出了基于學習理論和優化中廣泛使用的幾何邊界概念的公平性標準,以規避計算的不可處理性。

付費5元查看完整內容

隨著機器學習算法在高風險應用中不斷開發和部署,確保其可靠性已變得至關重要。本論文介紹了在機器學習中提高可靠性的算法進展,重點強調兩個關鍵維度:魯棒性和可解釋性。 本論文的第一部分側重于魯棒性,即保證算法在各種數據不確定性下仍能提供穩定和可預測的性能。我們研究了在不同數據不確定性來源下的學習魯棒性,包括基本的統計誤差以及數據噪聲和損壞。我們的研究揭示了這些不同來源如何相互作用并對數據驅動決策產生影響。我們引入了針對特定不確定性來源量身定制的新穎的分布魯棒優化方法。我們的研究結果表明,對一種來源的保護可能會增加對另一種來源的脆弱性。為了解決這個問題,我們開發了分布模糊集,能夠同時提供對所有來源的整體魯棒性。在每種情況下,我們證明了我們的新方法實現了“高效”的魯棒性,在平均性能與樣本外保證之間實現了最佳平衡。我們的新算法被應用于各種場景,包括訓練魯棒神經網絡,在這些場景中顯著優于現有基準。 本論文的第二部分探討了可解釋性,這是高風險環境下決策支持工具的一個關鍵屬性,要求算法能夠為其決策提供可理解的解釋。我們的工作在這一部分的動機來自于數據驅動的個性化患者治療——一種越來越受歡迎的機器學習應用。在這個強化學習問題中,可解釋性至關重要:醫生不能依賴于一個黑箱算法來開具治療方案。我們在理論上引入了學習連續狀態空間動態系統最簡潔離散表示的問題。在患者治療的背景下,這相當于基于患者治療過程中不斷變化的特征來確定治療組。令人驚訝的是,我們在理論上證明,僅從觀察到的歷史樣本路徑數據中就有可能學習到動態系統的最簡潔表示。隨后,我們開發了一種算法,MRL,能夠學習這種簡潔的表示,從而增強可解釋性和可操作性。

付費5元查看完整內容

動態穩定移動操縱器的使用正從受控研究實驗室擴展到真實世界。然而,自主操縱技能仍然專門用于單一任務,并且只能處理對象物理屬性的有限變化,這阻礙了機器人在非結構化人類環境中的部署。本論文關注于動態穩定移動操縱器的整體運動規劃和控制,以及為控制器提供實時適應由于與物體交互而引起的機器人動力學變化。

動態穩定移動操縱器,即配備機器人手臂的積極平衡移動機器人,在為人類設計的環境中工作潛力非常大。然而,它們的靈活性和順應性需要高控制復雜性。傳統的控制策略將移動和操縱問題分別處理,需要額外的啟發式方法來實現整體協調。此外,基于逆動力學的控制器不考慮系統未來的演變,這對平衡控制至關重要。另一方面,在本論文中,我們提出了一種基于模型預測控制(MPC)的整體運動規劃和控制公式。我們的方法利用了完整的機器人動力學,并共同優化平衡、基座追蹤、末端執行器追蹤和環境交互。我們在一個球平衡操縱器的廣泛實驗中驗證了所提出的整體MPC控制器。

當機器人動力學不準確或操縱新物體時,模型不確定性可能嚴重影響MPC的性能和通用性。為了解決這個問題,我們提出了兩種在線適應方案,用于MPC系統動力學中的物體參數,我們在一個球平衡操縱器的開門和舉起物體任務中展示了這一點。盡管我們最初將外部環境建模為線性系統,但對于更復雜的操縱任務或機器人動力學中的不確定性,需要更具描述性的表示。因此,我們提出將模型誤差近似為三角函數基函數的線性組合。假設當機器人執行類似操縱任務時,動力學的基本結構不會發生顯著變化,我們從相關實驗中收集的數據學習基函數的超參數,例如,讓機器人打開具有不同剛度系數的門。執行新任務時,基函數的超參數保持不變,而線性參數在線適應。我們在仿真和硬件實驗中測試了得到的多任務學習MPC控制器,并與其他自適應MPC控制器進行了廣泛比較。

最后,為了在參數不確定性下獲得更好的跟蹤性能,我們將機器人操縱器自適應控制中導出的控制Lyapunov函數(CLF)約束納入最優控制問題的不等式集合中。因此,我們獲得了一種結合了CLFs和MPC優勢的自適應控制器,在機器人與未知物體交互時提供了改進的性能,并減少了對MPC預測范圍調整的依賴。我們通過與幾個基線的比較展示了所提方法的優勢,并在一個四足機器人搬運磚塊和拖拽重箱的硬件測試中驗證了它。

付費5元查看完整內容

雷達在惡劣條件下以及遠程的感測能力使其成為移動機器人應用中視覺和激光雷達的有價值的替代品。然而,雷達復雜、與場景相關的感測過程和顯著的噪聲缺陷使得使用雷達具有挑戰性。超越迄今為止文獻中占主導地位的經典基于規則的方法,本論文探討了在機器人學的一系列任務中深入且數據驅動的解決方案。

首先,開發了一種深度方法,用于將原始傳感器測量映射到占用概率的網格地圖,其性能顯著超越了經典的過濾方法。捕捉到占用狀態的分布,此外還允許識別和管理預測中的不確定性。該方法完全使用從激光雷達自動生成的部分標簽進行訓練,無需手動標記。

接下來,提出了一個深度模型,用于從模擬的高程圖生成隨機雷達測量值。該模型通過學習前向和后向過程來進行訓練,結合使用對抗性和周期性一致性約束與部分對齊損失,使用激光雷達生成的標簽。通過忠實地復制雷達的感測過程,可以使用在模擬中容易獲得的標簽,為下游任務訓練新模型。在這種情況下,模擬雷達測量值上訓練的分割模型在真實世界中部署時,其性能接近完全在真實世界測量值上訓練的模型。

最后,探討了應用于雷達測距任務的深度方法的潛力。學習的特征空間與經典的相關掃描匹配過程相結合,并針對姿態預測進行優化,使得所提出的方法在性能上顯著超越了之前的最新技術。通過概率性的考慮,姿態的不確定性也得到了成功的描述。在此成功的基礎上,利用傅里葉變換的性質分離了平移和角度的搜索。結果顯示,這種解耦搜索在運行時間性能上有了顯著的提升,使得該方法可以在CPU和嵌入式設備上實時運行,同時仍與文獻中提出的其他雷達測距方法保持競爭力。

付費5元查看完整內容
北京阿比特科技有限公司