這篇論文是關于從一系列動作中學習產生一個物體(比如分子圖)的隨機策略的問題,這樣產生一個物體的概率與該物體的給定的正回報成正比。盡管標準收益最大化傾向于收斂于單個收益最大化序列,但在某些情況下,我們希望抽樣不同的高收益解決方案集。例如,在黑箱函數優化中,當可能的輪數很少時,每個批次都有大量的查詢,這些查詢的批次應該是不同的,例如,在新分子的設計中。人們也可以把這看作是一個將能量函數近似轉化為生成分布的問題。雖然MCMC方法可以實現這一點,但它們的成本很高,而且通常只執行局部勘探。相反,生成式策略在訓練過程中攤銷了搜索成本,并讓位于快速生成。利用來自時態差分學習的見解,我們提出了GFlowNet,基于將生成過程視為流動網絡的觀點,使其有可能處理不同軌跡可能產生相同最終狀態的棘手情況,例如,有許多方法順序添加原子來生成一些分子圖。我們將軌跡集轉換為一個流,并將流一致性方程轉換為一個學習目標,類似于將Bellman方程轉換為時間差分方法。我們證明了所提出的目標的任何全局最小值都能產生一個從期望分布中采樣的策略,并在一個有許多模式的獎勵函數的簡單域和一個分子合成任務上證明了GFlowNet改進的性能和多樣性。
從 2D 分子圖中預測穩定的 3D 構象一直是計算化學中的一個長期挑戰。而最近,機器學習方法取得了相比傳統的實驗和基于物理的模擬方法更優異的成績。這些方法主要側重于模擬分子圖上相鄰原子之間的局部相互作用,而忽略了非鍵合原子之間的長程相互作用。然而,這些未成鍵的原子在 3D 空間中可能彼此接近,模擬它們的相互作用對于準確確定分子構象至關重要,尤其是對于大分子和多分子復合物。在本文中,作者提出了一種稱為動態圖評分匹配 (DGSM) 的分子構象預測新方法,該方法通過在訓練和推理過程中根據原子之間的空間接近度動態構建原子之間的圖結構來對局部和遠程相互作用進行建模。具體來說,DGSM根據動態構建的圖,使用評分匹配方法直接估計原子坐標對數密度的梯度場。可以以端到端的方式有效地訓練整個框架。多項實驗表明,DGSM 的表現遠超該領域一流水平,并且能夠為更廣泛的化學系統生成構象,例如蛋白質和多分子復合物。
論文鏈接: //proceedings.neurips.cc/paper/2021/hash/a45a1d12ee0fb7f1f872ab91da18f899-Abstract.html
生成流網絡(GFlowNets)在主動學習環境中采樣多樣化的候選集合的一種方法,其訓練目標是使它們按照給定的獎勵函數的比例近似抽樣。在本文中,我們展示了GFlowNets的一些額外的理論性質。它們可以用來估計聯合概率分布和相應的邊際分布,其中一些變量是未指定的,特別有趣的是,可以表示在集合和圖等復合對象上的分布。GFlowNets將通常由計算昂貴的MCMC方法所做的工作攤銷在一個單一但經過訓練的生成過程中。它們也可以用來估計配分函數和自由能,給定子集(子圖)的超集(超圖)的條件概率,以及給定集(圖)的所有超集(超圖)的邊際分布。我們引入變量,使熵和互信息的估計,從帕累托邊界取樣,連接到獎勵最大化策略,并擴展到隨機環境,連續行動和模塊能量函數。
可控生成是深度生成模型在現實應用中成功應用的關鍵要求之一,但它仍然是一個巨大的挑戰。特別是,生成新概念組合的組合能力是目前大多數模型所無法達到的。在這項工作中,我們使用基于能量的模型(EBMs)來處理一組屬性的組成生成。為了使它們可擴展到高分辨率圖像生成,我們在StyleGAN等預訓練生成模型的潛在空間中引入了EBM。我們提出了一種新的EBM公式來表示數據和屬性的聯合分布,并且我們展示了如何將它的抽樣表示為求解常微分方程(ODE)。給定一個預訓練的生成器,我們所需要的可控生成就是訓練一個屬性分類器。利用ODE進行采樣是有效的,并且對超參數具有魯棒性。因此,該方法簡單、訓練快、采樣效率高。實驗結果表明,該方法在條件采樣和順序編輯方面都優于現有的方法。在成分生成中,我們的方法優于零樣本生成未見的屬性組合。此外,通過將能量函數與邏輯運算符組合在一起,這項工作首次實現了這種組合,從而生成分辨率為1024x1024的逼真圖像。
我們提出了一種新的方法來解開一組給定的觀察結果背后的變異的生成因素。我們想法是建立在可以顯式地建模為子流形乘積的數據空間的(未知的)低維流形。這種解糾纏的定義提出了一種新的弱監督算法,用于恢復數據背后的未知解釋因素。在訓練時,我們的算法只需要成對的非i.i.d.數據樣本,它們的元素共享至少一個,可能是多維的,產生變異的因素。我們不需要知道這些變換的性質,也不需要對每個子空間的性質做任何限制性的假設。我們的方法易于實現,并可以成功地應用于不同類型的數據(從圖像到三維表面)進行任意轉換。除了標準的合成基準外,我們還展示了我們在挑戰現實應用方面的方法,在現實應用中,我們可以與目前的技術水平想匹配。
最近的對比表示學習方法依賴于估計一個上下文的多個視圖之間的互信息。例如,我們可以通過應用數據增強獲得給定圖像的多個視圖,或者我們可以將序列分割成包含序列中某個步驟的過去和未來的視圖。MI的下界比較容易優化,但當評估大量的MI有強烈的低估偏見。我們提出將完整的MI估計問題分解為一個較小的估計問題。這個表達式包含一個無條件和條件MI項的和,每個測量總的MI的適度塊,這有助于通過對比界近似。為了使和最大化,我們給出了條件MI的一個比較下界,它可以有效地逼近。我們將我們的一般方法稱為互信息分解估計(DEMI)。我們證明了DEMI可以捕獲比標準的非分解對比界在綜合設置更大數量的MI,并在視覺域的對話生成學習更好的表示。
神經網絡搜索的關鍵步驟之一是評估候選網絡結構的性能。現有方法要么直接在驗證集上測量網絡結構性能,要么學習一個預測器來估計性能。然而,這些方法要么計算成本高,要么非常不準確,這可能會嚴重影響搜索效率和性能。此外,由于很難在特定任務上對網絡結構進行準確的性能標注,因此很難訓練得到一個準確的性能預測器。在本文中,我們認為神經網絡搜索可能不需要評估候選網絡結構的絕對性能。相反,我們可能只需要得到一個網絡結構與基線結構的相對優劣就足以進行搜索。然而,如何利用相對優劣信息作為獎勵,以及如何很好地利用有限的標注網絡結構數據,仍然是兩個巨大的挑戰。對此,我們提出了一種新型的對比神經架構搜索方法,該方法利用網絡結構之間的對比結果作為獎勵來進行搜索。具體而言,我們設計了一個網絡結構比較器來估計候選網絡結構優于基線結構的概率。此外,受課程學習啟發,我們提出了一種基線結構更新方案,其可以在搜索過程中逐漸提升基線結構。我們還從理論上表明,學習網絡結構比較器和直接優化網絡結構間的排序是等價的。我們在三個搜索空間的進行了廣泛實驗,實驗結果證明了我們方法較現有方法的優越性。
神經結構搜索(NAS)旨在以全自動的方式找到表現出色且新穎的神經網絡結構。然而現有的搜索空間設計過度依賴于研究者的專業知識,所涵蓋的神經網絡相對比較單一,導致搜索策略雖然能找到表現不錯的結構,卻無法發現突破性的新型神經網絡。在這篇工作中,我們 1)首次提出了搜索最優的神經網絡結構生成分布(architecturegenerator)而不僅僅是單個神經網絡(single architecture) 的概念,2)并針對這個概念提出了一個全新的,多階層的,基于圖的搜索空間。該搜索空間不但能生成非常多樣化的網絡結構,而且只由幾個超參來定義。這極大減少了結構搜索的維度,使得我們能高效地使用貝葉斯優化作為搜索策略。與此同時,因為我們拓廣了搜索空間(包含眾多性能和存儲需求差異巨大的有效網絡結構),這使得多目標學習在我們的場景下更有意義。我們在六個圖像數據集上驗證了我們方法(NAGO)的高效性, 并展示了我們的方法能找到非常輕便且性能卓越的網絡結構。
在最大化源與目標之間的互信息方面的最新進展已經證明了它在文本生成方面的有效性。然而,以往的工作對MI(即MI)的后向網絡建模關注較少。這對于變分信息最大化下界的緊密性至關重要。在本文中,我們提出了一個對抗互信息(AMI):一個文本生成框架,它是一個新的鞍點(min-max)優化,旨在識別源與目標之間的聯合交互。在這個框架中,通過比較真實和合成的數據分布,前向網絡和后向網絡能夠迭代地提升或降級彼此生成的實例。我們還開發了一個潛在噪聲采樣策略,利用高級語義空間的隨機變化來增強生成過程中的長期依賴性。基于不同文本生成任務的大量實驗表明,所提出的AMI框架能夠顯著優于多個強基線,我們還表明,AMI有可能為變分信息最大化問題帶來更緊密的互信息上限。
//www.zhuanzhi.ai/paper/ccd8403755c153d155bec032656f8c49