學習適用于各種下游任務的通用時間序列表征是具有挑戰性但在實際應用中極具價值的。最近,研究人員嘗試利用自監著學習(SSCL)在計算機視覺(CV)和自然語言處理(NLP)中的成功來解決時間序列表征的問題。然而,由于時間序列的特殊時序特性,僅依賴于其他領域的經驗指導可能對時間序列無效,且難以適應多個下游任務。為此,我們審查了SSCL涉及的三個部分,包括1)設計正樣本對的增強方法,2)構建(困難的)負樣本對,以及3)設計SSCL損失函數。對于1)和2),我們發現不合適的正、負樣本對構建可能引入不適當的歸納偏見,既不能保留時序屬性,也不能提供足夠的判別特征。對于3),僅探索片段級或實例級的語義信息對于學習通用表征是不夠的。為解決上述問題,我們提出了一種名為TimesURL的新型自監著框架。具體來說,我們首先引入一種基于頻率-時序的增強方法,以保持時序屬性不變。然后,我們構建雙重“Universum”作為一種特殊的困難負樣本,以指導更好的對比學習。此外,我們引入時間重構作為與對比學習的聯合優化目標,以捕獲片段級和實例級信息。結果表明,TimesURL能夠學習高質量的通用表征,并在6種不同的下游任務中實現最先進的性能,包括短期和長期預測、插值、分類、異常檢測和遷移學習。
動態圖神經網絡(DGNNs)在利用動態圖上的時空模式方面越來越普遍。然而,現有工作在分布轉移下的泛化能力不足,這在現實世界場景中很常見。由于動態圖的生成受潛在環境的強烈影響,調查它們對超出分布(OOD)泛化的影響至關重要。然而,面對以下兩個主要挑戰,這仍然是一個未探索的領域:(1)如何正確地建模和推斷動態圖上具有分布轉移的復雜環境?(2)在推斷出的時空環境下,如何發現不變模式?為了解決這些挑戰,我們提出了一種新穎的環境感知動態圖學習(EAGLE)框架,通過建模復雜的耦合環境和利用時空不變模式來實現OOD泛化。具體來說,我們首先設計了環境感知EADGNN,通過多通道環境解耦來建模環境。然后,我們提出了一種環境實例化機制,用于具有推斷分布的環境多樣化。最后,我們通過不變模式識別機制對超出分布的預測進行時空不變模式的區分,并通過混合實例化環境樣本對節點進行細粒度因果干預。在真實世界和合成動態圖數據集上的實驗表明,我們的方法在分布轉移下優于最先進的基準。據我們所知,我們是第一個從環境學習角度研究動態圖上OOD泛化的團隊。
圖結構學習是一個成熟的問題,旨在優化適應特定圖數據集的圖結構,以幫助消息傳遞神經網絡(即GNN)產生有效且魯棒的節點嵌入。然而,現有模型的普遍限制在于基本的封閉世界假設:測試圖與訓練圖相同。這個前提要求對每個圖數據集獨立從頭開始訓練結構學習模型,導致計算成本過高,并可能出現嚴重的過擬合風險。為了緩解這些問題,本文探索了一個新的方向,即學習一個通用的結構學習模型,可以在開放世界中推廣到各種圖數據集。我們首先介紹這個新穎問題設置的數學定義,并從概率數據生成的角度描述模型的構建。然后,我們設計了一個通用框架,協調一個圖共享的結構學習器和多個圖特定的GNN,以捕捉跨數據集的可推廣的最佳消息傳遞拓撲模式。經過良好訓練的結構學習器可以直接為未見過的目標圖生成適應性結構,而無需任何微調。在不同的數據集和各種具有挑戰性的跨圖泛化協議中,我們的實驗證明,即使在目標圖上沒有進行訓練,所提出的模型:i)顯著優于在輸入(非優化)拓撲上訓練的表達能力強大的GNN;ii)令人驚訝地與獨立優化特定目標圖的最先進模型表現相當,并且在目標圖上訓練的速度明顯加快了幾個數量級。 //arxiv.org/abs/2306.11264
從純觀測數據中發現因果結構(即,因果發現),旨在識別變量之間的因果關系,是機器學習中的基本任務。最近的可微分基于得分的DAG學習器的發明是關鍵的推動者,它將組合優化問題轉變為具有DAG約束的可微分優化問題,這個約束位于有向圖空間上。盡管這些前沿的DAG學習器取得了巨大成功,但它們結合了獨立于DAG-ness的得分函數來評估有向圖候選項,而忽視了考慮圖結構。結果,僅考量數據適應性而不考慮DAG-ness不可避免地導致了發現次優的DAG和模型的脆弱性。為此,我們提出了一種動態的因果空間用于DAG結構學習,我們稱之為CASPER,它將圖結構融入到得分函數中作為一種新的測量方法,在因果空間中忠實地反映出估計的DAG和基準DAG之間的因果距離。CASPER修訂了學習過程,并通過對DAG-ness的自適應關注來增強DAG結構學習。經驗可視化驗證,CASPER作為空間,滿足了一系列期望的特性,如結構意識和對噪聲的魯棒性。在合成數據和實際數據集上的廣泛實驗清楚地驗證了我們的CASPER在準確性和魯棒性方面超越了最先進的因果發現方法。
//www.zhuanzhi.ai/paper/86c37ab8b60e0e9ed7123051e5bdeeed
元學習算法能夠利用先前學習的知識來學習新任務,但它們通常需要大量的元訓練任務,而這些任務可能并不容易獲得。為了解決這個問題,我們提出了一種用更少任務進行小樣本學習的方法,我們稱之為 MetaModulation(元調制)。關鍵的想法是通過在元訓練期間調節批量歸一化參數,使用神經網絡增加元訓練任務的密度。此外,我們在各種網絡層面,而非僅在單一層面,修改參數以增加任務多樣性。為了解決由于訓練任務有限而導致的不確定性,我們提出了一種變分元調制方法,其中調制參數被視為隱變量。我們還引入了通過變分元調制學習的變分特征層次結構,這種調制可以調節所有層面的特征,并能考慮任務不確定性,生成更多樣化的任務。消融研究顯示了在不同層面利用可學習的任務調制的優點,并證明了在少任務元學習中加入概率變體的好處。我們的元調制及其變分變體在四個少任務元學習基準測試中均一致優于當前最先進的替代方案。
//www.zhuanzhi.ai/paper/6bad681ebd0c520eacc14067e18627dc
在源領域的帶標簽數據集上訓練的模型向無標簽目標領域的遷移通過無監督領域自適應(UDA)實現。然而,在處理復雜的時間序列模型時,由于不同領域間存在動態時間結構差異,導致特征偏移和時間頻率表示的空缺,使得遷移能力變得具有挑戰性。此外,源領域和目標領域的任務可能具有截然不同的標簽分布,這使得 UDA 很難緩解標簽偏移和識別僅存在于目標領域的標簽。我們提出了 RAINCOAT,這是第一個用于復雜時間序列的封閉集和通用 DA 的模型。RAINCOAT 通過考慮時間和頻率特征,跨領域對齊它們,并糾正不對齊來解決特征和標簽偏移問題,從而有助于檢測私有標簽。此外,RAINCOAT 通過識別目標領域的標簽偏移來提高遷移能力。我們在5個數據集和13個最先進的 UDA 方法上的實驗表明,RAINCOAT 可以實現最高達 16.33% 的性能改進,并且可以有效處理封閉集和通用自適應。
//www.zhuanzhi.ai/paper/5a24ce01774105793faf536c6b26090c
連續圖學習通常在各種現實應用中發揮作用,其中包含不同任務的圖數據依次出現。盡管之前的工作取得了成功,但仍然面臨著巨大的挑戰。一方面,現有的方法處理零曲率的歐氏空間,很大程度上忽略了曲率隨即將到來的圖序列而變化的事實。另一方面,文獻中的持續學習者依賴于豐富的標簽,但在實踐中對圖進行標注尤其困難,特別是對于不斷涌現的動態圖。為了解決上述的挑戰,我們提出探索一個具有挑戰性但實際的問題,自適應黎曼空間中的自監督連續圖學習。在本文中,我們提出了一種新的自監督黎曼圖持續學習者(RieGrace)。在RieGrace中,我們首先設計了一個自適應黎曼GCN (AdaRGCN),一個與神經曲率適配器相結合的統一GCN,使黎曼空間由學習到的自適應于每個圖的曲率來塑造。然后,我們提出了一種無標簽洛倫茲蒸餾方法,該方法為圖序列創建師生AdaRGCN。學生依次從自身進行內餾,從老師進行間餾,從而鞏固知識,避免災難性的遺忘。特別地,我們提出了黎曼空間中對比蒸餾的廣義洛倫茲投影。在基準數據集上的大量實驗證明了RieGrace算法的優越性。
理解強化學習(RL)智能體的新出現行為可能是困難的,因為此類智能體通常在復雜環境中使用高度復雜的決策程序進行訓練。這導致了強化學習中各種可解釋性方法的產生,這些方法旨在協調智能體的行為和觀察者預期的行為之間可能出現的差異。最近的大多數方法都依賴于領域知識(這可能并不總是可用的),依賴于對智能體策略的分析,或者依賴于對底層環境的特定元素的分析(通常建模為馬爾可夫決策過程(Markov Decision Process, MDP))。我們的關鍵主張是,即使底層的MDP不是完全已知的(例如,轉移概率沒有被準確地學習)或不是由智能體維護的(即,轉移概率不是由智能體維護的)。,當使用無模型方法時),它仍然可以被利用來自動生成解釋。出于這個目的,我們建議使用正式的MDP抽象和轉換(以前在文獻中用于加速搜索最優策略)來自動生成解釋。由于這種轉換通常基于環境的符號表示,它們可以表示預期和實際智能體行為之間差距的有意義的解釋。我們正式地定義了這個問題,提出了一類可以用來解釋突發行為的變換,并提出了能夠有效地尋找解釋的方法。我們將在一組標準基準上演示該方法。
Transformer在學習視覺和語言表示方面取得了巨大的成功,這在各種下游任務中都是通用的。在視覺控制中,學習可在不同控制任務間遷移的可遷移狀態表示對于減少訓練樣本的大小具有重要意義。然而,將Transformer移植到采樣高效的視覺控制仍然是一個具有挑戰性和未解決的問題。為此,我們提出了一種新穎的控制Transformer(CtrlFormer),它具有許多現有技術所沒有的吸引人的優點。首先,CtrlFormer在不同控制任務之間聯合學習視覺令牌和策略令牌之間的自注意力機制,可以在不發生災難性遺忘的情況下學習和遷移多任務表示。其次,我們精心設計了一個對比強化學習范式來訓練CtrlFormer,使其能夠達到較高的樣本效率,這在控制問題中是非常重要的。例如,在DMControl基準測試中,不像最近的先進方法在使用100k樣本遷移學習后在“Cartpole”任務中產生零分而失敗,CtrlFormer可以在僅使用100k樣本的情況下獲得769±34的最先進的分數,同時保持之前任務的性能。代碼和模型發布在我們的項目主頁上。
//www.zhuanzhi.ai/paper/9692ae63f6623f9fc8ad4d18583f4002
在不依賴下游任務的情況下評估已學習表示的質量仍然是表示學習的挑戰之一。在這項工作中,我們提出了幾何成分分析(GeomCA)算法,基于其幾何和拓撲性質評估表示空間。GeomCA可以應用于任何維度的表示,獨立于生成它們的模型。我們通過分析從各種場景中獲得的表示,如對比學習模型、生成模型和監督學習模型,證明了它的適用性。
多元時間序列建模一直是一個熱門主題,吸引了來自不同領域的研究人員,包括經濟、金融和交通。多元時間序列預測背后的一個基本假設是,其變量相互依賴,但仔細觀察,可以說現有方法無法完全利用變量對之間的潛在空間依賴性。同時,近年來,圖神經網絡(GNN)在處理關系依賴方面表現出了很高的能力。GNN需要用于信息傳播的定義明確的圖結構,這意味著它們無法直接應用于事先不知道相關性的多元時間序列。在本文中,我們提出了一個專門為多元時間序列數據設計的通用圖神經網絡框架。我們的方法通過圖形學習模塊自動提取變量之間的單向關系,可以輕松地將諸如變量屬性之類的外部知識整合到其中。進一步提出了一種新穎的混合跳躍傳播層和一個擴張的起始層來捕獲時間序列內的空間和時間依賴性。在端到端框架中共同學習圖學習,圖卷積和時間卷積模塊。實驗結果表明,我們提出的模型在4個基準數據集中的3個方面優于最新的基線方法,并在提供額外結構信息的兩個交通數據集上與其他方法相比具有同等的性能。
地址: //www.zhuanzhi.ai/paper/50fe383c75bcd2a665984f30eabe7d87