主題: Semi-Supervised StyleGAN for Disentanglement Learning
摘要: 解纏學習是獲得解纏表示和可控生成的關鍵。目前的解纏方法面臨著一些固有的局限性:難以獲得高分辨率圖像,主要是學習解纏表示,以及由于無監督設置而無法識別。為了緩解這些限制,我們設計了基于StyleGAN(Karras等人,2019)的新架構和損失函數,用于半監督高分辨率解糾纏學習。我們創建了兩個復雜的高分辨率合成數據集用于系統測試。我們研究了有限監督的影響,發現僅使用0.25%~2.5%的標記數據就足以對合成數據集和真實數據集進行良好的分離。我們提出了新的量化發電機可控性的指標,并觀察到分離表示學習和可控發電之間可能存在一個關鍵的權衡。我們還考慮了語義細粒度的圖像編輯,以實現對看不見的圖像更好的泛化。
題目: Online Deep Clustering for Unsupervised Representation Learning
摘要:
聯合聚類和特征學習方法在無監督表示學習中表現出了顯著的效果。但是,特征聚類和網絡參數更新訓練計劃的交替導致視覺表征學習的不穩定。為了克服這個挑戰,我們提出在線深度集群(ODC),它可以同時執行集群和網絡更新,而不是交替進行。關鍵見解是,聚類中心應該穩步發展,以保持分類器的穩定更新。具體來說,設計和維護了兩個動態內存模塊,即樣本記憶用于存儲樣本標簽和特征,中心記憶用于中心進化。我們將全局聚類分解為穩定的內存更新和成批的標簽重新分配。該過程被集成到網絡更新迭代中。通過這種方式,標簽和網絡齊頭并進,而不是交替發展。大量的實驗表明,ODC能夠穩定訓練過程,有效地提高訓練性能。
主題: Understanding Negative Sampling in Graph Representation Learning
摘要: 在最近的幾年中,研究人員對圖形表示學習進行了廣泛的研究。盡管它具有為各種網絡生成連續嵌入的潛力,但推斷向大型節點集表示高質量表示的有效性和效率仍然具有挑戰性。采樣是實現性能目標的關鍵點。現有技術通常集中于對正節點對進行采樣,而對負采樣的策略還沒有得到足夠的研究。為了彌合差距,我們從客觀和風險兩個角度系統地分析了負樣本的作用,從理論上證明了負樣本在確定優化目標和結果方差方面與正樣本同等重要。據我們所知,我們是第一個推導該理論并量化負采樣分布應與其正采樣分布呈正相關但與子線性相關的方法。在該理論的指導下,我們提出了MCNS,用Metropolis-Hastings用自對比度逼近來近似正分布,并加速Metropolis-Hastings進行負采樣。我們在5個數據集上評估了我們的方法,這些數據集涵蓋了19個實驗設置,涵蓋了廣泛的下游圖形學習任務,包括鏈接預測,節點分類和個性化推薦。這些相對全面的實驗結果證明了其魯棒性和優越性。
基于卷積神經網絡的方法在語義分割方面取得了顯著的進展。然而,這些方法嚴重依賴于注釋數據,這是勞動密集型的。為了解決這一限制,使用從圖引擎生成的自動注釋數據來訓練分割模型。然而,從合成數據訓練出來的模型很難轉換成真實的圖像。為了解決這個問題,以前的工作已經考慮直接將模型從源數據調整到未標記的目標數據(以減少域間的差距)。盡管如此,這些技術并沒有考慮到目標數據本身之間的巨大分布差異(域內差異)。在這項工作中,我們提出了一種兩步自監督域適應方法來減少域間和域內的差距。首先,對模型進行域間自適應;在此基礎上,我們使用基于熵的排序函數將目標域分成簡單和困難的兩部分。最后,為了減小域內間隙,我們提出了一種自監督自適應技術。在大量基準數據集上的實驗結果突出了我們的方法相對于現有的最先進方法的有效性。
題目: Milking CowMask for Semi-Supervised Image Classification
摘要:
一致性正則化是一種用于半監督學習的技術,最近被證明可以在標記數據很少的情況下產生強大的分類結果。該方法通過增加或反例擾動輸入數據,并鼓勵所學習的模型對未標記數據的擾動具有魯棒性。在這里,我們評估了一種最近提出的增強方法,稱為CowMasK。在半監督一致性正則化中,使用CowMask作為增強方法,我們在Imagenet上建立了一個新的最優結果,標記數據為10%,前5位誤差為8.76%,前1位誤差為26.06%。此外,我們使用的方法比其他方法簡單得多。我們通過在小型圖像基準SVHN、CIFAR-10和CIFAR-100上運行許多較小規模的實驗,進一步研究了CowMask用于半監督學習的行為,在這些實驗中,我們獲得了與現有水平相當的結果,并且發現了CowMask擾動廣泛適用的證據。
主題: Learning Video Object Segmentation from Unlabeled Videos
摘要:
我們提出了一種新的視頻對象分割方法(VOS),解決了從未標記的視頻中學習對象模式的問題,而現有的方法大多依賴于大量的帶注釋的數據。我們引入了一個統一的無監督/弱監督學習框架,稱為MuG,它全面地捕捉了VOS在多個粒度上的內在特性。我們的方法可以幫助提高對VOS中可視模式的理解,并顯著減少注釋負擔。經過精心設計的體系結構和強大的表示學習能力,我們的學習模型可以應用于各種VOS設置,包括對象級零鏡頭VOS、實例級零鏡頭VOS和單鏡頭VOS。實驗表明,在這些設置下,有良好的性能,以及利用無標記數據進一步提高分割精度的潛力。
機器學習的許多應用都需要一個模型來對測試樣本做出準確的預測,這些測試樣本在分布上與訓練示例不同,而在訓練期間,特定于任務的標簽很少。應對這一挑戰的有效方法是,在數據豐富的相關任務上對模型進行預訓練,然后在下游任務上對其進行微調。盡管預訓練在許多語言和視覺領域都是有效的,但是如何在圖數據集上有效地使用預訓練仍是一個有待解決的問題。本文提出了一種新的圖神經網絡訓練策略和自監督方法。我們的策略成功的關鍵是在單個節點以及整個圖的層次上預訓練一個具有強表示能力的GNN,以便GNN能夠同時學習有用的局部和全局表示。我們系統地研究了多類圖分類數據集的預處理問題。我們發現,在整個圖或單個節點級別上對GNN進行預訓練的樸素策略改進有限,甚至可能導致許多下游任務的負遷移。相比之下,我們的策略避免了負遷移,顯著提高了下游任務的泛化能力,使得ROC-AUC相對于未經訓練的模型提高了9.4%,實現了分子特性預測和蛋白質功能預測的最好性能。
題目: Weakly-Supervised Disentanglement Without Compromises
摘要:
智能體應該能夠通過觀察其環境中的變化來學習有用的表示。首先,從理論上證明,只知道有多少因素發生了變化,而不知道哪些因素發生了變化,就足以學習解纏表示。其次,我們提供了實用的算法,可以從成對的圖像中學習分離的表示,而不需要對組、單個因素或已更改的因素的數量進行注釋。第三,我們進行了大規模的實證研究,并表明這樣的觀測對足以可靠地學習幾個基準數據集上的解纏表示。最后,我們評估我們的表示學習,并發現它們在不同的任務集合上同時是有用的,包括協變量轉移下的泛化、公平性和抽象推理。總的來說,結果表明,在現實場景中,弱監督能夠幫助學習有用的解纏表示。
論文主題: Deep Learning for Image Super-resolution: A Survey
論文摘要: 圖像超分辨率(SR)是提高圖像分辨率的一類重要的圖像處理技術以及計算機視覺中的視頻。近年來,基于深度學習的圖像超分辨率研究取得了顯著進展技術。在這項調查中,我們旨在介紹利用深度學習的圖像超分辨率技術的最新進展系統的方法。一般來說,我們可以粗略地將現有的SR技術研究分為三大類:監督SR、非監督SR和領域特定SR。此外,我們還討論了一些其他重要問題,如公開可用的基準數據集和性能評估指標。最后,我們通過強調幾個未來來結束這項調查未來社區應進一步解決的方向和公開問題.
Learning embedding functions, which map semantically related inputs to nearby locations in a feature space supports a variety of classification and information retrieval tasks. In this work, we propose a novel, generalizable and fast method to define a family of embedding functions that can be used as an ensemble to give improved results. Each embedding function is learned by randomly bagging the training labels into small subsets. We show experimentally that these embedding ensembles create effective embedding functions. The ensemble output defines a metric space that improves state of the art performance for image retrieval on CUB-200-2011, Cars-196, In-Shop Clothes Retrieval and VehicleID.