偏標記學習是一個典型的弱監督學習問題,每個訓練示例都與一組候選標簽相關聯,其中只有一個標簽為真。大多數現有的方法都假設每個訓練示例的候選標記是由真實標記和隨機選取的不正確的標簽組成的。然而,這種假設是不切實際的,因為候選標簽總是依賴實例的。
在本文中,我們考慮了實例依賴的偏標記學習,并假設每個實例都與每個標記的潛在標記分布相關聯,其中標記分布代表了每個標記描述特征的程度。描述程度越高的不正確標簽更有可能被注釋為候選標簽。因此,潛在標記分布是部分標簽示例中必不可少的標記信息,值得用于預測模型訓練。基于這種考慮,我們提出了一種新的偏標記學習方法,用標記增強 (LE) 恢復標記分布,并在每個階段迭代訓練預測模型。具體地說,我們假設潛在標記分布的真實后驗密度是由推理模型參數化的變分近似狄利克雷密度,利用變分后驗產生的標記分布對預測模型進行訓練。最后在基準測試和真實數據集上進行實驗,驗證了該方法的有效性。
論文標題:
Instance-Dependent Partial Label Learning
論文鏈接:
//www.zhuanzhi.ai/paper/70739bd32a8310f090296cf05f3ba5ae
代碼鏈接:
會議: NeurIPS 2021 論文地址://arxiv.org/abs/2109.14285 圖神經網絡 (GNN) 卓越的性能已經廣受關注,但其預測結果是否值得信賴卻有待探索。之前的研究結果表明,許多現代神經網絡對其預測具有過度自信的現象。然而與之不同的是,我們發現GNN對其預測結果卻呈現出欠自信的現象。因此,要想獲得一個可信的GNN,亟需對其置信度進行校正。 在本文中,我們設計了一種拓撲感知的后處理校正函數,并由此提出了一種新穎的可信賴 GNN 模型。具體來說,我們首先驗證了圖中的置信度分布具有同質性的特點,由此啟發我們再次利用GNN模型來為分類GNN模型學習校正函數(CaGCN)的想法。CaGCN 能夠為每個節點學習到一種從分類 GNN 的輸出到校正后的置信度的唯一轉換,同時這種轉換還能夠保留類間的序關系,從而滿足保存精度的屬性。 此外,我們還將CaGCN應用于自訓練框架,結果表明可以通過對置信度進行校正獲得更可信的偽標簽,從而并進一步提高性能。我們通過大量實驗證明了我們提出的模型在置信度校正方面和在提高分類準確率方面的有效性。 總結(2-1-1): 2種現象:GNN的預測結果具有欠自信現象;好的置信度分布具有同質性現象;
1個模型:CaGCN
1類應用:置信度調整后的GNN可以有效應用于自訓練框架
學習人類可理解的規則模型是可解釋機器學習領域的重要研究方向之一,也和機器學習中的自動特征工程任務和數據挖掘中的子群體發現任務高度相關。傳統規則學習算法多采用啟發式規則生成+規則選擇的兩階段范式,難以直接控制最終規則模型的精度和可解釋性。
來自阿里巴巴達摩院的楊帆等多位研究者首次提出了一個完整的基于次模優化的規則學習算法框架。他們設計了一個具有次模性質的通用目標函數,其可以兼顧規則集合的精度、復雜度和重疊度。
此外,論文作者們進一步發現使用具備理論近似保證的貪心算法優化此目標函數時,生成最大化增益的單條規則的子問題可以被轉化為最大化兩個次模函數的差。基于此發現,作者們設計了一個利用問題次模性質的迭代式算法對子問題進行近似求解。相較于此前方法,該學習算法在精度、可解釋性和計算效率三者間取得了良好平衡,并可能從對次模優化的進一步研究中獲益。
//papers.nips.cc/paper/2021/file/eaa32c96f620053cf442ad32258076b9-Paper.pdf
在各種機器學習和數據分析任務中,學習一個圖的拓撲以揭示數據實體之間的底層關系扮演著重要的角色。在結構化數據在圖上平滑變化的假設下,問題可以表示為正半定錐上的正則凸優化,并用迭代算法求解。經典的方法需要一個顯式凸函數來反映一般的拓撲先驗,例如為增強稀疏性而使用L1懲罰,這限制了學習豐富拓撲結構的靈活性和表達性。基于學習優化(L2O)的思想,我們提出學習從節點數據到圖結構的映射。具體來說,我們的模型首先展開了一個迭代原對偶分裂算法到神經網絡。關鍵結構的近端投影被一個變分自編碼器取代,該編碼器用增強的拓撲特性來改進估計圖。模型以端到端方式訓練,使用成對的節點數據和圖樣本。在合成和真實數據上的實驗表明,在學習具有特定拓撲性質的圖時,我們的模型比經典的迭代算法更有效。
在不依賴下游任務的情況下評估已學習表示的質量仍然是表示學習的挑戰之一。在這項工作中,我們提出了幾何成分分析(GeomCA)算法,基于其幾何和拓撲性質評估表示空間。GeomCA可以應用于任何維度的表示,獨立于生成它們的模型。我們通過分析從各種場景中獲得的表示,如對比學習模型、生成模型和監督學習模型,證明了它的適用性。
我們提出了一個嚴格的方法,使用一組任意相關的弱監督源,以解決多類分類任務時,只有一個非常小的標記數據集可用。我們的學習算法可證明收斂于一個模型,該模型對于一組未標記數據的可行標記的對抗性選擇具有最小的經驗風險,其中標記的可行性是通過對弱監督源的嚴格估計統計量定義的約束來計算的。我們為這種依賴于弱監督來源提供的信息的方法提供了理論保障。值得注意的是,該方法不要求弱監督源具有與多類分類任務相同的標注空間。我們通過實驗證明了我們的方法在各種圖像分類任務中的有效性。
知識圖譜(KG)是一種靈活的結構,能夠描述數據實體之間的復雜關系。目前,大多數KG嵌入模型都是基于負采樣進行訓練的,即模型的目標是最大限度地增加KG內被連接實體的某些相似度,同時最小化被采樣的斷開實體的相似度。負抽樣通過只考慮負實例的子集,降低了模型學習的時間復雜度,這可能會由于抽樣過程的不確定性而無法提供穩定的模型性能。為了避免這一缺陷,我們提出了一種新的KG嵌入高效非采樣知識圖譜嵌入框架(NS-KGE)。其基本思想是在模型學習中考慮KG中的所有負面實例,從而避免負面抽樣。框架可應用于基于平方損失的知識圖譜嵌入模型或其損失可轉換為平方損失的模型。這種非抽樣策略的一個自然副作用是增加了模型學習的計算復雜度。為了解決這一問題,我們利用數學推導來降低非采樣損失函數的復雜度,最終為我們提供了比現有模型更好的KG嵌入效率和精度。在基準數據集上的實驗表明,NS-KGE框架在效率和準確率方面均優于傳統的基于負采樣的模型,該框架適用于大規模知識圖譜嵌入模型。
盡管主動學習在圖像識別方面取得了長足的進步,但仍然缺乏一種專門適用于目標檢測的示例級的主動學習方法。在本文中,我們提出了多示例主動目標檢測(MI-AOD),通過觀察示例級的不確定性來選擇信息量最大的圖像用于檢測器的訓練。MI-AOD定義了示例不確定性學習模塊,該模塊利用在已標注集上訓練的兩個對抗性示例分類器的差異來預測未標注集的示例不確定性。MI-AOD將未標注的圖像視為示例包,并將圖像中的特征錨視為示例,并通過以多示例學習(MIL)方式對示例重加權的方法來估計圖像的不確定性。反復進行示例不確定性的學習和重加權有助于抑制噪聲高的示例,來縮小示例不確定性和圖像級不確定性之間的差距。實驗證明,MI-AOD為示例級的主動學習設置了堅實的基線。在常用的目標檢測數據集上,MI-AOD和最新方法相比具有明顯的優勢,尤其是在已標注集很小的情況下。
代碼地址為//github.com/yuantn/MI-AOD
基于深度學習的半監督學習(SSL)算法在醫學圖像分割方面取得了很有前途的結果,并可以通過利用未標記的數據減輕醫生昂貴的標注。然而,現有文獻中的大多數SSL算法都傾向于通過干擾網絡和/或數據來規約模型訓練。考慮到多/雙任務學習涉及到具有固有的預測擾動的各個級別的信息,我們在這項工作中提出了一個問題:我們能夠顯式地構建任務級別的正則化,而不是隱式地構建用于SSL的網絡和/或數據級別的擾動和轉換嗎?為了回答這個問題,我們首次提出了一個新的雙任務一致性半監督框架。具體地說,我們使用一個雙任務深度網絡來聯合預測一個像素級分割圖和一個幾何感知的目標集表示。通過可微任務轉換層將水平集表示轉換為近似分割映射。同時,我們在水平集導出的分割圖和直接預測的分割圖之間引入了一種雙任務一致性正則化,用于標記和未標記數據。在兩個公共數據集上的大量實驗表明,我們的方法可以通過合并未標記數據極大地提高性能。同時,我們的框架優于最先進的半監督醫學圖像分割方法。代碼可以在//github.com/Luoxd1996/DTC找到。