深度學習在人工智能領域已經取得了非常優秀的成就,在有監督識別任務中,使用深度學習算法訓練海量的帶標簽數據,可以達到前所未有的識別精確度。但是,由于對海量數據的標注工作成本昂貴,對罕見類別獲取海量數據難度較大,所以如何識別在訓練過程中少見或從未見過的未知類仍然是一個嚴峻的問題。針對這個問題,該文回顧近年來的零樣本圖像識別技術研究,從研究背景、模型分析、數據集介紹、實驗分析等方面全面闡釋零樣本圖像識別技術。此外,該文還分析了當前研究存在的技術難題,并針對主流問題提出一些解決方案以及對未來研究的展望,為零樣本學習的初學者或研究者提供一些參考。
題目: A Survey on Transfer Learning in Natural Language Processing
摘要:
深度學習模型通常需要大量數據。 但是,這些大型數據集并非總是可以實現的。這在許多具有挑戰性的NLP任務中很常見。例如,考慮使用神經機器翻譯,在這種情況下,特別對于低資源語言而言,可能無法整理如此大的數據集。深度學習模型的另一個局限性是對巨大計算資源的需求。這些障礙促使研究人員質疑使用大型訓練模型進行知識遷移的可能性。隨著許多大型模型的出現,對遷移學習的需求正在增加。在此調查中,我們介紹了NLP領域中最新的遷移學習進展。我們還提供了分類法,用于分類文獻中的不同遷移學習方法。
當對大量的標記數據集合(如ImageNet)進行訓練時,深度神經網絡展示了它們在特殊監督學習任務(如圖像分類)上的卓越表現。然而,創建這樣的大型數據集需要大量的資源、時間和精力。這些資源在很多實際案例中可能無法獲得,限制了許多深度學習方法的采用和應用。為了尋找數據效率更高的深度學習方法,以克服對大型標注數據集的需求,近年來,我們對半監督學習應用于深度神經網絡的研究興趣日益濃厚,通過開發新的方法和采用現有的半監督學習框架進行深度學習設置。在本文中,我們從介紹半監督學習開始,對深度半監督學習進行了全面的概述。然后總結了在深度學習中占主導地位的半監督方法。
題目: A Concise Review of Recent Few-shot Meta-learning Methods
摘要:
最近,很少有人嘗試元學習,人們期望它能模仿人類快速適應基于先驗知識的新概念。在這篇簡短的交流中,簡要回顧了近年來有代表性的幾種元學習方法,并根據其技術特點將其分為四個分支。最后,總結了當前元學習面臨的一些重要挑戰和未來的展望。
題目: 基于深度學習的主題模型研究
摘要: 主題模型作為一個發展二十余年的研究問題,一直是篇章級別文本語義理解的重要工具.主題模型善于從一組文檔中抽取出若干組關鍵詞來表達該文檔集的核心思想,因而也為文本分類、信息檢索、自動摘要、文本生成、情感分析等其他文本分析任務提供重要支撐.雖然基于三層貝葉斯網絡的傳統概率主題模型在過去十余年已被充分研究,但隨著深度學習技術在自然語言處理領域的廣泛應用,結合深度學習思想與方法的主題模型煥發出新的生機.研究如何整合深度學習的先進技術,構建更加準確高效的文本生成模型成為基于深度學習主題建模的主要任務.本文首先概述并對比了傳統主題模型中四個經典的概率主題模型與兩個稀疏約束的主題模型.接著對近幾年基于深度學習的主題模型研究進展進行綜述,分析其與傳統模型的聯系、區別與優勢,并對其中的主要研究方向和進展進行歸納、分析與比較.此外,本文還介紹了主題模型常用公開數據集及評測指標.最后,總結了主題模型現有技術的特點,并分析與展望了基于深度學習的主題模型的未來發展趨勢。
摘要:圖像分類的應用場景非常廣泛,很多場景下難以收集到足夠多的數據來訓練模型,利用小樣本學習進行圖像分類可解決訓練數據量小的問題.本文對近年來的小樣本圖像分類算法進行了詳細綜述,根據不同的建模方式,將現有算法分為卷積神經網絡模型和圖神經網絡模型兩大類,其中基于卷積神經網絡模型的算法包括四種學習范式:遷移學習、元學習、對偶學習和貝葉斯學習;基于圖神經網絡模型的算法原本適用于非歐幾里得結構數據,但有部分學者將其應用于解決小樣本下歐幾里得數據的圖像分類任務,有關的研究成果目前相對較少.此外,本文匯總了現有文獻中出現的數據集并通過實驗結果對現有算法的性能進行了比較.最后,討論了小樣本圖像分類技術的難點及未來研究趨勢.
最近深度神經網絡已經在監督識別任務上取得了令人振奮的突破,但是深度神經網絡要求每個類都有足夠 多的且完全標注的訓練數據。如何從少數訓練樣本中學習并識別新的類別,對于深度神經網絡來說是一個具有挑戰性的問題。針對如何解決少樣本學習的問題,全面總結了現有的基于深度神經網絡的少樣本學習方法,涵蓋了方法 所用模型、數據集及評估結果等各個方面。具體地,針對基于深度神經網絡的少樣本學習方法,提出將其分為四種 類別,即數據增強方法、遷移學習方法、度量學習方法和元學習的方法;對于每個類別,進一步將其分為幾個子類 別,并且在每個類別與方法之間進行一系列比較,以顯示各種方法的優劣和各自的特點。最后,強調了現有方法的局限性,并指出了少樣本學習研究領域的未來研究方向。
摘要:近年來,深度學習模型在圖像、語音、文本識別等領域內取得了顯著成就。然而,深度學習模型嚴重依賴于大量標簽數據,使得其在數據缺乏的特殊領域內應用嚴重受限。面對數據缺乏等現實挑戰,很多學者針對數據依賴小的弱監督機器學習方法開展研究,出現了很多典型研究方向,如小樣本學習、零樣本學習等。針對弱監督機器學習方法,系統闡述了小樣本學習、零樣本學習、零—小樣本學習的問題定義、當前主要方法以及主流實驗設計,最后基于當前研究中出現的問題,對下一階段研究方向進行了總結展望。
簡介: 近幾年來, 深度學習在機器學習研究領域中取得了巨大的突破, 深度學習能夠很好地實現復雜問題的學習, 然而, 深度學習最大的弊端之一, 就是需要大量人工標注的訓練數據, 而這需要耗費大量的人力成本. 因此, 為了緩解深度學習存在的這一問題, Palatucci 等于 2009 年提出了零樣本學習 (Zero-shot learning). 零樣本學習是遷移學習的一種特殊場景, 在零樣本學習過程中, 訓練類集和測試類集之間沒有交集, 需要通過訓練類與測試類之間的知識遷移來完成學習, 使在訓練類上訓練得到的模型能夠成功識別測試類輸入樣例的類標簽. 零樣本學習的意義不僅在于可以對難以標注的樣例進行識別, 更在于這一方法模擬了人類對于從未見過的對象的認知過程, 零樣本學習方法的研究, 也會在一定程度上促進認知科學的研究. 鑒于零樣本學習的應用價值、理論意義和未來的發展潛力, 文中系統綜述了零樣本學習的研究進展, 首先概述了零樣本學習的定義, 介紹了 4 種典型的零樣本學習模型, 并對零樣本學習存在的關鍵問題及解決方法進行了介紹, 對零樣本學習的多種模型進行了分類和闡述, 并在最后指明了零樣本學習進一步研究中需要解決的問題以及未來可能的發展方向。
作者簡介:
劉建偉,男。中國石油大學博士生導師/碩士生導師。曾任加拿大溫哥華英屬哥倫比亞大學訪問學者,加拿大滑鐵盧大學高級訪問學者。講授模式識別專題(博士生),可編程序控制器原理及其應用,模式識別與機器學習導論等課程。
長期從事模式識別與智能系統、復雜系統分析與智能控制、機器學習和數據挖掘方面的研究工作。美國數學會《數學評論》評論員,中國人工智能學會機器學習分會高級會員。在計算機學報,自動化學報、計算機研究與發展、電子學報、TNNLS、Neurocomputing等期刊上和國內國際會議上發表學術研究論文180多篇,其中三大檢索100多篇。
近年來,零樣本學習(ZSL,zero-shot learning)已經在大量的任務中受到了廣泛的關注。大多數機器學習方法,均側重于那些訓練集中廣泛存在的樣本進行分類。但現實場景中,許多的任務需要對從未見過的樣本進行分類。零樣本學習是一種非常強大的學習范式,本篇綜述,首先,概述了零樣本學習,根據學習過程中使用到的數據模型,我們將其劃分為三種學習類型;第二,描述了零樣本學習過程中所采用的不同語義空間;第三,對現有零樣本學習方法進行了分類,并在每個類別下介紹了具有代表性的方法;第四,討論了零樣本學習的不同應用方向;最后,我們介紹了零樣本學習的未來研究方向。
“機器會思考嗎”和“機器能做人類做的事情嗎”是推動人工智能發展的任務。盡管最近的人工智能在許多數據密集型應用中取得了成功,但它仍然缺乏從有限的數據示例學習和對新任務的快速泛化的能力。為了解決這個問題,我們必須求助于機器學習,它支持人工智能的科學研究。特別地,在這種情況下,有一個機器學習問題稱為小樣本學習(Few-Shot Learning,FSL)。該方法利用先驗知識,可以快速地推廣到有限監督經驗的新任務中,通過推廣和類比,模擬人類從少數例子中獲取知識的能力。它被視為真正人工智能,是一種減少繁重的數據收集和計算成本高昂的培訓的方法,也是罕見案例學習有效方式。隨著FSL研究的廣泛開展,我們對其進行了全面的綜述。我們首先給出了FSL的正式定義。然后指出了FSL的核心問題,將問題從“如何解決FSL”轉變為“如何處理核心問題”。因此,從FSL誕生到最近發表的作品都被歸為一個統一的類別,并對不同類別的優缺點進行了深入的討論。最后,我們從問題設置、技術、應用和理論等方面展望了FSL未來可能的發展方向,希望為初學者和有經驗的研究者提供一些見解。