我們目前正處于一場數據革命之中。在科學、健康甚至日常生活中產生的海量和不斷增長的數據集將影響社會的許多領域。許多這樣的數據集不僅大,而且是高維的,每個數據點可能包含數百萬甚至數十億個數字。以成像為例,一張圖像可能包含數百萬個或更多的像素;一段視頻可能很容易包含10億個“體素”。為什么在高維空間學習具有挑戰性,這是有根本原因的(“維度詛咒”)。跨越信號處理、統計和優化的一個基本挑戰是在高維數據集中利用低維結構。低維信號建模推動了理論和應用領域的發展,從醫學和科學成像,到低功耗傳感器,再到生物信息學數據集的建模和解釋,這只是其中的一小部分。然而,大量的現代數據集帶來了額外的挑戰:隨著數據集的增長,數據收集技術變得越來越不受控制,經常會遇到嚴重錯誤或惡意破壞,以及非線性。傳統的技術在這種情況下完全崩潰,需要新的理論和算法。
為了應對這些挑戰,在過去的二十年里,高維空間中低維結構的研究取得了爆炸性的發展。在很大程度上,代表性低維模型的幾何和統計性質(如稀疏和低秩及其變體和擴展)現在已經被很好地理解。在何種條件下,這些模型可以有效地和高效地從(最小數量的抽樣)數據恢復已經明確的特征。為了從高維數據中恢復這種低維模型,人們開發了許多高效、可擴展的算法。這些算法的工作條件、數據和計算復雜度也得到了全面而精確的刻畫。這些新的理論成果和算法已經徹底改變了數據科學和信號處理的實踐,并對傳感、成像和信息處理產生了重大影響。另一方面,最近深度神經網絡和低維模型之間在學習表示、網絡架構和優化策略等多個層次上出現了強大的聯系。這種連接不僅有助于解釋深度學習中許多有趣的現象,而且為更好的網絡設計、優化、魯棒性和在監督和無監督場景下的深度網絡泛化提供了新的指導原則。
作為這樣的歷史進步的見證人,我們相信這是一個正確的時機,將這個新的知識體系交付給信號處理社區的下一代學生和研究人員。通過過去20年令人振奮的研究進展,信號處理界已經見證了稀疏和低維模型的力量。然而,與此同時,社區仍然處于擁抱現代機器學習的力量的過渡階段,尤其是深度學習,在建模和可解釋性方面面臨前所未有的新挑戰。與過去關于壓縮感知、凸優化和相關主題的教程相比,本教程(以及相關的書籍、練習和課程材料)的獨特之處在于,它將信號處理的基礎數學模型與非凸優化和深度學習的當代主題連接起來。目的是展示(i)這些低維模型和原理如何為制定問題和理解方法的行為提供一個有價值的視角,以及(ii)來自非凸性和深度學習的思想如何幫助這些核心模型實用于具有非線性數據和觀測模型、測量非理想性等的現實問題。
本課程首先介紹基本的線性低維模型(例如,基本的稀疏和低秩模型)和凸松弛方法,以及激勵工程應用,隨后介紹一套可擴展和有效的優化方法。基于此,從對稱和幾何角度介紹了若干基本學習和逆問題(如字典學習和稀疏盲反卷積)的非線性低維模型、非凸方法及其正確性保證和高效的非凸優化方法。在這些結果的基礎上,我們繼續討論低維結構和深度模型之間強大的概念、算法和理論聯系,為理解最先進的深度模型提供了新的視角,并為設計用于學習低維結構的深度網絡提供了新的原則,具有明確的可解釋性和實際效益。
人工智能在現代社會中扮演著越來越重要的角色,因為曾經由人類做出的決策現在被委托給了自動化系統。這些系統目前負責決定銀行貸款、罪犯監禁和雇傭新員工,不難想象,很快它們將成為社會大多數決策基礎設施的基礎。盡管這項任務的風險很高,但人們仍然缺乏對這類系統的一些基本屬性的正式理解,包括公平性、問責制和透明度等問題。在本教程中,我們將介紹因果公平分析的框架,目的是填補這一空白,即理解、建模,并可能解決決策設置中的公平問題。我們的方法的主要見解將是將觀察到的數據中存在的差異的量化與最初產生差異的潛在的、往往未被觀察到的因果機制聯系起來。我們將研究分解變化的問題,這將導致構建公平的實證措施,將這種變化歸因于產生它們的因果機制。這種將差異歸因于特定因果機制的做法,將使我們能夠提出一個正式而實用的框架,以評估不同處理和影響的法律理論,同時考慮到業務的必要性。最后,通過新開發的框架,我們將得出與以往文獻的重要聯系,在因果推理領域內外。這一努力將在“公平地圖”中達到高潮,這是第一個根據其因果屬性(包括可接受性、可分解性和權力)對公平的多個衡量標準進行銜接和系統分類的工具。我們希望這一套新的原則、措施和工具可以幫助指導AI研究人員和工程師分析和/或開發與社會目標、期望和愿望一致的決策系統。
現代深度學習已經在多個學科中帶來了許多發現:計算機視覺、語音識別、自然語言處理技術以及純粹通過自我游戲學習游戲的能力。這在很大程度上是由獲取大量數據的能力以及與問題域匹配的適當的歸納偏差所驅動的。在本教程中,我們將探討這一新興技術與信息論的相互作用。特別地,我們將討論兩個主題。
(1) 深度學習在信息論中的應用:信息論學界在編碼設計和解碼算法方面率先取得了幾項突破,徹底改變了現代數字通信。在這一主題中,我們將研究是否有可能利用現代深度學習技術來加速這種編碼方案的發現。我們將介紹這一領域的各種發展,展示Viterbi和BCJR算法可以從觀測數據中“學習”,以及如何為高密度編碼學習比消息傳遞更好的算法。此外,經過充分研究的信道編碼設置,我們基本上可以獲得無限數量的訓練數據,并且在一些設置中已經知道了接近最優的編碼策略,可以提供一個視角,通過它可以改進和增強目前的深度學習技術。除了代碼設計,深度學習作為一種通用函數逼近器在信息論中有更廣泛的應用潛力。我們將談到這個大致的概念。事實上,最近的一些研究已經將深度學習用于(條件)獨立檢驗、互信息估計、壓縮感知以及多假設檢驗中的誤發現率控制。
(2)在第二個主題中,我們將對信息論原理在理解和設計深度學習系統中的應用進行調研。這些工作大致可分為三類:(a)代表性(b)可學習性。(A)事實上,深度學習的一個基本結果是緊密逼近任何連續函數的能力。有幾個現代的表示定理的概括理解的數量和深度這樣的網絡需要近似各種函數類,以及一些不變的性質。我們將調研這些結果。(B)有一些新興的工作,包括張量方法,在一些數學假設下為神經網絡和混合專家提供了各種可學習性保證。
摘要
深度學習(Deep Learning, DL)是當前計算機視覺領域應用最廣泛的工具。它精確解決復雜問題的能力被用于視覺研究,以學習各種任務的深度神經模型,包括安全關鍵應用。然而,現在我們知道,DL很容易受到對抗性攻擊,這些攻擊可以通過在圖像和視頻中引入視覺上難以察覺的擾動來操縱它的預測。自2013年~[1]發現這一現象以來,引起了機器智能多個子領域研究人員的極大關注。在[2]中,我們回顧了計算機視覺社區在深度學習的對抗性攻擊(及其防御)方面所做的貢獻,直到2018年到來。這些貢獻中有許多啟發了這一領域的新方向,自見證了第一代方法以來,這一領域已顯著成熟。因此,作為[2]的后續成果,本文獻綜述主要關注自2018年以來該領域的進展。為了確保文章的真實性,我們主要考慮計算機視覺和機器學習研究的權威文獻。除了全面的文獻綜述外,本文還為非專家提供了該領域技術術語的簡明定義。最后,本文在文獻綜述和[2]的基礎上,討論了該方向面臨的挑戰和未來的展望。
//www.zhuanzhi.ai/paper/884c8b91ceec8cdcd9d3d0cc7bd2cf85
引言
深度學習(DL)[3]是一種數據驅動技術,可以在大數據集上精確建模復雜的數學函數。它最近為科學家在機器智能應用方面提供了許多突破。從DNA[4]的突變分析到腦回路[5]的重建和細胞數據[6]的探索; 目前,深度學習方法正在推進我們對許多前沿科學問題的知識。因此,機器智能的多個當代子領域迅速采用這種技術作為“工具”來解決長期存在的問題也就不足為奇了。隨著語音識別[7]和自然語言處理[8],計算機視覺是目前嚴重依賴深度學習的子領域之一。
計算機視覺中深度學習的興起是由Krizhevsky等人在2012年的開創性工作觸發的,他們報告了使用卷積神經網絡(CNN)[11]在硬圖像識別任務[10]上的記錄性能改善。自[9]以來,計算機視覺社區對深度學習研究做出了重大貢獻,這導致了越來越強大的神經網絡[12]、[13]、[14],可以在其架構中處理大量層——建立了“深度”學習的本質。計算機視覺領域的進步也使深度學習能夠解決人工智能(AI)的復雜問題。例如,現代人工智能的一個最高成就,即tabula-rasa learning[15],很大程度上要歸功于源于計算機視覺領域的殘差學習[12]。
由于深度學習[15]的(明顯)超人類能力,基于計算機視覺的人工智能被認為已經達到部署在安全和安保關鍵系統所需的成熟度。汽車自動駕駛[18],ATM的面部識別[19]和移動設備的面部識別技術[20]都是一些早期的真實世界的例子,描繪了現代社會對計算機視覺解決方案的發展信念。隨著高度活躍的基于深度學習的視覺研究,自動駕駛汽車[21],人臉識別[22],[23],機器人[24]和監控系統[25]等,我們可以預見,深度學習在關鍵安全計算機視覺應用中的無處不在。然而,由于深度學習[1]的對抗漏洞的意外發現,人們對這種前景產生了嚴重的擔憂。
Szegedy等人[1]發現,深度神經網絡預測可以在極低量級輸入擾動下被操縱。對于圖像而言,這些擾動可以限制在人類視覺系統的不可感知范圍內,但它們可以完全改變深度視覺模型的輸出預測(見圖1)。最初,這些操縱信號是在圖像分類任務[1]中發現的。然而,它們的存在現在已被公認為各種主流計算機視覺問題,如語義分割[27],[28];目標檢測[29],[30];目標跟蹤[31],[32]。文獻強調了對抗式干擾的許多特征,這使它們對作為實用技術的深度學習構成了真正的威脅。例如,可以反復觀察到,受攻擊的模型通常對操縱圖像[2],[17]的錯誤預測具有很高的置信度。同樣的微擾常常可以欺騙多個模型[33],[34]。文獻也見證了預先計算的擾動,稱為普遍擾動,可以添加到“任何”圖像,以高概率[35],[36]欺騙給定模型。這些事實對關鍵安全應用有著深遠的影響,特別是當人們普遍認為深度學習解決方案具有超越人類能力[15],[37]的預測能力時。
由于其重要性,對抗性攻擊(及其防御)的話題在過去五年中受到了研究團體的相當大的關注。在[2]中,我們調研了這個方向的貢獻,直到2018年到來。這些工作中的大多數可以被視為第一代技術,探索核心算法和技術,以欺騙深度學習或防御它的對抗性攻擊。其中一些算法激發了后續方法的靈感,進一步改進和適應核心攻擊和防御技術。這些第二代方法也被發現更多地關注其他視覺任務,而不僅僅是分類問題,這是這一方向早期貢獻的主要興趣主題。
自2018年以來,該研究方向的論文發表數量不斷增加(見圖2-a,b)。當然,這些出版物也包括文獻綜述的實例,如[38],[39],[40],[41],[42]。我們在這里提供的文獻綜述在許多方面不同于現有的綜述。這篇文章的獨特之處在于它是2的繼承。隨后的調研,如[41],通常緊跟[2];或者針對特定問題在[2]上建立[42]。近年來,這一方向在計算機視覺領域已經顯著成熟。通過構建[2]和后續文獻的見解,我們能夠為這一快速發展的研究方向提供更精確的技術術語定義。這也導致了本文所回顧的文獻的更連貫的結構,為此我們提供了基于研究團體當前對術語的理解的簡明討論。此外,我們關注出現在著名的計算機視覺和機器學習研究出版刊物的論文。專注于領先的貢獻使我們能夠為計算機視覺和機器學習研究人員提供一個更清晰的方向展望。更不用說,本文回顧了這個快速發展領域的最新貢獻,以提供迄今為止在這個方向上最全面的回顧。
本文的其余部分組織如下。在第二節中,我們提供了本文其余部分中使用的技術術語的定義。在第三節中,我們闡述了對抗性攻擊這一更廣泛的問題。第一代攻擊將在第四節中討論,接下來是第五節中關注分類問題的最近的攻擊。我們在第六節中關注分類問題之外的最近的攻擊,在第七節中關注針對物理世界的量身定制的攻擊。更多側重于存在對抗性例子的理論方面的貢獻將在第九節中討論。最近的防御方法是第十部分的主題。文章對第十一部分的文獻趨勢進行了反思,并對這一研究方向的前景和未來方向進行了討論。最后,我們在第十二節結束。
人類具有不斷從經驗中學習的非凡能力。我們不僅可以把以前學到的知識和技能運用到新的情況下,我們也可以把這些作為以后學習的基礎。人工智能(AI)的宏偉目標之一是構建一個人工的“持續學習”代理,通過自主增量開發越來越復雜的知識和技能,從自身經驗構建對世界的復雜理解(Parisi, 2019年)。然而,盡管有早期的推測和很少的先前工作(Ring, 1998; Thrun, 1998; Carlson, 2010),很少有研究和努力致力于解決這一愿景。當前人工智能系統深受新數據或新環境的影響,這些新數據或新環境與他們所接受的訓練稍有不同(Goodfellow, 2013)。此外,學習過程通常被限制在限定和孤立的任務內的固定數據集,這可能很難導致出現更復雜和自主的智能行為。從本質上講,持續學習和適應能力,雖然經常被認為是每一個智能代理的基本支柱,但大多被排除在主要的人工智能研究重點之外。
在本教程中,我們提出根據機器學習研究和人工智能深度架構(Lomonaco, 2019)的最新進展總結這些想法的應用。從一個動機和一個簡短的歷史開始,我們將最近的持續學習進展與之前在相關主題上的研究努力聯系起來,并總結了主要方法、基準和關鍵結果方面的最新進展。在教程的第二部分,我們計劃涵蓋更多關于低監督信號的持續學習的探索性研究,以及與其他范式的關系,如無監督,半監督和強化學習。我們還將強調神經科學的最新發現對原始持續學習算法設計的影響,以及它們在現實應用中的部署。最后,我們將強調持續學習的概念,作為可持續機器學習的關鍵技術推動者及其社會影響,并概述有趣的研究問題和未來值得解決的方向。
地址:
本書涵蓋了用于高維數據分析的新的數學原理(統計和幾何)、可擴展(凸和非凸)優化方法,以及重要的應用,如科學成像、寬帶通信、人臉識別、3D視覺和深度網絡。這本書將被用作數據科學、信號處理、優化和機器學習領域的研究生入門教科書。它已被用于課程EECS 290(伯克利)和ELEN 6886(哥倫比亞)。
在過去的二十年里,高維空間中低維結構的研究有了巨大的發展。在很大程度上,具有代表性的低維模型(如稀疏和低秩以及它們的變體和擴展)的幾何和統計特性現在已經很好地理解了。在何種條件下,這些模型可以有效地和高效地從(最小采樣量)數據中恢復,已經清楚地描述了。為了從高維數據中恢復低維模型,已經開發了許多高效和可擴展的算法。對這些算法的工作條件和計算復雜性也進行了詳細的描述。這些新理論結果和算法已經徹底改變了科學和信號處理的實踐數據, 并對傳感、成像和信息處理產生了重要的影響。在科學成像、圖像處理、計算機視覺、生物信息學、信息檢索和機器學習等領域,我們已取得了顯著的技術進步。正如我們將從本書中介紹的應用程序中看到的,其中一些發展似乎違背了傳統智慧。
見證了這一歷史性的進步,我們認為,現在是全面研究這一新知識體系并在統一的理論和計算框架下組織這些豐富成果的時候了。關于壓縮感知和稀疏模型的數學原理,已有許多優秀的書籍。然而,本書的目標是通過真正有效的計算,彌合低維模型在高維數據分析中的原理和應用之間的差距:
本書結構
這本書的主體包括三個相互關聯的部分: 原理、計算和應用(PCA)。本書還對相關的背景知識做了附錄。
第一部分: 原理(2-7章)提出了稀疏、低秩和一般低維模型的基本性質和理論結果。它描述了在保證正確性或精度的情況下,恢復這種低維結構的逆問題變得易于處理并且能夠有效地解決的條件。
第二部分: 計算(第8章和第9章)介紹了凸和非凸優化的方法,以開發用于恢復低維模型的實用算法。這些方法展示了如何系統地提高算法效率和降低整體計算復雜度,從而使生成的算法快速、可擴展到大尺寸和高維數據的強大思想。
第三部分: 應用(10到16章)演示了如何前面兩部分的原理和計算方法可能價格不能提高解決各種現實問題和實踐。這些應用還指導如何適當地定制和擴展本書中介紹的理想化的模型和算法,以包含關于應用的其他領域特定知識(先驗或約束)。
最后的附錄(A-E)在書的最后是為了使這本書很大程度上是獨立的。