深度神經網絡擅長于尋找解決大型數據集上復雜任務的層次表示。我們人類如何理解這些學習得到表示?在這項工作中,我們提出了網絡解剖,一個分析框架,系統地識別在圖像分類和圖像生成網絡中個別隱藏單元的語義。首先,我們分析一個在場景分類方面受過訓練的卷積神經網絡(CNN),并發現匹配不同對象概念集的單元。我們發現網絡已經學習了許多在場景類分類中起關鍵作用的對象類。其次,我們使用類似的分析方法來分析生成對抗網絡(GAN)模型訓練生成場景。通過分析激活或停用小組單元時的變化,我們發現對象可以在適應上下文的同時從輸出場景中添加或刪除。最后,我們將分析框架應用于理解敵對攻擊和語義圖像編輯。
【導讀】這一份最新216頁的ppt概述《深度學習自然語言處理》,包括神經網絡基礎,詞向量表示,序列句子表示,分類標注、生成句子,預訓練。
神經網絡已經成功地完成了許多推理任務。從經驗上看,這些任務需要專門的網絡結構,例如,圖神經網絡(GNNs)在許多這樣的任務中表現良好,而較少結構的網絡會失敗。從理論上講,盡管網絡結構具有相同的表達能力,但人們對網絡結構為什么以及何時比其他網絡結構更能泛化的理解是有限的。本文通過研究網絡的計算結構與相關推理過程的算法結構之間的一致性,建立了一個描述網絡能很好學習哪些推理任務的框架。我們正式定義了這種算法對齊,并推導出一個隨更好的對齊而減小的樣本復雜度界。該框架為流行推理模型的經驗成功提供了一個解釋,并指出了它們的局限性。例如,我們通過一個強大的算法范例——動態規劃(DP),將看似不同的推理任務,如直覺物理、可視化問題回答和最短路徑統一起來。我們證明了gnn與DP是一致的,因此可以解決這些問題。在一些推理任務中,我們的理論得到了實證結果的支持。