題目: A simple baseline for bayesian uncertainty in deep learning
摘要:
本文提出了一種簡單、可擴展、通用的面向深度學習的不確定性表示和標定方法SWA-Gaussian (SWAG)。隨機加權平均(SWA)是一種計算隨機梯度下降(SGD)的第一次迭代的改進學習速率調度方法,最近被證明可以提高深度學習的泛化能力。在SWAG中,我們以SWA解作為第一個矩來擬合高斯分布,并從SGD迭代中得到一個低秩加對角協方差,形成了一個近似的后驗分布;然后我們從這個高斯分布中取樣,進行貝葉斯模型平均。根據SGD迭代的平穩分布結果,我們發現SWAG近似真實后驗的形狀。此外,我們證明了SWAG在各種計算機視覺任務上表現良好,包括樣本外檢測、校準和遷移學習,與許多流行的替代方案相比,包括MC dropout、KFAC拉普拉斯和溫度標度。
作者:
Wesley Maddox是紐約大學數據科學專業的博士生,研究方向是統計機器學習、貝葉斯深度學習、高斯過程和生成模型。正在研究在機器學習模型(如神經網絡)中加入和利用不確定性的方法。
Pavel Izmailov是紐約大學計算機科學的博士生,研究方向主要包括深度學習中的損失面分析、優化和正則化,對深度半監督學習、貝葉斯深度學習、生成模型、高斯過程等課題也很感興趣。
題目: Bayesian Neural Networks With Maximum Mean Discrepancy Regularization
摘要: 貝葉斯神經網絡(BNNs)訓練來優化整個分布的權重,而不是一個單一的集合,在可解釋性、多任務學習和校準等方面具有顯著的優勢。由于所得到的優化問題的難解性,大多數BNNs要么通過蒙特卡羅方法采樣,要么通過在變分近似上最小化一個合適的樣本下界(ELBO)來訓練。在這篇論文中,我們提出了后者的一個變體,其中我們用最大平均偏差(MMD)估計器代替了ELBO項中的Kullback-Leibler散度,這是受到了最近的變分推理工作的啟發。在根據MMD術語的性質提出我們的建議之后,我們接著展示了公式相對于最先進的公式的一些經驗優勢。特別地,我們的BNNs在多個基準上實現了更高的準確性,包括多個圖像分類任務。此外,它們對權重上的先驗選擇更有魯棒性,而且它們的校準效果更好。作為第二項貢獻,我們提供了一個新的公式來估計給定預測的不確定性,表明與更經典的標準(如微分熵)相比,它在對抗攻擊和輸入噪聲的情況下表現得更穩定。
題目: Time Series Data Augmentation for Deep Learning: A Survey
摘要:
近年來,深度學習在許多時間序列分析任務中表現優異。深度神經網絡的優越性能很大程度上依賴于大量的訓練數據來避免過擬合。然而,許多實際時間序列應用的標記數據可能會受到限制,如醫學時間序列的分類和AIOps中的異常檢測。數據擴充是提高訓練數據規模和質量的有效途徑,是深度學習模型在時間序列數據上成功應用的關鍵。本文系統地綜述了時間序列的各種數據擴充方法。我們為這些方法提出了一個分類,然后通過強調它們的優點和局限性為這些方法提供了一個結構化的審查。并對時間序列異常檢測、分類和預測等不同任務的數據擴充方法進行了實證比較。最后,我們討論并強調未來的研究方向,包括時頻域的數據擴充、擴充組合、不平衡類的數據擴充與加權。
【導讀】紐約大學的Andrew Gordon Wilson和Pavel Izmailov在論文中從概率角度的泛化性對貝葉斯深度學習進行了探討。貝葉斯方法的關鍵區別在于它是基于邊緣化,而不是基于最優化的,這為它帶來了許多優勢。
貝葉斯方法的關鍵區別是邊緣化,而不是使用單一的權重設置。貝葉斯邊緣化可以特別提高現代深度神經網絡的準確性和校準,這是典型的不由數據完全確定,可以代表許多令人信服的但不同的解決方案。我們證明了深度集成為近似貝葉斯邊緣化提供了一種有效的機制,并提出了一種相關的方法,通過在沒有顯著開銷的情況下,在吸引域邊緣化來進一步改進預測分布。我們還研究了神經網絡權值的模糊分布所隱含的先驗函數,從概率的角度解釋了這些模型的泛化性質。從這個角度出發,我們解釋了那些對于神經網絡泛化來說神秘而獨特的結果,比如用隨機標簽來擬合圖像的能力,并證明了這些結果可以用高斯過程來重現。最后,我們提供了校正預測分布的貝葉斯觀點。
題目
生成式對抗網絡先驗貝葉斯推斷,Bayesian Inference with Generative Adversarial Network Priors
關鍵字
生成對抗網絡,貝葉斯推斷,深度學習,人工智能,計算物理學,圖像處理
簡介
當兩者通過物理模型鏈接時,貝葉斯推斷被廣泛用于根據相關場的測量來推斷并量化感興趣場的不確定性。盡管有許多應用,貝葉斯推理在推斷具有大維離散表示和/或具有難以用數學表示的先驗分布的字段時仍面臨挑戰。在本手稿中,我們考慮使用對抗性生成網絡(GAN)來應對這些挑戰。 GAN是一種深層神經網絡,具有學習給定字段的多個樣本所隱含的分布的能力。一旦對這些樣本進行了訓練,GAN的生成器組件會將低維潛矢量的iid組件映射到目標場分布的近似值。在這項工作中,我們演示了如何將這種近似分布用作貝葉斯更新中的先驗,以及它如何解決與表征復雜的先驗分布和推斷字段的大范圍相關的挑戰。我們通過將其應用于熱噪聲問題中的熱傳導問題中的推斷和量化初始溫度場中的不確定性的問題,論證了該方法的有效性,該問題由稍后的溫度噪聲測量得出。
作者
Dhruv Patel, Assad A Oberai
題目: Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision
摘要: 雖然深度神經網絡(DNNs)已經成為計算機視覺領域的熱門研究方向,但這些模型中的絕大多數都未能正確地捕捉到預測中的不確定性。估計這種預測的不確定性是至關重要的,例如不真實的應用。在貝葉斯深度學習中,預測不確定性通常被分解為任意和認知不確定性的不同類型。前者可以通過讓DNN輸出一定概率分布的參數來估計。認知不確定性估計是一個非常具有挑戰性的問題,雖然最近出現了不同的可擴展方法,但在現實環境中并沒有進行廣泛的比較。因此,我們接受了這一任務,并提出了一個可擴展的認知不確定性估計方法的綜合評估框架。我們提出的框架是專門為測試真實世界中計算機視覺應用所需的不確定性而設計的。我們還應用這一框架來提供兩種當前最先進的可伸縮方法:ensembling和MC-dropout的第一個適當的結論性比較。我們的比較表明,集合一致地提供了更可靠和實際有用的不確定性估計。
作者簡介: Fredrik K. Gustafsson,烏普薩拉大學博士,研究集中在自主駕駛和醫學影像的不確定性感知深度學習。個人主頁://www.fregu856.com/
報告題目: Bayesian Deep Learning
報告摘要: 深度神經網絡是連接主義系統,通過它通過學習例子來完成任務,而不需要事先了解這些任務。它們可以很容易地擴展到數百萬個數據點,并且可以通過隨機梯度下降進行優化。貝葉斯方法可以用于學習神經網絡權重的概率分布。貝葉斯深度學習與貝葉斯深度學習(如何對DNNs進行貝葉斯推理?如何學習分層結構的貝葉斯模型?),本篇報告給出一定解釋。
嘉賓介紹: 朱軍博士是清華大學計算機系長聘副教授、智能技術與系統國家重點實驗室副主任、卡內基梅隆大學兼職教授。2013年,入選IEEE Intelligent Systems的“人工智能10大新星”(AI’s 10 to Watch)。他主要從事機器學習研究,在國際重要期刊與會議發表學術論文80余篇。擔任國際期刊IEEE TPAMI和Artificial Intelligence的編委、國際會議ICML 2014地區聯合主席、以及ICML、NIPS等國際會議的領域主席。
課程名稱: Deep Learning and Bayesian Methods
課程介紹: 在Deep|Bayes暑期學校,我們將討論如何將Bayes方法與Deep Learning相結合,并在機器學習應用程序中帶來更好的結果。 最近的研究證明,貝葉斯方法的使用可以通過各種方式帶來好處。 學校參與者將學習對理解當前機器學習研究至關重要的方法和技術。 他們還將具有使用概率模型來構建神經生成和判別模型的動手經驗,學習神經網絡的現代隨機優化方法和正則化技術,并掌握推理神經網絡及其權重不確定性的方法,預測。
部分邀請嘉賓: Maurizio Filippone,AXA計算統計主席,EURECOM副教授
Novi Quadrianto,薩塞克斯大學助理教授
課程大綱:
報告主題: Bayesian Deep Learning for Medical
報告摘要: 在過去的幾年中,深度學習取得了飛速的發展,從而在許多醫學圖像分析任務中取得了顯著的性能改善,包括解剖標志的檢測,病理結果的分類,多個器官的語義分割以及醫學報告的自動生成。雖然深度學習的大部分工作都集中在提高最終性能上,但是了解深度網絡何時無法正常運行對于許多醫療和保健系統(尤其是那些具有較高安全標準的系統)至關重要。不幸的是,大多數現代深度學習算法無法可靠地估計深度網絡的不確定性。如果沒有用于模型高度不確定的故障安全模式,則系統可能會具有災難性的行為,例如缺少明顯的異常或包含種族歧視。
最近,人們對將貝葉斯方法與深度神經網絡相結合以估計模型預測的置信度越來越感興趣。盡管傳統方法將深度網絡視為確定性功能,但該功能只能為輸入生成單個輸出。相反,貝葉斯深度學習通過考慮訓練數據和建模參數固有的隨機性來計算每個輸入的輸出分布。這種分布可以估算輸出的置信度。已經證明,基于隨機正則化技術(例如丟包或可伸縮的蒙特卡洛干擾)的新方法可以捕獲有意義的不確定性,同時可以很好地縮放至高維數據。根據深度學習對貝葉斯技術的重新研究已經產生了許多有希望的結果。
盡管它很重要,但在MICCAI社區中,對該主題的研究仍很少。本教程的目的是通過從理論,實踐和未來方向方面全面介紹貝葉斯深度學習方法來彌合差距。該教程將邀請貝葉斯深度學習領域的領先研究人員介紹其最新技術,并深入說明該技術如何應用于選定的一組主題圖像檢測,分割和放射治療。最近在2018年神經信息處理系統會議上舉行的貝葉斯深度學習研討會吸引了大量論文和受眾。我們的教程有望對MICCAI產生相似的興趣。
報告流程:
邀請嘉賓:
Dan Nguyen,德克薩斯大學西南醫學中心助理教授。
Pengyu“ Ben” Yuan,休斯頓大學算法(HULA)實驗室的博士。他的研究興趣是元學習和強化學習及其在醫學圖像分析中的應用。
報告主題:UGLLI Face Alignment: Estimating Uncertainty with Gaussian Log-Likelihood Loss
報告摘要:現代人臉對齊方法在預測人臉界標的位置方面已經非常準確,但通常不會估算其預測位置的不確定性。 我們提出了一個新穎的框架,用于使用高斯對數似然損失將臉部界標位置和相關的不確定性建模為二維高斯分布。 我們對不確定性和地標位置的聯合估計不僅可以得出對預測的地標位置的不確定性的最新估計,而且可以對地標位置(面部對齊)產生最新的估計。 我們對地標預測位置不確定性的方法估計可用于自動識別面部對齊失敗的輸入圖像,這對下游任務可能至關重要。