深度學習最近變得非常流行,因為它在許多復雜的數據驅動應用程序中取得了令人難以置信的成功,比如圖像分類和語音識別。數據庫社區多年來一直致力于數據驅動的應用,因此應該在支持這一新浪潮方面發揮帶頭作用。然而,數據庫和深度學習在技術和應用方面是不同的。在本文中,我們討論了這兩個領域交叉的研究問題。特別地,我們從數據庫的角度討論了對深度學習系統的可能改進,并分析了可能從深度學習技術中受益的數據庫應用。
主題: Deep Learning for Community Detection: Progress, Challenges and Opportunities
摘要: 由于社區代表著相似的觀點,相似的功能,相似的目的等,因此社區檢測在科學查詢和數據分析中都是重要且極其有用的工具。 但是,隨著深度學習技術展示出以令人印象深刻的性能處理高維圖數據的能力日益增強,諸如頻譜聚類和統計推斷之類的經典社區檢測方法正在逐漸被淘汰。 因此,對通過深度學習進行社區發現的當前進展進行調查是及時的。 本文分為三個領域,分別是深度神經網絡,深度圖嵌入和圖神經網絡,本文總結了各個框架中各種框架,模型和算法的貢獻以及當前尚未解決的挑戰以及 未來的研究機會有待探索。
隨著機器學習、圖形處理技術和醫學成像數據的迅速發展,機器學習模型在醫學領域的使用也迅速增加。基于卷積神經網絡(CNN)架構的快速發展加劇了這一問題,醫學成像社區采用這種架構來幫助臨床醫生進行疾病診斷。自2012年AlexNet取得巨大成功以來,CNNs越來越多地被用于醫學圖像分析,以提高臨床醫生的工作效率。近年來,三維(3D) CNNs已被用于醫學圖像分析。在這篇文章中,我們追溯了3D CNN的發展歷史,從它的機器學習的根源,簡單的數學描述3D CNN和醫學圖像在輸入到3D CNNs之前的預處理步驟。我們回顧了在不同醫學領域,如分類、分割、檢測和定位,使用三維CNNs(及其變體)進行三維醫學成像分析的重要研究。最后,我們討論了在醫學成像領域使用3D CNNs的挑戰(以及使用深度學習模型)和該領域可能的未來趨勢。
圖神經網絡是解決各種圖學習問題的有效的機器學習模型。盡管它們取得了經驗上的成功,但是GNNs的理論局限性最近已經被揭示出來。因此,人們提出了許多GNN模型來克服這些限制。在這次調查中,我們全面概述了GNNs的表達能力和可證明的強大的GNNs變體。
最近數據采集工具的技術進步使生命科學家能夠從不同的生物應用領域獲取多模式數據。大致分為三種類型(即序列,圖像和信號),這些數據數量巨大且性質復雜。挖掘如此大量的數據用于模式識別是一項巨大的挑戰,需要復雜的數據密集型機器學習技術。基于人工神經網絡的學習系統以其模式識別能力而聞名,最近它們的深度架構-稱為深度學習(DL)-已成功應用于解決許多復雜的模式識別問題。本文調研了DL在識別生物數據模式中的作用,提供了-DL在生物序列,圖像和信號數據中的應用;這些數據的開放獲取源的概述;適用于這些數據的開源DL工具的描述;并從定性和定量的角度比較這些工具。最后,它概述了挖掘生物數據的一些開放式研究挑戰,并提出了一些可能的未來前景。
在過去的幾年里,深度學習取得了巨大的成功,無論是從政策支持還是科研和工業應用,都是一片欣欣向榮。然而,近期的許多研究發現,深度學習擁有許多固有的弱點,這些弱點甚至可以危害深度學習系統的擁有者和使用者的安全和隱私。深度學習的廣泛使用進一步放大了這一切所造成的后果。為了揭示深度學習的一些安全弱點,協助建立健全深度學習系統,來自中科院信息工程所和中國科學院大學網絡安全學院的研究人員,全面的調查了針對深度學習的攻擊方式,并對這些手段進行了多角度的研究。