最近數據采集工具的技術進步使生命科學家能夠從不同的生物應用領域獲取多模式數據。大致分為三種類型(即序列,圖像和信號),這些數據數量巨大且性質復雜。挖掘如此大量的數據用于模式識別是一項巨大的挑戰,需要復雜的數據密集型機器學習技術。基于人工神經網絡的學習系統以其模式識別能力而聞名,最近它們的深度架構-稱為深度學習(DL)-已成功應用于解決許多復雜的模式識別問題。本文調研了DL在識別生物數據模式中的作用,提供了-DL在生物序列,圖像和信號數據中的應用;這些數據的開放獲取源的概述;適用于這些數據的開源DL工具的描述;并從定性和定量的角度比較這些工具。最后,它概述了挖掘生物數據的一些開放式研究挑戰,并提出了一些可能的未來前景。
主題: Deep Learning for Community Detection: Progress, Challenges and Opportunities
摘要: 由于社區代表著相似的觀點,相似的功能,相似的目的等,因此社區檢測在科學查詢和數據分析中都是重要且極其有用的工具。 但是,隨著深度學習技術展示出以令人印象深刻的性能處理高維圖數據的能力日益增強,諸如頻譜聚類和統計推斷之類的經典社區檢測方法正在逐漸被淘汰。 因此,對通過深度學習進行社區發現的當前進展進行調查是及時的。 本文分為三個領域,分別是深度神經網絡,深度圖嵌入和圖神經網絡,本文總結了各個框架中各種框架,模型和算法的貢獻以及當前尚未解決的挑戰以及 未來的研究機會有待探索。
深度學習方法對各種醫學診斷任務都非常有效,甚至在其中一些任務上擊敗了人類專家。然而,算法的黑箱特性限制了臨床應用。最近的可解釋性研究旨在揭示對模型決策影響最大的特征。這一領域的大多數文獻綜述都集中在分類學、倫理學和解釋的需要上。本文綜述了可解釋的深度學習在不同醫學成像任務中的應用。本文從一個為臨床最終用戶設計系統的深度學習研究者的實際立場出發,討論了各種方法、臨床部署的挑戰和需要進一步研究的領域。
深度學習在許多領域已經取得了顯著的成果。現在它在科學領域掀起了波瀾尤其是在生命科學領域。這本實用的書教導了開發人員和科學家如何將深度學習用于基因組學、化學、生物物理學、顯微學、醫學分析和其他領域。
理想的實踐開發人員和科學家準備將他們的技能應用于科學應用,如生物學,遺傳學,和藥物的發現,這本書介紹了幾個深度網絡原語。您將跟隨一個案例研究,研究如何設計將物理、化學、生物學和醫學結合在一起的新療法——這個例子代表了科學界最大的挑戰之一。
學習在分子數據上執行機器學習的基礎知識
臺灣交通大學的Jen-Tzung Chien教授在WSDN 2020會議上通過教程《Deep Bayesian Data Mining》介紹了深度貝葉斯數據挖掘的相關知識,涵蓋了貝葉斯學習、深度序列學習、深度貝葉斯挖掘和學習等內容。
Jen-Tzung Chien教授在WSDM 2020的教程《Deep Bayesian Data Mining》(《深度貝葉斯數據挖掘》)介紹了面向自然語言的深度貝葉斯挖掘和學習,包括了它的基礎知識和進展,以及它無處不在的應用,這些應用包括語音識別、文檔摘要、文本分類、文本分割、信息抽取、圖像描述生成、句子生成、對話控制、情感分類、推薦系統、自動問答和機器翻譯等。
從傳統上,“深度學習”被認為是一個學習過程,過程中的推斷和優化都使用基于實數的判別模型。然而,從大量語料中提取出的詞匯、句子、實體、行為和文檔的“語義結構”在數學邏輯或計算機程序中可能不能很好地被這種方式表達或正確地優化。自然語言的離散或連續潛在變量模型中的“分布函數”可能不能被正確分解或估計。
該教程介紹了統計模型和神經網絡的基礎,并聚焦于一系列先進的貝葉斯模型和深度模型,包括層次狄利克雷過程、中國餐館過程、遞歸神經網絡、長短期記憶網絡、序列到序列模型、變分自編碼器、生成式對抗網絡、策略神經網絡等。教程還介紹了增強的先驗/后驗表示。教程展示了這些模型是如何連接的,以及它們為什么適用于自然語言中面向符號和復雜模式的各種應用程序。
變分推斷和采樣被提出解決解決復雜模型的優化問題。詞和句子的嵌入、聚類和聯合聚類被語言和語義約束合并。針對深度貝葉斯挖掘、搜索、學習和理解中的不同問題,一系列的案例研究、任務和應用被提出。最后,教程指出一些未來研究的方向和展望。教程旨在向初學者介紹深度貝葉斯學習中的主要主題,激發和解釋它對數據挖掘和自然語言理解正在浮現的重要性,并提出一種結合不同的機器學習工作的新的綜合方法。
教程的內容大致如下:
完整教程下載
請關注專知公眾號(點擊上方藍色專知關注) 后臺回復“DBDM20” 就可以獲取完整教程PDF的下載鏈接~
教程部分內容如下所示:
參考鏈接:
//chien.cm.nctu.edu.tw/home/wsdm-tutorial/
-END- 專 · 知
專知,專業可信的人工智能知識分發,讓認知協作更快更好!歡迎注冊登錄專知www.zhuanzhi.ai,獲取更多AI知識資料!
歡迎微信掃一掃加入專知人工智能知識星球群,獲取最新AI專業干貨知識教程視頻資料和與專家交流咨詢!
請加專知小助手微信(掃一掃如下二維碼添加),獲取專知VIP會員碼,加入專知人工智能主題群,咨詢技術商務合作~
點擊“閱讀原文”,了解注冊使用專知
簡介: 近年來,生命科學和數據科學已經融合。機器人技術和自動化技術的進步使化學家和生物學家能夠生成大量數據。與20年前的整個職業生涯相比,如今的科學家每天能夠產生更多的數據。快速生成數據的能力也帶來了許多新的科學挑戰。我們不再處于可以通過將數據加載到電子表格中并制作幾個圖表來對其進行處理的時代。為了從這些數據集中提取科學知識,我們必須能夠識別和提取非顯而易見的關系。近年來,作為識別數據模式和關系的強大工具而出現的一種技術是深度學習,它是一類算法,它徹底改變了解決諸如圖像分析,語言翻譯和語音識別等問題的方法。深度學習算法擅長識別和利用大型數據集中的模式。由于這些原因,深度學習在生命科學學科中具有廣泛的應用。本書概述了深度學習如何應用于遺傳學,藥物發現和醫學診斷等多個領域。我們描述的許多示例都附帶有代碼示例,這些示例為方法提供了實用的介紹,并為讀者提供了以后進行研究和探索的起點。
該書中代碼地址://github.com/deepchem/DeepLearningLifeSciences
目錄:
簡介: 機器學習在處理結構化數據集(例如表格數據)方面歷來是成功的。 隨著最近的進步,特別是在深度學習方面的進步,現在還存在用于處理圖像,文本和語音數據的完善且強大的方法。 但是,許多現實世界的數據并不屬于這些類別。 這種數據重要的一種是網絡或圖形數據,可用于對諸如社交網絡,交易流,計算機網絡甚至分子相互作用之類的概念進行建模。 使用圖,我們可以輕松地表示和捕獲對象之間的復雜交互和依賴關系,但同時也提出了一個問題:我們如何將機器學習應用于結構化數據圖?
嘉賓介紹: Xavier Bresson,NTU計算機科學副教授。 他是圖深度學習領域的領先研究人員,圖深度學習是一個新的框架,該框架結合了圖和深度學習技術,可以處理多個領域的復雜數據。 演講的目的是介紹基于圖的卷積神經網絡體系結構,以及此類問題的應用。
大綱:
Deep Learning based Recommender System: A Survey and New Perspectives
隨著在線信息量的不斷增長,推薦系統已成為克服此類信息過載的有效策略。鑒于其在許多網絡應用中的廣泛采用,以及其改善與過度選擇相關的許多問題的潛在影響,推薦系統的實用性不容小覷。近年來,深度學習在計算機視覺和自然語言處理等許多研究領域引起了相當大的興趣,不僅歸功于出色的表現,而且還具有從頭開始學習特征表征的吸引人的特性。深度學習的影響也很普遍,最近證明了它在應用于信息檢索和推薦系統研究時的有效性。顯然,推薦系統中的深度學習領域正在蓬勃發展。本文旨在全面回顧最近基于深度學習的推薦系統的研究工作。更具體地說,我們提供并設計了基于深度學習的推薦模型的分類,并提供了最新技術的綜合摘要。最后,我們擴展了當前的趨勢,并提供了有關該領域新的令人興奮的發展的新觀點。