圖神經網絡是一種功能強大的深度學習模型,驚人地普遍存在。
擴展和包含時間或異構信息是具有挑戰性的。
多種應用研究
幾何深度學習是一種從對稱性和不變性的角度對大量ML問題進行幾何統一的嘗試。這些原理不僅奠定了卷積神經網絡的突破性性能和最近成功的圖神經網絡的基礎,而且也提供了一種原則性的方法來構建新型的問題特定的歸納偏差。Simone Scardapane講述關于圖與幾何深度學習的報告。圖神經網絡是一種功能強大的深度學習模型。
本教程介紹在圖神經網絡(GNN)中使用的概念。GNN是建模數據的有用方法,這些數據被構造成圖形或包含不同實體之間的有用關系。這些方法已成功應用于交通預測、分子建模、社會網絡分析、視覺場景理解等多個領域。
教程將集中在介紹概念和展示基本方法,同時也呈現一些有趣的聯系和應用。
這兩個講座是Bitdefender在布加勒斯特大學教授的深度學習課程的一部分。演講將是虛擬在線的,對任何人開放,并要求基本的ML知識。
在許多現實世界的應用中,包括社交網絡、推薦系統、本體論、生物學和計算金融,圖表自然地出現了。傳統上,圖的機器學習模型大多是為靜態圖設計的。然而,許多應用程序都涉及到圖形的演變。這為學習和推理帶來了重要的挑戰,因為節點、屬性和邊會隨著時間而變化。在這一報告中,我們回顧了最近的進展表示學習動態圖,包括動態知識圖譜。我們從編碼器和解碼器的角度來描述現有的模型,根據它們所使用的技術對這些編碼器和解碼器進行分類,并對每一類的方法進行分析。我們也回顧了幾個突出的應用和廣泛使用的數據集,并強調了未來的研究方向。
問題: 學習動態節點表示。 挑戰: 時間變化圖結構:可以出現鏈接和節點 然后消失,社區一直在變化。 我要求節點表示同時捕捉結構 鄰近性(如靜態情況)和它們的時間性 進化。 事件的時間間隔不均勻。 改變的原因: 可以來自不同的方面,例如: 在合作網絡,研究社區和職業 階段的觀點。 需要對多方面的變化進行建模。
本文推薦來自Emanuele Rodolà博士講述《幾何深度學習》,100頁ppt系統性講述了幾何深度學習基礎知識和最新進展,非常干貨。 //lcsl.mit.edu/courses/regml/regml2020/
幾何深度學習
過去十年在計算機視覺研究已經見證了“深度學習”的重新崛起,特別是卷積神經網絡(CNN)技術, 它允許從大量的樣例中學習強大的圖像特征表示。CNNs在圖像分類、分割、檢測和標注等廣泛的應用中取得了性能上的突破。然而,當試圖將CNN范式應用于三維形狀、點云和圖形(基于特征的描述、相似度、對應、檢索等)時,必須面對圖像與幾何對象之間的根本差異。形狀分析、圖形分析和幾何處理帶來了圖像分析中不存在的新挑戰,而深度學習方法直到最近才開始滲透到這些領域。本教程的目的是概述非歐幾里得數據學習技術的基礎和目前的技術現狀。本教程將特別關注應用于歐氏和非歐氏流形的深度學習技術(CNN),以完成形狀分類、檢索和對應的任務。本教程將從新的角度介紹3D計算機視覺和幾何數據處理的問題,強調與傳統2D設置的類比和區別,并展示如何適應流行的學習方案,以處理非歐幾里得結構。
主題: Deep Learning for Community Detection: Progress, Challenges and Opportunities
摘要: 由于社區代表著相似的觀點,相似的功能,相似的目的等,因此社區檢測對于科學查詢和數據分析而言都是重要且極為有用的工具。 但是,隨著深度學習技術顯示出以令人印象深刻的性能處理高維圖形數據的能力日益增強,諸如頻譜聚類和統計推斷之類的經典社區檢測方法正在逐漸被淘汰。 因此,及時對通過深度學習進行社區檢測的進展進行調查。 該領域分為該領域的三個廣泛的研究流-深度神經網絡,深度圖嵌入和圖神經網絡,總結了每個流中各種框架,模型和算法的貢獻以及當前尚未解決的挑戰和 未來的研究機會尚待探索。
【導讀】圖數據處理是一個長期存在的研究課題,近年來又被深度學習領域廣泛關注。相關研究在數量和廣度上飛速增長,但這也導致了知識系統化的缺失和對早期文獻關注的缺失。《A Gentle Introduction to Deep Learning for Graphs》是圖深度學習領域的教程導論,它傾向于對主流概念和架構的一致和漸進的介紹,而不是對最新文獻的闡述。
教程在介紹概念和想法時采用了自上而下的方法并保留了清晰的歷史觀點,為此,導論在第2節中提供了圖表示學習的泛化形式,將圖表示學習泛化為一種基于局部和迭代的結構化信息處理過程。同時,介紹了架構路線圖,整個導論也是圍繞該路線圖進行開展的。導論聚焦于面向局部和迭代的信息處理過程,因為這些過程與神經網絡的體系更為一致。因此,導論會淡化那些基于圖譜理論的全局方法(假設有一個固定的鄰接矩陣)。
后續,導論介紹了可以用于組裝構建新奇和有效圖神經網絡模型的基本構建單元。導論還對圖深度學習中有意思的研究挑戰和應用進行了闡述,同時介紹了相關的方法。導論的內容大致如下:
摘要
簡介
高階概覽
數學符號
動機
路線圖
局部關系和信息的迭代處理
三種上下文傳播機制
構建塊/單元
鄰接聚合
池化
面向圖嵌入的節點聚合
總結
任務
無監督學習
有監督學習
生成式學習
總結
其他方法和任務的總結
核
圖譜方法
隨機游走
圖上的對抗訓練和攻擊
圖序列生成模型
開放挑戰和研究方法
時間進化圖
偏置方差權衡
邊信息的明智用法
超圖學習
應用
化學和藥物設計
社交網絡
自然語言處理
安全
時空預測
推薦系統
總結
報告名稱: Deep Geometric Learning of Big Data and Applications
報告摘要: 深度學習技術在計算機視覺,自然語言處理和語音分析方面取得了令人印象深刻的性能。這些任務專注于位于歐幾里得域上的數據,并且針對這些域的數學工具(例如卷積,下采樣,多尺度和局部性)已得到明確定義,并受益于GPU等快速計算硬件。但是,許多基本數據和任務都涉及非歐幾里德領域,而這些領域最初并不是為深度學習方法設計的。例如計算機圖形學中的3D點云和3D形狀,大腦結構連接網絡中的功能性MRI信號,基因組學中基因調控網絡的DNA,量子化學中的藥物設計,高能物理中的中微子檢測以及常見的知識圖理解視覺場景。這一主要局限性促使近年來的研究界將神經網絡推廣到任意的幾何域,例如圖形和流形。卷積,粗化,多分辨率,因果關系等基本操作已通過頻譜和空間方法進行了重新定義。這些非歐氏數據分析問題的最新結果顯示了在許多領域中都有希望的令人振奮的新工具。
該研討會的目標是:1)召集數學家,機器學習科學家和領域專家,以建立這些新興技術的現狀; 2)討論用于分析這些新的深度學習技術的框架; 3)確立新的研究方向以及這些技術在神經科學,社會科學,計算機視覺,自然語言處理,物理學,化學中的應用,以及4)討論了GPU以外的適用于非歐幾里德領域的新計算機處理體系結構。
邀請嘉賓: Jure Leskovec,斯坦福大學計算機科學副教授。 研究重點是對大型社會和信息網絡進行挖掘和建模,它們的演化,信息的傳播以及對它們的影響。 調查的問題是由大規模數據,網絡和在線媒體引起的。
Stanley Osher,加州大學洛杉磯分校 IPAM 數學與計算機科學教授,電氣工程與化學和生物分子工程教授。
報告部分大綱:
Metric learning learns a metric function from training data to calculate the similarity or distance between samples. From the perspective of feature learning, metric learning essentially learns a new feature space by feature transformation (e.g., Mahalanobis distance metric). However, traditional metric learning algorithms are shallow, which just learn one metric space (feature transformation). Can we further learn a better metric space from the learnt metric space? In other words, can we learn metric progressively and nonlinearly like deep learning by just using the existing metric learning algorithms? To this end, we present a hierarchical metric learning scheme and implement an online deep metric learning framework, namely ODML. Specifically, we take one online metric learning algorithm as a metric layer, followed by a nonlinear layer (i.e., ReLU), and then stack these layers modelled after the deep learning. The proposed ODML enjoys some nice properties, indeed can learn metric progressively and performs superiorly on some datasets. Various experiments with different settings have been conducted to verify these properties of the proposed ODML.