我們設計并實現了一個Python庫,以一種高效、可擴展和簡單的方式,幫助非專業人士使用所有這些強大的工具,并將其整合到數據科學家、實踐者和應用研究人員的工作流程中。這個庫中實現的算法在設計時考慮到了可用性和GPU效率,它們可以添加到任何PyTorch模型中,只需要額外的一行代碼。我們展示了這些工具在時間序列分析設置的流形優化應用上的有效性。在這種情況下,使用正交和幺正優化來約束和正則化循環模型,避免消失和爆炸梯度問題。為GeoTorch設計的算法允許我們在該系列模型的標準測試中實現最先進的結果。我們使用比較幾何中的工具來給出優化問題中感興趣的量的邊界。特別地,我們建立在(Kaul 1976)的工作之上,給出黎曼指數二階導數的范數的明確界限。
許多統計和機器學習的方法正在被定義。這些方法用于從系統的感知數據創建模型,幫助科學家生成或改進當前的模型。機器學習在科學領域得到了廣泛的研究,特別是在生物信息學、經濟學、社會科學、生態學和氣候科學等領域,但從數據中學習需要在復雜的情況下進行更多的研究。要為機器學習算法提供有意義的知識,就必須采用能夠捕獲結構和過程屬性的高級知識表示方法。它對理解困難的科學問題有重大影響。
這本《知識表示和機器學習的預測和分析》展示了各種知識表示和機器學習方法和體系結構,將在研究領域活躍。這些方法被回顧與現實生活的例子,從廣泛的研究主題。本書的網站提供了許多在機器學習知識表示中實現的技術和算法的理解。
特點:
檢查所需知識表示的表示充分性 掌握知識表示的推理充分性,以便從原始信息中產生新的知識 運用自動方法獲取新知識,提高推理和獲取效率 使用最新的技術,涵蓋知識表示和機器學習方面的主要挑戰、關注和突破 描述知識表示的思想和相關技術,以及它們的應用,以幫助人類變得更好、更智能 這本書作為研究人員和實踐者誰是在信息技術和計算機科學領域的知識表示和機器學習的基本和先進的概念的研究人員和實踐者的參考書。如今,開發自適應的、文件的、可擴展的和可靠的應用,以及為日常問題設計解決方案已經變得非常重要。這本書將有助于行業人士,也將幫助初學者和高級用戶學習最新的東西,其中包括基本和先進的概念。
理解復雜網絡的深度表示是在互聯網時代構建可解釋和值得信賴的機器學習應用的重要一步。近似于黑箱模型(如人工或生物神經網絡)預測的全局代理模型通常用于為模型可解釋性提供有價值的理論見解。為了評估代理模型在另一個模型中的表示能力,我們需要開發用于模型比較的推理方法。之前的研究已經比較了模型和大腦的表征幾何(以模型層或皮層區域中輸入模式的表征之間的距離矩陣為特征)。在本研究中,我們提出在模型和大腦中探索這些概括的表示的統計描述,作為更廣泛的一類統計的一部分,強調表示的拓撲和幾何。拓撲摘要統計建立在拓撲數據分析(TDA)和其他基于圖的方法的基礎上。我們評估這些統計數據在用于模型選擇時提供的敏感性和特異性,目的是將不同的神經網絡模型相互聯系起來,并對可能最好地解釋黑盒表示的計算機制進行推斷。這些新方法使大腦和計算機科學家能夠將大腦和模型學習到的動態表征轉換可視化,并執行模型比較統計推斷。
這是一本關于光滑流形優化的書,適合那些熟悉線性代數和多變量微積分的讀者。在幾何或優化方面沒有先決條件。第3章和第5章可以作為微分和黎曼幾何的單獨介紹,重點介紹線性空間的嵌入子流形,并有充分的證明。一個顯著的特點是,這些早期章節不涉及圖表。
第8章提供了一般的理論,以便我們可以在第9章中構建商流形。第4章和第6章中的優化算法適用于一般情況,但在閱讀第3章和第5章之后就可以理解了。第7章詳細介紹了在實踐中出現的子流形的例子。第10章介紹更高級的黎曼工具,第11章介紹測地線凸性。
在將近兩千年的時間里,“幾何學”一詞一直是歐幾里得幾何學的同義詞,因為沒有其他類型的幾何學存在。歐幾里得的壟斷地位在19世紀結束了,許多非歐幾里得幾何學的例子被展示出來。盡管如此,這些研究很快就分化成不同的領域,數學家們爭論不同幾何形狀之間的關系和定義一個幾何的是什么。菲利克斯·克萊因在他的Erlangen程序中提出了一種擺脫困境的方法,該程序提出將幾何學作為使用群論語言研究不變量或對稱性的方法。在20世紀,這些思想是發展現代物理學的基礎,最終形成了標準模型。
深度學習目前的狀態有點像19世紀的幾何學領域:一方面,在過去十年中,深度學習給數據科學帶來了一場革命,使許多以前被認為無法完成的任務成為可能,包括計算機視覺、圍棋或蛋白質折疊。同時,我們有各種各樣的神經網絡架構,但很少有統一的原則。就像過去一樣,很難理解不同方法之間的關系,不可避免地導致了對相同概念的再創造和再品牌。
幾何深度學習的目標是在Erlangen計劃的思想下為深度學習帶來幾何統一。它提供了一個共同的數學框架來研究最成功的神經網絡架構,如CNNs、RNNs、GNNs和transformer,并提供了一個建設性的過程來將先前的知識融入到神經網絡中,并以一種原則性的方式構建未來的架構。
在這次演講中,我將概述幾何深度學習在網格、圖形和流形上的數學原理,并展示這些方法在計算機視覺、社會科學、生物學和藥物設計領域的一些令人興奮和開創性的應用。
約束優化已經成為一個很好的研究領域,有一些強大的技術可以解決該領域的一般問題。在這本書中,考慮了一類特殊的約束,稱為幾何約束,它表示優化問題的解在流形上。這是一個最近的研究領域,它為更一般的約束優化方法提供了強大的替代方案。經典的約束優化技術適用于比流形大得多的嵌入式空間。因此,在流形上工作的優化算法具有較低的復雜性,而且通常還具有更好的數值特性(例如,保持能量等不變量的數值積分方案)。作者將此稱為受限搜索空間中的無約束優化。
可以用流形來描述差分方程或微分方程的思想起源于布羅克特、弗拉施卡和魯提肖瑟的工作。例如,他們描述了等譜流,這些流產生的時變矩陣彼此相似,最終收斂到有序特征值的對角矩陣。這些想法在數值線性代數領域沒有像在動力系統領域那樣得到那么多的關注,因為由此產生的差分和微分方程并沒有立即導致有效的算法實現。
這本書對發展高階優化技術的微分幾何的進行了深入的介紹,但它仍然成功地用簡單的想法解釋復雜的概念。這些思想隨后被用于發展牛頓型方法以及其他超線性方法,如信賴域方法和非精確和準牛頓方法,這些方法更加強調概念算法的高效數值實現。
幾何深度學習是一種從對稱性和不變性的角度對大量ML問題進行幾何統一的嘗試。這些原理不僅奠定了卷積神經網絡的突破性性能和最近成功的圖神經網絡的基礎,而且也提供了一種原則性的方法來構建新型的問題特定的歸納偏差。Simone Scardapane講述關于圖與幾何深度學習的報告。圖神經網絡是一種功能強大的深度學習模型。
雖然機器學習的專業知識并不意味著你可以創建自己的圖靈測試證明機器人(就像電影《機械總動員》中那樣),但它是人工智能的一種形式,是快速大規模識別機會和解決問題的最令人興奮的技術手段之一。任何掌握了機器學習原理的人都將掌握我們科技未來的很大一部分,并在職業領域開辟令人難以置信的新方向,包括欺詐檢測、優化搜索結果、服務實時廣告、信用評分、建立精確而復雜的定價模型等等。
與大多數機器學習書籍不同的是,完全更新的第二版《傻瓜機器學習》并不假設你有多年使用編程語言(如Python)的經驗,但讓你入門,涵蓋了入門的材料,將幫助你建立和運行你需要執行實際任務的構建模型。它揭示了推動機器學習的潛在的——迷人的——數學原理,同時也表明,你不需要是一個數學天才,就可以構建有趣的新工具,并將它們應用到你的工作和學習中。
題目: Unsupervised Multi-Class Domain Adaptation: Theory, Algorithms, and Practice
摘要:
本文研究了無監督多類域自適應理論,這是最近一些算法的基礎,這些算法的學習目標僅僅是由經驗驅動的。多類得分不一致(MCSD)分歧是通過聚合多類分類中的絕對裕度違規來表示的;所提出的MCSD能夠充分表征任何一對多類得分假設之間的關系。通過使用MCSD作為域距離的度量,我們為多類UDA開發了一個新的域適配邊界以及它的依賴于數據的(可能是近似正確的)邊界,這自然地提出了對抗性的學習目標來對齊源域和目標域的條件特征分布。因此,一個多類領域對抗學習網絡(McDalNets)的算法框架被開發出來,它通過學習目標的不同實例與最近流行的一些方法相一致或相似,從而(部分地)強調了它們的實際有效性。在多類UDA理論的基礎上,提出了一種新的域對稱網絡(SymmNets)算法。Symmnet提供了簡單的擴展,這些擴展在封閉集、部分集或開放集UDA的問題設置下都可以很好地工作。我們進行了仔細的實證研究,把不同的算法的McDalNets和我們的新推出的SymmNets相比較。實驗結果驗證了理論分析的正確性和有效性。
簡介: 本書的第2部分是基礎機器學習和深度學習算法的初學者指南。 目的是使讀者對現代AI方法的基本組成部分有一個了解。 有些概念偏數學內容,但是不必完全了解細節,了解其重要性即可。 盡管這些算法中的許多已不再是最新技術,但由于它們提供了后續方法性能的可靠基準,因此仍在工業中得到廣泛使用。
目錄:
本教程旨在深入介紹適用于3D視覺問題的全局優化工具,包括凸和半正定松弛。本教程的第一個目標是通過提供真實的示例來激發對全局求解器的需求,這些示例中,由于無法解決大型優化問題而難以實現最優性,因此導致缺乏魯棒性。第二個目標是為與會者講解基本的數學和算法概念,并介紹該領域最近的重要進展。第三個目標是概述幾種開放的研究途徑:全局優化具有巨大的未開發潛力,希望本教程能夠為研究人員使用現代優化工具解決幾何視覺中的幾個挑戰帶來靈感。