本書冊來自Bernd Heidergott 和Felisa J. Vazquez-Abad 撰寫的優化與學習的隨機梯度技術,涵蓋隨機優化與學習理論和梯度估計技術。值得關注
隨機優化與學習理論
本章對確定性優化的顯著結果進行了總結,特別是著重于數值方法。對于基本的定義和結果,我們參考標準教科書。對于基本結果的簡要回顧,請參閱附錄
梯度估計
附錄
貝葉斯統計分析方法是一本關于統計方法分析廣泛的各種數據的書。本書由12章組成,從基本概念開始,涵蓋了許多主題,包括貝葉斯估計,決策理論,預測,假設檢驗,層次模型,馬爾可夫鏈蒙特卡羅方法,有限總體推理,有偏抽樣和不可忽略的非響應。這本書包含了許多練習,所有的解決方案,包括完整的計算機代碼。適合自學或一個學期的課程,每周三小時的講座和一次輔導課,共13周。
//press.anu.edu.au/publications/bayesian-methods-statistical-analysis
Convex Optimization: Algorithms and Complexity
本專著介紹了凸優化的主要復雜性定理及其相應的算法。從黑箱優化的基本理論出發,對結構優化和隨機優化的最新進展進行了研究。黑盒優化的介紹,受到Nesterov的開創性著作和Nemirovski的課堂講稿的強烈影響,包括對切割平面方法的分析,以及(加速)梯度下降方案。我們還特別關注非歐幾里得設置(相關算法包括Frank-Wolfe、鏡像下降和雙重平均),并討論它們在機器學習中的相關性。我們溫和地介紹了結構優化與FISTA(優化光滑項和簡單非光滑項的求和),鞍點反射法(Nemirovski的替代Nesterov平滑),以及內部點方法的簡明描述。在隨機優化中,我們討論了隨機梯度下降、小批量、隨機坐標下降和次線性算法。我們也簡要地接觸到組合問題的凸松弛和使用隨機的圓解,以及基于隨機漫步的方法。
從應用的觀點來看,研究這本書的主要原因是幫助處理描述隨機、時變函數的復雜性。一個隨機變量可以被解釋為一個單一測量的結果。描述單個隨機變量的分布是相當簡單的。它完全由一個單變量的累積分布函數F(x)指定。在計算機上近似地表示一個累積分布函數是比較容易的。幾個隨機變量的聯合分布要復雜得多,一般用一個聯合累積概率分布函數F(x1, x2,…)來描述。它比n個單變量函數復雜得多。一個隨機過程,例如一個通信信道中的時變衰落模型,涉及許多,可能是無限多個隨機變量(在一個觀察區間內的每個時刻t都有一個)。
這本書幫助讀者準備理解和使用以下方法來處理隨機過程的復雜性:
這本書是為伊利諾伊大學香檳分校(University of Illinois at Urbana-Champaign)電子與計算機工程系(Department of Electrical and Computer Engineering)的隨機過程研究生第一學期課程而寫的。本課程假定學生上過概率論課程,在第一章簡要回顧。學生也應該熟悉實際分析和初級線性代數,如極限的概念、導數的定義、黎曼積分和對稱矩陣的對角化。這些主題將在附錄中回顧。最后,學生應該對變換方法和復變分析有一定的熟悉程度,盡管相關章節會對所使用的概念進行回顧。希望一些閱讀這本書的學生會發現,它們有助于理解系統工程的各種技術文獻,包括控制系統、信號和圖像處理、通信理論,以及各種網絡和算法的分析。希望一些學生能繼續設計系統,定義和分析隨機模型。希望其他人會有動力繼續學習概率論,繼續學習測度理論及其在概率論和分析中的應用。
本書的前四章在后面的章節中使用得非常多,所以大多數讀者在繼續閱讀之前應該先閱讀這些章節。第一章主要是對概率論第一課中發現的概念的回顧,重點是公理和期望的定義。希望對基本概率進行更廣泛回顧的讀者可以參考伊利諾斯大學ECE 313的作者筆記。第二章主要介紹隨機變量序列收斂的各種方法,以及概率論的基本極限定理:大數定律、中心極限定理和大偏差的漸近性態。第三章主要討論最小均方誤差估計和正交原理。基于創新序列從幾何角度解釋了卡爾曼濾波。第四章介紹了隨機過程的概念,并簡要介紹了幾個關鍵的例子和隨機過程的分類。本章將介紹馬爾可夫過程和鞅,但在以后的章節中將有更深入的討論。在第4章之后,下面的四個主題可以相互獨立地進行討論。第5章描述了馬爾可夫過程在建模和統計推斷中的使用。應用程序包括自然語言處理。第6章描述了馬爾可夫過程在動力學系統建模和分析中的應用。應用程序包括排隊系統的建模。第7-9章發展了基于均方收斂的隨機過程的演算,接著是線性濾波,正交展開,最后是因果和非因果維納濾波。第10章探討關于過濾的鞅,重點是初等集中不等式和可選抽樣定理。
這本書的目的是提供一個從零開始全面的貝葉斯優化介紹,并細致闡述所有關鍵的想法。目標受眾是機器學習、統計和相關領域的研究生和研究人員。然而,我也希望來自其他領域的從業者和研究人員能在這里找到一些用處。
本書分為三個主要部分,包括:
還包括一些其他的主題:
目錄內容: Introduction Gaussian Processes Modeling with Gaussian Processes Model Assessment, Selection, and Averaging Decision Theory for Optimization Utility Functions for Optimization Common Bayesian Optimization Policies Computing Policies with Gaussian Processes Implementation Theoretical Analysis Extensions and Related Settings A Brief History of Bayesian Optimization
引言概述
在機器學習的背景下,貝葉斯優化是一個古老的想法。盡管貝葉斯優化的歷史已經很長,但在過去的十年里,它經歷了一段復興和快速發展的時期。這種復興的主要驅動力是計算方面的進步,這使得貝葉斯建模和推理的工具越來越復雜。
這本書的目的是提供一個從零開始的全面的貝葉斯優化介紹,并細致闡述所有的關鍵思想。這種自下而上的方法允許我們在貝葉斯優化算法中確定統一的主題,這些主題可能在以往的調研文獻時丟失。
這本書分為三個主要部分。第2-4章涵蓋了高斯過程建模的理論和實踐方面。這類模型是貝葉斯優化文獻中最受歡迎的,其中包含的材料對接下來的幾章至關重要。
第5-7章介紹了序列決策理論及其在優化中的應用。雖然這個理論需要一個目標函數的模型和我們對它的觀察,介紹是不可知的模型的選擇,可以獨立地閱讀前幾章的高斯過程。這些內容是在第8-10章中介紹的,討論了使用高斯過程模型的貝葉斯優化的細節。第8-9章討論了計算和實現的細節,第10章討論了貝葉斯優化算法的理論性能界限,其中大多數結果密切依賴于目標函數的高斯過程模型或相關的重新生成核希爾伯特空間。
一些應用的細微差別需要修改基本序列優化方案(這是前幾章的重點),第11章介紹了對這一基本設置的幾個值得注意的擴展。每一個都是通過貝葉斯決策理論的統一視角系統地呈現出來的,以說明一個人在面對新情況時應該如何處理。最后,第12章提供了一個簡單和獨立的貝葉斯歷史介紹。
這本書的目的是全面概述在算法的數學分析中使用的主要技術。涵蓋的材料從經典的數學主題,包括離散數學,基本的真實分析,和組合學,以及從經典的計算機科學主題,包括算法和數據結構。重點是“平均情況”或“概率”分析,但也涵蓋了“最壞情況”或“復雜性”分析所需的基本數學工具。我們假設讀者對計算機科學和實際分析的基本概念有一定的熟悉。簡而言之,讀者應該既能寫程序,又能證明定理。否則,這本書是自成一體的。
這本書是用來作為算法分析高級課程的教科書。它也可以用于計算機科學家的離散數學課程,因為它涵蓋了離散數學的基本技術,以及組合學和重要的離散結構的基本性質,在計算機科學學生熟悉的背景下。傳統的做法是在這類課程中有更廣泛的覆蓋面,但許多教師可能會發現,這里的方法是一種有用的方式,可以讓學生參與到大量的材料中。這本書也可以用來向數學和應用數學的學生介紹與算法和數據結構相關的計算機科學原理。
盡管有大量關于算法數學分析的文獻,但該領域的學生和研究人員尚未直接獲得廣泛使用的方法和模型的基本信息。本書旨在解決這種情況,匯集了大量的材料,旨在為讀者提供該領域的挑戰的欣賞和學習正在開發的先進工具以應對這些挑戰所需的背景知識。補充的論文從文獻,這本書可以作為基礎的介紹性研究生課程的算法分析,或作為一個參考或基礎的研究人員在數學或計算機科學誰想要獲得這個領域的文獻自學。
第 1 章:算法 分析考慮算法分析的一般動機以及研究算法性能特征的各種方法之間的關系。
第 2 章:遞歸關系 專注于各種類型的 遞歸關系的基本數學屬性,這些遞歸關系在通過從程序的遞歸表示到描述其屬性的函數的遞歸表示的直接映射來分析算法時經常出現。
第 3 章:生成函數 在算法的平均情況分析中介紹了一個核心概念:生成函數 ——作為我們研究對象的算法與發現其屬性所必需的分析方法之間的必要且自然的聯系。
第 4 章:漸近逼近 研究了推導問題的近似解或逼近精確解的方法,這使我們能夠 在分析算法時對感興趣的數量進行 簡潔而精確的估計。
第 5 章:分析組合 學介紹了一種研究組合結構的現代方法,其中生成函數是研究的中心對象。這種方法是通過本書其余部分研究特定結構的基礎。
第 6 章:樹 研究了許多不同類型的 樹的屬性,以及在許多實際算法中隱含和顯式出現的基本結構。我們的目標是提供對樹組合分析的廣泛文獻結果的訪問,同時為大量算法應用提供基礎。
第 7 章:排列 調查了排列的組合屬性(數字1到N的排序),并展示了它們如何以自然的方式與基本的和廣泛使用的排序算法相關聯。
第 8 章:字符串和嘗試 研究 字符串、字符序列或從固定字母表中提取的字母的基本組合屬性,并介紹處理字符串的算法,從計算理論核心的基本方法到實用的文本處理方法重要應用程序的主機。
第 9 章:單詞和映射 涵蓋單詞的全局屬性( 來自M 字母字母表的 N 字母字符串),這些屬性在經典組合學(因為它們模擬獨立伯努利試驗的序列)和經典應用算法(因為它們散列算法的模型輸入序列)。本章還涵蓋了隨機映射 ( N個字母表中的N個字母單詞),并討論了與樹和排列的關系。
這本書是為那些對解決優化問題感興趣的人準備的。由于優化在科學、工程、經濟學和工業領域的廣泛(和不斷增長的)應用,對于學生和實踐者來說,發展對優化算法的理解是至關重要的。了解這些算法的能力和局限性有助于更好地理解它們對各種應用的影響,并為改進和擴展優化算法和軟件的未來研究指明了方向。在這本書中,我們的目標是對解決連續優化問題的最強大、最先進的技術進行全面描述。通過展示每個算法的激勵思想,我們試圖激發讀者的直覺,使技術細節更容易遵循。
優化是決策科學和物理系統分析中的一個重要工具。為了使用這個工具,我們必須首先確定一些目標,一個對所研究系統性能的定量度量。這個目標可以是利潤、時間、勢能,或者任何可以用單個數字表示的量或量的組合。目標取決于系統的某些特征,稱為變量或未知數。我們的目標是找到優化目標的變量值。在某些方面,變量通常是受限制的。例如,分子中的電子密度和貸款利率等物理量不能是負的。
優化和機器學習的相互作用是現代計算科學最重要的發展之一。優化的公式和方法在設計從大量數據中提取基本知識的算法方面被證明是至關重要的。然而,機器學習并不僅僅是優化技術的消費者,而是一個快速發展的領域,它本身也在產生新的優化思想。這本書以一種對兩個領域的研究人員都可訪問的方式捕獲了優化和機器學習之間交互的藝術的狀態。
優化方法因其廣泛的適用性和吸引人的理論特性而在機器學習中占有重要地位。當今機器學習模型的復雜性、規模和多樣性日益增加,需要對現有假設進行重新評估。這本書開始了重新評估的過程。它描述了在諸如一階方法,隨機近似,凸松弛,內點方法,和近端方法等已建立的框架。它還專門關注一些新的主題,如正則化優化、魯棒優化、梯度和次梯度方法、分裂技術和二階方法。其中許多技術的靈感來自其他領域,包括運籌學、理論計算機科學和優化子領域。這本書將豐富機器學習社區和這些其他領域以及更廣泛的優化社區之間正在進行的交叉發展。
強化學習技術是人工智能從感知智能向決策智能發展的關鍵技術之一;是基于控制論、心理學、生理學、認知科學、電腦科學等多學科交叉的新興機器學習技術。
本書是學習和研究強化學習技術的重要參考書籍,作者是日本人工智能領域知名學者、東京大學杉山將教授。
全書將統計學習和強化學習結合,從模型無關策略迭代、模型無關策略搜索、模型相關強化學習三個技術路線角度,對強化學習函數估計中的基函數設計、樣本重用以及策略搜索、模型估計等做了深入淺出的介紹。本書適合于從事人工智能和機器學習研究和應用的專家學者、技術人員、研究生閱讀。
本書特色:
從現代機器學習的角度介紹了統計強化學習的基本概念和實用算法,為該領域提供了最新介紹。
涵蓋了各種類型的強化學習方法,包括基于模型和無模型的方法、策略迭代和策略搜索方法。
涵蓋了最近在數據挖掘和機器學習領域引入的方法,以便在強化學習和數據挖掘/機器學習研究人員之間提供系統橋梁。
呈現了最新的結果,包括強化學習的維數降低和風險敏感強化學習;介紹了許多示例來幫助讀者理解強化學習技術的直觀性和實用性。
【導讀】《機器學習:貝葉斯和優化的視角》是雅典大學信息學和通信系的教授Sergios Theodoridis的經典著作,對所有主要的機器學習方法和新研究趨勢進行了深入探索,涵蓋概率和確定性方法以及貝葉斯推斷方法。非常值得學習。
Sergios Theodoridis教授是雅典大學信息學和通信系的教授,香港中文大學(深圳)客座教授。他的研究領域是信號處理和機器學習。他的研究興趣是自適應算法,分布式和稀疏性感知學習,機器學習和模式識別,生物醫學應用中的信號處理和學習以及音頻處理和檢索。
他的幾本著作與合著蜚聲海內外,包括《機器學習:貝葉斯和優化的視角》以及暢銷書籍《模式識別》。他是2017年EURASIP Athanasios Papoulis獎和2014年EURASIP Meritorious Service獎的獲得者。
機器學習:貝葉斯和優化方法
本書對所有主要的機器學習方法和新研究趨勢進行了深入探索,涵蓋概率和確定性方法以及貝葉斯推斷方法。其中,經典方法包括平均/小二乘濾波、卡爾曼濾波、隨機逼近和在線學習、貝葉斯分類、決策樹、邏輯回歸和提升方法等,新趨勢包括稀疏、凸分析與優化、在線分布式算法、RKH空間學習、貝葉斯推斷、圖模型與隱馬爾可夫模型、粒子濾波、深度學習、字典學習和潛變量建模等。全書構建了一套明晰的機器學習知識體系,各章內容相對獨立,物理推理、數學建模和算法實現精準且細致,并輔以應用實例和習題。本書適合該領域的科研人員和工程師閱讀,也適合學習模式識別、統計/自適應信號處理和深度學習等課程的學生參考。
本書涵蓋了這些領域中使用Python模塊演示的概率、統計和機器學習的關鍵思想。整本書包括所有的圖形和數值結果,都可以使用Python代碼及其相關的Jupyter/IPython Notebooks。作者通過使用多種分析方法和Python代碼的有意義的示例,開發了機器學習中的關鍵直覺,從而將理論概念與具體實現聯系起來。現代Python模塊(如panda、y和Scikit-learn)用于模擬和可視化重要的機器學習概念,如偏差/方差權衡、交叉驗證和正則化。許多抽象的數學思想,如概率論中的收斂性,都得到了發展,并用數值例子加以說明。本書適合任何具有概率、統計或機器學習的本科生,以及具有Python編程的基本知識的人。