本書探索了如何在各種應用中使用生成式對抗網絡,并強調了它們相對于傳統生成式模型的重大進步。本書的主要目標是專注于深度學習和生成式對抗網絡的前沿研究,包括創建用于處理文本、圖像和音頻的新工具和方法。生成對抗網絡(GAN)是一類機器學習框架,是深度學習應用中的下一個新興網絡。生成對抗網絡(Generative adversarial networks, GANs)能夠根據應用需求生成樣本數據,具有構建改進模型的可行性。GAN在科學技術領域有各種應用,包括計算機視覺、安防、多媒體和廣告、圖像生成、圖像翻譯、文本到圖像合成、視頻合成、生成高分辨率圖像、藥物發現等。 特點: 介紹如何將GAN用于圖像和視頻的全面指南 ?包括使用生成對抗網絡進行水下圖像增強的案例研究,使用GAN進行入侵檢測 ?強調包括使用深度學習方法的游戲效果 ?研究GAN的重大技術進步及其實際應用 ?討論GAN的挑戰和最佳解決方案 本書針對更廣泛的受眾,如初級和高級工程、本科生和研究生、研究人員,以及對GAN和深度學習的趨勢發展和機會感興趣的任何人,解決了科學方面的問題。 書中的材料可以作為參考圖書館,認證機構,政府機構,特別是學術高等教育機構打算推出或改革他們的工程課程。
機器學習的目標是讓計算機使用示例數據或過去的經驗來解決給定的問題。機器學習是自動駕駛汽車、語音識別和翻譯應用等令人興奮的新技術的基礎。這是一個全面的,廣泛使用的機器學習教科書的實質性修訂第四版,提供了在理論和實踐領域的最新進展的新覆蓋面,包括深度學習和神經網絡的發展。這本書涵蓋了廣泛的主題,通常不包括在介紹性機器學習文本,包括監督學習,貝葉斯決策理論,參數方法,半參數方法,非參數方法,多元分析,隱馬爾可夫模型,強化學習,核機器,圖形模型,貝葉斯估計,統計檢驗。第四版提供了一個關于深度學習的新章節,討論了訓練、正則化和構造深度神經網絡,如卷積和生成對抗網絡;強化學習一章的新材料,涵蓋了深度網絡的使用,策略梯度方法和深度強化學習;關于自動編碼器和word2vec網絡的多層感知器一章的新材料;討論了一種流行的降維方法t-SNE。新的附錄提供了線性代數和優化的背景材料。章末練習幫助讀者運用所學的概念。機器學習導論可用于高級本科生和研究生的課程,也可作為專業人員的參考。//mitpress.mit.edu/9780262043793/introduction-to-machine-learning/
生成對抗網絡(GenerativeAdversarialNetwork,GAN)在諸多領域都取得了較好的應 用效果,本章將以生成模型概述為切入點,介紹生成模型的基本概念和生成模型的意義及應 用,在此基礎上詳細敘述 GAN,并分析 GAN 的延伸模型———SGAN 模型、CGAN 模型、 StackGAN 模型、InfoGAN 模型和 AuxiliaryClassifierGAN 模型的結構。深度神經網絡的熱門話題是分類問題,即給定一幅圖像,神經網絡可以告知你它是什么 內容,或者屬于什么類別。近年來,生成模型成為深度神經網絡新的熱門話題,它想做的事 情恰恰相反,即給定一個類別,神經網絡可以無窮無盡地自動生成真實而多變的此類別圖 像,如圖5.1所示,它可以包括各種角度,而且會在此過程中不斷進步。
**5.1.1 生成模型的基本概念 **
在深度學習中,可以將其模型分為生成模型和判別模型兩大類[1]。生成模型可以通過 觀察數據,學習樣本與標簽的聯合概率密度分布P(x,y),然后生成對應的條件概率分布P (y|x),從而得到所預測的模型Y=f(x)。判別模型強調直接從數據中學習決策函數[2]。生成模型的目標是給定訓練數據,希望能獲得與訓練數據相同的新數據樣本。判別模型的 目標是找到訓練數據的分布函數。在深度學習中,監督學習和非監督學習都包含其對應的 生成模型,根據尋找分布函數的過程,可以把生成模型大致分為概率估計和樣本生成。概率估計是在不了解事件概率分布的情況下,通過假設隨機分布,觀察數據確定真正的 概率密度分布函數,此類模型也可定義為淺層生成模型,典型的模型有樸素貝葉斯、混合高斯模型和隱馬爾可夫模型等。樣本生成是在擁有訓練樣本數據的情況下,通過神經網絡訓練后的模型生成與訓練集 類似的樣本,此類模型也可以定義為深度生成模型,典型的模型有受限玻爾茲曼機、深度信 念網絡、深度玻爾茲曼機和廣義除噪自編碼器等。 **5.1.2 生成模型的意義及應用 **
著名物理學家費曼說過一句話:“只要是我不能創造的,我就還沒有理解。”生成模型恰 如其所描述的,其應用包括: (1)生成模型的訓練和采樣是對高維概率分布問題的表達和操作,高維概率分布問題 在數學和工程領域有很廣泛的應用[3]。(2)生成模型可以以多種方式應用到強化學習中。基于時間序列的生成模型可用來對 未來可能的行為進行模擬;基于假設環境的生成模型可用于指導探索者或實驗者,即使發生 錯誤行為,也不會造成實際損失[4]。(3)生成模型可以使用有缺失的數據進行訓練,并且可以對缺失的數據進行預測。(4)生成模型可以應用于多模態的輸出問題,一個輸入可能對應多個正確的輸出,每一 個輸出都是可接受的[5]。圖5.2是預測視頻的下一幀圖像的多模態數據建模示例。神經網絡的發展大致可以分為神經網絡的興起、神經網絡的蕭條與反思、神經網絡的復 興與再發展、神經網絡的流行度降低和深度學習的崛起共5個階段。
R深度學習,第二版使用R和強大的Keras庫從頭開始進行深度學習!在R深度學習第二版中,您將學習:
《R的深度學習,第二版》向您展示了如何將深度學習付諸行動。它基于Fran?ois Chollet的暢銷書《用Python進行深度學習》的修訂版。作者:Tomasz Kalinowski,他在RStudio維護Keras和Tensorflow R包。新手和有經驗的ML實踐者會喜歡構建神經網絡的專家見解、實用技術和重要理論。深度學習已經成為數據科學家、研究人員和軟件開發人員的基本知識。Keras和TensorFlow的R語言API為所有R用戶提供了深度學習,即使他們沒有高級機器學習或神經網絡的經驗。本書向您展示了如何開始使用R來完成核心的DL任務,如計算機視覺、自然語言處理等。深度學習與R,第二版是一個使用R語言進行深度學習的動手指南。當你讀這本書的時候,你會很快鎖定深度學習的基本思想。直觀的解釋、清晰的插圖和清晰的示例引導您了解核心的DL技能,如圖像處理和文本操作,甚至高級功能,如transformers。這個修訂和擴展的新版本改編自Python深度學習,第二版作者:Fran?ois Chollet, Keras庫的創建者。//www.manning.com/books/deep-learning-with-r-second-edition
目錄內容
1 What is deep learning?free * 2 The mathematical building blocks of neural networks * 3 Introduction to Keras and TensorFlow * 4 Getting started with neural networks: Classification and regression * 5 Fundamentals of machine learning * 6 The universal workflow of machine learning * 7 Working with Keras: A deep dive * 8 Introduction to deep learning for computer vision * 9 Advanced deep learning for computer vision * 10 Deep learning for time series * 11 Deep learning for text * 12 Generative deep learning * 13 Best practices for the real world * 14 Conclusions * App. Python primer for R users
圖像分割,總結和改進了當前圖像分割方法的新理論、方法和應用,由該領域的領導者撰寫。圖像分割的過程是根據像素的特征將圖像劃分為不同的區域,從而得到一個簡化的圖像,可以更有效地進行分析。圖像分割在工業檢測、生物醫學、智能交通、建筑等眾多領域有著廣泛的應用。《圖像分割:原理、技術和應用》是計算機視覺領域最新的技術和方法的最新集合。涵蓋基本概念、新理論和方法,以及各種實際應用,包括醫學成像、遙感、模糊聚類和分水嶺變換。深入的章節介紹了作者開發的創新方法,如卷積神經網絡,圖卷積網絡,可變形卷積和模型壓縮,以幫助研究生和研究人員在他們的工作中應用和改進圖像分割。
描述了圖像分割的基本原理和相關的數學方法,如聚類、神經網絡和數學形態學。
介紹了基于經典圖像處理和機器學習理論的快速、準確的圖像分割方法。
介紹了改進的卷積神經網絡在場景分割、目標識別和變化檢測等方面的技術。
重點介紹了圖像分割在交通圖像分析、醫學圖像分析、遙感應用、材料分析等各種應用場景中的效果。
圖像分割:原理、技術和應用是本科生和研究生課程的基本資源,如圖像和視頻處理、計算機視覺和數字信號處理,以及在計算機視覺和圖像分析工作的研究人員尋求改進他們的技術和方法。
Part I : Principles CHAPTER 1 Introduction (Pages: 1-19) CHAPTER 2 Clustering (Pages: 21-35) CHAPTER 3 Mathematical Morphology (Pages: 37-62) CHAPTER 4 Neural Networks (Pages: 63-96)Part II : Methods CHAPTER 5 Fast and Robust Image Segmentation Using Clustering (Pages: 97-123)
CHAPTER 6 Fast Image Segmentation Using Watershed Transform (Pages: 125-150) CHAPTER 7 Superpixel-Based Fast Image Segmentation (Pages: 151-177)Part III : Applications CHAPTER 8 Image Segmentation for Traffic Scene Analysis (Pages: 179-198) CHAPTER 9 Image Segmentation for Medical Analysis (Pages: 199-227) CHAPTER 10 Image Segmentation for Remote Sensing Analysis (Pages: 229-262) CHAPTER 11 Image Segmentation for Material Analysis (Pages: 263-288)
基于深度學習模型的目標檢測討論了利用深度學習方法進行目標檢測和識別的最新進展,這些方法在計算機視覺和圖像處理領域取得了巨大成功。它提供了深度學習理論及其在計算機視覺應用的最新發展的系統和系統的概述,說明了它們使用的關鍵主題,包括對象檢測,人臉分析,3D對象識別,和圖像檢索。這本書提供了理論與實踐的豐富結合。它適合對深度學習、計算機視覺等感興趣的學生、研究人員和從業人員,也可以作為參考書使用。通過對各種深度學習應用的綜合比較,幫助對機器學習和微積分有基本了解的讀者掌握理論,啟發在其他計算機視覺任務中的應用。特點:
這本書提供了一個現代的,獨立的介紹數字圖像處理。我們設計了這本書,既供學習者使用,希望建立一個堅實的基礎,也供尋找最重要技術的詳細分析和透明實現的實踐者使用。這是德語原版書的第三個英文版本,它已被廣泛使用:
這本現代的,獨立的教科書提供了一個數字圖像的領域介紹。這備受期待的第三版的權威教科書的數字圖像處理已完全修訂,并擴大了新的內容,改進插圖和教材。
主題和特點:
包含關于幾何基元擬合,隨機特征檢測(RANSAC),和最大穩定極值區域(MSER)的新章節 包括大多數章節的練習,并在相關網站上提供額外的補充材料和軟件實現 所有示例都使用ImageJ,這是一種廣泛使用的開源圖像環境,可以在所有主要平臺上運行 以數學形式逐步描述每個解決方案,作為抽象的偽代碼算法和完整的Java程序,可以很容易地移植到其他編程語言 在前言中提出一個或兩個學期課程的建議大綱
高級本科生和研究生將發現這全面和例子豐富的教科書將作為理想的介紹數字圖像處理。它也將證明寶貴的研究人員和專業人士尋求一個切實集中的自學入門。
//link.springer.com/book/10.1007/978-3-031-05744-1
深度學習:全面指南提供了深度學習(DL)和機器學習(ML)的概念的全面覆蓋。DL和ML是最受歡迎的領域,需要深刻的理解。這本書使讀者能夠基于ML和DL構建創新和有用的應用。從神經網絡的基礎開始,并繼續通過各種類型的CNN, RNNs, LSTM的架構,以及更多,直到書的結尾,每一個主題都給予了最大的照顧和專業和全面的塑造。
關鍵特征: 包括從ML概念到DL概念的平穩過渡
對于所有基于代碼的示例,都提供了逐行解釋
包括許多實際的例子和面試問題
即使是非計算機科學背景的人也可以從這本書中受益,學習理論、例子、案例研究和代碼片段
每一章都以目標開始,并以一組測試讀者理解力的測試問題結束
包括對提供額外指導的相關YouTube視頻的引用
人工智能是每個人的領域。這本書面向所有人,不論他們的專業領域是什么。畢業生和研究人員在深度學習將發現這本書有用。
PyTorch是Facebook于2017年初在機器學習和科學計算工具Torch的基礎上,針對Python語言發布的一個全新的機器學習工具包,一經推出便受到了業界的廣泛關注和討論,目前已經成為機器學習從業人員的研發工具。
《PyTorch深度學習》是使用PyTorch構建神經網絡模型的實用指南,內容分為9章,包括PyTorch與深度學習的基礎知識、神經網絡的構成、神經網絡的知識、機器學習基礎知識、深度學習在電腦視覺中的應用、深度學習在序列數據和文本中的應用、生成網絡、現代網絡架構,以及PyTorch與深度學習的未來走向。
《PyTorch深度學習》適合對深度學習領域感興趣且希望一探PyTorch的業內人員閱讀;具備其他深度學習框架使用經驗的讀者,也可以通過本書掌握PyTorch的用法。
Vishnu Subramanian在領導、設計和實施大數據分析項目(人工智能、機器學習和深度學習)方面富有經驗。
擅長機器學習、深度學習、分布式機器學習和可視化等。 在零售、金融和旅行等行業頗具經驗,還善于理解和協調企業、人工智能和工程團隊之間的關系。
隨著深度學習的快速發展, 生成式模型領域也取得了顯著進展. 生成對抗網絡(Generative adversarial network, GAN)是一種無監督的學習方法, 它是根據博弈論中的二人零和博弈理論提出的. GAN具有一個生成器網絡和一個判別器網絡, 并通過對抗學習進行訓練. 近年來, GAN成為一個炙手可熱的研究方向. GAN不僅在圖像領域取得了不錯的成績, 還在自然語言處理(Natural language processing, NLP)以及其他領域嶄露頭角. 本文對GAN的基本原理、訓練過程和傳統GAN存在的問題進行了闡述, 進一步詳細介紹了通過損失函數的修改、網絡結構的變化以及兩者結合的手段提出的GAN變種模型的原理結構, 其中包括: 條件生成對抗網絡(Conditional GAN, CGAN)、基于Wasserstein 距離的生成對抗網絡(Wasserstein-GAN, WGAN)及其基于梯度策略的WGAN (WGAN-gradient penalty, WGAN-GP)、基于互信息理論的生成對抗網絡(Informational-GAN, InfoGAN)、序列生成對抗網絡(Sequence GAN, SeqGAN)、Pix2Pix、循環一致生成對抗網絡(Cycle-consistent GAN, Cycle GAN)及其增強Cycle-GAN (Augmented CycleGAN). 概述了在計算機視覺、語音與NLP領域中基于GAN和相應GAN變種模型的基本原理結構, 其中包括: 基于CGAN的臉部老化應用(Face aging CGAN, Age-cGAN)、雙路徑生成對抗網絡(Two-pathway GAN, TP-GAN)、表示解析學習生成對抗網絡(Disentangled representation learning GAN, DR-GAN)、對偶學習生成對抗網絡(DualGAN)、GeneGAN、語音增強生成對抗網絡(Speech enhancement GAN, SEGAN)等. 介紹了GAN在醫學、數據增強等領域的應用情況, 其中包括: 數據增強生成對抗網絡(Data augmentation GAN, DAGAN)、醫學生成對抗網絡(Medical GAN, MedGAN)、無監督像素級域自適應方法(Unsupervised pixel-level domain adaptation method, PixelDA). 最后對GAN未來發展趨勢及方向進行了展望.
//www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180831