云南虫谷在线观看免费观看电视剧,蜜桃AV噜噜一区二区三区麻豆,日批视频网站免费看

?年前，在?公司和初創公司中，并沒有?量的深度學習科學家開發智能產品和服務。我們中年輕?（作者）進?這個領域時，機器學習并沒有在報紙上獲得頭條新聞。我們的??根本不知道什么是機器學習，更不? 說為什么我們可能更喜歡機器學習，而不是從事醫學或法律職業。機器學習是??具有前瞻性的學科，在現實世界的應?范圍很窄。而那些應?，例如語?識別和計算機視覺，需要?量的領域知識，以?于它們通常被認為是完全獨?的領域，而機器學習對于這些領域來說只是?個小組件。因此，神經?絡——我們在本書中關注的深度學習模型的前?，被認為是過時的?具。就在過去的五年?，深度學習給世界帶來了驚喜，推動了計算機視覺、?然語?處理、?動語?識別、強化學習和統計建模等領域的快速發展。有了這些進步，我們現在可以制造?以往任何時候都更?主的汽?（不過可能沒有?些公司試圖讓你相信的那么?主），可以?動起草普通郵件的智能回復系統，幫助?們從令? 壓抑的?收件箱中挖掘出來。在圍棋等棋類游戲中，軟件超越了世界上最優秀的?，這曾被認為是??年后的事。這些?具已經對?業和社會產?了越來越?泛的影響，改變了電影的制作?式、疾病的診斷?式，并在基礎科學中扮演著越來越重要的??——從天體物理學到?物學。

付費5元查看完整內容

相關內容

動手學深度學習

關注 0

深度學習 · 自然語言處理 · 亞利桑那州立大學（Arizona State University) ·

2021 年 7 月 29 日

[付費5元查看完整內容]《深度學習自然語言處理》新書，141頁pdf，Arizona大學

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

看到這些材料時，一個顯而易見的問題可能會出現:“為什么還要一本深度學習和自然語言處理的書?”已有多篇優秀的論文發表，涵蓋了深度學習及其在語言處理中的應用的理論和實踐兩個方面。然而，從我教授自然語言處理課程的經驗來看，我認為，盡管這些書的質量很好，但它們中的大多數并不是針對最有可能的讀者。這本書的目標讀者是那些在機器學習和自然語言處理之外的領域有技能的人，他們的工作至少部分依賴于對大量數據(尤其是文本數據)的自動分析。這些專家可能包括社會科學家、政治科學家、生物醫學科學家，甚至對機器學習了解有限的計算機科學家和計算語言學家。

現有的深度學習和自然語言處理書籍一般分為兩大陣營。第一個陣營側重于深度學習的理論基礎。這對前面提到的讀者肯定是有用的，因為在使用工具之前應該了解它的理論方面。然而，這些書往往假定了典型的機器學習研究者的背景，因此，我經常看到沒有這種背景的學生很快就會在這樣的材料中迷失。為了緩解這個問題，目前存在的第二種類型的書籍側重于機器學習從業者;也就是說，關于如何使用深度學習軟件，極少關注理論方面。我認為，關注實際方面同樣是必要的，但不是充分的。考慮到深度學習框架和庫已經變得相當復雜，由于理論上的誤解而誤用它們的幾率很高。我在我的課程中也經常看到這個問題。

因此，本書旨在為自然語言處理的深度學習的理論和實踐方面架起橋梁。我介紹了必要的理論背景，并假設讀者有最少的機器學習背景。我的目標是讓任何上過線性代數和微積分課程的人都能理解這些理論材料。為了解決實際方面的問題，本書包括用于討論的較簡單算法的偽代碼，以及用于更復雜體系結構的實際Python代碼。任何參加過Python編程課程的人都應該能夠理解這些代碼。讀完這本書后，我希望讀者能夠有必要的基礎，立即開始構建真實的、實用的自然語言處理系統，并通過閱讀有關這些主題的研究出版物來擴展他們的知識。

付費5元查看完整內容

概率圖模型 ·

2021 年 5 月 26 日

[付費5元查看完整內容]【2021新書】概率圖模型：原理與應用，370頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

這新版本的教科書/參考提供了從工程的角度對概率圖模型(PGMs)的介紹。它提供了關于馬爾科夫決策過程、圖模型和深度學習的新材料，以及更多的練習。

這本書涵蓋了PGM的每個主要類的基礎知識，包括表示、推理和學習原理，并回顧了每種類型的模型的實際應用。這些應用來自廣泛的學科，突出了貝葉斯分類器、隱藏馬爾可夫模型、貝葉斯網絡、動態和時間貝葉斯網絡、馬爾可夫隨機場、影響圖和馬爾可夫決策過程的許多使用。

概率圖模型(PGMs)及其在不確定性下進行智能推理的應用出現于20世紀80年代的統計和人工智能推理領域。人工智能的不確定性(UAI)會議成為這一蓬勃發展的研究領域的首要論壇。20歲的時候，我在圣何塞的UAI-92大學第一次見到了恩里克·蘇卡——我們都是研究生——在那里，他展示了他關于高層次視覺推理的關系和時間模型的研究成果。在過去的25年里，Enrique對我們的領域做出了令人印象深刻的研究貢獻，從客觀概率的基礎工作，到開發時態和事件貝葉斯網絡等高級形式的PGMS，再到PGMS的學習，例如，他的最新研究成果是用于多維分類的貝葉斯鏈分類器。

概率圖模型作為一種強大而成熟的不確定性推理技術已被廣泛接受。與早期專家系統中采用的一些特殊方法不同，PGM基于圖和概率論的強大數學基礎。它們可用于廣泛的推理任務，包括預測、監測、診斷、風險評估和決策。在開源軟件和商業軟件中有許多有效的推理和學習算法。此外，它們的力量和功效已通過其成功應用于大量現實世界的問題領域而得到證明。Enrique Sucar是PGM作為實用和有用技術建立的主要貢獻者，他的工作跨越了廣泛的應用領域。這些領域包括醫學、康復和護理、機器人和視覺、教育、可靠性分析以及從石油生產到發電廠的工業應用。

付費5元查看完整內容

Python · 深度學習 ·

2021 年 5 月 21 日

[付費5元查看完整內容]【2021新書】Python深度學習，316頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

掌握使用PyTorch實現深度學習解決方案的實踐方面，使用實踐方法理解理論和實踐。Facebook的人工智能研究小組開發了一個名為PyTorch的平臺，該平臺擁有良好的理論基礎和實用技能，為你在現實世界中應用深度學習做好了準備。

首先，您將了解PyTorch的深度學習是如何以及為什么成為一種具有開創性的框架，它帶有一組工具和技術來解決現實世界中的問題。接下來，這本書將為你打下線性代數、向量微積分、概率和最優化的數學基礎。在建立了這個基礎之后，您將繼續討論PyTorch的關鍵組件和功能，包括層、損失函數和優化算法。

您還將了解基于圖形處理單元(GPU)的計算，這對訓練深度學習模型是必不可少的。介紹了深度學習的前饋網絡、卷積神經網絡、循環神經網絡、長短時記憶網絡、自動編碼器網絡和生成對抗網絡等關鍵網絡結構。在許多訓練和優化深度學習模型的技巧的支持下，這個版本的Python深度學習解釋了使用PyTorch將這些模型帶到生產中的最佳實踐。

你會: 回顧機器學習的基本原理，如過擬合、欠擬合和正則化。了解深度學習的基本原理，如前饋網絡，卷積神經網絡，遞歸神經網絡，自動微分和隨機梯度下降。使用PyTorch深入應用線性代數探索PyTorch的基本原理及其構建塊使用調優和優化模型

付費5元查看完整內容

深度學習 · 計算機視覺 ·

2021 年 5 月 20 日

[付費5元查看完整內容]【2021新書】深度學習計算機視覺，320頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

圖像分類、目標檢測與跟蹤、姿態估計、人臉識別和情感估計在解決計算機視覺問題中都起著重要的作用。

本書將重點介紹這些和其他深度學習架構和技術，以幫助您創建使用Keras和TensorFlow庫的解決方案。您還將回顧多種神經網絡架構，包括LeNet、AlexNet、VGG、Inception、R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN、YOLO和SqueezeNet，并通過最佳實踐、技巧、捷徑和陷阱了解它們如何與Python代碼一起工作。所有代碼片段都將被分解并進行詳細討論，以便您可以在各自的環境中實現相同的原則。

使用深度學習的計算機視覺提供了一個全面而簡潔的指南，將DL和CV結合在一起，實現自動化操作，減少人工干預，提高能力，并降低成本。

你會:

掌握深度學習的代碼和概念，將指導原則應用到您自己的項目中
對各種體系結構進行分類和評估，以更好地理解您在各種用例中的選擇
深入基本深度學習功能，找出它們是如何工作的。

不久前，計算機視覺還只是科幻小說的專屬內容，但現在，即使不是在整個社會，也正迅速成為各行各業的普遍現象。人類視覺是人類感官中最珍貴的一種，在模仿人類視覺這一領域取得的進展令人驚嘆。直到1957年，拉塞爾·基爾希才掃描出了世界上第一張照片——他兒子的黑白照片。到20世紀80年代末，西羅維奇和柯比的工作幫助人臉識別成為一種可行的生物識別技術。盡管存在隱私問題和法律挑戰，但Facebook在2010年將人臉識別技術納入其社交媒體平臺時，使這項技術無處不在。

這本書試圖解釋計算機視覺問題的深度學習和神經網絡的概念。我們正在詳細研究卷積神經網絡，以及它們的各個組成部分和屬性。我們正在探索各種神經網絡架構，如LeNet, AlexNet, VGG, R-CNN, Fast R-CNN, Faster R-CNN, SSD, YOLO, ResNet, Inception, DeepFace，和FaceNet的細節。我們還在開發實用的解決方案，以解決二值圖像分類、多類圖像分類、目標檢測、人臉識別和視頻分析的用例。我們將使用Python和Keras作為解決方案。所有的代碼和數據集被檢入GitHub repo快速訪問。在最后一章中，我們將學習深度學習項目中的所有步驟——從定義業務問題到部署。我們還在處理在制定解決方案時面臨的重大錯誤和問題。在這本書中，我們提供了訓練更好的算法的技巧和技巧，減少訓練時間，監測結果，并改進解決方案。我們也分享代表性的研究論文和數據集，你應該使用它們來獲得進一步的知識。

這本書把這個主題分成三部分。在第1章到第4章，本書描述了神經網絡的本質和揭秘他們如何學習。并指出了不同的架構及其歷史意義。實踐者在擁有所有所需資源的情況下，可以體驗到LeNet優雅的簡單性、AlexNet提高的效率以及流行的VGG Net。在第5至7章，從業人員運用簡單而強大的計算機視覺應用，如訓練算法來檢測物體和識別人臉。在進行視頻分析時，我們遇到了漸變消失和爆炸的困擾問題，以及如何在ResNet架構中使用跳過連接來克服它。最后，在第8章中，我們回顧了完整的模型開發過程，從正確定義的業務問題開始，系統地推進，直到模型在生產環境中部署和維護。

付費5元查看完整內容

自然語言處理 · 自然語言處理現代方法 ·

2021 年 2 月 22 日

[付費5元查看完整內容]自然語言處理現代方法，176頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

近年來，自然語言處理的研究方法取得了一些突破。這些突破來源于兩個新的建模框架以及在計算和詞匯資源的可用性的改進。在這個研討會小冊子中，我們將回顧這些框架，以一種可以被視為現代自然語言處理開端的方法論開始:詞嵌入。我們將進一步討論將嵌入式集成到端到端可訓練方法中，即卷積神經網絡和遞歸神經網絡。這本小冊子的第二章將討論基于注意力的模型的影響，因為它們是最近大多數最先進的架構的基礎。因此，我們也將在本章中花很大一部分時間討論遷移學習方法在現代自然語言處理中的應用。最后一章將會是一個關于自然語言生成的說明性用例，用于評估最先進的模型的訓練前資源和基準任務/數據集。

//compstat-lmu.github.io/seminar_nlp_ss20/

在過去的幾十年里，人工智能技術的重要性和應用不斷得到關注。在當今時代，它已經與構成人類塑造環境的大部分環境密不可分。因此，商業、研究和開發、信息服務、工程、社會服務和醫學等無數部門已經不可逆轉地受到人工智能能力的影響。人工智能有三個主要領域組成了這項技術:語音識別、計算機視覺和自然語言處理(見Yeung (2020))。在這本書中，我們將仔細研究自然語言處理(NLP)的現代方法。

這本小冊子詳細介紹了用于自然語言處理的現代方法，如深度學習和遷移學習。此外，本研究亦會研究可用于訓練自然語言處理任務的資源，并會展示一個將自然語言處理應用于自然語言生成的用例。

為了分析和理解人類語言，自然語言處理程序需要從單詞和句子中提取信息。由于神經網絡和其他機器學習算法需要數字輸入來進行訓練，因此應用了使用密集向量表示單詞的詞嵌入。這些通常是通過有多個隱藏層的神經網絡學習的，深度神經網絡。為了解決容易的任務，可以應用簡單的結構神經網絡。為了克服這些簡單結構的局限性，采用了遞歸和卷積神經網絡。因此，遞歸神經網絡用于學習不需要預先定義最佳固定維數的序列的模型，卷積神經網絡用于句子分類。第二章簡要介紹了NLP中的深度學習。第三章將介紹現代自然語言處理的基礎和應用。在第四章和第五章中，將解釋和討論遞歸神經網絡和卷積神經網絡及其在自然語言處理中的應用。

遷移學習是每個任務或領域的學習模型的替代選擇。在這里，可以使用相關任務或領域的現有標記數據來訓練模型，并將其應用到感興趣的任務或領域。這種方法的優點是不需要在目標域中進行長時間的訓練，并且可以節省訓練模型的時間，同時仍然可以(在很大程度上)獲得更好的性能。遷移學習中使用的一個概念是注意力，它使解碼器能夠注意到整個輸入序列，或自注意，它允許一個Transformer 模型處理所有輸入單詞，并建模一個句子中所有單詞之間的關系，這使得快速建模一個句子中的長期依賴性成為可能。遷移學習的概念將在小冊子的第6章簡要介紹。第七章將通過ELMo、ULMFiT和GPT模型來描述遷移學習和LSTMs。第八章將詳細闡述注意力和自注意力的概念。第九章將遷移學習與自注意力相結合，介紹了BERT模型、GTP2模型和XLNet模型。

為NLP建模，需要資源。為了找到任務的最佳模型，可以使用基準測試。為了在基準實驗中比較不同的模型，需要諸如精確匹配、Fscore、困惑度或雙語評估替補學習或準確性等指標。小冊子的第十章簡要介紹了自然語言處理的資源及其使用方法。第11章將解釋不同的指標，深入了解基準數據集SQuAD、CoQa、GLUE和SuperGLUE、AQuA-Rat、SNLI和LAMBADA，以及可以找到資源的預訓練模型和數據庫，如“帶代碼的論文”和“大壞的NLP數據庫”。

在小冊子的最后一章中，介紹了生成性NLP處理自然語言生成，從而在人類語言中生成可理解的文本。因此，不同的算法將被描述，聊天機器人和圖像字幕將被展示，以說明應用的可能性。

本文對自然語言處理中各種方法的介紹是接下來討論的基礎。小冊子的各個章節將介紹現代的NLP方法，并提供了一個更詳細的討論，以及各種示例的潛力和限制。

付費5元查看完整內容

Python · 文本分析 ·

2020 年 12 月 23 日

[付費5元查看完整內容]【2020新書】Python文本分析，104頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

文本無處不在，對社會科學家來說，它是一個極好的資源。然而，由于信息非常豐富，而且語言又是千變萬化的，通常很難提取出我們想要的信息。人工智能的整個子領域與文本分析(自然語言處理)有關。開發的許多基本分析方法現在都可以作為Python實現使用。這本書將告訴您何時使用哪個方法、它如何工作的數學背景以及實現它的Python代碼。

概述：

今天，文本是我們生活中不可或缺的一部分，也是最豐富的信息來源之一。平均每天，我們閱讀約9000字，包括電子郵件、短信、新聞、博客文章、報告、推特，以及街道名稱和廣告。在你一生的閱讀過程中，這會讓你有大約2億字。這聽起來令人印象深刻(事實也的確如此)，然而，我們可以在不到0.5 g的空間里存儲這些信息:我們可以在u盤上隨身攜帶一生都值得閱讀的信息。在我寫這篇文章的時候，互聯網上估計至少有超過1200 TB的文本，或250萬人的閱讀價值。現在，大部分文本都以社交媒體的形式存在:微博、推特、Facebook狀態、Instagram帖子、在線評論、LinkedIn個人資料、YouTube評論等等。然而，文本即使在線下也是豐富的——季度收益報告、專利申請、問卷答復、書面信函、歌詞、詩歌、日記、小說、議會會議記錄、會議記錄，以及成千上萬的其他形式，可以(也正在)用于社會科學研究和數據挖掘。

文本是一個極好的信息來源，不僅僅是因為它的規模和可用性。它(相對)是永久性的，而且——最重要的是——它對語言進行編碼。這一人類能力(間接地，有時甚至直接地)反映了廣泛的社會文化和心理結構:信任、權力、信仰、恐懼。因此，文本分析被用于衡量社會文化結構，如信任(Niculae, Kumar, Boyd-Graber， & danescul - niculescul - mizil, 2015)和權力(Prabhakaran, Rambow， & Diab, 2012)。語言編碼了作者的年齡、性別、出身和許多其他人口統計因素(Labov, 1972;Pennebaker, 2011;Trudgill, 2000)。因此，文本可以用來衡量社會隨著時間推移對這些目標概念的態度(見Garg, Schiebinger, Jurafsky， & Zou, 2018;Hamilton, Leskovec， & Jurafsky, 2016;Kulkarni, Al-Rfou, Perozzi， & Skiena, 2015)。

然而，這種海量數據可能很快就會讓人喘不過氣來，處理這些數據可能會讓人望而生畏。文本通常被稱為非結構化數據，這意味著它不是以電子表格的形式出現，而是整齊地按類別排列。它有不同的長度，如果不首先對其進行格式化，就不能很容易地將其送入您喜歡的統計分析工具。然而，正如我們將看到的，“非結構化”是一個有點用詞不當。文本絕不是沒有任何結構的——它遵循非常規則的結構，受語法規則的控制。如果你知道這些，理解文本就會變得容易得多。

這本書分成兩部分。在前半部分，我們將學習文本和語言的一些基本屬性——語言分析的層次、語法和語義成分，以及如何描述它們。我們還將討論為我們的分析刪除哪些內容，保留哪些內容，以及如何計算簡單、有用的統計數據。在下半部分，我們將著眼于探索，發現數據中的潛在結構。我們將從簡單的統計學習到更復雜的機器學習方法，如主題模型、詞嵌入和降維。

付費5元查看完整內容

深度學習 · 自然語言處理 ·

2020 年 11 月 7 日

[付費5元查看完整內容]【2020新書】深度學習自然語言處理簡明導論，69頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

當看到這些材料時，一個明顯的問題可能會出現:“為什么還要寫一本深度學習和自然語言處理的書呢?”一些優秀的論文已經出版，涵蓋了深度學習的理論和實踐方面，以及它在語言處理中的應用。然而，從我教授自然語言處理課程的經驗來看，我認為，盡管這些書的質量非常好，但大多數都不是針對最有可能的讀者。本書的目標讀者是那些在機器學習和自然語言處理之外的領域有經驗的人，并且他們的工作至少部分地依賴于對大量數據，特別是文本數據的自動化分析。這些專家可能包括社會科學家、政治科學家、生物醫學科學家，甚至是對機器學習接觸有限的計算機科學家和計算語言學家。

現有的深度學習和自然語言處理書籍通常分為兩大陣營。第一個陣營專注于深度學習的理論基礎。這對前面提到的讀者肯定是有用的，因為在使用工具之前應該了解它的理論方面。然而，這些書傾向于假設一個典型的機器學習研究者的背景，因此，我經常看到沒有這種背景的學生很快就迷失在這樣的材料中。為了緩解這個問題，目前存在的第二種類型的書集中在機器學習從業者;也就是說，如何使用深度學習軟件，而很少關注理論方面。我認為，關注實際方面同樣是必要的，但還不夠。考慮到深度學習框架和庫已經變得相當復雜，由于理論上的誤解而濫用它們的可能性很高。這個問題在我的課程中也很常見。

因此，本書旨在為自然語言處理的深度學習搭建理論和實踐的橋梁。我涵蓋了必要的理論背景，并假設讀者有最少的機器學習背景。我的目標是讓任何上過線性代數和微積分課程的人都能跟上理論材料。為了解決實際問題，本書包含了用于討論的較簡單算法的偽代碼，以及用于較復雜體系結構的實際Python代碼。任何上過Python編程課程的人都應該能夠理解這些代碼。讀完這本書后，我希望讀者能有必要的基礎，立即開始構建真實世界的、實用的自然語言處理系統，并通過閱讀有關這些主題的研究出版物來擴展他們的知識。

//clulab.cs.arizona.edu/gentlenlp/gentlenlp-book-05172020.pdf

付費5元查看完整內容

百頁機器學習 ·

2020 年 9 月 22 日

[付費5元查看完整內容]干貨|書籍《百頁機器學習》推薦（附最新135頁PDF下載）

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

《The Hundred-Page Machine Learning Book》，中文翻譯為為《百頁機器學習書》。這本書是Andriy Burkov所著，其是Gartner的機器學習團隊負責人。這本書短小精悍，只有一百頁左右，包含大量自 20 世紀 60 年代以來具有重要實用價值的機器學習材料。它既適用于初學者，也適用于有經驗的從業者。

讓我們從實話實說開始：機器其實不會學習。典型的“Learning Machine”所做的是找到一個數學公式，當它應用于一組輸入(稱為“訓練數據”)時，就會產生所需的輸出。這個數學公式還可以為大多數其他輸入(與訓練數據不同)生成正確的輸出，條件是這些輸入來自與訓練數據相同或類似的統計分布。

為什么這不是學習?因為如果你稍微改變或扭曲一下輸入，輸出就很可能完全錯誤。但動物的學習不是這樣的。如果你學會了通過直視屏幕來玩電子游戲，那么如果有人稍微轉動一下屏幕，你仍然可以玩得很好。機器學習算法，如果它是通過“直視”屏幕來訓練的，除非它也經過了識別旋轉的訓練，否則它將無法在旋轉的屏幕上玩游戲。

那么為什么叫“機器學習”呢?原因是由于市場營銷：美國電腦游戲和人工智能領域的先驅阿瑟?塞繆爾(Arthur Samuel) 于1959年在IBM工作時創造了這個詞。與IBM在2010年試圖推銷“認知計算(cognitive computing)”一詞在競爭中脫穎而出的情況類似，在上世紀60年代，IBM使用了新的“機器學習(machine learning)”一詞來吸引客戶和有才華的員工。

正如你所看到的，就像人工智能不是智能一樣，機器學習也不是學習。然而，機器學習是一個被普遍認可的術語，通常指的是制造機器的科學和工程，這些機器能夠在沒有明確編程的情況下完成各種有用的事情。因此，這個術語中的“學習”這個詞是用來類比動物的學習，而不是字面上的學習。

付費5元查看完整內容