亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

過去的十年見證了大型機器學習(ML)模型的巨大成功。對海量數據的訪問在這一成功中發揮了關鍵作用。俗話說,“數據是新石油”,它為ML引擎提供動力。因此,在關鍵行業,如IT、金融、生物醫學等,生成、購買或銷售數據的競爭成為日益增長的趨勢。然而,與開發數據驅動的機器學習模型的廣泛研究相比,對數據本身的研究——例如,如何獲取、評估、交換和價格數據——卻很少被探索,事實上,最近才開始。原則性地理解數據本身對于促進數據的創建、填充和使用至關重要。

本教程的目標是讓你了解最近關于數據價值的研究,從統計學和經濟學的角度,如何有效地為數據或信息定價,以及如何從經濟代理人那里收集數據。對于每個方面,我們將描述基本概念、當前狀態或關鍵結果,以及開放問題。

在簡要介紹之后,本教程分為三個部分,分別從該領域的三個關鍵利益相關者的角度進行介紹:數據買家,數據賣家和ML供應商。第一部分站在數據購買者的角度,涵蓋了數據價值建模的統計方法和經濟方法。第二部分從數據賣家的角度出發,討論了最近關于如何給數據定價以及如何通過匯總人群信息來收集數據的工作。最后,討論了ML供應商的市場和競爭。

//www.haifeng-xu.com/DataEcon-aaai23/index.html

付費5元查看完整內容

相關內容

長期以來,用于開發工業規模搜索引擎的機器學習技術一直是大多數領域及其在線產品的重要組成部分。搜索相關性算法是電子商務、流媒體服務和社交網絡等不同領域產品的關鍵組成部分。在本教程中,我們計劃介紹這種大規模的搜索排名系統,特別關注該領域的深度學習技術。我們計劃涵蓋的主題如下:(1)搜索排名系統在實踐中的概述,包括流行的技術,如頁面排名算法和BM25;(2)介紹搜索排序的序列模型和語言模型;(3)該領域的知識蒸餾方法。對于前面提到的每一節課,我們計劃先做一個介紹性的演講,然后再復習一個實際操作的教程,以真正地鉆研概念。我們計劃通過演示、案例研究和實踐示例來涵蓋基本概念,包括最新的深度學習方法,這些方法在生成最相關的搜索結果方面取得了最先進的結果。此外,我們計劃展示這些方法在python中的示例實現,利用各種開放源碼的機器學習庫以及真實的工業數據或開放源碼數據。

//dlranking.github.io/dlrr/

相關性排序是信息檢索(Information Retrieval, IR)的核心問題,在網絡搜索引擎等許多應用中起著至關重要的作用。給定一個查詢和一組候選文本文檔,使用一個排名函數通過生成分數來確定文檔相對于查詢的相關度。早期的排序方法專注于查詢和web文檔之間的文本匹配,如BM25[7],向量空間模型[1]等。然而,隨著網絡信息的巨大增長,越來越多的自然語言格式的查詢以及更多的維度特征(包括時間和空間維度)對現有的排名解決方案提出了挑戰。近年來,深度學習方法在許多機器學習排名應用中表現出了巨大的成功,包括DSSM [3], CDSSM [8], DeepRank[6]等。

在本教程中,我們將概述搜索排名的實踐,并演示各種經典和流行的排名算法,以幫助讀者理解搜索相關性算法及其在現實世界中的應用。本教程大綱如下:搜索相關性排名介紹:在這一環節中,我們將概述信息檢索[9]中的排名問題。回顧了排序函數的一些早期工作,并簡要介紹了各種排序函數模型的歷史。我們選擇了一些關鍵的算法來使用真實數據解釋和演示它們的排名表現。我們介紹了幾個關鍵的性能指標來評估排名和在線指標。我們的實踐課程涵蓋了經典排名函數的實現。基于注意力的搜索相關性模型:在這一環節中,我們將概述序列模型的發展,然后討論注意力機制。我們還將介紹Transformer架構,以及如何在搜索排名系統的上下文中利用其中一些架構。具體內容如下: (1) 我們介紹了序列模型(如RNN和LSTM)是什么,訓練它們時所做的假設是什么,它們更適合于搜索排名系統的哪種數據集。(2)注意力/自注意力: 我們解釋一般注意力機制。(3) Transformer:與上述兩點類似,我們以真實的搜索排序和自然語言處理任務為背景來解釋和激發Transformer架構。(4) 操作會話封面訓練:注意力/Transformer模型。知識蒸餾的搜索相關性: 在這一環節,我們提供了一個介紹的深度結構化語義模型(DSSM)[3],已廣泛采用在工業中,其質量和高效的架構。我們還介紹了最近的NLP突破,BERT[2]在對查詢文檔對進行評分方面明顯優于DSSM及其變體。然而,我們表明,它的Transformer交叉層同時是昂貴的,因此它不允許離線預計算文檔。為了連接兩者,我們將我們提出的知識蒸餾[5]從教師BERT模型分享到學生模型。新的學習方法明顯勝過傳統的DSMM模型,從點擊中學習。在實踐環節中,聽眾接受了關于在開源數據集上搜索相關性的知識提煉的培訓。提供的代碼示例用于訓練雙塔學生模型,測試數據集用于聽眾體驗教師和學生模型之間的度量差異。

付費5元查看完整內容

自動化機器學習(AutoML)有望將原始數據轉換為準確的預測,而不需要大量的人力、專業知識和人工實驗。在這個講座式的教程中,我們將演示多模態AutoML的基本技術。與大多數專注于解決包含分類和數字特征的表格任務的AutoML系統不同,我們考慮對各種類型的數據(包括表格特征、文本和圖像及其組合)進行監督學習任務。我們強調的不是單個ML模型如何工作的技術描述,而是如何在接受原始訓練數據并輸出測試數據預測的整體ML流程中最好地使用模型。

我們教程的主要重點是自動構建和訓練深度學習模型,這些模型功能強大,但手動管理起來很麻煩。本教程中涉及的每個主題都附帶了一個實踐的Jupyter筆記本,它實現了最佳實踐(教程前后都可以在GitHub上獲得)。大部分代碼采用了AutoGluon,這是一個最新的開源AutoML工具包,它既先進又易于使用。

付費5元查看完整內容

氣候變化是當今社會面臨的最大挑戰之一,需要全社會迅速采取行動。在本教程中,我們將介紹氣候變化,解決它意味著什么,以及機器學習如何發揮作用。從能源到農業到災害響應,我們將描述機器學習可以幫助的高影響問題,例如,通過提供決策相關信息、優化復雜系統和加速科學實驗。這些問題包含了方法創新和實際實施的激動人心的機會。我們還將介紹機器學習研究人員和從業者參與的途徑,以及負責任的開發和部署此類工作的關鍵考慮因素。雖然本教程將主要討論機器學習幫助應對氣候變化的機會,但值得注意的是,機器學習是一種通用技術,可以用于幫助和阻礙氣候行動的應用。此外,機器學習有自己的計算和硬件足跡。因此,我們將簡要介紹一個框架,以理解和情境化機器學習的整體氣候影響,并描述機器學習研究和實踐的相關考慮。通過本教程的課程,我們希望參與者能夠更深入地了解氣候變化和機器學習是如何相互交織的,以及他們如何能夠通過使用他們的技能來幫助解決氣候危機。

付費5元查看完整內容

機器學習模型和數據驅動系統正越來越多地用于幫助在金融服務、醫療保健、教育和人力資源等領域做出決策。機器學習應用程序提供了諸如提高準確性、提高生產率和節約成本等好處。這一趨勢是多種因素共同作用的結果,最顯著的是無處不在的連通性、使用云計算收集、聚合和處理大量細粒度數據的能力,以及對能夠分析這些數據的日益復雜的機器學習模型的更好訪問。

開發負責任的人工智能解決方案是一個過程,涉及在人工智能生命周期的所有階段與關鍵利益相關者(包括產品、政策、法律、工程和人工智能/ML團隊,以及最終用戶和社區)進行輸入和討論。在本文中,我們主要關注ML生命周期中用于偏見和可解釋性的技術工具。我們還提供了一個簡短的章節,介紹了AI公平性和可解釋性的限制和最佳實踐。

//pages.awscloud.com/rs/112-TZM-766/images/Amazon.AI.Fairness.and.Explainability.Whitepaper.pdf

付費5元查看完整內容

數據挖掘和機器學習的基本算法構成了數據科學的基礎,利用自動化方法分析各種數據的模式和模型,應用范圍從科學發現到商業分析。本教材面向本科和研究生課程,全面深入地介紹了數據挖掘、機器學習和統計學,為學生、研究人員和實踐者提供了堅實的指導。這本書奠定了數據分析、模式挖掘、聚類、分類和回歸的基礎,集中在算法和潛在的代數、幾何和概率概念上。新的第二版是一個完整的部分致力于回歸方法,包括神經網絡和深度學習。

  • 涵蓋核心方法和前沿研究,包括深度學習

  • 提供了一種基于開源實現的算法方法

  • 包含了經過類測試的例子和練習,允許課程設計的靈活性和現成的參考

數據挖掘和機器學習使人能夠從數據中獲得基本的見解和知識。它們允許發現深刻的、有趣的和新穎的模式,以及從大規模數據中描述的、可理解的和可預測的模型。在這個領域有幾本好書,但其中很多不是太高級就是太高級。這本書是一個介紹性的文本,奠定了機器學習和數據挖掘的基本概念和算法的基礎。重要的概念在第一次遇到時就會被解釋,并附有詳細的步驟和推導。本書的主要目標是通過對數據和方法的幾何、(線性)代數和概率解釋的相互作用,建立公式背后的直覺。這第二版在回歸上增加了一個完整的新部分,包括線性和邏輯回歸,神經網絡,和深度學習。其他章節的內容也進行了更新,已知的勘誤表也得到了修正。本書的主要部分包括數據分析基礎、頻繁模式挖掘、聚類、分類和回歸。這些課程涵蓋了核心方法以及尖端主題,如深度學習、核方法、高維數據分析和圖分析。

深度學習,核方法,高維數據分析,圖分析。這本書包括許多例子來說明概念和算法。它也有結束語練習,在課堂上使用過。書中所有的算法都是由作者實現的。為了幫助實際理解,我們建議讀者自己實現這些算法(例如,使用Python或R)。如幻燈片、數據集和視頻等補充資源可以在該書的同伴站點在線獲得:

//dataminingbook.info

目錄內容: Front Matter Contents Preface

PART I. DATA ANALYSIS FOUNDATIONS

1 Data Mining and Analysis 2 Numeric Attributes 3 Categorical Attributes 4 Graph Data 5 Kernel Methods 6 High-dimensional Data 7 Dimensionality Reduction

PART II. FREQUENT PATTERN MINING

8 Itemset Mining 9 Summarizing Itemsets 10 Sequence Mining 11 Graph Pattern Mining 12 Pattern and Rule Assessment

PART III. CLUSTERING

13 Representative-based Clustering 14 Hierarchical Clustering 15 Density-based Clustering 16 Spectral and Graph Clustering 17 Clustering Validation PART IV. CLASSIFICATION

18 Probabilistic Classification 19 Decision Tree Classifier 20 Linear Discriminant Analysis 21 Support Vector Machines 22 Classification Assessment

PART V. REGRESSION

23 Linear Regression 24 Logistic Regression 25 Neural Networks 26 Deep Learning 27 Regression Evaluation

Index

圖片

付費5元查看完整內容

人工智能(AI)在決定我們日常體驗方面扮演著越來越重要的角色。人工智能的應用越來越多地不再局限于搜索和推薦系統,如網絡搜索、電影和產品推薦,但人工智能也被用于對個人、企業和社會至關重要的決策和流程。在招聘、借貸、刑事司法、醫療保健和教育等領域,基于web的人工智能解決方案對個人和專業的影響是深遠的。

在人工智能系統的開發和部署中,有許多因素發揮著作用,它們可能會表現出不同的、有時是有害的行為。例如,訓練數據往往來自社會和現實世界,因此它可能反映了社會對少數民族和弱勢群體的偏見和歧視。例如,少數族裔與多數族裔在類似行為上面臨更高的逮捕率,所以在沒有補償的情況下構建一個人工智能系統可能只會加劇這種偏見。

上述問題凸顯出需要監管、最佳實踐和實用工具,以幫助數據科學家和ML開發人員構建安全、隱私保護、透明、可解釋、公平和負責的人工智能系統,以避免可能對個人、企業和社會有害的意外后果和合規挑戰。

在這些原則中,模型的透明度和可解釋性是在需要可靠性和安全性的高風險領域(如醫療保健和自動化運輸)建立信任和采用人工智能系統的先決條件,以及具有重大經濟影響的關鍵工業應用(如預測性維護、自然資源勘探和氣候變化建模)。除了可解釋性,越來越多的利益相關者質疑他們的人工智能系統的公平性,因為有很多例子可以說明不考慮公平性的后果,從人臉識別對白人男性的效果明顯優于有色女性,到歧視特定群體的自動招聘系統。通過整合工具來確保模型的透明度和公平性,可以讓數據科學家、工程師和模型用戶更容易調試模型,并實現確保AI系統的公平性、可靠性和安全性等重要目標。

最后,人工智能產品通常由ML模型驅動,這些模型根據敏感用戶數據進行訓練。給定足夠的復雜性——無論是從參數的數量[例如。或者用戶級個性化——,該模型可以對用戶的私人信息進行編碼。此外,通常需要在ML生命周期的不同階段確保用戶隱私,并保護不同類型的不良行為者和威脅場景,需要隱私保護AI方法。

在本教程中,我們將概述負責任的人工智能,強調人工智能中模型的可解釋性、公平性和隱私性,關鍵的法規/法律,以及提供關于基于web的人工智能/ML系統的理解的技術/工具。然后,我們將關注可解釋性、公平評估/不公平緩解和隱私技術在行業中的應用,其中我們提出了有效使用這些技術的實際挑戰/指導方針,以及從部署幾個web規模的機器學習和數據挖掘應用模型中獲得的經驗教訓。我們將介紹不同公司的案例研究,包括搜索和推薦系統、招聘、銷售、借貸和欺詐檢測等應用領域。我們將強調,與負責任的人工智能相關的主題是社會技術的,也就是說,它們是社會和技術交叉的主題。潛在的挑戰不能由技術人員單獨解決;我們需要與所有關鍵的利益相關者一起工作——比如技術的客戶、受技術影響的人,以及具有道德和相關學科背景的人——并在設計這些系統時考慮他們的輸入。最后,基于我們在行業中的經驗,我們將為數據挖掘/機器學習社區確定開放的問題和研究方向。

//sites.google.com/view/ResponsibleAITutorial

付費5元查看完整內容
北京阿比特科技有限公司