亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

在海量數據的時代,高效的機器學習算法變得至關重要。然而,許多常見的機器學習算法依賴于在大數據集上計算成本過高的子程序。通常,現有的技術會對數據進行子采樣或使用其他方法來提高計算效率,但這會以引入一些近似誤差為代價。這篇論文表明,往往只需用一種特殊的隨機化方法替代計算密集型的子程序,就能在幾乎不降低質量的情況下獲得足夠的效果。這篇論文的結果是基于自適應采樣文獻中的技術。第1章以一個特定的自適應采樣問題為引子:多臂老虎機中的最佳臂識別。我們首先提供了環境設定和最佳臂識別問題的正式描述。然后,我們介紹了一種名為“連續淘汰”的通用算法,用于解決最佳臂識別問題。在第2章,第3章和第4章,我們將把在第1章中開發的技術應用于不同的問題。在第2章,我們討論了如何將k-medoids聚類問題簡化為一系列的最佳臂識別問題。我們利用這一發現提出了一種基于連續淘汰的新算法,該算法在聚類質量上與先前的最新技術相當,但達到相同解的速度要快得多。在數據生成分布的一般假設下,我們的算法在樣本復雜性上實現了 O( n logn ) 的降低,其中 n 是數據集的大小。

在第3章中,我們分析了訓練基于樹的模型的問題。這類模型的大部分訓練時間都用在分割樹的每個節點上,即確定在哪個特征和相應的閾值處分割每個節點。我們展示了節點分割子程序可以簡化為一個最佳臂識別問題,并介紹了一種訓練樹的最新算法。我們的算法僅依賴于每個可能分割的相對質量,而不是顯式地依賴于訓練數據集的大小,并將數據集大小n的顯式依賴從常用的先前算法的O(n)降低到O(1)。我們的算法通常適用于許多基于樹的模型,如隨機森林和XGBoost。在第4章中,我們研究最大內積搜索問題。我們注意到,與k-medoids和節點分割問題一樣,最大內積搜索問題可以簡化為一個最佳臂識別問題。有了這個觀察,我們為高維數據集中的最大內積搜索問題提出了一個新穎的算法。在對數據的合理假設下,我們的算法將與數據集維數d的顯式比例從O(√d)降低到O(1)。我們的算法具有幾個優點:它不需要對數據進行預處理,能自然處理新增或刪除的數據點,并包含一個超參數來權衡準確性和效率。第5章以總結本論文的貢獻和未來工作的可能方向作為結論。

//searchworks.stanford.edu/view/14783548

付費5元查看完整內容

相關內容

 (StanfordUniversity)位于加利福尼亞州,臨近舊金山,占地35平方公里,是美國面積第二大的大學。它被公認為世界上最杰出的大學之一,相比美國東部的常春藤盟校,特別是哈佛大學、耶魯大學,斯坦福大學雖然歷史較短,但無論是學術水準還是其他方面都能與常春藤名校相抗衡。斯坦福大學企業管理研究所和法學院在美國是數一數二的,美國最高法院的9個大法官,有6個是從斯坦福大學的法學院畢業的。

最近機器學習領域取得了重大的進展,其中序列模型是深度學習模型的核心,這些模型在科學應用中取得了廣泛的成功。然而,現有的方法需要針對不同任務、模態和能力進行大量的專門化,存在計算效率瓶頸,并且在建模更復雜的序列數據(例如涉及長依賴性的情況)時存在困難。因此,繼續開發有原則和實用性的建模通用序列的方法仍然具有基本重要性。本論文提出了一種使用狀態空間模型進行深度序列建模的新方法,該方法具有理論基礎、計算效率高,并在各種數據模態和應用中取得了強大的結果。首先,我們引入了一類具有多種表示和屬性的模型,它們綜合了標準深度序列模型(如循環神經網絡和卷積神經網絡)的優勢。然而,我們表明計算這些模型可能具有挑戰性,并且開發了一類在現代硬件上非常快速的結構化狀態空間,無論是在長序列的擴展上還是在其他設置(如自回歸推斷)上。最后,我們提出了一種新穎的數學框架,用于逐步建模連續信號,它可以與狀態空間模型相結合,賦予它們具有原則性的狀態表示,并提高其對長程依賴關系的建模能力。總的來說,這種新的方法類為機器學習模型提供了有效且多功能的構建模塊,特別是在大規模處理通用序列數據方面具有重要意義。

付費5元查看完整內容

機器學習系統在面對分布偏移時并不具備魯棒性——當它們在與訓練環境不同的環境中部署時,準確率會大幅下降。例如,當在新的國家部署衛星遙感模型、在新的醫院部署腫瘤檢測模型,或在新的森林中部署野生動物保護模型時,它們都會面臨準確率大幅下降的問題。在這篇論文中,我們證明了基礎模型范例是一個原則性的解決方案,可以達到最先進的魯棒性。基礎模型范例包括三個步驟:在多樣化的無標簽數據上預訓練模型(例如,來自世界各地的衛星圖像)以學習通用的表示,然后將這些模型適應到我們關心的下游任務,最后在真實世界中部署這些模型。這篇論文將專注于理解和改善這三個步驟以提高魯棒性。(1) 首先,我們展示了在無標簽數據上的預訓練能學習到可遷移的表示,即使在我們沒有標簽的領域也能提高準確性。我們解釋了為什么預訓練能以與某些傳統直觀(領域不變性)完全不同的方式工作。我們的理論預測了真實數據集的現象,并導出了改善預訓練方法的建議。(2) 接下來,我們將展示標準的適應方法(更新模型的所有參數)可能會扭曲預訓練表示,并且在分布外表現不佳。我們的理論分析引導出了更好的適應方法,以及在ImageNet以及諸如衛星遙感、野生動物保護和放射學等應用中的最先進準確度。(3) 最后,當我們在現實世界中部署模型時,數據分布會隨著時間的推移而變化,這會導致模型性能下降。我們展示了在模型自身預測上進行自訓練可以提高對分布偏移的魯棒性,并解釋了在何時以及為何自我訓練能夠工作。

在過去的十年中,機器學習(ML)取得了快速的進展。在ImageNet [Deng等人,2009,Russakovsky等人,2015]這一最受歡迎的機器學習基準測試中,準確率已經從54% [Sanchez和Perronnin,2011,Krizhevsky等人,2012]上升到了超過90% [Pham等人,2021]。最先進的深度學習模型現在可以生成類似人類的文本,高精度地翻譯語言,并從自然語言描述中編寫代碼 [Lewis等人,2020,Brown等人,2020,Chen等人,2021a]。快速的進展帶來了快速的部署。機器學習模型現在被用于醫學診斷 [Wong等人,2021],衛星遙感 [Xie等人,2016,Jean等人,2016,Hansen等人,2013],野生動物保護 [Beery等人,2020],以及警務 [Hill,2020]等諸多應用中。然而,一個關鍵的挑戰仍然存在:ML模型不具備魯棒性。ML模型在其訓練數據上的表現良好,但是當在不同的數據上進行評估時,它們的準確度會大幅下降 [Recht等人,2019,Hendrycks和Dietterich,2019,Hendrycks等人,2020a]。當衛星遙感模型在新的國家部署,腫瘤檢測模型在新的醫院部署,或者野生動物保護模型在新的森林中部署時,它們都會面臨準確度大幅下降的問題 [Jean等人,2016,Xie等人,2021a,Sagawa等人,2022]。這種缺乏魯棒性在幾乎所有的實際應用中都是一個重大問題。正式地說,我們從在來自分布Pid的標簽數據集上訓練的模型開始,我們稱之為在分布數據。標準的ML基準測試是在同一分布Pid的未見過的樣本組成的測試集上評估模型。但是當模型被部署時,會出現分布的偏移:模型需要對來自不同分布的數據Pid進行預測,我們稱之為分布外數據。這里,Pood可能表示來自不同國家,醫院或未來的數據。在實際應用中,從Pid到Pood的這種分布偏移是常態,因為部署環境通常與精心策劃的訓練數據不同。

盡管已有大量的先前工作和進展,但對分布偏移的魯棒性問題仍然沒有得到解決。現有的工作主要關注對小偏移的魯棒性,但實際的偏移往往更大。有一系列的工作研究了對抗性樣本[Szegedy等人,2014,Goodfellow等人,2015,Madry等人,2017,Raghunathan等人,2018],在這里,對手惡意地向圖像添加一小部分不可察覺的噪聲以欺騙模型的預測。另一線的工作研究了如重要性加權[Shimodaira,2000,Sugiyama等人,2007,Huang等人,2006],或者像H--H散度這樣的距離度量[Ben-David等人,2010,Mansour等人,2009]等方法。這些方法要求訓練分布(Pid)和部署分布(Pood)非常接近——例如,重要性加權假設Pid和Pood包含相同的樣本,但比例不同。在實踐中,分布偏移往往更大——例如,來自北美,歐洲和非洲的圖像看起來非常不同,來自不同醫院的數據通常看起來不同。還有許多其他的分布偏移方法,如CORAL [Sun和Saenko,2016],不變風險最小化 [Arjovsky等人,2019],和領域對抗訓練[Tzeng等人,2014,Ganin和Lempitsky,2015],這些在某些情況下有用但在其他情況下不適用 [Gulrajani和Lopez-Paz,2020,Sagawa等人,2022]。對于這些方法何時以及為何有效的理解也有限 [Zhao等人,2019]。為了構建對分布偏移具有魯棒性的模型,我們需要理解Pid和Pood可能如何相關。如果沒有任何結構——如果Pood與Pid有任意的不同——那么在Pood上表現良好是不可能的。正如我們接下來將看到的,學習Pid和Pood之間關系的一個強大工具是利用包含這兩種分布的多樣化的無標簽數據,例如來自互聯網的圖像或文本。

在這篇論文中,我們將展示基礎模型范式——對多樣化的無標簽數據進行預訓練,然后適應感興趣的任務(圖1.1)——是構建對分布偏移魯棒的模型的最有希望的方式之一。我們將解釋如何預訓練魯棒的基礎模型,以及如何將它們魯棒地適應特定任務。我們將展示預訓練和適應基礎模型所使用的算法和數據對于對分布偏移的魯棒性至關重要。例如,在第4章中,我們將看到用于預訓練模型的數據在其魯棒性中起著關鍵作用,并且通常比預訓練方法或損失的細節產生更大的影響。在第5章中,我們將展示適應基礎模型的標準算法,全精調,因為它扭曲了預訓練的表示而對分布偏移不魯棒。我們將看到適應方法的選擇至關重要,而有趣的是,它通常比預訓練算法的選擇產生更大的差異。利用我們的理論洞見,我們將找到更好的精調方法,大大提高模型的魯棒性。這篇論文將建立一些首次理解預訓練和適應正在學習什么的理論,通過引用和擴展理論概念(例如,譜圖理論,隨機矩陣理論,非凸優化)。然后,我們將把理論結果轉化為改進的實際算法。我們的方法已經在ImageNet(最受歡迎的機器學習基準之一)以及衛星遙感,野生動物保護和放射學等應用中取得了最好的準確性。

付費5元查看完整內容

優化算法的一個教科書式特性是在通用的正則條件下解決問題的能力。兩個例子分別是單純形方法和梯度下降(GD)方法。然而,這些基本且通用的優化算法的性能往往不盡如人意;它們經常運行緩慢,在通用設置下可能返回次優解。在我看來,這是它們通用性的代價;實際上,通用算法是一項成就,但對于許多問題來說,利用特殊結構所帶來的收益可能非常巨大。一個基本問題隨之產生:我們如何在算法中利用問題特定結構,以獲得具有強性能保證的快速、實用的算法?隨著更多結構化的數據驅動決策模型的出現,這個問題對實踐者來說變得越來越緊迫和相關。

例如,在非凸優化中,GD方法眾所周知容易陷入次優的鞍點。然而,一系列近期的研究表明,隨機初始化或擾動改變了GD的動態特性,并使其可證明地收斂于全局最優解。此外,馬爾可夫決策過程(MDP)和離散最優傳輸(OT)問題都可以通過大規模線性規劃來解決。與使用通用LP算法不同,策略迭代和Sinkhorn迭代利用了MDP和OT中的特殊結構,因此在實踐中表現更好。將算法調整為問題特定結構通常被稱為結構驅動的算法設計。

盡管這一研究方向已經被廣泛研究了70多年并取得了廣泛的成功,但機器學習的成功案例引入了新的表述,它們適合進行深入的理論分析和產生顯著的實際影響。我的研究通過識別可靠機器學習(極小極大優化)和多智能體機器學習(高階優化及以上)的特殊結構,以及設計計算適當定義的最優解的最優算法;還有其他結構化問題,如高效熵正則化最優傳輸、無梯度非光滑非凸優化以及在博弈中的自適應和雙重最優學習,推動了這一領域的發展。

付費5元查看完整內容

從壓縮相機到弱光攝影,許多計算成像系統的一個關鍵方面是用于從編碼或噪聲測量中發現信號的算法。一些計算相機將高維信息(例如不同波長的光、3D、時間)編碼到二維傳感器上,然后使用算法解碼和恢復這種高維信息。另一些捕獲的測量值極具噪聲或退化,需要算法來提取信號并使圖像可供人們使用,或供更高級別的下游算法使用。在每種情況下,用于解碼和從原始測量中提取信息的算法對于使計算攝像機發揮作用至關重要和必要。多年來,從計算攝像機中恢復信息的主要方法,經典方法都是基于最小化由數據項和精心挑選的先驗項組成的優化問題。最近,深度學習已被應用于這些問題,但往往無法納入已知的光學特性,需要大型訓練數據集,并導致無法輕松解釋的黑盒模型。本文提出基于物理信息的機器學習的計算成像,這是一種將經典方法的元素與深度學習相結合的中間方法。本文展示了如何將成像系統物理學的知識納入神經網絡,以提高圖像質量和性能,超出幾個計算相機的經典或深度方法的可行性。本文展示了幾種將成像物理納入神經網絡的不同方法,包括算法展開、可微光學模型、無監督方法以及通過生成式對抗網絡。對于這些方法中的每一種,都專注于具有獨特挑戰和建模考慮的不同計算相機。引入了一個展開的、基于物理的網絡,提高了無鏡頭相機的質量和重建時間,改善了這些相機,并在各種場景中顯示出逼真的圖像質量。在此基礎上,本文展示了一種新的重建網絡,可以將具有空間變化模糊度的壓縮單次3D顯微鏡的重建時間提高1600倍,從而實現場景的交互式預覽。在難以獲得訓練數據的情況下,未經訓練的物理信息網絡可以提高壓縮單次視頻和高光譜成像的圖像質量,而不需要訓練數據。設計了一種物理信息噪聲發生器,可以在極高增益、低照度設置下真實地合成噪聲。使用這個學習到的噪聲模型,我們展示了如何推動相機超過其典型的極限,并首次在星光級別的照明下拍攝逼真的視頻。每個案例都強調了使用基于物理學的機器學習如何改善計算相機并將其推向極限。

付費5元查看完整內容

在過去的幾十年里,機器學習在眾多人工智能應用中取得了長足的進步。然而,它的成功主要依賴于在一個封閉的環境中使用大量的離線數據訓練模型,然后在類似的測試環境中對它們進行評估。這意味著大多數機器學習模型無法在很少的觀察下快速適應新環境并在線學習新知識。相比之下,我們的人類大腦可以從在線感官輸入流中學習新的表示、概念和技能。**本文旨在使具有幾個核心能力的機器能夠在開放世界中學習新概念,而無需訪問大量精心策劃的標記數據。**具體來說,它解決了幾個關鍵問題,如使用有限的標記數據、增量數據、無標記數據以及不平衡和噪聲數據進行學習。本文提出的算法可以自然地與任何深度神經網絡相結合,并且與網絡架構無關。它們可以為各種開放世界條件提供更大的靈活性和魯棒性,使基于學習的方法適合部署在一般的基于智能體的智能系統中。

1.引言

**機器學習是人工智能領域的核心課題之一。由于許多智能行為不能簡單地由標準程序定義,而不是依靠人工設計的規則,本文使用機器學習來獲得函數逼近,給定許多輸入和輸出觀測。**今天,在機器學習的幫助下,我們的計算機可以識別我們的聲音和筆跡,記住我們的臉,標記我們的照片,翻譯不同的語言,在下棋和圍棋中擊敗我們,并在道路上安全駕駛汽車。就像阿蘭·圖靈在20世紀50年代設想的那樣,今天的計算機使用機器學習來“模擬”兒童的思維,這是一張逐漸充滿各種各樣的知識和表示的白紙。然而,機器的學習過程與兒童的學習過程仍有很大的差距。也許機器學習和人類學習之間最顯著的區別之一是能夠學習自然世界中稀缺數據的任務。如今的機器學習往往依賴于在一個封閉的世界環境中訓練模型,并在大量經過整理的數據中進行評估,然后在類似或相同的測試環境中進行評估。這意味著,與人類不同,標準的機器學習算法無法在很少的觀察下快速適應新環境并在線學習新知識。在本文中,我們將這種期望的能力稱為開放世界學習。 我們如何彌合人類和機器之間的這種明顯差距?我的論文旨在尋求解決方案,使機器能夠在一個開放的世界中學習新概念,而不需要獲取大量的策劃標簽。具體來說,它解決了開放世界學習框架下的幾個關鍵問題,如使用有限的標記數據、增量數據、無標記數據、不平衡和噪聲數據、在線和流數據進行學習,所有這些都是今天典型的機器學習管道中沒有考慮的。這些問題的最終解決方案將對我們所有人產生深遠的影響。首先,它將允許未來的智能體在飛行中學習:你未來的家庭機器人將適應你的房子,識別新家具,并學習使用新設備;你的增強現實眼鏡將通過你對世界的視角來學習,這些視角是你過去從未經歷過的;您的個人AI助理將適應您的偏好,并在與您的對話中學習新技能。此外,它將在許多工業應用中節省數百萬小時的工程、標簽和數據管理工作。最后,通過將我們的學習過程投射到計算框架中,這也將是探索理解人類智能的一個里程碑。

本文概述

**本文提出的貢獻,使機器能夠用很少的標記示例獲得新概念,并使它們對許多自然主義和開放世界條件更魯棒。**在過去,有幾種機器學習范式,如小樣本學習、持續學習、自監督學習等,它們都是由使機器學習在開放世界中更加靈活和自適應的大愿景所驅動的。第二章概述了這些課題的背景文獻。具體來說,本文首先討論了各種學習范式,這些范式鼓勵在與訓練不同的環境中進行測試時的學習,例如小樣本學習和持續學習,然后討論了另一個相關研究的思路,旨在從無標簽的示例中學習,例如自監督學習。 然而,這些學習范式通常只專注于一個特定的屬性,如域偏移量或標記數據點的數量。有時,這些性質是正交的,它們的解可以組合在一起,但通常提出的解決方案依賴于一些額外的不現實的假設。例如,標準的半監督學習利用未標記的數據來提高學習模型的質量;然而,它假設未標記的數據與標記的數據來自相同的分布,并且也屬于預定義的類別之一。在另一個例子中,標準的少樣本學習旨在用很少的數據點來學習新類別,但它假設數據點平均分布于在訓練期間從未見過的幾個新類別。或者,類不平衡問題通常假設類標簽是正確的,因此高訓練成本意味著數據點來自少數類。在這些示例中,假設學習環境的其他屬性的解決方案在同時存在多個問題的開放世界中部署時可能會崩潰。因此,本文的核心主題是尋求新的解決方案,以同時解決開放世界的多種特性,如有限的標記數據學習、輸出空間的增量增長、無標記、不平衡和有噪聲的數據。為了實現這一目標,我們不僅需要開發新的學習算法,還需要重新思考定義問題的學習范式。因此,論文的一部分,如第4章和第6章的部分,也旨在定義具有額外自然屬性的新的學習范式或基準。

**用有限的標記數據進行學習的文獻被廣泛稱為少樣本學習。然而,標準的少樣本學習在測試時只處理少量的新類。**在第3章中,我們關注的是增量少樣本學習的問題,模型需要識別訓練時多次出現的舊類別和測試時剛剛引入的新類別。令人驚訝的是,許多只專注于解決新類別的經典少樣本學習方法,實際上在處理結合新舊類別的更現實問題時受到了影響,可能是因為新舊類別的表示彼此不兼容。與直接使用新類樣本的某些特征向量作為分類器權重的傳統方法不同,本文提出的方法是基于連續優化的,通過平衡新舊類帶來的目標來求解權重,并在測試時達到更好的優化解。在整個增量學習新類別的過程中,現實世界的智能體通常會遇到更多的未標記樣本。在第4章中,我們又向前邁進了一步,將未標記數據引入到小樣本學習問題中。本文提出一種半監督少樣本學習的新學習范式,除了在每個學習片段中標記的數據點很少的約束外,還考慮未標記的樣本。本文工作是第一個同時解決半監督學習和少樣本學習的工作。它不僅減少了訓練和測試任務中對標記數據量的依賴,而且解決了干擾因素的問題,即不屬于任何已知類別的類別,因為在經典的半監督學習中不考慮這一問題。本文提出新的少樣本學習模型,可以規避分干擾類的影響,同時仍然設法利用來自未標記數據的有用信息。

**盡管小樣本學習取得了廣泛的成功,但情節通常是從精心策劃的數據集中采樣,而不是從自然世界的噪聲長尾分布中采樣。**我們在第4章中介紹的干擾物例子也可以被認為是一種噪聲訓練數據。在第5章中,我們將研究在標準機器學習環境下的不平衡和噪聲類標簽學習問題。雖然這兩個問題在自然學習環境中普遍發生,但傳統上,它們被分開研究,采用相互矛盾的補救方法。為了解決這一沖突,本文提出了一種數據驅動的示例權重機制,可以在統一的框架下直接應用于這兩個問題。該算法利用干凈和平衡的驗證集來校準訓練樣本權重。該模型還強調了一種同時聯合更新內層和外層循環參數的高效學習方法。少樣本學習通常伴隨著僵化的情景設置,這使得對新概念的持續增量獲取進行建模變得不自然。第6章提出了一種新的在線情境化小樣本學習范式。雖然我們在第3章中研究了新舊類別的組合,但之前的方法主要關注情節的概念,但知識從未隨著時間順序和增量增長。雖然已經有一些努力使這些情節更有順序,就像設置增量類學習一樣,但訓練和測試階段的分離仍然使評估變得繁重。現實世界的智能體不依賴偶發的停止,而是執行在線持續學習,在序列的每個時間步中產生一些輸出預測,通過自上而下的上下文信息流進行調制。新范式包含了許多自然主義屬性,如在線、增量、上下文化、少樣本和半監督,還開發了一個基于室內家庭圖像的新基準,模仿現實世界智能體的視覺輸入流。提出了一種新的模型——上下文原型記憶(context Prototypical Memory, CPM),成功地解決了在有限標記數據下的在線上下文類學習問題。

最后,在第7章中,我們研究了在不使用任何類別標簽的情況下,通過在線視覺輸入流動態學習表示和類別。在前幾章中,學習仍然主要由帶標簽的示例驅動:例如,在第6章中,只有當環境告訴智能體它是一個新類時,新的類別簇才會創建。在本章中,我們將介紹一種算法,該算法允許智能體同時從未標記的數據流中學習表示和類別。這可以被視為發展過程中的一個前階段,因為智能體可以首先通過在沒有標記數據的情況下學習表示和類別來探索環境,然后在一些示例的監督下進行。所提出的模型,在線無監督原型網絡,將用于概念學習的原型網絡與基于聚類的自監督表示學習相結合,并與僅使用在線數據流進行訓練的最先進的自監督視覺表示學習方法相比較。此外,該算法對不均衡分布也具有較強的魯棒性。

目錄內容:

付費5元查看完整內容

長期以來,隨著數據處理系統的復雜性不斷增加,系統設計者一直在想象能夠根據環境線索進行自我配置和適應的系統(如數據庫、調度程序)。在這種情況下,強化學習(RL)方法從一開始就吸引了系統開發人員。他們承諾從原始反饋信號中獲取復雜的決策策略。盡管RL方法在概念上很流行,但在現實世界的數據處理系統中卻很少見到。最近,由于利用大型神經網絡(深度強化學習)取得了引人注目的成功,RL受到了爆炸性增長的關注。新興的機器學習框架和強大的硬件加速器催生了大量新的潛在應用。在本文中,我首先提出,為了高效地設計和執行深度RL算法,需要新穎的軟件抽象來適應通信密集和快速進化算法的獨特計算模式。我提出了一種將邏輯算法構造與本地和分布式執行語義解耦的體系結構。我將進一步介紹RLgraph,這是我對這個體系結構的概念驗證實現。在RLgraph中,算法開發人員可以通過組合邏輯組件構建高級數據流圖來探索新的設計。此數據流圖獨立于特定的后端框架或執行概念,只在以后通過分階段構建過程映射到執行語義。RLgraph支持高性能算法實現,同時保持快速原型的靈活性。

//www.repository.cam.ac.uk/handle/1810/304385

其次,我研究了系統本身中RL應用程序稀缺的原因。我認為,由于缺乏用于任務模型設計的工具來彌合系統和算法之間的差距,以及缺乏評估模型能力的共同標準,應用RL的進展受到了阻礙。在本文中,我介紹了應用RL中第一個用于增量模型設計的工具——Wield。Wield 提供了一小組原語,將系統接口和特定于部署的配置從表示中分離出來。運用的核心是一種新的指導性實驗協議,稱為漸進隨機化,它幫助從業者逐步評估非確定性的不同維度。我演示了如何使用和漸進的隨機化可以用來再現和評估之前的工作,并指導新RL應用程序的實現。

付費5元查看完整內容

機器學習模型在有偏差的數據集上訓練時是有偏差的。最近提出了許多方法,以減輕被確定為先驗的偏差。然而,在現實世界的應用中,標注偏差不僅耗時而且具有挑戰性。本論文考慮了三種不同的場景,并提出了學習魯棒模型的新算法。這些算法是有效的,因為它們不需要明確的偏差注釋,從而實現了實用的機器學習。

首先,我們引入了一種算法,該算法對從多個環境中收集的數據進行操作,其中偏差特征和標簽之間的相關性可能會有所不同。我們表明,當使用在一個環境上訓練的分類器對來自不同環境的例子進行預測時,它的錯誤是隱藏偏見的信息。

然后,我們利用這些錯誤來創建一組示例,這些示例的插值結果只具有穩定的相關性。我們的算法在四種文本和圖像分類任務上實現了最新的技術。然后我們考慮無法訪問多個環境的情況,這是新任務或資源有限任務的常見場景。我們證明,在現實世界的應用中,相關的任務往往有類似的偏見。在此基礎上,我們提出了一種算法,從資源豐富的源任務中推斷出偏差特征,并將這種知識轉移到目標任務中。與橫跨5個數據集的15個基線相比,我們的方法始終提供顯著的性能提升。

最后,我們研究了只給出一組輸入標簽對的自動偏差檢測。我們的算法學習分割數據集,使得在訓練分割上訓練的分類器不能泛化到測試分割上。性能差距為測量學習特征的偏差程度提供了一個智能體,因此可以用來識別未知偏差。在六個NLP和視覺任務上的實驗表明,我們的方法能夠產生與人類識別的偏差相關的虛假分裂。

付費5元查看完整內容
北京阿比特科技有限公司