亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

機器學習中的標記增強理論與應用研究

標記端多義性是當今機器學習的熱點問題。多標記學習中,每個樣本都被賦予一組 標記子集來表示其多種語義信息。然而,標記強度差異現象在多義性機器學習任務中廣 泛存在,而既有多標記學習研究中普遍采用的相關/無關兩個子集的邏輯劃分法幾乎完 全忽視了這種現象,造成學習過程中不可避免的信息損失。針對這一突出問題,有必要 用一種稱為標記分布的標注結構來代替邏輯標記對示例的類別信息進行描述。標記分布 通過連續的描述度來顯式表達每個標記與數據對象的關聯強度,很自然地解決了標記強 度差異的問題,而在以標記分布標注的數據集上學習的過程就稱為標記分布學習。由于 描述度的標注成本更高且常常沒有客觀的量化標準,現實任務中大量的多義性數據仍然 是以簡單邏輯標記標注的,為此本文提出了標記增強這一概念。標記增強在不增加額外 數據標注負擔的前提下,挖掘訓練樣本中蘊含的標記重要性差異信息,將邏輯標記轉化 為標記分布。

本文對標記增強進行研究,主要工作包括:構建標記增強基礎理論框架。該理論框架回答了以下三個問題:第一,標記增強所 需的類別信息從何而來?即標記分布的內在生成機制;第二,標記增強的結果如何評價?即標記增強所得標記分布的質量評價機制;第三,標記增強為何有效?即標記增強對后 續分類器的泛化性能提升機制。理論分析和實驗結果驗證了標記增強的有效性。

提出一種面向標記分布學習的標記增強專用算法。以面向標記分布學習的標記增強 為目標專門設計的算法十分重要,其關鍵是如何設計能夠充分挖掘數據中隱藏的標記信 息的優化目標函數。因此,本文提出一種面向標記分布學習的標記增強方法 GLLE。該 方法利用訓練樣本特征空間的拓撲結構以及標記間相關性,挖掘了標記強度信息,從而 生成了標記分布。實驗結果驗證了 GLLE 對邏輯標記數據集進行標記增強處理后使用標 記分布學習的有效性。

標記增強在其他學習范式上的應用。本文提出了基于標記增強的多標記學習方法 LEMLL,該方法將標記增強與多標記預測模型統一到同一學習目標中,使得預測模型可 以在更為豐富的監督信息下進行訓練,有效地提升了學習效果。本文提出了基于標記增 強的偏標記學習方法 PLLE,該方法利用標記增強恢復候選標記的描述度,使得后續的 學習問題轉化為多輸出回歸問題。在多標記數據集和偏標記數據集上的實驗結果顯示, 相較于對比算法,基于標記增強方法取得了顯著更優的表現。

付費5元查看完整內容

相關內容

“機器學習是近20多年興起的一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。機器學習理論主要是設計和分析一些讓 可以自動“ ”的算法。機器學習算法是一類從數據中自動分析獲得規律,并利用規律對未知數據進行預測的算法。因為學習算法中涉及了大量的統計學理論,機器學習與統計推斷學聯系尤為密切,也被稱為統計學習理論。算法設計方面,機器學習理論關注可以實現的,行之有效的學習算法。很多 問題屬于 ,所以部分的機器學習研究是開發容易處理的近似算法。” ——中文維基百科

知識薈萃

精品入門和進階教程、論文和代碼整理等

更多

查看相關VIP內容、論文、資訊等

隨著信息技術在社會各領域的深入滲透,人類社會所擁有的數據總量達到了一個前所未有的高度.一方面,海量數據為基于數據驅動的機器學習方法獲取有價值信息提供了充分空間;另一方面,高維度、過冗余以及高噪聲也是上述繁多、復雜數據的固有特性.為消除數據冗余、發現數據結構、提高數據質量,原型學習是一種行之有效的方式.通過尋找一個原型集來表示目標集,以從樣本空間進行數據約簡,在增強數據可用性的同時,提升機器學習算法的執行效率.其可行性在眾多應用領域中已得到證明.因此,原型學習相關理論與方法的研究是當前機器學習領域的一個研究熱點與重點.該文主要介紹了原型學習的研究背景和應用價值,概括介紹了各類原型學習相關方法的基本特性、原型的質量評估以及典型應用.接著,從原型學習的監督方式及模型設計兩個視角重點介紹了原型學習的研究進展,其中前者主要涉及無監督、半監督和全監督方式;后者包括基于相似度,行列式點過程,數據重構和低秩逼近四大類原型學習方法.最后,對原型學習的未來發展方向進行了展望.

//www.jos.org.cn/jos/article/abstract/6365

付費5元查看完整內容

開放環境下的度量學習研究

利用對象之間的相似性關系,度量學習為樣本學到有效的特征表示,使得 在該表示空間中,樣本之間的距離度量能夠精確反映樣本之間的相似與不相 似關系。有效的距離度量與表示空間極大地輔助了后續的多樣化任務。在度 量學習的研究中,傳統的方法依賴于靜態的、封閉的環境,需要無干擾、不變 化的特征,大量的訓練樣本,且只能處理單一的對象語義。而實際應用場景 比較復雜,是開放的,并存在“輸入噪聲多”、“訓練樣本少”、“特征變化 快”、“語義表示廣”等特點。本文從模型在開放環境下輸入、輸出層面上面 臨的挑戰作為切入點,提出針對或利用度量學習特性的具體算法,從理論和應 用等多個角度使得度量學習的研究能夠契合開放的環境。

本文的主要內容有:

  1. 從理論上分析了度量學習的泛化能力,并提出策略以降低其樣本復雜度。傳統機器學習方法要求大量有標記的訓練樣本,而實際場景中,對于某些 類別,考慮到樣本搜集和標注的代價,只能獲取極少量的有標記的樣本。本文從目標函數性質以及度量重用兩個角度進行泛化能力的理論分析,相 對于以往的分析結果,提出如何能獲得更快的泛化收斂率,即如何利用更 少的樣本得到同樣的泛化誤差。同時,本文通過大量實驗進行驗證,說明 滿足理論假設時,各因素對樣本復雜度的影響與理論中給出的趨勢一致。

  2. 提出一種應用度量語義變換在小樣本情況下應對特征變化的學習方法。除了僅有少量的訓練樣本,當在開放環境下處理新的任務時,模型也會 面臨特征空間變化的挑戰。本文利用特征之間的關聯性,提出構建特征的 “元表示”空間,利用在該空間中學習的度量,將已有特征空間的分類器 轉換到新的特征空間上,以“重用”已有的訓練好的異構分類器。提出的 ReForm 方法也降低了學習算法的樣本和計算需求。值得一提的是,在ReForm 方法重用分類器的過程中,沒有歷史訓練數據的傳輸,而僅僅需 要已有的模型,這也保護了不同階段、不同任務之間數據的隱私性。

  3. 提出能夠靈活挖掘并自適應利用開放環境中復雜語義的多度量學習框架。圖片、文本等對象在不同場景下往往存在豐富的語義。以往的度量學習 方法只針對對象的單一語義進行建模,而忽略了語義的多樣性。本文提出 “語義度量”這一概念以及統一的框架 U?2 ?,學習多個局部度量,不但能 統一已有的方法、靈活挖掘出對象本身的不同語義,也能夠提升后續眾多 實際問題的性能。針對度量數目的選擇,本文也提出自適應的多度量學習 框架 L???,利用全局度量的輔助,動態地為不同的語義分配度量的數目。L??? 一方面防止模型過擬合、提升分類能力,一方面也降低了存儲開銷。

  4. 提出一種利用分布擾動以適應輸入特征和對象關系噪聲的度量學習方法。開放動態的環境容易受到噪聲的影響。一方面,輸入的樣本特征容易附帶 噪聲,導致樣本特征的描述不夠精確;另一方面,對象之間的關聯關系也 會不準確,使后續相似性的學習更加困難。針對這一難點,本文首先對樣 本之間的距離做概率化分析,指出上述兩種噪聲都來源于樣本特征的擾 動。并提出一種基于“期望距離”的度量學習方法 Drift。該方法在學習 過程中動態地引入噪聲,有效地增廣數據,使模型有更好的泛化能力。利 用 Drift 學到的距離度量更加魯棒,能夠更真實地反映對象之間的關系。

付費5元查看完整內容

城市資源智能優化方法及應用研究

隨著城市化進程的加速,越來越多的人選擇到大城市中工作和生活。然而,相比于 城市居民的規模,城市中的各類資源是非常有限的,如何為更多的城市居民提供更好的 工作和生活服務已經成為許多城市面臨的一個巨大挑戰。城市資源智能優化是解決該挑 戰的一個有效方法,其通過對有限的城市資源進行智能優化來提升有限的城市資源的效 率,從而能夠為更多的城市居民提供更好的服務。因此,本文針對城市資源智能優化問 題,借助城市多源大數據的時空屬性,研究具有時空屬性的運籌優化、圖論方法、數據 挖掘、機器學習、強化學習等技術,設計城市資源智能優化方法,從而使有限的城市資 源的效率最大化。根據城市資源智能優化問題的內在屬性,本文將其分為兩大類:靜態 的城市資源智能優化和動態的城市資源智能優化,并將研究的城市資源智能優化方法成 功地應用到四個具體問題中。

  • 面向移動群智感知問題的靜態城市資源智能優化方法:移動群智感知是城市數據收 集的重要方法之一,因此本文首先研究移動群智感知中的靜態城市資源優化問題, 即:給定一定的經費資源,基于用戶的移動信息,如何招募用戶以及如何為招募到 的用戶設計數據收集任務,使得收集到的數據質量最高?為此,本文提出一個基于 人群移動性的移動群智感知框架,能夠在城市人群移動不均勻的情況下收集到均 勻覆蓋的數據。該框架包含三個部分:基于層次信息熵的數據覆蓋率指標來評估 收集到的數據的質量、基于數據點圖的數據收集任務設計方法以及高效的用戶招 募算法。基于34個用戶的真實移動信息,通過北京市噪聲數據收集的移動群體感 知實驗,驗證了所提出的框架在有限的資源經費下能夠收集到更高質量的數據。

  • 面向外賣配送任務分組問題的靜態城市資源智能優化方法:網上訂外賣已經城市 居民新的生活方式,對于外賣訂餐平臺來說,外賣配送任務分組是提升其有限外 賣送餐員整體送餐效率的重要方法。因此,本文基于真實的外賣訂單數據和地圖 數據,設計了高效的基于圖分割的外賣配送任務分組方法。首先,根據歷史的外 賣訂單配送數據構建外賣配送任務圖,外賣配送任務即為任務圖中的連邊,從而 將問題定義為圖分割問題;接著,設計外賣任務配送任務分組問題的評價指標, 用于指導外賣配送任務分組的進行;最后,提出了一個高效的圖分割算法對外賣 配送任務進行分組。基于外賣平臺真實數據的實驗結果顯示,所提出的方法能夠 將外賣配送所需要的平均時間降低16%,大幅提升了有限的外賣送餐員資源的整體 送餐效率。

  • 面向救護車重新部署問題的動態城市資源智能優化方法:救護車是城市120急救系 統中的重要資源,其通過快速接送病人去醫院來保障城市居民的生命健康。對救護車的動態重新部署能夠提升其整體的救人效率。因此,針對動態救護車重新部 署問題,本文提出了一個能夠綜合考慮五種不同數據特征的動態救護車重新部署 方法。該方法首先設計了一個緊急度指標來評估每個救護車站點的緊急程度,即 對救護車的需求程度。接著,基于每個救護車站點的緊急度以及其他忙碌中的救 護車狀態,建立了一個兩階段的運籌優化模型來進行救護車的重新部署決策。基 于天津市120急救中心數據的實驗結果顯示,相比于現有的救護車動態重新部署方 法,本文的方法能夠將病人的平均上車時間降低35%,將10分鐘之內上車的病人比 例從68.4%提升到80.3%,驗證了該方案能夠大幅提升有限的救護車資源條件下的整 體救人效率。

  • 面向出租車路徑推薦問題的動態城市資源智能優化方法:出租車是城市交通中最為 重要的資源之一,也是城市居民日常最常用的交通方式之一。動態出租車路徑推 薦旨在為空駛的出租車推薦行駛路徑使得其能夠快速地找到下一個乘客,從而提 升有限出租車的載客效率。因此,本文研究動態出租車路徑推薦問題,將其定義 為一個時序決策問題,并提出了一個高效的方法。該方法首先考慮和抽取了很多 實時的時空特征,用于反映出租車在每條路徑上找到新乘客的概率。接著,設計了一個深度強化學習方法來學習一個深度策略網絡,實現了對所抽取的時空特征 的有效融合,從而做出最優的推薦方案。基于美國舊金山市和紐約市數據的實驗 結果顯示,所提出的方法能夠提升出租車司機42.8%的平均收入,降低乘客44.4%的 平均等待時間,大幅提升了有限的出租車資源的載客效率。

付費5元查看完整內容

推薦系統在信息大爆炸時代扮演著重要角色,其核心是以人為中心的“人 -內容-算法平臺” 的生態圈:人與內容的交互行為所積累的數據為算法平臺 所收集,以此為基礎進行內容過濾,用戶隨后在社交網絡中的傳播行為對內 容進行擴散。因此,準確把握“人與內容”、“人與人”、“人與算法平臺” 之間 的關系至關重要,包括交互行為建模、社交行為建模與行為數據收集帶來的 用戶隱私保護問題。然而,這些研究問題存在諸多挑戰,如交互行為多元稀 疏、社交行為間接、隱私泄漏環節眾多等。針對這些挑戰,本文基于多類型 交互行為建模、社交行為精細化建模,以及通用保護隱私的推薦框架三個關 鍵問題展開研究,主要貢獻與創新點如下:

首先,在人與內容之間的多類型交互行為建模方面,本文從交互行為的 異質性入手,系統研究了有無強度偏序先驗下的建模問題,提出基于多任務 學習與圖神經網絡的方法,解決了對多類型交互行為難以刻畫行為強度與語 義的難題。在真實數據集上的實驗表明,相對于已有方法推薦精準度提升 6%-25%。

第二,在人與人之間的精細化社交行為建模方面,針對已有方法對于社 交行為影響的粗獷的“社交近似”假設,本文提出細粒度刻畫用戶在決策時 來自社交行為的復雜影響,提出一種通用的正則化方法,并設計對抗訓練方 法以提升優化魯棒性。在真實數據集上的測試表明,本文提出的方法相對于 現有方法推薦精準度平均提升近 10%。進一步地考慮社交行為的影響受平臺 限制,研究了有無社交影響的跨平臺遷移推薦問題,提出基于跨平臺用戶興 趣遷移的推薦模型,在真實數據集上的實驗表明,相比于已有方法推薦精準 度可以提升 5%以上。

第三,在人與算法平臺之間的用戶行為隱私保護方面,本文分析了在單 平臺數據收集與跨平臺數據共享兩類推薦場景下的隱私泄露風險,針對這兩 類場景的隱私泄露風險,分別提出了在保護行為隱私前提下的高效推薦模型。在真實數據集上的實驗表明,本文提出的模型在保護隱私的前提下實現了精 準的個性化推薦。

付費5元查看完整內容

多層圖分析技術研究

近年來,越來越多的領域都使用“圖”來表示和管理數據,稱為“圖數據”。針對 圖數據的分析可以發現其中的結構特征、頻繁模式、演變規律等有用的知識,具有 重要的科研意義和應用價值。隨著研究的深入,人們發現現實世界的圖數據往往 包含數據對象間多種類型的關系。例如,社交網絡數據包括多個社交媒體組成的 網絡;交通網絡數據涵蓋了多種交通工具組成的網絡。這種圖數據稱為“多層圖”, 其每一層包含了數據對象間某種特定類型的關系。

多層圖分析可以發現準確可靠、價值更高的知識。然而,多層圖分析面臨兩 方面的挑戰:一方面,單層圖上的計算語義在多層圖場景下不再適用,多層圖上 的計算語義更加復雜;另一方面,多層圖分析涉及多個圖層上的計算任務,使得 問題的固有計算復雜性大大增加。現有的多層圖分析方法在計算語義和算法設計 兩個方面都存在缺陷,不能很好的解決多層圖分析的有關問題。

本文綜合運用數據分析的相關理論、技術和方法,對于多層圖分析進行了系統研究。本文同時考慮了無概率的普通多層圖和帶概率的多層圖,從圖數據的稠 密性、可靠性、傳播性和相似性四方面重要性質出發,對多層圖分析領域中的一 系列重要問題進行了深入研究,主要研究成果如下:

  1. 本文研究了多層圖上的多樣化稠密區域發現問題,該問題在生物蛋白復合 體檢測和社區發現上具有重要應用。在無概率的普通多層圖模型基礎上,本文提 出了一種新的稠密區域概念 d-Coherent-Core(簡稱 d-CC),設計了兩種近似比為 1/4 的高效搜索算法來求解該 NP-難問題,算法在結果質量和執行時間兩個方面 均優于基于準團的傳統算法。d-CC 概念同時刻畫了稠密區域的稠密度和支持度兩 方面重要特性,滿足唯一性、包含性和層次性 3 個重要數學性質。自底向上和自 頂向下兩種搜索算法采用了高效的搜索策略和剪枝方法,分別適用于支持度參數 較小和較大兩種情況。真實數據上的實驗結果表明:自底向上和自頂向下兩種搜 索算法是高效、準確的。

  2. 本文研究了多層圖上的 top-k 可靠頂點搜索問題,該問題在通信網絡中具 有重要的研究意義,相比基于閾值的搜索問題自適應性更好。本文給出了一種圖 層帶概率的多層圖模型,提出了一種新的多層圖計算框架——共享計算,其可以 有效利用多層圖不同圖層間的重疊結構以減少搜索代價、提高算法效率。基于此,本文設計了求解 top-k 可靠頂點搜索問題的共享 BFS 精確算法和隨機算法。真實 數據上的實驗結果表明:共享 BFS 精確算法具有很高的效率和擴展性;共享 BFS 隨機算法具有很高的準確率。

  3. 本文研究了多層圖上的影響力最大化問題,該問題在病毒式營銷和輿情控 制中應用廣泛。為描述影響力最大化問題中的圖數據,本文給出了一種帶概率的 多層圖模型,其可以表示由于邊的不確定性而形成的多層圖。針對已有算法的缺 陷,本文設計了一種能夠同時達到高時間效率、高結果質量、低內存開銷和高健 壯性的影響力最大化算法,具有線性的時間和空間復雜度。該算法采用高質量的 分數估計方法和增量式的分數更新方法,在實際社交網絡中表現出良好的性能和 很高的擴展性。

  4. 本文研究了多層圖上 SimRank 頂點相似性測度問題,該問題是推薦系統、 實體識別等眾多應用的基礎。在帶概率的多層圖模型基礎上,本文嚴格給出了符 合其可能世界語義的 SimRank 相似性測度定義,設計了高效、準確的計算頂點間 SimRank 相似性的方法。同時,作為 SimRank 相似性測度的基礎,本文提出了多 層圖上隨機游走的定義,嚴格證明了這一定義滿足馬爾可夫性,設計了計算隨機 游走概率的高效算法。真實數據上的實驗結果表明:本文提出的 SimRank 算法是 高效、準確的;本文提出的 SimRank 測度比傳統測度在實際應用中效果更好。

付費5元查看完整內容

機器學習中部分非凸和隨機優化算法研究

機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算 法復雜度理論等多門學科。算法理論與應用是機器學習中最為重要的核心之一。其中一階優化算法因其簡單有效性,而被廣泛研究與應用。另一方面由于近年來 數據規模的不斷增大,數據集的規模使得二階或更高階的算法應用受阻。這使得 一階算法進一步成為機器學習的研究重點。隨著機器學習中問題模型的不斷擴張, 例如深度學習,非凸問題和模型也激發了學者們廣泛的研究興趣。這使得研究非 凸算法顯得更加急迫。而且由于數據集的龐大性,確定算法難以逃出鞍點,因此 隨機算法受到了史無前例的關注。本文主要結果可以歸納如下:

一、研究了三種 ADMM 算法。第一個 ADMM 的工作是關于一般的 ADMM 收 斂性分析統一框架。在此框架下,很多現有的 ADMM 收斂性分析可以歸納進該 框架。除了現有的 ADMM 算法,根據統一框架還能夠設計出新的 ADMM 算法。第二個和第三個 ADMM 都是針對結構非凸優化問題提出的:一個是針對泛 ?q 正 則化約束優化問題,而另一個是針對 ?1?2 正則化約束優化。給出了后面兩種非凸 ADMM 算法的收斂性分析,所得到的結果可以指導用戶選擇合適的超參數。

二、研究了兩種一階優化領域常用的非精確算法。第一種是非精確的加速算 法。相較于之前的研究,該算法的假設更為真實。而且還囊括了一大類隨機噪聲 的情況,使得算法更為實用。而機器學習中的一階催化劑算法由于是該加速算法 帶上了隨機噪聲,因此可以看做本算法的特例。在第二部分給出了非精確非凸算 法的收斂性框架理論。可以被廣泛應用到各種一階非凸算法。

三、證明了在有界和無界延遲以及隨機和確定性塊選擇下異步并行梯度下降法 的收斂結果。這些結果不需要迄今為止絕大多數其他工作中出現的獨立性假設。這是由于本文使用了 Lyapunov 函數技術,可直接處理延遲,而不是像之前的工作 一樣僅僅將它們建模為噪聲。

四、分析了馬爾可夫鏈隨機梯度下降法,其中樣本采用了某個馬爾可夫鏈的軌跡。主要貢獻之一是給出了馬爾可夫鏈隨機梯度下降法的在凸情況下的非遍歷收 斂分析。結果然后擴展到不精確的格式。這種分析使得能夠建立不可逆有限狀態 馬爾可夫鏈和非凸最小化問題的收斂性。這樣的結果適用于不知道具體的概率分 布,但可以通過馬爾可夫鏈進行采樣的情形。

付費5元查看完整內容

基于深度學習的圖像處理算法研究

隨著智能手機和微單相機的普及,拍照已經變成人們日常生活中不可缺少的一部分,圖像也已成為人類社會的重要信息媒介。然而受到拍照環境、設備和技術的影響,圖像中難免會出現退化現象,如何從圖像處理的角度提升拍攝照片的質量具有重要的研究意義與應用價值。近年來,深度學習技術得到了巨大的發展,并廣泛應用于圖像處理領域。相對于許多傳統算法,深度學習技術從海量的訓練數據中學習到的先驗知識具有更強的泛化能力和更復雜的參數化表達,且無需調節算法參數以適應不同的應用場景。得益于上述優勢,深度學習技術已經廣泛應用于圖像處理領域,如何利用深度學習算法提升圖像處理的效果也變成了一個重要的研究方向。

盡管深度學習技術顯著促進了圖像處理領域的發展,但是受限于其對訓練數據的敏感性,在面對無標簽、僅有弱標簽或者合成偽標簽的數據時,深度學習技術的優勢難以充分體現。本學位論文針對以上挑戰,重點研究了缺失完整數據標簽的經典圖像處理問題,包括圖像平滑、反光去除和本征圖像分解等。本文通過將上述問題抽象為對圖像結構敏感的圖像分解問題,將顯著的目標邊緣信息通過優化或者濾波的方式編碼進深度學習的算法設計中。根據圖像處理問題中數據標簽的類型和數量不同,本文依次提出了基于無監督學習、弱監督學習和多標簽聯合訓練的深度學習解決方案。本文的最后提出了解耦學習框架,通過對10種不同圖像處理問題的聯合訓練,提煉出了圖像處理問題的核心解空間。該算法對于理解深度學習技術在圖像處理領域的應用有重要的研究價值和意義。本文的創新點和貢獻包括以下幾個方面:

(1) 一種基于無監督學習的空間自適應圖像平滑算法

該算法通過使用卷積神經網絡,以無監督的方式從無標簽數據中學習圖像平滑的優化過程,并實現可靈活調節的圖像平滑效果。該算法提出了一個由邊緣保持項和空間自適應平滑項構成的能量函數,前者用于保持重要但易破壞的圖像結構,后者用于將多種形式的正則器(Lp范數)施加至圖像的不同區域。由于缺乏平滑圖像的真值數據,本文采用一個無監督學習的能量優化框架,用來實現多種基于圖像平滑的視覺應用,譬如圖像抽象化、鉛筆素描、細節增強、紋理去除和基于內容的圖像處理等。實驗結果表明,該基于無監督學習的空間自適應圖像平滑算法獲得了更好的視覺結果。

(2) 一種基于弱監督學習的圖像反光去除算法

該算法提出了一個多階段卷積神經網絡,用以解決圖像分解領域中經典的反光去除問題。本算法框架由兩個結構相似的卷積神經網絡串聯而成,前者預測目標圖像的邊緣結構,后者依據預測邊緣信息的引導重建目標圖像;整個過程既不需要任何人工設計,也不依賴于其他圖像處理應用。通過從真實反光圖像觀察得到的圖像亮度和結構先驗,該算法設計了一種針對模糊強反光的反光圖像合成算法;通過將合成數據以弱監督信號的形式融入到多階段神經網絡訓練中,該算法獲得了在真實反光圖像上的良好泛化性能。實驗結果表明,該基于弱監督學習的圖像反光去除算法在不同程度的反光場景中均獲得更優的視覺效果。

(3) 一種基于多標簽聯合訓練的本征圖像分解算法

本征圖像分解往往存在數據集冗雜、數據標簽不一致等問題。為解決該問題,本文提出了一個通用的核心神經網絡,用以在不同類型的數據標簽中共享本征圖像形成過程的稀疏先驗。該神經網絡由三個不同的基礎模塊組成:直接本征圖像估計網絡、導向網絡和域濾波器;其中,直接本征圖像估計網絡通過對本征圖像的直接監督獲得初始的預測結果,導向網絡負責生成稀疏的反射結構先驗,并引導域濾波器獲得干凈的反射估計。該算法設計了一個靈活的能量損失層以實現多標簽數據聯合訓練的目的。實驗結果表明,該本征圖像分解算法在所有的主流基準數據集上都獲得了更高的精確度。

(4) 一種基于解耦學習的實時參數化圖像處理框架

傳統的深度學習算法在面對不同的圖像處理應用時,需要重復地訓練神經網絡。為了解決這個問題,該算法提出了由基礎網絡和權重學習網絡組成的解耦學習框架,其中前者用來實現具體的圖像處理應用,后者用來學習基礎網絡的權重。該算法通過對基礎網絡的結構和權重進行解耦,達到根據圖像處理應用的變化實時動態調整基礎網絡權重的效果,并因此實現了利用單一神經網絡融合多種圖像處理應用的目的。實驗結果表明,該解耦學習框架成功應用在10種不同的參數化圖像算子中,并減少了網絡參數的存儲空間。

付費5元查看完整內容

新型深度學習模型的研究

深度學習是近年來機器學習領域中的熱點研究領域。深度森林模型是一 種新型深度學習模型,擴展了深度學習的內涵和適用范圍。本文開展深度森 林方面的相關研究工作,主要取得了以下創新結果:

  • 1.基于森林的多層分布表示。多層分布式表示學習被認為是神經網絡獨有的 特性,本文提出了基于森林的多層模型 mGBDT,第一次顯示出多層分布 式表示通過森林模型也能進行。在表格數據和混合數據等各類建模任務 上,mGBDT 展示了其兼具表示學習和離散數據建模的能力。

  • 2.基于森林的自編碼器模型。自編碼器被認為是只能通過神經網絡實現的獨 有模型,本文工作提出了第一個基于森林的自編碼器 eForest,在多類數 據上均取得了優異的性能體現。與此同時,還利用 Intel 眾核芯片 KNL, 通過多進程,向量化和編譯器優化等技術,獲得了近線性加速比,為大規 模應用提供了基礎。

    1. 基于自編碼器的毒化訓練。毒化訓練指對深度學習模型的訓練過程進行攻 擊,使得訓練好的模型存在攻擊者希望的缺陷。本文主要討論通過設計新 型自編碼器,通過對訓練樣本進行對抗表示學習,以實現毒化訓練。本文 同時將算法擴展到了聯邦學習框架下,驗證了該算法在具備數據隱私保護 的分布式場景下依舊有效。
    1. 多示例多標記的深度模型。多標記多示例 (MIML) 學習是面向多義性對象 的新型機器學習框架,本文設計了第一個 MIML 深度模型,可自動從原 始數據中學習出多示例的樣本表示。與此同時,通過預訓練 DeepMIML 模型同多標記深度森林模型相結合,在一系列任務中取得了優異的性能。

付費5元查看完整內容

前言: 目標:本課程旨在讓學生對人工智能的基本概念和實踐有一個堅實的(通常是有點理論性的)基礎。這門課程在第一學期主要涉及符號化的人工智能,有時也被稱為優秀的老式人工智能(GofAI),并在第二學期提供統計方法的基礎。事實上,一個完整的基于機器學習的AI應該有專業課程,并且需要比我們在這門課程中更多的數學基礎。

課程內容

目標: 使學生對人工智能領域的基本概念和實踐有一個堅實的基礎。該課程將基于Russell/Norvig的書《人工智能》:現代方法[RN09]

Artificial Intelligence I(第一部分): 介紹人工智能作為一個研究領域,討論作為人工智能統一概念范式的理性代理,并涵蓋問題解決、搜索、約束傳播、邏輯、知識表示和規劃。

Artificial Intelligence II(第二部分): 更傾向于讓學生接觸基于統計的人工智能的基礎知識:我們從不確定性下的推理開始,用貝葉斯網絡建立基礎,并將其擴展到理性決策理論。在此基礎上,我們介紹了機器學習的基礎知識。

付費5元查看完整內容
北京阿比特科技有限公司