干逼视频无码免费网站,日韩专区欧美专区亚洲福利

人體姿態估計的目的是通過圖像、視頻等輸入數據定位人體部位，構建人體表征(如人體骨架)。在過去的十年中，它受到了越來越多的關注，并被廣泛應用于人機交互、運動分析、增強現實和虛擬現實等領域。盡管最近開發的基于深度學習的解決方案在人體姿態估計方面取得了很高的性能，但由于訓練數據不足、深度模糊和遮擋，仍然存在挑戰。本綜述論文的目的是通過對基于輸入數據和推理的解決方案進行系統的分析和比較，對最近基于深度學習的二維和三維姿態估計解決方案進行全面的回顧。這項綜述涵蓋了自2014年以來的240多篇研究論文。此外，還包括了二維和三維人體姿態估計數據集和評估指標。本文總結和討論了現有方法在流行數據集上的定量性能比較。最后，對所涉及的挑戰、應用和未來的研究方向進行了總結。

//www.zhuanzhi.ai/paper/7459265d2fbd81f9b91bf0f7b461bcc7

付費5元查看完整內容

知識薈萃

精品入門和進階教程、論文和代碼整理等

查看相關VIP內容、論文、資訊等

圖像到圖像的轉換 ·

2021 年 1 月 25 日

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

圖像到圖像轉換(I2I)的目的是在保留內容表示的同時將圖像從源域傳輸到目標域。I2I由于在圖像合成、分割、風格轉換、復原、姿態估計等計算機視覺和圖像處理問題上的廣泛應用，近年來受到越來越多的關注，并取得了巨大的進展。在本文中，我們對近年來發展起來的I2I工作進行了綜述。我們將分析現有I2I工作的關鍵技術，并闡明社區取得的主要進展。此外，我們將闡述I2I對研究和行業社區的影響，并指出在相關領域仍存在的挑戰。

//www.zhuanzhi.ai/paper/5fe5204f7d9eeb37dc385304f9cb9f62

想象一下，如果你拍了一張自拍照，想讓它更有藝術感，就像漫畫家畫的一樣，你怎么能通過電腦自動實現呢?這類研究工作可以概括為圖像到圖像轉換(I2I)問題。通常，I2I的目標是將輸入圖像x從源域A轉換為目標域B，保留內在源內容并轉移外部目標樣式。例如，可以將自拍圖像作為源域，以一些漫畫作為目標域參考，將其“翻譯”為想要的藝術風格圖像。

從上面I2I的基本定義可以看出，將一幅圖像從一個源域轉換到另一個目標域可以涵蓋圖像處理、計算機圖形學、計算機視覺等方面的許多問題。具體來說,I2I已經廣泛應用于語義圖像合成[3],[4],[5],[6],圖像分割[7],[8],[9],風格轉移[2],[10],[11],[12],[13],圖像修復[14],[15],[16],[17],[18],3 d姿勢估計[19],[20],圖像/視頻彩色化[21], [22]、[23]、[24]、[25]、[26]，圖像超分辨率[27]、[28]，域適配[29]、[30]、[31]，卡通生成[22]0、[22]、[22]、[22]、[22]4、[22]5，圖像注冊[22]。我們將在第五節詳細分析和討論這些相關的應用。

本文就圖像到圖像翻譯的研究進展作一綜述。據我們所知，這是第一個概述了I2I的分析、方法和相關應用的論文。具體來說，我們的論文組織如下:

首先，我們簡要介紹了用于圖像-圖像翻譯的兩種最具代表性和最常用的生成模型，以及一些著名的評價指標，然后分析了這些生成模型如何學習表示和獲得想要的翻譯結果。

其次，我們將I2I問題劃分為兩大類任務，即雙域I2I任務和多域I2I任務，每一組I2I任務都出現了大量的I2I工作，對其他研究領域產生了深遠的影響，如圖2所示。

最后但并非最不重要的是，我們按照相同的I2I方法分類，提供了一個完整的I2I應用程序分類，如表1所示。

付費5元查看完整內容

人臉識別 · 人臉檢測 · 人臉表示 ·

2020 年 10 月 2 日

[付費5元查看完整內容]最新《端到端人臉識別》2020綜述論文，44頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

The Elements of End-to-end Deep Face Recognition: A Survey of Recent Advances

人臉識別是計算機視覺領域中最基本、最長期存在的研究課題之一。隨著深度卷積神經網絡和大規模數據集的發展，深度人臉識別取得了顯著的進展，并在實際應用中得到了廣泛的應用。以自然圖像或視頻幀作為輸入，端到端深度人臉識別系統輸出人臉特征進行識別。為了實現這一目標，整個系統通常由三個關鍵要素構建:人臉檢測、人臉預處理和人臉表示。人臉檢測在圖像或幀中定位人臉。然后，對人臉進行預處理，將人臉標定為標準視圖，并將其裁剪為標準化像素大小。最后，在人臉表示階段，從預處理后的人臉中提取識別特征進行識別。深度卷積神經網絡滿足了這三個要素。摘要隨著深度學習技術的蓬勃發展，端到端深度人臉識別技術的能力得到了極大的提高，本文對端到端深度人臉識別技術中各個方面的最新進展進行了綜述。首先，我們介紹端到端深度人臉識別的概述，如前所述，它包括人臉檢測、人臉預處理和人臉表示。然后，我們分別回顧了基于深度學習的每個元素的進展，包括許多方面，如最新的算法設計、評估指標、數據集、性能比較、存在的挑戰和未來的研究方向。我們希望這一調查可以為我們更好地理解端到端人臉識別的大圖和更系統的探索帶來有益的想法。

//arxiv.org/abs/2009.13290

付費5元查看完整內容

深度學習 · 異常檢測 ·

2020 年 9 月 30 日

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

視頻中的異常檢測是一個研究了十多年的問題。這一領域因其廣泛的適用性而引起了研究者的興趣。正因為如此，多年來出現了一系列廣泛的方法，這些方法從基于統計的方法到基于機器學習的方法。在這一領域已經進行了大量的綜述，但本文著重介紹了使用深度學習進行異常檢測領域的最新進展。深度學習已成功應用于人工智能的許多領域，如計算機視覺、自然語言處理等。然而，這項調查關注的是深度學習是如何改進的，并為視頻異常檢測領域提供了更多的見解。本文針對不同的深度學習方法提供了一個分類。此外，還討論了常用的數據集以及常用的評價指標。然后，對最近的研究方法進行了綜合討論，以提供未來研究的方向和可能的領域。

//arxiv.org/abs/2009.14146

付費5元查看完整內容

3D點云 ·

2020 年 9 月 21 日

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

隨著自動駕駛和機器人技術等實際應用的發展，人們越來越關注對3D點云的理解。雖然深度學習在基于圖像的任務上取得了顯著的成功，但深度神經網絡在處理大量、非結構化和噪聲的三維點時仍面臨著許多獨特的挑戰。為了展示深度學習在理解三維點云方面的最新進展，本文從幾個不同的方向(分類、分割、檢測、跟蹤、流量估計、配準、增強和補全)，以及常用的數據集、指標和最新性能，總結了該領域最近顯著的研究貢獻。

//www.zhuanzhi.ai/paper/e4ae936bed62e851d27089c9ddbe985e

付費5元查看完整內容

持續學習 · 深度學習 · 深度持續學習 ·

2020 年 9 月 7 日

[付費5元查看完整內容]最新《深度持續學習》綜述論文，32頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

當前的深度學習研究以基準評價為主。如果一種方法在專門的測試集上有良好的經驗表現，那么它就被認為是有利的。這種心態無縫地反映在持續學習的重現領域，在這里研究的是持續到達的基準數據集。核心挑戰是如何保護之前獲得的表示，以免由于迭代參數更新而出現災難性地遺忘的情況。然而，各個方法的比較是與現實應用程序隔離的，通常通過監視累積的測試集性能來判斷。封閉世界的假設仍然占主導地位。假設在部署過程中，一個模型保證會遇到來自與用于訓練的相同分布的數據。這帶來了一個巨大的挑戰，因為眾所周知，神經網絡會對未知的實例提供過于自信的錯誤預測，并在數據損壞的情況下崩潰。在這個工作我們認為值得注意的教訓來自開放數據集識別,識別的統計偏差以外的數據觀測數據集,和相鄰的主動學習領域,數據增量查詢等預期的性能收益最大化,這些常常在深度學習的時代被忽略。基于這些遺忘的教訓，我們提出了一個統一的觀點，以搭建持續學習，主動學習和開放集識別在深度神經網絡的橋梁。我們的結果表明，這不僅有利于每個個體范式，而且突出了在一個共同框架中的自然協同作用。我們從經驗上證明了在減輕災難性遺忘、主動學習中查詢數據、選擇任務順序等方面的改進，同時在以前提出的方法失敗的地方展示了強大的開放世界應用。

//www.zhuanzhi.ai/paper/e5bee7a1e93a93ef97e1c

概述：

隨著實用機器學習系統的不斷成熟，社區發現了對持續學習[1]、[2]的興趣。與廣泛練習的孤立學習不同，在孤立學習中，系統的算法訓練階段被限制在一個基于先前收集的i.i.d數據集的單一階段，持續學習需要利用隨著時間的推移而到來的數據的學習過程。盡管這種范式已經在許多機器學習系統中找到了各種應用，回顧一下最近關于終身機器學習[3]的書，深度學習的出現似乎已經將當前研究的焦點轉向了一種稱為“災難性推理”或“災難性遺忘”的現象[4]，[5]，正如最近的評論[6]，[7]，[8]，[9]和對深度持續學習[8]，[10]，[11]的實證調查所表明的那樣。后者是機器學習模型的一個特殊效應，機器學習模型貪婪地根據給定的數據群更新參數，比如神經網絡迭代地更新其權值，使用隨機梯度估計。當包括導致數據分布發生任何變化的不斷到達的數據時，學習到的表示集被單向引導，以接近系統當前公開的數據實例上的任何任務的解決方案。自然的結果是取代以前學到的表征，導致突然忘記以前獲得的信息。

盡管目前的研究主要集中在通過專門機制的設計來緩解持續深度學習中的這種遺忘，但我們認為，一種非常不同形式的災難性遺忘的風險正在增長，即忘記從過去的文獻中吸取教訓的危險。盡管在連續的訓練中保留神經網絡表示的努力值得稱贊，但除了只捕獲災難性遺忘[12]的度量之外，我們還高度關注了實際的需求和權衡，例如包括內存占用、計算成本、數據存儲成本、任務序列長度和訓練迭代次數等。如果在部署[14]、[15]、[16]期間遇到看不見的未知數據或小故障，那么大多數當前系統會立即崩潰，這幾乎可以被視為誤導。封閉世界的假設似乎無所不在，即認為模型始終只會遇到與訓練過程中遇到的數據分布相同的數據，這在真實的開放世界中是非常不現實的，因為在開放世界中，數據可以根據不同的程度變化，而這些變化是不現實的，無法捕獲到訓練集中，或者用戶能夠幾乎任意地向系統輸入預測信息。盡管當神經網絡遇到不可見的、未知的數據實例時，不可避免地會產生完全沒有意義的預測，這是眾所周知的事實，已經被暴露了幾十年了，但是當前的努力是為了通過不斷學習來規避這一挑戰。選擇例外嘗試解決識別不可見的和未知的示例、拒絕荒謬的預測或將它們放在一邊供以后使用的任務，通常總結在開放集識別的傘下。然而，大多數現有的深度連續學習系統仍然是黑盒，不幸的是，對于未知數據的錯誤預測、數據集的異常值或常見的圖像損壞[16]，這些系統并沒有表現出理想的魯棒性。

除了目前的基準測試實踐仍然局限于封閉的世界之外，另一個不幸的趨勢是對創建的持續學習數據集的本質缺乏理解。持續生成模型(如[17]的作者的工作,[18],[19],[20],[21],[22]),以及類增量持續學習的大部分工作(如[12]中給出的工作,[23],[24],[25],[26],[27],[28])一般調查sequentialized版本的經過時間考驗的視覺分類基準如MNIST [29], CIFAR[30]或ImageNet[31],單獨的類只是分成分離集和序列所示。為了在基準中保持可比性，關于任務排序的影響或任務之間重疊的影響的問題通常會被忽略。值得注意的是，從鄰近領域的主動機器學習(半監督學習的一種特殊形式)中吸取的經驗教訓，似乎并沒有整合到現代的連續學習實踐中。在主動學習中，目標是學會在讓系統自己查詢接下來要包含哪些數據的挑戰下，逐步地找到與任務解決方案最接近的方法。因此，它可以被視為緩解災難性遺忘的對抗劑。當前的持續學習忙于維護在每個步驟中獲得的信息，而不是無休止地積累所有的數據，而主動學習則關注于識別合適的數據以納入增量訓練系統的補充問題。盡管在主動學習方面的早期開創性工作已經迅速識別出了通過使用啟發式[32]、[33]、[34]所面臨的強大應用的挑戰和陷阱，但后者在深度學習[35]、[36]、[37]、[38]的時代再次占據主導地位，這些挑戰將再次面臨。

在這項工作中，我們第一次努力建立一個原則性和鞏固的深度持續學習、主動學習和在開放的世界中學習的觀點。我們首先單獨回顧每一個主題，然后繼續找出在現代深度學習中似乎較少受到關注的以前學到的教訓。我們將繼續爭論，這些看似獨立的主題不僅從另一個角度受益，而且應該結合起來看待。在這個意義上，我們建議將當前的持續學習實踐擴展到一個更廣泛的視角，將持續學習作為一個總括性術語，自然地包含并建立在先前的主動學習和開放集識別工作之上。本文的主要目的并不是引入新的技術或提倡一種特定的方法作為通用的解決方案，而是對最近提出的神經網絡[39]和[40]中基于變分貝葉斯推理的方法進行了改進和擴展，以說明一種走向全面框架的可能選擇。重要的是，它作為論證的基礎，努力闡明生成建模作為深度學習系統關鍵組成部分的必要性。我們強調了在這篇論文中發展的觀點的重要性，通過實證證明，概述了未來研究的含義和有前景的方向。

付費5元查看完整內容

深度學習 · 人臉識別 ·

2020 年 8 月 10 日

[付費5元查看完整內容]最新《深度學習人臉識別》綜述論文，

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

深度學習利用多個處理層來學習具有多個層次特征的數據表示。自2014年以來，隨著Deepface和DeepID方法的突破，這一新興技術已經重塑了人臉識別的研究領域。從那時起，深度人臉識別(FR)技術，利用層次結構學習區分的人臉表示，已經極大地提高了最先進的性能，并培養了許多成功的現實世界的應用。在這篇論文中，我們提供了一個全面深度學習人臉識別綜述。首先，我們總結了在快速發展的深度FR方法中提出的不同的網絡結構和損耗函數。其次，相關的人臉處理方法被分為兩個類:“一對多增強”和“多對一歸一化”。然后，對常用的模型訓練和評價數據庫進行了總結和比較。第三，對跨因素場景、異質場景、多媒體場景和行業場景進行了深入分析。最后，指出了現有方法的潛在不足和未來的發展方向。

付費5元查看完整內容

深度學習 · 噪聲標簽數據學習 ·

2020 年 7 月 20 日

[付費5元查看完整內容]最新《深度學習噪聲標簽學習》綜述論文，14頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

在海量大數據的幫助下，深度學習在許多領域都取得了顯著的成功。但是，數據標簽的質量是一個問題，因為在許多現實場景中缺乏高質量的標簽。由于帶噪標簽嚴重降低了深度神經網絡的泛化性能，從帶噪標簽中學習(魯棒訓練)已成為現代深度學習應用的一項重要任務。在這個綜述中，我們首先從監督學習的角度來描述標簽噪聲的學習問題。接下來，我們提供了對46種最先進的魯棒訓練方法的全面回顧，所有這些方法根據其方法上的差異被歸類為7組，然后系統地比較用于評價其優越性的6種屬性。然后，總結了常用的評價方法，包括公共噪聲數據集和評價指標。最后，我們提出了幾個有前景的研究方向，可以作為未來研究的指導。

//arxiv.org/abs/2007.08199

付費5元查看完整內容

深度學習 · 自動駕駛 ·

2020 年 6 月 14 日

[付費5元查看完整內容]最新《深度學習自動駕駛》技術綜述論文，28頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

自動駕駛一直是人工智能應用中最活躍的領域。幾乎在同一時間，深度學習的幾位先驅取得了突破，其中三位(也被稱為深度學習之父)Hinton、Bengio和LeCun獲得了2019年ACM圖靈獎。這是一項關于采用深度學習方法的自動駕駛技術的綜述。我們研究了自動駕駛系統的主要領域，如感知、地圖和定位、預測、規劃和控制、仿真、V2X和安全等。由于篇幅有限，我們將重點分析幾個關鍵領域，即感知中的二維/三維物體檢測、攝像機深度估計、數據、特征和任務級的多傳感器融合、車輛行駛和行人軌跡的行為建模和預測。

//arxiv.org/abs/2006.06091

付費5元查看完整內容

深度學習 · 行人重識別 ·

2020 年 5 月 5 日

[付費5元查看完整內容]最新《深度學習行人重識別》綜述論文，24頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

智能視頻監控(IVS)是當前計算機視覺和機器學習領域的一個活躍研究領域，為監控操作員和取證視頻調查者提供了有用的工具。人的再識別(PReID)是IVS中最關鍵的問題之一，它包括識別一個人是否已經通過網絡中的攝像機被觀察到。PReID的解決方案有無數的應用，包括檢索顯示感興趣的個體的視頻序列，甚至在多個攝像機視圖上進行行人跟蹤。文獻中已經提出了不同的技術來提高PReID的性能，最近研究人員利用了深度神經網絡(DNNs)，因為它在類似的視覺問題上具有令人信服的性能，而且在測試時執行速度也很快。鑒于再識別解決方案的重要性和廣泛的應用范圍，我們的目標是討論在該領域開展的工作，并提出一項最先進的DNN模型用于這項任務的調查。我們提供了每個模型的描述以及它們在一組基準數據集上的評估。最后，我們對這些模型進行了詳細的比較，并討論了它們的局限性，為今后的研究提供了指導。