亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

題目: Probabilistic Regression for Visual Tracking

簡介:

從根本上說,視覺跟蹤是在每個視頻幀中使目標狀態回歸的問題。盡管取得了重大進展,但跟蹤器仍然容易出現故障和不準確的情況。因此,至關重要的是在目標估算中表示不確定性。盡管當前的主要范式依賴于估計與狀態有關的置信度得分,但是該值缺乏明確的概率解釋,使它的使用變得復雜。因此,在這項工作中,我們提出了概率回歸公式,并將其應用于跟蹤。我們的網絡預測給定輸入圖像后焦油狀態的條件概率密度。至關重要的是,我們的配方能夠對由于任務中不正確的注釋和歧義而產生的標簽噪聲進行建模。通過最小化Kullback Leibler差異來訓練回歸網絡。當應用于跟蹤時,我們的公式不僅允許輸出的概率表示,而且還可以顯著提高性能。我們的跟蹤器在六個數據集上設置了最新的技術,在LaSOT上實現了59.8%的AUC,在Tracking Net上實現了75.8%的成功。可以在//github.com/visionml/pytracking獲得代碼和模型。

付費5元查看完整內容

相關內容

CVPR is the premier annual computer vision event comprising the main conference and several co-located workshops and short courses. With its high quality and low cost, it provides an exceptional value for students, academics and industry researchers. CVPR 2020 will take place at The Washington State Convention Center in Seattle, WA, from June 16 to June 20, 2020. //cvpr2020.thecvf.com/

主題: A Unified Dual-view Model for Review Summarization and Sentiment Classification with Inconsistency Loss

摘要: 從用戶的評論中獲取準確的摘要和情感是現代電子商務平臺的重要組成部分。評論摘要旨在生成簡潔的摘要,描述評論的主要觀點和觀點,而情感分類旨在預測觀點標簽表示評論的情感態度。為了在評論摘要和情感分類任務中有效利用共享情感信息,我們提出了一種新穎的雙視圖模型,可以共同提高這兩個任務的性能。在我們的模型中,編碼器首先學習評論的上下文表示,然后摘要解碼器逐詞生成評論摘要。然后,源視圖情感分類器使用編碼的上下文表示來預測評論的情感標簽,而摘要視圖情感分類器則使用解碼器的隱藏狀態為生成的摘要預測情感標簽。在訓練過程中,我們引入了不一致的損失來懲罰這兩個分類器之間的分歧。它可以幫助解碼器生成摘要,從而與評論產生一致的情感趨勢,還可以幫助兩個情感分類器相互學習。來自不同領域的四個真實世界數據集的實驗結果證明了我們模型的有效性。

付費5元查看完整內容

主題: Neural Topological SLAM for Visual Navigation

摘要: 本文研究了圖像目標導航的問題,該問題涉及在以前看不見的新型環境中導航到目標圖像指示的位置。 為了解決這個問題,我們設計了空間的拓撲表示,以有效利用語義并提供近似的幾何推理。 表示的核心是具有關聯語義特征的節點,這些節點使用粗略的幾何信息相互連接。我們描述了基于監督學習的算法,該算法可以在噪聲激勵下構建,維護和使用此類表示。 在視覺和物理逼真的模擬中的實驗研究表明,我們的方法建立了有效的表示形式,可以捕獲結構規律性并有效解決長視距導航問題。 與研究該任務的現有方法相比,我們觀察到相對改進了50%以上。

付費5元查看完整內容

題目: Probability Calibration for Knowledge Graph Embedding Models

摘要: 知識圖譜嵌入的研究忽略了概率定標問題。我們展示了流行的嵌入模型確實是未經校準的。這意味著與預測三元組相關的概率估計是不可靠的。摘要針對知識圖譜中常見的情況,提出了一種新的校準模型的方法。我們建議在我們的方法的同時使用普拉特尺度和等滲回歸。在三個帶有地面真值負樣本的數據集上進行的實驗表明,與使用負樣本的黃金標準相比,我們的貢獻使模型得到了很好的校準。我們得到的結果顯著優于未校準的模型從所有校準方法。我們證明等滲回歸提供了最好的整體性能,而不是沒有權衡。我們還表明,經過校準的模型不需要定義特定于關系的決策閾值就可以達到最先進的精度。

付費5元查看完整內容

傳統的多目標跟蹤和目標檢測是使用單獨的系統來完成的,而之前的大多數工作都只關注其中一個方面。跟蹤系統顯然能從精確的檢測中獲益,然而,文獻中有大量證據表明,檢測器可以從跟蹤中獲益,例如,跟蹤可以幫助平滑預測。在這篇論文中,我們關注的是自動駕駛的檢測跟蹤范式,其中兩個任務都是關鍵的任務。我們提出了一種概念簡單而有效的檢測和跟蹤聯合模型,稱為RetinaTrack,它改進了目前流行的單階段視網膜網方法,使其能夠適應實例級嵌入訓練。我們通過對Waymo開放數據集的評估表明,我們的性能優于最新的跟蹤算法,同時所需的計算量顯著減少。我們認為,我們簡單而有效的方法可以作為這一領域今后工作的有力基礎。

付費5元查看完整內容

題目:

Probabilistic Video Prediction from Noisy Data with a Posterior Confidence

簡介:

我們從一系列嘈雜的輸入中研究了概率視頻預測的新研究問題,這很有用,因為在實際的時空預測應用中很難保證輸入幀的質量。它也具有挑戰性,因為它涉及兩個級別的不確定性:來自噪聲觀測的感知不確定性和正向建模中的動力學不確定性。在本文中,我們通過端到端訓練模型,稱為貝葉斯預測網絡(BP-Net)。與先前在隨機視頻預測中假設時空一致性并因此無法處理感知不確定性的工作不同,BP-Net在集成框架中對兩個不確定性水平進行建模。此外,與以前的工作僅能提供未分類的未來幀估計不同,BP-Net利用可微的順序重要性抽樣(SIS)方法基于基礎物理狀態的推論做出未來的預測,從而根據SIS重要性權重,即置信度。我們的實驗結果表明,BP-Net在根據嘈雜數據預測未來幀方面明顯優于現有方法。

付費5元查看完整內容

小樣本學習是計算機視覺中的一項基本任務,它帶來了減輕對詳盡標記數據需求的希望。到目前為止,大多數小樣本學習方法都集中在日益復雜的神經特征提取器和分類器適應策略,以及任務定義本身的細化。在這篇論文中,我們探討了一個假設,即一個簡單的基于類協方差的距離度量,即馬氏距離,被采用到一個最先進的小樣本學習方法(CNAPS)中,它本身可以導致顯著的性能改進。我們還發現,學習自適應特征提取器是可能的,它允許從非常少的樣本中對該度量所需的高維特征協方差進行有用的估計。我們的工作結果是一個新的“簡單的CNAPS”架構,它比CNAPS少了9.2%的可訓練參數,并且在標準的小樣本圖像分類基準數據集上比現有的技術水平高了6.1%。

付費5元查看完整內容

題目: Understanding Knowledge Distillation in Non-autoregressive Machine Translation

摘要: 非自回歸機器翻譯(NAT)系統并行地預測輸出標記序列,與自回歸模型相比,在生成速度上獲得了實質性的改進。現有的NAT模型通常依賴于知識蒸餾技術,該技術從一個預先訓練好的自回歸模型中創建訓練數據,以獲得更好的性能。知識蒸餾在經驗上是有用的,它使NAT模型的準確性得到了很大的提高,但是這種成功的原因到目前為止還不清楚。在這篇論文中,我們首先設計了系統的實驗來研究為什么知識蒸餾對于NAT訓練是至關重要的。我們發現,知識蒸餾可以降低數據集的復雜性,并幫助NAT對輸出數據的變化進行建模。此外,在NAT模型的容量和為獲得最佳翻譯質量而提取的數據的最優復雜度之間存在很強的相關性。基于這些發現,我們進一步提出了幾種可以改變數據集復雜性的方法,以提高NAT模型的性能。我們為基于nat的模型實現了最先進的性能,并縮小了與WMT14 En-De基準上的自回歸基線的差距。

付費5元查看完整內容

題目: Deep Learning for Visual Tracking: A Comprehensive Survey

簡介: 視覺目標跟蹤是計算機視覺領域中最受關注和最具挑戰性的研究課題之一。考慮到這個問題的不適定性質及其在現實世界中廣泛應用的情況,已經建立了大量的大型基準數據集,在這些數據集上已經開發了相當多的方法,并在近年來取得了顯著進展——主要是最近基于深度學習(DL)的方法。這項綜述的目的是系統地調查當前基于深度學習的視覺跟蹤方法、基準數據集和評估指標。它也廣泛地評價和分析領先的視覺跟蹤方法。首先,從網絡體系結構、網絡利用、視覺跟蹤網絡訓練、網絡目標、網絡輸出、相關濾波優勢利用六個關鍵方面,總結了基于dll的方法的基本特征、主要動機和貢獻。其次,比較了常用的視覺跟蹤基準及其各自的性能,總結了它們的評價指標。第三,在OTB2013、OTB2015、VOT2018和LaSOT等一系列成熟的基準上,全面檢查最先進的基于dll的方法。最后,通過對這些最先進的方法進行定量和定性的批判性分析,研究它們在各種常見場景下的優缺點。它可以作為一個溫和的使用指南,讓從業者在什么時候、在什么條件下選擇哪種方法。它還促進了對正在進行的問題的討論,并為有希望的研究方向帶來光明。

付費5元查看完整內容

論文題目:
Latent Relation Language Models

論文摘要: 在本文中,我們提出了潛在關系語言模型(LRLM),它是一類語言模型,它通過知識圖的關系參數化文檔中單詞和其中出現的實體的聯合分布。 該模型具有許多吸引人的屬性:它不僅提高了語言建模性能,而且還能夠注釋實體跨度對于關聯文本的后驗概率。 實驗表明,在基于單詞的基準語言模型和結合了知識圖譜信息的先前方法上,經驗性改進。 定性分析進一步證明了該模型在上下文中學習最佳預測適當關系的能力。

付費5元查看完整內容

Discrete correlation filter (DCF) based trackers have shown considerable success in visual object tracking. These trackers often make use of low to mid level features such as histogram of gradients (HoG) and mid-layer activations from convolution neural networks (CNNs). We argue that including semantically higher level information to the tracked features may provide further robustness to challenging cases such as viewpoint changes. Deep salient object detection is one example of such high level features, as it make use of semantic information to highlight the important regions in the given scene. In this work, we propose an improvement over DCF based trackers by combining saliency based and other features based filter responses. This combination is performed with an adaptive weight on the saliency based filter responses, which is automatically selected according to the temporal consistency of visual saliency. We show that our method consistently improves a baseline DCF based tracker especially in challenging cases and performs superior to the state-of-the-art. Our improved tracker operates at 9.3 fps, introducing a small computational burden over the baseline which operates at 11 fps.

北京阿比特科技有限公司