亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

**復雜視覺推理與問題回答(VQA)是一個具有挑戰性的任務,要求具備超越簡單物體和事件識別與定位的組成性多步處理能力和更高層次的推理能力。**在本文中,我們提出了一種完全神經化的迭代與并行推理機制(IPRM),該機制結合了兩種不同形式的計算——迭代計算和并行計算——以更好地解決復雜的VQA場景。具體來說,IPRM的“迭代”計算有助于在需要動態計算、存儲和回憶個別操作的場景中進行逐步的組成性推理(例如,計算查詢:“確定坐在白色桌子旁邊穿紅色T恤的孩子左側的筆的顏色”)。與此同時,其“并行”計算允許同時探索不同的推理路徑,并有利于獨立操作的更強魯棒性和高效執行(例如,在查詢“確定所有T恤中出現頻率最高的顏色”時計算每種顏色的數量)。我們將IPRM設計為一個輕量級、完全可微的神經模塊,可以方便地應用于變換器(transformer)和非變換器的視覺-語言骨干網絡。它在多個圖像和視頻VQA基準測試中,超越了先前的任務特定方法和基于變換器的注意力模塊,測試了不同的復雜推理能力,如組成性時空推理(AGQA)、情境推理(STAR)、多跳推理泛化(CLEVR-Humans)和因果事件鏈接(CLEVRER-Humans)。此外,IPRM的內部計算可以在推理步驟中進行可視化,有助于提高其可解釋性和錯誤診斷。源代碼將發布于://github.com/shantanuj/IPRM_Iterative_and_Parallel_Reasoning_Mechanism

付費5元查看完整內容

相關內容

高效探索高維狀態空間的能力對于深度強化學習(RL)的實際成功至關重要。本文介紹了一種名為隨機潛在探索(Random Latent Exploration,RLE)的新探索技術,該技術結合了獎勵加成和噪聲加成(兩種深度RL中有效探索的流行方法)的優勢。RLE利用了通過在環境的某些(隨機)狀態中向原始任務獎勵添加結構化隨機獎勵來擾動獎勵的想法,以鼓勵代理在訓練過程中探索環境。RLE實現簡單,實踐效果良好。為了展示RLE的實際有效性,我們在具有挑戰性的ATARI和ISAACGYM基準上進行了評估,結果表明RLE在所有任務中表現出的總體得分高于其他方法。

付費5元查看完整內容

在本文中,我們考慮了多目標強化學習,這在具有多個優化目標的許多實際問題中出現。我們采用最大-最小框架來解決這一問題,重點關注多個目標之間的公平性,并在最大-最小框架下開發了相關理論和實用的無模型算法。所開發的理論在多目標強化學習方面提供了理論上的進步,而提出的算法在性能上顯著優于現有的基準方法。

付費5元查看完整內容

時空時間序列預測在許多現實世界應用中起著關鍵作用。盡管在這一領域已經取得了顯著進展,但完全捕捉和利用時空異質性仍然是一個基本挑戰。因此,我們提出了一種新穎的異質性知情的元參數學習方案。具體而言,我們的方法通過學習空間和時間嵌入隱式地捕捉時空異質性,這可以看作是一個聚類過程。然后,提出了一種新的時空元參數學習范式,從元參數池中學習時空特定的參數,這些參數是由捕捉到的異質性信息提供的。 基于這些想法,我們開發了一種用于時空時間序列預測的異質性知情時空元網絡(HimNet)。在五個廣泛使用的基準數據集上進行了廣泛的實驗,結果表明我們的方法達到了最先進的性能,同時表現出優越的可解釋性。我們的代碼可在 //github.com/XDZhelheim/HimNet 獲取。

付費5元查看完整內容

盡管多模態大型語言模型(MLLMs)展示了有希望的多功能能力,它們在下游任務上的表現仍然不如專門的模型,這使得調整它們以增強其實用性變得必要。然而,微調方法需要對每個模型進行獨立訓練,導致巨大的計算和內存開銷。在本文中,我們提出了一個新的設置,旨在通過一組為下游任務優化的共享參數來提高不同MLLMs的性能。為此,我們提出了可轉移視覺提示(Transferable Visual Prompting,TVP),一種簡單而有效的方法,用于生成可以轉移到不同模型并在僅在一個模型上訓練后提高其在下游任務上的表現的視覺提示。我們引入兩種策略來解決現有視覺提示方法的跨模型特征污染問題,并增強學到的提示的可轉移性,包括1) 特征一致性對齊:對提示的特征變化施加約束,以保持與任務無關的知識;2) 任務語義豐富:鼓勵提示圖像在語言指導下包含更豐富的任務特定語義。我們通過與6種現代MLLMs在從對象識別和計數到多模態推理和幻覺校正等廣泛任務上的大量實驗,驗證了TVP的有效性。

付費5元查看完整內容

在許多實際情境中,安全探索對于增強學習(RL)的實用性至關重要。在本文中,我們提出了一個通用安全探索(GSE)問題,作為常見安全探索問題的統一公式。接著,我們提出了一個安全探索的元算法MASE作為GSE問題的解決方案,該算法結合了一個無約束的RL算法和一個不確定性量化器,以保證在當前情節中的安全,同時在實際安全違規之前適當地懲罰不安全的探索,以防止它們在未來的情節中出現。MASE的優勢在于,我們可以在保證有很高概率不會違反任何安全約束的情況下,優化策略。具體來說,我們提出了兩種不同構造的不確定性量化器的MASE變體:一種基于帶有安全和接近最優性理論保證的廣義線性模型,另一種結合了高斯過程以確保安全性和深度RL算法以最大化獎勵。最后,我們證明了我們提出的算法在格子世界和Safety Gym基準測試中比現有技術更優秀,即使在訓練期間也不違反任何安全約束。

//www.zhuanzhi.ai/paper/bfda323a5d9d59281497f4e599b516b8

付費5元查看完整內容

以人為中心的感知在視覺和圖形學中起著至關重要的作用。但是他們的數據注釋非常昂貴。因此,希望有一個通用的預訓練模型,作為數據高效的下游任務轉移的基礎。為此,我們提出了以人為中心的多模態對比學習框架HCMoCo,該框架利用人類數據的多模態特性(如RGB、深度、2D關鍵點)來進行有效的表示學習。該目標面臨兩個主要挑戰: 多模態數據的密集預訓練,稀疏人類先驗的有效利用。**為了解決這一問題,我們設計了一種新型的密集樣本內對比學習和稀疏結構感知對比學習目標,通過層次化學習具有連續和有序特征分布和結構感知語義一致性的模態不變潛空間。**HCMoCo通過組合異構數據集為不同的模態提供預訓練,這允許有效地使用現有的特定于任務的人類數據。在四個不同模式的下游任務上的大量實驗證明了HCMoCo的有效性,特別是在數據效率設置下(DensePose Estimation和Human Parsing提高了7.16%和12%)。此外,通過探索跨模態監督和缺失模態推理,我們證明了HCMoCo的多功能性,驗證了它在跨模態聯想和推理方面的強大能力。

//www.zhuanzhi.ai/paper/3e8a73c1d485a5e417b1e659558792c0

付費5元查看完整內容

知識庫問答旨在通過知識庫回答自然語言問題。近來,大量的研究集中在語義或句法上復雜的問題上。在本文中,我們精心總結了復雜知識庫問答任務的典型挑戰和解決方案,介紹了復雜知識庫問答的兩種主流方法,即基于語義解析(基于SP)的方法和基于信息檢索(基于IR)的方法。首先,我們形式化地定義了知識庫問答任務并介紹了該任務下相關的數據集。然后,我們從兩個類別的角度全面回顧了前沿方法,說明他們針對典型挑戰的解決方案。最后,我們總結并討論了一些仍具有挑戰的未來研究方向。

知識庫(KB)是一個結構化的數據庫,它以(主題、關系、對象)的形式包含一系列事實。大型KBs,如Freebase [Bollacker et al., 2008], DBPedia [Lehmann et al., 2015]和Wikidata [Tanon et al., 2016],已經構建服務于許多下游任務。知識庫問答(KBQA)是一種基于知識庫的自然語言問答任務。KBQA的早期工作[Bordes et al., 2015; Dong et al., 2015; Hu et al., 2018a; Lan et al., 2019b; Lan et al., 2019a]專注于回答一個簡單的問題,其中只涉及一個單一的事實。例如,“j·k·羅琳出生在哪里?”“是一個可以用事實來回答的簡單問題”(J.K.羅琳)羅琳,出生地,英國)。

最近,研究人員開始更多地關注于回答復雜問題,即復雜的KBQA任務[Hu et al., 2018b; Luo et al., 2018]。復雜問題通常包含多個主題,表達復合關系,并包含數值運算。以圖1中的問題為例。這個例題的開頭是“the Jeff Probst Show”。這個問題不是問一個單一的事實,而是要求由兩個關系組成,即“被提名人”和“配偶”。該查詢還與一個實體類型約束“(Jeff Probst,是一個電視制作人)”相關聯。最后的答案應該通過選擇有最早結婚日期的可能候選人來進一步匯總。一般來說,復雜問題是涉及多跳推理、約束關系、數值運算或上述幾種組合的問題。

付費5元查看完整內容

本文由騰訊 AI Lab 主導,與清華大學、電子科技大學、香港中文大學(深圳)合作完成。為了生成“精確”表述的場景圖,幾乎所有現有的方法都以確定性的方式預測成對關系,我們認為視覺關系在語義上往往具有模糊歧義性。

具體來說,受語言學知識的啟發,我們將歧義分為三類:同義歧義、上下義歧義和多視點歧義。這種模糊性自然會導致隱性多標簽問題,也激發了對預測多樣性的需求。在這項工作中,我們提出了一個新的即插即用概率不確定性建模(PUM)模塊。它將每個聯合區域建模為高斯分布,其方差度量相應視覺內容的不確定性。與傳統的確定性方法相比,這種不確定性建模帶來了特征表示的隨機性,使得預測具有多樣性。作為一個副產品,PUM還能夠覆蓋更細粒度的關系,從而減輕對頻繁關系的偏見。

在大規模視覺數據集上的大量實驗表明,將PUM與新提出的ResCAGCN相結合可以在平均召回度量下獲得最佳性能。此外,我們通過將PUM插入到一些現有模型中,證明了PUM的普適性,文中也對其生成多樣化但合理的視覺關系的能力進行了深入分析。

//www.zhuanzhi.ai/paper/254379481b6040802beebbace52db94a

付費5元查看完整內容

本文研究了新聞中的宣傳手段(propaganda)檢測。和之前僅僅從訓練數據中的輸入-輸出數據中進行學習不同,本文進一步提出了一種方法在細粒度的宣傳手段檢測中引入了聲明性知識(declarative knowledge)。具體來說,本文同時利用了一階邏輯和自然語言文本中的聲明性知識。前者是指粗粒度預測和細粒度預測之間的邏輯一致性,通過布爾表達式來對訓練過程進行正則化。后者指每一種宣傳手段的定義,它被利用于獲得這一類宣傳手段的特征表示,從而對模型參數進行正則化。本文在“Propaganda Techniques Corpus (PTC)”數據集上進行實驗,它是一個大規模的人工標注的數據集,用于細粒度的宣傳手段檢測。實驗結果表明,本文提出的模型取得了優異的性能,驗證了利用聲明性知識可以幫助模型進行更準確的預測。

//www.zhuanzhi.ai/paper/69553c6775073b80179e52ebb4e90ce9

付費5元查看完整內容
北京阿比特科技有限公司