亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

表情生動、引人入勝的表情包在網絡短信應用中越來越受歡迎,一些作品致力于通過將表情包的文本標簽與之前的話語進行匹配,自動選擇表情包響應。然而,由于數量龐大,要求所有貼紙都有文字標簽是不切實際的。因此,在本文中,我們建議在不使用任何外部標簽的情況下,根據多回合對話框上下文歷史向用戶推薦合適的標簽。這項任務面臨兩大挑戰。一是學習沒有對應文字標簽的貼紙的語義。另一個挑戰是使用多回合對話框上下文聯合建模候選標簽。為了解決這些挑戰,我們提出了一個貼紙響應選擇器(SRS)模型。具體來說,SRS首先使用一個基于卷積的貼紙圖像編碼器和一個基于自我注意力的多回合對話編碼器來獲取貼紙和話語的表示。接下來,我們提出了深度交互網絡,將標簽與對話歷史中的每個話語進行深度匹配。然后SRS通過融合網絡學習所有交互結果之間的短期和長期依賴關系,輸出最終的匹配分數。為了評估我們提出的方法,我們從最流行的在線聊天平臺之一收集了一個帶有貼圖的大型真實世界對話數據集。在該數據集上進行的大量實驗表明,我們的模型在所有常用指標上都達到了最先進的性能。實驗還驗證了SRS各組成部分的有效性。為了便于貼紙選擇領域的進一步研究,我們發布了340K多回合對話框和貼紙對數據集。

付費5元查看完整內容

相關內容

目標檢測和數據關聯是多目標跟蹤系統的關鍵組成部分。盡管這兩個組件高度依賴于彼此,但MOT中的一個流行趨勢是將檢測和數據關聯作為單獨的模塊執行,并按級聯順序處理。由于這種級聯過程,所生成的MOT系統只能執行前向推理,而不能將錯誤反向傳播到整個管道并進行糾正。這導致整個管道的性能低于最佳水平。為了解決這個問題,最近的工作聯合優化了檢測和數據關聯,并形成了一個綜合的MOT方法,已被證明提高了檢測和跟蹤的性能。為此,我們提出了一種基于圖神經網絡(GNNs)的聯合MOT方法。該方法的關鍵思想是,GNNs能夠在空間和時間域內顯式地建模多個目標之間的復雜交互,這對于學習識別特征進行檢測和數據關聯至關重要。我們還利用了運動特征與外觀特征一起使用時對MOT有用這一事實。因此,我們提出的聯合MOT方法也將外觀和運動特征納入我們的基于圖的特征學習框架,從而使MOT更好地學習特征。在MOT挑戰數據集上的大量實驗表明,我們提出的方法在目標檢測和MOT檢測上都取得了最先進的性能。

付費5元查看完整內容

圖像分類和自然語言處理的最新發展,加上社交媒體使用的快速增長,使得實時檢測世界各地突發事件的技術取得了根本性的進步。應急響應就是這樣一個可以從這些進展中獲益的領域。通過每分鐘處理數十億的文本和圖像,可以自動檢測事件,從而使應急響應人員能夠更好地評估快速發展的情況并相應地部署資源。到目前為止,該領域的大多數事件檢測技術都集中在圖像或文本方法上,這限制了檢測性能并影響了向危機響應團隊傳遞信息的質量。在本文中,我們提出了一種新的多模態融合方法,利用圖像和文本作為輸入。特別地,我們介紹了一個交叉注意力模塊,它可以在一個樣本的基礎上從弱模態中過濾沒有信息和誤導的成分。此外,我們采用了一種基于多模態圖的方法,在訓練過程中隨機轉換不同多模態對的嵌入,以更好地規范學習過程,并通過從不同的樣本構造新的匹配對來處理有限的訓練數據。結果表明,我們的方法在三個與危機相關的任務上比單模態方法和強多模態基線有較大的優勢。

付費5元查看完整內容

題目: MuTual: A Dataset for Multi-Turn Dialogue Reasoning

摘要: 近年來,非任務導向的對話系統取得了巨大的成功,這得益于大量可訪問的對話數據和深度學習技術的發展。在給定的上下文中,當前的系統能夠產生相關的、流暢的響應,但是由于推理能力較弱,有時會出現邏輯錯誤。為了便于會話推理的研究,我們引入了一個用于多回合對話推理的新數據集MuTual,包括8,860個基于中國學生英語聽力考試的手動注釋對話。與以前的非面向任務的對話系統的基準測試相比,MuTual測試更具挑戰性,因為它需要一個能夠處理各種推理問題的模型。實證結果表明,最先進的推理方法只能達到71%,遠遠落后于人類94%的表現,說明推理能力還有很大的提升空間。

付費5元查看完整內容

隨著網絡新聞的爆炸式增長,個性化的新聞推薦對于網絡新聞平臺幫助用戶發現感興趣的信息變得越來越重要。現有的新聞推薦方法通過從新聞內容和用戶與新聞的直接交互(如點擊)中構建精確的新聞表示和用戶表示來實現個性化,而忽略了用戶與新聞之間的高階關聯。**本文提出了一種新聞推薦方法,通過對用戶和新聞之間的關系進行圖形化建模,增強用戶和新聞之間的表示學習。**在我們的方法中,用戶和新聞都被看作是歷史用戶點擊行為構造的二部圖中的節點。對于新聞表示,首先利用transformer架構構建新聞語義表示。然后通過一個圖注意力網絡將其與圖中相鄰新聞信息相結合。對于用戶表示,我們不僅表示來自其歷史上單擊的新聞的用戶,而且還仔細地將其鄰居用戶的表示合并到圖中。在大型真實數據集上的改進性能驗證了我們所提方法的有效性。

付費5元查看完整內容

Stickers with vivid and engaging expressions are becoming increasingly popular in online messaging apps, and some works are dedicated to automatically select sticker response by matching text labels of stickers with previous utterances. However, due to their large quantities, it is impractical to require text labels for the all stickers. Hence, in this paper, we propose to recommend an appropriate sticker to user based on multi-turn dialog context history without any external labels. Two main challenges are confronted in this task. One is to learn semantic meaning of stickers without corresponding text labels. Another challenge is to jointly model the candidate sticker with the multi-turn dialog context. To tackle these challenges, we propose a sticker response selector (SRS) model. Specifically, SRS first employs a convolutional based sticker image encoder and a self-attention based multi-turn dialog encoder to obtain the representation of stickers and utterances. Next, deep interaction network is proposed to conduct deep matching between the sticker with each utterance in the dialog history. SRS then learns the short-term and long-term dependency between all interaction results by a fusion network to output the the final matching score. To evaluate our proposed method, we collect a large-scale real-world dialog dataset with stickers from one of the most popular online chatting platform. Extensive experiments conducted on this dataset show that our model achieves the state-of-the-art performance for all commonly-used metrics. Experiments also verify the effectiveness of each component of SRS. To facilitate further research in sticker selection field, we release this dataset of 340K multi-turn dialog and sticker pairs.

簡介:

作為面向任務的對話系統中的關鍵組件,自然語言生成(NLG)模塊將以語義形式表示的對話行為轉換為自然語言的響應。傳統的基于模板或統計模型的成功通常依賴于帶有大量注釋的數據,這對于新領域而言是不可行的。因此,對于NLG系統而言,在實際應用中使用有限的標記數據很好地泛化至關重要。為此,我們展示了FewShotWOZ,這是第一個NLG基準測試,用于模擬面向任務的對話系統中的少量學習設置。此外,我們開發了SC-GPT模型。它在大量帶注釋的NLG語料庫上進行了預訓練,以獲取可控的生成能力,并僅用少數幾個特定于域的標簽進行微調以適應新的域。在FewShotWOZ和大型Multi-Domain-WOZ數據集上進行的實驗表明,通過各種自動指標和人工評估,提出的SC-GPT明顯優于現有方法。

付費5元查看完整內容

題目: Cross-Modality Attention with Semantic Graph Embedding for Multi-Label Classification

簡介:

多標簽圖像和視頻分類是計算機視覺中最基本也是最具挑戰性的任務。主要的挑戰在于捕獲標簽之間的空間或時間依賴關系,以及發現每個類的區別特征的位置。為了克服這些挑戰,我們提出將語義圖嵌入的跨模態注意用于多標簽分類。基于所構造的標簽圖,我們提出了一種基于鄰接的相似圖嵌入方法來學習語義標簽嵌入,該方法顯式地利用了標簽之間的關系。在學習標簽嵌入的指導下,生成了新的跨模態注意圖。在兩個多標簽圖像分類數據集(MS-COCO和NUS-WIDE)上的實驗表明,我們的方法優于其他現有的方法。此外,我們在一個大的多標簽視頻分類數據集上驗證了我們的方法,評估結果證明了我們的方法的泛化能力。

付費5元查看完整內容

由于大量對話數據的可用性和人工智能對話的神經方法的最新進展,開發智能開放域對話系統的興趣正在復蘇。與傳統的面向任務的機器人不同,開放域對話系統旨在通過滿足人類交流、情感和社會歸屬感的需求,與用戶建立長期的聯系。這篇文章回顧了最近關于神經方法的工作,致力于解決在開發這樣的系統中的三個挑戰:語義,一致性和交互性。語義要求對話系統不僅要理解對話的內容,還要識別用戶在對話過程中的情感和社會需求。一致性要求系統表現出一致的個性,以贏得用戶的信任,獲得用戶的長期信心。互動性是指系統產生人際反應以實現特定社會目標的能力,如娛樂、一致性和任務完成。我們在這次調查中選擇的研究是基于我們獨特的觀點,并不是完全的。盡管如此,我們希望討論將會給開發更智能的開放域對話系統的新研究帶來靈感。

付費5元查看完整內容
北京阿比特科技有限公司