亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

會話搜索的任務主要是使用交互數據來提高用戶在會話級別上的下一個查詢的相關性。在本文中,我們將會話搜索作為一個個性化任務,在學習排序的框架下進行。個性化方法重新排列結果以匹配用戶模型。這種用戶模型通常是根據用戶的瀏覽行為隨著時間的推移而積累起來的。我們使用一套預先計算的、透明的基于社會科學文獻概念的用戶模型。交互數據用于將每個會話映射到這些用戶模型。然后根據這些模型和sessions的交互數據來估計新特性。從TREC會話軌跡的測試收集上進行的廣泛實驗顯示,在統計上比當前會話搜索算法有顯著的改進。

//www.zhuanzhi.ai/paper/3cd6afe65db82a0f6e0fa3a45d1fda73

付費5元查看完整內容

相關內容

搜索引擎指根據一定的策略、運用特定的計算機程序搜集互聯網上的信息,在對信息進行組織和處理后,為用戶提供檢索服務的系統。

【導讀】第14屆推薦系統頂級會議ACM RecSys在9月22日到26日在線舉行。

最近官網大會公布了最佳長短文,包括來自Criteo AI Labs的因果嵌入推薦與德國Duisburg-Essen大學的用戶評估中物品消費的影響。

官網地址: //recsys.acm.org/best-papers/

最佳長論文獎

漸進式分層提取(PLE): 一種用于個性化推薦的新型多任務學習(MTL)模型

多任務學習(MTL)已成功地應用于許多推薦應用中。然而,在實際推薦系統中,由于復雜的競爭性任務相關性,MTL模型往往會出現負遷移的性能退化。此外,通過對SOTA MTL模型的大量實驗,我們觀察到一個有趣的現象,即一個任務的性能往往會通過損害其他任務的性能而得到改善。為了解決這些問題,我們提出了一個具有新的共享結構設計的漸進分層抽取(PLE)模型。PLE對共享組件和任務特定組件進行顯式分離,采用漸進式路由機制逐步提取和分離更深層次的語義知識,提高了一般設置下跨任務聯合表示學習和信息路由的效率。我們將PLE應用于復雜相關和正常相關的任務,在一個擁有10億樣本的真實騰訊視頻推薦數據集上,從兩任務到多任務,結果表明,在不同的任務相關性和任務組大小下,PLE顯著優于最新的MTL模型。此外,在騰訊大型內容推薦平臺上,對PLE的在線評價顯示,與SOTA MTL模型相比,在瀏覽量和觀看時間上分別增加了2.23%和1.84%,是一個顯著的提升,證明了PLE的有效性。最后,在公共基準數據集上進行的大量離線實驗表明,除了建議消除蹺蹺板現象外,PLE還可以應用于各種場景。PLE目前已成功部署到騰訊在線視頻推薦系統中。

Best Long Paper Runner-up

通過疊加的方式將多個推薦系統集成在一起,可以有效地提高協同推薦的質量。最近的研究擴展了堆疊,使用了額外的用戶性能預測器(例如,用戶做出的評分總數)來幫助確定每個基礎推薦應該在整體中貢獻多少。然而,盡管手工制作判別預測器的成本很高,這通常需要深入了解每個推薦者在整體中的優缺點,但只觀察到微小的改進。為了克服這一局限性,我們建議通過利用用戶自己的歷史評級來直接評估這些性能,而不是設計復雜的特征來預測給定用戶的不同推薦器的性能。在來自多個領域的真實數據集上進行的實驗表明,使用性能估計作為附加特征可以顯著提高最先進的集成器的精度,nDCG@20比不使用它們平均提高23%。

最佳短論文

由于人們對隱私問題的日益關注,基于會話的推薦受到了越來越多的關注。盡管最近基于神經會話的推薦器取得了成功,但它們通常是以使用靜態數據集的離線方式開發的。然而,推薦需要不斷地適應以考慮新的和過時的項目和用戶,并且需要在現實應用中“不斷地學習”。在這種情況下,推薦器會不斷地、周期性地更新,每次更新周期都會有新的數據到達,更新后的模型需要在下一個模型更新之前為用戶活動提供推薦。用神經模型進行持續學習的一個主要挑戰是災難性遺忘,在這種情況下,一個經過持續訓練的模型會忘記它以前學習過的用戶偏好模式。為了應對這一挑戰,我們提出了一種自適應提取樣本回放(ADER)的方法,即通過自適應提取損失對當前模型周期性地回放以前的訓練樣本(即樣本)。實驗是基于最先進的SASRec模型,使用兩個廣泛使用的數據集,以幾個著名的持續學習技術基準的ADER。我們以經驗證明,ADER始終優于其他基線,甚至在每個更新周期中優于使用所有歷史數據的方法。這一結果表明,ADER是一個很有前途的解決方案,可以緩解災難性遺忘問題,從而構建更現實、更可伸縮的基于會話的推薦器。

付費5元查看完整內容

查詢理解是信息檢索中的一個基本問題,在過去的幾十年里一直受到人們的關注。為了理解用戶的搜索查詢,人們提出了許多不同的任務,例如查詢分類或查詢聚類。然而,在意圖類/集群級別上理解搜索查詢并不那么精確,因為會丟失許多詳細信息。正如我們在許多基準數據集(例如TREC和SemEval)中發現的那樣,查詢通常與人類注釋者提供的詳細描述相關聯,這些描述清楚地描述了查詢的意圖,以幫助評估文檔的相關性。如果一個系統能夠為搜索查詢自動生成詳細而精確的意圖描述,就像人類注釋器一樣,這將表明更好的查詢理解已經實現。因此,在本文中,我們提出了一種新的查詢到意圖描述(Q2ID)任務來進行查詢理解。與那些利用查詢及其描述來計算文檔相關性的現有排序任務不同,Q2ID是一個反向任務,旨在基于給定查詢的相關和不相關文檔生成自然語言意圖描述。為了解決這一問題,我們提出了一種新的對比生成模型,即CtrsGen(簡稱CtrsGen),該模型通過對比給定查詢的相關文檔和不相關文檔來生成意圖描述。我們通過與幾種最先進的生成模型在Q2ID任務上的比較,證明了我們的模型的有效性。我們將通過一個示例應用程序討論這種Q2ID技術的潛在用法。

//www.zhuanzhi.ai/paper/d34ba15f09003b2b2c17a7a415b8b026

付費5元查看完整內容

//www.zhuanzhi.ai/paper/f89bf5e9ab6b630c51edddff406566f4

推薦系統在web應用中扮演著過濾大量信息和匹配用戶興趣的基礎角色。雖然許多人致力于開發各種場景下更有效的模型,但對于推薦系統可解釋性的探索卻處于滯后狀態。解釋可以幫助改善用戶體驗和發現系統缺陷。本文在正式引入與模型可解釋性相關的要素后,通過提高表示學習過程的透明度,提出了一種新的可解釋推薦模型。具體地說,為了克服傳統模型中的表示糾纏問題,我們修改了傳統的圖卷積來區分不同層次的信息。此外,每個表示向量被分解為若干段,其中每個段與數據中的一個語義方面相關。與之前的工作不同,在我們的模型中,因子發現和表示學習同時進行,我們能夠處理額外的屬性信息和知識。通過這種方式,該模型可以學習對用戶和項的可解釋和有意義的表示。與傳統方法需要在可解釋性和有效性之間進行權衡不同,我們所提出的可解釋模型在考慮了可解釋性后,其性能沒有受到負面影響。最后,通過綜合實驗驗證了模型的性能和解釋的可信度。

付費5元查看完整內容

近年來,深度神經網絡在許多研究領域取得了成功。大多數神經網絡設計背后的基本思想是從數據中學習相似模式,用于預測和推理,這缺乏認知推理能力。然而,具體的推理能力對于許多理論和實踐問題是至關重要的。另一方面,傳統的符號推理方法在邏輯推理方面做得很好,但它們大多是基于規則的硬推理,由于不同的任務可能需要不同的規則,使得它們的泛化能力局限于不同的任務。推理和泛化能力對于預測任務都很重要,比如推薦系統,推理為精確預測提供了用戶歷史和目標項目之間的緊密聯系,泛化幫助模型在噪聲輸入中繪制出一個穩健的用戶畫像。

在本文中,我們提出了邏輯集成神經網絡(LINN)來集成深度學習和邏輯推理的能力。LINN是一個根據輸入邏輯表達式構建計算圖的動態神經結構。它學習基本的邏輯操作,如AND, OR,而不是神經模塊,并通過網絡進行命題邏輯推理進行推理。理論任務實驗表明,LINN在求解邏輯方程和變量方面都取得了顯著的效果。此外,我們通過將實際的推薦任務構造成一個邏輯推理問題來測試我們的方法。實驗表明,LINN在Top-K推薦方面的性能顯著優于現有推薦模型,驗證了LINN在實際應用中的潛力。

付費5元查看完整內容

第29屆國際計算機學會信息與知識管理大會(The 29th ACM International Conference on Information and Knowledge Management, CIKM 2020)將于2020年10月19日-10月23日在線上召開。CIKM是CCF推薦的B類國際學術會議,是信息檢索和數據挖掘領域頂級學術會議之一。本屆CIKM會議共收到投稿920篇,其中錄用論文193篇,錄取率約為21%。

論文題目:Diversifying Search Results using Self-Attention Network(長文)

作者者:秦緒博(人大博士生),竇志成,文繼榮

論文概述:搜索結果多樣化的目標是使得檢索得到的結果能夠盡量覆蓋用戶提出問題的所有子話題。已有的多樣化排序方法通常基于貪心選擇(Greedy Selection)過程,獨立地將每一個候選文檔與已選中的文檔序列進行比較,選擇每一個排序位置的最佳文檔,生成最后的文檔排序。而相關研究證明由于各候選文檔的邊際信息收益并非彼此獨立,貪心選擇得到的各個局部最優解將難以導向全局最佳排序。本文介紹了一種基于自注意力網絡(Self-Attention Network)的方法,可以同步地衡量全體候選文檔間的關系,以及候選文檔對不同用戶意圖的覆蓋程度,有效地克服原有方法受限于貪心選擇過程的局限性,并在TRECWebTrack09-12數據集上獲得更好的性能。

論文題目:PSTIE: Time Information Enhanced Personalized Search(長文)

作 者:馬正一(人大碩士生),竇志成,邊關月,文繼榮

論文概述:基于深度學習的個性化搜索模型通過序列神經網絡(例如RNN)對用戶搜索歷史進行序列建模,歸納出用戶的興趣表示,取得了當前最佳的效果。但是,這一類模型忽略了用戶搜索行為之間細粒度的時間信息,而只關注了搜索行為之間的相對順序。實際上,用戶每次查詢之間的時間間隔可以幫助模型更加準確地對用戶查詢意圖與文檔興趣的演化進行建模。同時,用戶歷史查詢與當前查詢之間的時間間隔可以直接幫助模型計算用戶的重查找(re-finding)行為概率。基于此,本文提出了一個時間信息增強的個性化搜索模型。我們設計了兩種時間感知的LSTM結構在連續時間空間中對用戶興趣進行建模,同時直接將時間信息利用在計算用戶重查找概率中,計算出了更加準確的用戶長短期興趣表示。我們提出了兩種將用戶興趣表示用于個性化排序的策略,并在兩個真實數據集上取得了更好的效果。

論文題目:Learning to Match Jobs with Resumes from Sparse Interaction Data using Multi-View Co-Teaching Network(長文)

作 者:卞書青(人大博士生),陳旭,趙鑫,周昆,侯宇蓬,宋洋,文繼榮

論文概述:隨著在線招聘規模的不斷增長,求職領域下的人崗匹配已經成為最重要的任務。人崗匹配任務通常可以看作文本匹配問題。當監督數據足夠多時,模型的學習效果是有用的。但是在線招聘平臺上,職位和簡歷的交互數據稀疏且帶有噪聲,這會影響求職簡歷匹配算法的性能。為了緩解這些問題,本文提出了一種多視圖協同教學網絡用來解決人崗匹配中的數據稀疏和噪聲問題,匹配網絡包含兩個主要模塊,即基于文本的匹配模型和基于關系的匹配模型。這兩個部分在兩個不同的視圖中捕獲了語義信息并且相互補充。為解決數據稀疏和噪聲數據帶來的挑戰,我們設計了兩種特定策略。首先,兩個模塊共享學習的參數和表示,以增強每個模塊的初始的表示。更重要的,我們采用了一種協同教學的機制來減少噪聲對訓練數據的影響。核心思想是讓這兩個模塊通過選擇更可靠的訓練實例來互相幫助。這兩種策略分別關注于表示增強和數據增強。與基于純文本的匹配模型相比,所提出的方法能夠從有限的甚至稀疏的交互數據中學習更好的表示,對訓練數據中的噪聲具有一定的抵抗能力。實驗結果表明,我們的模型均優于現有的方法。

論文題目:Knowledge-Enhanced Personalized Review Generation with Capsule Graph Neural Network(長文)

作 者:李軍毅(人大博士生),李思晴,趙鑫,何高樂,魏志成,袁晶,文繼榮

論文概述:個性化評論生成(PRG)任務旨在自動生成反映用戶偏好的評論文本。以前的大多數研究都沒有明確建模物品的事實描述,因此傾向于生成無信息的內容。而且,這些研究主要集中在單詞層面的生成,無法準確反映出用戶在多個主題上的抽象偏好。針對上述問題,我們提出了一種基于膠囊圖神經網絡(Caps-GNN)的知識增強個性化評論生成模型。我們首先構造一個異構知識圖譜(HKG),充分利用豐富的物品屬性。我們采用Caps-GNN學習到HKG圖膠囊,用于編碼HKG的隱含特征。我們的生成過程包含兩個主要步驟,即主題序列生成和句子生成。首先,基于圖膠囊,我們自適應地學習了主題膠囊,以推斷主題序列。然后,根據推斷的主題標簽,我們設計了一種基于圖的拷貝機制,通過引入HKG的相關實體或單詞來生成句子。本文是第一個將知識圖譜用于個性化評論生成任務,引入的KG信息能夠增強用戶在主題和單詞層面上的偏好。實驗表明,我們的模型對于個性化評論生成任務具有更好的效果。

論文題目:S3-Rec: Self-Supervised Learning for Sequential Recommendation with Mutual Information Maximization(長文)

作 者:周昆(人大博士生),王輝(人大碩士生),趙鑫,朱余韜,王思睿,張富錚,王仲遠,文繼榮

論文概述:近年來,深度學習在序列化推薦領域取得了巨大成功,已有的序列化推薦模型通常依賴于商品預測的損失函數進行參數訓練。但是該損失函數會導致數據稀疏和過擬合問題,其忽視了上下文數據與序列數據之間的關聯,使得數據的表示學習的并不充分。為解決該問題,本文提出了S3-Rec這一模型,該模型基于自注意力是模型框架,利用四個額外的自監督訓練函數來學習屬性、商品、序列之間的特殊關系。在這里,本文采用了互信息最大化技術來構造這些自監督函數,以此來統一這些關系。在六個數據集上的充分實驗表明本文提出的模型能夠取得State-of-the-art的效果,其在數據量受限和其他推薦模型上也能帶來較大的提升。

**論文:Learning Better Representations for Neural Information Retrieval with Graph Information” **

(作者:李祥圣,Maarten de Rijke, 劉奕群,毛佳昕,馬為之,張敏,馬少平)

內容簡介:目前的檢索模型多數基于文本間的匹配。然而,對于一個搜索會話,用戶的行為之間是具有聯系的,這樣的聯系可以用圖的方式表示出來。例如用戶在會話搜索中修改查詢的過程可以知道那些查詢之間是相似的,用戶點擊文檔后,可以知道查詢與文檔之間的關聯性。利用這樣的兩個網絡,我們可以構建一個由用戶行為組成的圖網絡。在傳統的文本匹配模式上,進一步地引入行為圖信息幫助檢索模型更好地理解用戶搜索意圖。檢索模型可以利用圖信息,對輸入的查詢進行相似節點查詢。同理,對于候選文檔也可以利用相似節點查詢。通過引入鄰接節點信息,豐富當前節點的語義表示。

現有的圖模型的工作主要分為兩種:網絡嵌入式表示方法與圖神經網絡方法。基于這兩種方法,我們提出了兩種利用圖信息改進檢索模型的方法,兩種方法的示意圖如下所示:

付費5元查看完整內容

題目:

Mining Implicit Relevance Feedback from User Behavior for Web Question Answering

簡介:

訓練和刷新用于多語言商業搜索引擎的Web級問答系統通常需要大量的數據。一個想法是從搜索引擎日志中記錄的用戶行為從而挖掘隱式相關性。以前所有有關挖掘隱式相關性的著作都將反饋的目標指定為Web文檔的相關性。由于QA任務中的幾個獨特特性,現有的Web文檔用戶行為模型無法應用于推斷段落相關性。在本文中,我們進行了第一項研究,以探索用戶行為與段落之間的相關性,并提出了一種挖掘Web QA訓練數據的方法。我們對四個測試數據集進行了廣泛的實驗,結果表明,在沒有人標記的數據中,我們的方法顯著提高了段落排名的準確性。實際上,已證明這項工作有效地降低了全球商業搜索引擎中質量檢查服務的人工標記成本,尤其是對于資源較少的語言。

付費5元查看完整內容

深度推薦系統近年來取得了顯著的進步。盡管其具有較高的排名精度,但其運行效率和內存消耗在現實中成為嚴重的瓶頸。為了克服這兩個限制,我們提出了LightRec,這是一個輕量級的推薦系統,具有快速的在線推理和經濟的內存消耗。LightRec的主干是B碼本,每個B碼本由W個潛在向量組成,稱為碼字。在這種結構的頂部,LightRec將有一個項目表示為B碼字的附加組合,這些B碼字是從每個碼本中最佳選擇的。為了從數據中有效地學習代碼本,我們設計了一個端到端學習工作流,其中所提出的技術克服了固有的可微性和多樣性方面的挑戰。此外,為了進一步提高表示質量,我們使用了一些蒸餾策略,這些策略可以更好地保存用戶-項目的相關性分數和相對的排序順序。LightRec通過四個真實世界的數據集進行了廣泛的評估,這產生了兩個經驗發現:1)與最先進的輕量級基線相比,LightRec在召回性能方面取得了超過11%的相對改進;2)與傳統推薦算法相比,在top-k推薦算法中,LightRec的精度下降幅度可以忽略不計,但速度提高了27倍以上。

付費5元查看完整內容
北京阿比特科技有限公司