亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

【導讀】人工智能頂會 ICLR 2021 即國際表征學習大會, 是人工智能領域全球最具影響力的學術會議之一,因此在該會議上發表論文的研究者也會備受關注。據官方統計,今年共有3013篇論文提交。ICLR 采用公開評審,可以提前看到這些論文。小編發現推薦系統(Recommendation System)相關的投稿paper很多,和常見的推薦系統paper不太一樣,投稿的大部分理論研究偏多,希望大家多多關注。

為此,這期小編繼續為大家奉上ICLR 2021必讀的六篇推薦系統投稿相關論文——深度隱變量模型、可解釋關系表示模型、多方面信任推薦、不確定性推薦、循環探索網絡、分解推薦

ICLR 2021 Submitted Paper: //openreview.net/group?id=ICLR.cc/2021/Conference

ICLR2020CI、ICML2020CI

1. DEEPLTRS: A Deep Latent Recommender System based on User Ratings and Reviews

摘要:為了給用戶提供基于觀察到的用戶評分和商品評論文本的高質量推薦,我們引入了一個深度隱變量推薦系統(deep latent recommender system, deepLTRS)。Latent的動機是,當用戶只給幾個產品打分時,評論中的文本信息是一個重要的信息來源。評論信息的加入可以緩解數據稀疏性,從而增強模型的預測能力。我們的方法采用變分自編碼器結構作為生成性深度隱變量模型,用于編碼用戶對產品的評分的有序矩陣(ordinal matrix)和評論的文檔術語矩陣。此外,與唯一的基于用戶或基于項目的模型不同,Deep LTRS假定用戶和產品都具有潛在的表示。我們提出了一種交替的用戶/產品小批量優化結構,用于聯合捕獲用戶和商品的偏好。在模擬和真實數據集上的數值實驗表明,Deep LTRS的性能優于最新技術,特別是在極端數據稀疏的情況下。

網址:

2. Interpretable Relational Representations For Food Ingredient Recommendation Systems

摘要:食物配料推薦系統支持廚師創造新的食譜是具有挑戰性的,因為好的配料組合取決于許多因素,如味道、氣味、烹飪風格、質地等。使用機器學習來解決這些問題的嘗試很少。重要的是,有用的模型不僅需要準確,更重要的是-特別是對于食品專業人士-是可解釋的。為了解決這些問題,我們提出了可解釋關系表示模型(Interpretable Relational Representation Model, IRRM)。該模型的主要組成部分是一個鍵-值記憶網絡,用于表示成分之間的關系。我們提出并測試了該模型的兩個變體。一個可以通過可訓練的記憶網絡(隱式模型)學習潛在的關系表示,而另一個可以通過集成外部知識庫(顯式模型)的預訓練的記憶網絡學習可解釋的關系表示。模型產生的關系表示是可解釋的-它們允許核對為什么建議某些配料配對。顯式模型還允許集成任何數量的手動指定的約束。我們在分別有45,772個食譜的CulinaryDB和55,001個食譜的Flavorne這兩個食譜數據集上進行了實驗。實驗結果表明,我們的模型具有預測性和信息性。

網址:

3. Multi-faceted Trust Based Recommendation System

摘要:推薦系統對用戶在互聯網上做出的選擇中起著決定性的作用。他們尋求為用戶量身定做決策。由于人們認為用戶與他們信任的人相似,會做出與這些用戶相似的選擇,這使得信任(trust)成為推薦系統中的一個非常重要的因素。在協同推薦系統(collaborative recommendation systems)中,信任及其對人們選擇的影響已經被廣泛研究。可以理為,信任不是一層不變的,而是可以隨上下文變化的。最近在基于信任的推薦系統領域的研究表明,使用基于trust的方法極大地提高了推薦質量(Mauro等人,2019年;Fang等人,2015年)。我們提出了一個推薦系統,該系統在考慮產是否適合特定用戶的同時,考慮了信任的多個方面。這種基于多方面信任的推薦器(MFTBR)體系結構考慮到了可擴展性--不需要太多的努力就可以添加新的信任方面--并且不會對動態性信任方面進行任意加權。取而代之的是,通過神經網絡優化權重以獲得最佳結果。這里考慮的信任方面是本地信任、全局信任和類別信任。MFTBR的性能明顯好于基本協同過濾-U2UCF(C.Desrosiers,2011),以及社交和基于信任的推薦系統領域的一些成熟模型-MTR(Mauro等人,2019年)和SocialFD(Yu等人,2017年)。因此,我們的模型不僅考慮了信任對推薦的影響,而且考慮了信任建立的上下文,從而提供了更接近現實生活中的推薦。

網址:

4. PURE: an Uncertainty-aware Recommendation Framework for Maximizing Expected Posterior Utility of Platform

摘要:商業推薦可以看作是推薦平臺與其目標用戶之間的互動過程。平臺的一個關鍵問題是如何充分利用其優勢,使其效用最大化,即推薦所帶來的商業利益。本文提出了一種新的推薦框架,該框架有效地利用了用戶在不同項目維度上的不確定性信息,并且顯式地考慮了展示策略對用戶的影響,從而使平臺獲得最大的期望后驗概率(maximal expected posterior)。我們將獲得最大期望后驗概率的最優策略問題描述為一個約束非凸優化問題,并進一步提出了一種基于ADMM的解來導出近似最優策略。通過對從真實推薦平臺收集的數據進行了大量的實驗,驗證了該框架的有效性。此外,我們亦采用建議的架構框架進行試驗,以揭示平臺如何取得商業效益。研究結果表明,平臺應滿足用戶對用戶喜歡的商品維度的偏好,而對于用戶不確定性較高的商品維度,該平臺可以通過推薦實用性高的商品來獲得更多的商業收益。

網址:

5. Recurrent Exploration Networks for Recommender Systems

摘要:循環神經網絡已被證明在推薦系統建模序列用戶反饋方面是有效的。然而,它們通常只關注項目相關性,而不能有效地為用戶挖掘多樣化的項目,從而在長遠來看損害了系統的性能。為了解決這個問題,我們提出了一種新型的循環神經網絡,稱為循環探索網絡( recurrent exploration networks, REN),在潛在空間中聯合進行表示學習和有效探索。試圖平衡相關性和探索性,同時考慮到表征中的不確定性。我們的理論分析表明,即使在學習的表示存在不確定性的情況下,REN也可以保持速率最優的 sublinear regret(Chu等人,2011)。我們的實驗研究表明,REN在合成和真實推薦數據集上都能獲得令人滿意的長期回報,表現優于最先進的模型。

網址:

6. Untangle: Critiquing Disentangled Recommendations

摘要:大多數協同過濾方法背后的核心原則是將用戶和項目嵌入到潛在空間中,在潛在空間中,獨立于任何特定項目屬性學習各個維度。因此,用戶很難基于特定方面(評論)控制他們的推薦。在這項工作中,我們提出了Untangle:一種推薦模型,它允許用戶相對于特定的項目屬性(例如,不那么暴力的、更有趣的電影)控制推薦列表,這些屬性在用戶偏好中具有因果關系。Untangle使用精細化的訓練過程,通過訓練:(i)一部分監督的β-VAE來解開(disentangles)項目表示,以及(ii)第二階段,其優化以生成對用戶的推薦。Untangle可以根據用戶喜好控制對推薦的評論,而不會犧牲推薦的準確性。此外,只需要極少的標簽項就可以創建與屬性無關的偏好表示。

網址:

付費5元查看完整內容

相關內容

【導讀】人工智能頂會 ICLR 2021 即國際表征學習大會, 是人工智能領域全球最具影響力的學術會議之一,因此在該會議上發表論文的研究者也會備受關注。據官方統計,今年共有3013篇論文提交。ICLR 采用公開評審,可以提前看到這些論文。小編發現基于因果推理(Causal Inference)相關的投稿paper很多,因果推理,以及反事實等相關理論方法在CV、NLP都開始有相關的應用了,這個前沿的方法受到了很多人的關注。

為此,這期小編繼續為大家奉上ICLR 2021必讀的七篇因果推理(Causal Inference)投稿相關論文——領域自適應、時間序列數據、連續終身因果效應、反事實生產式網絡、解糾纏生成式因果表示

ICLR 2021 Submitted Paper: //openreview.net/group?id=ICLR.cc/2021/Conference

ICML2020CI

1、Accounting for unobserved confounding in domain generalization

摘要:從觀察到的環境到在新的相關環境進行推斷或推廣的能力是可靠機器學習的核心,然而大多數方法在數據過多時都會失敗。在某些情況下,由于對所支配數據的因果結構的誤解,特別是未觀察到的干擾因子的影響,這些干擾因子使觀察到的分布發生變化,并扭曲了相關性。在這篇文章中,我們提出定義關于更廣泛類別的分布移位(distribution shifts)的泛化(定義為由潛在因果模型中的干預引起的),包括觀察到的、未觀察到的和目標變量分布的變化。我們提出了一種新的魯棒學習原則,它可以與任何基于梯度的學習算法配對。這一學習原則具有明確的泛化保證,并將魯棒性與因果模型中的某些不變性聯系起來,表明了為什么在某些情況下,測試性能落后于訓練性能。我們展示了我們的方法在來自不同模態的醫療數據(包括圖像和語音數據)上的性能。

網址:

2、Amortized causal discovery learning to infer causal graphs from time series data

摘要:標準的因果發現方法無論何時遇到來自新的基本因果圖的樣本,都必須適合一個新的模型。然而,這些樣本經常共享相關信息(例如,描述因果關系影響的動態信息),這些信息在遵循這種方法時會丟失。我們提出了一個新的框架-攤銷因果發現(Amortized Causal Discovery),它利用這種共享的動力來學習從時間序列數據中推斷因果關系。這使我們能夠訓練一個單一的攤銷模型,該模型推斷具有不同基本因果圖的樣本之間的因果關系,從而利用共享的信息。我們通過實驗證明了這種以變分模型實現的方法在因果發現性能方面有了顯著的改進,并展示了如何將其擴展以在 hidden confounding情況下很好地執行。

網址:

3、Continual lifelong causal effect inference with real world evidence

摘要:當前觀測數據非常容易獲取,這極大地促進了因果關系推理的發展。盡管在克服因果效應估計方面的挑戰方面取得了重大進展,在缺少反事實數據(counterfactual outcomes)和選擇偏差的情況下,但是現有方法只關注特定于源的和穩定的觀測數據。本文研究了從增量觀測數據中推斷因果關系的一個新的研究問題,并相應地提出了三個新的評價標準,包括可擴展性、適應性和可達性。我們提出了一種連續因果效應表示學習(Continual Causal Effect Representation Learning )方法,用于估計非平穩數據分布中增量可用的觀測數據的因果效應。我們的方法不是訪問所有可見的觀測數據,而是僅存儲從先前數據學習的有限的特征表示子集。該方法將選擇性均衡表示學習、特征表示提煉和特征變換相結合,在不影響對原始數據估計能力的前提下,實現了對新數據的連續因果估計。大量實驗證明了連續因果推理的重要性和方法的有效性。

網址:

4、Counterfactual generative networks

摘要:神經網絡很容易找到學習捷徑--它們經常對簡單的關系進行建模,而忽略了可能更好地概括更復雜的關系。以往的圖像分類工作表明,深度分類器不是學習與物體形狀的聯系,而是傾向于利用與低層紋理或背景的虛假相關性來解決分類任務。在這項工作中,我們朝著更健壯和可解釋的分類器邁進,這些分類器顯式地揭示了任務的因果結構。基于目前在深度生成建模方面的進展,我們提出將圖像生成過程分解為獨立的因果機制,我們在沒有直接監督的情況下對這些機制進行訓練。通過利用適當的歸納偏差,這些機制將對象形狀、對象紋理和背景分開;因此,它們允許生成反事實圖像。我們演示了我們的模型在MNIST和ImageNet上生成此類圖像的能力。此外,我們還表明,盡管反事實圖像是人工合成的,但它們可以在原始分類任務的性能略有下降的情況下,提高分布外的穩健性。最后,我們的生成式模型可以在單個GPU上高效地訓練,利用常見的預訓練模型作為歸納偏差(inductive biases)。

網址:

5、Disentangled generative causal representation learning

摘要:這篇文章提出了一種解纏的生成式因果表示(Disentangled Generative Causal Representation,DEPE)學習方法。與現有的強制獨立于潛在變量的解纏方法不同,我們考慮的是潛在因素可以因果關聯的一般情況。我們表明,以前的方法與獨立的先驗不能解開因果相關的因素。受這一發現的啟發,我們提出了一種新的解纏學習方法DELE,該方法實現了因果可控生成和因果表示學習。這一新公式的關鍵是使用結構因果模型(SCM)作為雙向生成模型的先驗。然后,使用適當的GAN損失與生成器和編碼器聯合訓練先驗。我們給出了所提公式的理論證明,保證了在適當條件下的解纏因果表示學習。我們在合成和真實數據上進行了廣泛的實驗,以證明DEAR在因果可控生成方面的有效性,以及學習的表示在樣本效率和分布穩健性方面對下游任務的好處。

網址:

6、Explaining the efficacy of counterfactually augmented data

摘要:為了減少機器學習模型對訓練數據中虛假模式的依賴,研究人員最近提出通過human-in-the-loop進程來生成與事實相反的增強數據。正如在NLP中所應用的那樣,給定一些文檔及其(初始)標簽,人類的任務是修改文本以使(給定的)反事實標簽適用。重要的是,這些說明禁止進行翻轉適用標簽時不必要的編輯。在擴充(原始和修訂)數據上訓練的模型已被證明較少依賴語義無關的單詞,并能更好地概括域外。雖然這項工作借鑒了因果思維,將編輯塑造為干預措施,并依靠人類的理解來評估結果,但潛在的因果模型并不清楚,也不清楚在域外評估中觀察到的改進背后的原則。在這篇文章中,我們探索了一個模擬玩具(toy analog),使用線性高斯模型。我們的分析揭示了因果模型、測量噪聲、域外泛化和對虛假信號的依賴之間的有趣關系。有趣的是,我們的分析表明,通過向因果特征添加噪聲而損壞的數據將降低域外性能,而向非因果特征添加噪聲可能會使模型在域外更加健壯。這一分析產生了有趣的見解,有助于解釋反事實增強數據的有效性。最后,我們提出了一個支持這一假說的大規模實證研究。

網址:

7、Selecting treatment effects models for domain adaptation using causal knowledge

摘要:從觀察數據中選擇因果推斷模型來估計個體化治療效果(ITE)是一個挑戰,因為從來沒有觀察到反事實的結果。該問題在無監督域自適應(UDA)設置中進一步受到挑戰,在該設置中,我們只能訪問源域中的已標記樣本,但是我們希望選擇在僅有未標記樣本可用的目標域上實現良好性能的模型。現有的用于UDA模型選擇的技術是針對預測設置設計的。這些方法檢查源域和目標域中輸入協變量之間的判別密度比,并且不考慮模型在目標域中的預測。正因為如此,在源域上具有相同性能的兩個模型通過現有方法將獲得相同的風險分數,但在現實中,它們在測試域上具有顯著不同的性能。我們利用因果結構跨域的不變性來引入一種新的模型選擇度量,該度量專門針對UDA設置下的ITE模型而設計。特別是,我們建議選擇對干預效果的預測滿足目標領域中已知因果結構的模型。在實驗上,我們的方法在幾個合成和真實的醫療數據集上選擇對協變量變化更穩健的ITE模型,包括估計來自不同地理位置的新冠肺炎患者的通風效果。

網址:

付費5元查看完整內容

【導讀】ICML(International Conference on Machine Learning),即國際機器學習大會, 是機器學習領域全球最具影響力的學術會議之一,因此在該會議上發表論文的研究者也會備受關注。因疫情的影響, 今年第37屆ICML大會已于2020年7月13日至18日在線上舉行。據官方統計,ICML 2020共提交4990篇論文,接收論文1088篇,接收率為21.8%。與往年相比,接收率逐年走低。小編發現基于因果推理(Causal Inference)相關的paper很多,因果推理,以及反事實等相關理論方法在CV、NLP都開始有相關的應用了,這個前沿的方法受到了很多人的關注。

為此,這期小編繼續為大家奉上ICML 2020必讀的六篇因果推理(Causal Inference)相關論文——隱私攻擊、因果效應估計、分層貝葉斯模型、反事實交叉驗證、協變量表示

ICML 2020 Accepted Paper: //proceedings.icml.cc/book/2020

ICML2020GNN_Part1、KDD2020GNN_Part1、CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、

1、Alleviating Privacy Attacks via Causal Learning

作者:Shruti Tople, Amit Sharma, Aditya V. Nori

摘要:機器學習模型,特別是深度神經網絡,已經被證明容易受到隱私攻擊,例如成員關系推理(membership inference),在這種情況下,對手可以檢測到數據點是否被用于訓練黑盒模型。當模型用于預測不可知數據分布時,這樣的隱私風險就會加劇。為了減輕隱私攻擊,我們展示了基于輸入特征和結果之間因果關系預測模型的好處。我們首先表明,使用因果結構學習的模型可以更好地推廣到不可知數據(unseen data),特別是在與訓練分布具有不同分布的數據上。基于這一性質,我們建立了因果關系和隱私之間的理論聯系:與關聯模型相比,因果模型提供了更強的區分隱私保證,并且對成員關系推理攻擊具有更強的魯棒性。在模擬的Bayesian networks和colored-MNIST數據集上的實驗表明,在不同的測試分布和樣本大小情況下,關聯模型的攻擊準確率高達80%,而因果模型的攻擊準確率接近隨機猜測。

網址:

2、Causal Effect Estimation and Optimal Dose Suggestions in Mobile Health International Conference on Machine Learning

作者:Liangyu Zhu, Wenbin Lu, Rui Song

摘要:在這篇文章中,我們提出了新的結構性嵌套模型(nested models)來估計基于移動健康數據的持續治療的因果效應(causal effects)。為了找到優化患者預期短期結果的治療方案,我們將加權lag-K advantage定義為價值函數。然后將最優干預方案為使價值函數最大化的方案。我們的方法對數據生成過程施加了最小的假設。對估計的參數進行統計推斷。模擬研究和在Ohio type 1 diabetes 數據集的應用表明,我們的方法可以為移動健康數據的劑量建議提供有意義的見解。

網址:

3、Causal Inference using Gaussian Processes with Structured Latent Confounders

作者:Sam Witty, Kenta Takatsu, David Jensen, Vikash Mansinghka

摘要:潛在干擾因子(confounders)-影響介入選擇和結果的一些未觀察到的變量-可能會對因果效應的估計產生偏差。在某些情況下,這些干擾因子在不同的觀察中是相同的,例如,一所學校的所有學生除了單獨接受任何教育的干預外,還受到學校文化的影響。本文展示了如何對具有這種結構的潛在干擾因子進行建模,從而改進對因果效應的估計。主要創新點是分層貝葉斯模型、帶結構干擾因子的高斯過程(Gaussian processes with structured latent confounders, GP-SLC)和基于橢圓切片采樣(elliptical slice sampling)的蒙特卡羅推理(Monte Carlo inference)算法。GP-SLC提供個體治療效果的原則性貝葉斯不確定性估計,對與干擾因子、協變量、介入和結果相關的函數形式的假設最少。本文還證明,對于線性函數形式,考慮潛在干擾因子中的結構對于因果效應的漸近相容估計是充分的。最后,本文證明了GP-SLC與等級線性模型( multi-level linear models)和貝葉斯加性回歸樹(Bayesian additive regression trees)等廣泛使用的因果推理技術相比具有競爭力或更高的精確度。基準數據集包括 Infant Health 和Development Program ,以及顯示溫度變化對整個新英格蘭全州能源消耗的影響的數據集。

網址:

4、Counterfactual Cross-Validation:Stable Model Selection Procedure for Causal Inference Models

作者:Yuta Saito, Shota Yasui

摘要:本文研究了conditional average treatment effect(CATE)預測中的模型選擇問題。與以往的研究工作不同,我們的重點是保持候選CATE預測器性能的等級順序,以便能夠準確和穩定地選擇模型。為此,我們分析了模型的性能排名問題,并制定了指導方針,以獲得更好的評價指標。然后,我們提出了一種新的度量方法,它可以高置信度地識別CATE預測器的性能排名。實驗評估表明,我們的度量方法在模型選擇和超參數調整任務上都優于現有的度量方法。

網址:

5、DeepMatch: Balancing Deep Covariate Representations for Causal Inference Using Adversarial Training

作者:Nathan Kallus

摘要:當豐富的協變量(covariates)和復雜的關系需要靈活的神經網絡建模時,我們研究了從觀測數據中進行因果推理時,如何平衡其協變量表示。在這種情況下,諸如傾向于加權和匹配/平衡之類的標準方法分別會因為未正確校正的傾向網絡和不合適的協變量表示而失敗。我們提出了一種基于權重和判別器網絡的對抗訓練的新方法,可以有效地解決這種方法上的差距。這是經過新的理論特征和基于合成與臨床數據的經驗結果證明的,這些結果表明在這種挑戰性的環境中如何解決因果分析。

網址:

6、Efficient Identification in Linear Structural Causal Models with Auxiliary Cutsets

作者:Daniel Kumor, Carlos Cinelli, Elias Bareinboim

摘要:我們提出了一種新的多項式時間(polynomial-time)算法來識別線性因果模型中的結構系數,它包含了以前最先進的方法,統一了幾種不同的識別方法。在這些結果的基礎上,我們開發了一種識別線性系統中總因果效應的程序。

網址:

付費5元查看完整內容

【導讀】ICML(International Conference on Machine Learning),即國際機器學習大會, 是機器學習領域全球最具影響力的學術會議之一,因此在該會議上發表論文的研究者也會備受關注。因疫情的影響, 今年第37屆ICML大會將于2020年7月13日至18日在線上舉行。據官方統計,ICML 2020共提交4990篇論文,接收論文1088篇,接收率為21.8%。與往年相比,接收率逐年走低。在會議開始前夕,專知小編為大家整理了ICML 2020圖神經網絡(GNN)的六篇相關論文供參考——核GNN、特征變換、Haar 圖池化、無監督圖表示、譜聚類、自監督GCN。

ICML 2020 Accepted Papers //icml.cc/Conferences/2020/AcceptedPapersInitial

ACL2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN

1. Convolutional Kernel Networks for Graph-Structured Data

作者:Dexiong Chen, Laurent Jacob, Julien Mairal

摘要:我們引入了一系列多層圖核,并在圖卷積神經網絡和核方法之間建立了新的聯系。我們的方法通過將圖表示為核特征映射序列將卷積核網絡推廣到圖結構數據,其中每個節點攜帶關于局部圖子結構的信息。一方面,核的觀點提供了一種無監督的、有表現力的、易于正規化的數據表示,這在樣本有限的情況下很有用。另一方面,我們的模型也可以在大規模數據上進行端到端的訓練,從而產生了新型的圖卷積神經網絡。我們的方法在幾個圖分類基準上取得了與之相當的性能,同時提供了簡單的模型解釋。

網址:

代碼鏈接:

2. GNN-FILM: Graph Neural Networks with Feature-Wise Linear Modulation 作者:Marc Brockschmidt

摘要:本文提出了一種新的基于特征線性調制(feature-wise linear modulation,FiLM)的圖神經網絡(GNN)。許多標準GNN變體僅通過每條邊的源的表示來計算“信息”,從而沿著圖的邊傳播信息。在GNN-FILE中,邊的目標節點的表示被附加地用于計算可以應用于所有傳入信息的變換,從而允許對傳遞的信息進行基于特征的調制。基于基線方法的重新實現,本文給出了在文獻中提到的三個任務上的不同GNN體系結構的實驗結果。所有方法的超參數都是通過廣泛的搜索找到的,產生了一些令人驚訝的結果:基線模型之間的差異比文獻報道的要小。盡管如此,GNN-FILE在分子圖的回歸任務上的表現優于基線方法,在其他任務上的表現也具有競爭性。

網址:

3. Haar Graph Pooling

作者:Yu Guang Wang, Ming Li, Zheng Ma, Guido Montufar, Xiaosheng Zhuang, Yanan Fan

摘要:深度圖神經網絡(GNNs)是用于圖分類和基于圖的回歸任務的有效模型。在這些任務中,圖池化是GNN適應不同大小和結構的輸入圖的關鍵因素。本文提出了一種新的基于壓縮Haar變換的圖池化操作-HaarPooling。HaarPooling實現了一系列池化操作;它是通過跟隨輸入圖的一系列聚類序列來計算的。HaarPooling層將給定的輸入圖變換為節點數較小、特征維數相同的輸出圖;壓縮Haar變換在Haar小波域中過濾出細節信息。通過這種方式,所有HaarPooling層一起將任何給定輸入圖的特征合成為大小一致的特征向量。這種變換提供了數據的稀疏表征,并保留了輸入圖的結構信息。使用標準圖卷積層和HaarPooling層實現的GNN在各種圖分類和回歸問題上實現了最先進的性能。

網址:

4. Interferometric Graph Transform: a Deep Unsupervised Graph Representation 作者:Edouard Oyallon

摘要:我們提出了Interferometric Graph Transform(IGT),這是一類用于構建圖表示的新型深度無監督圖卷積神經網絡。我們的第一個貢獻是提出了一種從歐幾里德傅立葉變換的推廣得到的通用復數譜圖結構。基于一個新穎的貪婪凹目標,我們的學習表示既包括可區分的特征,也包括不變的特征。通過實驗可以得到,我們的學習過程利用了譜域的拓撲,這通常是譜方法的一個缺陷,特別是我們的方法可以恢復視覺任務的解析算子。我們在各種具有挑戰性的任務上測試了我們的算法,例如圖像分類(MNIST,CIFAR-10)、社區檢測(Authorship,Facebook graph)和3D骨架視頻中的動作識別(SBU,NTU),在譜圖非監督環境下展示了一種新的技術水平。

網址:

5. Spectral Clustering with Graph Neural Networks for Graph Pooling

作者:Filippo Maria Bianchi, Daniele Grattarola, Cesare Alippi

摘要:譜聚類(SC)是發現圖上強連通社區的一種流行的聚類技術。SC可以在圖神經網絡(GNN)中使用,以實現聚合屬于同一簇的節點的池化操作。然而,Laplacian的特征分解代價很高,而且由于聚類結果是特定于圖的,因此基于SC的池化方法必須對每個新樣本執行新的優化。在本文中,我們提出了一種圖聚類方法來解決SC的這些局限性。我們建立了歸一化minCUT問題的連續松弛公式,并訓練GNN來計算最小化這一目標的簇分配。我們的基于GNN的實現是可微的,不需要計算譜分解,并且學習了一個聚類函數,可以在樣本外的圖上快速評估。從提出的聚類方法出發,我們設計了一個圖池化算子,它克服了現有圖池化技術的一些重要局限性,并在多個監督和非監督任務中取得了最好的性能。

網址:

6. When Does Self-Supervision Help Graph Convolutional Networks?

作者:Yuning You, Tianlong Chen, Zhangyang Wang, Yang Shen

摘要:自監督作為一種新興的技術已被用于訓練卷積神經網絡(CNNs),以提高圖像表示學習的可傳遞性、泛化能力和魯棒性。然而,自監督對操作圖形數據的圖卷積網絡(GCNS)的介紹卻很少被探索。在這項研究中,我們首次將自監督納入GCNS的系統探索和評估。我們首先闡述了將自監督納入GCNS的三種機制,分析了預訓練&精調和自訓練的局限性,并進而將重點放在多任務學習上。此外,我們還提出了三種新的GCNS自監督學習任務,并進行了理論分析和數值比較。最后,我們進一步將多任務自監督融入到圖對抗性訓練中。研究結果表明,通過合理設計任務形式和合并機制,自監督有利于GCNS獲得更強的泛化能力和魯棒性。

網址:

代碼鏈接:

付費5元查看完整內容

【導讀】作為CCF推薦的A類國際學術會議,International ACM SIGIR Conference on Research and Development in Information Retrieval(國際計算機學會信息檢索大會,簡稱 SIGIR)在信息檢索領域享有很高的學術聲譽,每年都會吸引全球眾多專業人士參與。今年的 SIGIR 2020計劃將于 2020年7月25日~30日在中國西安舉行。本次大會共有555篇長文投稿,僅有147篇長文被錄用,錄用率約26%。專知小編提前為大家整理了六篇SIGIR 2020 基于圖神經網絡的推薦(GNN+RS)相關論文,這六篇論文分別出自中科大何向南老師和和昆士蘭大學陰紅志老師團隊,供大家參考——捆綁推薦、Disentangled GCF、服裝推薦、多行為推薦、全局屬性GNN

CVPR2020SGNN、CVPR2020GNN_Part2、CVPR2020GNN_Part1、WWW2020GNN_Part1、AAAI2020GNN、ACMMM2019GNN、CIKM2019GNN、ICLR2020GNN、EMNLP2019GNN、ICCV2019GNN_Part2、ICCV2019GNN_Part1、NIPS2019GNN、IJCAI2019GNN_Part1、IJCAI2019GNN_Part2、KDD2019GNN、ACL2019GNN、CVPR2019GNN

1. Bundle Recommendation with Graph Convolutional Networks

作者:Jianxin Chang, Chen Gao, Xiangnan He, Yong Li, Depeng Jin

摘要:捆綁推薦(Bundle recommendation )旨在推薦一組商品供用戶整體消費。現有的解決方案通過共享模型參數或多任務學習的方式將用戶項目交互建模集成到捆綁推薦中,然而,這些方法不能顯式建模項目與捆綁包(bundles)之間的隸屬關系,不能探索用戶選擇捆綁包時的決策。在這項工作中,我們提出了一個用于捆綁推薦的圖神經網絡模型BGCN(Bundle Graph Convolutional Network)。BGCN將用戶-項目交互、用戶-捆綁包交互和捆綁包-項目從屬關系統一到一個異構圖中。以項目節點為橋梁,在用戶節點和捆綁包節點之間進行圖卷積傳播,使學習到的表示能夠捕捉到項目級的語義。通過基于hard-negative采樣器的訓練,可以進一步區分用戶對相似捆綁包的細粒度偏好。在兩個真實數據集上的實驗結果表明,BGCN的性能有很高的提升,其性能比最新的基線高出10.77%到23.18%。

網址: //arxiv.org/abs/2005.03475

2. Disentangled Graph Collaborative Filtering

作者:Xiang Wang, Hongye Jin, An Zhang, Xiangnan He, Tong Xu, Tat-Seng Chua

摘要:從交互數據中學習用戶和項目的信息表示對于協同過濾(CF)至關重要。當前的嵌入函數利用用戶-項目關系來豐富表示,從單個用戶-項目實例演變為整體交互圖。然而,這些方法在很大程度上以統一的方式對關系進行建模,而忽略了用戶采用這些項目的意圖的多樣性,這可能是為了打發時間,為了興趣,或者為其他人(如家庭)購物。這種統一的對用戶興趣建模的方法很容易導致次優表示,不能對不同的關系建模并在表示中分清用戶意圖。在這項工作中,我們特別關注用戶意圖細粒度上的用戶-項目關系。因此,我們設計了一種新的模型- Disentangled圖協同過濾(Disentangled Graph Collaborative Filtering ,DGCF),來理清這些因素并產生disentangled的表示。具體地說,通過在每個用戶-項目交互意圖上的分布建模,我們迭代地細化意圖感知的交互圖和表示。同時,我們鼓勵不同的意圖獨立。這將生成disentangled的表示,有效地提取與每個意圖相關的信息。我們在三個基準數據集上進行了廣泛的實驗,DGCF與NGCF、DisenGCN和MacridV AE這幾個最先進的模型相比取得了顯著的改進。進一步的分析揭示了DGCF在分解用戶意圖和表示的可解釋性方面的優勢。

網址:

代碼鏈接:

.

3. GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection

作者:Shijie Zhang, Hongzhi Yin, Tong Chen, Quoc Viet Nguyen Hung, Zi Huang, Lizhen Cui

摘要:近年來,推薦系統已經成為所有電子商務平臺中不可缺少的功能。推薦系統的審查評級數據通常來自開放平臺,這可能會吸引一群惡意用戶故意插入虛假反饋,試圖使推薦系統偏向于他們。此類攻擊的存在可能會違反高質量數據始終可用的建模假設,而這些數據確實會影響用戶的興趣和偏好。因此,構建一個即使在攻擊下也能產生穩定推薦的健壯推薦系統具有重要的現實意義。本文提出了一種基于GCN的用戶表示學習框架GraphRf,該框架能夠統一地進行穩健的推薦和欺詐者檢測。在其端到端學習過程中,用戶在欺詐者檢測模塊中被識別為欺詐者的概率自動確定該用戶的評級數據在推薦模塊中的貢獻;而在推薦模塊中輸出的預測誤差作為欺詐者檢測模塊中的重要特征。因此,這兩個組成部分可以相互促進。經過大量的實驗,實驗結果表明我們的GraphRf在魯棒評級預測和欺詐者檢測這兩個任務中具有優勢。此外,所提出的GraphRf被驗證為對現有推薦系統上的各種攻擊具有更強的魯棒性。

網址:

4. Hierarchical Fashion Graph Network for Personalized Outfit Recommendation

作者:Xingchen Li, Xiang Wang, Xiangnan He, Long Chen, Jun Xiao, Tat-Seng Chua

摘要:服裝推薦越來越受到網購服務商和時尚界的關注。與向用戶推薦單個單品(例如,朋友或圖片)的其他場景(例如,社交網絡或內容共享)不同,服裝推薦預測用戶對一組匹配良好的時尚單品的偏好。因此,進行高質量的個性化服裝推薦應滿足兩個要求:1)時尚單品的良好兼容性;2)與用戶偏好的一致性。然而,目前的研究主要集中在其中一個需求上,只考慮了用戶-全套服裝(outfit)或全套服裝-項目的關系,從而容易導致次優表示,限制了性能。在這項工作中,我們統一了兩個任務,服裝兼容性建模和個性化服裝推薦。為此,我們開發了一個新的框架,層次時尚圖網絡(HFGN),用于同時建模用戶、商品和成套服裝之間的關系。特別地,我們構建了一個基于用戶-全套服裝交互和全套服裝-項目映射的層次結構。然后,我們從最近的圖神經網絡中得到啟發,在這種層次圖上使用嵌入傳播,從而將項目信息聚合到一個服裝表示中,然后通過他/她的歷史服裝來提煉用戶的表示。此外,我們還對這兩個任務進行了聯合訓練,以優化這些表示。為了證明HFGN的有效性,我們在一個基準數據集上進行了廣泛的實驗,HFGN在NGNN和FHN等最先進的兼容性匹配模型基礎上取得了顯著的改進。

網址:

代碼鏈接:

5. Multi-behavior Recommendation with Graph Convolutional Networks

作者:Bowen Jin, Chen Gao, Xiangnan He, Depeng Jin, Yong Li

摘要:傳統的推薦模型通常只使用一種類型的用戶-項目交互,面臨著嚴重的數據稀疏或冷啟動問題。利用多種類型的用戶-項目交互(例如:點擊和收藏)的多行為推薦可以作為一種有效的解決方案。早期的多行為推薦研究未能捕捉到行為對目標行為的不同程度的影響。它們也忽略了多行為數據中隱含的行為語義。這兩個限制都使得數據不能被充分利用來提高對目標行為的推薦性能。在這項工作中,我們創新性地構造了一個統一的圖來表示多行為數據,并提出了一種新的模型--多行為圖卷積網絡(Multi-Behavior Graph Convolutional Network,MBGCN)。MBGCN通過用戶-項目傳播層學習行為強度,通過項目-項目傳播層捕獲行為語義,較好地解決了現有工作的局限性。在兩個真實數據集上的實驗結果驗證了該模型在挖掘多行為數據方面的有效性。我們的模型在兩個數據集上的性能分別比最優基線高25.02%和6.51%。對冷啟動用戶的進一步研究證實了該模型的實用性。

網址:

6. GAG: Global Atributed Graph Neural Network for Streaming Session-based Recommendation

作者:Ruihong Qiu, Hongzhi Yin, Zi Huang, Tong Chen

摘要:基于流會話的推薦(Streaming session-based recommendation,SSR)是一項具有挑戰性的任務,它要求推薦器系統在流媒體場景(streaming scenario)中進行基于會話的推薦(SR)。在電子商務和社交媒體的現實應用中,在一定時間內產生的一系列用戶-項目交互被分組為一個會話,這些會話以流的形式連續到達。最近的SR研究大多集中在靜態集合上,即首先獲取訓練數據,然后使用該集合來訓練基于會話的推薦器模型。他們需要對整個數據集進行幾個epoch的訓練,這在流式設置下是不可行的。此外,由于對用戶信息的忽視或簡單使用,它們很難很好地捕捉到用戶的長期興趣。雖然最近已經提出了一些流推薦策略,但它們是針對個人交互流而不是會話流而設計的。本文提出了一種求解SSR問題的帶有Wasserstein 庫的全局屬性圖(GAG)神經網絡模型。一方面,當新的會話到達時,基于當前會話及其關聯用戶構造具有全局屬性的會話圖。因此,GAG可以同時考慮全局屬性和當前會話,以了解會話和用戶的更全面的表示,從而在推薦中產生更好的性能。另一方面,為了適應流會話場景,提出了Wasserstein庫來幫助保存歷史數據的代表性草圖。在兩個真實數據集上進行了擴展實驗,驗證了GAG模型與最新方法相比的優越性。

網址:

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。由于疫情影響,會議在線上舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。上周專知小編整理了WWW 2020 推薦系統相關論文-part2,這期小編繼續為大家奉上WWW 2020六篇推薦系統相關論文-part3 供參考——上下文感知推薦、雙邊公平推薦、MetaSelector、視覺主題推薦、社交影響力。 WWW2020RS_Part2、WWW2020RS_Part1

1. Eficient Non-Sampling Factorization Machines for Optimal Context-Aware Recommendation

作者:Chong Chen, Min Zhang, Weizhi Ma, Yiqun Liu, and Shaoping Ma

摘要:為了提供更準確的推薦,在對用戶項目交互進行建模之外考慮上下文特征已成為一個熱門話題。具有負采樣的因子分解機(FM)是一種流行的上下文感知推薦解決方案。然而,由于采樣可能丟失重要信息,并且在實際應用中通常會導致非最優性能,因此該算法的魯棒性不強。最近的一些努力通過使用深度學習框架建模高階特征交互增強了FM的性能。而他們要么只關注評分預測任務,要么通常采用負采樣策略來優化排名效果。由于采樣的巨大的波動,我們有理由認為這些基于采樣的FM方法對于上下文感知推薦仍然不是最佳的。在本文中,我們提出在不進行采樣的情況下學習FM,以有助于上下文感知推薦??的排名任務。盡管這種方法效率很高,但這種非采樣策略對模型的學習效率提出了很大的挑戰。因此,我們進一步設計了一種新的理想框架--有效非采樣樣因子分解機(ENSFM)。ENSFM不僅無縫連接了FM和矩陣分解(MF)之間的關系,而且通過新穎的記憶策略解決了具有挑戰性的效率問題。通過在三個真實的公共數據集上的大量實驗表明:1)我們提出的ENSFM的性能一致且顯著優于現有的上下文感知Top-K推薦方法,2)ENSFM在訓練效率上具有顯著的優勢,使其更適用于實際的大系統。此外,實驗結果表明,對于Top-K推薦任務,合適的學習方法比先進的神經網絡結構更為重要。

網址:

//www.thuir.cn/group/~mzhang/publications/TheWebConf2020-Chenchong.pdf

代碼鏈接:

2. FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms

作者:Gourab K Patro, Arpita Biswas, Niloy Ganguly, Krishna P. Gummadi and Abhijnan Chakraborty

摘要:我們在雙邊在線平臺的背景下調查公平推薦(fair recommendation )問題,該平臺由一邊的客戶和另一邊的生產商組成。這些平臺推薦服務的傳統方法側重于根據個人客戶的個性化偏好定制結果,以實現客戶滿意度的最大化。然而,我們的調查顯示,這種以客戶為中心的設計可能會導致生產商之間曝光量的不公平分配,這可能會對他們的利益造成不利影響。另一方面,以生產商為中心的設計可能會對客戶不公平。因此,我們考慮了客戶和生產商之間的公平問題。我們的方法將公平推薦問題映射為一個公平分配不可分割商品問題的新穎映射。我們提出的FairRec算法可確保至少為大多數生產商提供Maximin Share(MMS)的曝光量,并為每個客戶提供多達Envy-Free(EF1)的公平性。對多個真實世界數據集的廣泛評估顯示,FairRec在確保雙面公平性的同時,在總體推薦質量方面造成了邊際損失的有效性。

網址:

3. MetaSelector: Meta-Learning for Recommendation with User-Level Adaptive Model Selection

作者:Mi Luo, Fei Chen, Pengxiang Cheng, Zhenhua Dong, Xiuqiang He, Jiashi Feng and Zhenguo Li

摘要:推薦系統通常面對包含高度個性化用戶歷史數據的異構數據集,在這些數據集中,沒有哪個模型可以為每個用戶提供最佳建議。我們在公共和私有數據集上都觀察到了這種普遍存在的現象,并解決了模型選擇問題,以追求對每個用戶的推薦質量的優化。我們提出了一個元學習框架來促進推薦系統中用戶級的自適應模型選擇。在此框架中,我們將使用來自所有用戶的數據來訓練推薦者集合,然后通過元學習對模型選擇器進行訓練,以使用用戶特定的歷史數據為每個用戶選擇最佳的單個模型。我們在兩個公共數據集和一個真實的生產數據集上進行了廣泛的實驗,證明了我們的框架在AUC和LogLoss方面比單一的模型基線和樣本級模型選擇器都有改進。特別是,當這些改進部署在在線推薦系統中時,可能會帶來巨大的利潤收益。

網址:

4. Recommending Themes for Ad Creative Design via Visual-Linguistic Representations

作者:Yichao Zhou, Shaunak Mishra, Manisha Verma, Narayan Bhamidipati and Wei Wang

摘要:在線廣告行業中經常需要更新廣告創意,即用于吸引在線用戶進入品牌的圖像和文字。進行此類更新,是為了減少在線用戶中廣告疲勞的可能性,并將其他成功的廣告加入到相關產品類別中。對于創意策略師來說,給定一個品牌,為一個新的廣告想出主題是一個費時費力的過程。創意策略師來通常從過去廣告活動中使用的圖像和文字以及有關品牌的知識中汲取靈感。為了在過去的廣告活動中通過此類多模態信息自動推斷廣告主題,我們為廣告創意策略師提出了主題(關鍵詞)推薦系統。主題推薦器基于視覺問答(VQA)任務的聚合結果,該任務提取以下內容:(i)廣告圖像,(ii)與廣告關聯的文字以及廣告中品牌的Wikipedia頁面,(iii)有關廣告的問題。我們利用基于transformer的跨模態編碼器來為VQA任務訓練視覺語言表示。我們沿著分類和排序的思路研究了VQA任務的兩個公式;通過在公共數據集上的實驗,表明跨模態表示顯著地提高了分類準確率和排序精準-召回指標。與單獨的圖像和文本表示相比,跨模式表示顯示出更好的性能。此外,與僅使用文本或視覺信息相比,多模態信息的使用表現出顯著提升。

網址:

5. The Structure of Social Influence in Recommender Networks

作者:Pantelis P. Analytis, Daniel Barkoczi, Philipp Lorenz-Spreen and Stefan M. Herzog

摘要:人們在品味(taste)上影響他人意見的能力各不相同-既包括離線與在線推薦系統。這些驚人差異背后的機制是什么?使用加權k最近鄰算法(k-nn)表示一系列社會學習策略,我們利用網絡科學的方法展示了k-nn算法如何在六個現實世界的品味領域中引發社會影響力網絡。我們給出了三個新的結果,分別適用于離線建議獲取和在線推薦器設置。首先,有影響力的個人具有主流品味,與其他人的品味相似性分散度很高。其次,個人或算法咨詢的人越少(即k越低),或者對其他更相似的人的意見給予的權重越大,具有實質性影響的人的群體就越小。第三,對部署k-nn算法后產生的影響網絡是分層組織的。我們的結果為通信和網絡科學中的經典實證發現提供了新的線索,有助于提高對線下和在線上的社會影響的理解。

網址:

6. Latent Linear Critiquing for Conversational Recommender Systems

作者:PKai Luo, Scott Sanner, Ga Wu, Hanze Li and Hojin Yang

摘要:批判(Critiquing)是一種用于會話推薦的方法,可根據用戶的偏好反饋迭代地調整建議。在該設置中,迭代地向用戶提供該項目的項目推薦和屬性描述;用戶可以接受該推薦,或者批判項目描述中的屬性以生成新的推薦。之前的批判方法主要基于顯式約束和基于實用程序的方法來修改推薦(評判的項目屬性)。在這篇文章中,我們回顧了基于潛在嵌入和主觀項目描述(即來自用戶評論的關鍵詞)的推薦方法時代的批判方法。主要兩個關鍵的研究問題:(1)如何將關鍵詞批判與用戶偏好嵌入一起嵌入以更新推薦,(2)如何調節多步驟批判性反饋的強度,其中批判性反饋不一定是獨立的,也不一定是同等重要的。為了解決(1),我們構建了一個現有的最先進的線性嵌入推薦算法,以使基于評論的關鍵詞屬性與用戶偏好嵌入保持一致。為了解決(2),我們利用嵌入和推薦預測的線性結構來建立一個基于線性規劃(LP)的優化問題,以確定納入批評反饋的最優權重。我們在兩個包含模擬用戶評論的推薦數據集上評估提出的框架。與對批判反饋進行平均的標準方法相比,實驗結果表明,我們的方法減少了找到滿意項目所需的交互次數,并提高了總體成功率。

網址:

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。近期,推薦相關也比較熱門,專知小編提前整理了WWW 2020 推薦系統比較有意思的的論文,供參考——序列推薦、可解釋Serendipity 推薦、推薦效率、 bandit推薦、Off-policy學習。 WWW2020RS_Part1

  1. A Contextualized Temporal Attention Mechanism for Sequential Recommendation

作者:Jibang Wu, Renqin Cai, Hongning Wang

摘要:根據用戶的歷史連續行為預測用戶的偏好對于現代推薦系統來說是具有挑戰性的,也是至關重要的。現有的序列推薦算法在建模歷史事件對當前預測的影響時,大多側重于序列行為之間的過渡結構,而很大程度上忽略了時間和上下文信息。在這篇文章中,我們認為過去的事件對用戶當前行為的影響應該隨著時間的推移和不同的背景而變化。因此,我們提出了一種情境時間注意力機制(Contextualized Temporal Attention),該機制可以學習權衡歷史行為在行為以及行為發生的時間和方式上的影響。更具體地說,為了動態地校準來自自注意力機制的相對輸入的依賴關系,我們提出了多個參數化的核函數以學習各種時間動態,然后使用上下文信息來確定每個輸入要跟隨哪一個kernel( reweighing kernels )。在對兩個大型公開推薦數據集進行的實證評估中,我們的模型始終優于一系列最先進的序列推薦方法。

網址:

//arxiv.org/pdf/2002.00741.pdf

  1. Directional and Explainable Serendipity Recommendation

作者:Xueqi Li, Wenjun Jiang, Weiguang Chen, Jie Wu, Guojun Wang, Kenli Li

摘要:近幾年來,Serendipity推薦越來越受到人們的關注,它致力于提供既能迎合用戶需求,又能開闊他們眼界的建議。然而,現有的方法通常使用標量而不是向量來度量用戶與項目的相關性,忽略了用戶的偏好方向,這增加了不相關推薦的風險。此外,合理的解釋增加了用戶的信任度和接受度,但目前沒有為Serendipity推薦提供解釋的工作。為了解決這些局限性,我們提出了一種有向的、可解釋的Serendipity推薦方法,稱為DESR。具體而言,首先采用基于高斯混合模型(GMM)的無監督方法提取用戶的長期偏好,然后利用膠囊(capsule )網絡捕捉用戶的短期需求。然后,我們提出了將長期偏好與短期需求相結合的意外(serendipity)向量,并利用它生成有向的Serendipity推薦。最后,利用反向路徑選擇方案進行了解釋。在真實數據集上的大量實驗表明,與現有的基于意外(serendipity)發現的方法相比,DESR能夠有效地提高意外性和可解釋性,促進多樣性。

網址

  1. LightRec: a Memory and Search-Efficient Recommender System

作者:Defu Lian, Haoyu Wang, Zheng Liu, Jianxun Lian, Enhong Chen, Xing Xie

摘要:近年來,深度推薦系統已經取得了顯著的進步。盡管具有出色的排名精度,但實際上運行效率和內存消耗在現實中卻是嚴重的瓶頸。為了克服這兩個瓶頸,我們提出了LightRec,這是一個輕量級的推薦系統,具有快速的在線推斷功能和經濟的內存消耗。LightRec的主干是總共B個codebooks,每個codebook均由W個潛在向量組成,稱為codewords。在這種結構的頂部,LightRec將有一個商品表示為B codewords的加法組合,這些B codewords是從每個codebook中選擇的最佳的。為了有效地從數據中學習codebooks,我們設計了一個端到端的學習工作流程,其中所提出的技術克服了固有差異性和多樣性方面的挑戰。另外,為了進一步提高表示質量,采用了幾種distillation策略,可以更好地保留用戶-商品的相關性得分和相對排名順序。我們對LightRec在四個真實數據集上進行了廣泛評估,得出了兩個經驗發現:1)與最先進的輕量級baseline相比,LightRec在召回性能方面取得了超過11%的相對改進;2)與傳統推薦算法相比,在top-k推薦算法中,LightRec的精度下降幅度可以忽略不計,但速度提高了27倍以上。

網址:

  1. Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

作者:Mengyue Yang, Qingyang Li, Zhiwei Qin, Jieping Ye

摘要:上下文多臂 bandit(MAB)在各種問題上實現了優異性能。然而,當涉及到推薦系統和在線廣告等現實場景時,必須考慮探索的資源消耗。在實踐中,通常存在與在環境中執行建議(ARM)相關聯的非零成本,因此,應該在固定的探索成本約束下學習策略。由于直接學習全局最優策略是一個NP難題,并且極大地使bandit算法的探索和開發之間的權衡復雜化,因此直接學習全局最優策略是一個很大的挑戰。現有的方法著重于通過采用貪婪策略來解決問題,該策略估計預期的收益和成本,并基于每個臂的預期收益/成本比使用貪婪的選擇,利用歷史觀察直到勘探資源耗盡為止。然而,現有的方法當沒有更多的資源時,學習過程就會終止,因此很難擴展到無限的時間范圍。本文提出了一種分層自適應上下文bandit方法(HATCH)來進行有預算約束的上下文bandit的策略學習。HATCH采用一種自適應的方法,根據剩余資源/時間和對不同用戶上下文之間報酬分配的估計來分配勘探資源。此外,我們利用充分的上下文特征信息來找到最好的個性化推薦。最后,為了證明提出的理論,我們進行了regret bound分析,并證明HATCH的regret bound低至O(√T)。實驗結果證明了該方法在合成數據集和實際應用中的有效性和效率。

網址:

  1. Off-policy Learning in Two-stage Recommender Systems

作者:Jiaqi Ma, Zhe Zhao, Xinyang Yi, Ji Yang, Minmin Chen, Jiaxi Tang, Lichan Hong, Ed H. Chi

摘要:許多現實世界中的推薦系統需要高度可伸縮性:將數百萬個項目與數十億用戶進行匹配,并只具有毫秒級的延遲。可伸縮性的要求導致了廣泛使用的兩階段推薦系統,由第一階段高效的候選生成模型和第二階段更強大的排序模型組成。通常使用記錄的用戶反饋(例如,用戶點擊或停留時間)來構建用于推薦系統的候選生成和排名模型。雖然很容易收集大量這樣的數據,但因為反饋只能在以前系統推薦的項目上觀察到,因此這些數據在本質上是有偏見的。近年來,推薦系統研究領域對此類偏差的off-policy 修正引起了越來越多的關注。然而,現有的大多數工作要么假設推薦系統是一個單階段系統,要么只研究如何將離策略校正應用于系統的候選生成階段,而沒有顯式地考慮這兩個階段之間的相互作用。在這項工作中,我們提出了一種兩階段離策略(two-stage off-policy)策略梯度方法,并證明了在兩階段推薦系統中忽略這兩個階段之間的交互會導致次優策略。該方法在訓練候選生成模型時明確考慮了排序模型,有助于提高整個系統的性能。我們在具有大項目空間的真實數據集上進行了實驗,驗證了所提方法的有效性。

網址:

付費5元查看完整內容

【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。上周專知小編提前整理了WWW 2020圖神經網絡(GNN)比較有意思的的論文,這期小編繼續為大家奉上WWW 2020推薦相關論文供參考! WWW2020GNN

  1. Correcting for Selection Bias in Learning-to-rank Systems

作者:Zohreh Ovaisi, Ragib Ahsan, Yifan Zhang, Kathryn Vasilaky and Elena Zheleva

摘要:現代推薦系統收集到的點擊數據是用來訓練學習排名(LTR)系統的觀察數據的重要來源。然而,這些點擊數據會受到許多偏差(bias)的影響,這些偏差可能會導致LTR系統的性能變差。在此類系統中,最近的偏差校正(bias correction)方法主要集中在位置偏差上,即雖然不是用戶查詢最相關的,但排名較高的結果(例如,頂級搜索引擎結果)更可能被點擊。由于所點擊的文檔反映了什么文檔首先向用戶展示,因此大部分方法對校正選擇偏差的關注較少。在本文中,我們提出了新的方法,這些方法可以適應Heckman的兩階段方法,并考慮LTR系統中的選擇偏差和位置偏差。我們的實驗評估表明,與現有的無偏LTR算法相比,我們提出的方法對噪聲的魯棒性更高,并且具有更好的準確性,尤其是在存在中度偏差到無位置偏差的情況下。

網址: //arxiv.org/abs/2001.11358

  1. Efficient Neural Interaction Function Search for Collaborative Filtering

作者:Quanming Yao, Xiangning Chen, James T. Kwok, Yong Li and Cho-Jui Hsieh

摘要:在協同過濾(CF)中,交互函數(IFC)扮演著捕獲項目和用戶之間交互的重要角色。最流行的交互函數(IFC)是內積,它已經成功地應用于低階矩陣分解。然而,現實世界應用中的交互可能非常復雜。因此,可以提供更好性能的操作(例如:串聯和級聯)被提出。然而,現有的IFC仍然很難在不同的應用場景中保持一致的良好性能。受AutoML的啟發,本文提出在CF中尋找簡單神經交互函數(SIF)。通過對現有CF方法的研究和推廣,設計了一種具有表現力的SIF搜索空間,并將其表示為結構化的多層感知機。我們提出了一種one-shot搜索算法,可以同時更新體系結構和學習參數。 實驗結果表明,所提出的方法比流行的AutoML方法效率更高,比最新的CF方法可以獲得更好的預測性能,并且可以針對不同的數據集和任務發現不同的IFC。

網址:

  1. Influence Function based Data Poisoning Attacks to Top-N Recommender Systems

作者:Minghong Fang, Neil Zhenqiang Gong and Jia Liu

摘要:推薦系統是Web服務中吸引用戶的重要組成部分。流行的推薦系統使用大量眾包用戶-項目交互數據(例如評級得分)對用戶偏好和項目屬性進行建模;然后,將與用戶偏好最匹配的前N個項目推薦給用戶。在這項工作中,我們展示了攻擊者可以通過向虛假用戶注入精心制作的用戶-項目交互數據,對推薦系統發起數據中毒攻擊,從而按照攻擊者的意愿進行推薦。具體地說,攻擊者可以誘導推薦系統向盡可能多的普通用戶推薦目標項目。我們關注已經在行業中得到了廣泛的應用的基于矩陣分解的推薦系統。給定攻擊者可以注入的虛假用戶數量,我們將虛假用戶評分的制定過程描述為一個優化問題。但是,該優化問題是一個非凸整數規劃問題,求解起來很有挑戰性。為了解決這一挑戰,我們開發了幾種技術來近似解決優化問題。例如,我們利用影響函數(influence function)來選擇對推薦有影響力的普通用戶子集,并基于這些有影響力的用戶來解決我們制定的優化問題。實驗結果表明,我們的攻擊是有效的,并且優于現有的方法。

網址:

  1. Learning Multi-granular Quantized Embeddings for Large-Vocab Categorical Features in Recommender Systems

作者:Wang-Cheng Kang,Derek Zhiyuan Cheng, Ting Chen, Xinyang Yi, Dong Lin, Lichan Hong and Ed H. Chi

摘要:推薦系統模型通常通過嵌入來表示像用戶、項目和分類特征這類的稀疏特征。標準方法是將每個唯一的特征值映射為嵌入向量。所產生的嵌入表的大小隨著詞匯表的大小線性增長。因此,大詞匯量不可避免地會導致巨大的嵌入表,從而產生兩個嚴重的問題:(I)使服務于資源緊張環境中的模型變得難以處理;(ii)造成過擬合的問題。在本文中,我們致力于學習用于推薦系統(recsys)中大型詞匯稀疏特征的高度簡潔的嵌入。首先,我們證明了新的可微積量化( Differentiable Product Quantization,DPQ)方法可以推廣到Recsys問題。此外,為了更好地處理Recsys中常見的冪律數據分布,我們提出了一種多粒度量化嵌入(MGQE)技術,該技術對不頻繁的項目學習更簡單的嵌入。我們嘗試以簡單的模型規模為提高推薦性能提供一個新的角度。在三個推薦任務和兩個數據集上的大量實驗表明,我們可以用原始模型規模的20%的模型獲得與原模型相當甚至更好的性能。

網址:

  1. Beyond Clicks: Modeling Multi-Relational Item Graph for Session-Based Target Behavior Prediction

作者:Wen Wang, Wei Zhang, Shukai Liu, Bo Zhang, Leyu Lin and Hongyuan Zha

摘要:基于會話的目標行為預測旨在預測要與特定行為類型(例如,點擊)進行交互的下一個項目。雖然現有的基于會話的行為預測方法利用強大的表示學習方法來編碼項目在低維空間中的順序相關性,但是它們受到一些限制。首先,它們側重于只利用同一類型的用戶行為進行預測,而忽略了將其他行為數據作為輔助信息的潛力。當目標行為稀疏但很重要(例如,購買或共享物品)時,這一點尤為重要。其次,項目到項目的關系是在一個行為序列中單獨和局部建模的,缺乏一種規定的方法來更有效地全局編碼這些關系。為了克服這些局限性,我們提出了一種新的基于會話的目標行為預測的多關系圖神經網絡模型MGNN-SPred。具體地說,我們基于來自所有會話的所有行為序列(涉及目標行為類型和輔助行為類型)構建多關系項目圖(Multi-Relational Item Graph,MRIG)。在MRIG的基礎上,MGNN-SPred學習全局項目與項目之間的關系,進而獲得用戶偏好。即分別為當前目標行為序列和輔助行為序列。最后,MGNN-SPred利用門控機制自適應地融合用戶表示,以預測與目標行為交互的下一項目。在兩個真實數據集上的廣泛實驗證明了MGNN-SPred與最新的基于會話的預測方法相比的優越性,驗證了利用輔助行為和基于MRIG學習項目到項目關系的優點。

網址:

  1. Towards Detection of Subjective Bias using Contextualized Word Embeddings

作者:Tanvi Dadu, Kartikey Pant and Radhika Mamidi

摘要:主觀偏見檢測(Subjective bias detection)對于宣傳檢測、內容推薦、情感分析和偏見消除等應用至關重要。這種偏見是在自然語言中通過煽動性的詞語和短語引入的,使人對事實產生懷疑,并預設事實。在這項工作中,我們在維基中立性語料庫(WNC)上使用基于BERT的模型進行了全面的主觀偏見檢測實驗。數據集為36萬個來自維基百科并刪除了各種偏見的標記實例組成。我們進一步提出了基于BERT的集成,其性能優于BERT_large之類的最新方法5.6 F1 score。

網址:

付費5元查看完整內容
北京阿比特科技有限公司