亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

最佳長論文獎

對YouTube上錯誤信息過濾泡沫的審計:泡沫破裂和最近的行為變化

錯誤信息過濾氣泡在自適應系統中的負面影響已經為研究人員所知有一段時間了。幾項研究調查了用戶僅僅從提供的商品中選擇“錯誤選項”進入錯誤信息過濾泡沫的速度,其中最顯著的是YouTube上的研究。然而,到目前為止,還沒有研究調查“泡沫破裂”需要什么,也就是說,恢復泡沫外殼。我們提出了一項研究,在這項研究中,預編程的代理(扮演YouTube用戶)通過觀看虛假信息推廣內容(針對各種主題)深入到虛假信息過濾氣泡中。然后,通過觀察虛假信息揭穿內容,代理試圖打破泡沫,達到更平衡的推薦組合。我們記錄了特工們遇到的搜索結果和建議,并分析了它們是否存在錯誤信息。我們的關鍵發現是,過濾氣泡的破裂是可能的,盡管不同的主題表現不同。此外,我們觀察到過濾氣泡在某些情況下并沒有真正出現。我們還與之前的研究進行了直接比較。遺憾的是,盡管YouTube最近做出了承諾,但我們并未發現錯誤信息的出現有多大改善。

//dl.acm.org/doi/10.1145/3460231.3474241

最佳學生論文

從用戶互動中老虎機學習的方法通常需要一個特定上下文-動作組合將產生的獎勵模型——例如,點擊推薦的概率。這種常見的機器學習任務非常重要,因為上下文和動作的數據生成過程往往受到推薦系統本身的扭曲。事實上,當在數據收集時間部署的推薦策略不是均勻隨機地選擇其行動時,就會導致選擇偏差,從而阻礙有效的獎勵模型。這反過來又使離線策略學習——行業中的典型設置——變得特別具有挑戰性。在這項工作中,我們提出并驗證了一般的悲觀獎勵模型方法的離線策略學習的推薦。貝葉斯不確定性估計允許我們對自己的獎勵模型表示懷疑,而這反過來又可以用來生成保守的決策規則。我們展示了它是如何緩解眾所周知的決策現象,即所謂的優化者的詛咒,并將其與現有的悲觀策略學習工作進行比較。當脊回歸器對獎勵進行建模時,利用后驗均值和方差的可用封閉形式表達式,我們展示了如何有效地將悲觀主義應用到離線策略推薦用例中。在廣泛的環境中進行的經驗觀察表明,在決策過程中保持保守可以顯著地提高推薦性能。我們方法的優點在現實環境中表現得最為明顯,即有限的日志隨機性、有限的訓練樣本和更大的行動空間。

最佳Demo

我們提出了Grapevine,一個用戶控制的推薦,使本科生和研究生找到一個合適的研究建議。該系統通過使用最先進的知識提取、基于grape的推薦和智能用戶界面,結合了探索性搜索、用戶建模和推薦系統等領域的思想。在本文中,我們演示了系統的關鍵組件以及它們如何作為一個整體工作。

付費5元查看完整內容

相關內容

推薦系統,是指根據用戶的習慣、偏好或興趣,從不斷到來的大規模信息中識別滿足用戶興趣的信息的過程。推薦推薦任務中的信息往往稱為物品(Item)。根據具體應用背景的不同,這些物品可以是新聞、電影、音樂、廣告、商品等各種對象。推薦系統利用電子商務網站向客戶提供商品信息和建議,幫助用戶決定應該購買什么產品,模擬銷售人員幫助客戶完成購買過程。個性化推薦是根據用戶的興趣特點和購買行為,向用戶推薦用戶感興趣的信息和商品。隨著電子商務規模的不斷擴大,商品個數和種類快速增長,顧客需要花費大量的時間才能找到自己想買的商品。這種瀏覽大量無關的信息和產品過程無疑會使淹沒在信息過載問題中的消費者不斷流失。為了解決這些問題,個性化推薦系統應運而生。個性化推薦系統是建立在海量數據挖掘基礎上的一種高級商務智能平臺,以幫助電子商務網站為其顧客購物提供完全個性化的決策支持和信息服務。

知識薈萃

精品入門和進階教程、論文和代碼整理等

更多

查看相關VIP內容、論文、資訊等

推薦系統(RS)在信息搜索方面已經取得了巨大的成功。近年來,為了更好地擬合用戶行為數據,人們進行了大量的推薦模型研究。然而,用戶行為數據是觀察性的,而不是實驗性的。這使得各種偏差廣泛存在于數據中,包括但不限于選擇偏差、位置偏差、暴露偏差。盲目擬合數據而不考慮固有偏差會導致許多嚴重的問題,例如,離線評估和在線指標之間的差異,損害用戶對推薦服務的滿意度和信任等。為了將大量的研究模型轉化為實際的改進,迫切需要探索偏差的影響,并在必要時制定去偏策略。因此,推薦系統中的偏倚問題及其解決方法引起了學術界和業界的高度關注。

在本教程中,我們旨在系統地回顧關于這個主題的現有工作。我們將介紹推薦系統中的七種偏見,以及它們的定義和特點;調研現有的去偏解決方案及其優缺點;并確定一些開放的挑戰和未來的方向。我們希望本教程能激發更多關于這個主題的想法,并促進去偏推薦系統的開發。

//recsys.acm.org/recsys21/tutorials/#content-tab-1-5-tab

付費5元查看完整內容

【導讀】作為CCF推薦的A類國際學術會議,International ACM SIGIR Conference on Research and Development in Information Retrieval(國際計算機學會信息檢索大會,簡稱 SIGIR)在信息檢索領域享有很高的學術聲譽,每年都會吸引全球眾多專業人士參與。今年的 SIGIR 2021已經在2021年7月11-15日在線上舉行。此次大會共收到了720篇長文投稿,錄用151篇,長文錄取率21%(去年的錄取率為26.4%);共收到了526篇短文投稿,錄用145篇,短文錄取率27%(去年的錄取率為30%)。

SIGIR2021 Paper List: //dl.acm.org/doi/proceedings/10.1145/3404835

為此,專知小編為大家整理了五篇SIGIR 2021 反事實推理(Counterfactual Inference)相關研究和應用,這塊這幾年一直比較受關注——視頻時刻檢索、流行度偏好、AutoDebias、情緒偏差、延時反饋

CVPR2021CL、CVPR2021DA、CVPR2021IVC、CVPR2021PID、CVPR2021IC、CVPR2021VU、CVPR2021OD、CVPR2021OT、CVPR2021AR

1. Deconfounded Video Moment Retrieval with Causal Intervention

作者:Xun Yang, Fuli Feng, Wei Ji, Meng Wang, Tat-Seng Chua

摘要:本文解決了視頻時刻(moment)檢索 (VMR) 的任務,該任務旨在根據文本query定位視頻中的特定時刻(moment)。現有方法主要通過復雜的跨模態交互對query和moment之間的匹配關系進行建模。盡管它們有效,但當前的模型大多利用數據集偏差(biases)而忽略視頻內容,從而導致泛化性較差。本文認為這個問題是由 VMR 中隱藏的混雜因素引起的,即時刻(moments)的時間位置(temporal location),它虛假地關聯了模型輸入和預測。如何針對時間位置偏差設計穩健的匹配模型至關重要,但據本文所知,尚未有針對 VMR 進行研究。為了填補研究空白,本文提出了一個因果關系啟發的 VMR 框架,該框架構建了結構因果模型來捕捉query和視頻內容對預測的真實影響。具體來說,本文提出了一種去混雜的跨模態匹配 (DCM) 方法來消除moment location的混雜影響。它首先解開moment表示以推斷視覺內容的核心特征,然后基于后門調整(backdoor adjustment)對解開的多模態輸入進行因果干預,這迫使模型公平地考慮目標的每個可能位置。大量實驗清楚地表明,本文的方法可以在準確性和泛化性方面,比最先進方法,取得顯著改進。

論文:

2. Causal Intervention for Leveraging Popularity Bias in Recommendation

作者:Yang Zhang, Fuli Feng, Xiangnan He, Tianxin Wei, Chonggang Song, Guohui Ling, Yongdong Zhang

摘要:推薦系統通常面臨流行偏好(popularity bias)問題:從數據角度來看,items在交互頻率上表現出不均勻(通常是長尾)分布;從方法的角度來看,協同過濾方法容易通過過度推薦熱門items來放大bias。在推薦系統中考慮流行偏好(popularity bias)無疑是至關重要的,現有工作主要通過基于傾向的無偏學習或因果嵌入來消除偏差效應。然而,本文認為并非數據中的所有偏差都是不好的,即某些items因其更好的內在質量而表現出更高的受歡迎程度。盲目追求無偏學習可能會去除數據中的有益模式,從而降低推薦準確性和用戶滿意度。本文研究了推薦中一個未探索的問題——如何利用流行偏好(popularity bias)來提高推薦準確性。關鍵在于兩個方面:如何去除訓練過程中流行度偏差的不良影響,以及如何在生成top-K推薦的推理階段注入所需的流行度偏差。這對推薦生成過程的因果機制提出了一些疑惑。沿著這條線,本文發現items流行度在暴露項目和觀察到的交互之間起到了混雜的作用,導致了偏差放大的不良影響。為了實現這一目標,本文提出了一種新的推薦訓練和推理范式,稱為流行偏見解混和與調整(PDA)。它消除了模型訓練中混淆的流行偏差,并通過因果干預調整推薦分數。本文展示了潛在因素模型的新范式,并在來自快手、豆瓣和騰訊的三個真實世界數據集上進行了大量實驗。實證研究表明,去混淆訓練有助于發現用戶的真實興趣,并且根據流行度偏差進行推理調整可以進一步提高推薦準確率。

論文:

代碼:

3. AutoDebias: Learning to Debias for Recommendation

作者:Jiawei Chen, Hande Dong, Yang Qiu, Xiangnan He, Xin Xin, Liang Chen, Guli Lin, Keping Yang

摘要:

推薦系統依靠評分和點擊等用戶行為數據來構建個性化模型。然而,收集到的數據是觀察性的而不是實驗性的,這會導致數據中的各種偏差,從而顯著影響學習的模型。大多數現有的推薦去偏差工作,例如逆傾向評分(the inverse propensity scoring)和插補(imputation)方法,都側重于一兩個特定的偏差,缺乏可以解釋數據中混合甚至未知偏差的通用能力。針對這一研究空白,本文首先從風險差異的角度分析偏差的來源,風險差異代表了預期經驗風險與真實風險之間的差異。值得注意的是,本文推導出了一個通用學習框架,通過指定通用框架的一些參數,它很好地總結了大多數現有的除偏策略。這為開發用于去偏的通用解決方案提供了寶貴的機會,例如,通過從數據中學習去偏參數。然而,訓練數據缺乏重要信號來說明數據是有偏的,以及無偏數據是什么樣子的。為了推進這一想法,本文提出了 AotoDebias,它利用另一組(小)均勻數據,通過元學習解決雙層優化問題來優化除偏參數。通過理論分析,本文推導出了 AutoDebias 的泛化界限,并證明了其獲得合適的去偏策略的能力。對兩個真實數據集和一個模擬數據集的大量實驗證明了 AutoDebias 的有效性。

論文:

代碼:

4. Mitigating Sentiment Bias for Recommender Systems

作者:Chen Lin, Xinyi Liu, Guipeng Xv, Hui Li

摘要:推薦系統(RS)中的偏差和去偏差最近已成為研究熱點。這篇論文揭示了一種尚未探索的偏見類型,即情緒偏見。通過實證研究,本文發現許多 RS 模型對具有更多正面反饋的用戶/物品組(即正面用戶/物品)比對具有更多負面反饋的用戶/物品組(即負面用戶/物品)提供更準確的推薦。本文表明,情緒偏見與現有偏見(例如流行偏見)不同:積極的用戶/項目沒有更多的用戶反饋(即,更多的評分或更長的評論)。情緒偏見的存在導致對關鍵用戶的推薦質量低下,對小眾商品的推薦不公平。本文討論導致情緒偏差的因素。然后,為了修正情緒偏差的來源,本文提出了一個通用的去偏差框架,其中包含三種策略,體現在不同的正則化器中,可以輕松插入 RS 模型而無需更改模型架構。在各種 RS 模型和基準數據集上的實驗已經驗證了本文的去偏置框架的有效性。據本文所知,之前沒有研究過情緒偏見及其去偏見。本文希望這項工作可以幫助加強對 RS 中偏差和去偏差的研究。

論文:

5. Counterfactual Reward Modification for Streaming Recommendation with Delayed Feedback

作者:Xiao Zhang, Haonan Jia, Hanjing Su, Wenhan Wang, Jun Xu, Ji-Rong Wen

摘要:在許多流媒體推薦場景中,用戶反饋可能會延遲。例如,用戶對推薦優惠券的反饋包括對點擊事件的即時反饋和對轉化結果的延遲反饋。延遲反饋對使用標簽不完整的實例訓練推薦模型提出了挑戰。當應用于實際產品時,挑戰變得更加嚴峻,因為流推薦模型需要非常頻繁地重新訓練,并且需要在非常短的時間范圍內收集訓練實例。現有方法要么簡單地忽略未觀察到的反饋,要么在靜態實例集上試探性地調整反饋,從而導致訓練數據存在偏差并損害學習推薦的準確性。在本文中,本文提出了一種新穎且理論上合理的反事實方法來調整用戶反饋和學習推薦模型,稱為 CBDF(Counterfactual Bandit with Delayed Feedback)。CBDF 將具有延遲反饋的流推薦作為順序決策問題制定,并使用批量bandit對其進行建模。為了解決延遲反饋的問題,在每次迭代(episode)時,都會采用反事實重要性采樣模型來重新加權原始反饋并生成修改后的反饋。基于修改后的反饋,學習批量bandit以在下一次迭代中進行在線推薦。理論分析表明,修改后的獎勵在統計上是無偏的,并且學習到的bandit策略享有次線性的后悔界限。實驗結果表明,CBDF 在合成數據集、Criteo 數據集和來自騰訊微信應用的數據集上的表現優于最先進的基線方法。

論文:

付費5元查看完整內容

SIGIR是人工智能領域智能信息檢索方向最權威的國際會議。最新組委會公布了一系列最佳論文。其中來自荷蘭Radboud大學-Harrie Oosterhuis獨自署名的論文獲得最佳論文,山東大學聶禮強組獲得最佳學生論文。

第44屆國際計算機學會信息檢索大會(The 44rd International ACM SIGIR Conference on Research and Development in Information Retrieval, SIGIR 2021)于2021年7月11日-7月15日以線上會議形式召開。這次會議共收到720篇長文投稿,僅有151篇長文被錄用,錄用率約21%。

最佳論文

Computationally Efficient Optimization of Plackett-Luce Ranking Models for Relevance and Fairness

Harrie Oosterhuis

地址: //www.zhuanzhi.ai/paper/8115d7d2f9546fdb76d900da6c5ebee6

最近的研究提出了隨機Plackett-Luce (PL)排序模型,作為優化相關性和公平性指標的穩健選擇。與需要啟發式優化算法的確定性模型不同,PL模型是完全可微的。理論上,它們可以通過隨機梯度下降來優化排序指標。然而,在實踐中,梯度的計算是不可行的,因為它需要迭代所有可能的項目排列。因此,實際應用依賴于通過采樣技術來近似梯度。本文介紹了一種新的PL- rank算法,它估計了PL排序模型的相關度和公平性。與基于策略梯度的現有方法不同,PL- rank利用了PL模型和排名度量的特定結構。我們的實驗分析表明,PL-Rank比現有策略梯度具有更大的樣本效率和更低的計算代價,從而在更高的性能下更快地收斂。PL- rank進一步使行業能夠將PL模型用于更相關和更公平的現實排序系統。

最佳學生論文

圖像-文本檢索是信息檢索的基礎和關鍵分支。盡管在銜接視覺和語言方面取得了很大進展,但由于模態內推理和跨模態對齊的困難,這仍然是一個挑戰。現有的模態交互方法在公共數據集上取得了令人印象深刻的效果。然而,他們在交互模式的設計上嚴重依賴于專家經驗和經驗反饋,因此缺乏靈活性。針對這些問題,我們提出了一種新的基于路由機制的模態交互建模網絡,這是第一個統一的、動態的多模態交互框架用于圖像-文本檢索。特別的是,我們首先設計了四種類型的細胞作為基本單元,探索不同層次的形態相互作用,然后將它們密集地連接起來,構建一個路徑空間。為了使模型具有路徑決策的能力,我們在每個單元中集成了一個動態路由器來進行模式探索。由于路由器以輸入為條件,我們的模型可以動態學習不同數據的激活路徑。在Flickr30K和MS-COCO兩個基準數據集上的大量實驗,驗證了我們的模型與幾個最先進的基準相比的優越性。

付費5元查看完整內容

基于用戶交互來優化排名系統是一個被廣泛研究的問題。基于用戶交互的優化排名系統的最先進方法分為在線方法(通過直接與用戶交互進行學習)和反事實方法(通過歷史交互進行學習)。現有的在線方法在沒有在線干預的情況下會受到阻礙,因此不應該被用到反事實方法中。相反,反事實的方法不能直接從在線干預中獲益。我們提出了一種新的干預感知估計器,用于反事實和在線學習排序(LTR)。隨著干預感知估計器的引入,我們的目標是連接在線/反事實LTR部門,因為它在在線和反事實場景中都被證明是非常有效的。通過使用基于日志策略行為和在線干預(在收集點擊數據期間對日志策略所做的更改)的校正,估計器可以校正位置偏差、信任偏差和項目選擇偏差的影響。我們的實驗結果,在一個半合成的實驗設置中進行,結果表明,不像現有的反事實LTR方法,干預感知估計器可以從在線干預大大獲益。

//www.zhuanzhi.ai/paper/a7538e130a7fc65679e6e7d950bb4016

付費5元查看完整內容

【導讀】第14屆推薦系統頂級會議ACM RecSys在9月22日到26日在線舉行。

最近官網大會公布了最佳長短文,包括來自Criteo AI Labs的因果嵌入推薦與德國Duisburg-Essen大學的用戶評估中物品消費的影響。

官網地址: //recsys.acm.org/best-papers/

最佳長論文獎

漸進式分層提取(PLE): 一種用于個性化推薦的新型多任務學習(MTL)模型

多任務學習(MTL)已成功地應用于許多推薦應用中。然而,在實際推薦系統中,由于復雜的競爭性任務相關性,MTL模型往往會出現負遷移的性能退化。此外,通過對SOTA MTL模型的大量實驗,我們觀察到一個有趣的現象,即一個任務的性能往往會通過損害其他任務的性能而得到改善。為了解決這些問題,我們提出了一個具有新的共享結構設計的漸進分層抽取(PLE)模型。PLE對共享組件和任務特定組件進行顯式分離,采用漸進式路由機制逐步提取和分離更深層次的語義知識,提高了一般設置下跨任務聯合表示學習和信息路由的效率。我們將PLE應用于復雜相關和正常相關的任務,在一個擁有10億樣本的真實騰訊視頻推薦數據集上,從兩任務到多任務,結果表明,在不同的任務相關性和任務組大小下,PLE顯著優于最新的MTL模型。此外,在騰訊大型內容推薦平臺上,對PLE的在線評價顯示,與SOTA MTL模型相比,在瀏覽量和觀看時間上分別增加了2.23%和1.84%,是一個顯著的提升,證明了PLE的有效性。最后,在公共基準數據集上進行的大量離線實驗表明,除了建議消除蹺蹺板現象外,PLE還可以應用于各種場景。PLE目前已成功部署到騰訊在線視頻推薦系統中。

Best Long Paper Runner-up

通過疊加的方式將多個推薦系統集成在一起,可以有效地提高協同推薦的質量。最近的研究擴展了堆疊,使用了額外的用戶性能預測器(例如,用戶做出的評分總數)來幫助確定每個基礎推薦應該在整體中貢獻多少。然而,盡管手工制作判別預測器的成本很高,這通常需要深入了解每個推薦者在整體中的優缺點,但只觀察到微小的改進。為了克服這一局限性,我們建議通過利用用戶自己的歷史評級來直接評估這些性能,而不是設計復雜的特征來預測給定用戶的不同推薦器的性能。在來自多個領域的真實數據集上進行的實驗表明,使用性能估計作為附加特征可以顯著提高最先進的集成器的精度,nDCG@20比不使用它們平均提高23%。

最佳短論文

由于人們對隱私問題的日益關注,基于會話的推薦受到了越來越多的關注。盡管最近基于神經會話的推薦器取得了成功,但它們通常是以使用靜態數據集的離線方式開發的。然而,推薦需要不斷地適應以考慮新的和過時的項目和用戶,并且需要在現實應用中“不斷地學習”。在這種情況下,推薦器會不斷地、周期性地更新,每次更新周期都會有新的數據到達,更新后的模型需要在下一個模型更新之前為用戶活動提供推薦。用神經模型進行持續學習的一個主要挑戰是災難性遺忘,在這種情況下,一個經過持續訓練的模型會忘記它以前學習過的用戶偏好模式。為了應對這一挑戰,我們提出了一種自適應提取樣本回放(ADER)的方法,即通過自適應提取損失對當前模型周期性地回放以前的訓練樣本(即樣本)。實驗是基于最先進的SASRec模型,使用兩個廣泛使用的數據集,以幾個著名的持續學習技術基準的ADER。我們以經驗證明,ADER始終優于其他基線,甚至在每個更新周期中優于使用所有歷史數據的方法。這一結果表明,ADER是一個很有前途的解決方案,可以緩解災難性遺忘問題,從而構建更現實、更可伸縮的基于會話的推薦器。

付費5元查看完整內容

【導讀】CCF A類會議,國際萬維網大會WWW 2020(International World Wide Web Conference)于2020年4月20日至24日在中國臺灣舉行。碰到疫情,WWW采用在線舉行。剛剛最佳論文一系列獎項出爐了!來自俄亥俄州立大學的開放意圖抽取《 Open Intent Extraction from Natural Language Interactions》獲得最佳論文,北京郵電大學的移動App占位《Mobile App Squatting 》獲得最佳學生論文!

「最佳論文獎」(Best Paper Award)

自然語言交互的開放意圖提取 Open Intent Extraction from Natural Language Interactions

作者: Nikhita Vedula , Nedim Lipka , Pranav Maneriker , Srinivasan Parthasarathy Authors Info & Affiliations

摘要:準確地從用戶的書面或口頭語言中發現他們的意圖在自然語言理解和自動對話響應中扮演著重要的角色。大多數現有的研究將其建模為每個話語都有一個意圖標簽的分類任務,將用戶的話語從一組已知的類別中分組為一個單一的意圖類型。在此基礎上,我們定義并研究了公開意圖發現的新問題。它涉及到從文本話語中發現一個或多個通用的意圖類型,這些類型可能在訓練中沒有遇到。我們提出了一種新領域無關的方法OPINE,它將問題表述為開放世界環境下的一個序列標記任務。它在雙向LSTM上使用CRF來以一致的格式提取意圖,受意圖標簽標簽之間的約束。我們用了一個多頭自注意力機制來有效地學習遠處單詞之間的依賴關系。我們進一步使用對抗性訓練來提高性能,并在不同的領域強有力地適應我們的模型。最后,我們策劃并計劃發布一個開放的意圖注釋數據集,包含25K個跨越不同領域的真實話語。大量的實驗表明,我們的方法優于最先進的基線5-15%的F1得分點。我們還演示了OPINE在識別多個不同的域意圖方面的有效性,每個域的訓練示例有限(也可以為零)。

//dl.acm.org/doi/10.1145/3366423.3380268

「最佳學生論文獎」(Best Student Paper Award)

移動App占位 Mobile App Squatting

Authors: Yangyu Hu , Haoyu Wang , Ren He , Li Li , Gareth Tyson , Ignacio Castro , Yao Guo , Lei Wu , Guoai Xu

域名占用是攻擊者模仿流行域名注冊的一種對抗策略,已經被觀察了幾十年。然而,越來越多的證據表明,這種攻擊方式已經蔓延到其他領域。在這篇文章中,我們探討了占用攻擊在移動應用生態系統中的存在。在“App Squatting”中,攻擊者發布的帶有標識符(如App名稱或包名)的應用,與流行應用或知名互聯網品牌的應用混淆不清。本文首次對app占用進行了深入的測量研究,揭示了app占位的流行及其意義。我們首先確定了app squatters常用的11種變形方式,并提出了一種名為“AppCrazy”的app標識符自動生成工具。我們將AppCrazy應用到谷歌Play中最受歡迎的500個應用中,生成了224,322個變形關鍵字,然后我們將這些變形關鍵字用于測試流行市場上的app非法占位者。通過這個,我們確認了問題的規模,確定了10553個占用應用程序(平均每個合法應用程序超過20個占位程序)。我們的調查顯示,超過51%的非法占用應用程序是惡意的,其中一些非常受歡迎(高達1000萬次下載)。同時,我們也發現移動應用市場在識別和消除非法占用應用方面并不成功。我們的發現表明了識別和防止濫用app的緊迫性。為此,我們已經公開發布了所有識別出的占位應用程序,以及我們的工具AppCrazy。

付費5元查看完整內容

元學習的研究越來越受到學者們的重視,從最初在圖像領域的研究逐漸拓展到其他領域,目前推薦系統領域也出現了相關的研究問題,本文介紹了5篇基于元學習的推薦系統相關論文,包括用戶冷啟動推薦、項目冷啟動推薦等。

  1. MeLU: Meta-Learned User Preference Estimator for Cold-Start Recommendation

本文提出了一種新的推薦系統,解決了基于少量樣本物品來估計用戶偏好的冷啟動問題。為了確定用戶在冷啟動狀態下的偏好,現有的推薦系統,如Netflix,在啟動初向用戶提供物品選擇,我們稱這些物品為候選集。然后根據用戶選擇的物品做出推薦。以往的推薦研究有兩個局限性:(1) 只有少量物品交互行為的用戶推薦效果不佳,(2) 候選集合不足,無法識別用戶偏好。為了克服這兩個限制,我們提出了一種基于元學習的推薦系統MeLU。從元學習中,MeLU可以通過幾個例子快速地應用于新任務,通過幾個消費物品來估計新用戶的偏好。此外,我們提供了一個候選集合選擇策略,以確定自定義偏好估計的區分項目。我們用兩個基準數據集對MeLU進行了驗證,與兩個對比模型相比,該模型的平均絕對誤差至少降低了5.92%。我們還進行了用戶研究實驗來驗證選擇策略的有效性。

  1. Meta-Learning for User Cold-Start Recommendation 冷啟動問題是對實際推薦系統的長期挑戰。大多數現有的推薦算法依賴于大量的觀測數據,對于很少交互的推薦場景來說是脆弱的。本文用少樣本學習和元學習來解決這些問題。我們的方法是基于這樣一種見解,即從幾個例子中有一個很好的泛化,依賴于一個通用的模型初始化和一個有效的策略來使這個模型適應新出現的任務。為了實現這一點,我們將場景指定的學習與模型無關的序列元學習結合起來,并將它們統一到一個集成的端到端框架中,即場景指定的序列元學習者(或s^2 Meta)。我們的元學習器通過聚合來自各種預測任務的上下文信息來生成一個通用的初始模型,同時通過利用學習到的知識來有效地適應特定的任務。在各種現實世界數據集上的實驗表明,我們提出的模型可以在在線推薦任務中獲得對冷啟動問題的最好效果。

  2. Sequential Scenario-Specific Meta Learner for Online Recommendation

冷啟動問題是對實際推薦系統的長期挑戰。大多數現有的推薦算法依賴于大量的觀測數據,對于很少交互的推薦場景來說是脆弱的。本文用少樣本學習和元學習來解決這些問題。我們的方法是基于這樣一種見解,即從幾個例子中有一個很好的泛化,依賴于一個通用的模型初始化和一個有效的策略來使這個模型適應新出現的任務。為了實現這一點,我們將場景指定的學習與模型無關的序列元學習結合起來,并將它們統一到一個集成的端到端框架中,即場景指定的序列元學習者(或s^2 Meta)。我們的元學習器通過聚合來自各種預測任務的上下文信息來生成一個通用的初始模型,同時通過利用學習到的知識來有效地適應特定的任務。在各種現實世界數據集上的實驗表明,我們提出的模型可以在在線推薦任務中獲得對冷啟動問題的最好效果。

  1. A Meta-Learning Perspective on Cold-Start Recommendations for Items 矩陣分解(M F)是最流行的項目(item)推薦技術之一,但目前存在嚴重的冷啟動問題。項目冷啟動問題在一些持續輸出項目的平臺中顯得特別尖銳(比如Tweet推薦)。在本文中,我們提出了一種元學習策略,以解決新項目不斷產生時的項目冷啟動問題。我們提出了兩種深度神經網絡體系結構,實現了我們的元學習策略。第一個體系結構學習線性分類器,其權重由項目歷史決定,而第二個體系結構學習一個神經網絡。我們評估了我們在Tweet推薦的現實問題上的效果,實驗證明了我們提出的算法大大超過了MF基線方法。

  2. One-at-a-time: A Meta-Learning Recommender-System for Recommendation-Algorithm Selection on Micro Level

推薦算法的有效性通常用評價指標來評估,如均方根誤差、F1或點擊率CTR,在整個數據集上計算。最好的算法通常是基于這些總體度量來選擇的,然而,對于所有用戶、項目和上下文來說并沒有一個單獨的最佳算法。因此,基于總體評價結果選擇單一算法并不是最優的。在本文中,我們提出了一種基于元學習的推薦方法,其目的是為每個用戶-項目對選擇最佳算法。我們使用MovieLens 100K和1m數據集來評估我們的方法。我們的方法(RMSE,100K:0.973;1M:0.908)沒有優于單個的最佳算法SVD++(RMSE,100k:0.942;1M:0.887)。我們還探索了元學習者之間的區別,他們在每個實例(微級別),每個數據子集(中級)和每個數據集(全局級別)上進行操作。評估表明,與使用的總體最佳算法相比,一個假設完美的微級元學習器將提高RMSE 25.5%。

付費5元查看完整內容
北京阿比特科技有限公司