推薦系統已被證明是緩解過多選擇問題和提供準確和量身定制的推薦的有效方法。然而,所提出的推薦算法、分割策略、評估協議、指標和任務的數量令人印象深刻,使得嚴格的實驗評估尤其具有挑戰性。由于對適當的評估基準、實驗流程、超參數優化和評估程序的不斷重建感到困惑和沮喪,我們開發了一個詳盡的框架來滿足這些需求。Elliot是一個全面的推薦框架,旨在通過處理一個簡單的配置文件來運行和重現整個實驗流程。該框架加載、過濾和分割數據需要考慮大量的策略(13種分割方法和8種過濾方法,從時間訓練測試分割到嵌套的k -fold交叉驗證)。Elliot為幾種推薦算法(50)優化超參數(51個策略),選擇最佳模型,將它們與提供模型內統計數據的基線進行比較,計算從準確性到準確度、偏差和公平性的度量(36),并進行統計分析(Wilcoxon和配對t檢驗)。其目的是為研究人員提供一種工具,以簡化(并使其可重復)所有的實驗評估階段,從數據讀取到結果收集。可以在GitHub (//github.com/sisinflab/elliot)上找到Elliot。
時序知識圖譜推理是信息檢索和語義搜索的關鍵任務。當TKG頻繁更新時,這是特別具有挑戰性的。該模型必須適應TKG的變化,以便進行有效的訓練和推理,同時保持其對歷史知識的表現。最近的工作通過增加一個時間感知編碼函數來實現TKG補全(TKGC)。然而,使用這些方法在每個時間步驟中直接微調模型并不能解決以下問題:1)災難性遺忘;2)模型不能識別事實的變化(例如,政治派別的變化和婚姻的結束);3)缺乏訓練效率。為了解決這些挑戰,我們提出了時間感知增量嵌入(TIE)框架,該框架結合了TKG表示學習、經驗回放和時間正則化。我們引入一組度量標準來描述模型的不妥協性,并提出一個約束,將刪除的事實與負面標簽相關聯。在Wikidata12k和YAGO11k數據集上的實驗結果表明,本文提出的TIE框架減少了大約10倍的訓練時間,并在提出的指標上有所改進。對于任何傳統的度量方法,它都不會造成性能上的重大損失。廣泛的消融研究揭示了不同評估指標之間的性能權衡,這對于真實世界的TKG應用的決策是至關重要的。
點擊率(CTR)預測在推薦系統和在線廣告中起著至關重要的作用。這些應用程序中使用的數據是多字段類別數據,其中每個特征屬于一個字段。字段信息被證明是重要的,在他們的模型中有一些考慮字段的工作。在本文中,我們提出了一種新的方法來有效和高效地建模場信息。該方法是對FwFM的直接改進,被稱為場矩陣分解機(FmFM,或FM2)。在FmFM框架下,我們對FM和FwFM提出了新的解釋,并與FFM進行了比較。除了對交叉項進行修剪外,我們的模型還支持特定領域的可變維度的嵌入向量,這是一種軟修剪。在保持模型性能的同時,我們還提出了一種有效的最小化維數的方法。FmFM模型還可以通過緩存中間向量來進一步優化,它只需要數千次浮點運算(FLOPs)就可以做出預測。實驗結果表明,該算法的性能優于復雜的FFM算法。FmFM模型的性能也可以與DNN模型相媲美,DNN模型在運行時需要更多FLOPs 。
//www.zhuanzhi.ai/paper/39df3ac3e3acb641f86294a4d6acb39f