對特征交互進行建模是推薦系統中的一個重要問題。在現有的深度推薦模型中,特征交互是由專家設計或者簡單枚舉得到。但是,簡單枚舉所有的特征交互會占用大量的內存和計算時間。更糟糕的是,無效的特征交互會引入不必要的噪聲,干擾推薦模型的訓練。在本工作中,我們提出了一個兩階段的模型AutoFIS。
AutoFIS可以為因子分解類模型自動定義出所有重要的特征交互,而并不過多地增加訓練時間。在搜索階段,為了實現在特征交互的離散集合上進行搜索,我們引入連續型結構變量來輔助搜索。通過在這些結構變量上加入約束型優化器,我們的模型在訓練過程中可以自動定位并刪除無效的特征交互。在重訓練階段,我們將這些結構變量當做注意力機制的權重參數來重新訓練,以進一步提升模型的精度。我們在公開數據集和產品數據集上驗證,AutoFIS可以提升因子分解類模型的精度(AUC和Logloss)。該方法簡單有效,得到KDD評委的高度認可,得到3/2/2的分數,其中meta review的評價是:”Overall the paper presents a novel idea, it is well written and the evaluation is very thorough”。
該工作已經公開//arxiv.org/abs/2003.11235。
本次阿里文娛摩酷實驗室和東南大學PALM實驗室合作的工作《Feature-InducedManifold Disambiguation for Multi-view Partial Multi-label Learning》被KDD 2020 Research Track錄用。在視頻的分發過程中,標簽的準確性和完整性起著至關重要的作用,但由于個人用戶的非專業性,上傳的短視頻標簽通常存在著較大的偏差與遺漏。考慮到視頻天然帶有豐富的多模態信息,本文抽象出一種MVPML表征框架,并提出了FIMAN方法可充分利用異質特征導出的流形結構進行消歧,能夠有效地對用戶上傳的視頻標簽進行修正與補足,從而提升整體的分發效率。該項工作目前已廣泛應用于阿里文娛的各項場景中。