? We Know What You Want: An Advertising Strategy Recommender System for Online Advertising 廣告主端的“猜你喜歡”:在線廣告投放策略推薦系統
摘要:廣告主在電子商務平臺中起著重要作用,其廣告支出是電子商務平臺的主要收入來源。通過減少廣告實時出價過程中的試錯成本為廣告主提供更好的廣告體驗,對于電子商務平臺的長期收入至關重要。為了實現這一目標,廣告平臺需要了解廣告主的獨特營銷需求,并積極為其推薦個性化和最佳的廣告策略。在這項工作中,我們首先在淘寶展示廣告平臺上部署了一個原型推薦系統,以實現廣告主人群出價和人群選擇的優化。然后,我們提出了一種新穎的用于動態出價策略推薦的推薦系統,該系統將廣告主的策略推薦問題建模為上下文老虎機問題。我們使用神經網絡,根據廣告主的信息和歷史采納行為來預測廣告主的需求。基于預測的需求,我們應用模擬競價來推導用于推薦的最佳出價策略,并通過顯示預估的廣告效果與廣告主進行交互。為了解決探索/利用問題,我們用Dropout表示網絡的不確定性,以進行有效的策略探索,可以證明這種方式近似等價于湯普森采樣。在線評估表明,原型推薦系統可以優化廣告主的廣告效果,廣告主愿意打開該系統,選擇并采納建議,這也進一步增加了平臺的收入。基于阿里巴巴在線競價數據的仿真實驗證明,上下文老虎機算法可以有效優化廣告主的采納率。對比實驗證明湯普森采樣可以更好地平衡探索和利用,進一步優化模型的性能。 論文下載:
Exploration in Online Advertising Systems with Deep Uncertainty-Aware Learning
基于深度置信度感知學習的廣告投放探索方案
摘要:目前先進的在線廣告系統得益于個性化方法,例如點擊率預估技術。依托于深度學習豐富的表示能力,深層點擊率預估模型在工業界獲得大規模應用,并取得了巨大成功。但是,這些方法可能會受限于“缺乏探索”問題。此前的一系列工作借助上下文賭博機(Contextual Bandit)方法來解決探索與利用的權衡問題,但這些方法難以兼容深層模型,因而表示能力受限。
在本文中,我們提出了一種新穎的深度置信度感知學習(DUAL)方法,基于高斯過程(Gaussian Process)學習點擊率模型。該方法可以在保持深層模型靈活表示能力的同時,提供模型預估不確定性的估計。DUAL可以輕松地在現有模型上實現,并以極少的額外計算開銷部署于實時系統中。通過結合DUAL對模型預估不確定性的估計能力與Bandit算法,我們進一步提出了基于DUAL的廣告投放策略,以提高廣告系統的長期效用。在幾個公共數據集上的實驗結果均表明了該方法的有效性。同時,在阿里巴巴展示外投廣告平臺上部署的在線A/B測試結果顯示,DUAL方法顯著提升了平臺收入等指標。 論文下載:
Multi-Agent Cooperative Bidding Games for Multi-Objective Optimization in e-Commercial Sponsored Search
基于多智能體協同競價博弈的電商搜索廣告多目標競價優化
摘要:在線廣告是一種以互聯網為載體,幫助廣告主觸達目標消費者,從而實現商業訴求的廣告形式。在線廣告通常通過實時競價的方式決定勝出者。電商搜索廣告是一種主流的在線廣告:消費者在電商平臺表達搜索請求,觸發相關廣告主的實時競價以及平臺流量分配,并帶來可能的成交行為。在高度動態的電商市場,每天通常有數百萬的廣告主,這些廣告主訴求各異,經由上千億次的實時競價競爭接近百億次的用戶曝光。如何在如此大規模的電商流量場景下,通過優化實時競價,滿足廣告主多樣化目標訴求是一個頗具挑戰的問題。學術界和工業界已經深入研究了單廣告主視角的競價優化問題,這些研究往往即假設其他競爭者不改變出價,這一強假設往往不成立,導致策略在運用于多廣告主真實競價時往往表現較差。少量現有工作從多廣告主視角,利用多智能體強化學習,通過構建一致的目標進行出價的協同優化,但他們存在如下缺陷:(1)由于信息完全共享,這些方法很難避免多廣告主串謀的問題,一種顯而易見的更優解是廣告主串通出較低價競價流量,導致平臺收益受損;(2)在復雜動態的競價環境中,這些策略需要較長時間收斂并且極度不穩定。此外,針對電商搜索廣告競價優化問題,以往的工作很少考慮同時優化廣告主多樣化的訴求目標。
針對以上問題,本文提出了一套新穎的多目標協同出價優化框架,即多智能體協同出價博弈。在該合作博弈框架中,本文通過引入一個全局的目標以優化所有廣告主的總體利益,鼓勵了廣告主更好的協同,從而間接保護了自主出價廣告主的利益,使得流量分配更加公平。為解決多廣告主串謀問題,本文也額外引入了平臺的收入作為約束。本文通過理論分析給出了最優出價公式的泛函形式,并設計了一種策略網絡用于探索泛函出價公式中的最優參數。為尋找最優參數,本文同時設計了一種高效的多智能體進化策略搜索算法。進化策略不需要顯式建模動態環境,使得求解過程具有更好的魯棒性。淘寶搜索廣告平臺上廣泛的離線評測和在線A/B測試,都顯示本文的方法顯著優于現有最新的工作。該模型已經上線部署到淘寶搜索廣告平臺,每天服務上百萬廣告主的實時競價優化,使得整體大盤效率指標以及廣告主自身訴求均有5%以上提升。
論文下載: //www.zhuanzhi.ai/paper/96bacab511dabf1b4b213f1e229d58bb
音樂流媒體服務嚴重依賴推薦系統來改善用戶體驗,通過幫助他們瀏覽一個大型音樂目錄,并發現新的歌曲、專輯或藝術家。然而,向新用戶推薦相關和個性化的內容,而不需要與目錄進行交互,是一項挑戰。這通常被稱為用戶冷啟動問題。在這篇應用論文中,我們提出了最近部署在音樂流媒體服務Deezer上的系統來解決這個問題。該解決方案利用了一種半個性化的推薦策略,該策略基于深度神經網絡架構,并基于來自異構信息源的用戶集群。通過離線和在線的大規模實驗,我們廣泛展示了該系統在預測冷啟動用戶未來音樂偏好方面的實際影響和有效性。我們公開了我們的代碼以及我們實驗中的匿名使用數據。我們希望此次發布的行業資源將有助于未來用戶冷啟動建議的研究。
點擊率(CTR)預測在推薦系統和在線廣告中起著至關重要的作用。這些應用程序中使用的數據是多字段類別數據,其中每個特征屬于一個字段。字段信息被證明是重要的,在他們的模型中有一些考慮字段的工作。在本文中,我們提出了一種新的方法來有效和高效地建模場信息。該方法是對FwFM的直接改進,被稱為場矩陣分解機(FmFM,或FM2)。在FmFM框架下,我們對FM和FwFM提出了新的解釋,并與FFM進行了比較。除了對交叉項進行修剪外,我們的模型還支持特定領域的可變維度的嵌入向量,這是一種軟修剪。在保持模型性能的同時,我們還提出了一種有效的最小化維數的方法。FmFM模型還可以通過緩存中間向量來進一步優化,它只需要數千次浮點運算(FLOPs)就可以做出預測。實驗結果表明,該算法的性能優于復雜的FFM算法。FmFM模型的性能也可以與DNN模型相媲美,DNN模型在運行時需要更多FLOPs 。
//www.zhuanzhi.ai/paper/39df3ac3e3acb641f86294a4d6acb39f
在以人工智能技術為支持的推薦、搜索、廣告等業務中,點擊率預估(CTR)一直是技術攻堅的核心,同時也是人工智能技術在業務落地中最難實現的技術方向之一。第一期介紹了視覺信息使用幫助提高點擊率預估的準確度(Category-Specific CNN for Visual-aware CTR Prediction at JD.com KDD2020)。本次介紹京東廣告團隊在用戶行為建模中的工作:基于卡爾曼濾波的注意力機制——廣告點擊率預估中的用戶行為建模。
此次工作《Kalman Filtering Attention for User Behavior Modeling in CTR Prediction》被機器學習領域中含金量最高的頂級國際會議NeurIPS 2020成功收錄為Spotlight論文。本次會議的Oral+Spotlight共收錄了385篇論文,占9454篇總投稿量的4%。
介紹之前,首先致謝京東零售數據算法通道委員會的支持。2020年京東零售建立數據算法通道委員會后,推出了適合算法工作特點的評價體系機制,算法技術氛圍變的更濃厚,使得算法工作能朝向長期深入的方向去深耕,也為算法工程師去嘗試風險較高的創新項目提供信心保障,將視野投向行業,敢于去挑戰業界的難題。
我們提出了一種基于卡爾曼濾波的注意力機制,用于工業級廣告點擊率預測系統中的用戶行為建模任務。通過卡爾曼濾波建模,有效地引入特定搜索詞的全局先驗信息,并有效控制高頻商品在用戶行為中的權重,從而得到比現存注意力機制更適配用戶行為建模任務的算法,有效提升用戶行為建模及其后續廣告點擊率預估的準確性。
隨著在線廣告在產業界取得巨大成功,其在學術界特別是數據挖掘和機器學習領域的研究也吸引了大量學者的關注。本論文圍繞實時競價機制在展示廣告投放中的關鍵問題展開研究。首先介紹了實時競價的基本流程、主要參與者的功能、定價模型和交易機制;然后分別從需求方、供應方和交易中心的角度,介紹了實時競價中存在的關鍵問題,以及目前的研究方法、理論和模型,具體包括:用戶響應預測、出價策略、預算與步進管理、保留價優化、庫存分配、拍賣機制等,特別針對用戶響應預測和出價策略兩個研究熱點展開了廣泛討論,并對其中的代表性方法進行了量化對比;此基礎上對主要的廣告欺詐方式和檢測手段進行了整理;最后對該方向未來的研究趨勢進行展望。
//gb.oversea.cnki.net/KCMS/detail/detail.aspx?filename=JSJX20191112000&dbcode=CJFQ&dbname=CAPJ2019