亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

鑒于信息量的爆炸性增長,推薦系統已成為在線活動中不可或缺的服務之一,能夠有效地幫助用戶找到他們感興趣的內容或目標購買的產品,從而提升用戶參與度和滿意度。盡管在過去的幾年中,得益于深度學習的進步,推薦方法得到了極大的發展,但它們仍然面臨著幾個限制。現有的方法可能難以有效理解和捕捉文本的旁信息,難以泛化到各種推薦場景,并在其預測中進行推理。最近,大語言模型(LLMs)的出現徹底改變了自然語言處理(NLP)領域,因為它們具有卓越的語言理解和生成能力。更令人印象深刻的是,它們能夠通過推理來解決復雜問題,并且可以輕松泛化到新的領域或任務。這樣的能力為解決現有推薦方法中的上述限制提供了機會,這使得基于LLM的推薦系統成為未來一個有前景的研究領域。為此,在本教程中,我們旨在從預訓練、微調和提示等各個方面提供關于基于LLM的推薦系統的最新進展的全面概述。這預計將幫助AI社區中相關領域的研究人員和工業實踐者獲得對基于LLM的推薦系統的總體理解,并為他們提供新的想法以進行更多令人興奮的研究。 我們的綜述論文:《大語言模型(LLMs)時代的推薦系統》 我們的幻燈片:第一部分,第二部分 教程網站://advanced-recommender-systems.github.io/LLMs4Rec-IJCAI/ 本教程的主題包括但不限于以下內容:

  • 基于LLM的推薦系統簡介
  • 推薦系統和LLM的基礎知識
  • 基于LLM的推薦系統的預訓練
  • 基于LLM的推薦系統的微調
  • 基于LLM的推薦系統的提示
  • 維度交互及未來方向

付費5元查看完整內容

相關內容

成對比較的排名聚合廣泛應用于社會學、政治學、經濟學、心理學、體育等領域。鑒于其巨大的社會影響和隨之而來的激勵措施,潛在的對手有強烈的動機來操縱排名列表。然而,理想的攻擊機會和過度的對抗能力使現有方法難以實際操作。為了充分探索潛在的風險,我們利用了在線攻擊脆弱的數據收集過程。由于它獨立于排名聚合并且缺乏有效的保護機制,我們通過偽造成對比較來干擾數據收集過程,而無需了解未來的數據或真實分布。從博弈論的角度來看,在線操縱者與控制原始數據源的排名者之間的對抗場景被表述為應對知識不確定性的分布魯棒博弈。然后我們通過分析Bernoulli和水庫等采樣算法的脆弱性,證明了在上述博弈中,均衡可能對對手有利。根據上述理論分析,我們在貝葉斯決策框架和一大類參數成對比較模型下提出了不同的序列操作策略。對于完全掌握知識的攻擊者,我們建立了所提出策略的漸近最優性。為了提高在不完全知識下進行序列操作的成功率,一個分布魯棒估計器替代了鞍點問題中的最大似然估計,提供了一個保守的數據生成解決方案。最后,驗證性的實證結果表明,所提出的方法能夠以序列方式操縱排名聚合方法的結果。

付費5元查看完整內容

信息檢索的核心目標已不僅僅是將用戶與其搜索的相關信息連接起來,還包括豐富連接的多樣性、個性化和互動性,確保信息檢索過程在全球數字時代中盡可能無縫、有效和支持性。目前的信息檢索系統通常面臨一些挑戰,例如對查詢理解的限制、響應的靜態和僵化、個性化程度有限以及互動性受限。隨著大語言模型(LLMs)的出現,通過將LLM驅動的代理集成到這些系統中,帶來了變革性的范式轉變。這些代理具備記憶和規劃等關鍵的人類能力,使其在完成各種任務時表現得像人類一樣,有效地增強用戶參與度并提供量身定制的互動。

在本教程中,我們將深入探討LLM驅動代理在各種信息檢索領域中的前沿技術,例如搜索引擎、社交網絡、推薦系統和對話助手。我們還將探討在無縫集成這些代理時面臨的挑戰,并指出可能徹底改變信息檢索方式的未來研究方向。 //llmagenttutorial.github.io/sigir2024

付費5元查看完整內容

在個性化推薦系統領域,適應不斷變化的用戶偏好以及新用戶和新物品的持續涌入是至關重要的挑戰。傳統模型通常依賴于靜態的訓練-測試方法,難以跟上這些動態需求。流式推薦,特別是通過持續圖學習,作為一種新穎的解決方案,受到了學術界和工業界的高度關注。然而,現有的方法在這一領域要么依賴歷史數據重放,這在嚴格的數據隱私法規下變得越來越不切實際;要么無法有效解決過度穩定性問題;要么依賴模型隔離和擴展策略,需要大量模型擴展并因大參數集的耗時更新而受阻。

為了解決這些困難,我們提出了GPT4Rec,一種用于流式推薦的圖提示微調方法。在不斷演變的用戶-物品交互圖中,GPT4Rec首先將圖模式解纏到多個視圖中。在不同視圖中隔離特定的交互模式和關系后,GPT4Rec利用輕量級圖提示有效引導模型在用戶-物品圖中的不同交互模式中進行適應。首先,節點級提示用于指導模型適應圖中各個節點屬性或特性的變化。其次,結構級提示引導模型適應圖中更廣泛的連接和關系模式。最后,視圖級提示創新性地設計用于促進從多個解纏視圖中聚合信息。這些提示設計使GPT4Rec能夠綜合理解圖結構,確保考慮并有效整合用戶-物品交互的所有重要方面。

在四個不同的真實世界數據集上的實驗結果表明,我們提出的方法在效果和效率上均表現出色。

付費5元查看完整內容

GNN(圖神經網絡)基礎的推薦系統在捕捉復雜的用戶-物品交互方面表現出色,通過多跳消息傳遞實現。然而,這些方法往往未能考慮到用戶-物品交互的動態特性,導致在適應用戶偏好變化和新數據分布方面面臨挑戰。因此,它們在真實世界動態環境中的可擴展性和性能受到限制。在我們的研究中,我們引入了GraphPro,一個將動態圖預訓練與提示學習以參數高效的方式結合起來的框架。這種創新的結合使得GNN能夠熟練掌握持久的用戶偏好和短暫的行為變化,從而提供精確且最新的推薦。GraphPro通過將時間提示機制和圖結構提示學習機制整合到預訓練的GNN架構中,解決了用戶偏好變化的問題。時間提示機制將時間相關信息印刻到用戶-物品交互上,使模型能夠固有地吸收時間動態,而圖結構提示學習機制允許將預訓練的洞見應用于新的行為動態,而無需持續的重訓練。我們還引入了一個動態評估框架,用于推薦以更好地反映現實世界情況并縮小線下-線上差距。我們的全面實驗,包括在大規模工業環境中的部署,證明了GraphPro與各種領先推薦器的無縫插拔擴展性,凸顯了GraphPro在有效性、魯棒性和效率方面的優越性。我們的GraphPro實現細節和源代碼可在//github.com/HKUDS/GraphPro 倉庫中獲得。

付費5元查看完整內容

如何使用大模型來進行檢索優化?看這篇綜述就夠了

作為信息獲取的主要手段,如搜索引擎等信息檢索(IR)系統已經融入了我們的日常生活。這些系統還作為對話、問答和推薦系統的組件。

信息檢索的軌跡從其基于術語的方法的起源動態地發展到與先進的神經模型的整合。雖然神經模型擅長捕捉復雜的上下文信號和語義細微差別,從而重塑信息檢索的格局,但它們仍然面臨如數據稀缺、可解釋性以及生成上下文可能的但可能不準確的回應等挑戰。

這種演變需要結合傳統方法(如基于術語的稀疏檢索方法與快速響應)和現代神經結構(如具有強大語言理解能力的語言模型)。與此同時,大型語言模型(LLMs),如ChatGPT和GPT-4,由于其出色的語言理解、生成、概括和推理能力,已經革命性地改變了自然語言處理

因此,最近的研究已經尋求利用LLMs來改進IR系統。鑒于這一研究軌跡的快速發展,有必要整合現有的方法并通過全面的概述提供細致的見解。

在這項綜述中,我們深入探討了LLMs和IR系統的融合,包括查詢重寫器、檢索器、重新排序器和讀取器等關鍵方面。此外,我們還探討了這個不斷擴展領域內的有前景的方向。

//www.zhuanzhi.ai/paper/cfc9d30dab451b42c356f809ecf111a6

大模型驅動的信息檢索

信息訪問是人類日常基本需求之一。為了滿足快速獲取所需信息的需求,開發了各種信息檢索(IR)系統[1–4]。顯著的例子包括Google、Bing和Baidu等搜索引擎,它們在互聯網上作為IR系統,擅長根據用戶查詢檢索相關的網頁,并為用戶提供便捷、高效地訪問互聯網上的信息。值得注意的是,信息檢索超出了網頁檢索的范圍。在對話系統(聊天機器人)[1, 5-8]中,如微軟的小冰[2]、蘋果Siri1和Google助手2,IR系統在檢索與用戶輸入語言相應的適當回應中起到了關鍵作用,從而產生自然流暢的人機對話。同樣,在問答系統[3, 9]中,為了有效地解答用戶的問題,IR系統被用來選擇相關的線索。在圖像搜索引擎[4]中,IR系統擅長返回與用戶輸入查詢相符的圖片。鑒于信息的指數級增長,研究和產業對開發有效的IR系統越來越感興趣。

IR系統的核心功能是檢索,其目的是確定用戶發出的查詢與待檢索的內容之間的相關性,包括文本、圖像、音樂等各種類型的信息。在本綜述的范圍內,我們僅專注于審查那些文本檢索系統,其中查詢與文檔的相關性通常由它們的匹配得分來衡量。3考慮到IR系統操作大量的知識庫,檢索算法的效率變得至關重要。為了提高用戶體驗,檢索性能從上游(查詢重構)和下游(重新排序和閱讀)的角度得到了增強。作為一個上游技術,查詢重構旨在優化用戶的查詢,使其更有效地檢索到相關的文檔[10, 11]。隨著會話式搜索的日益受歡迎,這種技術受到了越來越多的關注。在下游方面,重新排序方法被開發出來,以進一步調整文檔的排名[12-14]。與檢索階段相比,重新排序僅在檢索器已經檢索到的有限集合的相關文檔上執行。在這種情況下,重點放在實現更高的性能而不是保持更高的效率,允許在重新排序過程中應用更復雜的方法。此外,重新排序可以滿足其他特定的需求,如個性化[15-18]和多樣化[19-22]。在檢索和重新排序階段之后,加入了一個閱讀組件,用于總結檢索到的文檔并為用戶提供簡潔的文檔[23, 24]。雖然傳統的IR系統通常要求用戶自己收集和整理相關信息;但是,閱讀組件是New Bing等新IR系統的一個不可分割的部分,簡化了用戶的瀏覽體驗,節省了寶貴的時間。

信息檢索(IR)的軌跡經歷了動態的演變,從其基于術語的方法的起源轉變為與神經模型的整合。最初,IR基于基于術語的方法[25]和布爾邏輯,專注于為文檔檢索進行關鍵詞匹配。隨著向量空間模型[26]的引入,這一范式逐漸發生了變化,釋放出捕獲術語之間細微的語義關系的潛力。這種進展隨著統計語言模型[27, 28]繼續發展,通過上下文和概率考慮來改進相關性估計。在這一階段,有影響力的BM25算法[29]起到了重要作用,通過考慮術語頻率和文檔長度的變化,徹底改變了相關性排名。IR歷程中的最新篇章是由神經模型的崛起[3, 30-32]標志的。這些模型擅長捕獲復雜的上下文提示和語義細節,重塑了IR的格局。然而,這些神經模型仍然面臨如數據稀缺、可解釋性以及可能生成合理但不準確回應等挑戰。因此,IR的演變仍然是一個平衡傳統優勢(如BM25算法的高效率)與現代神經結構所帶來的顯著能力(如語義理解)的旅程。

近年來,大型語言模型(LLMs)已在各種研究領域,如自然語言處理(NLP)[33-35]、推薦系統[36-39]、金融[40],甚至分子發現[41]中嶄露頭角,成為變革的力量。這些前沿的LLMs主要基于Transformer架構,并在各種文本源上進行廣泛的預訓練,包括網頁、研究文章、書籍和代碼。隨著它們的規模繼續擴展(包括模型大小和數據量),LLMs在其能力上展現出了顯著的進步。一方面,LLMs在語言理解和生成方面展現出了前所未有的熟練程度,從而產生更像人類的響應,并更好地與人類的意圖對齊。另一方面,更大的LLMs在處理復雜任務[42]時展示了令人印象深刻的突發能力,如泛化和推理技能。值得注意的是,LLMs可以有效地應用其學到的知識和推理能力,只需幾個針對特定任務的示范或適當的指導即可解決新任務[43, 44]。此外,如基于上下文的學習這樣的先進技術,已經大大增強了LLMs的泛化性能,無需對特定的下游任務進行微調[34]。這一突破尤為寶貴,因為它減少了大量的微調需求,同時獲得了顯著的任務性能。通過使用如“思維鏈”這樣的提示策略,LLMs可以生成帶有逐步推理的輸出,導航復雜的決策過程[45]。無疑,利用LLMs的強大力量可以提高IR系統的性能。通過整合這些復雜的語言模型,IR系統可以為用戶提供更準確的回應,從根本上重塑信息訪問和檢索的格局。

已經進行了初步的嘗試,以利用LLMs在開發新型IR系統中的潛力。值得注意的是,就實際應用而言,New Bing旨在通過從不同的網頁中提取信息,并將其壓縮成簡潔的摘要作為用戶生成查詢的響應,從而改進用戶使用搜索引擎的體驗。在研究界,LLMs已在IR系統的特定模塊(如檢索器)中證明了其用途,從而增強了這些系統的整體性能。由于LLM增強型IR系統的迅速發展,全面審查它們的最新進展和挑戰至關重要。我們的綜述提供了對LLMs和IR系統交叉點的深入探索,涵蓋了關鍵視角,如查詢重寫器、檢索器、重新排名器和讀取器(如圖1所示)。這項分析加深了我們對LLMs在推進IR領域中的潛力和局限性的理解。為了這次綜述,我們創建了一個Github倉庫,收集了有關LLM4IR的相關論文和資源。我們將繼續使用新的論文更新倉庫。此綜述也將根據此領域的發展定期進行更新。我們注意到有幾篇關于PLMs、LLMs及其應用(例如AIGC或推薦系統)的綜述[46–52]。在這些中,我們強烈推薦LLMs的綜述[52],它為LLMs的許多重要方面提供了系統而全面的參考。與它們相比,我們專注于為IR系統開發和應用LLMs的技術和方法。此外,我們注意到有一篇觀點論文討論了IR在遇到LLMs時的機會[53]。這將是關于未來方向的本次綜述的極好補充。

此綜述的其余部分組織如下:第2部分介紹IR和LLMs的背景。第3、4、5、6部分分別從查詢重寫器、檢索器、重新排名器和讀取器的四個視角審查了最近的進展,這是IR系統的四個關鍵組件。然后,第7部分討論了未來研究中的一些可能方向。最后,我們在第8部分總結了主要發現,結束這次綜述。

結論

在這項綜述中,我們對LLMs在IR的多個維度上的變革影響進行了深入的探索。我們根據它們的功能將現有方法組織成不同的類別:查詢重寫、檢索、重新排序和讀取模塊。在查詢重寫領域,LLMs已經展示了其在理解模糊或多面的查詢方面的有效性,增強了意圖識別的準確性。在檢索的背景下,LLMs通過使查詢和文檔之間的匹配更加細致,同時考慮上下文,提高了檢索的準確性。在重新排序領域,LLM增強的模型在重新排序結果時考慮了更多的語言細節。在IR系統中加入讀取模塊代表了向生成綜合性回應而不僅僅是文檔列表的重要一步。LLMs的整合到IR系統帶來了用戶與信息和知識互動方式的根本變化。從查詢重寫到檢索,重新排序和讀取模塊,LLMs已經通過高級語言理解、語義表示和上下文敏感處理豐富了IR過程的每一個方面。隨著這一領域的不斷進展,LLMs在IR中的旅程預示著一個更加個性化、精確和以用戶為中心的搜索體驗的未來。這項綜述著重于審查最近的將LLMs應用于不同信息檢索組件的研究。除此之外,LLMs的出現帶來了一個更大的問題:在LLMs的時代,傳統的IR框架是否還有必要?例如,傳統的IR旨在返回與發出的查詢相關的文檔的排名列表。然而,生成語言模型的發展引入了一個新的范例:直接生成對輸入問題的答案。此外,根據最近的一篇觀點論文[53],IR可能會演變為多種系統的基本服務。例如,在一個多代理模擬系統[162]中,IR組件可以用于記憶回憶。這意味著未來的IR將會有許多新的挑戰。

付費5元查看完整內容

圖數據在現實世界的各種應用中無處不在。為了更深入地理解這些圖,圖挖掘算法多年來發揮了重要作用。然而,大多數圖挖掘算法缺乏對公平性的考慮。因此,它們可能對某些人口次群體或個人產生歧視性的結果。這種潛在的歧視導致社會越來越關注如何緩解圖挖掘算法中表現出的偏見。本教程全面概述了在測量和減輕圖挖掘算法中出現的偏差方面的最新研究進展。首先介紹了幾個廣泛使用的公平性概念和相應的指標。然后,對現有的去偏置圖挖掘算法技術進行了有組織的總結。展示了不同的現實世界應用在去偏后如何受益于這些圖挖掘算法。對當前的研究挑戰和開放問題提出了見解,以鼓勵進一步取得進展。

//yushundong.github.io/ICDM_2022_tutorial.html

內容:

Part 1: 引言Introduction

Background and Motivation. * An overview of graph mining tasks that have been studied on algorithmic bias mitigation. * An overview of the applications which benefit from debiased graph mining algorithms.

Part 2:圖挖掘公平性符號與度量 Fairness Notions and Metrics in Graph Mining

Why is it necessary to define fairness in different ways? * Group Fairness: graph mining algorithms should not render discriminatory predictions or decisions against individuals from any specific sensitive subgroup. * Individual Fairness: graph mining algorithms should render similar predictions for similar individuals. * Counterfactual Fairness: an individual should receive similar predictions when his/her features are perturbed in a counterfactual manner. * Degree-Related Fairness: nodes with different degree values in the graph should receive similar quality of predictions. * Application-Specific Fairness: fairness notions defined in specific real-world applications.

**Part 3: 圖挖掘算法去偏見技術 **Techniques to Debias Graph Mining Algorithms

Optimization with regularization. * Optimization with constraint. * Adversarial learning. * Edge re-wiring. * Re-balancing. * Orthogonal projection.

Part 4: 真實世界應用場景 Real-World Application Scenarios

Recommender systems. * Applications based on knowledge graphs. * Other real-world applications, including candidate-job matching, criminal justice, transportation optimization, credit default prediction, etc.

Part 5: 總結 挑戰與未來 Summary, Challenges, and Future Directions

Summary of presented fairness notions, metrics and debiasing techniques in graph mining. * Summary on current challenges and future directions. * Discussion with audience on which fairness notion, metric should be applied to their own application scenarios.

講者:

付費5元查看完整內容

隨著新聞文章的信息爆炸,個性化的新聞推薦因為能夠讓用戶快速找到自己感興趣的文章,已經越來越受到業界和學術界的關注。現有的新聞推薦方法主要包括基于用戶-新聞直接交互的協同過濾方法和基于用戶歷史閱讀內容特征的基于內容的方法。雖然這些方法取得了良好的性能,但由于大多數方法無法廣泛利用新聞推薦系統中的高階結構信息(例如U-D-T-D-U隱含相似的用戶傾向于閱讀相似的新聞文章信息),存在數據稀疏問題。在本文中,我們提出構建一個異質圖來明確地建模用戶、新聞和潛在主題之間的交互。附加的主題信息將有助于捕捉用戶的興趣,并緩解用戶-新聞交互的稀疏性問題。然后我們設計一個新穎的異質圖神經網絡學習用戶和新聞表示,通過在圖上傳播特征表示來編碼高階結構信息。通過異質圖完整的用戶點擊歷史學習到的用戶嵌入能夠捕獲用戶的長期興趣。此外,我們還設計了融合注意力的LSTM模型使用最近的閱讀歷史來建模用戶最近的短期興趣。

付費5元查看完整內容

本文探討了元學習在序列推薦中的應用,以緩解項目冷啟動問題。序列推薦旨在根據用戶的歷史行為序列捕獲用戶的動態偏好,是大多數在線推薦場景的關鍵組成部分。然而,大多數以前的方法難以推薦冷啟動項目,這在這些情況下是普遍存在的。由于在序列推薦任務的設置中通常沒有附加信息,所以當只有用戶-項目交互可用時,不能運用以前的冷啟動方法。因此,我們提出了一種基于元學習的冷啟動序列推薦框架,即Mecos,以緩解序列推薦中項目冷啟動問題。這項任務不是微不足道的,因為它的目標是一個重要的問題,在一個新穎的和具有挑戰性的背景下。Mecos有效地從有限的交互中提取用戶偏好,并學習將目標冷啟動項目與潛在用戶匹配。此外,我們的框架可以輕松地集成基于神經網絡的模型。在三個真實世界的數據集上進行的大量實驗驗證了Mecos的優越性,與最先進的基線方法相比,在HR@10的平均改進高達99%,91%和70%。

付費5元查看完整內容

可解釋人工智能(xAI)是近年來出現的一個有趣的問題。許多研究人員正試圖從不同的角度和有趣的結果來處理這個問題。然而,我們在理解這些類型的模型方面仍處于起步階段。在未來的幾年里,深度學習模型的開放性將被討論。在經典的人工智能方法中,我們經常遇到深度學習方法。這些深度學習方法可以根據數據集大小、數據集質量、用于特征提取的方法、用于深度學習模型的超參數集、激活函數和優化算法得出高效的結果。然而,目前的深度學習模型還存在一些重要的不足。這些基于人工神經網絡的模型是黑盒模型,它概括傳輸給它的數據并從數據中學習。因此,輸入和輸出之間的關系是不可觀察的。這是人工神經網絡和深度學習模型的一個重要開放點。由于這些原因,有必要認真研究黑盒模型的可解釋性和可解釋性。

付費5元查看完整內容

最近,終身學習在構建不斷積累和轉移知識以幫助未來學習的機器學習系統方面引起了關注。無監督主題建模廣泛用于從文檔集合中發現主題。然而,由于數據稀疏性,例如,在一個小的(短)文檔集合中,會產生不連貫的主題和次優的文檔表示,主題建模的應用具有挑戰性。為了解決這個問題,我們提出了一個神經主題建模的終身學習框架,它可以連續處理文檔集流,積累主題,并通過從多個來源的知識轉移來指導未來的主題建模任務,以更好地處理稀疏的數據。在終身學習過程中,我們特別共同研究:(1)終生共享生成同源性(潛在話題)以轉移先驗知識,(2)通過新穎的選擇性數據增強、聯合訓練和話題正則化方法最小化保留過去學習的災難性遺忘。在給定一個文檔集合流的情況下,我們應用所提出的終身神經主題建模(LNTM)框架,將三個稀疏文檔集合建模為未來任務,并通過perplexity、Topic coherence和information retrieval task量化,證明了性能的提高。

付費5元查看完整內容
北京阿比特科技有限公司