個性化學習推薦是智能學習的一個研究領域,其目標是在學習平臺上給特定學習者提供有效學習資源,從而提升學習積極性與學習效果。雖然現有的推薦方法已被廣泛用于教學場景,但教學活動自身的科學規律,使個性化學習推薦在個性化參數設置、推薦目標設定、評價標準設計等方面具有一定的特殊性。針對上述問題,在調研大量文獻的基礎上對近年來個性化學習推薦的研究進行了綜述。從學習推薦通用框架、學習者建模、學習推薦對象建模、學習推薦算法、學習推薦評價五方面對個性化學習推薦的相關研究進行了系統的梳理和解讀。首先提出了學習推薦系統的通用框架,其次介紹了學習者建模的思路和方法,接著討論了學習推薦對象建模的思路和方法,然后歸納了學習推薦的算法與模型,接下來總結了學習推薦評價的設計與方法。并對這五方面現有研究的主要思想、實施方案、優勢及不足進行了分析。最后還展望了個性化學習推薦未來的發展方向,為智能學習的進一步深入研究奠定了基礎。
對話推薦算法研究綜述
A Survey of Conversational Recommendation Algorithms
作者:趙夢媛,黃曉雯*,桑基韜,于劍 單位:
北京交通大學計算機與信息技術學院 北京交通大學人工智能研究院 北京交通大學交通數據分析與挖掘北京市重點實驗室 郵箱:{f19120453, xwhuang, jtsang, jianyu}@bjtu.edu.cn **論文:** *通訊作者
01
簡介
推薦系統是一種通過理解用戶的興趣和偏好幫助用戶過濾大量無效信息并獲取感興趣的信息或者物品的信息過濾系統。目前主流的推薦系統主要基于離線的、歷史的用戶數據,不斷訓練和優化線下模型,繼而為在線的用戶推薦物品,這類訓練方式主要存在三個問題:基于稀疏且具有噪聲的歷史數據估計用戶偏好的不可靠估計、對影響用戶行為的在線上下文環境因素的忽略和默認用戶清楚自身偏好的不可靠假設。由于對話系統關注于用戶的實時反饋數據,獲取用戶當前交互的意圖,因此“對話推薦”通過結合對話形式與推薦任務成為解決傳統推薦問題的有效手段。對話推薦將對話系統實時交互的數據獲取方式應用到推薦系統中,采用了與傳統推薦系統不同的推薦思路,通過利用在線交互信息,引導和捕捉用戶當前的偏好興趣,并及時進行反饋和更新。在過去的幾年里,越來越多的研究者開始關注對話推薦系統,這一方面歸功于自然語言處理領域中語音助手以及聊天機器人技術的廣泛使用,另一方面受益于強化學習、知識圖譜等技術在推薦策略中的成熟應用。本文將對話推薦系統的整體框架進行梳理,將對話推薦算法研究所使用的數據集進行分類,同時對評價對話推薦效果的相關指標進行討論,重點關注于對話推薦系統中的后臺對話策略與推薦邏輯,對近年來的對話推薦算法進行綜述,最后對對話推薦領域的未來發展方向進行展望。
2.1
什么是對話推薦系統?
對話推薦系統的交互推薦方式就像是將傳統靜態推薦系統與對話系統結合,在與用戶的交互中通過詢問用戶相關問題動態地更新用戶的興趣偏好。因此對話推薦系統可以有如下兩種定義。
**定義一:**對話推薦系統是以推薦為目標導向的對話系統。系統通過與用戶的在線對話達到捕捉用戶興趣從而推薦物品的目的。
**定義二:**對話推薦系統是具有多輪交互形式的推薦系統。交互的形式狹義上是自然語言形式或語音形式,廣義上還包括推薦系統中用戶的任何行為數據的形式(如:點擊、瀏覽)
2.2
傳統推薦系統vs對話推薦系統
傳統的推薦系統中,用戶在尋找具有特定屬性的物品時,可以通過主動搜索來進行,例如,用戶可以搜索“春季的短款夾克”,其中關鍵短語“春季”和“短款”是“夾克”的屬性。在這個場景中,用戶自己構造查詢,推薦效果不僅依賴于搜索引擎,更依賴用戶在構造查詢方面的專業知識。推薦系統需要用戶根據自己的先驗知識輸入可能的屬性選項限制,從而更準確地定位到合適的推薦候選項集合,推薦系統才能在此基礎上幫助用戶找到目標物品。總之,這種推薦系統中的主動搜索方式需要用戶熟悉自己想要的每一件物品,然而在實際操作中并非如此。當用戶并不熟悉自己想要物品的屬性時,推薦系統就被期望能夠主動向用戶介紹他們可能喜歡的潛在物品,然而,傳統的推薦系統無法做到這一點,它只能使用靜態的歷史記錄作為輸入,這也就導致了傳統單向、靜態的推薦系統中存在三個主要問題:基于稀疏且具有噪聲的歷史數據估計用戶偏好的不可靠估計、對影響用戶行為的在線上下文環境因素的忽略和默認用戶清楚自身偏好的不可靠假設。
2.2.1 **共性:**面向推薦任務,都需要理解用戶興趣偏好,為用戶篩選信息 **區別:**使用數據不同: (1)傳統推薦系統主要依賴用戶的歷史交互數據。 (2)對話推薦系統主要依賴用戶的在線反饋數據。 推薦模型更新方式不同: (1)傳統推薦系統是靜態的,其從用戶的歷史交互信息中來估計用戶偏好,上線后不做更新,更新需定期下線。 (2)對話推薦系統是動態的,其與用戶進行交互,在模型有不確定的地方,可以主動咨詢用戶,實時更新推薦模型參數。
03
對話推薦系統特點:多輪交互、目標導向
04
對話推薦系統的流程
一個標準的CRS框架包含了三大功能模塊:用戶意圖理解模塊、對話策略模塊和推薦模塊。從功能模塊來看,CRS與DS非常相似,這進一步說明CRS的核心思路來源就是DS。
**用戶意圖理解模塊:**用戶與系統交互的“翻譯器”,將用戶的輸入(文本、圖像、評分、瀏覽等交互行為)處理成會話的狀態表示,作為對話策略模塊的輸入,如果是基于自然語言交互的對話推薦,該模塊還需要生成流暢的自然語言反饋。
**對話策略模塊:**是核心模塊,是用戶意圖模塊和推薦模塊的連接橋梁,該模塊處理和記錄用戶偏好,并根據用戶當前的交互歷史數據,決定系統當前輪次反饋給用戶的交互內容,引導用戶決策,最終實現符合用戶偏好的一次成功推薦。
**推薦模塊:**建模用戶與物品的關系,在被對話策略模塊調用時輸出當前輪次下契合該用戶偏好的推薦物品列表。
05
對話推薦系統的用戶意圖理解模塊
用戶與系統交互的“翻譯器”,與用戶直接進行信息交換的模塊,處理用戶的輸入數據(文本、圖像、評分、瀏覽等交互行為)處理成會話的狀態表示,作為對話策略模塊的輸入。
(1)面向自然語言、語音和圖像的用戶意圖:理解處理自然語言、語音和圖像,研究如何像人類一樣溝通交互。
(2)面向用戶行為數據的用戶意圖理解:處理數據為用戶偏好集合,接受用戶二值反饋,輸出系統策略行為(詢問或推薦)
06
對話推薦系統的對話策略模塊
是對話推薦系統的核心模塊,該模塊處理和記錄用戶偏好,并根據用戶當前的交互歷史數據,決定系統當前輪次反饋給用戶的交互內容,引導用戶決策,最終實現符合用戶偏好的一次成功推薦。
對話推薦的交互性使得用戶有機會及時表達自己的意圖,以獲得更好的個性化推薦服務,并且由于具有交互性,對話推薦還可以主動探索用戶看不見的物品空間,從而引導用戶發掘自己的偏好。然而對話推薦的探索過程是有代價的,與利用已經獲得的偏好推薦高置信度的物品相比,暴露不相關的物品空間的信息可能會傷害用戶的偏好,失去做出準確推薦的機會。此外由于用戶與系統互動的時間和精力有限,一次失敗的探索將浪費用戶的時間與精力,可能造成用戶的流失。因此追求探索和收益的平衡(exploration and exploitation,E&E)是對話推薦研究中的一個關鍵問題,對話策略模塊主要解決的問題就是權衡探索與收益,它是CRS核心模塊。
這個模塊的研究工作根據目前研究者使用的核心策略技術,主要分成以下四大類:
(1)基于人工規則
基于人工規則的的方法非常簡單,根據人的先驗領域知識,設置對話規則,例如,設置限制,規定固定輪次交互后都要提供一個推薦物品,或者根據置信度推薦前k個物品。
(2)基于神經網絡
利用神經網絡模型輸出的動作概率分布決定對話策略,例如,通過GRU將當前對話的上下文編碼成隱狀態向量輸入,softmax層輸出概率分布,根據概率分布決定是否推薦以及推薦什么物品。
(3)基于****強化學習
將對話上下文、用戶偏好等編碼為狀態向量,輸入到強化策略網絡中,策略網絡基于獎勵函數進行訓練,學習對話策略,輸出系統動作向量。
(4)基于元學習
核心思想是“學習如何學習一個推薦模型”。將元學習應用到對話推薦算法中是個值得研究的思路。
07
對話推薦系統的推薦模塊
推薦模塊是CRS中實現推薦功能的模塊,根據已經捕捉到的用戶偏好推薦用戶當前最感興趣的目標物品。大部分的研究工作中,推薦模塊都采用簡單的推薦模型,例如矩陣分解(matrix factorization),這是因為簡單的推薦模型就已經可以滿足對話推薦系統的推薦需求,使用過于復雜的推薦模型,反而會使系統整體復雜度上升,使對話推薦模型的訓練變得困難。
(1)基于自編碼器的模型(autoencoder-based models) 自編碼器(autoencoder)本身就常被用于推薦系統中,可以克服冷啟動問題(cold-start problem)
(2)基于圖卷積神經網絡的模型(GCN-based models) 圖卷積神經網絡面向應用場景中的圖結構數據,通過卷積操作,同時考慮節點的屬性以及鄰居節點的屬性,讓模型學習到節點更好的局部表示,從而提高基于圖結構數據的模型性能。
08
對話推薦任務-常用數據集
對話推薦的交互形式既可以是語音、自然語言語句,也可以是更為一般的用戶交互行為數據(如點擊、瀏覽、購買等)。因此在對話推薦的研究工作中,常用的數據集也分為兩類:第一類是研究者將用戶交互語音或語句與推薦數據結合,人工構造的數據集;第二類是更為一般的推薦系統通用數據集。
09
對話推薦任務-評價指標
在兩類不同類型數據集的應用場景下,對話推薦的評價指標也不相同,目前尚沒有統一且成熟的評價指標體系來評價對話推薦系統的功能。如表所示,在對話推薦相關的研究工作中,研究者由于研究的出發點和關注的角度不同,往往在實驗中使用不同的評價指標,從其關注的某幾個方面評價對話推薦的效果。 根據各類指標的評估內容和角度,把目前對話推薦任務的相關評價指標分為三類: (1)評價對話推薦的語言質量的指標; (2)評價對話推薦的推薦性能的指標; (3)評價對話推薦的系統效率的指標。
10
對話推薦任務-評估方式
(1)在線用戶評估
與真實的用戶交互,在真實的環境中驗證系統的效果,評估的結果真實且可信。雖然在線用戶評估的結果很優越,但實際的研究工作大多沒有條件進行線上用戶評估,在線用戶的評估方式很難被廣泛使用。原因有二,一是使用在線用戶進行訓練和評估,不成熟的對話推薦系統會損害用戶體驗,造成實際的損失;二是在線用戶評估數據的收集和整理需要額外的時間和精力,投入的成本加大。
(2)用戶模擬器評估
用戶模擬器(user simulator)通過擬合用戶的歷史數據,提供對話推薦的交互環境,為對話推薦系統每輪交互的輸出動作模擬用戶可能的行為。使用用戶模擬器,使得對話推薦系統的交互訓練更加快捷,也極大降低了評估成本。但該方式也有明顯的缺點,即用戶模擬器無法完全正確地預測在線用戶的真實反饋。
11
對話推薦系統研究中存在的問題
1、評價指標不統一
人類評估和專家分析是必要的,目前沒有完美的指標可以全面評估對話推薦系統的功能。
2、探索與收益的平衡
(1)如何在保證推薦準確率的前提下,減輕用戶的交互負擔; (2)如何將會話數據與用戶歷史數據結合,推斷用戶具有時序性特點的偏好; (3)如何利用用戶歷史興趣引導用戶發掘未來偏好。
3、數據稀疏性
(1)物品冷啟動問題:一定程度上可以解決傳統推薦系統中的用戶冷啟動問題,但在物品冷啟動問題上沒有非常好的解決方式。 (2)用戶反饋數據稀疏問題:對話推薦受制于有限的對話輪次,獲取到的用戶反饋只有有限輪次數量的數據。
4、對話策略模型低效
(1)模型訓練方式問題:對話推薦系統的環境缺少明確的規則,從而導致使用強化模型時沒有明確獎勵函數以及清晰的動作空間。
(2)模型面向任務的設計問題:強化對話推薦算法中的強化模型設計完全依賴于研究者的直覺與經驗,與任務不合適的強化模型會導致對話策略模型的訓練低效,甚至是無效。
12
未來研究方向
協同優化的端到端對話推薦 * 知識增強的對話推薦 * 基于多模態交互數據的對話推薦 * 無偏的對話推薦 * 用戶反饋的改進 * 更智能的對話推薦策略設計
13
總結
作為解決目前傳統推薦系統中存在問題的有效手段,對話推薦的研究具有重大意義。近兩年大量的對話推薦相關工作在推薦領域和數據挖掘領域的頂級會議與期刊中被發表,對話推薦的研究進入新的發展階段。本文詳細討論了對話推薦的研究內容與特點,重點關注對話推薦中的算法設計,對目前的對話推薦算法進行了歸類和總結,并介紹了對話推薦的評價指標及當前研究的挑戰與未來的研究方向。本文有助于人們理解對話推薦的研究內容、研究難點與研究思路,引發人們對未來對話推薦研究的思考。
摘要: 推薦系統致力于從海量數據中為用戶尋找并自動推薦有價值的信息和服務,可有效解決信息過載問題,成為大數據時代一種重要的信息技術。但推薦系統的數據稀疏性、冷啟動和可解釋性等問題,仍是制約推薦系統廣泛應用的關鍵技術難點。強化學習是一種交互學習技術,該方法通過與用戶交互并獲得反饋來實時捕捉其興趣漂移,從而動態地建模用戶偏好,可以較好地解決傳統推薦系統面臨的經典關鍵問題。強化學習已成為近年來推薦系統領域的研究熱點。文中從綜述的角度,首先在簡要回顧推薦系統和強化學習的基礎上,分析了強化學習對推薦系統的提升思路,對近年來基于強化學習的推薦研究進行了梳理與總結,并分別對傳統強化學習推薦和深度強化學習推薦的研究情況進行總結;在此基礎上,重點總結了近年來強化學習推薦研究的若干前沿,以及其應用研究情況。最后,對強化學習在推薦系統中應用的未來發展趨勢進行分析與展望。
近年來,采用異質信息網絡統一建模推薦系統中不同類型對象的復雜交互行為、豐富的用戶和商品屬性以及各種各樣的輔助信息,不僅有效地緩解了推薦系統的數據稀疏和冷啟動問題,而且具有較好的可解釋性,并因此得到了廣泛關注與應用。據我們所知,本文是首篇專門介紹基于異質信息網絡的推薦系統的綜述。
具體而言,本文首先介紹了異質信息網絡和推薦系統的核心概念和背景知識,簡要回顧了異質信息網絡和推薦系統的研究現狀,并且闡述了將推薦系統建模為異質信息網絡的一般步驟。然后,本文根據模型原理的不同將現有方法分為三類,分別是基于相似性度量的方法、基于矩陣分解的方法和基于圖表示學習的方法,并對每類方法的代表性工作進行了全面的介紹,指出了每類方法的優缺點和不同方法之間的發展脈絡與內在關系。最后,本文討論了現有方法存在的問題,并展望了該領域未來的幾個潛在的研究方向。
1 引言
推薦系統往往面臨著數據稀疏和冷啟動問題,因此無法得到精準的推薦結果。在推薦系統中引入輔助信息可以有效地緩解這些問題。例如社會化推薦根據用戶之間的關系構造社交網絡作為輔助信息,從而能夠在推薦系統中充分利用社會關系對用戶喜好的影響。類似地,基于地理位置的社交推薦構建了用戶與位置之間的關系,通過用戶的位置記錄來捕捉用戶的行為偏好。然而,這些方法僅適用于某種特定類型的輔助信息,不具有普適性。
異質信息網絡是一種通用的融合多源數據的方法。通過將推薦系統視為由不同類型對象和交互構成的異質信息網絡,我們可以建模用戶與商品之間復雜的交互關系,而且可以有效融合屬性和各類輔助信息。基于異質信息網絡的推薦系統在信息融合、探索結構語義等方面具有顯著優勢,不僅可以有效緩解數據稀疏與冷啟動問題,而且有助于提升推薦系統的準確性和可解釋性,因此取得了廣泛的關注與應用。
綜述的章節編排如下:第2章簡要介紹推薦系統和異質信息網絡的相關概念與定義;第3章按照模型原理的不同,對基于異質信息網絡的推薦系統進行分類,并對現有方法進行了系統地梳理與分析;第4章展望了基于異質信息網絡的推薦系統未來研究方向;第5章回顧并總結全文。(在這里,主要展示第3章和第4章的核心內容,其他內容詳見論文原文。)
2 模型分類
目前,研究人員設計了各種適用于異質信息網絡建模的推薦算法。本章根據模型的不同,將現有工作進行分類,如表1所示。 圖片
2.1 基于相似性度量
推薦系統的個性化匹配往往基于對實體相似性的度量,而協同過濾需要基于用戶與商品之間的交互歷史計算相似度。早期的相似性度量算法僅對同質信息網絡定義,然而,這些算法忽視了對象和聯系的不同類型,不適用于建模為異質信息網絡的推薦系統。為了解決這一問題,研究者們提出了一系列用于異質信息網絡中實體相似性度量的算法,主要包括基于隨機游走的方法和基于元路徑的方法。基于這兩類異質信息網絡相似性度量算法,研究者們提出了很多協同過濾算法的變體,本文將這類方法統稱為基于相似性度量的方法。(詳見原文)
2.2 基于矩陣分解
為了解決相似性度量方法存在的時空復雜度高的問題,推薦系統的研究者們提出了矩陣分解模型,其原理是通過分解評分矩陣來提取出用戶和商品的隱向量,然后根據隱向量的相似度進行推薦。傳統的矩陣分解模型在訓練時使用隱向量重構共現矩陣作為優化目標,無法利用異質信息網絡中豐富的語義信息。很多研究者提出適用于異質信息網絡建模的矩陣分解方法,可以分為兩類:基于正則化的方法,和基于神經矩陣分解的方法。與基于相似性度量的方法相比,本節介紹的方法不依賴顯式的路徑可達性,當路徑連接稀疏或嘈雜時也不會失敗。(詳見原文)
2.3 基于圖表示學習
隨著深度學習的發展,基于神經網絡的推薦模型憑借其強大的特征交叉能力以及模型架構設計的靈活性,取得了較好的推薦效果。然而,傳統的神經網絡并不能直接建模圖結構。隨著圖表示學習技術的興起,研究者們嘗試設計融合圖表示學習技術的推薦模型,從而更好地學習圖數據中豐富的結構和語義信息。本節將這類方法統稱為基于圖表示學習的方法,并進一步分為基于兩階段訓練的方法和基于端到端訓練的方法。(詳見原文)
3 未來研究方向
異質信息網絡作為一種融合輔助信息的建模方法,憑借其緩解數據稀疏與冷啟動問題、提升模型性能與可解釋性等方面的優勢,已經在各種各樣的推薦系統模型和推薦任務上得到了應用。然而,基于異質信息網絡的推薦系統仍面臨很多挑戰,本節將介紹幾個潛在的未來研究方向。(詳見原文) 新型的異質圖推薦的模型與應用:基于圖神經網絡的推薦系統模型仍存在過平滑、魯棒性差等缺陷,而目前在圖神經網絡中引入異質信息的方法也仍不夠靈活,如何設計更好的異質圖推薦模型存在挑戰,如何將異質信息網絡用于更多類型的推薦任務也存在挑戰。
面向跨域數據的異質圖推薦:目前的絕大多數工作僅關注在單一異質網絡上的推薦任務,與單圖推薦相比,跨域推薦存在很多額外的挑戰。例如,如何設計源域到目標域的映射函數,如何在利用跨域信息的同時不泄露用戶隱私等,如何應對上述挑戰是未來的研究重點。
面向大規模實時場景的異質圖推薦:真實的推薦系統往往需要處理超大規模的數據,并且對推薦的實時性有較高的要求,因此很多復雜的推薦模型無法直接使用。大規模實時推薦主要面臨兩方面問題:一方面是模型的輕量化,另一方面是模型的動態更新。目前的推薦算法輕量化和動態更新方法主要適用于二分圖,如何將其應用于異質信息網絡存在挑戰。
基于事件社會網絡(Event-Based Social Network,EBSN)是一種結合了線上網絡和線下網絡的新型社會網絡,近年來得到了越來越多關注,已有許多國內外重要研究機構的研究者們對其進行研究并取得許多研究成果.在EBSN推薦系統中,一個重要任務就是設計出更好、更合理的推薦算法以提高推薦精確度和用戶滿意度,其關鍵在于充分結合EBSN中的各種上下文信息去挖掘用戶、事件和群組的隱藏特征.本文主要對EBSN推薦系統的最新研究進展進行綜述. 首先,概述EBSN的定義、結構、屬性和特征,介紹EBSN推薦系統的基本框架,以及分析EBSN推薦系統與其他推薦系統的區別.其次,對EBSN推薦系統的主要推薦方法和推薦內容進行歸納、總結和對比分析.最后,分析EBSN推薦系統的研究難點及其發展趨勢,并對本文作出總結.
//www.jos.org.cn/jos/ch/reader/view_abstract.aspx?file_no=6145&flag=1
推薦系統旨在為用戶推薦個性化的在線商品或信息, 其廣泛應用于眾多Web場景之中, 來處理海量信息數據所導致的信息過載問題, 以此提升用戶體驗. 鑒于推薦系統強大的實用性, 自20世紀90年代中期以來, 研究者針對其方法與應用兩方面, 進行了大量廣泛的研究. 近年來, 很多工作發現知識圖譜中所蘊含的豐富信息可以有效地解決推薦系統中存在的一系列關鍵問題, 例如數據稀疏、冷啟動、推薦多樣性等. 因此, 本文 針對基于知識圖譜的推薦系統這一領域進行了全面的綜述. 具體地, 首先簡單介紹推薦系統與知識圖譜中的一些基本概念. 隨后, 詳細介紹現有方法如何挖掘知識圖譜不同種類的信息并應用于推薦系統. 此外, 總結了相關的一系列推薦應用場景. 最后, 提出了對基于知識圖譜的推薦系統前景的看法, 并展望了該領域未來的研究方向.