隨著互聯網和信息計算的飛速發展,衍生了海量數據,我們已經進入信息爆炸的時代。網絡中各種信息量的指數型增長導致用戶想要從大量信息中找到自己需要的信息變得越來越困難,信息過載問題日益突出。推薦系統在緩解信息過載問題中起著非常重要的作用,該方法通過研究用戶的興趣偏好進行個性化計算,由系統發現用戶興趣進而引導用戶發現自己的信息需求。目前,推薦系統已經成為產業界和學術界關注、研究的熱點問題,應用領域十分廣泛。在電子商務、會話推薦、文章推薦、智慧醫療等多個領域都有所應用。傳統的推薦算法主要包括基于內容的推薦、協同過濾推薦以及混合推薦。其中,協同過濾推薦是推薦系統中應用最廣泛最成功的技術之一。該方法利用用戶或物品間的相似度以及歷史行為數據對目標用戶進行推薦,因此存在用戶冷啟動和項目冷啟動問題。此外,隨著信息量的急劇增長,傳統協同過濾推薦系統面對數據的快速增長會遇到嚴重的數據稀疏性問題以及可擴展性問題。為了緩解甚至解決這些問題,推薦系統研究人員進行了大量的工作。近年來,為了提高推薦效果、提升用戶滿意度,學者們開始關注推薦系統的多樣性問題以及可解釋性等問題。由于深度學習方法可以通過發現數據中用戶和項目之間的非線性關系從而學習一個有效的特征表示,因此越來越受到推薦系統研究人員的關注。目前的工作主要是利用評分數據、社交網絡信息以及其他領域信息等輔助信息,結合深度學習、數據挖掘等技術提高推薦效果、提升用戶滿意度。對此,本文首先對推薦系統以及傳統推薦算法進行概述,然后重點介紹協同過濾推薦算法的相關工作。包括協同過濾推薦算法的任務、評價指標、常用數據集以及學者們在解決協同過濾算法存在的問題時所做的工作以及努力。最后提出未來的幾個可研究方向。
//jcs.iie.ac.cn/xxaqxb/ch/reader/view_abstract.aspx?file_no=20210502&flag=1
摘要: 推薦系統致力于從海量數據中為用戶尋找并自動推薦有價值的信息和服務,可有效解決信息過載問題,成為大數據時代一種重要的信息技術。但推薦系統的數據稀疏性、冷啟動和可解釋性等問題,仍是制約推薦系統廣泛應用的關鍵技術難點。強化學習是一種交互學習技術,該方法通過與用戶交互并獲得反饋來實時捕捉其興趣漂移,從而動態地建模用戶偏好,可以較好地解決傳統推薦系統面臨的經典關鍵問題。強化學習已成為近年來推薦系統領域的研究熱點。文中從綜述的角度,首先在簡要回顧推薦系統和強化學習的基礎上,分析了強化學習對推薦系統的提升思路,對近年來基于強化學習的推薦研究進行了梳理與總結,并分別對傳統強化學習推薦和深度強化學習推薦的研究情況進行總結;在此基礎上,重點總結了近年來強化學習推薦研究的若干前沿,以及其應用研究情況。最后,對強化學習在推薦系統中應用的未來發展趨勢進行分析與展望。
摘要 近年來,涌現了很多高質量大規模的知識庫,基于知識庫的問答系統(Knowledge Base Question Answering,KBQA)隨著知識庫的發展而得到了快速發展.知識庫問答系統通過對自然語言問句進行理解和解析,進而利用知識庫中的事實來回答自然語言問題,使用戶在不了解知識庫數據結構的情況下快速、精準的得到有價值的知識或答案.本文對知識庫問答系統的研究方法進行了詳細介紹并對目前的研究進展進行了總結,包括基于模板的方法、基于語義解析的方法和基于深度學習的方法.通過對這些研究方法進行對比,指出了各方法中存在的問題和不足,進而對知識庫問答系統所面臨的問題和挑戰進行了總結.
新聞推薦(NR)可以有效緩解新聞信息過載,是當今人們獲取新聞資訊的重要方式,而深度學習(DL)成為近年來促進新聞推薦發展的主流技術,使新聞推薦的效果得到顯著提升,受到研究者們的廣泛關注。主要對基于深度學習的新聞推薦方法研究現狀進行分類梳理和分析歸納。根據對新聞推薦的核心對象——用戶和新聞的建模思路不同,將基于深度學習的新聞推薦方法分為“兩段式”方法、“融合式”方法和“協同式”方法三類。在每類方法中,根據建模過程中的具體子任務或基于的數據組織結構進行更進一步細分,對代表性模型進行分析介紹,評價其優點和局限性等,并詳細總結每類方法的特點和優缺點。另外還介紹了新聞推薦中常用數據集、基線算法和性能評價指標,最后分析展望了該領域未來可能的研究方向及發展趨勢。
深度學習在計算機視覺和語言理解領域取得了驚人的成功,受此影響,推薦研究已經轉向了基于神經網絡的新推薦模型的發明。
近年來,神經網絡推薦模型的發展取得了顯著的進展,由于神經網絡具有強大的表示能力,使得傳統的推薦模型得到了推廣和超越。
在本文中,我們對神經推薦模型進行了系統性回顧,旨在對該領域進行總結,以促進未來的發展。與現有的基于深度學習技術分類法對現有方法進行分類的調研不同,我們從推薦建模的角度對該領域進行了總結,這可能對研究推薦系統的研究者和從業者更有指導意義。
具體來說,我們根據他們用于推薦建模的數據將工作分為三種類型:
協同過濾模型,它利用了用戶-物品交互數據;
內容豐富模型,利用與用戶和物品相關的側面信息,如用戶檔案和物品知識圖譜;
3)上下文豐富模型,它解釋了與互動相關的上下文信息,如時間、地點和過去的互動。
在回顧了每種類型的代表性工作后,我們最后討論了該領域的一些有前途的方向,包括標桿推薦系統、基于圖推理的推薦模型,以及可解釋和公平的社會公益推薦。
//www.zhuanzhi.ai/paper/cbf33028b44f85138520717fd1d72792
由于互聯網的擴散,信息過載在人們的每一個生活中都是一個日益嚴重的問題。與搜索引擎一樣,推薦系統是緩解信息過載問題的有效解決方案,方便用戶尋找所需信息,增加服務提供商的流量和收入。它已經被廣泛應用于電子商務、社交媒體網站、新聞門戶、應用商店、數字圖書館等。它是現代信息系統中最普遍的以用戶為中心的人工智能應用之一。
關于推薦的研究可以追溯到20世紀90年代的[1],在那個年代早期的工作開發了許多基于內容的啟發式和協同過濾(CF)[2]。由于Netflix的挑戰,Matrix Factorization (MF)[3]后來很長一段時間(從2008年到2016年)成為主流推薦模型[4],[5]。然而,因子分解模型的線性性質使其在處理大而復雜的數據時效率較低。復雜的用戶-物品交互,這些物品可能包含復雜的語義(例如,文本和圖像),這需要對它們進行徹底的理解。大約在2010年中期的同一時期,機器學習領域的深度神經網絡(deep neural networks,又稱“深度神經網絡”)興起。(比如深度學習)已經在語音識別、計算機視覺和自然語言處理等領域產生了革命性的變化。深度學習的巨大成功源于神經網絡相當大的表達能力,尤其有利于從具有復雜模式的大數據中學習。這自然為推薦技術的發展帶來了新的機會。毫不奇怪,在過去的幾年中出現了很多關于開發神經網絡方法的推薦系統的工作。在這項工作中,我們的目的是提供一個系統的回顧推薦模型使用神經網絡-稱為“神經推薦模型”。這是當前推薦研究中最熱門的話題,不僅近年來取得了許多令人興奮的進展,而且顯示出了成為下一代推薦系統的技術基礎的潛力。
我們專注于物品推薦的一般任務,即向用戶推薦項目,而忽略了對其他推薦任務的討論,如向一組用戶推薦物品、特定領域推薦(如教育推薦和時尚推薦)。此外,我們專注于利用單個域的數據的工作,而忽略了關于跨域推薦[8]的討論。我們的目標是提供一個單一領域的一般性項目推薦的全面綜述,并幫助青年研究者掌握該領域的主要研究方向。
本次綜述的組織結構如下。在第2節中,我們將回顧使用ID和交互歷史進行建模的協同過濾模型。在第3節中,我們回顧了將用戶和商品的側面信息整合到推薦中的模型,如用戶簡介和社交網絡、商品屬性和知識圖譜。我們將它們稱為內容豐富的模型,它通過集成側信息自然地擴展了CF。在第4節中,我們將回顧解釋上下文信息的模型。上下文數據與每個用戶-項目交互相關聯,例如時間、位置和過去的交互序列。上下文感知模型基于上下文數據進行預測。由于頁面限制,我們主要關注時間信息,這是最常見的上下文數據之一。最后,對研究結果進行了總結,并提出了展望。
圖神經網絡(GNN)是一類基于深度學習的處理圖域信息的方法,它通過將圖廣播操作和深度學習算法結合,可以讓圖的結構信息和頂點屬性信息都參與到學習中,在頂點分類、圖分類、鏈接預測等應用中表現出良好的效果和可解釋性,已成為一種廣泛應用的圖分析方法.然而現有主流的深度學習框架(如Tensorflow、PyTorch等)沒有為圖神經網絡計算提供高效的存儲支持和圖上的消息傳遞支持,這限制了圖神經網絡算法在大規模圖數據上的應用.目前已有諸多工作針對圖結構的數據特點和圖神經網絡的計算特點,探索了大規模圖神經網絡系統的設計和實現方案.本文首先對圖神經網絡的發展進行簡要概述,總結了設計圖神經網絡系統需要面對的挑戰;隨后對目前圖神經網絡系統的工作進行介紹,從系統架構、編程模型、消息傳遞優化、圖分區策略、通信優化等多個方面對系統進行分析;最后使用部分已開源的圖神經網絡系統進行實驗評估,從精確度、性能、擴展性等多個方面驗證這些系統的有效性.
//www.jos.org.cn/jos/ch/reader/view_abstract.aspx?file_no=6311
基于事件社會網絡(Event-Based Social Network,EBSN)是一種結合了線上網絡和線下網絡的新型社會網絡,近年來得到了越來越多關注,已有許多國內外重要研究機構的研究者們對其進行研究并取得許多研究成果.在EBSN推薦系統中,一個重要任務就是設計出更好、更合理的推薦算法以提高推薦精確度和用戶滿意度,其關鍵在于充分結合EBSN中的各種上下文信息去挖掘用戶、事件和群組的隱藏特征.本文主要對EBSN推薦系統的最新研究進展進行綜述. 首先,概述EBSN的定義、結構、屬性和特征,介紹EBSN推薦系統的基本框架,以及分析EBSN推薦系統與其他推薦系統的區別.其次,對EBSN推薦系統的主要推薦方法和推薦內容進行歸納、總結和對比分析.最后,分析EBSN推薦系統的研究難點及其發展趨勢,并對本文作出總結.
//www.jos.org.cn/jos/ch/reader/view_abstract.aspx?file_no=6145&flag=1
數據稀疏和冷啟動是當前推薦系統面臨的兩大挑戰. 以知識圖譜為表現形式的附加信息能夠在某種程度上緩解數據稀疏和冷啟動帶來的負面影響, 進而提高推薦的準確度. 本文綜述了最近提出的應用知識圖譜的推薦方法和系統, 并依據知識圖譜來源與構建方法、推薦系統利用知識圖譜的方式, 提出了應用知識圖譜的推薦方法和系統的分類框架, 進一步分析了本領域的研究難點. 本文還給出了文獻中常用的數據集. 最后討論了未來有價值的研究方向.
//www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200128
推薦系統推薦系統是一種向目標用戶建議可能感興趣物品的軟件工具. 隨著網絡與現實信息的爆炸式增長, 越來越多的在線服務商為用戶提供商品、音樂、電影等(以下統稱為物品)的推薦服務. 推薦系統能夠滿足用戶的個性化需求, 為在線服務商帶來巨大商業價值. 同時, 推薦方法與系統的研究促進了偏好挖掘、大數據處理、決策支持等領域的相關理論和實踐的飛速發展, 其學術價值也引起了廣泛的關注.
推薦系統面臨的重要挑戰主要是數據稀疏性問題和冷啟動問題. 數據稀疏問題指的是相對于數量龐大的用戶和物品, 僅有少量的物品獲得了用戶的評價或者購買, 難以據此獲得相似的用戶或相似的物品, 使得傳統推薦方法失效了. 冷啟動問題指的是系統由于并不知道新加入用戶的歷史行為, 無法給他們推薦物品, 同樣新加入的物品也由于沒有被用戶評價或購買過而無法被針對性的推薦.
推薦系統中通常利用附加信息來解決上述問題, 以提高性能. 附加信息(一般也稱上下文信息)分為顯式信息和隱式信息[1]. 顯式信息是通過諸如物理設備感知、用戶問詢、用戶主動設定等方式獲取的與用戶、物品相關聯的上下文信息. 隱式信息即利用已有數據或周圍環境間接獲取的一些上下文信息, 例如可根據用戶與系統的交互日志獲取時間上下文信息.
近年來, 利用以知識圖譜為表示形式的附加信息的推薦方法受到了學者們的關注. 知識圖譜最初用于提升搜索系統的性能[2], 刻畫了海量實體之間的多種關系, 具有網狀結構, 能夠用于推薦系統中來增強用戶、物品之間聯系的認知與解釋, 從而提高推薦準確度. 本文綜述了2015年~2019年發表在DLRS、RecSys、KDD、CIKM、NIPS、TIST、UMAP、SIGIR等會議和期刊中的利用知識圖譜的推薦方法的文獻, 共23篇. 在利用知識圖譜的推薦系統中, 通常首先將收集到的用戶信息、物品信息、在利用知識圖譜的推薦系統中, 通常首先將收集到的用戶信息、物品信息、用戶歷史行為等數據或者一些相關的外部數據表示成知識圖譜的形式. 然后, 設計推薦算法, 利用知識圖譜生成推薦. 此類推薦系統通常包含知識圖譜構建和利用知識圖譜產生推薦兩個環節. 本文根據這兩個環節中構建知識圖譜數據的不同來源, 以及推薦方法中利用知識圖譜信息的不同形式提出了分類框架, 并據此對相關文獻進行了分類綜述, 詳情請參看本文第三章. 與本文最為相關是文獻[3]. 該文獻綜述了2009年~2017年16篇利用知識圖譜的推薦方法的文獻. 本文在綜述的文章數量上超過了文獻[3]. 此外, 本文提出文獻分類框架能夠更好地覆蓋新提出的方法.
本文第一章介紹了利用知識圖譜的推薦方法的相關背景知識; 第二章對利用知識圖譜的推薦方法文獻進行分類與綜述; 第三章整理了目前常用的推薦系統數據集和知識圖譜數據集; 第四章、第五章分別討論了應用知識圖譜的推薦系統的研究難點與發展前景; 最后, 在第六章中對全文進行了總結.
推薦系統旨在為用戶推薦個性化的在線商品或信息, 其廣泛應用于眾多Web場景之中, 來處理海量信息數據所導致的信息過載問題, 以此提升用戶體驗. 鑒于推薦系統強大的實用性, 自20世紀90年代中期以來, 研究者針對其方法與應用兩方面, 進行了大量廣泛的研究. 近年來, 很多工作發現知識圖譜中所蘊含的豐富信息可以有效地解決推薦系統中存在的一系列關鍵問題, 例如數據稀疏、冷啟動、推薦多樣性等. 因此, 本文 針對基于知識圖譜的推薦系統這一領域進行了全面的綜述. 具體地, 首先簡單介紹推薦系統與知識圖譜中的一些基本概念. 隨后, 詳細介紹現有方法如何挖掘知識圖譜不同種類的信息并應用于推薦系統. 此外, 總結了相關的一系列推薦應用場景. 最后, 提出了對基于知識圖譜的推薦系統前景的看法, 并展望了該領域未來的研究方向.