【導讀】2021年國際萬維網大會The Web Conference(舊稱WWW)將于2021年4月19日-23日線上召開。TheWebConf是中國計算機學會(CCF)推薦的A類國際學術會議,是互聯網技術領域最重要的國際會議之一,由國際萬維網會議委員會(IW3C2)和主辦地地方團隊合作組織,每年召開一次,今年是第30屆會議。本次會議共接收1736篇提交長文,最終錄用357篇,錄用率為20.6%。剛剛最佳論文一系列獎項出爐了!來自華盛頓大學的強化學習在線心理健康應用《 Towards Facilitating Empathic Conversations in Online Mental Health Support: A Reinforcement Learning Approach》獲得最佳論文,臺灣國立交通大學《ConceptGuide: Supporting Online Video Learning with Concept Map-based Recommendation of Learning Path》獲得最佳學生論文!
本屆大會采用ZOOM軟件開展網絡會議。你可以在會議中回顧過去30年的Web技術和行業的變遷,分享最新研究成果,并規劃基于Web技術的未來研究。會議目前公開了三項主題演講,多研究方向介紹,研討會和教程,博士學位會議等環節。會議匯聚了眾多在大數據、人工智能、醫療保健、計算機科學、計算社會科學、公共政策、法律和人權等領域最杰出和最有影響力的研究人員,開發人員,決策者和思想家,他們將討論如何創建未來的Web–即多樣化,中立和平衡的Web,能夠真正實現內容訪問民主化夢想的Web。
詳情可登陸以下會議官網查詢://www2021.thewebconf.org/
「最佳論文獎」(Best Paper Award)
促進在線心理健康支持中的共情對話:一種強化學習方法
作者: Ashish Sharma, Inna W. Lin, Adam S. Miner, David C. Atkins, Tim Althoff
摘要:在線點對點支持平臺使數百萬尋求和提供心理健康支持的人能夠進行對話。如果成功,基于網絡的心理健康對話可以改善獲得治療的機會,并減少全球疾病負擔。心理學家多次證明,同理心,即理解和感受他人情緒和經歷的能力,是在支持性對話中取得積極成果的關鍵因素。然而,最近的研究表明,在在線心理健康平臺上,高度共情的對話非常罕見。
在這篇論文中,我們致力于改善在線心理健康支持對話中的共情。我們引入了一項新的共情改寫任務,旨在將低共情會話職位轉化為高共情。學習這種轉換是具有挑戰性的,需要深刻理解同理心,同時通過文本的流暢性和對話語境的特異性來保持對話質量。在這里,我們提出了PARTNER,一個深度強化學習代理,學習對帖子進行句子級編輯,以增加表達的同理心水平,同時保持對話質量。我們的RL代理利用了一個基于GPT-2 transformer語言模型的策略網絡,該模型完成了生成候選共情句子和在適當位置添加這些句子的雙重任務。在訓練過程中,我們獎勵那些在保持文本流暢性、上下文特異性和多樣性的同時增加共鳴的轉換。通過將自動評估和人類評估相結合,我們證明了PARTNER成功地產生了更多的共情、具體和多樣的反應,并在風格遷移和共情對話生成等相關任務中表現優于NLP方法。我們的工作對促進網絡平臺上的共情對話有直接的影響。
「最佳學生論文獎」(Best Student Paper Award)
ConceptGuide: Supporting Online Video Learning with Concept Map-based Recommendation of Learning Path
人們越來越多地使用YouTube等在線視頻平臺來查找教育視頻,以獲取知識或技能,滿足個人學習需求。然而,大多數現有的視頻平臺都是根據查詢的相關性以通用的排名列表的形式顯示視頻搜索結果。面向關聯的信息顯示設計沒有考慮知識領域的內部結構,可能不適合在線學習者的需求。在本文中,我們提出了ConceptGuide,一個原型系統的學習方向,以支持從無組織的視頻材料臨時在線學習。ConceptGuide的特點是一個計算管道,它對檢索到的YouTube視頻文本進行內容分析,并生成基于概念圖的概念間和視頻間鏈接的視覺推薦,形成供學習者消費的學習路徑結構。我們評估了ConceptGuide,將其設計與YouTube的通用界面在學習經驗和行為方面進行了比較。ConceptuGuide被發現可以提高視頻學習的效率,并以許多建設性的方式幫助學習者探索感興趣的知識。
NAACL 2021(2021 Annual Conference of the North American Chapter of the Association for Computational Linguistics)將于2021年6月6日至11日以在線會議的形式在墨西哥城舉辦。來自羅切斯特大學和騰訊的研究人員《視頻輔助無監督語法歸納》獲得最佳長論文,此外還包括2篇杰出長論文和1篇最佳短論文和2篇杰出短論文。
NAACL為自然語言處理領域的頂級會議之一,旨在為北美以及中美洲和南美洲的計算語言學協會(ACL)的成員總結研究領域重點,組織年度會議,促進區域性的合作交流,從而鼓勵和促進美洲人民和機構加入ACL,并為ACL執行委員會提供有關區域活動的信息來源。
最佳論文評選過程:
這些論文是從NAACL 2021年提交的1797篇論文中選出來的。候選人由高級AC提名,并由最佳論文委員會審查。每個委員會成員對一部分論文進行了排序,PC聯合主席考慮了所有的建議以做出最終決定。特別感謝我們杰出的最佳論文評委會:Isabelle Augenstein, Marco Baroni, Barbara Di Eugenio, Jacob Eisenstein, Hanna Hajishirzi, Omer Levy, Jessy Li, Yang Liu, Chris Quirk和Bonnie Webber。
詳情可登陸以下會議官網查詢:
//2021.naacl.org/blog/best-paper-awards/
「最佳長論文獎」(Best Long Paper)
視頻輔助無監督語法歸納 Video-aided Unsupervised Grammar Induction
Songyang Zhang, Linfeng Song, Lifeng Jin, Kun Xu, Dong Yu and Jiebo Luo
摘要:我們研究了視頻輔助語法歸納法,它從無標記文本和相應的視頻學習一個constituency解析器。現有的多模態語法歸納方法側重于從文本-圖像對中學習句法語法,結果表明靜態圖像信息可以用于語法歸納。然而,視頻提供了更豐富的信息,不僅包括靜態對象,還包括動作和狀態變化,這對引導動詞短語很有用。在本文中,我們從視頻中探索了豐富的特征(例如動作、物體、場景、音頻、人臉、OCR和語音),并以最近的Compound PCFG模型(Kim et al., 2019)為基線。我們進一步提出了一個多模態化合物PCFG模型(MMC-PCFG)來有效地從不同的模態中聚合這些豐富的特征。我們提出的MMC-PCFG進行了端到端的訓練,并在三個基準上(即DiDeMo、YouCook2和MSRVTT)超過了每個單獨的模態和以前最先進的系統,證實了利用視頻信息進行無監督語法歸納的有效性。
地址:
「杰出長論文獎」(Outstanding Long Papers Award)
Unifying Cross-Lingual Semantic Role Labeling with Heterogeneous Linguistic Resources
Simone Conia, Andrea Bacciu and Roberto Navigli
雖然跨語言技術在各種自然語言處理任務中取得了越來越多的成功,但由于每種語言都采用自己的語言形式,例如probank用于英語,AnCora用于西班牙語,pdd - vallex用于捷克語,因此它們在語義角色標記(Semantic Role Labeling, SRL)中的應用受到了很大的限制。在這項工作中,我們解決了這個問題,并提出了一個統一的模型來在不同的語言資源上執行跨語言SRL。我們的模型隱式地學習了跨不同語言的不同形式的高質量映射,而無需訴諸于單詞對齊和/或翻譯技術。我們發現,我們的跨語言系統不僅與當前的技術水平相匹配,而且對于低數據場景也很魯棒。有趣的是,我們的統一模型能夠在一個單一的正向傳遞中注釋一個句子,它所訓練的所有庫存,提供了一個工具來分析和比較不同語言的語言理論。
It's Not Just Size That Matters: Small Language Models Are Also Few-Shot Learners
Timo Schick and Hinrich Schütze
當擴展到數千億參數時,預訓練的語言模型,如GPT-3 (Brown et al., 2020),實現了顯著的少樣本學習性能。然而,訓練和運用這樣的大型模型需要大量的計算,這導致了巨大的碳耗費,使得研究人員和從業人員很難使用它們。我們展示了與GPT-3類似的性能可以通過更“綠色”的語言模型獲得,因為它們的參數計數要小幾個數量級。這是通過將文本輸入轉換為包含任務描述的完形填空問題,并結合基于梯度的優化來實現的;利用未標記的數據提供了進一步的改進。我們確定了用小語言模型成功理解自然語言所需的關鍵因素。
「最佳短論文」(Best Short Paper)
Learning How to Ask: Querying LMs with Mixtures of Soft Prompts Guanghui Qin and Jason Eisner
學習如何提問:使用混合軟提示查詢語言模型
現有的協同過濾(CF)方法大多是基于匹配的思想設計的,即通過使用淺層或深層模型從數據中學習用戶和項目嵌入,試圖捕獲數據中的關聯關聯模式,這樣用戶嵌入就可以通過設計或學習的相似函數與相關的物品嵌入相匹配。然而,推薦作為一種認知而非感知智能任務,不僅需要從數據中進行模式識別和匹配的能力,還需要對數據進行認知推理的能力。在本文中,我們將協同過濾(CF)提升為協同推理(CR),即每個用戶知道推理空間的一部分,并在空間中協作進行推理,以估計彼此的偏好。在技術上,我們提出了一個神經協作推理(NCR)框架來連接學習和推理。具體來說,我們整合了表示學習和邏輯推理的能力,其中表示從感知的角度捕捉數據中的相似模式,而邏輯促進了知情決策的認知推理。然而,一個重要的挑戰是在一個共享的體系結構中架起可微分神經網絡和符號推理的橋梁,以進行優化和推理。為解決這一問題,我們提出了一種模塊化的推理體系結構,將AND(∧)、OR(∨)、NOT(?)等邏輯運算學習為蘊涵推理(→)的神經模塊。這樣,邏輯表達式就可以等效地組織成神經網絡,從而在連續空間中進行邏輯推理和預測。與淺層、深層和推理模型相比,在真實數據集上的實驗驗證了我們的框架的優勢。
【導讀】人工智能頂會CCF-A類會議WWW2021今天論文出結果了,共有357篇論文接受,你的論文中了么
WWW 大會由萬維網發明人、2016 年度圖靈獎獲得者 Tim Berners-Lee 于 1992 年發起并創辦,是互聯網系統與應用領域的頂級學術會議,也被列為《中國計算機學會推薦國際學術會議和期刊目錄》中交叉 / 綜合 / 新興類的 A 類學術會議。
計算語言學國際會議 COLING 2020(The 28th International Conference on Computational Linguistics)是計算語言學和自然語言處理領域的重要國際會議,由ICCL(International Committee on Computational Linguistics)主辦,每兩年舉辦一次,是CCF-B類推薦會議。本屆COLING 2020將于2020年12月8日至13日以在線會議的形式舉辦。COLING 2020共計收到2180篇論文投稿,其中包括2021篇主會投稿、48篇Demo投稿、111篇工業論文投稿,最終有1900余篇論文進入審稿流程。官方Twitter公布了最佳論文。
【導讀】第28屆ACM國際多媒體會議(ACM MM)于2020年10月12日至16日在線舉行。剛剛,包括最佳論文,最佳學生論文,最佳demo, 最佳開源軟件在內的所有多媒體領域大獎都已出爐。
ACM國際多媒體會議(ACM International Conference on Multimedia, 簡稱自1993年首次召開以來,ACMMM每年召開一次,已經成為多媒體領域頂級會議,也是中國計算機學會推薦的A類國際學術。會議熱門方向有大規模圖像視頻分析、社會媒體研究、多模態人機交互、計算視覺、計算圖像等等。
最佳論文
標題:PiRhDy: Learning Pitch-, Rhythm-, and Dynamics-aware Embeddings for Symbolic Music (學習考慮音高、節奏和動態的符號音樂嵌入)
作者:Hongru Liang, Wenqiang Lei, Paul Yaozhu Chan, Zhenglu Yang, Maosong Sun, Tat-Seng Chua
摘要:目前,確定性嵌入仍然是計算音樂學中符號音樂深度學習的基本挑戰之一。與自然語言類似,音樂可以被建模為token序列,這促使大多數現有的解決方案探索利用文本嵌入模型來構建音樂嵌入。然而,音樂與自然語言有兩個關鍵的區別:(1)音樂token是多面性的,它包含了音高、節奏和動態信息;(2)音樂上下文是二維的——每個音樂token都依賴于旋律上下文和和聲上下文。在這項工作中,我們提供了一個全面的解決方案,方案包含一個名為PiRhDy的新框架,它無縫地集成了音高、節奏和動態信息。PiRhDy采用一種層次化的策略,它可分解為兩個步驟: (1) token(即音符事件)建模,分開表示音高、節奏和動態,并將它們集成為單個token; (2)上下文建模,利用旋律和和聲知識訓練token嵌入。我們對PiRhDy的各組成部分和子策略進行了深入研究,并在三個下游任務中進一步驗證了嵌入的效果——旋律完成、伴奏建議和類型分類。研究結果表明PiRhDy是符號音樂神經方法的重要進展,也展現出PiRhDy作為廣泛的符號音樂應用預訓練模型的潛力。
論文地址: //dl.acm.org/doi/abs/10.1145/3394171.3414032
最佳學生論文
標題:Learning from the Past: Meta-Continual Learning with Knowledge Embedding for Jointly Sketch, Cartoon, and Caricature Face Recognition(從過去學習: 面向素描、卡通和漫畫人臉聯合識別的知識嵌入元持續學習)
作者: Wenbo Zheng, Lan Yan, Feiyue Wang, Chao Gou
摘要:本文面向一個從不同模態學習的挑戰性任務,解決了針對抽象素描、卡通、漫畫和真實照片的人臉聯合識別問題。由于抽象人臉的顯著差異,建立視覺模型來識別來自這些模式的數據是一項極具挑戰性的工作。我們提出了一個新的框架,稱為知識嵌入元持續學習,以解決素描,卡通和漫畫的人臉聯合識別任務。特別地,我們首先提出了一個深度關系網絡來捕獲和記憶不同樣本之間的關系。其次,我們展示了知識圖的構建,它將圖像和標簽聯系起來,作為元學習者的指導。然后,我們設計了一個知識嵌入機制,以納入知識表示到我們的網絡。最后,為了減輕災難性遺忘,我們使用元連續模型,更新我們的集成模型,提高其預測精度。使用這種元連續模型,我們的網絡可以從過去學習。最后的分類是我們的網絡通過學習比較樣本的特征而獲得的。實驗結果表明,與其他先進的方法相比,我們的方法獲得了更高的性能。
論文地址:
【導讀】CCF A類會議,國際萬維網大會WWW 2020(International World Wide Web Conference)于2020年4月20日至24日在中國臺灣舉行。碰到疫情,WWW采用在線舉行。剛剛最佳論文一系列獎項出爐了!來自俄亥俄州立大學的開放意圖抽取《 Open Intent Extraction from Natural Language Interactions》獲得最佳論文,北京郵電大學的移動App占位《Mobile App Squatting 》獲得最佳學生論文!
「最佳論文獎」(Best Paper Award)
自然語言交互的開放意圖提取 Open Intent Extraction from Natural Language Interactions
作者: Nikhita Vedula , Nedim Lipka , Pranav Maneriker , Srinivasan Parthasarathy Authors Info & Affiliations
摘要:準確地從用戶的書面或口頭語言中發現他們的意圖在自然語言理解和自動對話響應中扮演著重要的角色。大多數現有的研究將其建模為每個話語都有一個意圖標簽的分類任務,將用戶的話語從一組已知的類別中分組為一個單一的意圖類型。在此基礎上,我們定義并研究了公開意圖發現的新問題。它涉及到從文本話語中發現一個或多個通用的意圖類型,這些類型可能在訓練中沒有遇到。我們提出了一種新領域無關的方法OPINE,它將問題表述為開放世界環境下的一個序列標記任務。它在雙向LSTM上使用CRF來以一致的格式提取意圖,受意圖標簽標簽之間的約束。我們用了一個多頭自注意力機制來有效地學習遠處單詞之間的依賴關系。我們進一步使用對抗性訓練來提高性能,并在不同的領域強有力地適應我們的模型。最后,我們策劃并計劃發布一個開放的意圖注釋數據集,包含25K個跨越不同領域的真實話語。大量的實驗表明,我們的方法優于最先進的基線5-15%的F1得分點。我們還演示了OPINE在識別多個不同的域意圖方面的有效性,每個域的訓練示例有限(也可以為零)。
//dl.acm.org/doi/10.1145/3366423.3380268
「最佳學生論文獎」(Best Student Paper Award)
移動App占位 Mobile App Squatting
Authors: Yangyu Hu , Haoyu Wang , Ren He , Li Li , Gareth Tyson , Ignacio Castro , Yao Guo , Lei Wu , Guoai Xu
域名占用是攻擊者模仿流行域名注冊的一種對抗策略,已經被觀察了幾十年。然而,越來越多的證據表明,這種攻擊方式已經蔓延到其他領域。在這篇文章中,我們探討了占用攻擊在移動應用生態系統中的存在。在“App Squatting”中,攻擊者發布的帶有標識符(如App名稱或包名)的應用,與流行應用或知名互聯網品牌的應用混淆不清。本文首次對app占用進行了深入的測量研究,揭示了app占位的流行及其意義。我們首先確定了app squatters常用的11種變形方式,并提出了一種名為“AppCrazy”的app標識符自動生成工具。我們將AppCrazy應用到谷歌Play中最受歡迎的500個應用中,生成了224,322個變形關鍵字,然后我們將這些變形關鍵字用于測試流行市場上的app非法占位者。通過這個,我們確認了問題的規模,確定了10553個占用應用程序(平均每個合法應用程序超過20個占位程序)。我們的調查顯示,超過51%的非法占用應用程序是惡意的,其中一些非常受歡迎(高達1000萬次下載)。同時,我們也發現移動應用市場在識別和消除非法占用應用方面并不成功。我們的發現表明了識別和防止濫用app的緊迫性。為此,我們已經公開發布了所有識別出的占位應用程序,以及我們的工具AppCrazy。
【導讀】國際萬維網大會(The Web Conference,簡稱WWW會議)是由國際萬維網會議委員會發起主辦的國際頂級學術會議,創辦于1994年,每年舉辦一屆,是CCF-A類會議。WWW 2020將于2020年4月20日至4月24日在中國臺灣臺北舉行。由于疫情影響,會議在線上舉行。本屆會議共收到了1129篇長文投稿,錄用217篇長文,錄用率為19.2%。上周專知小編整理了WWW 2020 推薦系統相關論文-part2,這期小編繼續為大家奉上WWW 2020六篇推薦系統相關論文-part3 供參考——上下文感知推薦、雙邊公平推薦、MetaSelector、視覺主題推薦、社交影響力。 WWW2020RS_Part2、WWW2020RS_Part1
1. Eficient Non-Sampling Factorization Machines for Optimal Context-Aware Recommendation
作者:Chong Chen, Min Zhang, Weizhi Ma, Yiqun Liu, and Shaoping Ma
摘要:為了提供更準確的推薦,在對用戶項目交互進行建模之外考慮上下文特征已成為一個熱門話題。具有負采樣的因子分解機(FM)是一種流行的上下文感知推薦解決方案。然而,由于采樣可能丟失重要信息,并且在實際應用中通常會導致非最優性能,因此該算法的魯棒性不強。最近的一些努力通過使用深度學習框架建模高階特征交互增強了FM的性能。而他們要么只關注評分預測任務,要么通常采用負采樣策略來優化排名效果。由于采樣的巨大的波動,我們有理由認為這些基于采樣的FM方法對于上下文感知推薦仍然不是最佳的。在本文中,我們提出在不進行采樣的情況下學習FM,以有助于上下文感知推薦??的排名任務。盡管這種方法效率很高,但這種非采樣策略對模型的學習效率提出了很大的挑戰。因此,我們進一步設計了一種新的理想框架--有效非采樣樣因子分解機(ENSFM)。ENSFM不僅無縫連接了FM和矩陣分解(MF)之間的關系,而且通過新穎的記憶策略解決了具有挑戰性的效率問題。通過在三個真實的公共數據集上的大量實驗表明:1)我們提出的ENSFM的性能一致且顯著優于現有的上下文感知Top-K推薦方法,2)ENSFM在訓練效率上具有顯著的優勢,使其更適用于實際的大系統。此外,實驗結果表明,對于Top-K推薦任務,合適的學習方法比先進的神經網絡結構更為重要。
網址:
//www.thuir.cn/group/~mzhang/publications/TheWebConf2020-Chenchong.pdf
代碼鏈接:
2. FairRec: Two-Sided Fairness for Personalized Recommendations in Two-Sided Platforms
作者:Gourab K Patro, Arpita Biswas, Niloy Ganguly, Krishna P. Gummadi and Abhijnan Chakraborty
摘要:我們在雙邊在線平臺的背景下調查公平推薦(fair recommendation )問題,該平臺由一邊的客戶和另一邊的生產商組成。這些平臺推薦服務的傳統方法側重于根據個人客戶的個性化偏好定制結果,以實現客戶滿意度的最大化。然而,我們的調查顯示,這種以客戶為中心的設計可能會導致生產商之間曝光量的不公平分配,這可能會對他們的利益造成不利影響。另一方面,以生產商為中心的設計可能會對客戶不公平。因此,我們考慮了客戶和生產商之間的公平問題。我們的方法將公平推薦問題映射為一個公平分配不可分割商品問題的新穎映射。我們提出的FairRec算法可確保至少為大多數生產商提供Maximin Share(MMS)的曝光量,并為每個客戶提供多達Envy-Free(EF1)的公平性。對多個真實世界數據集的廣泛評估顯示,FairRec在確保雙面公平性的同時,在總體推薦質量方面造成了邊際損失的有效性。
網址:
3. MetaSelector: Meta-Learning for Recommendation with User-Level Adaptive Model Selection
作者:Mi Luo, Fei Chen, Pengxiang Cheng, Zhenhua Dong, Xiuqiang He, Jiashi Feng and Zhenguo Li
摘要:推薦系統通常面對包含高度個性化用戶歷史數據的異構數據集,在這些數據集中,沒有哪個模型可以為每個用戶提供最佳建議。我們在公共和私有數據集上都觀察到了這種普遍存在的現象,并解決了模型選擇問題,以追求對每個用戶的推薦質量的優化。我們提出了一個元學習框架來促進推薦系統中用戶級的自適應模型選擇。在此框架中,我們將使用來自所有用戶的數據來訓練推薦者集合,然后通過元學習對模型選擇器進行訓練,以使用用戶特定的歷史數據為每個用戶選擇最佳的單個模型。我們在兩個公共數據集和一個真實的生產數據集上進行了廣泛的實驗,證明了我們的框架在AUC和LogLoss方面比單一的模型基線和樣本級模型選擇器都有改進。特別是,當這些改進部署在在線推薦系統中時,可能會帶來巨大的利潤收益。
網址:
4. Recommending Themes for Ad Creative Design via Visual-Linguistic Representations
作者:Yichao Zhou, Shaunak Mishra, Manisha Verma, Narayan Bhamidipati and Wei Wang
摘要:在線廣告行業中經常需要更新廣告創意,即用于吸引在線用戶進入品牌的圖像和文字。進行此類更新,是為了減少在線用戶中廣告疲勞的可能性,并將其他成功的廣告加入到相關產品類別中。對于創意策略師來說,給定一個品牌,為一個新的廣告想出主題是一個費時費力的過程。創意策略師來通常從過去廣告活動中使用的圖像和文字以及有關品牌的知識中汲取靈感。為了在過去的廣告活動中通過此類多模態信息自動推斷廣告主題,我們為廣告創意策略師提出了主題(關鍵詞)推薦系統。主題推薦器基于視覺問答(VQA)任務的聚合結果,該任務提取以下內容:(i)廣告圖像,(ii)與廣告關聯的文字以及廣告中品牌的Wikipedia頁面,(iii)有關廣告的問題。我們利用基于transformer的跨模態編碼器來為VQA任務訓練視覺語言表示。我們沿著分類和排序的思路研究了VQA任務的兩個公式;通過在公共數據集上的實驗,表明跨模態表示顯著地提高了分類準確率和排序精準-召回指標。與單獨的圖像和文本表示相比,跨模式表示顯示出更好的性能。此外,與僅使用文本或視覺信息相比,多模態信息的使用表現出顯著提升。
網址:
5. The Structure of Social Influence in Recommender Networks
作者:Pantelis P. Analytis, Daniel Barkoczi, Philipp Lorenz-Spreen and Stefan M. Herzog
摘要:人們在品味(taste)上影響他人意見的能力各不相同-既包括離線與在線推薦系統。這些驚人差異背后的機制是什么?使用加權k最近鄰算法(k-nn)表示一系列社會學習策略,我們利用網絡科學的方法展示了k-nn算法如何在六個現實世界的品味領域中引發社會影響力網絡。我們給出了三個新的結果,分別適用于離線建議獲取和在線推薦器設置。首先,有影響力的個人具有主流品味,與其他人的品味相似性分散度很高。其次,個人或算法咨詢的人越少(即k越低),或者對其他更相似的人的意見給予的權重越大,具有實質性影響的人的群體就越小。第三,對部署k-nn算法后產生的影響網絡是分層組織的。我們的結果為通信和網絡科學中的經典實證發現提供了新的線索,有助于提高對線下和在線上的社會影響的理解。
網址:
6. Latent Linear Critiquing for Conversational Recommender Systems
作者:PKai Luo, Scott Sanner, Ga Wu, Hanze Li and Hojin Yang
摘要:批判(Critiquing)是一種用于會話推薦的方法,可根據用戶的偏好反饋迭代地調整建議。在該設置中,迭代地向用戶提供該項目的項目推薦和屬性描述;用戶可以接受該推薦,或者批判項目描述中的屬性以生成新的推薦。之前的批判方法主要基于顯式約束和基于實用程序的方法來修改推薦(評判的項目屬性)。在這篇文章中,我們回顧了基于潛在嵌入和主觀項目描述(即來自用戶評論的關鍵詞)的推薦方法時代的批判方法。主要兩個關鍵的研究問題:(1)如何將關鍵詞批判與用戶偏好嵌入一起嵌入以更新推薦,(2)如何調節多步驟批判性反饋的強度,其中批判性反饋不一定是獨立的,也不一定是同等重要的。為了解決(1),我們構建了一個現有的最先進的線性嵌入推薦算法,以使基于評論的關鍵詞屬性與用戶偏好嵌入保持一致。為了解決(2),我們利用嵌入和推薦預測的線性結構來建立一個基于線性規劃(LP)的優化問題,以確定納入批評反饋的最優權重。我們在兩個包含模擬用戶評論的推薦數據集上評估提出的框架。與對批判反饋進行平均的標準方法相比,實驗結果表明,我們的方法減少了找到滿意項目所需的交互次數,并提高了總體成功率。
網址:
報告主題: 信息檢索
報告摘要: 信息檢索是用戶進行信息查詢和獲取的主要方式,是查找信息的方法和手段。信息按一定的方式進行加工、整理、組織并存儲起來,再根據信息用戶特定的需要將相關信息準確的查找出來的過程。又稱信息的存儲于檢索。
邀請嘉賓: 任昭春,博士,山東大學教授,博士生導師。2016年10月在荷蘭阿姆斯特丹大學取得博士學位;2016年至2017年在倫敦大學學院工作,2017年至2019年在京東數據科學實驗室擔任算法科學家。任昭春主要從事信息檢索和自然語言處理方面的研究,特別關注于社交媒體內容分析,搜索多樣性,問答和對話系統,以及可解釋性推薦系統等研究問題,目前已在計算機領域各個國際頂級會議和期刊上共發表60余篇論文,獲得信息檢索領域國際頂級會議WSDM2018最佳學生論文獎和CIKM2017最佳長論文提名獎;應邀擔任信息檢索領域和自然語言處理領域多項頂級會議程序委員會委員和頂級期刊審稿人。同時任昭春在信息檢索領域一直擔任多項會議和期刊的組織服務工作。