人工智能是當今最熱門的技術領域之一,也是中國互聯網公司的重要戰略方向。本報告基于對9位來自中國AI科技團隊的產業人士問卷調研,分析了中國AI產業在資源投入、模型發展、數據隱私保護和行業合作等方面的表現,以及面臨的挑戰和機遇。用科學數據證據給讀者提供全面的視角洞察中國AI產業的發展現狀和未來趨勢。
億級資金有望注入,團隊擴容力度加大。根據公司戰略定位和發展重點,在技術研發、算力資源投入、數據采集與標注以及市場推廣與商業化擴展方面存在投入差異。同時, AI人力資源也在不斷擴張,采取多元化的策略來吸引和培養人才。 AI模型新發布可期,復雜數據處理升級。下半年有多個AI模型發布計劃,涵蓋自然語言處理、計算機視覺和跨模態領域。在模型發布中, Transformer架構是主流選擇。數據挑戰、模型優化和商業化仍是AI團隊面臨的瓶頸。雖然大模型在應用場景中擴展,并非模型規模越大越好,也需綜合考慮數據和模型的質量。 數據多樣性、數據合作和數據隱私保護是中國AI公司在數據領域的關鍵關注點。數據多樣性與合作是關鍵,共享數據合作是重要趨勢。圖像和自然語言數據集普及度高,物體檢測數據集應用較少。中國AI公司重視數據安全與隱私保護,采取多層防護措施、動態處理與隱私保護并重,以用戶為中心保護用戶數據。 AI硬件投入將繼續保持強勁的發展勢頭。服務器部署反映算力需求,大部分公司有服務器擴張計劃。不同公司在計算資源的使用量、成本和供應商選擇上存在差異,反映出它們在AI技術發展上的投入和戰略規劃。中國本土公司在半導體領域的發展也不容忽視。 AI商業化需要持續投入和優化,而營銷策略中突出大模型的創新性和應用價值是至關重要的。按交易量費和定制開發費是中國AI科技團隊主要的收費模式,顯示出對需求敏感性和靈活盈利模式的重視。調研結果還揭示了AI服務費用反映了模型復雜性、服務質量和市場競爭的因素,需要綜合評估選擇。 AI的跨行業應用和行業合作是推動技術發展和創新的關鍵。AI應用有廣闊的發展空間,需要各行業積極與AI公司合作推動數字化和智能化轉型,同時加強數據隱私保護。我們認為,未來行業整合、競爭加劇和新興創業公司崛起的可能性較大。
來源:騰訊研究院
近日,針對大模型AI技術發展,騰訊研究院、同濟大學、騰訊云、騰訊新聞基于產學研等多方在AI領域的研究,共同發布了《人機共生——大模型時代的AI十大趨勢觀察》報告,從技術、應用、社會等角度,提出大模型時代的關鍵性趨勢觀察,并帶來了大模型時代AI的十個關鍵詞。
技術趨勢:大語言模型和多模態技術將助力人工智能向AGI發展
AGI(通用人工智能)是一種具有所有人類智能能力的機器,它可以理解、學習、適應和實現任何知識工作。報告顯示,自2010年代初深度學習問世以來,人工智能進入到第三次高潮,而2017年出現的Transformer算法,又將深度學習推向了大模型時代。以ChatGPT為代表的大語言模型,展現出來的推理、思維鏈等能力,讓人類感到驚訝,尤其是GPT4在多種能力測試中達到人類頂級水平,更是讓人類看到了AGI的曙光。
未來真正的AGI可以自然地處理多種類型信息,它需要具有高效的多模態信息處理機制。報告認為,多模態AI不僅能夠處理單一數據類型的任務,而且可以在不同數據類型間建立聯系和融合,為解決復雜問題提供支持,因此多模態AI也將助力人工智能向AGI發展。
報告還強調,多模態AI也將帶來創新應用的藍海,例如多模態AI可以擴展在社交媒體中的實時語音、文字、圖像和視頻的處理能力,為傳統游戲和增強現實/虛擬現實(AR/VR)應用帶來更為豐富和沉浸式體驗。
應用趨勢:AI將給產品交互、企業生態、商業模式等多個領域帶來變革
在應用層面,報告重點提到了AI對產品交互、企業生態、商業模式、個人創作能力等方面的變革。
在產品交互方面,過去人類用鍵盤鼠標與電腦交互,用手指觸屏與手機交互,用喚醒詞與智能音箱交互,但生成式AI讓人類可以用自然語言的方式跟機器對話,機器也可以通過大模型擁有理解人類語言的能力。報告顯示,過去的數次人機交互變革,都帶來了從終端到連接,到各類應用的顛覆式變革,生成式AI也必將帶來產業鏈、價值鏈和生態的重塑。
在商業模式方面,大模型促進了AI的工業化,并且正在重構現有的商業模式,未來將形成模型即服務的MaaS生態。報告顯示,未來的數字化商業將分為大模型基礎設施型企業、垂直行業領域的小模型應用企業,以及更加貼合個人用戶的模型應用和服務。這一生態的建立和發展,將更廣泛地賦能各行業應用,加快社會各領域數字化轉型、智能化發展,帶來全社會的生產效率提升。
此外,垂直領域應用將是大模型的主戰場。隨著生成式人工智能技術的飛速發展,它已經在多個領域展現出全新的商業價值。在中國,諸多行業企業也已經看到生成式AI、大模型可能為企業帶來競爭優勢。金融行業、文化娛樂行業等頭部機構預計會在一年內,在相對成熟的場景中嘗試引入大模型以及生成式AI能力。
與此同時,MaaS服務正助力加速行業大模型落地。騰訊云從產業客戶需求場景出發,基于大模型高性能計算集群和大模型能力,依托騰訊云TI平臺打造模型精選商店,為客戶提供MaaS一站式服務和行業大模型解決方案,全面降低落地門檻,助力客戶構建專屬大模型及智能應用。截至目前,騰訊云已聯合行業頭部企業,為10大行業輸出了超過50個解決方案,提供一整套模型服務工具鏈,幫助企業高效宰、高品質、低成本創建和部署AI應用。
對于個人來講,AI大模型將助力個體成為超級生產者。報告指出,基于生成式AI的新應用快速進化,涌現出許多新型面向個體的生產力應用。在創意制作、文本生成、圖像和視頻工具、學習工具、閱讀工具、市場分析、編程等各個領域快速融入工作流,從信息處理、個性化學習、輔助創作、智能優化等方面協助人類創作,賦能個體成為超級生產者。在大模型的加持下,人工智能正在從“工具”變成“伙伴”,人機關系將進入到下一階段。
社會趨勢:重點審視版權歸屬難題和倫理挑戰
在社會觀察層面,報告重點關注當下受到AI沖擊最為明顯的兩個領域:版權與治理。
傳統的版權制度立足于“思想表達二分法”這一基本原則,即“只保護自然人思想的表達,而不保護自然人的思想本身”。報告指出,在人工智能時代,版權制度如果無法對“人的創造性思想”和“AI模型的獨創性表達”加以有效回應,那么其適用價值將會受到極大影響。
同時,生成式AI也帶來了更加復雜難控的風險,包括對人類未來生存的潛在風險。報告指出,AI時代需要成為一個負責任創新的時代,人們需要建立合理審慎的AI倫理和治理框架,塑造負責任的AI生態,打造人機和諧共生的未來。
其中,生成式AI領域的創新主體需要積極探索技術上和管理上的安全保障措施,為生成式AI的健康發展和安全可控應用構筑起防護欄。
具體內容如下:
本報告以AI商業落地投資價值為研究對象,其中AI商業落地指人工智能技術在各細分行業和領域中的具體落地場景,包括智慧城市、金融、制造、 醫療、零售、互聯網、汽車和泛娛樂等領域中的商業落地場景。AI商業落地投資價值指AI商業落地場景給下游甲方企業帶來的綜合投資價值,本報告從“戰略價值、降本增效和創收創利”三個層面衡量AI商業落地場景為企業帶來的經濟、成本和戰略價值。
基于技術成熟度曲線,人工智能領域中計算機視覺、數據標簽與注釋等成熟度相對較高的技術在現有商業落地場景中應用廣泛;以生成式AI為代表的萌芽期技術具有較大發展潛力,有助于提升AI技術落地的可能性和場景的豐富度。隨著人工智能技術在中國的周期性變化,AI商業落地將迎來新一輪波峰, 技術與產業的融合度及場景應用豐富度將逐步提高。
多智能體強化學習(MARL)是一種廣泛使用的人工智能(AI)技術。然而,當前的研究和應用需要解決其可擴展性,非平穩性,以及可信度的問題。本文旨在回顧MARL的方法和應用,并指出未來十年的研究趨勢和遠景。首先,本文總結了MARL的基本方法和應用場景。其次,本文概述了相應的研究方法及其在實際應用MARL時需要解決的安全性,魯棒性,泛化性,以及倫理約束的局限性。特別地,我們認為,未來十年,可信的MARL將成為熱門的研究主題。此外,我們認為考慮人類互動對于MARL在各種社會中的實際應用至關重要。因此,本文還分析了將MARL應用于人機交互時的挑戰。
1. 引言
由于其在解決序列決策任務中的巨大潛力,強化學習(RL)得到了廣泛的探索[88, 107, 129, 131, 168, 169, 197, 216, 218]。Kaelbling等人在1996年指出[76],RL將在游戲和機器人技術中得到廣泛應用。Mnih等人[130]提出深度強化學習(DRL),將具有推理能力的強化學習和具有代表性能力的深度學習(RL)結合起來,訓練出的智能體在各種雅達利游戲中的表現超過了人類玩家。Silver等人在2007年使用RL解決圍棋游戲[180],并在2016年提出使用深度神經網絡和蒙特卡洛樹搜索的AlphaGo[179]。在機器人技術方面,DRL也取得了如四足運動[92, 233]等突出的發展。最新的ChatGPT在全世界范圍內都是眾所周知的,并且使用了與RL相關的技術。自DRL提出以來的20年間,游戲和機器人技術的研究興趣一直在不斷提高。RL的前瞻性應用總結在[76]中。
在整合人類因素時,我們需要考慮的不僅僅是智能體的協作,還要考慮智能物理信息系統與人類文明的互動。在將MARL應用于人機交互時,我們提出了四個挑戰:由于人類干預而產生的非馬爾可夫性質,人類行為的多樣性,復雜的異質性,以及多人多機的可擴展性。本文與其他相關綜述的區別列在表1中。本文的大綱顯示在圖1中。接下來的這個調查組織如下。在第2部分,我們給出了MARL的相關定義,并總結了典型的研究方法。第3部分展示了MARL的具體應用場景。第4部分總結了可信MARL的定義、相關研究和局限性。在第5部分,我們指出了人類兼容的MARL面臨的挑戰。第6部分對整篇文章進行了總結。
2. 方法
強化學習(RL)智能體旨在通過與環境的嘗試和錯誤交互,最大化總的折扣預期獎勵。馬爾可夫決策過程(MDP)有助于為序列決策定義模型。在多智能體系統(MAS)中,每個智能體都通過與環境的嘗試和錯誤接觸解決序列決策問題。然而,它比單智能體場景更復雜,因為環境返回的下一個狀態和獎勵都基于所有智能體的聯合行動,這使得對于任何智能體來說環境都是非馬爾可夫的。隨機博弈(SG)可以用來模擬多智能體序列決策問題。
**3 多智能體強化學習的應用 **
通過MARL,智能體能夠學習并與彼此溝通,從而實現更有效的任務完成和更好的決策結果。這種方法廣泛應用于工程和科學,例如,智能交通,無人駕駛飛機,智能信息系統,公共衛生和智能醫療診斷,智能制造,金融貿易,網絡安全,智能教育,以及科學研究中的強化學習。
**3.1 智能交通 **
智能交通利用物聯網(IoT)和人工智能等先進技術來提高安全性,提高交通效率,并減少其對環境的負面影響。在基于MARL的智能交通中,我們描述了兩個已知的場景:交通燈控制和自動駕駛,并展示了人類在這些智能系統中的作用。這個應用與強化學習方法之間的對應關系顯示在表2中。
**3.2 無人駕駛飛行器 **
在基于MARL的無人駕駛飛行器(UAVs)應用中,我們描述了三個已知的場景:集群控制[124, 158, 207, 210, 222-224],環境監控[75, 134, 148, 204],以及協同運輸[66, 74, 177]。這個應用與強化學習方法之間的對應關系顯示在表3中。
**3.3 智能信息系統 **
MARL在智能信息系統中具有巨大的應用潛力,包括自然語言處理(NLP)[13, 83, 98, 104, 120, 183, 195, 226],編程生成[26, 104, 178],以及推薦系統[40, 51, 72, 231, 245]。基于SARL的技術已在NLP和編程生成中得到研究,我們將總結這些研究并指出MARL在這些應用中的顯著優點。這個應用與強化學習方法之間的對應關系顯示在表4中。
**3.4 公共衛生和智能醫療診斷 **
MARL在公共衛生和智能醫療診斷中得到了廣泛的探索和應用。例如,MARL可以應用于COVID-19的預測和管理、醫療圖像處理和疾病診斷,以提高疾病預防、診斷和治療的效率和準確性。這個應用與強化學習方法之間的對應關系顯示在表5中。
**3.5 智能制造 **
智能制造是將先進技術(如物聯網、人工智能等)整合到制造過程中,以優化生產過程。對于智能制造,MARL是一種有前景的方法。在智能制造的背景下,MARL可以作為生產調度、車間工業機器人控制、質量控制和設備維護的工具,實現智能高效的生產過程[97]。這個應用與強化學習方法之間的對應關系顯示在表6中。
**3.6 金融交易 **
金融交易是一項挑戰性的活動,需要快速判斷并適應不斷變化的市場條件。過去的單智能體方法和深度學習技術已經無法滿足市場的期望。MARL通過結合各種智能體之間的合作與競爭,為應對金融交易中的困難提供了新的思路。我們從投資組合管理[60, 95, 123, 150, 175]、交易策略優化[79, 143, 156, 157]和風險管理[6, 34, 49]的角度總結了MARL在金融交易中的應用。這個應用與強化學習方法之間的對應關系顯示在表7中。
**3.7 網絡安全 **
網絡安全是當今社會面臨的重要問題,攻擊者利用各種技術和手段侵入計算機系統和網絡,威脅到個人、組織和國家的安全。MARL是一種有前景的方法,可以應用在網絡安全領域,主要應用在入侵檢測[54, 118, 118, 132, 172, 173]和網絡資源優化[103, 135, 145, 186, 190]。這個應用與強化學習方法之間的對應關系顯示在表8中。
**3.8 智能教育 **
智能教育利用物聯網和人工智能將學習過程數字化,并根據特定學生的學習風格和特點提供個性化的學習體驗和支持。傳感器可以用來捕捉學生的學習行為和數據。通信使學生與教師之間以及學生之間的協作學習實現實時互動。人工智能可以用來分析學習行為,提供個性化學習和評價教學。虛擬現實技術使得場景重建、實驗模擬和遠程教學變得更加容易。在基于MARL的智能教育中,我們總結了現有的技術[31, 48, 112, 194]。教育4.0旨在將人工智能技術融入學生自主學習的每個階段,以提高學習過程中的興趣和效果[19, 46, 170]。Tang和Hare[194]創建了一個自適應輔導游戲,讓學生在沒有教師指導的情況下個性化學習。為了優化學生學習,該系統使用Petri網圖結構監控學生在游戲中的進展,使用強化學習智能體適應性地改變系統行為以響應學生表現。然后,他們應用Petri網和層次化強化學習算法,基于上述游戲個性化學生的幫助[48]。該算法可以幫助教師根據學生的需求,為他們在游戲中提供定制的指導和反饋,使他們通過將游戲中的任務分解為幾個階段,逐漸掌握復雜的知識和技能。該算法可以幫助教育工作者為游戲中的學生提供定制的支持和反饋,通過將游戲中的任務分為多個層次,逐漸掌握復雜的知識和技能。[112]和[31]都使用傳感器收集的數據監測學生的學習進度,并使用強化學習技術為學生提供個性化的學習建議。
3.9 科學領域的強化學習
近年來,人工智能在科學領域的應用已經成為熱門話題,人工智能被高度評價為實現科學進步的關鍵工具[127]。強化學習已經在化學、物理和材料研究等領域展示出顯著的科學潛力,尤其在探索未知的物理現象等挑戰中,強化學習被證明是解決這些挑戰的關鍵工具。這個應用和強化學習方法之間的對應關系顯示在表9中。Seo等人[171]利用強化學習來控制KSTAR托卡馬克的前饋??。Degrave等人[22]介紹了一種創新的強化學習方法,使托卡馬克聚變裝置的磁控系統能夠自主學習,從而實現對各種等離子體配置的精確控制,大大減少了設計工作量,是強化學習在聚變領域的開創性應用。Bae等人[5]引入了一種科學多智能體強化學習(SciMARL),用于在湍流模擬中發現壁面模型,大大降低了計算成本,同時復制了關鍵流量,并提供了對湍流模擬的前所未有的能力。強化學習的科學研究提供了更多的可能性,我們相信未來強化學習在科學應用中的范圍將會更廣。
4 展望
盡管多智能體強化學習(MARL)在許多領域都已表現出優越的性能,但一些問題,如安全性、魯棒性和泛化能力,限制了MARL在實際環境中的應用。我們認為,要想最大化地利用未來實踐應用中MARL的優越性,首先需要解決這些問題,并需要考慮到人類社會的道德約束。本節回顧了在四個方面的研究現狀:安全性、魯棒性、泛化能力和道德約束,并討論了未來研究需要解決的差距。
4.1 多智能體強化學習的安全性
隨著多智能體強化學習(MARL)的日益普及,確保這些系統的安全性的需求日益突出。在MARL中,一個智能體的行動可能會對任務或其他參與的智能體造成傷害。因此,開發安全的MARL方法的需求迫在眉睫。為了在MARL中實現安全,一種常見的方法是在訓練過程中添加約束。通過引入安全性約束,可以鼓勵智能體避免可能導致任務失敗或對其他智能體造成傷害的不安全行動。已經有很多關于強化學習安全性的綜述,如[35],[39]和[225]所總結的。然而,目前還沒有關于MARL安全性的系統性綜述,而且關于這個話題的研究相對較少。在本節中,我們給出了在[38]中使用的安全MARL的定義。
4.2 多智能體強化學習的魯棒性
在分類任務中,深度學習的魯棒性已有一系列的研究 [36, 58, 69, 71, 142]。強化學習是一個序列決策問題,其中在一個時間步的錯誤分類并不等同于期望最小的獎勵。在多智能體強化學習(MARL)中,任何智能體的決策失敗都可能導致團隊任務失敗,這使得MARL的魯棒性研究具有挑戰性。此外,MARL在現實世界的應用中面臨各種挑戰,例如環境的不確定性,其他智能體的政策不確定性,以及傳感器噪聲。所有這些因素都可能導致訓練的模型表現不佳或者失敗。因此,提高MARL的魯棒性至關重要,這將有助于確保模型在各種情況下都能穩定可靠地運行。以下是關于魯棒MARL的相關定義。我們使用了[253]和[241]的定義。
4.3 多智能體強化學習的泛化
在MARL領域,泛化涉及到智能體將其在特定環境或場景中學到的知識和技能,無需進行大幅度的修改或重新訓練,就能轉移到新的、多樣的環境或場景中的能力。有幾個調查研究了強化學習的泛化 [87, 201, 225, 247]。在SARL的泛化中,各種技術如領域隨機化[133, 160, 165],因果推理[82, 167, 237],以及元學習[3, 27, 77]已被用來解決泛化問題。然而,與單智能體設置相比,對MARL的泛化研究相對較少。在這方面,我們從兩個角度,即多任務學習和sim2real,提供了相關工作的概述,如圖4所示。
4.4 遵循道德約束的學習
隨著AI技術的不斷發展,考慮AI系統的道德含義變得越來越重要[4]。MARL系統涉及多個智能體的互動,其行為可能對現實世界產生重大影響。因此,確保MARL系統的設計和訓練考慮到道德因素至關重要。我們將有關MARL的道德約束的研究總結為隱私保護、公平性和透明度,如圖5所示。
5. 人機協同多智能體強化學習面臨的挑戰
人機協同物理系統(HCPS)是基于物理系統(CPS)發展起來的,它融合了計算機科學、自動化技術、通信科學等領域[9, 115]。本文第3節總結的MARL應用是HCPS的典型應用。人類被視為HCPS的重要組成部分,因此,MARL算法的設計需要考慮人的因素。除了可擴展性和非平穩性的挑戰之外,HCPS中的MARL面臨著許多額外的挑戰,這是由于人類、物理系統和計算機系統之間的相互作用導致的。
6. 結論
本文綜述了MARL的基本方法,并對MARL在智能交通、無人機、智能信息系統、公共健康與智能醫療診斷、智能制造、金融貿易、網絡安全、智慧教育、科學強化學習等各個領域的相關研究進行了綜述。為了更好地服務于人類社會,有必要發展一個值得信賴的MARL。從安全性、魯棒性、泛化性和倫理約束等角度定義了可信MARL,并總結了這些領域的當前研究和局限性。最后,討論了在MARL中考慮HCPS時面臨的其他挑戰,這對其在人類社會的實際應用至關重要。希望本文能夠對各種研究方法和應用場景進行全面綜述,鼓勵和推動MARL在人類社會中的應用,更好地服務于人類。
幾何機器學習和基于圖的機器學習是當前最熱門的研究課題之一。在過去的一年中,該領域的研究發展迅猛。在本文中,幾何深度學習先驅 Michael Bronstein 和 Petar Veli?kovi? 合作,采訪了多位杰出的領域專家,總結了該領域過去一年中的研究亮點,并對該方向在 2022 年的發展趨勢進行了展望。
本文編譯自//towardsdatascience.com/predictions-and-hopes-for-geometric-graph-ml-in-2022-aa3b8b79f5cc#0b34
作者:Michael Bronstein 牛津大學DeepMind人工智能教授、Twitter圖機器學習負責人
編譯:熊宇軒
01
要點概述
幾何在機器學習中變得越來越重要。 微分幾何和同源場為機器學習研究引入了新的思想,包括利用了對稱性和類似于圖中的曲率的新等變圖神經網絡(GNN)架構,以及在深度學習模型中理解和利用不確定性。
消息傳遞仍然是 GNN 的主導范式。 在 2020 年,研究社區意識到了了消息傳遞 GNN 的不足之處,并尋求這種范式之外的更具表現力的架構。2021 年,很明顯,消息傳遞仍然占據主導地位,因為有的研究工作表明,將 GNN 應用于子圖可以獲得更好的表達能力。
微分方程催生了新的 GNN 架構。NeuralODE 的趨勢擴展到了圖機器學習領域。一些工作說明了如何將 GNN 模型形式化定義為連續微分方程的離散形式。在短期內,這些工作將催生新的可以規避 GNN 中的常見問題(如過平滑和過壓縮)的架構。從長遠來看,我們可能會更好地理解 GNN 的工作原理,以及如何使它們更具表現力和可解釋性。
信號處理、神經科學和物理學領域的舊思想煥發了新生。 許多研究者認為,圖信號處理重新點燃了最近對圖機器學習的興趣,并為該領域提供了第一套分析工具(例如,廣義傅里葉變換和圖卷積)。表征理論等其它經典信號處理和物理學中的基本技術已經在2021年取得了一些重要進展,并仍有很大的潛力。
為復雜系統建模不僅需要圖。 2021 年的諾貝爾物理學獎授予 Giorgio Parisi,以表彰他對復雜系統的研究。雖然,這樣的系統通常可以被基本地抽象為圖。但我們有時必須考慮非成對關系和動態行為等更復雜的結構。2021 年的多項工作討論了動態關系系統,并展示了如何將 GNN 擴展到高階結構(如傳統上在代數拓撲領域處理的細胞和單純復雜結構)。我們可能會看到機器學習更多地采用該領域的其它思想。
在圖機器學習領域中,推理、公理化和泛化的問題仍然是重要的有待解決的問題。 在這一年中,我們看到了受算法推理啟發的 GNN 架構的持續進步,以及在圖結構任務上更魯棒的與分布外泛化(OOD)相關的工作。如今,我們有了與廣義 Bellman-Ford 算法顯式一致的知識圖譜推理器,以及利用分布偏移的顯式因果模型的圖分類器。可以說,這些都是未來具有廣闊前景的更魯棒、更通用的 GNN 的發展方向。在2022年,這其中許多的課題可能將取得很大的進展。
圖在強化學習中越來越流行,但可能還有很大的探索空間。 也許并不令人意外的是,強化學習中存在許多有關圖和對稱性的問題(通常在強化學習智能體的結構中,或在對環境的表征中)。2021 年,有一些研究方向試圖利用這種結構,并取得了不同程度的成功。我們現在對如何在強化學習中利用這些對稱性有了更好的理解(包括在多智能體系統中)。然而,將智能體建模為圖似乎不需要嚴格地使用圖結構。盡管如此,我們相信,圖和幾何賦能的強化學習在 2022 年具有廣闊的發展前景。
AlphaFold 2 是幾何機器學習領域的重要成果,也是結構生物學領域的范式轉變。 20 世紀 70 年代,諾貝爾化學獎得主 Christian Anfinsen 提出了預測蛋白質三維折疊結構的可能性。這是一項非常困難的計算任務,是結構生物學領域的「圣杯」。2021年,DeepMind 的 AlphaFold 2 打破了該問題之前的記錄,取得了讓領域專家們信服的準確率,并得到了廣泛的應用。AlphaFold 2 的核心正是一個基于等變注意力機制的幾何架構。
GNN 及其與 Transformer 模型的融合助力了藥物研發和設計。 實際上,GNN 的起源可以追溯到 20 世紀 90 年代的計算化學工作。因此,分子圖的分析是最流行的 GNN 應用之一,也就不足為奇了。2021 年,這一領域取得了持續的顯著進展,涌現出了數十個新架構和幾項超越對比基準的成果。將 Transformer 應用于圖數據也取得了巨大的成功,它有望模擬 Transformer 架構在自然語言處理領域成功的關鍵之處:能夠跨任務泛化的大型預訓練模型。
人工智能主導的藥物發現技術越來越多地使用了幾何和圖機器學習。 AlphaFold 2 和分子圖神經網絡的成功讓人類距離通過人工智能設計新藥的夢想更近了一步。Alphabet 的新公司 Isomorphic Labs 標志著工業界「壓寶」于這項技術。然而,為了實現這類夢想,對分子間的相互作用建模是必須解決的重要前沿課題。
基于圖的方法也助力了量子機器學習。 對于機器學習領域的大多數專家來說,量子機器學習仍然是一個神器的小眾方向,但隨著量子計算硬件的逐漸普及,它很快就成為了現實。Alphabet X 最近的工作顯示了圖結構歸納偏置在量子機器學習架構中的優勢,他們結合了這兩個貌似不相關的領域。從長遠來看,由于量子物理系統通常擁有豐富而深奧的群對稱性,我們可以將這種性質用于量子結構設計,幾何可能會扮演更重要的角色。
2021 年,幾何和基于圖的機器學習方法出現在一系列備受矚目的應用中
**
**
02
幾何在機器學習中的重要性與日俱增
如果我們必須選擇一個詞,它在 2021 年遍布圖表示學習的幾乎每個領域,毫無疑問,「幾何」一詞將是首選。
Melanie Weber:
「在過去的一年里,我們看到許多經典的幾何思想以新的方式在圖機器學習領域中得以應用」——Melanie Weber,牛津大學數學研究所 Hooke 研究員
Melanie 認為:值得注意的例子包括利用對稱性更高效地學習模型,最優傳輸相關概念的應用,或在表示學習中使用微分幾何中的曲率概念。
最近,人們對理解關系型數據的幾何特性和利用這些信息學習良好的(歐氏或非歐)表征產生了濃厚的興趣[1]。這催生了許多對特定幾何編碼的 GNN 架構。值得注意的例子是雙曲 GNN 模型[2],該模型于 2019 年底作為學習層次化數據的高效表征的工具被首次提出。在過去的一年里,出現了大量的新模型和架構,它們能夠更高效地學習雙曲表征,或者能捕獲更復雜的幾何特征[3, 4]。此外,還有一類工作利用了等變性和對稱性等幾何信息[5]。
圖注:今年,在圖神經網絡領域,我們看到了幾何技術的激增。例如,等變信息傳遞在小分子性質預測、蛋白質折疊等生化應用中起到了關鍵作用。
Melanie 進一步研究了微分幾何,指出它在 2022 年存在許多潛在的應用方向:離散微分幾何(研究圖或單純復形等離散結構的幾何)已被用于分析 GNN。離散曲率概念是表征離散結構局部和整體幾何性質的重要工具。Topping 等人在論文「Understanding over-squashing and bottlenecks on graphs via curvature」中提出了曲率在圖機器學習中的一種重要應用[6],在圖重連的背景下研究離散 Ricci 曲率,作者提出了一種新的方法來緩解 GNN 中的過壓縮效應。未來,離散曲率很可能與圖機器學習中的其它結構和拓撲問題聯系在一起。
Melanie 希望這些課題將在 2022 年繼續影響該領域,被應用于更多的圖機器學習任務。這可能會推動計算方面的進步,從而減輕實現非歐算法的計算挑戰,傳統的針對歐式數據設計的工具很難勝任這些工作。此外,離散曲率等幾何工具的計算成本很高,因此很難將它們集成到大規模應用中。計算技術的進步或專用程序庫的發展可以使相關從業者更容易使用這些幾何思想。
Pim de Haan:
「圖神經網絡設計者越來越重視圖豐富的對稱結構。」——Pim de Haan,阿姆斯特丹大學博士生
傳統上,GNN 采用具有置換不變性的消息傳遞方式,后來的工作利用群與表示理論構造節點置換群表示之間的等變映射。最近,類比于流形的局部對稱性(稱為度規對稱性),我們開始研究由同構子圖產生的圖的局部對稱性。我們發現應該用對稱理論而不是群分析某些圖中的問題,將對稱性整合到神經網絡架構中可以提高某些圖機器學習任務(例如,分子預測)的性能。
圖注:圖機器學習研究者利用圖中豐富的對稱結構。
Pim 預測道:在新的一年里,我希望看到范疇論成為一種廣泛應用于神經網絡的設計語言。這將給我們提供一種形式化的語言來討論和利用比以前更復雜的對稱。特別是,我很高興看到它被用于處理圖的局部和近似對稱,結合點云的幾何和組合結構,并幫助我們研究因果圖的對稱性。”
Francesco Di Giovanni:
「盡管圖是不可微的,但是許多在流形分析中被成功應用的思想正逐漸出現在 GNN 領域中。」——Francesco Di Giovanni,Twitter 機器學習研究員
Francesco 對偏微分方程方法特別感興趣,這種方法最初被用于研究曲面,Francesco 等人用它來處理圖像。他們探索了「圖重連」的思路,「圖重連」指的是對底層鄰接關系的修改,它屬于對幾何流方法的拓展。此外,他們還利用基于邊的曲率的新概念來研究 GNN 中的過壓縮問題,并提出了一種圖重連方法。對于保持和破壞對稱形式的分子,幾何也被認為是將 GNN 應用于分子的關鍵因素。
Francesco 認為,這個領域的研究剛剛興起。圖重連技術將可能在解決消息傳遞的一些主要缺陷方面發揮作用,這些缺陷包括在異類數據集上的性能和處理長距離依賴關系。我們希望能很快彌平在圖上的卷積和流形上的卷積之間的概念上的較大差異,這可能會導致下一代 GNN 的出現。最后,Francesco 很高興看到幾何變分方法進一步揭示了 GNN 內在的動力學,并希望能夠提供更有原則的方法來設計新的 GNN 架構、比較現有的架構。
圖注:Ricci 曲率、幾何流等微分幾何領域的概念被用于圖機器學習,改進 GNN 中的信息流。
Aasa Feragen:
**
**
「人們希望通過微分幾何等數學理論為那些精確的公式中存在非線性幾何的問題給出有理有據的解決方案。」——Aasa Feragen,哥本哈根大學助理教授
Aasa 認為,微分幾何在理解和利用深度學習模型的不確定性方面發揮著基礎性的作用。例如,使用模型不確定性生成數據的幾何表示,揭示在標準歐式表征下仍然十分模糊的生物信息。另一個例子是,利用由局部有向數據編碼的黎曼幾何對結構化的大腦連接的不確定性進行量化。
幾何模型通常用于經過深度預處理的數據,揭示其幾何結構。數據通常是根據原始數據估計的,而原始數據存在誤差和不確定性。Aasa 希望 2022 年有更多工作開始評估原始數據的不確定性對我們直接處理的數據的影響,以及這種不確定性應該如何傳播到模型上。Aasa 希望能夠將測量誤差納入對非歐數據的分析,努力打破統計和深度學習之間的鴻溝。
03
消息傳遞仍然是 GNN 的主導范式
Haggai Maron:
「我希望子圖 GNN 以及相應的重構猜想這一研究方向在新的一年里成果豐碩。」——Haggai Maron,英偉達研究科學家
由于等價于 Weisfeiler-Lehman 測試,圖機器學習領域遭遇到了消息傳遞范式的根本限制。Michael Brostein 在 2021 年預測道:想要繼續發展圖機器學習,就需要脫離 2020 年及之前在占據主導地位的消息傳遞機制。如今,這一預測在一定程度上得以實現。然而,盡管 2021 年已經出現了一些表達能力更強的 GNN 架構,但其中大多數仍然停留在消息傳遞機制的范圍內。
最近,一些研究者使用子圖來提高 GNN 的表達能力。Haggai Maron 曾指出:「子圖 GNN」底層的想法是將圖表示為其子結構的集合,在 Kelly 和 Ulam 在上世紀 60 年代有關圖重建猜想的工作就可以發現這一主題。如今,同樣的思想被用來構造富有表達能力的 GNN,而 GNN 的相關工作反過來又催生了新的、更精細的重構猜想。
04
微分方程催生了新的 GNN 架構
圖注:2021 年,一些研究工作通過離散擴散偏微分方程推導圖神經網絡。
Pierre Vandergheynst:
「這提出了一種新的觀點,讓我們可以使用 GNN 為下游機器學習任務提取有意義的信息,并將關注焦點從支撐信息的域轉移到使用圖作為針對信號的計算的支撐。」——Pierre Vandergheynst,洛桑聯邦理工學院
通過用微分方程表示的物理系統動力學重新構建圖上的學習,是 2021 年的另一個趨勢。正如常微分方程是理解殘差神經網絡的強大工具一樣(「Neural ODEs」被評為 NeurIPS 2019 的最佳論文),偏微分方程可以在圖上建立信息傳播的模型。我們可以通過迭代的數值計算求解這樣的偏微分方程,從而恢復出許多標準的 GNN 架構。此時,我們將圖看作對連續對象的離散化表示:
Pierre 認為,在 2022 年,使用圖作為針對給定數據集執行局部連貫的計算、交換信息的機制,并且關注數據的整體屬性,將成為一種新的趨勢。這將在無監督、零樣本學習領域激發人們的興趣。
05
信號處理、神經科學和物理學領域的舊觀點煥發新生
許多現代的 GNN 方法都起源于信號處理領域。圖信號處理(GSP)之父 Pierre Vandergheynst 從這個角度為圖機器學習方法的發展提供了一個有趣的視角:
圖信號處理對數字信號處理的擴展體現在兩個方面:(1)推廣了支撐信息的域。傳統的數字信號處理定義在低維歐式空間上,圖信號處理將其定義在了復雜得多、但是結構化的對象上。我們可以用圖(例如,網絡、網格曲面)來表示這些對象。(2)使用圖(某種最近鄰),從而拋開結構化域,直接處理一些數據集,表示樣本之間的相似性。這背后的思想是,標簽域繼承了一些可以使用圖定義并通過適當轉換捕獲的規律。因此,圖可以支撐整個數據集上的局部計算。GNN 中的一些有趣的思路可以追溯到這些早先的動機,2021 年有一些亮點工作延續了這一趨勢。 **
**
Pierre Vandergheynst:
「經典線性變換(例如,傅里葉變換、小波變換)提給出了一個具有某些數學特性(例如,平滑信號具有低頻傅里葉系數,分段平滑信號具有稀疏、局部的小波稀疏)的通用潛空間」——Pierre Vandergheynst,洛桑聯邦理工學院
過去,研究者們通過構建線性變換來揭示信號的特性。物理學家在設計基于群作用的不同對稱的等價變換方面尤為領先。這些群作用包括,仿射群上的小波變換、Weyl-Heisenberg 群的線性時頻分析等。關于數學物理中相干態領域的工作提出了一種通用的解決方法:通過使用群表示對函數進行參數化,從而構建某種線性變換。2021 年,一些出色的論文進一步引入了非線性和可學習的參數化函數,賦予了 GNN 對稱性,使它們在物理或化學問題中大放異彩:
圖注:群表示是一種信號處理和物理學領域的傳統工具,使我們可以推導出可以應用于流形的坐標無關的深度學習架構。
Pierre 認為,由于某些應用需求、適應性和可解釋性之間權衡(結構化變換域適應性較差但可解釋性很強,GNN 可以在二者之間取得很好的平衡),構建結構化潛空間的趨勢將會在 2022 年得以延續。
在傳統上,神經科學與信號處理密切相關。事實上,我們通過分析大腦傳遞的電信號來了解動物如何感知其周圍的世界。
Kim Stachenfeld:
「我的研究背景是計算神經科學,我首次在研究中用到圖是因為我希望表示任何動物如何學習結構。」——Kim Stachenfeld,DeepMind 研究科學家
我們可以通過圖這種數學對象來分析任何動物如何表示通過獨立的經驗片段獲取的相關概念,并將其拼接成一個全局連貫的、集成的知識體系。
2021 年,一些研究將神經網絡的局部操作和底層或內在的集合表征相結合。例如,一些有關 GNN 中不變性的工作使 GNN 可以利用圖結構以外的幾何和對稱性。此外,使用圖拉普拉斯特征向量作為圖 Transformer 的位置編碼,使 GNN 可以在不受其約束的條件下,利用關于內在、低維幾何性質的信息。
Kim 對 GNN 在神經科學和更廣闊的領域中的應用感到十分興奮,尤其是在超大規模真實數據上的應用。例如,使用 GNN 預測交通狀況、對復雜物理動力學進行仿真、解決超大規模圖上的問題。將 GNN 用于神經數據分析的工作也紛紛涌現。這些問題對現實世界產生影響,它們要求模型能夠高效擴展并泛化,同時仍然能夠捕獲真正的復雜的動力學。GNN 的優化目標是對結構和表達能力的平衡。
06
對復雜系統建模不僅需要圖
Tina Eliassi-Rad:
「2021 年諾貝爾物理學獎授予了對復雜系統的研究。從根本上說,復雜系統是由實體及其之間的交互組成的。復雜系統通常被表示為復雜網絡,而這為圖機器學習提供了動力。」——Tina Eliassi-Rad,東北大學教授
隨著圖機器學習逐漸成熟,我們需要仔細分析以不同形式體現的系統依賴(例如,子集、時間、空間),通用的數學表征(圖、單純復形、超圖),它們的底層假設。沒有完美的方法可以表示一個復雜系統,檢驗來襲一個系統的數據集時所作的建模決策可能并不一定能遷移到另一個系統上,甚至不能遷移到來自同一系統的另一個數據集上。然而,考慮與我們選擇的數學表示法相關的系統依賴,為圖機器學習指出了新的研究機會。
Pierre Vandergheynst:
圖并不能為所有的復雜系統提供適當的模型,我們需要圖之外的方式。2021 年,一些優秀的論文提出了通過圖的泛化獲取的新的結構化信息域。使用單純復形和代數拓撲的其它思想來構建新的神經網絡在理論和實踐上對 GNN 進行了提升。這一趨勢在 2022 年會延續下去,我們會深入研究通過代數拓撲或微分幾何提供的大量結構化數學對象。
圖注:將圖拓展到胞腔復形或單純復形,可以傳遞更復雜的拓撲消息,從而產生超越 WL 測試表達能力的 GNN 架構。
Cristian Bodanr:
「我們很可能會看到采用更奇特的數學對象,這些數學對象迄今為止還鮮為探索。我相信這些拓撲方法降維分析和理解 GNN 提供一套新的數學工具。」——Cristian Bodnar,劍橋大學博士
Cristian Bodnar 熱衷于代數研究拓撲和圖機器學習之間的聯系。在過去的一年中,單純復形和胞腔復形上的卷積和消息傳遞模型解決了許多 GNN 的缺陷(例如,檢測特定的子結構、捕獲長距離和高階交互、處理高階特征、跳出 WL 測試的層次)。他們在分子相關的問題、軌跡預測和分類等任務中取得了目前最優的結果。
2022 年,Cristian 預計這些方法將會擴展到令人激動的新應用上,例如:計算代數拓撲、鏈接預測、計算機圖形學,等。
Rose Yu:
「我對圖機器學習在學習時空動力學中扮演的角色感到十分興奮。」——Rose Yu,UCSD 助理教授
時空圖是一種重要的復雜網絡系統,它的結構會隨著時間演變。Rose 認為,COVID-19 預測、交通預測、軌跡建模等應用需要捕獲高度結構化的時序數據的復雜動力學。圖機器學習有能力捕獲時間序列、空間依賴之間的交互,以及動力學中的相關性。
2022 年,我們樂見時間序列和動態系統中的思想與圖機器學習融合。希望這些思想將催生新的模型設計、訓練算法,幫助我們更好地理解復雜動態系統的內在機制。圖神經網絡具有置換對稱性(不變性或等變性),對稱性發現是圖表示學習領域中一個被忽視的重要問題。但這種全局對稱性可能從根本上被限制,有一些優秀的工作將圖神經網絡推廣到置換之外的對稱群和局部對稱中。我們希望看到更多關于圖神經網絡對稱性的研究。
參考文獻: [1] M. Bogu?á et al., Network geometry (2021) Nature Reviews Physics 3:114–135. [2] Q. Liu, M. Nickel, D. Kiela, Hyperbolic Graph Neural Networks (2019) NeurIPS. [3] M. Law. Ultrahyperbolic Neural Networks (2021) NeurIPS. [4] Y. Zhang et al., Lorentzian Graph Convolutional Networks (2021) WWW. [5] V. G. Satorras, E. Hoogeboom, M. Welling, E(n) equivariant graph neural networks (2021) ICML.
為了了解人工智能企業的技術崗位設置現狀和技術人才供需,中國軟件行業協會教育與培訓委員會(簡稱“教培委”)研究團隊在2020 年下半年,對數十家不同類型的人工智能企業和開設了人工智能專業的高校進行了走訪調研。本報告將從人工智能行業應用發展現狀、人工智能企業運營模式和人才培養方式、技術崗位設置和技術人才供需等方面展示研究成果。
本報告得到了來自軟件與信息技術服務企業、高校和教育機構的專家們鼎力支持。
文章由斯坦福大學與Google研究組合作撰寫,主要介紹了深度學習領域中各類方法在醫療領域中的應用前景,文章分別從計算機視覺、自然語言處理、強化學習、廣義深度學習方法四個方面進行了闡述。