亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

移動設備的迅速普及以及移動應用和服務的日益普及,對移動和無線網絡基礎設施提出了前所未有的要求。即將到來的5G系統正在不斷發展,以支持爆炸式的移動流量、實時提取細粒度分析和敏捷管理網絡資源,從而最大限度地提高用戶體驗。隨著移動環境日益復雜、異構和演進,完成這些任務是具有挑戰性的。一個潛在的解決方案是求助于先進的機器學習技術,以幫助管理數據量和算法驅動的應用的增長。最近深度學習的成功為解決這一領域的問題提供了強大的新工具。在本文中,我們通過對這兩個領域的交叉研究的全面調研,彌合了深度學習和移動和無線網絡研究之間的差距。我們首先簡要介紹深度學習技術的基本背景和最新進展,以及在網絡中的潛在應用。然后,我們討論了幾種有助于在移動系統上高效部署深度學習的技術和平臺。隨后,我們對基于深度學習的移動和無線網絡研究進行了百科全書式的回顧,并將其劃分為不同的領域。根據我們的經驗,我們討論了如何根據移動環境定制深度學習。我們通過明確當前的挑戰和打開未來的研究方向來完成這項調研。

與互聯網連接的移動設備正滲透到個人生活、工作和娛樂的方方面面。越來越多的智能手機和越來越多樣化的應用程序的出現引發了移動數據流量的激增。事實上,最新的行業預測表明,到2021年,全球每年的IP流量消耗將達到3.3 zettabytes (1015 MB),同年智能手機流量將超過PC流量[1]。鑒于用戶偏好向無線連接的轉變,當前的移動基礎設施面臨著巨大的容量需求。為了應對這一日益增長的需求,早期的努力建議靈活地提供資源[2],并分配地解決移動性管理[3]。但從長遠來看,互聯網服務提供商(isp)必須開發智能的異構架構和工具,以衍生第5代移動系統(5G),并逐步滿足更嚴格的終端用戶應用需求[4],[5]。

移動網絡結構的日益多樣化和復雜性使得對眾多網絡要素的監控和管理變得非常困難。因此,在未來的移動網絡中嵌入多用途的機器智能正引起空前的研究興趣。這一趨勢反映在基于機器學習(ML)的問題解決方案中,從無線電訪問技術(RAT)選擇[8]到惡意軟件檢測[9],以及支持機器學習實踐的網絡系統的開發(如[10],[11])。ML允許系統地從交通數據中挖掘有價值的信息,并自動發現相關關系,否則人類專家將無法提取這些相關關系。深度學習作為機器學習的旗艦,在計算機視覺[13]和自然語言處理(NLP)[14]等領域取得了令人矚目的成績。網絡研究人員也開始認識到深度學習的力量和重要性,并正在探索其解決特定于移動網絡領域[15]、[16]問題的潛力。

將深度學習嵌入5G移動和無線網絡是有充分理由的。特別是,移動環境產生的數據越來越異構,因為這些數據通常從不同的來源收集,具有不同的格式,并表現出復雜的相關性[17]。因此,對于傳統的機器學習工具(如淺神經網絡)來說,一系列特定的問題變得過于困難或不切實際。這是因為(i)如果提供更多的數據[18],它們的性能不會提高;(ii)它們無法處理控制問題[19]中的高維度狀態/操作空間。相比之下,大數據促進了深度學習的性能,因為它消除了領域專業知識,而使用層次特征提取。本質上,這意味著可以高效地提取信息,并且可以從數據中獲得越來越抽象的相關性,同時減少預處理工作。基于圖形處理單元(GPU)的并行計算進一步使深度學習在毫秒內做出推斷。這有助于提高網絡分析和管理的準確性和及時性,克服了傳統數學技術(如凸優化、博弈論、元啟發式)的運行時間限制。

盡管移動網絡領域對深度學習的興趣日益增長,但現有的貢獻分散在不同的研究領域,缺乏全面的綜述。這篇文章填補了深度學習和移動和無線網絡之間的空白,通過呈現位于這兩個領域之間的交叉點的最新研究調研。除了回顧最相關的文獻,我們還討論了各種深度學習架構的關鍵利弊,并概述了深度學習模型選擇策略,以解決移動網絡問題。我們進一步研究了針對單個移動網絡任務定制深度學習的方法,以在復雜環境中獲得最佳性能。我們總結了這篇論文,指出了未來的研究方向和重要的問題,仍然沒有解決和值得追求的深度神經網絡。我們的最終目標是為打算使用深度學習來解決感興趣的問題的網絡研究者和實踐者提供一個明確的指南。

本綜述的目的是在移動網絡領域提供最先進的深度學習實踐的全面觀點。通過這一點,我們旨在回答以下關鍵問題:

  1. 為什么深度學習在解決移動網絡問題上很有前景?
  2. 與移動和無線網絡相關的前沿深度學習模型有哪些?
  3. 深度學習在移動網絡領域最新的成功應用有哪些?
  4. 研究人員如何針對特定的移動網絡問題定制深度學習?
  5. 哪些是最重要且最有前景的值得進一步研究的方向?

我們之前提到的研究論文和書籍只能部分回答這些問題。這篇文章超越了之前的這些工作,特別關注深度學習和移動網絡之間的交叉。我們涵蓋了一系列神經網絡(NN)結構,這些結構越來越重要,在早期教程中沒有明確討論,例如[77]。這包括自動編碼器和生成式對抗網絡。與這些現有的教程不同,我們還回顧了用于部署和訓練神經網絡的開源庫,一系列優化算法,以及在大量移動設備上并行化神經網絡模型和訓練。我們還會調研其他相關綜述中沒有涉及的應用,包括流量/用戶分析、安全和隱私、移動健康等。雖然我們的主要范圍仍然是移動網絡領域,但為了完整起見,我們也討論了深度學習在無線網絡中的應用,并確定了與這些領域密切相關的新興應用領域。我們區分了移動網絡和無線網絡,移動網絡指的是設備是便攜式的、電池供電的、潛在的可穿戴的,并且經常連接到蜂窩基礎設施;無線網絡指的是設備大多是固定的,是分布式基礎設施(包括wlan和WSNs)的一部分,并服務于單個應用。總的來說,我們的論文從以下幾個方面區別于之前的綜述:

(i) 我們特別關注深度學習在移動網絡分析和管理中的應用,而不是廣泛討論深度學習方法(如[20]、[21])或圍繞單個應用領域,如特定平臺[17]的移動大數據分析

(ii) 我們從移動網絡的角度討論前沿的深度學習技術(如[78],[79]),重點關注它們在該領域的適用性,而較少關注可能過時的傳統深度學習模型

(iii) 我們分析現有的非聯網問題與移動網絡特有問題之間的相似性;基于此分析,我們提出了最佳深度學習架構選擇策略和適應方法,從而利用移動網絡的特點進行分析和管理任務

據我們所知,這是第一次從深度學習的角度共同回顧移動網絡分析和管理。我們還首次提供了深度學習如何針對移動網絡問題的見解。

深度學習驅動的移動和無線網絡

付費5元查看完整內容

相關內容

 機器學習的一個分支,它基于試圖使用包含復雜結構或由多重非線性變換構成的多個處理層對數據進行高層抽象的一系列算法。

知識薈萃

精品入門和進階教程、論文和代碼整理等

更多

查看相關VIP內容、論文、資訊等

【導讀】推薦系統是現在習以為常的應用,如何融入元學習方法來解決推薦系統的冷啟動或小數據場景是個有趣的問題。上海交大最新《推薦系統中的深度元學習》綜述,有40頁pdf涵蓋135篇文獻,全面地概述了當前基于深度元學習的推薦方法。針對推薦場景、元學習技術和元知識表示,提出了一種分類方法,為基于元學習的推薦方法提供了設計空間。值得關注!

作為信息過濾技術,基于深度神經網絡的推薦系統近年來取得了很大的成功。然而,由于從頭開始的模型訓練需要足夠的數據,基于深度學習的推薦方法仍然面臨數據不足和計算效率低下的瓶頸。元學習作為一種新興的學習模式,學習如何提高算法的學習效率和泛化能力,在解決數據稀疏問題方面顯示出了其優勢。最近,越來越多的基于深度元學習的推薦系統的研究出現了,以提高在可用數據有限的推薦場景下的性能,例如用戶冷啟動和項目冷啟動。因此,本研究及時全面地概述了當前基于深度元學習的推薦方法。針對推薦場景、元學習技術和元知識表示,提出了一種分類方法,為基于元學習的推薦方法提供了設計空間。對于每個推薦場景,我們進一步討論了現有方法如何應用元學習來提高推薦模型的泛化能力的技術細節。最后,我們指出了當前研究的局限性,并指出了未來研究的方向。

//www.zhuanzhi.ai/paper/6cff1ae05b9c005089acf0838b5fa0a6

近年來,推薦系統作為緩解信息過載的過濾系統被廣泛應用于電子商務、娛樂服務、新聞等各種網絡應用。推薦系統通過在大量的候選物品中提出個性化的建議,在改善用戶體驗和增加在線平臺吸引力方面取得了巨大的成功。隨著數據驅動的機器學習算法[3,90],特別是基于深度學習的方法[9,32,121]的發展,該領域的學術和行業研究在準確性、多樣性、可解釋性等方面極大地提高了推薦系統的性能。

由于表達表示學習能力能夠從足夠的數據中發現隱藏的依賴關系,基于深度學習的方法在當代推薦模型中被大量引入[26,121]。通過利用大量具有不同數據結構的訓練實例(例如,交互對[121]、序列[20]和圖形[26]),具有深度神經結構的推薦模型通常被設計用于有效捕獲非線性和非微不足道的用戶/物品關系。然而,傳統的基于深度學習的推薦模型通常是基于預定義的學習算法,用足夠的數據從頭開始訓練。例如,常規監督學習范式通常使用從所有用戶收集的交互來訓練一個統一的推薦模型,并基于學習到的特征表示對未看到的交互進行推薦。這種基于深度學習的方法通常需要大量的數據和計算。換句話說,基于深度學習的推薦系統的性能很大程度上依賴于大量訓練數據的可用性和足夠的計算量。在實際的推薦應用中,數據的收集主要來源于用戶在訪問網絡平臺過程中觀察到的用戶互動。存在可用用戶交互數據稀疏(如冷啟動推薦)和模型訓練計算受限(如在線推薦)的推薦場景。因此,數據不足和計算效率低下的問題成為基于深度學習的推薦模型的瓶頸。

最近,元學習提供了一種很有吸引力的學習范式,它針對數據和計算的不足,著重加強機器學習方法的泛化能力[36,98]。元學習的核心思想是從先前的多任務學習過程中獲得關于高效任務學習的先驗知識(即元知識)。元知識可以促進新任務的快速學習,在看不見的任務上具有良好的泛化性能。在這里,任務通常指屬于同一類或具有相同屬性的一組實例,涉及其上的單個學習過程。與提高深度學習模型的表征學習能力不同,元學習側重于學習更好的學習策略來替代固定的學習算法,被稱為學習到學習的概念。由于元學習技術在對看不見的任務進行快速適應方面具有巨大的潛力,它被廣泛應用于圖像識別[4,130]、圖像分割[60]、自然語言處理[48]、強化學習[75,103]等研究領域。

元學習的好處與推薦模型在實例有限和計算效率低下的情況下的推廣需求是一致的。早期基于元學習的推薦方法主要分為個性化推薦算法選擇[13,78],提取元數據集的特征,針對不同的數據集(或任務)選擇合適的推薦算法。通過運用提取元知識和生成任務特定模型的思想,這種元學習的定義更接近自動化機器學習的研究[39,115]。**隨后,深度元學習[38]或神經網絡元學習[36]出現,并逐漸成為推薦模型中典型討論的元學習技術的主流[47,69]。如[36,38]所介紹的,深度元學習旨在提取元知識,以實現深度神經網絡的快速學習,這對目前流行的深度學習范式帶來了增強。2017年以來,深度元學習在推薦系統研究界受到關注。**在訓練傳統的深度推薦模型時,首先應用先進的元學習技術來緩解數據不足(即冷啟動問題)。例如,最成功的基于優化的元學習框架MAML,以神經網絡參數初始化的形式學習元知識,首先在冷啟動推薦場景[47]中表現出極大的有效性。此外,在元學習模式下還研究了點擊率預測[69]、在線推薦[123]、順序推薦[125]等多種推薦場景,以提高在數據不足和計算效率低下的情況下的學習能力。

在本文中,我們對快速增長的基于深度元學習的推薦系統的研究進行了及時和全面的綜述。在我們的研究中,雖然已經有一些關于元學習或深度元學習的研究綜述了通用元學習方法及其應用的細節[36,38,98],但對推薦系統的最新進展仍然缺乏關注。此外,在其他應用領域也有一些關于元學習方法的綜述,如自然語言處理[48,117],多模態[61]和圖像分割[60]。然而,目前還沒有關于深度元學習在推薦系統中的研究。與他們相比,我們的綜述是填補這一空白的第一次嘗試,系統地回顧了元學習和推薦系統相結合的最新論文。在我們的綜述中,我們的目的是全面回顧基于深度元學習的推薦系統的文獻,這將有助于讀者和研究人員對這一主題的全面理解。為了仔細定位該領域的工作,我們提供了一個從三個角度的分類,包括推薦場景、元學習技術和元知識表示。此外,我們還根據推薦場景討論了相關的方法,并介紹了不同的作品如何利用元學習技術提取特定的元知識,包括參數初始化、參數調制、超參數優化等多種形式。我們希望我們的分類可以為開發新的基于深度元學習的推薦方法提供設計空間。此外,我們還總結了構建元學習任務的常見方法,這是構建元學習范式的必要條件。 本次綜述的結構安排如下。在第2節中,我們介紹了元學習技術的共同基礎和典型的推薦場景,其中元學習方法已被研究,以緩解數據不足和計算效率低下。在第3節中,我們將介紹由三個獨立軸組成的分類法。在第4節中,我們總結了文獻中使用的元學習推薦任務構建的不同方法。然后,我們在第5節詳細闡述了在不同推薦場景下使用元學習技術的現有方法的方法論細節。最后,我們在第6部分討論了該領域未來的研究方向,并在第7部分總結了這一綜述。

基于深度元學習的推薦系統分類

在本節中,我們建立了基于深度元學習的推薦系統的分類,并根據分類總結了現有方法的特點。通常,我們根據三個獨立的軸來定義分類,包括推薦場景、元學習技術和元知識表示。圖1顯示了分類法。之前[38,98]對一般元學習方法的分類更多關注2.1節介紹的三種元學習框架,但對元學習技術的實際應用關注有限。此外,[36]提出了一個新的分類法,涉及元表示、元優化器和元目標三個方面。他們提供了一個更全面的分類,可以引導新的元學習方法的發展。但是,它側重于整個元學習領域,不適合反映基于深度元學習的推薦系統的研究現狀和應用場景。

付費5元查看完整內容

摘要

在過去的幾十年里,人工智能技術迅猛發展,改變了每個人的日常生活,深刻改變了人類社會的進程。開發人工智能的目的是通過減少勞動、增加生活便利、促進社會公益來造福人類。然而,最近的研究和人工智能應用表明,人工智能可能會對人類造成意外傷害,例如,在安全關鍵的情況下做出不可靠的決定,或通過無意中歧視一個或多個群體而破壞公平。因此,值得信賴的人工智能最近受到越來越多的關注,人們需要避免人工智能可能給人們帶來的負面影響,以便人們能夠充分信任人工智能技術,與人工智能技術和諧相處。近年來,人們對可信人工智能進行了大量的研究。在本次綜述中,我們從計算的角度對值得信賴的人工智能進行了全面的評述,幫助讀者了解實現值得信賴的人工智能的最新技術。值得信賴的人工智能是一個大而復雜的課題,涉及方方面面。在這項工作中,我們關注實現值得信賴的人工智能的六個最關鍵方面: (i) 安全性和健壯性,(ii) 非歧視和公平,(iii) 可解釋性,(iv) 隱私,(v) 問責性和可審計性,和(vi) 環境福祉。對于每個維度,我們根據一個分類回顧了最近的相關技術,并總結了它們在真實系統中的應用。我們還討論了不同維度之間的協調和沖突互動,并討論了值得信賴的人工智能在未來研究的潛在方面。

引言

人工智能(AI)是一門研究和發展模擬、擴展和拓展人類智能的理論、方法、技術和應用系統的科學,為現代人類社會帶來了革命性的影響。從微觀角度來看,人工智能在我們生活的許多方面發揮著不可替代的作用。現代生活充滿了與人工智能應用的互動: 從用人臉識別解鎖手機,與語音助手交談,到購買電子商務平臺推薦的產品; 從宏觀角度看,人工智能創造了巨大的經濟成果。世界經濟論壇的《2020年就業前景報告》[136]預測,人工智能將在5年內創造5800萬個新就業崗位。到2030年,人工智能預計將產生13萬億美元的額外經濟利潤,對全球GDP的年增長率貢獻1.2%[54]。然而,隨著其快速而令人印象深刻的發展,人工智能系統也暴露了其不值得信任的一面。例如,安全至關重要的人工智能系統在對抗攻擊時很脆弱。無人駕駛汽車的深度圖像識別系統可能無法識別被惡意攻擊者修改的路標[345],對乘客安全構成極大威脅。此外,人工智能算法可能會導致偏見和不公平。在線人工智能聊天機器人可能會產生不雅、種族主義和性別歧視的內容[335],冒犯用戶,并產生負面社會影響。此外,人工智能系統還存在泄露用戶隱私和商業秘密的風險。黑客可以利用人工智能模型產生的特征向量來重構私人輸入數據,如指紋[25],從而泄露用戶的敏感信息。這些漏洞會使現有的人工智能系統無法使用,并可能造成嚴重的經濟和安全后果。對于人工智能來說,要想在一個領域取得進步、得到更廣泛的應用并創造更多的經濟價值,對誠信的擔憂已經成為一個巨大的障礙。因此,如何構建可信的人工智能系統成為學術界和業界關注的焦點。

近年來,出現了大量關于可信人工智能的文獻。隨著構建可信人工智能的需求日益增長,總結已有成果并探討未來可能的研究方向勢在必行。在本次綜述中,我們提供了值得信賴的人工智能的全面概述,以幫助新手對什么使人工智能系統值得信賴有一個基本的了解,并幫助老兵跟蹤該領域的最新進展。我們澄清了可信人工智能的定義,并介紹了可信人工智能的六個關鍵維度。對于每個維度,我們給出了它的概念和分類,并回顧了有代表性的算法。我們還介紹了不同維度之間可能的互動,并討論了值得信賴的人工智能尚未引起足夠關注的其他潛在問題。除了定義和概念,我們的綜述還關注實現可信人工智能每個維度的具體計算解決方案。這一視角有別于現有的一些相關工作,如政府指南[307],建議如何以法律法規的形式建立一個值得信賴的人工智能系統,或綜述[51,318],從高層次、非技術的角度討論值得信賴的人工智能的實現。

根據歐盟(EU)最近提供的人工智能倫理指南[307],一個值得信賴的人工智能系統應符合四項倫理原則: 尊重人類自主、防止傷害、公平和可解釋性。基于這四個原則,人工智能研究人員、實踐者和政府提出了值得信賴的人工智能的各個具體維度[51,307,318]。在這項調查中,我們重點關注已經被廣泛研究的六個重要和相關的維度。如圖1所示,它們是安全性和穩健性、非歧視性和公平性、可解釋性、隱私性、可審計性和可問責性,以及環境福祉。

余下論文綜述組織如下。在第2節中,我們明確了值得信賴的AI的定義,并提供了值得信賴的AI的各種定義,幫助讀者理解來自計算機科學、社會學、法律、商業等不同學科的研究人員是如何定義值得信賴的AI系統的。然后,我們將值得信賴的人工智能與倫理人工智能和負責任的人工智能等幾個相關概念區分開來。在第3節中,我們詳細介紹了安全性和穩健性的維度,這要求人工智能系統對輸入的噪聲擾動具有穩健性,并能夠做出安全的決策。近年來,大量研究表明,人工智能系統,尤其是那些采用深度學習模型的系統,可能對有意或無意的輸入擾動非常敏感,對安全至關重要的應用構成巨大風險。例如,如前所述,自動駕駛汽車可能會被改變的路標欺騙。此外,垃圾郵件檢測模型可能會被設計良好的文本[30]郵件欺騙。因此,垃圾郵件發送者可以利用這個弱點,使他們的電子郵件不受檢測系統的影響,這將導致糟糕的用戶體驗。已經證明,人工智能算法可以通過提供的訓練例子學習人類的歧視,并做出不公平的決定。例如,一些人臉識別算法難以識別非洲裔美國人的面孔[280]或將其誤分類為大猩猩[168]。此外,語音聽寫軟件在識別男性聲音時通常比識別女性聲音表現得更好[277]。

在第4節中,我們介紹了非歧視和公平的維度,在這個維度中,人工智能系統被期望避免對某些群體或個人的不公平偏見。在第5節中,我們討論了可解釋性的維度,這表明AI的決策機制系統應該能夠向利益相關者解釋(他們應該能夠理解解釋)。例如,人工智能技術已經被用于根據患者的癥狀和身體特征進行疾病診斷[289]。在這種情況下,黑箱決策是不可接受的。推理過程應該對醫生和患者透明,以確保診斷的每個細節都是準確的。

研究人員發現,一些人工智能算法可以存儲和暴露用戶的個人信息。例如,在人類會話語料庫上訓練的對話模型可以記住敏感信息,如信用卡號碼,這些信息可以通過與模型交互而得到[164]。在第6節中,我們提出了隱私的維度,這需要一個人工智能系統來避免泄露任何私人信息。在第7節中,我們描述了可審計性和問責性的維度,該維度期望人工智能系統由第三方評估,并在必要時為人工智能故障分配責任,特別是在關鍵應用中[307]。最近,人工智能系統對環境的影響引起了人們的關注,因為一些大型人工智能系統消耗了大量的能源。作為一項主流的人工智能技術,深度學習正在朝著追求更大的模型和更多的參數的方向發展。因此,會消耗更多的存儲和計算資源。一項研究[312]表明,訓練BERT模型[110]需要排放大約1400磅二氧化碳,這與跨美國的往返飛行相當。因此,人工智能系統應該是可持續的和環境友好的。

在第8節中,我們回顧了環境福利的維度。在第9節中,我們將討論不同維度之間的相互作用。最近的研究表明,值得信賴的AI的不同維度之間存在一致性和沖突[307,333]。例如,深度神經網絡的魯棒性和可解釋性緊密相連,魯棒模型往往更具有可解釋性[122,322],反之亦然[255]。此外,研究表明,在某些情況下,健壯性和隱私之間存在權衡。例如,對抗性防御方法會使模型更容易受到成員推理攻擊,增加了訓練數據泄漏的風險[308]。

除了上述六個維度,值得信賴的人工智能還有更多的維度,如人工代理和監督、可信性等。盡管這些額外的維度與本文中考慮的6個維度一樣重要,但它們還處于開發的早期階段,相關文獻非常有限,特別是對于計算方法而言。因此,在第10節中,我們將討論值得信賴的人工智能的這些方面,作為未來需要專門研究的方向。

付費5元查看完整內容

社區揭示了不同于網絡中其他社區成員的特征和聯系。社區檢測在網絡分析中具有重要意義。除了經典的譜聚類和統計推理方法,我們注意到近年來用于社區檢測的深度學習技術在處理高維網絡數據方面的優勢有了顯著的發展。因此,通過深度學習對社區檢測的最新進展進行全面概述,對學者和從業者都是及時的。本文設計并提出了一種新的分類方法,包括基于深度神經網絡的深度學習模型、深度非負矩陣分解和深度稀疏濾波。主要的類別,即深度神經網絡,進一步分為卷積網絡,圖注意力網絡,生成對抗網絡和自動編碼器。綜述還總結了流行的基準數據集、模型評估指標和開源實現,以解決實驗設置。然后討論了社區檢測在各個領域的實際應用,并提出了實現方案。最后,通過提出這一快速發展的深度學習領域中具有挑戰性的課題,我們概述了未來的發展方向。

//www.zhuanzhi.ai/paper/eb70a346cb2540dab57be737828445c6

引言

早在20世紀20年代,社會學和社會人類學就對社區進行了研究。然而,直到21世紀之后,研究人員才開始利用強大的數學工具和大規模數據操作來檢測社區,以解決具有挑戰性的問題[2]。自2002年[3]以來,Girvan和Newman將圖劃分問題引起了更廣泛的關注。在過去的10年里,計算機科學研究者廣泛研究了基于網絡拓撲結構[5]-[8]和實體語義信息[9]-[11]、靜態網絡[12]-[14]、小型網絡和大型網絡[15]-[17]的社區檢測問題[4]。越來越多的基于圖的方法被開發出來用于檢測具有復雜數據結構[18],[19]環境中的社區。通過社區檢測,可以詳細分析網絡中社區的動態和影響,如謠言傳播、病毒爆發、腫瘤進化等。

社區的存在推動了社區檢測研究的發展,是一個越來越具有現實意義的研究領域。俗話說,物以類聚,人以群分。根據六度分離理論,世界上任何一個人都可以通過六個熟人認識其他人[21]。事實上,我們的世界是一個由一系列社區組成的巨大網絡。例如,通過檢測社交網絡[22]-[24]中的社區,如圖1所示,平臺贊助商可以向目標用戶推廣他們的產品。在引文網絡[25]中,社區檢測決定了研究主題的重要性、關聯性、演化和識別研究趨勢。在代謝網絡[26]、[27]和蛋白質-蛋白質相互作用(PPI)網絡[28]中,社區檢測揭示了具有相似生物學功能的代謝和蛋白質。同樣,腦網絡[19]、[29]中的社區檢測反映了腦區域的功能和解剖分離。

許多傳統的技術,如譜聚類[30],[31]和統計推理[32]-[35],被用于小型網絡和簡單的場景。然而,由于它們的計算和空間成本巨大,它們無法擴展到大型網絡或具有高維特征的網絡。現實網絡中非線性結構信息豐富,使得傳統模型在實際應用中不太適用。因此,需要更強大的具有良好計算性能的技術。目前,深度學習提供了最靈活的解決方案,因為深度學習模型: (1) 學習非線性網絡屬性,如節點之間的關系,(2) 提供一個低維的網絡表示,保持復雜的網絡結構,(3) 提高了從各種信息中檢測社區的性能。因此,深度學習用于社區檢測是一種新的趨勢,需要及時全面的調查。

據我們所知,本文是第一次全面調研深度學習在社區檢測方面的貢獻。以往的研究主要集中在傳統的社區檢測上,回顧了其在發現網絡固有模式和功能[36]、[37]方面的重要影響。這篇論文綜述了一些具體的技術,但不限于: 基于隨機塊模型(sms)的部分檢測[38],標簽傳播算法(LPAs)[39],[40],以及單目標和多目標優化的進化計算[13],[14]。在網絡類型方面,研究人員綜述了動態網絡[12]、有向網絡[41]和多層網絡[5]中的社區檢測方法。此外,[6],[7]還回顧了一系列關于不相交和重疊的社區缺陷的概述。圍繞應用場景,以往的論文綜述了社交網絡[9]、[42]中的社區檢測技術。

本文旨在幫助研究人員和從業者從以下幾個方面了解社區檢測領域的過去、現在和未來趨勢:

  • 系統性分類和綜合評價。我們為此項綜述提出了一個新的系統分類(見圖3)。對于每個類別,我們回顧、總結和比較代表性的工作。我們還簡要介紹了現實世界中的社區檢測應用。這些場景為未來的社區檢測研究和實踐提供了見解。

  • 豐富的資源和高影響力的參考資料。該綜述不僅是文獻綜述,而且是基準數據集、評估指標、開源實現和實際應用的資源集合。我們在最新的高影響力國際會議和高質量同行評審期刊上廣泛調查社區檢測出版物,涵蓋人工智能、機器學習、數據挖掘和數據發現等領域。

  • 未來的發展方向。由于深度學習是一個新的研究趨勢,我們討論了當前的局限性,關鍵的挑戰和開放的問題,為未來的方向。

社區檢測在網絡分析和數據挖掘中具有重要意義。圖4展示了傳統學習方法和深度學習方法的發展。傳統的方法是在網絡結構上探索社區。這七種方法(圖3左圖)僅以一種簡單的方式捕捉淺連接。傳統方法的檢測結果往往是次優的。我們將在本節簡要回顧它們的代表性方法。深度學習方法(圖3右圖)揭示了深度網絡信息,復雜關系,處理高維數據。

本文提出了一種深度社區檢測的分類方法。分類法將方法歸納為六類: 卷積網絡、圖注意力網絡(GAT)、生成對抗網絡(GAN)、自動編碼器(AE)、深度非負矩陣分解(DNMF)和基于深度稀疏濾波(DSF)的深度社區檢測方法。卷積網絡包括卷積神經網絡(CNN)和圖卷積網絡(GCN)。AE又分為堆疊型AE、稀疏型AE、去噪型AE、圖卷積型AE、圖關注型AE和變分型AE (VAE)。

付費5元查看完整內容

由于時空數據量的激增,基于位置的服務和應用的普及,以及從時空數據中提取知識以解決廣泛的現實問題的重要性,在過去十年中,在空間和時空數據分析領域進行了大量的研究和開發工作。現有作品的主要目標是開發算法和技術來捕捉、存儲、管理、分析和可視化空間或時空數據。

研究人員通過在現有系統中添加時空支持、從零開始開發一個處理時空數據的新系統、或實現挖掘時空數據的算法等方式做出了貢獻。

現有的時空數據分析系統可分為三大類: (1) 空間數據庫(SQL和NoSQL); (2)大時空數據處理基礎設施; (3) 處理時空數據的編程語言和軟件工具。

由于現有的調研大多針對處理空間數據的大數據基礎設施,本調研探討了空間和時空分析的整個生態系統,并對大空間數據處理系統進行了最新綜述。本調研也描繪了空間和時空數據分析的重要性和未來。

付費5元查看完整內容

摘要:

圖機器學習在學術界和工業界都得到了廣泛的研究。然而,隨著圖學習文獻的大量涌現,涌現出大量的方法和技術,對于不同的圖相關任務,人工設計最優的機器學習算法變得越來越困難。為了解決這一關鍵挑戰,圖上的自動機器學習(AutoML)結合了圖機器學習和自動學習的優點,正受到學術界的關注。因此,本文對圖自動學習方法進行了全面的綜述,重點研究了用于圖機器學習的超參數優化(HPO)和神經結構搜索(NAS)。我們進一步概述了與自動圖機器學習相關的庫,并深入討論了AutoGL,這是第一個用于AutoML on graphs的專用開源庫。最后,我們分享了對自動圖機學習未來研究方向的看法。據我們所知,這篇論文是第一個關于圖上的自動機器學習的系統和全面的綜述。

//arxiv.org/abs/2103.00742

引言

圖形數據在我們的日常生活中無處不在。我們可以使用圖表來模擬實體之間的復雜關系和依賴關系,從蛋白質中的小分子和物理模擬中的粒子到大型全國范圍的電網和全球航空公司。因此,關于圖的機器學習一直是學術界和業界的一個重要研究方向[Newman, 2018]。特別是網絡嵌入[Cui et al., 2018; Hamilton et al., 2017; Goyal and Ferrara, 2018b; Cai et al., 2018b]和圖神經網絡(GNNs) [Zhang et al., 2020b; Wu et al., 2020; Zhou et al., 2018]在過去十年中越來越受到關注。已成功應用于推薦系統[Ying et al., 2018a; Ma et al., 2019],欺詐檢測[Akoglu等人,2015],生物信息學[Su等人,2020;Zitnik and Leskovec, 2017],物理模擬[Kipf et ., 2018],交通預測[Li et ., 2018b;Yu et al., 2018],知識表示[Wang et al., 2017],藥物再利用[Ioannidis et al., 2020; Gysi et al., 2020]和Covid-19大流行預測[Kapoor et al., 2020]。

盡管圖機器學習算法很受歡迎,但現有的文獻嚴重依賴人工超參數或架構設計來實現最佳性能,導致大量模型出現在各種圖任務時耗費大量人力。以GNNs為例,僅在2020年,就有至少一百種新的通用架構在頂級機器學習和數據挖掘會議上發表,更不用說針對特定任務設計的跨學科研究了。在為目標任務設計最優算法時,如果我們堅持人工的試錯范式,將不可避免地需要越來越多的人力努力。

另一方面,自動化機器學習(AutoML)已被廣泛研究,以減少人類在開發和部署機器學習模型方面的努力[He et al., 2020; Yao et al., 2018]. 完整的AutoML 具有使機器學習的每一個步驟自動化的潛力,包括自動數據收集和清洗、自動特征工程、自動模型選擇和優化等。由于深度學習模型的普及,超參數優化(HPO) [Bergstra and Bengio, 2012; Bergstra et al., 2011; Snoek et al., 2012]和神經結構搜索(NAS) [Elsken et al., 2019]得到了最廣泛的研究。AutoML已經達到或超過了人類水平的性能[Zoph and Le, 2017; Liu et al., 2018; Pham et al., 2018]在諸如計算機視覺等領域幾乎沒有人類指導[Zoph et al., 2018; Real et al., 2019]。

圖自動機器學習,結合了AutoML和圖機器學習的優點,自然是一個很有前途的研究方向,進一步提升模型的性能,越來越受到社會各界的關注。在這篇文章中,我們提供了一個全面和系統的回顧自動機器學習圖,據我們所知,這是第一次。具體來說,我們關注兩個主要的主題: 圖機器學習的HPO和NAS。對于HPO,我們專注于如何開發可擴展的方法。對于NAS,我們遵循文獻,從搜索空間、搜索策略和性能評估策略比較不同的方法。在此過程中,我們討論了不同的方法如何應對圖自動機器學習的挑戰。然后,我們回顧了與自動圖機器學習相關的庫,并討論了第一個用于圖自動機器學習的專用框架和開源庫AutoGL。本文重點介紹了AutoGL的設計原理,并簡要介紹了它的應用,這些都是專門為圖自動機器學習而設計的。我們相信,本文的綜述將極大地促進和進一步推動自動機器學習在圖上的研究和應用。

付費5元查看完整內容

下一代移動網絡將變得越來越復雜,因為越來越多的連接設備在吞吐量、延遲和可靠性方面有著不同的性能要求,這些設備將難以適應巨大的數據流量需求。這使得對眾多網絡元素的監控和管理很難用現有的工具進行,而傳統的機器學習算法依賴于手工制作的特征工程,這也不現實。在這種情況下,將機器智能嵌入移動網絡變得十分必要,因為這樣可以系統地從移動大數據中挖掘有價值的信息,并自動發現那些人類專家難以提取的相關性。特別是,基于深度學習的解決方案可以自動從原始數據中提取特征,而無需人類的專門知識。人工智能(AI)在其他領域的表現吸引了學術界和產業界對使用深度學習方法解決移動網絡技術挑戰前所未有的興趣。本文利用深度神經網絡的最新進展,從不同的角度研究移動網絡領域的重要問題。

本文利用深度神經網絡的最新進展,從不同的角度研究移動網絡領域的重要問題。作為開場白,我們通過一項關于深度學習和移動網絡之間交叉關系的調查,來縮小深度學習和移動網絡之間的差距。其次,我們設計了專門的深度學習架構來預測城市規模的移動流量消費。特別是,我們針對不同的移動流量數據結構(即來自城市網格和地理空間點云天線部署的數據)定制了我們的深度神經網絡模型,以提供精確的預測。接下來,我們提出了一種移動流量超分辨率(MTSR)技術,利用生成對抗網絡架構實現移動流量測量的粗到細粒度轉換。這可以為移動運營商提供關于移動流量分布的深度知識,同時有效地減少數據后處理開銷。隨后,提出了基于深度學習的移動流量分解(MTD)技術,將聚合的移動流量測量數據分解為服務級時間序列。使用MTD,移動運營商可以為網絡切片(即物理基礎設施的邏輯分區)執行更有效的資源分配,并減輕深度包檢查的廣泛使用帶來的隱私問題。最后,我們以一個真實的黑箱威脅模型研究了網絡特定深度異常檢測器的魯棒性,并提出了可靠的解決方案,以防御那些試圖顛覆現有的基于深度學習的網絡入侵檢測系統(NIDS)的攻擊。

最后,根據獲得的結果,我們識別重要的研究方向,是值得追求的未來,包括 (1) 服務深度學習與大規模的高質量數據;(2) 深度學習時空移動數據挖掘;(3) 深度學習幾何移動數據挖掘(iv)無監督學習在移動網絡和移動網絡;(4) 強化學習控制。總的來說,本文證明了深度學習可以支持強大的工具,解決移動網絡領域的數據驅動問題。有了這樣的智能,未來的移動網絡可以更有效地監控和管理,從而保證更高的用戶體驗質量。

付費5元查看完整內容

題目: Convergence of Edge Computing and Deep Learning: A Comprehensive Survey

簡介: 來自工廠和社區的傳感器和智能設備正在生成大量數據,而不斷增長的計算能力正在將計算和服務的核心從云端驅動到網絡邊緣。作為廣泛改變人們生活的重要推動力,從人臉識別到智能工廠和城市,基于人工智能(尤其是深度學習,DL)的應用程序和服務的發展正在蓬勃發展。但是,由于效率和延遲問題,當前的云計算服務體系結構阻礙了“為每個地方的每個人和每個組織提供人工智能”的愿景。因此,使用在數據源附近的網絡邊緣的資源來釋放DL服務已經成為一種理想的解決方案。因此,旨在通過邊緣計算促進DL服務部署的邊緣智能已引起了廣泛關注。此外,作為人工智能的代表技術的DL可以集成到邊緣計算框架中,以構建用于動態,自適應邊緣維護和管理的智能邊緣。關于互惠互利的邊緣智能和智能邊緣,本文介紹和討論:1)兩者的應用場景; 2)實際的實現方法和使能技術,即定制邊緣計算框架中的DL訓練; 3)現有挑戰以及更普遍,更精細的智能化趨勢。通過整合散布在通信,網絡和DL領域的信息,可以幫助讀者理解支持技術之間的聯系,同時促進對邊緣智能與智能邊緣融合的進一步討論。

付費5元查看完整內容
北京阿比特科技有限公司