18禁不卡无毒免费网站入口,大陆国产乱人伦AⅤ,亚洲乱码AV一区二区三区女同

摘要：移動邊緣計算是近年出現的一種新型網絡計算模式,它允許將具有較強計算能力和存儲性能的服務器節點放置在更加靠近移動設備的網絡邊緣(如基站附近),讓移動設備可以近距離地卸載任務到邊緣設備進行處理,從而解決了傳統網絡由于移動設備的計算和存儲能力弱且能量較有限,從而不得不耗費大量時間、能量且不安全地將任務卸載到遠方的云平臺進行處理的弊端。但是,如何讓僅掌握局部有限信息(如鄰居數量)的設備根據任務的大小和數量選擇卸載任務到本地,還是在無線信道隨時間變化的動態網絡中選擇延遲、能耗均最優的移動邊緣計算服務器進行全部或部分的任務卸載,是一個多目標規劃問題,求解難度較高。傳統的優化技術(如凸優化等)很難獲得較好的結果。而深度強化學習是一種將深度學習與強化學習相結合的新型人工智能算法技術,能夠對復雜的協作、博弈等問題作出更準確的決策,在工業、農業、商業等多個領域具有廣闊的應用前景。近年來,利用深度強化學習來優化移動邊緣計算網絡中的任務卸載成為一種新的研究趨勢。最近三年來,一些研究者對其進行了初步的探索,并達到了比以往單獨使用深度學習或強化學習更低的延遲和能耗,但是仍存在很多不足之處。為了進一步推進該領域的研究,文中對近年來國內外的相關工作進行了詳細地分析、對比和總結,歸納了它們的優缺點,并對未來可能深入研究的方向進行了討論。

//www.jsjkx.com/CN/10.11896/jsjkx.200800095

付費5元查看完整內容

相關內容

[付費5元查看完整內容]多智能體深度強化學習：綜述

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

【論文標題】多智能體深度強化學習：綜述Multi-agent deep reinforcement learning: a survey

【作者團隊】Sven Gronauer, Klaus Diepold

【論文鏈接】//link.springer.com/content/pdf/10.1007/s10462-021-09996-w.pdf

【推薦理由】強化學習的進步已記錄了各個領域的卓越成就。盡管在此過程中，多智能體領域已被其單智能體領域所遮蓋，但多智能體強化學習獲得了快速發展的動力，最新成果解決了現實世界中的復雜性問題。本文概述了多智能體深度強化學習領域的最新發展。主要關注近年來的文獻，這些文獻結合了深度強化學習方法和多智能體方案。主要內容分為三個部分。首先，分析了用于訓練多個特工的訓練方案的結構。第二，考慮了合作，競爭和混合場景中代理行為的新興模式。第三，系統地枚舉了多代理領域中唯一出現的挑戰，并回顧了用于應對這些挑戰的方法。本文討論了研究進展，確定趨勢并概述了該研究領域未來工作的可能方向。

付費5元查看完整內容

深度學習 · 網絡流量預測 · 深度信念網絡 · 卷積神經網絡 · 長短時記憶網絡 ·

2021 年 5 月 30 日

[付費5元查看完整內容]基于深度學習的網絡流量預測研究綜述

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

精準地預判網絡流量變化趨勢可以幫助運營商準確預估網絡的使用情況，合理分配并高效利用網絡資源，以滿足日益增長且多樣化的用戶需求。以深度學習算法在網絡流量預測領域的進展為線索，闡述了網絡流量預測的評價指標和目前公開的網絡流量數據集及應用，具體分析了網絡流量預測中常用的深度信念網絡、卷積神經網絡、循環神經網絡和長短時記憶網絡共四種深度學習方法，并重點介紹了近年來針對不同問題所提出的改進神經網絡模型，總結了各模型特點及應用場景。最后對網絡流量預測未來發展進行了展望。

//cea.ceaj.org/CN/abstract/abstract39601.shtml

付費5元查看完整內容

自動駕駛 · 邊緣計算 · 協同感知 ·

2021 年 5 月 3 日

[付費5元查看完整內容]面向自動駕駛的邊緣計算技術研究綜述

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

邊緣計算在自動駕駛的環境感知和數據處理方面有著極其重要的應用。自動駕駛汽車可以通過從邊緣節點獲得環境信息來擴大自身的感知范圍，也可以向邊緣節點卸載計算任務以解決計算資源不足的問題。相比于云計算，邊緣計算避免了長距離數據傳輸所導致的高時延，能給自動駕駛車輛提供更快速的響應，并且降低了主干網絡的負載。基于此，首先介紹了基于邊緣計算的自動駕駛汽車協同感知和任務卸載技術及相關挑戰性問題，然后對協同感知和任務卸載技術的研究現狀進行了分析總結，最后討論了該領域有待進一步研究的問題。

付費5元查看完整內容

復雜未知環境 · 人工智能 · 高維連續空間 · 深度強化學習 · 機器人運動控制 ·

2021 年 4 月 22 日

[付費5元查看完整內容]基于深度強化學習的機器人運動控制研究進展

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

摘要：復雜未知環境下智能感知與自動控制是目前機器人在控制領域的研究熱點之一,而新一代人工智能為其實現智能自動化賦予了可能.近年來,在高維連續狀態-動作空間中,嘗試運用深度強化學習進行機器人運動控制的新興方法受到了相關研究人員的關注.本篇綜述首先回顧了深度強化學習的興起與發展,將用于機器人運動控制的深度強化學習算法分為基于值函數和策略梯度2類,并對各自典型算法及其特點進行了詳細介紹;其次,針對仿真至現實之前的學習過程,簡要介紹了5種常用于深度強化學習的機器人運動控制仿真平臺;然后根據研究類型的不同,綜述了目前基于深度強化學習的機器人運動控制方法在自主導航、物體抓取、步態控制、人機協作以及群體協同等5個方面的研究進展.最后,對其未來所面臨的挑戰以及發展趨勢進行了總結與展望.

//kzyjc.cnjournals.com/kzyjc/article/pdf/2020-1382

付費5元查看完整內容

深度強化學習 · 記憶網絡 · 情景記憶 · 可微分計算機 ·

2021 年 4 月 6 日

[付費5元查看完整內容]記憶增強型深度強化學習研究綜述

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

近年來,深度強化學習的取得了飛速發展,為了提高深度強化學習處理高維狀態空間或動態復雜環境的能力,研究者將記憶增強型神經網絡引入到深度強化學習,并提出了不同的記憶增強型深度強化學習算法,記憶增強型深度強化學習已成為當前的研究熱點.本文根據記憶增強型神經網絡類型,將記憶增強型深度強化學習分為了4類:基于經驗回放的深度強化學習、基于記憶網絡的深度強化學習算法、基于情景記憶的深度強化學習算法、基于可微分計算機的深度強化學習.同時,系統性地總結和分析了記憶增強型深度強化學習的一系列研究成果存在的優勢和不足.另外,給出了深度強化學習常用的訓練環境.最后,對記憶增強型深度強化學習進行了展望,指出了未來研究方向.

//xwxt.sict.ac.cn/CN/volumn/current_abs.shtml#

付費5元查看完整內容

自動駕駛 · 決策控制 · 馬爾科夫決策控制 · 強化學習 · 自主學習 ·

2021 年 2 月 17 日

[付費5元查看完整內容]強化學習的自動駕駛控制技術研究進展

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

自動駕駛車輛的本質是輪式移動機器人，是一個集模式識別、環境感知、規劃決策和智能控制等功能于一體的綜合系統。人工智能和機器學習領域的進步極大推動了自動駕駛技術的發展。當前主流的機器學習方法分為：監督學習、非監督學習和強化學習3種。強化學習方法更適用于復雜交通場景下自動駕駛系統決策和控制的智能處理，有利于提高自動駕駛的舒適性和安全性。深度學習和強化學習相結合產生的深度強化學習方法成為機器學習領域中的熱門研究方向。首先對自動駕駛技術、強化學習方法以及自動駕駛控制架構進行簡要介紹，并闡述了強化學習方法的基本原理和研究現狀。隨后重點闡述了強化學習方法在自動駕駛控制領域的研究歷史和現狀，并結合北京聯合大學智能車研究團隊的研究和測試工作介紹了典型的基于強化學習的自動駕駛控制技術應用，討論了深度強化學習的潛力。最后提出了強化學習方法在自動駕駛控制領域研究和應用時遇到的困難和挑戰，包括真實環境下自動駕駛安全性、多智能體強化學習和符合人類駕駛特性的獎勵函數設計等。研究有助于深入了解強化學習方法在自動駕駛控制方面的優勢和局限性，在應用中也可作為自動駕駛控制系統的設計參考。

//www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20210103&flag=1

付費5元查看完整內容

人工智能 · 深度強化學習 · 深度學習 · 強化學習 · 智能控制 ·

2021 年 1 月 28 日

[付費5元查看完整內容]深度強化學習在智能制造中的應用展望綜述

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

深度強化學習作為機器學習發展的最新成果，已經在很多應用領域嶄露頭角。關于深度強化學習的算法研究和應用研究，產生了很多經典的算法和典型應用領域。深度強化學習應用在智能制造中，能在復雜環境中實現高水平控制。對深度強化學習的研究進行概述，對深度強化學習基本原理進行介紹，包括深度學習和強化學習。介紹深度強化學習算法應用的理論方法，在此基礎對深度強化學習的算法進行了分類介紹，分別介紹了基于值函數和基于策略梯度的強化學習算法，列舉了這兩類算法的主要發展成果，以及其他相關研究成果。對深度強化學習在智能制造的典型應用進行分類分析。對深度強化學習存在的問題和未來發展方向進行了討論。

付費5元查看完整內容

深度學習 · 深度強化學習 · 通用人工智能 ·

2020 年 12 月 31 日

[付費5元查看完整內容]多Agent深度強化學習綜述(中文版)，21頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

近年來, 深度強化學習(Deep reinforcement learning, DRL)在諸多復雜序貫決策問題中取得巨大突破.由于融合了深度學習強大的表征能力和強化學習有效的策略搜索能力, 深度強化學習已經成為實現人工智能頗有前景的學習范式.然而, 深度強化學習在多Agent系統的研究與應用中, 仍存在諸多困難和挑戰, 以StarCraft Ⅱ為代表的部分觀測環境下的多Agent學習仍然很難達到理想效果.本文簡要介紹了深度Q網絡、深度策略梯度算法等為代表的深度強化學習算法和相關技術.同時, 從多Agent深度強化學習中通信過程的角度對現有的多Agent深度強化學習算法進行歸納, 將其歸納為全通信集中決策、全通信自主決策、欠通信自主決策3種主流形式.從訓練架構、樣本增強、魯棒性以及對手建模等方面探討了多Agent深度強化學習中的一些關鍵問題, 并分析了多Agent深度強化學習的研究熱點和發展前景.

//www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180372

付費5元查看完整內容

深度強化學習 · 組合優化 · 自動化學報 ·

2020 年 12 月 11 日

[付費5元查看完整內容]基于深度強化學習的組合優化研究進展

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

組合優化問題廣泛存在于國防、交通、工業、生活等各個領域, 幾十年來, 傳統運籌優化方法是解決組合優化問題的主要手段, 但隨著實際應用中問題規模的不斷擴大、求解實時性的要求越來越高, 傳統運籌優化算法面臨著很大的計算壓力, 很難實現組合優化問題的在線求解. 近年來隨著深度學習技術的迅猛發展, 深度強化學習在圍棋、機器人等領域的矚目成果顯示了其強大的學習能力與序貫決策能力. 鑒于此, 近年來涌現出了多個利用深度強化學習方法解決組合優化問題的新方法, 具有求解速度快、模型泛化能力強的優勢, 為組合優化問題的求解提供了一種全新的思路. 因此本文總結回顧近些年利用深度強化學習方法解決組合優化問題的相關理論方法與應用研究, 對其基本原理、相關方法、應用研究進行總結和綜述, 并指出未來該方向亟待解決的若干問題.

//www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200551

付費5元查看完整內容

深度生成模型 · 自動化學報 ·

2020 年 11 月 23 日

[付費5元查看完整內容]深度生成模型綜述(中文版)，43頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

通過學習可觀測數據的概率密度而隨機生成樣本的生成模型在近年來受到人們的廣泛關注, 網絡結構中包含多個隱藏層的深度生成式模型以更出色的生成能力成為研究熱點, 深度生成模型在計算機視覺、密度估計、自然語言和語音識別、半監督學習等領域得到成功應用, 并給無監督學習提供了良好的范式. 本文根據深度生成模型處理似然函數的不同方法將模型分為三類: 第一類方法是近似方法, 包括采用抽樣方法近似計算似然函數的受限玻爾茲曼機和以受限玻爾茲曼機為基礎模塊的深度置信網絡、深度玻爾茲曼機和亥姆霍茲機, 與之對應的另一種模型是直接優化似然函數變分下界的變分自編碼器以及其重要的改進模型, 包括重要性加權自編碼和可用于半監督學習的深度輔助深度模型; 第二類方法是避開求極大似然過程的隱式方法, 其代表模型是通過生成器和判別器之間的對抗行為來優化模型參數從而巧妙避開求解似然函數的生成對抗網絡以及重要的改進模型, 包括WGAN、深度卷積生成對抗網絡和當前最頂級的深度生成模型BigGAN; 第三類方法是對似然函數進行適當變形的流模型和自回歸模型, 流模型利用可逆函數構造似然函數后直接優化模型參數, 包括以NICE為基礎的常規流模型、變分流模型和可逆殘差網絡(i-ResNet), 自回歸模型(NADE)將目標函數分解為條件概率乘積的形式, 包括神經自回歸密度估計(NADE)、像素循環神經網絡(PixelRNN)、掩碼自編碼器(MADE)以及WaveNet等. 詳細描述上述模型的原理和結構以及模型變形后, 闡述各個模型的研究進展和應用, 最后對深度生成式模型進行展望和總結.

//www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190866

受益于當前計算機性能的快速提升, 學習可觀測樣本的概率密度并隨機生成新樣本的生成模型成為熱點. 相比于需要學習條件概率分布的判別模型, 生成模型的訓練難度大、模型結構復雜, 但除了能夠生成新樣本外, 生成模型在圖像重構、缺失數據填充、密度估計、風格遷移和半監督學習等應用領域也獲得了巨大的成功. 當前可觀測樣本的數量和維數都大幅度增加, 淺層的生成模型受到性能瓶頸的限制而無法滿足應用需求, 從而被含有多個隱藏層的深度生成模型替代, 深度生成模型能夠學習到更好的隱表示, 模型性能更好. 本文對有重要意義的深度生成模型進行全面的分析和討論, 對各大類模型的結構和基本原理進行梳理和分類. 本文第1節介紹深度生成模型的概念和分類; 第2節介紹受限玻爾茲曼機和以受限玻爾茲曼機為基礎模塊的幾種深度生成模型, 重點內容是各種模型的不同訓練算法; 第3節介紹變分自編碼器的基本結構、變分下界的推理和重參數化方法; 第4節介紹生成對抗網絡, 主要內容為模型原理、訓練方法和穩定性研究, 以及兩種重要的模型結構; 第5節總結了流模型的結構, 詳細介紹了流模型的技術特點; 第6節分析了自回歸模型的模型結構以及幾種重要分支的研究進展; 第7節將介紹生成模型中的兩個小分支: 矩陣匹配模型和隨機生成模型; 第8節對深度生成模型存在的問題進行分析討論, 并對未來的研究方向和發展趨勢做出了展望.

付費5元查看完整內容