亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

摘要: 卷積神經網絡(convolutional neural network, CNN)在圖像處理、語音識別、自然語言處理等領域實現了很好的性能.大規模的神經網絡模型通常遭遇計算、存儲等資源限制,稀疏神經網絡的出現有效地緩解了對計算和存儲的需求.盡管現有的領域專用加速器能夠有效處理稀疏網絡,它們通過算法和結構的緊耦合實現高能效,卻喪失了結構的靈活性.粗粒度數據流架構通過靈活的指令調度可以實現不同的神經網絡應用.基于該架構,密集卷積規則的計算特性使不同通道共享相同的一套指令執行,然而稀疏網絡中存在權值稀疏,使得這些指令中存在0值相關的無效指令,而現有的指令執行方式無法自動跳過它們從而產生無效計算.同時在執行不規則的稀疏網絡時,現有的指令映射方法造成了計算陣列的負載不均衡.這些問題阻礙了稀疏網絡性能的提升.基于不同通道共享一套指令的前提下,根據稀疏網絡的數據和指令特征增加指令控制單元實現權值數據中0值相關指令的檢測和跳過,同時使用負載均衡的指令映射算法解決稀疏網絡中指令執行不均衡問題.實驗表明:與密集網絡相比稀疏網絡實現了平均1.55倍的性能提升和63.77%的能耗減少.同時比GPU(cuSparse)和Cambricon-X實現的稀疏網絡分別快2.39倍(Alexnet)、2.28倍(VGG16)和1.14倍(Alexnet)、1.23倍(VGG16).

//crad.ict.ac.cn/CN/10.7544/issn1000-1239.2021.20200112

付費5元查看完整內容

相關內容

在深度學習中,卷積神經網絡(CNN或ConvNet)是一類深度神經網絡,最常用于分析視覺圖像。基于它們的共享權重架構和平移不變性特征,它們也被稱為位移不變或空間不變的人工神經網絡(SIANN)。它們在圖像和視頻識別,推薦系統,圖像分類,醫學圖像分析,自然語言處理,和財務時間序列中都有應用。

知識薈萃

精品入門和進階教程、論文和代碼整理等

更多

查看相關VIP內容、論文、資訊等

摘要: 在大數據時代,圖被用于各種領域表示具有復雜聯系的數據.圖計算應用被廣泛用于各種領域,以挖掘圖數據中潛在的價值.圖計算應用特有的不規則執行行為,引發了不規則負載、密集讀改寫更新操作、不規則訪存和不規則通信等挑戰.現有通用架構無法有效地應對上述挑戰.為了克服加速圖計算應用面臨的挑戰,大量的圖計算硬件加速架構設計被提出.它們為圖計算應用定制了專用的計算流水線、訪存子系統、存儲子系統和通信子系統.得益于這些定制的硬件設計,圖計算加速架構相比于傳統的通用處理器架構,在性能和能效上均取得了顯著的提升.為了讓相關的研究學者深入了解圖計算硬件加速架構,首先基于計算機的金字塔組織結構,從上到下對現有工作進行分類和總結,并以多個完整架構實例分析應用于不同層次的優化技術之間的關系.接著以圖神經網絡加速架構的具體案例討論新興圖計算應用的加速架構設計.最后對該領域的前沿研究方向進行了總結,并放眼于未來探討圖計算加速架構的發展趨勢.

付費5元查看完整內容

圖神經網絡(GNN)是一類基于深度學習的處理圖域信息的方法,它通過將圖廣播操作和深度學習算法結合,可以讓圖的結構信息和頂點屬性信息都參與到學習中,在頂點分類、圖分類、鏈接預測等應用中表現出良好的效果和可解釋性,已成為一種廣泛應用的圖分析方法.然而現有主流的深度學習框架(如Tensorflow、PyTorch等)沒有為圖神經網絡計算提供高效的存儲支持和圖上的消息傳遞支持,這限制了圖神經網絡算法在大規模圖數據上的應用.目前已有諸多工作針對圖結構的數據特點和圖神經網絡的計算特點,探索了大規模圖神經網絡系統的設計和實現方案.本文首先對圖神經網絡的發展進行簡要概述,總結了設計圖神經網絡系統需要面對的挑戰;隨后對目前圖神經網絡系統的工作進行介紹,從系統架構、編程模型、消息傳遞優化、圖分區策略、通信優化等多個方面對系統進行分析;最后使用部分已開源的圖神經網絡系統進行實驗評估,從精確度、性能、擴展性等多個方面驗證這些系統的有效性.

//www.jos.org.cn/jos/ch/reader/view_abstract.aspx?file_no=6311

付費5元查看完整內容

近年來深度學習在圖像、語音、自然語言處理等諸多領域得到廣泛應用,但隨著人們對深度學習的訓練速度和數據處理能力的需求不斷提升,傳統的基于單機的訓練過程愈發難以滿足要求,分布式的深度學習訓練方法成為持續提升算力的有效途徑.其中訓練過程中節點間網絡的通信性能至關重要,直接影響訓練性能.分析了分布式深度學習中的性能瓶頸,在此基礎上對目前常用的網絡性能優化方案進行綜述,詳細闡述了目前最新的超大規模分布式訓練的體系結構、優化方法、訓練環境和最有效的優化方法,最后對分布式訓練仍然存在的困難進行了總結,對其未來研究方向進行了展望.

//crad.ict.ac.cn/CN/10.7544/issn1000-1239.2021.20190881

付費5元查看完整內容

摘要: 基于卷積神經網絡, 提出一種基于改進卷積神經網絡的短文本分類模型. 首先, 采用不同編碼方式將短文本映射到不同空間下的分布式表示, 提取不同粒度的數字特征作為短文本分類模型的多通道輸入, 并根據標準知識庫提取概念特征作為先驗知識, 提高短文本的語義表征能力;其次, 在全連接層增加自編碼學習策略, 在近似恒等的基礎上進一步組合數字特征, 模擬數據內部的關聯性;最后, 利用相對熵原理為模型增加稀疏性限制, 降低模型復雜度的同時提高模型的泛化能力. 通過對開源數據集進行短文本分類實驗, 驗證了模型的有效性.

付費5元查看完整內容

深度神經網絡已經被證明可以有效的解決圖像、自然語言等不同領域的問題.同時伴隨著移動互聯網技術的不斷發展,便攜式設備得到了迅速的普及,用戶提出了越來越多的需求.因此,如何設計高效、高性能的輕量級神經網絡是解決問題的關鍵.本文詳細闡述了三種構建輕量級神經網絡的方法,分別是人工設計輕量級神經網絡、神經網絡模型壓縮算法和基于神經網絡架構搜索的自動化神經網絡架構設計,同時簡要總結和分析了每種方法的特點,并重點介紹了典型的構建輕量級神經網絡的算法.最后,總結現有的方法,并給出了未來發展的前景.

付費5元查看完整內容

A Survey of Model Compression and Acceleration for Deep Neural Networks 深度卷積神經網絡(CNNs)最近在許多視覺識別任務中取得了巨大的成功。然而,現有的深度神經網絡模型在計算上是昂貴的和內存密集型的,這阻礙了它們在低內存資源的設備或有嚴格時間延遲要求的應用程序中的部署。因此,在不顯著降低模型性能的情況下,在深度網絡中進行模型壓縮和加速是一種自然的思路。在過去幾年中,這方面取得了巨大的進展。本文綜述了近年來發展起來的壓縮和加速CNNs模型的先進技術。這些技術大致分為四種方案: 參數剪枝和共享、低秩因子分解、傳輸/緊湊卷積過濾器和知識蒸餾。首先介紹參數修剪和共享的方法,然后介紹其他技術。對于每種方案,我們都提供了關于性能、相關應用程序、優點和缺點等方面的詳細分析。然后我們將討論一些最近比較成功的方法,例如,動態容量網絡和隨機深度網絡。然后,我們調查評估矩陣、用于評估模型性能的主要數據集和最近的基準測試工作。最后,對全文進行總結,并對今后的研究方向進行了展望。

付費5元查看完整內容
北京阿比特科技有限公司