主題: Data Science: A Comprehensive Overview
摘要: 二十一世紀迎來了大數據時代和數據經濟時代,其中攜帶重要知識,見識和潛力的數據DNA已成為所有基于數據的生物的固有組成部分。對數據DNA及其有機體的適當理解依賴于數據科學及其基石分析的新領域。盡管人們爭論大數據是否僅僅是炒作和嗡嗡聲,并且數據科學還處于非常早期的階段,但是重大挑戰和機遇正在涌現,或者受到數據科學的研究,創新,業務,專業和教育的啟發。本文提供了有關數據科學基本方面的全面調查和教程:從數據分析到數據科學的演變,數據科學概念,數據科學時代的全景,數據創新的主要挑戰和方向,數據分析的性質,數據經濟中的新工業化和服務機會,數據教育的專業和能力以及數據科學的未來。除了提供豐富的觀察,教訓以及對數據科學和分析的思考之外,本文是本領域中第一篇全面概述的文章。
學
題目: 3D Deep Learning on Medical Images: A Review
摘要:
機器學習,圖形處理技術和醫學成像數據的可用性的快速發展導致在醫學領域深度學習模型的使用迅速增加。基于卷積神經網絡(CNN)的體系結構的快速發展加劇了這種情況,醫學成像社區采用了該體系結構來幫助臨床醫生進行疾病診斷。自2012年AlexNet取得巨大成功以來,CNNs越來越多地用于醫學圖像分析,以提高人類臨床醫生的效率。近年來,三維(3D)CNNs已用于醫學圖像分析。在本文中,追溯了3D CNN如何從其機器學習根源發展的歷史,對3D CNN進行了簡要的數學描述,并在將醫學圖像輸入3D CNNs之前對其進行了必要的預處理。文中還回顧了使用3D CNNs(及其變體)在不同醫學領域(例如分類,分割,檢測和定位)的3D醫學成像分析領域的重要研究。通過討論與在醫學成像領域中使用3D CNNs相關的挑戰(以及通常使用深度學習模型)以及該領域可能的未來趨勢來得出結論。
隨著web技術的發展,多模態或多視圖數據已經成為大數據的主要流,每個模態/視圖編碼數據對象的單個屬性。不同的模態往往是相輔相成的。這就引起了人們對融合多模態特征空間來綜合表征數據對象的研究。大多數現有的先進技術集中于如何融合來自多模態空間的能量或信息,以提供比單一模態的同行更優越的性能。最近,深度神經網絡展示了一種強大的架構,可以很好地捕捉高維多媒體數據的非線性分布,對多模態數據自然也是如此。大量的實證研究證明了深多模態方法的優勢,從本質上深化了多模態深特征空間的融合。在這篇文章中,我們提供了從淺到深空間的多模態數據分析領域的現有狀態的實質性概述。在整個調查過程中,我們進一步指出,該領域的關鍵要素是多模式空間的協作、對抗性競爭和融合。最后,我們就這一領域未來的一些方向分享我們的觀點。
本書介紹了數據科學的數學和算法基礎,包括機器學習、高維幾何和大型網絡的分析。主題包括高維數據的反直覺性質、重要的線性代數技術,如奇異值分解、隨機游動和馬爾科夫鏈理論、機器學習的基本原理和重要算法、聚類算法和分析、大型網絡的概率模型、表示學習,包括主題建模和非負矩陣分解、小波和壓縮感知。本文提出了一種正概率技術,包括大數定律、尾部不等式、隨機投影分析、機器學習中的泛化保證以及分析大隨機圖相變的矩量法。此外,還討論了重要的結構和復雜性度量,如矩陣范數和vc維。本書適用于設計和分析數據算法的本科和研究生課程。
主題: A Review on Deep Learning Techniques for Video Prediction
摘要: 預測,預期和推理未來結果的能力是智能決策系統的關鍵組成部分。鑒于深度學習在計算機視覺中的成功,基于深度學習的視頻預測已成為有前途的研究方向。視頻預測被定義為一種自我監督的學習任務,它代表了一個表示學習的合適框架,因為它展示了提取自然視頻中潛在模式的有意義的表示的潛在能力。視頻序列預測的深度學習方法。我們首先定義視頻預測的基礎知識,以及強制性的背景概念和最常用的數據集。接下來,我們會仔細分析根據擬議的分類法組織的現有視頻預測模型,突出顯示它們的貢獻及其在該領域的意義。數據集和方法的摘要均附有實驗結果,有助于在定量基礎上評估現有技術。通過得出一些一般性結論,確定開放研究挑戰并指出未來的研究方向來對本文進行總結。
主題: Comprehensive Review of Deep Reinforcement Learning Methods and Applicationsin Economic
摘要: 深度強化學習(DRL)方法在經濟學中的應用已成倍增加。 DRL通過從強化學習(RL)和深度學習(DL)的廣泛功能來處理復雜的動態業務環境提供了廣闊的機遇。 DRL的特點是可伸縮性,它有可能結合經濟數據的噪聲和非線性模式應用于高維問題。在這項工作中,我們首先考慮對經濟學中各種應用中的DL,RL和深層RL方法進行簡要回顧,以提供對最新技術水平的深入了解。此外,研究了應用于經濟應用的DRL體系結構,以突出其復雜性,魯棒性,準確性,性能,計算任務,風險約束和獲利能力。調查結果表明,與傳統算法相比,DRL可以提供更好的性能和更高的精度,同時在存在風險參數和不確定性不斷增加的情況下面臨實際的經濟問題。
論文題目
數據科學中有關矩陣方法的文獻綜述:A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE
論文摘要
高效的數值線性代數是所有科學和工業學科中許多應用的核心組成部分。通過這項調查,我們想說明,隨著數據和計算資源的可用性推動了許多新的發展,數字線性代數在支持和改進數據科學計算方面已經發揮并正在發揮關鍵作用。從數據中提取信息的研究已成為業務,工程,基礎研究甚至文化的主要驅動力。 在這里,我們將數據科學視為借鑒了機器學習,數據挖掘和許多其他數學領域(例如優化或統計)的要素。 此外,我們要指出,為了從數據中獲取信息,不一定意味著數據很大,但通常它們是這樣的。
論文作者
MARTIN STOLL
論文題目: Blockchain for Future Smart Grid: A Comprehensive Survey
論文摘要: 智能電網的概念已被引入,作為常規電網的新視野,以尋求一種整合綠色和可再生能源技術的有效方法。通過這種方式,連接互聯網的智能電網(也稱為能源互聯網)也正在作為一種創新的方法出現,以確保隨時隨地的能源供應。這些發展的最終目標是建立一個可持續發展的社會。但是,對于傳統的集中式網格系統而言,集成和協調大量不斷增長的連接可能是一個具有挑戰性的問題。因此,智能電網正在從其集中形式轉變為分散式拓撲。另一方面,區塊鏈具有一些出色的功能,使其成為智能電網范例的有前途的應用程序。本文旨在對區塊鏈在智能電網中的應用進行全面的調查。因此,我們確定了可以通過區塊鏈解決的智能電網場景的重大安全挑戰。然后,我們提出了許多基于區塊鏈的最新研究成果,這些研究成果發表在不同的文獻中,涉及智能電網領域的安全問題。我們還總結了最近出現的幾個相關的實用項目,試驗和產品。最后,我們討論了將區塊鏈應用于智能電網安全問題的基本研究挑戰和未來方向。
論文摘要:遷移學習的目的是通過遷移包含在不同但相關的源域中的知識來提高目標學習者在目標域中的學習性能。這樣可以減少對大量目標域數據的依賴,從而構建目標學習者。由于其廣泛的應用前景,轉移學習已經成為機器學習中一個熱門和有前途的領域。雖然已經有一些關于遷移學習的有價值的和令人印象深刻的綜述,但這些綜述介紹的方法相對孤立,缺乏遷移學習的最新進展。隨著遷移學習領域的迅速擴大,對相關研究進行全面的回顧既有必要也有挑戰。本研究試圖將已有的遷移學習研究進行梳理和梳理,并對遷移學習的機制和策略進行全面的歸納和解讀,幫助讀者更好地了解當前的研究現狀和思路。與以往的研究不同,本文從數據和模型的角度對40多種具有代表性的遷移學習方法進行了綜述。簡要介紹了遷移學習的應用。為了展示不同遷移學習模型的性能,我們使用了20個有代表性的遷移學習模型進行實驗。這些模型是在三個不同的數據集上執行的,即,亞馬遜評論,路透社-21578,Office-31。實驗結果表明,在實際應用中選擇合適的遷移學習模型是非常重要的。
關鍵詞:遷移學習 機器學習 域適應 可解釋性
隨著大數據、深度學習在學術界和工業界的普及,人們越來越認識到數據對于科研和應用的重要性。雖然現在相關的工具和框架大大降低了構建數據應用的門檻,數據科學基礎對應用的構建依然起著核心的作用。本文介紹微軟研究院新版書籍《數據科學基礎》。
這本書介紹了數據科學的數學和算法基礎,包括機器學習,高維幾何,和大型網絡的分析。主題包括高維數據的反直覺性質,重要的線性代數技術,如奇異值分解,隨機漫步和馬爾科夫鏈理論,機器學習的基本原理和重要算法,聚類算法和分析,大型網絡的概率模型,表示學習包括主題建模和非負矩陣分解、小波和壓縮感知。發展了重要的概率技術,包括大數定律、尾不等式、隨機投影分析、機器學習中的泛化保證,以及用于分析大型隨機圖中的相變的矩方法。此外,還討論了矩陣規范和vc維等重要的結構和復雜性度量指標。這本書適合本科和研究生課程的設計和分析算法的數據。