真實世界中的時間序列數據通常復雜且難以通過傳統分析方法處理。深度學習在應對這種復雜性方面展現了很大的潛力,但針對時間序列數據的有效方法仍在不斷開發之中。特別是,常用的序列到序列框架未能充分利用時間層次結構,在長序列解碼方面表現不佳。本文通過結合時間層次結構,探索了先進的深度學習技術,以實現更有效的時間序列分析。首先,我們提出了一種具有多分辨率集成解碼的遞歸自編碼器。該方法使用粗到細的融合機制,進行多分辨率時間融合,結合多個解碼專家。另一方面,一類表示學習通過假設高維隱空間中的一個超球體,避免了序列解碼。我們通過引入具有多重時間尺度的時間層次一類表示,擴展了現有的一類方法。這種方法能夠在統一的一類學習框架中捕捉豐富的正常模式。此外,我們還探索了一種基于自適應多輪掩蔽對比學習框架,以提高一類表示學習的效果。時間層次結構還可以應用于時間序列擴散模型。我們首先開發了兩種條件生成機制,以增強這些擴散模型。然后,我們提出利用多分辨率分析,從時間序列中順序提取細到粗的趨勢用于前向擴散,同時去噪過程以一種從易到難的非自回歸方式進行。實驗結果表明,將時間層次信息集成到深度學習模型中,在各類時間序列任務中,包括正常性建模和生成預測,相比最先進的方法更為有效。
時間序列建模是許多現實世界應用中的核心問題,如銷售預測[16]、天氣預測[17]、醫療保健[18]、地震檢測[19]、交通管理[20]和天文學[21]。有效的人工智能方法用于時間序列建模,預計能夠應對以下挑戰:
機器學習方法廣泛應用于人工智能領域,通常分為判別模型和生成模型。判別方法,包括監督學習、無監督學習和強化學習,在該領域發揮了重要作用。然而,傳統的機器學習方法在進行時間序列建模時,通常過于依賴數據表示或特征工程。這種對手動特征工程的依賴使得將機器學習技術應用于各種時間序列任務變得勞動密集且耗時。因此,對于能夠最小化大量特征工程需求的端到端深度學習算法的需求日益增長。此外,長時間序列數據中的復雜時間動態對深度生成模型的開發構成了重大挑戰。盡管該領域取得了一些進展,但為時間序列創建強大的生成模型仍然非常復雜。不同時間步之間復雜的交互和依賴關系使得準確捕捉潛在的生成過程變得具有挑戰性。開發能夠有效捕捉時間動態并生成逼真的時間序列樣本的深度生成模型仍是一個持續的研究領域。本文通過結合時間層次結構特征,探索了先進的深度學習技術,以實現更有效的時間序列分析。具體來說,我們為真實世界中的時間序列應用開發了新的表示學習方法和條件生成模型,包括異常檢測和長期預測。前者任務要求具有從給定數據建模正常性(normality)的強大能力,使模型能夠捕捉正常的時間序列表示,并在測試過程中識別未知或未見的異常。另一方面,后者任務旨在通過歷史觀測的引導,建模未來值的條件分布。與傳統的機器學習方法不同,深度學習方法本質上是數據驅動的。它們通過使機器或算法能夠直接從數據中自動學習相關特征,努力消除手動特征工程的需求。這一特性使得深度學習技術近年來越來越受到關注和重視。盡管深度學習在計算機視覺和自然語言處理等領域的應用已經得到了廣泛研究[22],但其在時間序列分析中的應用相對較少,研究也較為有限。如圖1.1(a)所示,通用的深度學習框架以端到端的方式從輸入X到輸出Y建立映射(記作F,參數為Θ),即: 在表示學習方法(b)中,其輸出通常是一個壓縮的固定長度表示向量Z。表示Z預計以監督或無監督的方式捕捉X的判別性模式。這個過程有助于在時間序列中發現有意義的特征。與表示學習方法相比,時間序列生成建模(c)直觀上旨在從先驗分布學習到一個映射,生成真實時間序列分布。通過利用給定條件(例如歷史觀測)的引導并捕捉時間序列中的統計特性,模型能夠生成具有與真實數據相似特征的未來時間序列樣本。通過將時間序列建模任務劃分為這兩個不同的類別——時間序列表示學習和生成建模——我們能夠系統全面地研究現有的基于深度學習的時間序列分析方法。
摘要
本論文關注于強化學習(RL),其中決策代理通過與環境的交互并接收獎勵反饋來學習理想的行為。從交互中學習決策與大多數機器學習范式不同,強化學習代理不僅需要學習如何收集數據以指導未來的決策,還需要學習最大化累積獎勵的期望行為。這些過程被稱為探索和利用。本文的重點是強化學習中的探索問題,并提出了引導代理高效收集數據、平衡探索與利用的創新解決方案。 論文的第一部分關注于在稀疏獎勵環境中單智能體強化學習的探索問題。在這種環境下,單個決策代理通過與環境的交互學習,并且很少(或幾乎不)從環境中獲得非零獎勵。在這種挑戰性環境中,一個常見的探索方法是引入內在獎勵,通過內在獎勵激勵代理進行探索。然而,通過引入這個第二優化目標,代理需要顯式并小心地平衡內在獎勵的探索目標與環境中外在獎勵的利用目標。為了解決這個問題,我們提出了分解強化學習(DeRL)。在DeRL中,代理為探索和利用學習獨立的策略,以適應這兩種策略的不同目標。探索策略通過內在獎勵進行訓練,用于收集有價值的數據以供利用策略使用,而利用策略則在收集的數據上進行訓練,以解決任務。我們展示了DeRL在樣本效率和對探索與利用之間權衡的超參數的魯棒性方面,優于現有的內在動機驅動的探索方法。 在論文的后續部分,我們將重點轉向多智能體強化學習(MARL)中的探索問題。在MARL中,多個決策代理通過與共享環境的交互共同學習。本文關注于需要代理合作的環境,即代理需要學習協調其行為以達成共同目標。與單智能體強化學習相比,這一額外的考慮使得學習過程和探索變得更加復雜,因為現在需要考慮代理之間的交互。本文對MARL的第一個貢獻是對十種算法在25個合作性共享獎勵環境中的綜合基準測試。作為這一研究的一部分,我們開源了EPyMARL,一個擴展了現有PyMARL代碼庫的MARL代碼庫,增加了更多的算法、支持更多環境,并增強了可配置性。在分析這一基準測試后,我們識別出MARL中存在的挑戰,尤其是在獎勵信息稀缺的環境中如何高效訓練代理進行合作。針對這一挑戰,我們提出了共享經驗的演員-評論員算法(SEAC)。SEAC利用許多多智能體環境中的對稱性,跨代理共享經驗,并通過演員-評論員算法從所有代理的集體經驗中進行學習。在實驗中,我們證明了經驗共享顯著提高了學習效率,并幫助代理同時學習多種技能。然而,對于基于價值的算法,經驗共享的效果不如預期,因為這些算法的代理不會顯式學習策略。 為了引導基于價值的MARL算法的探索,我們提出了多智能體探索的集成價值函數(EMAX)。EMAX為每個代理訓練一組價值函數,并引導代理的探索朝向可能需要多個代理協作的狀態和動作。通過這種方式,代理能夠更高效地協調其行為,我們證明了EMAX作為三種常見基于價值的MARL算法的擴展,可以顯著提高訓練的樣本效率和穩定性。 最后,本文展示了一個案例研究,討論了MARL在倉庫物流自動化中的應用。本章是與Dematic GmbH的行業合作成果,我們在其中形式化了倉庫物流問題,并提出了一個雙重解決方案來應對這一環境的可擴展性挑戰。我們的方法利用多智能體學習架構的層次化分解,并屏蔽掉被認為無效的動作。通過這些技術,簡化了個體代理的學習目標,使MARL代理能夠更高效地學習,并在更多代理和位置的較大倉庫實例中擴展,同時超越了行業標準啟發式算法和傳統MARL算法的性能。
本論文通過創新性貢獻,推動了序列建模技術的發展,架起了狀態空間模型與深度學習之間的橋梁。序列建模技術能夠識別有序數據中的模式和關系,廣泛應用于時間序列預測、語音和音頻信號處理、文本生成、生物序列建模和神經記錄分析等多個領域。盡管深度學習已經改變了序列建模的格局,但當前的架構在計算效率、建模能力和可解釋性之間面臨著基本的權衡。我們通過三項互補的貢獻,解決了這些挑戰。 首先,我們提出了 S5 層,它重新設計了深度狀態空間方法,以支持并行掃描操作。我們通過與先前方法的數學聯系,解釋了其強大的實驗性能。接著,我們將這些洞察擴展到時空建模領域,提出了 ConvS5,將空間結構整合到狀態空間框架中。最后,我們通過雅可比切換線性動力系統(JSLDS)過程,開發了新的分析工具,為將復雜的非線性動力學分解為可解釋的線性成分提供了系統化的方法。 通過在多個領域的廣泛實驗證明,我們展示了這些方法如何在各自領域顯著推進了當前的技術水平。綜合來看,這些貢獻展示了將經典動力系統方法與現代深度學習技術結合,創造出更強大、高效且具可解釋性的序列模型的廣泛潛力。 序列建模——即學習有序數據中的模式和關系——是科學與工程多個領域的基礎任務。其應用范圍從金融時間序列預測[Salinas et al., 2020]、天氣模式分析[Rasp et al., 2020, Pathak et al., 2022],到語音與音頻信號處理[Oord et al., 2016]、生物序列建模[Jumper et al., 2021]、神經記錄分析[Pandarinath et al., 2018],以及文本[Brown et al., 2020]和視頻[Ho et al., 2022]生成等。序列建模中的關鍵挑戰在于捕捉短期模式和可能跨越數百、數千或數百萬時間步的長期依賴關系。 深度學習通過用學習到的表示代替手工設計的特征和傳統統計模型,已經改變了序列建模。然而,隨著序列模型在規模和能力上的增長,出現了三個基本挑戰:計算效率、建模精度和模型可解釋性。目前的架構在這些目標之間面臨顯著的權衡。遞歸神經網絡(RNNs)[Rumelhart et al., 1986, Elman, 1990]在推理效率方面表現出色,但在處理長期依賴時表現不佳,并且在訓練過程中天生是順序的。Transformer模型[ Vaswani et al., 2017]在捕捉長期模式方面表現優異,但其計算復雜度與序列長度呈二次增長。此外,隨著這些模型的復雜性增加,并且被部署在關鍵應用中,我們對其決策過程的理解變得愈發重要。 在本論文中,我們認為深度狀態空間方法——將經典動力系統理論中的狀態空間模型(SSMs)與現代深度學習相結合——能夠有效解決上述序列建模中的基本挑戰。通過三項互補的貢獻,我們展示了這種經典與現代方法的結合如何提升計算效率、建模精度和模型可解釋性。 首先,我們提出了S5層[Smith et al., 2023a],它簡化了深度狀態空間方法,同時擴展了其能力。通過精心重新設計架構以支持并行掃描,S5在保持線性計算擴展性的同時,達到了最先進的性能,即使是在時間變化的系統中也是如此。我們與先前方法建立的數學聯系解釋了其有效性,并為設計提供了有原則的選擇。 基于這些基礎,我們提出了ConvS5[Smith et al., 2023b],以解決時空建模中的挑戰。該工作展示了如何將S5背后的核心思想擴展到更復雜的領域,通過結合卷積操作處理空間結構,并將狀態空間動態應用于時間建模。ConvS5在有效處理空間依賴性的同時,保持了S5的計算優勢。 我們的第三項貢獻從不同的角度出發,將狀態空間模型作為分析工具,而不是計算構建塊。雅可比切換線性動力系統(JSLDS)[Smith et al., 2021]方法展示了如何通過共同訓練一個切換線性SSM和非線性RNN,提供對RNN計算機制的可解釋性見解。這項工作展示了經典動力系統概念如何幫助彌合深度學習的經驗成功與理論理解之間的差距。 這些貢獻統一在幾個共同主題下:
SSM與深度學習方法的創新整合:每種方法都展示了將經典動力系統與現代深度學習相結合的創新方式,無論是作為計算組件(S5、ConvS5)還是分析工具(JSLDS)。 * 增強的能力:前兩種方法在保持高效并行計算的同時,達到了最先進的性能,而JSLDS為理解RNN動態提供了新的分析能力,同時提升了共同訓練的切換SSM的能力。 * 廣泛的適用性:這些方法在包括語言、語音、視頻和神經數據等多個領域取得了成功,突顯了我們方法的普遍性。
本論文的其余部分組織如下:第二章提供了序列建模、狀態空間模型及相關架構的必要背景。第三章介紹了S5層及其在序列建模中的應用,基于我們在Smith et al. [2023a]中的工作。第四章介紹了ConvS5,并展示了其在時空建模中的有效性,基于我們在Smith et al. [2023b]中的工作。第五章發展了JSLDS框架及其應用,基于我們在Smith et al. [2021]中的工作。最后,第六章探討了本研究的廣泛影響,并概述了未來研究的有希望方向。
深度統計模型的進展重新定義了現代數據驅動應用,在各個領域展現了顯著的經驗成功。然而,雖然一些領域受益于大量干凈且完全觀測的數據,使得實踐者能夠充分發揮深度模型的優勢,但其他領域通常面臨著不完整數據的問題,這阻礙了這些強大模型的有效應用。在本論文中,我們旨在研究并解決由缺失數據引起的重要挑戰,這些挑戰妨礙了深度模型的使用,重點關注兩個關鍵統計任務:從不完整訓練數據集中進行參數估計和缺失數據填補。首先,我們探討了使用預訓練模型進行缺失數據填補的問題,重點關注變分自編碼器(VAE)類的深度統計模型。我們的探索揭示了現有的 VAE 條件采樣方法的局限性,識別了與常見的 VAE 學習特性相關的陷阱,這些陷阱在某些場景中妨礙了方法的性能。為了解決這些問題,我們提出了基于馬爾科夫鏈蒙特卡洛和重要性采樣的兩種新方法。我們的評估表明,所提出的方法在不同數據集上改進了使用預訓練 VAE 進行的缺失數據填補。隨后,我們將注意力轉向了從不完整訓練數據集中估計 VAE 的問題。盡管這一領域在文獻中得到了相當大的關注,但我們報告了由缺失數據引起的一個之前未知的現象,該現象妨礙了 VAE 的有效擬合。為了克服這些不利影響并改進從不完整數據中估計 VAE,我們引入了基于變分混合分布的兩種策略,這些策略在計算效率、模型精度和學習到的潛在結構之間進行權衡。我們展示了與不使用變分混合的現有方法相比,所提出的方法在不完整數據下改善了 VAE 的估計效果。擴展到估計一般統計模型的更廣泛挑戰時,我們觀察到不同類別的深度模型在進展上存在不平衡。為了推動所有深度統計模型的采用,我們引入了變分吉布斯推斷(VGI),這是一種通用方法,用于最大似然估計具有可處理似然函數的一般統計模型。我們表明,該方法能夠從不完整數據中進行精確的模型估計,包括 VAE 和歸一化流。值得注意的是,VGI 是當前文獻中少數幾種具有概率原理的方法之一,能夠從不完整數據中進行歸一化流的估計,且達到了最先進的性能。通過提供一個統一的框架來處理模型估計中的缺失數據,VGI 為在面臨缺失數據的各個領域中充分發揮深度統計模型的潛力鋪平了道路。
通過代碼數據學習來解決軟件任務的編程工具在提升開發人員生產力方面展現了早期的潛力。然而,這些工具在魯棒性方面以及它們對軟件安全性和可靠性的最終影響上仍然存在顯著差距——這些問題甚至對經驗豐富的開發人員來說仍是挑戰。本論文旨在從安全性和可靠性的角度推動代碼機器學習領域的發展。我們提出了訓練機器學習模型的新技術,以使其具備強大的推理能力,能夠處理與安全性和可靠性相關的問題。 我們首先介紹了利用監督學習信號來增強程序分析的方法。作為這一方法的實例,我們提出使用模仿學習框架,從符號執行中學習一個有效且快速的模糊測試器。首先,符號執行專家為大量程序生成高質量輸入數據集。然后,利用該數據集訓練一個神經網絡模糊測試器,使其模仿專家的行為。訓練好的模糊測試器隨后被部署以測試新程序。
此外,我們研究了分布漂移問題,這是阻礙深度學習模型在現實場景中有效檢測漏洞的關鍵問題。分布漂移發生在訓練和評估所用的數據集與實際遇到的漏洞分布不一致時。為了解決這個問題,我們提出了一種兩階段的訓練方法。首先,模型在大量的合成漏洞上進行訓練,然后進一步在一個更接近實際漏洞分布的數據集上進行訓練。 最后,我們從兩個互補的角度探討了代碼生成中的安全性問題。我們不僅尋求改進生成安全代碼的能力,還研究了從對抗角度降低安全級別的可能性。為實現這些目標,我們提出了一個統一的微調框架,采用專門的優化目標,既優化安全性又保持模型生成功能性正確代碼的能力。
近年來,深度學習取得了顯著進展。然而,其理論基礎,尤其在大模型領域,仍然相對滯后。本文的研究重點在于將堅實的理論基礎與大模型高效擴展的實際應用相結合。 在論文的第一部分中,我們聚焦于神經網絡的訓練動態,討論了過參數化神經網絡的理論。我們將簡要介紹神經切線核(Neural Tangent Kernel,NTK)的理論,并深入探討超參數遷移,這是一種重要的張量程序框架應用。我們將回顧一些奠定 NTK 作為研究領域的早期論文,并討論 NTK 的局限性。超參數遷移是一種新穎且高效的超參數調整范式,它提供了擴展模型的最優策略。我們將介紹深度神經網絡訓練動態的特征化,并提出一種高效的超參數選擇方案,其中通過在淺層網絡上調優選定的最優超參數同樣適用于深層網絡。 論文的第二部分集中于大模型擴展中的數據方面。我們首先介紹 Skill-Mix,這是一種新穎且獨特的評估方法,避免了傳統大型語言模型(LLM)評估中的數據污染和為排行榜“臨時抱佛腳”的問題。Skill-Mix 隨機選擇 k 種語言技能,然后提示 LLM 生成展示所選技能的簡潔文本。技能組合數量的指數級增長有效防止了數據污染,并進一步揭示了強大的 LLM 成功作答的創新性。接著,我們介紹了 ConceptMix,這是 Skill-Mix 的擴展,用于評估文本生成圖像模型結合 k 個隨機選定視覺概念的能力。最后,我們探討了 LLM 在給出優質 Skill-Mix 回答的情況下,學習和泛化技能組合的能力。結果表明,幾千條這樣的數據足以顯著提高模型在未見過的技能組合上的表現,甚至超越了尺寸更大的模型。這表明,將富含技能的合成文本融入訓練數據,是一種高效擴展數據規模的途徑。
在過去的十年里,深度學習在多個領域取得了顯著進展,尤其是在計算機視覺和自然語言處理方面。這些成就通常歸因于模型規模和數據的擴展。ImageNet [Deng et al., 2009] 通過提供一個大規模且標注豐富的數據集,極大推動了計算機視覺的發展,促成了更優模型的產生。ResNet [He et al., 2016a] 通過引入殘差連接,革新了深度學習,使得超深網絡的有效訓練成為可能,從而利用增加的模型規模提升性能。最近,隨著大規模語言模型(LLM)規模的不斷擴展,并在更大規模的語料庫上進行訓練,LLM 展現出了新的能力,例如少樣本上下文學習、推理和解決數學問題 [Brown et al., 2020, OpenAI, 2023]。
總的來說,擴展過程——即模型規模和數據集的擴大——對于開發能夠執行具有人類或超人準確性與適應性的強大 AI 模型至關重要。然而,這個過程的代價高昂,訓練大型 AI 模型,如 LLaMA-2 [Touvron et al., 2023] 和 GPT-4 [OpenAI, 2023],需要耗費數千萬甚至數億美元的計算資源。 本論文旨在深入理解擴展背后的原理,并使擴展過程更為高效,以較少的計算資源實現更高的性能。我們的工作分為兩個部分,分別探討擴展的兩個關鍵方面:模型規模和數據。
在過去的十年里,經典機器學習與現代機器學習之間的差距不斷擴大。現代學習的預測性能不可比擬地更好,但更容易對經典學習進行分析,并保證其安全性、效率、公平性等特性。在本論文中,我探討了通過審慎和戰略性地結合經典技術,是否有可能將這些期望的特性恢復到現代機器學習中。我將經典與現代學習的結合歸納為兩種高級策略:(1)封裝,即通過經典分析技術從現代的、不透明的模型中提取可靠的性能保證,或(2)替換,即從經典的基礎構建現代模型的某些組件,以提高整體的效率、可處理性和/或表達能力。這些努力在機器學習的多個領域帶來了新的進展。本論文的最重要貢獻涉及元分析,這是一種結構化的問答形式,作為循證醫學的基礎。經典元分析技術基于隨機對照試驗,其因果效度受到信任;相比之下,現代回歸模型是在大型觀察性數據庫上訓練的,其因果效度不被信任。我展示了如何在不犧牲效度的情況下將不可信的數據納入元分析中。這涉及對完全共形預測的基本改進,這些改進具有普遍的意義。在一個更聚焦的醫療保健應用中,我推廣了經典的、手工設計的心率變異性統計,使其能夠通過監督學習進行微調,成為深度神經網絡的一部分,從而生成更準確的、生理學知情的模型。我還提出了一些可以在未來機器學習模型和算法中使用的基礎計算原語。第一個是一種算法,可以在O(log T)的并行時間內(近似)運行T步非線性RNN。該算法的關鍵創新在于通過一種證明一致的局部、可并行修正方案,用深度上的非線性替代時間上的非線性。通過這種方式,經典線性動態系統(也稱為狀態空間模型)可以堆疊起來形成快速的非線性序列模型。另一個新的計算原語是在所有正交多項式序列集合上進行基于梯度的優化。這種優化形式與信號處理和優化中的許多不同問題都有聯系。最后,我提出了基于學習理論和優化中廣泛使用的幾何邊界概念的公平性標準,以規避計算的不可處理性。
隨著機器學習算法在高風險應用中不斷開發和部署,確保其可靠性已變得至關重要。本論文介紹了在機器學習中提高可靠性的算法進展,重點強調兩個關鍵維度:魯棒性和可解釋性。 本論文的第一部分側重于魯棒性,即保證算法在各種數據不確定性下仍能提供穩定和可預測的性能。我們研究了在不同數據不確定性來源下的學習魯棒性,包括基本的統計誤差以及數據噪聲和損壞。我們的研究揭示了這些不同來源如何相互作用并對數據驅動決策產生影響。我們引入了針對特定不確定性來源量身定制的新穎的分布魯棒優化方法。我們的研究結果表明,對一種來源的保護可能會增加對另一種來源的脆弱性。為了解決這個問題,我們開發了分布模糊集,能夠同時提供對所有來源的整體魯棒性。在每種情況下,我們證明了我們的新方法實現了“高效”的魯棒性,在平均性能與樣本外保證之間實現了最佳平衡。我們的新算法被應用于各種場景,包括訓練魯棒神經網絡,在這些場景中顯著優于現有基準。 本論文的第二部分探討了可解釋性,這是高風險環境下決策支持工具的一個關鍵屬性,要求算法能夠為其決策提供可理解的解釋。我們的工作在這一部分的動機來自于數據驅動的個性化患者治療——一種越來越受歡迎的機器學習應用。在這個強化學習問題中,可解釋性至關重要:醫生不能依賴于一個黑箱算法來開具治療方案。我們在理論上引入了學習連續狀態空間動態系統最簡潔離散表示的問題。在患者治療的背景下,這相當于基于患者治療過程中不斷變化的特征來確定治療組。令人驚訝的是,我們在理論上證明,僅從觀察到的歷史樣本路徑數據中就有可能學習到動態系統的最簡潔表示。隨后,我們開發了一種算法,MRL,能夠學習這種簡潔的表示,從而增強可解釋性和可操作性。
本論文的核心目標是通過提高深度學習模型的標簽和訓練效率來增強深度學習的實用性。為此,我們研究了基于信息論原理的數據子集選擇技術,特別是主動學習和主動采樣。主動學習提高了標簽效率,而主動采樣提高了訓練效率。監督式深度學習模型通常需要大量的帶標簽數據進行訓練。標簽獲取可能既昂貴又耗時,且訓練大型模型資源密集型,這限制了其在學術研究和“大科技”公司之外的應用。深度學習中現有的數據子集選擇方法通常依賴于啟發式方法或缺乏一個原理化的信息論基礎。相比之下,本論文檢查了數據子集選擇的幾種目標及其在深度學習中的應用,力求采用一種由信息論啟發的更原理化的方法。
我們首先在單次前向傳播的深度神經網絡中區分了認知不確定性和隨機不確定性,這提供了有用的直覺和洞見,關于不同形式的不確定性及其對數據子集選擇的相關性。然后,我們提出并研究了在(貝葉斯)深度學習中進行主動學習和數據子集選擇的各種方法。最后,我們將各種現有和提出的方法與在權重或預測空間中信息量的近似聯系起來。
支撐這項工作的是一個原理化且實用的信息論量符號,包括隨機變量和觀察到的結果。這篇論文展示了從統一視角出發工作的好處,并強調了我們的貢獻對深度學習實際應用潛在影響的可能性。
基于深度遷移學習的工業監控方法在近年來獲得了大量研究關注,特別是在以故障診斷、軟 測量等為代表的工業監控典型監督任務中。通過挖掘與遷移相似源域的知識來完成對目標域的建模, 這類方法為實際工業場景中變工況等原因導致的跨域監控問題提供了新的思路。本文系統梳理了面 向工業監控典型監督任務的深度遷移學習方法,并將其分為基于模型遷移、基于樣例遷移與基于特 征遷移的工業監控方法。在此基礎上,對不同類方法的基本研究思想、在故障診斷與軟測量任務中 的研究進展進行了詳細闡述。隨后,從實際工業場景的復雜欠數據問題、可遷移性的量化與負遷移 問題、工業過程的動態特性問題等角度,指出了當前基于深度遷移學習的工業監控研究中存在的挑 戰,并對該領域的未來研究方向做出進一步展望。
1. 引言
隨著現代工業不斷向高端化、復雜化趨勢發展,系統運行的安全性、可靠性面臨著更大挑戰 [1~ 3]。作為保障工業安全可靠運行的必要手段,以數據驅動的故障診斷與軟測量為典型代表的工業監 控任務在近年來獲得了大量關注 [4~6]。故障診斷旨在識別出當前系統所發生的故障類型,而軟測量 往往利用過程中較易測得的變量實現對質量變量的回歸建模。其中,質量變量一般指在工業過程中 與產品質量緊密相關的、需加以監控的過程變量,這類變量往往具有獲取成本較高、測量具有一定 延遲等特點 [7]。由于這兩類任務往往基于工業過程歷史運行過程中積累的標注樣本,有監督機器學 習方法目前在這兩類任務中得到了廣泛應用 [8~10]。近十年來,得益于深度學習算法的蓬勃發展與各類工業傳感器的廣泛部署,基于深度學習的方法在工業監控領域大放異彩。例如,基于各類卷積 神經網絡 [11~14]、遞歸神經網絡 [15, 16] 與 Transformer [17] 的方法在工業故障診斷、工業過程軟 測量任務中相較傳統機器學習方法獲得了顯著性能提升。然而,這些方法往往假設訓練數據與測試 數據具有相同的分布 [18]。在實際工業場景中,操作條件改變、給料變化等復雜變工況現象 [19~22] 導致了顯著的訓練與測試數據分布不一致問題。這一問題為傳統深度學習方法的廣泛應用帶來了挑 戰。
近年來,隨著深度遷移學習方法的興起,通過挖掘與遷移相似源域的知識來完成對目標域的建 模,為解決上述問題提供了新的思路 [23]。一般來說,深度遷移學習方法以深度神經網絡為基礎,通 過利用源域中的數據或模型,進一步結合目標域中的有限數據,以完成知識的遷移過程。不同于傳 統基于機器學習的工業監控方法對不同域單獨建模并決策,基于深度遷移學習的工業過程監控方法 往往利用源域中的知識來協助目標域中模型的建立。這一過程本質上模仿了人類可以利用從歷史經 驗中學習到的知識以輕松適應新的場景這一能力。基于此理念,近年來深度遷移學習方法在工業監 控領域中受到了大量關注。在谷歌學術網站1)中分別以 ““deep transfer learning” “fault diagnosis” OR “soft sensor”” 和 ““深度遷移學習” “故障診斷” OR “軟測量”” 作為組合關鍵詞進行中英文文獻 搜索,可以得到相關領域歷年中英文發表文章數量的發展趨勢。如圖1所示,在過去的五年中,本領 域的相關研究經歷了飛速發展,其中,英文文獻數量從 2017 年的 4 篇增長至 2021 年的 990 篇,中 文文獻數量從 0 篇增長至 28 篇,顯示出相關學者對本領域的關注不斷提升。當前,國內外學者針 對基于深度遷移學習的故障診斷與軟測量問題進行了大量的研究,也有一些工作對相關研究進行了 整理與綜述。例如,文獻 [23] 根據傳統遷移學習中的不同任務場景,將遷移學習分為歸納式、直推 式以及無監督的遷移學習。Tan 等人 [24] 根據在深度遷移學習任務中使用的具體方法不同,將深度 遷移學習進一步分為基于樣例、基于映射、基于網絡與基于對抗的方法。在機械設備的故障診斷方 面,目前已有若干前人工作 [25,26]。例如,Li 等人 [27] 對深度遷移學習的分類與工業應用場景進行 了總結與綜述。此外,針對流程工業的軟測量問題,Curreri 等人 [28] 根據遷移學習在不同類型工業 過程中的應用進行了梳理與討論。Maschler 等人 [29] 對深度遷移學習在工業自動化領域的若干研究 進行了簡要回顧,并討論了該類方法在印刷電路組件制造等任務中的應用。總體來看,目前工業領域中的大多數綜述工作主要關注機械設備的故障診斷問題,從深度遷移學習的角度出發對工業監控 中的工業故障診斷與工業過程軟測量領域研究進行梳理總結的文章相對較少。基于此,本文面向工 業監控中的兩種典型有監督任務,即故障診斷與軟測量,對深度遷移學習方法展開了相關綜述。其 中,故障診斷和軟測量任務一方面對提高系統安全性、提升產品質量有重要意義;另一方面其建模 往往基于工業過程歷史運行過程中積累的有監督樣本,屬于工業監控中有監督學習的典型代表。此 外,在這兩個場景中的深度遷移學習相關研究也在近年來獲得了大量學者的研究關注,屬于工業監 控領域的熱門研究方向之一。
本文的結構框架如圖2所示。首先,對基于深度遷移學習的工業監控方法現狀進行介紹。其中, 首先對深度遷移學習進行概述,進而將面向工業監控典型監督任務的深度遷移學習方法分為三個類 別,即基于模型、基于樣例與基于特征遷移的工業監控方法。在每種類別下分別對故障診斷與軟測 量兩種應用場景進行介紹。其次,從跨域工業監控中的復雜欠數據問題、可遷移性的量化與負遷移 問題,以及工業過程的動態特性問題等角度,對當前基于深度遷移學習的工業監控方法所面臨的挑 戰進行了分析。最后對本領域的未來研究方向,包括多源信息融合的跨域工業監控以及語義知識與 數據聯合驅動的跨域工業監控做出進一步展望。
**基于深度遷移學習的工業監控方法總結 **
在本小節中,將基于模型遷移、基于樣例遷移與基于特征遷移的工業監控方法的應用任務、典 型工作、方法特點與適用場景總結于表1中。如表所示,總體來看,基于模型遷移的工業監控方法往 往要求目標域中包含少量標注數據。若源域中包含充足標注數據,即可基于源域工況建立基礎模型; 反之,可利用 ImageNet 預訓練模型或計算仿真等方式實現源域模型的構建。對于樣例遷移類方法, 往往針對源域與目標域均具有標注樣本的情況,通過對源域與目標域數據進行權重學習,從而實現 可遷移樣例的挖掘。此外,樣例遷移學習對域間差異較大或不同域間具有不同故障標簽空間的場景 較為適用。最后,基于特征遷移的工業監控方法相較于其余兩類方法,在近年來獲得了更多的研究 關注。該類方法目前的主流方式是通過利用域差異度量指標或域對抗訓練的方式進行遷移,較適用 于目標域中只有無標注樣本的場景。
機器學習是一種從數據中提取預測模型,從而能夠將預測泛化到未觀察數據的技術。根據已知數據集選擇良好模型的過程需要進行優化。具體地說,優化過程在約束集中生成一個變量來最小化目標。這個過程包含了包括神經網絡訓練在內的許多機器學習管道,這將是我們在本文中進行理論分析的主要試驗場。在各種優化算法中,梯度方法因其高維可擴展性和反向傳播的自然局限性而成為深度學習中的主導算法。然而,盡管基于梯度的算法很受歡迎,但我們從理論的角度對機器學習環境中的這種算法的理解似乎還遠遠不夠。一方面,在現有的理論框架內,大多數上下界是封閉的,理論問題似乎得到了解決。另一方面,理論分析很難產生比實踐者發現的經驗更快的算法。本文回顧了梯度法的理論分析,指出了理論與實踐的差異。然后,我們解釋了為什么會發生不匹配,并通過發展由經驗觀察驅動的理論分析,提出了一些初始解決方案。
//dspace.mit.edu/handle/1721.1/143318