機器學習需要多樣化的訓練數據集才能取得良好效果。在不同國家/公司之間共享數據集往往涉及法律和隱私問題。聯邦學習是一種學習框架,其中的數據集分布在不同的智能體上,可以在不集中數據的情況下對復雜數據集進行訓練。每個智能體根據自己的數據集進行本地訓練,模型更新則集中進行。盡管這一過程看似安全,但由于每個智能體都可以任意操縱更新,因此引發了許多安全問題。目前的文獻強調了攻擊最終模型的可能方法。本論文主要關注有針對性的攻擊,其目標是對數據集中的選定標簽進行錯誤分類。論文將研究主要的攻擊和防御策略,最后提出一種基于通用對抗網絡(GAN)的新攻擊。GAN 攻擊可以破壞并穿過服務器防御機制,這說明了在實施這些機制時可能出現的問題。最后,研究并討論了提高聯邦學習安全性的可能思路。
圖 2.1: 梯度深層滲漏(DLG) 算法概覽。需要更新的變量用粗體邊框標出。正常參與者使用其私人訓練數據計算 W 以更新參數,而惡意攻擊者則更新其虛擬輸入和標簽,以最小化梯度距離。優化結束后,惡意用戶可以從誠實的參與者那里獲得訓練集。[1]
模擬作戰需要了解友軍和敵軍在既定友軍目標和可信敵軍目標方面的進展情況。在美國防部(DoD),這些目標的結構是分層的,從國家戰略層面一直到戰術層面。軍事評估旨在回答兩個主要問題: 1)是否創造了所期望的效果?對模擬作戰評估方法的研究很少。一些主要的評估應用領域是教育和游戲,它們為模擬軍事作戰評估提供了有益的借鑒。本研究從美國防部政策和這些領域的研究中總結出模擬作戰評估方法的幾個理想特征。在根據這些特征建立價值層次結構之后,本論文提供并評估了幾種可用于模擬作戰的候選方法--貝葉斯企業分析模型(BEAM)中現有的 "戰斗力與戰斗脆弱性 "方法、貝葉斯網絡、價值思維和線性規劃。每種替代方案的評估都是通過其在小型作戰模擬中的應用來進行的。然后,從 "價值思維 "和 "線性規劃 "中創造出一種替代方案,其評估結果優于其他四種方案。論文最后對線性規劃進行了總結,并提出了未來研究的想法。
與真實戰爭類似,作戰模擬需要了解友軍和敵軍的進展情況。這種知識將潛在的模擬停止條件擴展到時間之外,并允許分析與時間、資金和資產態勢相關的進展情況。雖然記錄資產的損毀和消耗品的使用情況可能會提供有價值的分析結果,但指揮官通常更關心的是一個更廣泛的問題,即這一場景是贏了還是輸了?要回答這個問題,模擬必須包含一定的勝負定義。要做到這一點,最簡單的辦法就是完成既定目標。戰斗模擬必須能夠評估作戰環境,并報告實現或未實現這些目標的進展情況。從具體的目標(如摧毀敵方所有港口)到較為抽象的目標(如實現海軍優勢),模擬中的單一作戰評估方法應具有足夠的通用性,以便在面對多種不同的勝負定義時,為勝負問題提供答案。本論文提供了這樣一種方法,可用于模擬戰爭的戰役級戰斗評估。
評估的一個直接定義是 "使用數據來證明既定目標和目的是否真正實現的過程"(1,第 554 頁)。在國防領域,美國參謀長聯席會議(JCS)將評估定義為 "在軍事行動中衡量運用聯合部隊能力的整體有效性的持續過程"(2)。一般來說,評估是一個用于持續或不斷反饋的詞,旨在改進一個過程。在更正式的場合,評估分為兩類:總結性評估和形成性評估。總結性評估,或有些人稱之為評價,是對表現進行事后審查。總結性評估的例子包括簡單的評分和與基準的比較,以及從過程產出中獲取比較結果的統計或其他分析方法。終結性評估的 "外部"(3,第 19 頁)特征自然會導致其結果的呈現是遙遠的和/或靜態的。終結性評估的一些例子包括年度人事審查和評估、學生考試和業務指標報告。相反,形成性評估關注的是持續的學習過程,目的是在特定過程中提供反饋(4)。在教育領域,形成性評估包括學生與評估者之間的合作,以 "積極創造[學生的]最佳表現"(5,第 242 頁)。形成性評估在本質上是互動的,它的目的是在一個過程結束之前提高學生的表現,利用數據(或經驗)為被評估方提供定制化的幫助。因此,形成性評估還可能包括進度跟蹤或報告。本論文重點關注戰役級模擬戰爭背景下的形成性評估方法。我們對 "如何在計算模擬中進行戰役級戰斗評估 "這一問題提出了建議。
模擬戰爭中的評估方法,尤其是用于軍事訓練或分析的模擬戰爭,應模仿實際決策者對戰爭努力的評估。在實際作戰環境中,軍事下屬和分析人員會準備一份評估報告,供指揮官了解態勢。指揮官利用評估結果為操縱作戰環境提供進一步指導。當我們在模擬作戰中模擬戰爭努力時,評估部分實際上應是下級/分析員評估與指揮官反饋相結合的模型。在第 3.1 節中,我們將這一概念納入了作戰模擬評估方法的價值層次中。此外,我們還提出了一個必要的特點,即評估方法應簡單易懂,便于向指揮官和其他決策者介紹。將評估結果歸納為不同類別(如勝利或失敗)對簡單交流非常有用,第 3.1 節將對此進行更詳細的討論。
作為聯合部隊行動的權威資料,美國聯合司令部的 "聯合出版物 3-0"(2)提供了模仿決策類型的見解。聯合司令部最關心的是 "行動評估",即 "衡量完成任務、創造條件或效果以及實現目標的進展情況 "的過程(2,第 II-9 頁)。聯合司令部聲稱,行動評估應 "從任務式指揮分析開始,由指揮員和參謀人員考慮衡量什么和如何衡量"(2,第 II-9 頁)。對于實戰中使用的計算模型而言,這一步將發生在模型運行之前,分析人員將在運行過程中設定初步目標和任何初始參數。此外,本定義中的 "目標 "是指指導行動方案的目標。目標可以是一個短語,如國防部的國家戰略目標,也可以是單項軍事任務的目標。無論如何,模擬戰爭評估方法中的目標決定了代理指揮官的注意力在哪里,以及他們建議的行動方向。
圖 1 提供了不同層次的戰爭與相應目標之間的嵌套關系。在軍事應用中,圖 1 中紫色箭頭所示的評估框架通常被稱為 "從戰略到任務 "框架(6;7;8)。在該框架中,目標之下是可評估的效果。效果 "是 "行動的結果、成果或后果"(2,第 GL-9 頁)。任務 "被視為軍事行動的最小單元,小到摧毀敵方資產,大到運送物資。有些任務本身就是目標,有些任務支持相應的目標,沒有中間影響。然而,如圖 1 所示,上級目標為下級目標提供依據,而下級目標又指導各級軍事行動。同時,評估是用于提供自下而上反饋的機制。在提供反饋時,評估應回答兩個關鍵問題: 1)"我們是否在[作戰環境]中創造了我們所期望的效果或條件?"和 2)"我們是否按標準完成了任務?(2,第 II-11 頁)。
這兩個核心評估問題的重點自然而然地將模擬戰爭的作戰評估引向形成性領域。盡管分析人員傳統上使用總結性評估方法對這些問題進行追溯性回答,但如果將形成性評估與回答這兩個關鍵問題的意圖結合起來,則可實現被動的模擬作戰環境。利用形成性評估方法,模擬環境(或指揮官)可收到與特定目標相關的作戰環境狀態的實時更新。與進行事后分析相比,形成性評估更接近于實時戰爭工作,即評估對友軍造成的戰損,以及任務匯報和關于敵方單元的情報報告。因此,本論文側重于形成性評估方法。
本論文的其余部分致力于將聯合司令部的作戰評估要求綜合為一個連貫的結構,以便在作戰建模模擬環境中有效部署評估方法。Gallagher 等人(9)利用分辨率定義了不同層次的作戰:系統/工程、交戰、任務、戰役、國防企業和整個政府。聯合司令部的條令規定,每個層次的戰斗分辨率都要分層評估。本論文并不試圖將評估范圍縮小到任何特定的交戰決議;相反,我們提出了一般結果,試圖盡可能廣泛地應用于國防部的各種應用。本研究的重點是回答兩個研究問題:
研究問題
程序化/計算機化模擬的作戰評估方法需要具備哪些特征?
如何在程序化戰爭模擬中進行戰斗評估?
下一章將通過其他主要應用領域介紹評估方法。根據第二章的經驗教訓和聯合司令部的評估指南,我們在第三章構建了一個價值層次。在第四章中,我們介紹了幾種可供選擇的評估方法,并在小型作戰模擬中對其機制進行了研究。然后,我們在第五章對這些替代評估方法在模擬戰爭中的應用進行評估。第五章最后提出了模擬作戰評估方法的建議。我們在第六章中提出了一些結束語和進一步研究的建議。
利用社交媒體獲取開源情報是一種讓軍事情報分析人員深入了解在線人群思想和想法的做法。了解一個地區的社交媒體氛圍對任何相關方都至關重要,因為通過社交媒體聯系起來的個人的力量不可低估。通過社交網絡分析,Twitter 上的用戶互動將被建模為一個加權的有向網絡。通過隱含狄利克雷分布進行主題建模,可以發現推文中的討論主題,然后將其整合到多層網絡中,這樣就可以將用戶與其參與的對話聯系起來。然后,在這個網絡中發現有影響力的用戶以及聯系緊密的個人群體,為情報分析師提供他們所面對的網絡環境的視角。
這項研究的結果表明,當分析人員通過使用更一般的搜索查詢從各種討論中收集推文時,社交網絡中包含的主題可以更有力地發現有影響力的用戶。PageRank 被認為是在此問題背景下性能最佳的影響力排名方法,同時還分析了兩種潛在的社區識別方法。通過這項研究,為軍事情報分析人員開發了一個可復制的推特活動高級自動分析流程框架。
圖 2. 多層 Twitter 網絡允許不同的節點類型和層間互動(Ramokhoro 等人,2020 年)
軍事和災難響應應用中的機器人集體需要聯盟組建算法將機器人劃分為適當的任務小組。機器人集體的任務往往包含需要多種高級機器人行為或服務的任務,而聯盟組建必須滿足這些要求。此外,高度動態和非結構化的應用領域還要求聯盟組建算法能在接近實時的時間內(即 < 5 分鐘)為超大型集體(即數百個機器人)提供接近最優的解決方案(即 > 95% 的效用)。以前的聯盟組建算法都無法滿足這些要求。初步評估發現,傳統的基于拍賣的算法運行時間太長,即使集中式模擬器包含了現實世界部署中不太可能出現的理想條件(即機器人之間的同步和完美的即時通信)。基于享樂博弈的 GRAPE 算法可以近乎實時地生成解決方案,但無法應用于多個服務集體。本手稿整合了 GRAPE 和服務模型,產生了 GRAPE-S 和 PairGRAPE-S。這些算法和兩個拍賣基線分別通過使用多達 1000 個機器人的集中式模擬器和使用多達 500 個機器人的迄今為止最大的分布式聯盟形成模擬評估進行了評估。評估結果表明,拍賣無法很好地轉移到分布式集體中,導致運行時間過長和解決方案效用較低。GRAPE-S 滿足了目標領域的聯盟組建要求,能在接近實時的情況下生成接近最優的解決方案,而 Pair-GRAPE-S 則更能滿足領域要求,能在接近實時的情況下生成最優的解決方案。GRAPE-S 和 Pair-GRAPE-S 是首批支持超大型分布式多服務集體近實時聯盟組建的算法。
多智能體搜索與任務分配(MASTA)應用廣泛,包括搜索與救援、生態監測與采樣、軍事應用等。在設計這類系統時遇到的相當大的困難是缺乏分析建模工具,這就要求研究人員和工程師依賴計算機建模與仿真(M&S)。雖然 M&S 是一種非凡而重要的工具,但它往往不容易被人類洞察,可能需要大量的時間和精力,而且往往無法快速做出決策。本論文介紹了 MASTA 的分析模型,并將其與作為基線的 MASTA 計算機實施進行了比較。分析模型的預演誤差在百分之幾以內,并能更深入地了解系統行為和參數之間的相互作用。該模型可縮短 MASTA 系統的設計時間,并通過快速決策對此類系統進行更好的控制。
圖 1:a) [15] 分類法中的三個維度:第一,可由一個機器人解決的任務 (SR) 與需要多個機器人解決的任務 (MR);第二,只能同時解決一個任務的機器人 (ST) 與同時解決多個任務的機器人 (MT)。第三,不考慮未來分配的瞬時分配與可獲得足夠信息從而需要考慮未來分配的最優分配的時間擴展分配。 b) [46] 所描述的任務類型,以及 c) 多機器人任務分配。
多機器人任務分配(MRTA)涉及由多個機器人組成的系統,而這些機器人往往無法獨立完成任務。它可以被視為一個最優分配問題。[20]. 這個問題通常很復雜,而且通常是 NP 難問題[21]。 因此,人們開發了許多不同的方法。其中最受歡迎的分散式多智能體系統是基于市場的方法。在單項拍賣中,一個智能體將開始拍賣一項任務,其他智能體將根據自己的效用出價,拍賣者將選擇獲勝者。我們感興趣的是需要搜索任務并分配任務的系統,因此我們將搜索和任務分配結合起來。在實際系統中,通信半徑和探測任務的能力是有限的,而且成本可能過高,尤其是在水下。我們建議將簡單、廉價的智能體自適應地組合起來,以創建能夠進行較遠距離通信和任務檢測的移動相控陣。我們將這些智能體稱為組成體,因為它們共同組成了一個嚎叫智能體(復合體)。據我們所知,以前的文獻中還沒有探討過這種組成智能體的想法。合成智能體的最佳形成是一個復雜的問題,因為它會影響搜索、通信和任務分配性能。如果能開發出有效的方法來組建復合智能體并使之相互作用,就能讓一大批簡單的機器人承擔起昂貴得多的設備的任務。
研究人員對帶有檢索約束條件的搜索和檢索的動態任務分配進行了研究。檢索對象是通過搜索一組位置找到的,每個機器人都能做到這一點。對象與類型相關聯;在搜索和檢索之前,會創建一個列表,列出每種類型的任務何時可以相互交付。例如,對于紅色和藍色類型,給定一個列表 {紅、藍、紅、紅},找到的任何紅色或藍色物體都能滿足要求,但只能按照指定的順序進行。首先,開發了一種擴展的順序單項拍賣,并與隱式協調(共識控制)方法進行了比較。他們發現,共識控制能更快地完成所有任務,但智能體在拍賣方法下的移動速度較慢。
一個潛在的應用領域是水下任務,在這種任務中,通信和導航的成本過高;自主水下航行器(AUV)的價格高達十幾萬美元。研究人員[13]提出了一種方法,利用水聽器,一個昂貴的水下機器人可以引導一群較簡單的廉價機器人。智能體通過發射頻率的多普勒頻移來估計相對航向,通過振幅來估計距離。組成相控陣列的智能體或許可以充當領航員,與更靠近水面的飛行器進行通信,以進行導航。
動物界也有智能體聚集在一起,發出更強的信號。例如,螢火蟲(雷蟲、閃電蟲)在交配季節會用生物發光相互吸引。當螢火蟲聚集在一起時,它們的發光強度會增加,從而吸引更遠處的螢火蟲。因此,某些螢火蟲物種會同步發光,數百只螢火蟲一起以恒定的頻率照亮樹木,中間則是完全的黑暗[19]。
論文旨在對智能體搜索和任務分配在一系列參數(如智能體數量、探測半徑、任務數量等)下的性能進行數學建模。這些模型旨在加深對 MASTA 系統的理解,減少設計時間和計算需求。此外,數學模型還有助于設計和開發 MASTA 控制器。我們的目標是回答以下研究問題:
1.是否有可能對 MASTA 系統進行數學建模?
2.這些模型是否能加深對 MASTA 的理解?
3.這些模型是否減少了計算需求?
第 2 節介紹了背景材料,包括論文相關領域的簡短概述。第 3 節介紹了實施的計算機模型和軟件。第 4 節包含實驗和結果分析。第 5 節討論第 4 節的結果。最后,在第 6 節中得出結論,并提出今后工作的設想。
當前的多域指揮和控制計算機網絡需要大量監督,以確保可接受的安全水平。防火墻是網絡邊緣的主動安全管理工具,用于確定惡意和良性流量類別。這項工作旨在通過深度學習和半監督聚類來開發機器學習算法,以便在大規模網絡中通過網絡流量分析對潛在威脅進行剖析。為了實現這些目標,本研究利用深度學習對數據包級的企業網絡數據進行分析,從而對流量模式進行分類。此外,本研究還檢驗了幾種機器學習模型類型和多種不平衡數據處理技術的功效。這項工作還結合了數據包流來識別和分類用戶行為。對數據包分類模型的測試表明,深度學習對惡意流量很敏感,但與傳統算法相比,在識別允許流量方面表現不佳。不過,不平衡數據處理技術為某些深度學習模型帶來了性能優勢。相反,半監督聚類能準確識別和分類多種用戶行為。這些模型為學習和預測未來流量模式提供了自動化工具。在大規模網絡中應用這些技術可以更快地檢測到異常情況,并讓網絡運營商更好地了解用戶流量。
當前用于自動規劃的戰斗模擬軟件開發在其方法中沒有考慮到戰爭迷霧。這使得他們的輸出不太現實,因為在現實世界的規劃中不可能有精確的敵人位置。人工智能控制的部隊應該能夠在沒有信息的情況下運作,而這些信息在相同的情況下是人類無法獲得的。本文提出了一種AI智能體在給定典型情報的情況下預測和評估敵方兵力位置的方法。我們還提出了一種方法來匯總這些位置的風險影響。我們在一個戰斗模擬環境中展示了這些技術,并評估了它們在多個戰斗場景中的表現。結果顯示了戰斗模擬中不確定性的重要性,并說明我們的風險匯總方法是有效的。
在將人工智能(AI)技術與作戰模擬相結合時,重要的是要將戰爭迷霧的考慮因素包括在內并加以考慮。目前的自動規劃方法依賴于對敵方部隊位置的完美了解,使得人工智能控制的智能體行動不太現實。為了使智能體的行為更加自然,人工智能兵力應該接受與人類指揮官在類似情況下可用的相同類型和數量的信息并采取行動。這將要求人工智能依賴對其對手和環境條件的理解,就像人類一樣。
這篇論文著重討論了人工智能在模擬環境中處理戰爭迷霧的能力的兩個方面。第一個方面是人類對提交給人工智能的關于敵人和環境的知識的表述。這包括敵人的優先級和程序,以及環境因素,如能見度和視線。第二方面是當給定這些知識時,人工智能可以預測戰霧中可能的敵人位置,并評估可能的敵人編隊的風險影響。
關于第一個方面,我們審查了人工智能在模擬環境中跟蹤對手和戰術注釋的方法。我們發現有必要將戰斗地形離散為一個導航圖。這個導航圖將有支持實體運動的邊和可以被注釋的節點,為人工智能代理提供戰略信息。我們還確定了在戰斗模擬環境中對單位幾何的戰術評估技術。
然后,我們發現適用于檢查軍事決策過程(MDMP)中進行的分析,特別是由戰斗空間情報準備(IPB)產生的產品。IPB的輸出包括將已知的對手戰術分層到當前的作戰環境中,以產生一個預期的敵人行動路線(ECOA),如圖1所示的態勢模板。
節點的戰術注釋可以看作是圖1中所示的頂層敵人威脅模型。當這些注釋被應用于地形的導航圖(環境層)時,其結果是將ECOA編碼到模擬中。然后,我們可以評估潛在的敵人位置與編碼的ECOA有多大的一致性。
我們把這種評估稱為編隊評分函數。這個評分函數是讓人工智能預測和評估戰爭迷霧中風險的起點。該函數產生一個數字分數,它取決于一個給定的敵方編隊在保持理想的單位幾何形狀和火力掩護的同時瞄準目標優先事項的能力。分數越高,表明越符合編碼的ECOA的要求。我們把一個能使給定評分函數最大化的編隊稱為預測。
不幸的是,識別一個最大化的編隊并不是一項微不足道的任務,因為它涉及到多個實體平衡幾個競爭性因素以產生一個分數。我們采用的方法是將未被發現的實體隨機放置在地形上的可能位置,讓它們爬到對陣型得分貢獻最大化的位置。通過幾輪的隨機放置和爬坡,產生了候選陣型集,每個陣型都是評分函數的局部最大值。每個編隊由一組不同的敵人實體位置和導航圖中節點的相關威脅值組成。
然后,我們使用吉布的典型集合方程,將候選集合中的每個編隊視為實際敵方編隊可能處于的一種 "狀態"。這使我們能夠為候選集合中的每個編隊計算出一個概率值。然后,我們可以根據每個編隊的計算概率來匯總其節點威脅值。這使我們能夠將可能的敵方陣地的估計風險表示為一個單獨的圖,我們稱之為不確定性威脅圖。由于該圖僅由現有的情報產品和觀察結果產生,它不依賴于人類指揮官無法獲得的無關信息。
本論文介紹了我們在WOMBAT XXI(WXXI)中對這些方法的實施和評估,WXXI是一個用Unity 3D游戲引擎構建的輕型戰斗模擬環境(圖2)。
使用WXXI的單位模板和真實世界的地形表現,我們進行了60次模擬戰斗,跨越三個不同層次的敵軍陣地信息。這些戰斗模擬了攻擊一個藍軍排,對抗一個靜態的紅軍小隊。在第一種情況下,我們將藍方的知識限制在一組探測到的紅方防御者。在第二種情況下,我們使用檢測到的紅色防御者和一個陣型評分函數來產生一個不確定性威脅圖,以估計實際的紅色陣型。在最后一個場景中,藍色被賦予了關于紅色陣地的全部信息。在每場戰斗中,我們都收集了關于藍方和紅方的傷亡、零散交換率(FER)和任務完成情況的數據。我們發現,當藍方得到紅方陣地的估計時,他們的表現與得到實際陣地時相當。表1提供了在三個戰斗場景中收集到的定量數據。
論文中預測和不確定性建模的新方法在自動計劃和改善兵棋推演中人工智能控制的兵力方面有很大的應用潛力。論文還提供了運動到交戰行動的進一步測試實例,并提供了一種使用編隊評分功能的計劃識別方法。最后,我們為WXXI作戰模擬環境貢獻了附加功能。
盡管近年來機器學習技術不斷進步,但最先進的系統對 "真實世界 "的事件缺乏魯棒性,即部署的系統遇到的輸入分布和任務將不限于原來的訓練環境,而系統將需要在部署時適應新的分布和任務。這一關鍵差距可以通過開發 "終身學習 "系統來解決,該系統能夠:1)持續學習,2)轉移和適應,以及3)可擴展性。不幸的是,提高這些能力的工作通常被當作獨立的研究領域來評估,而沒有考慮到每個獨立能力對系統其他方面的影響。相反,我們提出了一個整體的方法,使用一套指標和一個評估框架,以一種有原則的方式評估終身學習,而不考慮具體領域或系統技術。通過五個案例研究,我們表明這套衡量標準可以為各種復雜的終身學習系統的發展提供參考。我們強調了所提出的這套指標是如何量化終身學習系統開發過程中的性能權衡的--包括廣泛討論的穩定性-彈性困境和新提出的樣本效率和穩健學習之間的關系。此外,我們還提出了制定和使用衡量標準的建議,以指導終身學習系統的持續發展,并在未來評估其進展。
這項工作提出了一個支持決策過程的算法框架,其中終端用戶在領域專家的協助下解決一個問題。此外,終端用戶和領域專家之間的交流的特點是問題和答案的數量有限。開發的框架可以幫助領域專家向終端用戶精確定位少量的問題,以增加其見解正確的可能性。建議的框架是基于領域專家的知識,包括與領域專家和終端用戶的互動。領域專家的知識由知識圖譜表示,而終端用戶與問題相關的信息作為證據被輸入圖譜。這就觸發了圖中的推理算法,該算法向領域專家建議最終用戶的下一個問題。本文在醫學診斷領域提出了一個詳細的建議框架;然而,它也可以適應具有類似設置的其他領域。我們開發的軟件框架使決策過程以互動和可解釋的方式進行,這包括使用語義技術,因此是創新的。
近年來,"大數據 "世界獲得了巨大的發展動力,并不斷產生機遇和挑戰[1,2]。大數據的各種用途已經滲透到技術世界的幾乎每一個領域。我們對在處理決策過程的技術領域整合大數據的挑戰感興趣,以便利用這些過程。
這些過程可以在各種各樣的內容世界(醫學、商業、教育等)中找到,并且需要了解情況意識、數據建模以及提供智能見解的算法。然而,這些過程為不同的需求提供不同的答案;因此,有幾種類型的決策過程,每一種都有合適的設置[3,4]。
在這項工作中,我們專注于具有以下設置的決策過程:(a)該過程涉及兩個實體:一個最終用戶和一個領域專家,(b)最終用戶啟動該過程,(c)兩個實體之間存在互動,包括(領域專家的)問題和(最終用戶的)答案,(d)兩個實體之間的互動盡可能有限(在時間、問題數量、金錢等方面)。
鑒于上述情況,本報告的目的是提供一個基于語義技術的框架,該框架能夠整合大數據,在決策過程中協助領域專家,向他們建議一套針對最終用戶的問題(從數據中推斷出來的),這將減少問題和答案的循環。 考慮以下兩個領域的例子,其流程自然適合這樣的設置:醫療診斷[5]和家電維修[6](表1)。
如前所述,上述兩個領域包含了一個兩方面的有限互動。這種限制可以用時間、問題的數量等來表示。請注意,醫療和家電維修這兩個領域都是寬泛的領域,可以被專門化為特定的子領域。例如,家電維修領域可以被專業化為建筑服務、互聯網服務、家庭故障服務等。醫療領域也是如此。它也可以包含一些子域,如各領域的醫療咨詢(如心理學)、緊急醫療電話的處理等。
建議的框架包括兩個主要部分:(a) 使用語義技術對相關領域專家的知識進行正式表示,特別是知識圖譜,以及(b) 一套互動的算法,從一組初始領域值(即最終用戶的先驗知識)開始,然后,基于這些先驗知識和知識圖譜表示,它將向最終用戶提出具體問題。這些問題的答案將推動領域專家的決策過程,并成為下一次迭代的輸入。迭代將繼續進行,直到領域專家感到滿意并做出決定。
我們有動力通過知識圖譜來表示專家的知識,因為圖譜已經成為表示連接數據的一種自然方式[7]。在過去的十年中,人們努力將大量的數據組織成節點和邊的集合,特別是在推薦系統、搜索引擎優化和決策過程中[8,9,10]。由此產生的靈活結構,稱為知識圖譜,允許快速適應復雜的數據和通過關系的連接。它們固有的互連性使人們能夠使用圖算法來揭示隱藏的模式和推斷新的知識[11,12,13,14]。此外,知識圖譜在計算上是高效的,并且可以擴展到非常大的規模,社會圖譜分析就是一個例子[15,16]。
我們的框架受到了Musen和他的同事[17]的啟發,他們是生物醫學信息學領域的知名研究者,提出了關于協助臨床決策支持(CDS)的信息技術的看法。Musen等人[17]提出了提供CDS的系統的指導原則:他們的論述是關于交流而不是檢索信息,建議而不是產生報告,以及協助領域專家發展更多的知情判斷。分別來說,引導我們開發框架的概念是為領域專家提供從分析圖表示的相關數據中推斷出的建議,并使他能夠做出明智的決定。然而,另外一個領先的概念是以有限的迭代次數來進行。我們的框架可以擴展到其他領域。
在所提交的工作中,我們為一個交互式框架引入了一種新的方法,以支持以有限的交互次數為特征的決策過程。該框架通過使用圖數據模型、圖算法和語義技術,以通用的方式進行創新。我們在一個真實的數據集上運行我們的算法,并在一個可能的現實場景中展示框架的可行性。因此,我們為我們的框架提供了一個概念證明。
為了說明擬議的框架,我們首先回顧了知識圖譜和決策過程(第2節)。然后,我們定義了該框架的術語和算法(第3節)。隨后,我們在醫學診斷領域使用由疾病和病人癥狀組成的數據集來演示該框架(第4節)。最后,我們總結并考慮潛在的未來方向(第5節)。
這一節中介紹了所提出的框架,其中包括一個算法集合和它們之間的互動。
目標是基于互動的決策過程。互動是在領域專家和終端用戶之間進行的,結果是有限的迭代,由框架建議領域專家問終端用戶的問題組成。決策過程將根據終端用戶的回答而進行。
當分析這些類型的過程時,我們得出結論,它們可以被籠統地建模為一個癥狀和疾病的集合。最終,該過程的目標是協助領域專家決定診斷(即在分析現有數據的基礎上為一組給定的癥狀提供解釋)。Musen將診斷過程描述為決定要問哪些問題,要做哪些測試,或要執行哪些程序[7,17]。診斷過程中可能出現的問題有以下幾種類型。終端用戶是否有一個特定的癥狀?
上述術語(即癥狀、疾病、問題和診斷)產生的行話可以自然地用于醫學診斷領域,然而它也適用于其他領域,如家電維修:癥狀代表問題,疾病代表故障,診斷是一種故障識別,一個典型的問題可以是。終端用戶的電器有什么特別的問題嗎?
當在提議的框架中使用這個行話時,我們用假設一詞來代替診斷,因為該框架并不向領域專家提供診斷,而是提供可能的假設。每個假說實際上是一種潛在的疾病,它伴隨著一個問題,是表明疾病(假說)的癥狀。因此,我們在本文中用來描述框架及其各種算法的行話包括:癥狀、疾病、問題和假設。特別是,該框架推斷出假設及其相關的問題,并將它們提交給領域專家,后者決定是否使用(或不使用)這些問題來確認(或不確認)這些假設(疾病)。
在本節的其余部分,我們將描述該框架及其算法,首先是一般的,然后是詳細的。
一般來說,我們首先從原始數據建立一個知識圖譜,這將有助于探索疾病和癥狀之間的關系。在此之后,我們在KG上使用魯汶分層聚類法[21](算法1)來尋找社區(即具有類似癥狀的疾病群)。然后,給定最終用戶報告的癥狀(稱為證據癥狀),我們使用KG上的推理找到與證據癥狀相匹配的可能疾病(算法2)。在這一點上,我們推斷出最可能的社區,以包括最終用戶的疾病,并向領域專家建議一個表明這個社區的問題(癥狀)(算法3)。最后,我們找到最佳假設建議給領域專家(算法4),也就是說,我們向領域專家建議最終用戶可能有的疾病和癥狀,以解決診斷過程的改進。
整個框架分為兩個主要部分:第一部分,預處理部分,在框架啟動后進行;而第二部分,處理部分,在每次有新請求到達框架時進行。預處理部分包括兩個步驟和一個算法(算法1),而處理部分包括三個步驟和三個算法(算法2-4),正如我們在下面描述的那樣。
我們使用的數據結構包括代表KG的結構(默認是鄰接列表)和運行算法所需的額外結構。在下面描述算法的段落中,我們將詳細介紹這些結構和它們的用途。
預處理部分:
輸入:一個疾病及其癥狀的列表
第1步:構建一個疾病和癥狀的知識圖(KG)(見第3.1節)。
第2步:根據疾病的癥狀將其聚類為一組(稱為社區),即具有類似癥狀的疾病將在同一個社區中(算法1)。
輸出:(1)每一種疾病都與KG中的一個社區相關聯;(2)額外的數據結構,稱為癥狀社區矩陣(SCM),表示疾病組和各種癥狀之間的聯系 處理部分:
輸入:K證據癥狀
第一步:尋找最可能的疾病,即與證據癥狀相匹配的可能疾病(算法2)。
第2步:推斷并向領域專家建議(根據需要重復)一個問題(癥狀),表明最可能的社區包括最終用戶疾病(算法3)。
第3步:推斷并向領域專家建議一個假說(最終用戶可能患有的疾病)及其相關問題(癥狀)的列表,并按相關性排序(算法4)。
圖1顯示了整個建議框架的高級視圖。
機器學習模型受益于龐大而多樣的訓練數據集。然而,單個組織很難收集足夠多樣化的數據。此外,數據的敏感性和政府法規(如GDPR、HIPPA和CCPA)限制了組織與其他實體共享數據的方式。這迫使擁有敏感數據集的組織開發只在局部最優的模型。聯邦學習(FL)通過實現在不共享敏感數據的情況下開發全局模型,促進了魯棒的機器學習。然而,部署FL系統有兩個廣泛的挑戰:隱私挑戰和訓練/性能相關的挑戰。隱私方面的挑戰涉及到暴露本地客戶數據敏感信息的攻擊。與訓練/性能相關的挑戰包括高溝通成本,跨客戶的數據異構,以及缺乏個性化技術。為了使FL實用、可擴展和有用,必須解決所有這些問題。在這篇論文中,我討論了我為解決這些挑戰而設計的技術,并描述了我為緩解這些挑戰而開發的兩個系統——PrivacyFL(用于FL的隱私保護模擬器)和DynamoFL(用于FL的易于使用的生產級系統)。
隨著數據越來越多地存儲在不同的筒倉中,社會越來越關注數據隱私問題,傳統的人工智能(AI)模型集中訓練正面臨效率和隱私方面的挑戰。最近,聯邦學習(FL)作為一種替代解決方案出現,并在這種新的現實中繼續蓬勃發展。現有的FL協議設計已經被證明對系統內外的對抗是脆弱的,危及數據隱私和系統的魯棒性。除了訓練強大的全局模型外,最重要的是設計具有隱私保障和抵抗不同類型對手的FL系統。在本文中,我們對這一問題進行了第一次全面的綜述。通過對FL概念的簡明介紹,和一個獨特的分類涵蓋:1) 威脅模型; 2) 中毒攻擊與魯棒性防御; 3) 對隱私的推理攻擊和防御,我們提供了這一重要主題的可訪問的回顧。我們強調了各種攻擊和防御所采用的直覺、關鍵技術和基本假設。最后,我們對魯棒性和隱私保護聯合學習的未來研究方向進行了討論。
//www.zhuanzhi.ai/paper/678e6e386bbefa8076e699ebd9fd8c2a
引言
隨著計算設備變得越來越普遍,人們在日常使用中產生了大量的數據。將這樣的數據收集到集中的存儲設施中既昂貴又耗時。傳統的集中式機器學習(ML)方法不能支持這種普遍存在的部署和應用,這是由于基礎設施的缺點,如有限的通信帶寬、間歇性的網絡連接和嚴格的延遲約束[1]。另一個關鍵問題是數據隱私和用戶機密性,因為使用數據通常包含敏感信息[2]。面部圖像、基于位置的服務或健康信息等敏感數據可用于有針對性的社交廣告和推薦,造成即時或潛在的隱私風險。因此,私人數據不應該在沒有任何隱私考慮的情況下直接共享。隨著社會對隱私保護意識的增強,《通用數據保護條例》(GDPR)等法律限制正在出現,這使得數據聚合實踐變得不那么可行。
在這種情況下,聯邦學習(FL)(也被稱為協作學習)將模型訓練分發到數據來源的設備上,作為一種有前景的ML范式[4]出現了。FL使多個參與者能夠構建一個聯合ML模型,而不暴露他們的私人訓練數據[4],[5]。它還可以處理不平衡、非獨立和同分布(非i.i.d)數據,這些數據自然出現在真實的[6]世界中。近年來,FL獲得了廣泛的應用,如下一個單詞預測[6]、[7]、安全視覺目標檢測[8]、實體解析[9]等。
根據參與者之間數據特征和數據樣本的分布,聯邦學習一般可以分為水平聯邦學習(HFL)、垂直聯邦學習(VFL)和聯邦遷移學習(FTL)[10]。
具有同構體系結構的FL: 共享模型更新通常僅限于同構的FL體系結構,也就是說,相同的模型被所有參與者共享。參與者的目標是共同學習一個更準確的模型。具有異構架構的FL: 最近的努力擴展了FL,以協同訓練具有異構架構的模型[15],[16]。
FL提供了一個關注隱私的模型訓練的范式,它不需要數據共享,并且允許參與者自由地加入和離開聯盟。然而,最近的研究表明,FL可能并不總是提供足夠的隱私和健壯性保證。現有的FL協議設計容易受到以下攻擊: (1)惡意服務器試圖從個人更新中推斷敏感信息,篡改訓練過程或控制參與者對全局參數的看法;或者(2)一個敵對的參與者推斷其他參與者的敏感信息,篡改全局參數聚合或破壞全局模型。
在隱私泄露方面,在整個訓練過程中,通信模型的更新會泄露敏感信息[18]、[19],并導致深度泄露[20],無論是對第三方服務器還是中央服務器[7]、[21]。例如,如[22]所示,即使是很小一部分的梯度也可以揭示相當數量的有關本地數據的敏感信息。最近的研究表明,通過簡單地觀察梯度,惡意攻擊者可以在[20],[23]幾次迭代內竊取訓練數據。
在魯棒性方面,FL系統容易受到[24]、[25]和[26]、[27]、[28]、[29]的模型中毒攻擊。惡意參與者可以攻擊全局模型的收斂性,或者通過故意改變其本地數據(數據中毒)或梯度上傳(模型中毒)將后門觸發器植入全局模型。模型投毒攻擊可以進一步分為:(1)Byzantine 攻擊,攻擊者的目標是破壞全局模型[13]、[30]的收斂性和性能;(2)后門攻擊,對手的目標是在全局模型中植入一個后門觸發器,以欺騙模型不斷預測子任務上的敵對類,同時在主要任務[26],[27]上保持良好的性能。需要注意的是,后門模型投毒攻擊通常利用數據投毒來獲取有毒的參數更新[24]、[26]、[27]。
這些隱私和魯棒性攻擊對FL構成了重大威脅。在集中學習中,服務器控制參與者的隱私和模型魯棒性。然而,在FL中,任何參與者都可以攻擊服務器并監視其他參與者,有時甚至不涉及服務器。因此,理解這些隱私性和健壯性攻擊背后的原理是很重要的。
目前對FL的研究主要集中在系統/協議設計[10]、[31]、[32]。聯邦學習的隱私和穩健性威脅還沒有得到很好的探討。在本文中,我們調研了FL的隱私和魯棒性威脅及其防御方面的最新進展。特別地,我們關注由FL系統內部者發起的兩種特定威脅:1) 試圖阻止學習全局模型的中毒攻擊,或控制全局模型行為的植入觸發器;2) 試圖泄露其他參與者隱私信息的推理攻擊。表2總結了這些攻擊的特性。