亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

算法和數據驅動的決策和建議通常用于刑事司法、醫學和公共政策等高風險決策環境中。我們利用 1969 年底推出的安全評估算法后立即測量的結果,研究是否有可能改進該算法。這一實證應用提出了在高風險算法決策中經常出現的幾個方法論挑戰。首先,在實施新算法之前,必須確定并控制產生比現有算法更差結果的風險。其次,現有算法是確定性的,學習新算法需要透明的外推法。第三,現有算法涉及離散決策表,這些決策表很常見,但很難優化。

為了應對這些挑戰,我們引入了平均條件風險 (ACRisk),它首先量化了新算法政策導致個體單位子群結果變差的風險,然后將其平均到子群分布上。我們還提出了一個貝葉斯政策學習框架,在控制后驗預期 ACRisk 的同時,最大化后驗預期值。這一框架將異質性治療效果的估計與政策優化分離開來,實現了對效果的靈活估計和對復雜政策類別的優化。我們將由此產生的機會受限優化問題描述為受限線性規劃問題。我們的分析表明,與越戰期間使用的實際算法相比,學習算法將大多數地區評估為更安全的地區,并強調經濟和政治因素而非軍事因素。

引言

算法和數據驅動的決策與建議早已應用于信貸市場(Lauer,2017 年)和戰爭(Daddis,2012 年)等不同領域。現在,它們越來越成為當今社會許多方面不可或缺的一部分,包括在線廣告(如 Li 等人,2010 年;Tang 等人,2013 年;Schwartz 等人,2017 年)、醫療(如 Kamath 等人,2001 年;Nahum-Shani 等人,2018 年)和刑事司法(如 Imai 等人,2023 年;Greiner 等人,2020 年)。將數據驅動政策應用于重大決策任務時,面臨的一個主要挑戰是如何描述和控制從數據中學到的任何新政策的相關風險。醫學、公共政策和軍事等領域的利益相關者可能會擔心,采用新的數據衍生政策可能會無意中導致某些人在某些情況下出現更糟糕的結果。

在本文中,我們考慮了一個特別高風險的環境,分析了在越南戰爭中使用的美國軍事安全評估政策。戰爭期間,美國軍方開發了一種名為 "哈姆雷特評估系統"(Hamlet Evaluation System,HES)的數據驅動評分系統,為每個地區得出一個安全分數(PACAF,1969 年);指揮官利用這些分數做出空襲決定。最近一項基于回歸不連續設計的分析表明,空襲對包括地區安全、經濟和公民社會措施在內的發展成果產生了顯著的負面影響,因此在很大程度上適得其反(Dell 和 Querubin,2018 年)。我們考慮是否有可能利用美國軍方和相關機構收集的同期數據來改進 HES,以反映這一事實,同時通過改變評估系統來避免許多地區發展成果惡化的風險。

特別是,最初的 HES 是由各種 "子模型分數 "組成的,這些分數根據調查反饋來衡量每個地區的不同方面(如經濟變量、地方行政管理、敵方軍事存在)。然后,該系統通過使用預定義決策表確定如何合并不同分數的三級分層匯總方法,將這些分數合并為一個單一的安全分數。然后將安全分數提交給空軍指揮官,由他們做出目標選擇決策。因此,我們的目標是通過改變基本決策表來修改 HES,找到能優化各種發展目標的決策表,同時限制個別地區這些目標惡化的風險。

這一經驗性問題提出了幾個在高風險數據驅動決策環境中通常會遇到的方法論挑戰。首先,我們希望描述和控制新的決策、分類或建議政策可能導致某些地區組(即單個單位)結果惡化的風險。其次,HES 是輸入數據的確定性函數,這意味著要學習新政策,就必須進行外推。第三,安全得分是通過使用決策表進行一系列匯總而得出的。事實上,決策表在許多公共政策和醫療決策環境中都得到了廣泛應用(例如,美國刑事司法系統中的風險評分 Greiner 等人,2020 年;Imai 等人,2023 年),但在實踐中對其進行優化卻具有挑戰性。

為了應對這些挑戰,我們引入了一種風險度量--平均條件風險(ACRisk),它首先量化了特定政策對具有一組特定協變量的個體單位群體的風險,然后將這種條件風險平均到協變量的分布上。與描述政策平均績效不確定性的現有風險度量(如 Delage 和 Mannor,2010 年;Vakili 和 Zhao,2015 年;Bai 等人,2022 年)不同,ACRisk 度量的是所學政策對子群產生負面影響的程度。這使我們能夠更好地描述應用新政策的潛在異質性風險。

有了這個風險度量指標,我們提出了一個貝葉斯安全政策學習框架,在控制后驗預期 ACR 風險的同時,最大化觀測數據的后驗預期值。我們將其表述為一個機會受限的優化問題,并展示了如何利用條件平均治療效果(CATE)的后驗分布樣本高效地解決該問題。

擬議框架的主要優勢在于其靈活性。由于偶然性約束優化問題只依賴于后驗樣本,因此可以使用流行的貝葉斯非參數回歸模型,如 BART 和高斯過程回歸(Rasmussen 和 Williams,2006 年;Chipman 等人,2010 年;Branson 等人,2019 年),同時在復雜的政策類別中高效地找到最優政策。這對于像我們這種協變量重疊有限或沒有協變量重疊的情況尤其有幫助,我們的框架允許通過貝葉斯先驗進行靈活的外推。相比之下,頻數主義的安全政策學習概念依賴于穩健優化,需要解決潛在模型類和潛在政策類的最小優化問題,因此很難同時考慮非參數模型和復雜政策類(Pu 和 Zhang,2020 年;Kallus 和 Zhou,2021 年;Ben-Michael 等,2022 年;Zhang 等,2022 年)。

我們通過模擬研究表明,控制后預期 ACR 風險可有效限制各種情況下的 ACR 風險,降低損害某些單位子群的風險。我們還發現,盡管所提出的方法設計得比較保守,但在某些信噪比較低的情況下,它所產生的新政策的平均值要高于沒有安全約束的政策。這證明所提出的安全約束能有效地規范政策優化問題。

在我們的實證分析中,我們應用所提出的方法來尋找對 HES 的調整,以獲得更好的總體結果(以軍事、經濟和社會目標為衡量標準),同時限制某些地區在新系統下的結果比在原始 HES 下更差的后驗概率。我們考慮了兩個政策學習問題--一個是我們只改變分層匯總最后一層中使用的決策表,另一個是我們同時修改所有三層分層匯總中使用的決策表。為了處理后一種復雜情況,我們開發了一種基于有向無環圖分區隨機行走的隨機優化算法,該算法普遍適用于決策表。我們的分析一致表明,原始的 HES 過于悲觀--將地區評估得過于不安全--并且過于強調軍事因素,而對 HES 進行的數據化調整則將地區評估得更為安全,并更多地依賴經濟和社會因素來得出地區安全分數。

文獻綜述

近年來,統計學家和機器學習研究人員對從隨機實驗和觀察研究中尋找最優政策的興趣與日俱增(例如,Beygelzimer 和 Langford, 2009; Qian 和 Murphy, 2011; Dud′?k et al、 2011;Zhao 等人,2012;Zhang 等人,2012;Swaminathan 和 Joachims,2015;Luedtke 和 Van Der Laan,2016;Zhou 等人,2017;Kitagawa 和 Tetenov,2018;Kallus,2018;Athey 和 Wager,2021;Zhou 等人,2022)。這些研究通常在頻繁主義框架下考慮以下兩個步驟--首先通過 CATE 確定給定政策的平均性能或價值,然后根據觀察到的數據,通過最大化估計值來學習最優政策

與此相反,我們采用貝葉斯視角--首先根據觀察到的數據獲得 CATE 的后驗分布,然后通過最大化后驗期望值來學習最優政策。貝葉斯方法已被廣泛用于因果推理(近期綜述見 Li 等人,2022b)。特別是,BART 和高斯過程經常被用來靈活估計 CATE(Hill,2011 年;Branson 等人,2019 年;Taddy 等人,2016 年;Hahn 等人,2020 年)。然而,貝葉斯方法似乎很少應用于政策學習。我們提出的框架利用了這些流行的貝葉斯非參數方法來實現安全的政策學習。

關于在無法識別 CATE 的情況下進行政策學習的文獻也在不斷增加。這些文獻包括帶有未測量混雜因素的觀察研究(Kallus 和 Zhou,2021 年)、帶有不遵守或工具變量的研究(Pu 和 Zhang,2020 年)、由于確定性治療規則而缺乏重疊的研究(Ben-Michael 等,2021 年;Zhang 等,2022 年)以及涉及潛在結果聯合集的效用函數(Ben-Michael 等,2022 年)。這些研究首先部分確定了給定政策的價值,然后通過穩健優化找到使最壞情況價值最大化的政策。我們的方法與之不同,我們只依靠后驗樣本進行政策學習,從而將估計與政策優化分離開來。

在強化學習(RL)文獻中,人們以不同的名稱研究了各種安全概念(如安全強化學習、風險規避強化學習、悲觀強化學習;見 Garc?a 和 Fernandez ′ (2015))。例如,Geibel 和 Wysotzki(2005 年)在尋找最優策略時,通過明確施加風險約束來控制代理訪問 "危險狀態 "的風險。相比之下,Sato 等人(2001 年)和 Vakili 和 Zhao(2015 年)在尋找高預期收益和低方差的最優政策時,將收益方差作為目標中的懲罰項。這些 RL 文獻主要關注在線環境,在在線環境中,算法的設計是為了避免探索過程中的風險,而我們研究的是在離線環境中應用數據驅動策略的風險。

我們還擴展了現有工作,提出了 ACRisk 概念,并將其作為優化新策略后驗預期值的約束條件。相關文獻是悲觀離線 RL,它使用值的置信下限(LCB)來量化給定策略的風險,并找到一個具有最佳 LCB 的策略(Jin 等人,2021 年;Buckman 等人,2020 年;Zanette 等人,2020 年)、 2020;Zanette 等人,2021;Xie 等人,2021;Chen 和 Jiang,2022;Rashidinejad 等人,2021;Yin 和 Wang,2021;Shi 等人,2022;Yan 等人,2022;Uehara 和 Sun,2021;Bai 等人,2022;Jin 等人,2022)。相比之下,擬議的 ACR 風險衡量的是與基線政策相比,新政策對某些群體產生負面影響的程度。

最后,我們的工作還與機會約束優化有關,后者被廣泛應用于不確定性下的決策分析(例如,Schwarm 和 Nikolaou,1999 年;Filar 等人,1995 年;Delage 和 Mannor,2007 年、2010 年;Farina 等人,2016 年)。例如,Delage 和 Mannor(2010 年)考慮了馬爾可夫決策過程的機會約束控制。他們假定獎勵分布為高斯模型,并使用機會約束優化來找到一種能以高后驗概率實現低遺憾的策略。我們的方法考慮了高斯模型之外的更一般的設置,并使用 ACRisk 的后驗期望值作為約束,這與現有的工作有所不同。

提綱

本文的其余部分安排如下。第 2 節介紹了美國在越南戰爭中的軍事安全評估、HES 以及相關的經驗政策學習問題。第 3 節介紹了正式設置,第 4 節介紹了貝葉斯安全政策學習框架和機會約束優化程序,以及通過高斯過程和貝葉斯因果森林實現。第 5 節介紹了評估我們建議的數值實驗。第 6 節將貝葉斯安全策略學習方法應用于軍事安全評估問題。第 7 節總結并討論了局限性和未來方向。

圖 1:20 個子模型分數的匯總。哈姆雷特評估系統 (HES) 使用 20 個子模型分數作為輸入,并使用雙向和三向決策表對其進行匯總。每個圓圈對應一個基于雙向或三向決策表的聚合,不同圓圈使用的決策表相同。

本文提出的方法

現在,我們介紹貝葉斯安全政策學習框架。首先,我們引入了一個新的風險度量--平均條件風險(ACRisk),它表示新政策在協變量條件下產生比基準政策更差的預期效用的概率。然后,我們建議最大化新政策的后驗預期值,同時限制后驗預期 ACRisk。我們的方法包括兩個步驟:首先使用靈活的貝葉斯模型估計條件平均治療效果(CATE),然后找到最優政策。我們將其表述為一個機會約束優化問題,而這個問題又可以使用基于馬爾可夫鏈蒙特卡羅(MCMC)從 CATE 后驗分布中抽取的線性規劃來解決。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

決策支持是一個至關重要的過程,它能為決策者提供必要的洞察力,使其做出明智的選擇,從而提高任務準備狀態并優化資源分配。要提供有效的決策支持,顧問和分析人員必須理解決策者的優先事項,并采用能靈活、即時地直觀呈現資源情況的決策支持工具。在本研究中,主張實施專門設計的數據分析工具,通過數據分析協助管理決策。評估重點是未來創建戰略決策儀表板的潛在解決方案。評估了數據分析工具在整個決策過程中提供與管理決策相一致的決策支持能力。這項研究深入探討了每種數據分析工具的優缺點。理想的設計應為決策者提供數據可視化技術,使他們能夠做出明智的管理決策,確保資源效率和組織目標的實現。總之,所開展的研究支持使用合適的數據分析工具和未來開發戰略決策儀表板。

付費5元查看完整內容

本論文提出開發一種彈性機器學習算法,可對海軍圖像進行分類,以便在廣闊的沿海地區開展監視、搜索和探測行動。然而,現實世界的數據集可能會受到標簽噪聲的影響,標簽噪聲可能是通過隨機的不準確性或蓄意的對抗性攻擊引入的,這兩種情況都會對機器學習模型的準確性產生負面影響。我們的創新方法采用 洛克菲勒風險最小化(RRM)來對抗標簽噪聲污染。與依賴廣泛清理數據集的現有方法不同,我們的兩步流程包括調整神經網絡權重和操縱數據點標稱概率,以有效隔離潛在的數據損壞。這項技術減少了對細致數據清理的依賴,從而提高了數據處理的效率和時間效益。為了驗證所提模型的有效性和可靠性,我們在海軍環境數據集上應用了多種參數配置的 RRM,并評估了其與傳統方法相比的分類準確性。通過利用所提出的模型,我們旨在增強艦船探測模型的魯棒性,為改進自動海上監視系統的新型可靠工具鋪平道路。

藍色亞馬遜管理系統

機器學習(ML)發展迅速,使機器能夠根據數據分析做出決策。計算機視覺(CV)是這一領域的一個專業部門,它使用先進的算法來解釋視覺信息,通過創造創新機會來改變汽車、醫療、安全和軍事等行業。在軍事領域,這些工具已被證明在改進決策、態勢感知、監視能力、支持行動以及促進在復雜環境中有效使用自主系統等方面大有裨益。

我們的研究主要集中在將 CV 原理應用于海軍領域,特別是解決二元分類問題,以顯示船只的存在與否。這構成了更廣泛的監視工具的重要組成部分,并采用了一種名為 "Rockafellian 風險最小化"(RRM)[1] 的新策略。RRM 方法旨在應對海上監控等復雜多變環境中固有的數據集標簽損壞所帶來的挑戰。我們方法的核心是交替方向啟發式(ADH),這是一種雙管齊下的策略,可依次優化不同的變量集。這種兩步迭代的過程可調整神經網絡權重并操縱數據點概率,從而有效隔離潛在的數據損壞。其結果是建立了一個更強大、更準確的海上監視和探測系統,從而增強了海軍行動中的決策和態勢感知能力。

我們的評估使用了兩個不同的數據集,即空中客車船舶探測(AIRBUS)[2] 和海事衛星圖像(MASATI)[3]。為了測試我們方法的魯棒性,我們逐步提高了這些數據集的標簽損壞水平,并觀察了這對模型性能的影響。

我們的研究在 ADH 流程中采用了兩種策略:w-優化和 u-優化。在 w 優化階段,我們試用了兩種不同的神經網絡(NN)優化器 Adam [4] 和 Stochastic Gradient Descent (SGD) [5, Section 3G],以調整神經網絡權重。u優化階段包括實施 ADH-LP(線性規劃)或 ADH-SUB(子梯度)算法,以修改每個數據點的概率,并有效隔離潛在的數據損壞。

ADH-LP 利用線性規劃進行計算優化,可提供全局最優解,但需要更多處理時間。另一方面,ADH-SUB 采用更快的子梯度方法,更適合較大的數據集或有限的計算資源。主要目的不是通過架構調整來提高性能,而是展示 RRM 方法如何提供優于傳統 ERM 方法的優勢,特別是在處理數據損壞和提高模型性能方面。

無論使用何種數據集(MASATI 或 AIRBUS),我們的研究采用 RRM 方法訓練 NN 始終優于或匹配 ERM 方法。RRM下的ADHLP和ADH-SUB算法在保持高性能水平的同時,對數據損壞表現出了顯著的適應能力,其中ADH-LP一直表現優異。總之,我們的研究結果表明,RRM 是一種穩健而有彈性的方法,可用于處理一定程度的數據損壞。

總之,我們利用 RRM 的創新方法為減少對標簽正確數據的依賴提供了一種有前途的解決方案,從而能夠開發出更強大的船舶檢測模型。這項研究在改進船舶自動檢測和整體海事安全方面邁出了一大步。通過有效處理數據損壞和測試創新方法,我們提高了海事監控系統有效監控沿海和劃界海域的能力。

付費5元查看完整內容

信息是國家力量的重要組成部分,每天都有新的信息敘事出現。有些信息值得領導者關注,而另一些則缺乏足夠的牽引力。在信息戰的背景下,領導者必須了解新興敘事的關鍵指標,以確定其重要性。面對領導者不知道社交媒體故事是否重要的問題,我們創建了一個儀表板,幫助領導者識別信息戰活動及其影響。該方法包括衡量不同報道的四個指標:到達率、病毒性、傳播以及有機與無機活動。綜合來看,這些指標顯示了敘事的傳播方式、傳播速度、真實性和影響力。當這些指標被包裝成可視化儀表盤時,就能在信息維度的戰略環境中做出明智的決策。

引言

信息領域每天都會出現新的敘事和故事,其中一些對民族國家具有重大影響。敘事可能是對組織決策的回應,例如美國決定殺死或抓獲本-拉登。其他敘事可能涉及競爭對手的活動,如伊朗的#CalExit活動旨在鼓勵加利福尼亞州離開美國。這些只是信息戰(IW)的幾個例子。隨著故事及其引發的討論的發展,一些故事獲得了牽引力和傳播力,而另一些則銷聲匿跡。本文提供了定量指標,適用于信息維度中新出現的敘述,幫助領導者確定哪些故事需要關注,哪些可以基本忽略。我們試圖衡量IW活動的覆蓋面和影響力,以幫助領導者確定這些活動是否重要。本文包括四個重點領域:傳播、病毒性、覆蓋范圍以及有機與無機活動。這些指標為領導者提供了活動的整體視角。為了了解社交媒體網絡中的信息流及其對人群的影響,我們對社交媒體中的五個主題進行了文獻綜述:網絡傳播、病毒性、營銷、效果衡量標準(MOEs)和人類行為。

圖3:為顯示信息戰指標而開發的儀表板截圖

付費5元查看完整內容

本項目的目標是提高具有智能體間通信基礎設施的多智能體分布式任務協調的效率。在這個項目的第一階段,我們探索了基于共識的捆綁算法(CBBA)在預算約束下的分布式任務分配的改進。CBBA技術的局限性在于,環境必須被所有的智能體預先知道,任務必須被明確定義,并有已知的成本和獎勵。這種技術顯然不適合在未知環境中的合作任務,在這種環境中,智能體必須一起探索和即興行動。在這個項目的第二階段,我們研究了在未知環境中執行任務的合作技術,其中智能體只有部分觀察。該研究使用多智能體捕食者和獵物游戲作為平臺。目標是讓智能體聯合定位并捕獲獵物。智能體對環境和獵物的逃逸算法沒有事先了解。他們相互交流,以獲得超出他們自己本地觀察范圍的環境信息。基于他們對環境的局部理解,智能體選擇自己的行動,包括在哪里移動以及是否與其他智能體溝通,以使團隊獎勵最大化。強化學習被應用于優化智能體的政策,以便用最少的步驟完成游戲。

第二階段研究的主要貢獻是信仰圖譜輔助的多智能體系統(BAMS)。信念圖代表了智能體在融合了傳入的信息后所保持的環境的隱藏狀態。通過將信仰圖譜與強化學習框架相結合,并向信仰圖譜提供反饋,我們加速了訓練并提高了系統可以獲得的獎勵。在不同復雜程度的環境中,使用合作的捕食者和獵物游戲對BAMS的性能進行了評估。與現有的具有信息傳遞能力的多智能體模型相比,BAMS具有以下優點。

1)訓練收斂速度快68%,使用BAMS模型訓練的智能體完成游戲的步驟少27.5%。

2)它具有強大的性能。在應用模式中,智能體的數量不必與訓練環境相同。

3)智能體之間的信息是加密的。BAMS中的信息是智能體對環境信念的學習表示的向量。它們不僅包含關于智能體和環境的當前狀態的信息,而且還包含未來的狀態。每個數字都與智能體或環境的任何物理屬性沒有對應關系。除非有經過訓練的BAMS模型,否則不可能解碼這些信息。

4)智能體在訓練中達成默契。從實驗結果來看,使用BAMS訓練的智能體似乎不需要明確的交流就能理解對方的意圖。

  1. 解碼后的信念圖為智能體的決定提供了一個粗略的解釋。信念圖解碼器與BAMS中的策略網絡一起訓練。通過比較信仰地圖和實際地圖,系統收到額外的反饋渠道,從而監督訓練過程。在執行過程中,信仰圖譜提供了一種解釋智能體隱藏狀態的方法,這可以進一步用來解釋智能體的行為。

付費5元查看完整內容

這篇論文提出了在自動化制造背景下的多智能體機器人裝配規劃的算法。我們的工作涉及到 "工廠自主權堆棧 "的許多部分。本論文的第一個貢獻是引入了一個離散工廠問題的表述,其中包括時間延長的多機器人任務分配、任務間的優先權約束和避免碰撞的約束。我們提出了一種解決此類問題的有效方法。我們算法效率的兩個關鍵是它將任務分配和路線規劃解耦,以及它能夠利用一些機器人在自己的時間表中被推遲而不對工廠的整體性能造成任何負面影響的情況。

本論文的下一個主要貢獻是針對我們的離散工廠問題的在線版本的重新規劃算法系列。在在線設置中,工廠指揮中心定期收到新的制造工作量,這些工作量必須被迅速納入整體計劃中。我們通過大量的實驗表明,我們的重新規劃方法適用于廣泛的問題。此外,我們提出的方法在應用時可以使工廠在等待收到更新的計劃時永遠不必凍結。

我們最后的貢獻是一個概念驗證系統,用于大規模的多機器人裝配計劃,包括任意形狀和尺寸的裝配體和原材料。我們的系統從原材料和一套關于這些材料如何組合的基本指令開始。然后,規劃器合成一個施工計劃,其中定義了每個有效載荷將如何攜帶(由一個或多個機器人攜帶),每個組件和子組件將在哪里建造,以及哪些特定的機器人將被分配到每個單獨和協作的運輸任務。最后,一個反應式防撞控制策略使機器人能夠以分布式方式執行建造計劃。我們在模擬中證明,我們的系統可以在幾分鐘內合成具有數百個部件的裝配體的施工計劃。雖然我們沒有解決圍繞多機器人制造的所有相關的 "現實世界 "的考慮,但我們的工作是向使用移動機器人的大規模自動化施工邁出的一小步。

付費5元查看完整內容

本文詳細介紹了以色列國防情報局(IDI)幾十年來進行的改革,形成了一個新的概念,即 "多學科情報",它挑戰了傳統 "情報周期 "模式的幾個假設。它的重點是在聯合進程和組織中合作收集和分析,利用先進技術。這一概念的邏輯最初被應用于戰術和目標情報,并逐漸演變為 "通過適應進行創新",實踐先于理論。這篇文章增加了對以色列情報的研究,以及更廣泛的對 ""英倫圈"以外的情報系統的研究。

以色列國防情報局(IDI,希伯來語為Agaf Hamodi'in或AMAN)是以色列國防軍(IDF)總參謀部的情報局,也是以色列情報系統中最大的組織。盡管是一個軍事組織,IDI也有國防級和國家級的作用。在過去的幾十年里,以色列情報局經歷了根本性的改革,導致實施了一個被稱為 "多學科情報 "的新概念。然而,雖然這些改革在以色列的專業文獻中得到了很多關注,但在廣泛的情報研究領域,這些改革卻很少成為學術研究的對象。

以色列的情報工作,特別是IDI,已經被許多學者研究過了--比如BarJoseph, Handel, Ben-Zvi, Shlaim, Hershkovitz, Kahana, Shpiro, Barnea, Gelber, Adamsky, Libel, Leslau, Sheffy, Pascovich, Magen, Jones, 和其他人。這些工作得到了前以色列情報人員的專業和學術著作的補充,如哈卡比、澤維-法卡什、加齊特、亞德林、布倫、阿米德勒、庫珀瓦瑟、阿舍、拉皮德、吉爾博阿、埃文、佐哈爾、格拉尼特、西曼-托夫、沙皮拉和其他人。此外,以色列前高級情報人員的回憶錄也對其進行了補充。近年來,關于以色列情報局當前面臨的挑戰的專業作品也在不斷涌現,這些作品通常由以色列代理從業人員撰寫,盡管是匿名的,而且只用希伯來語。

這些作品從不同角度研究以色列情報工作。其中包括1973年贖罪日戰爭中的情報失敗,歷史事件,組織事項,間諜和特別行動,分析方法,如 "魔鬼的主張",預警,對反恐的情報支持,情報和政策之間的互動,軍事情報在國家決策中的作用,與民事機構和媒體的互動,以及其他。現有的研究還研究了情報對以色列面臨的具體挑戰的貢獻--從大規模殺傷性武器,到政治和軍事方面,再到 "獨狼 "恐怖主義--在不同的地理領域。關于以色列情報部門的研究甚至已經開始研究對打擊全球大流行病的支持。

然而,廣泛的情報研究領域很少涉及以色列情報實踐的當前事項--如新興技術、收集和分析之間的互動。例如,情報研究很少研究以色列目前對 "情報周期 "的執行情況--這是公認的情報過程的順序模式,依賴于收集和分析之間的區別。因此,情報研究沒有研究以色列情報部門挑戰這種模式的方式,也沒有將以色列關于情報周期的改革與其他國家情報系統的類似改革進行比較。

本文旨在彌補這些不足。以色列情報局已經逐漸創造了一個新的概念,挑戰 "情報周期",模糊了收集和分析之間的界限。這個概念被稱為多學科情報,它創造了新的合作過程和組織,將收集和分析結合起來。它的基礎是以任務為中心,而不是傳統的以學科為中心的關于情報過程、產品和組織的理由。這個新概念的邏輯已經發展了幾十年,以一種適應性和漸進的方式,最初是針對目標和戰術情報實施。

這篇文章的主要貢獻在于增加了對以色列情報的研究。它通過提供一個關于以色列情報局收集和分析之間的互動的經驗基礎,以及關于這個領域的改革的方式,同時通過 "情報周期 "和 "情報創新 "的理論視角討論這些問題。此外,這篇文章還有助于對 "英倫圈"(美國和英國的情報系統)以外的情報系統的研究不斷深入。它可以促成國家情報系統之間的比較研究,并豐富情報改革和 "情報周期 "替代方案的理論研究。

這篇文章的范圍有限。它只關注IDI,而不是整個以色列情報界:關于其他兩個以色列情報機構,摩薩德(負責外國情報和特別行動)和沙巴克(負責國內情報和特別行動)的公開信息由于其隱蔽性而非常少。文章討論的是程序和組織,而不是情報產品的性質或質量,因為關于后者的公共信息也很匱乏。最后,文章重點討論了情報系統本身的改革和創新,而不是討論情報部門與決策者和操作者的互動。

文章的進展如下。我們首先提供了關于文章中使用的兩個主要框架的理論背景:"情報周期 "模型及其對收集和分析之間互動的影響,以及 "情報創新"。然后,我們描述了近幾十年來情報系統和IDI所面臨的新挑戰,作為IDI改革的背景。我們接著詳細介紹了自21世紀初發生的這些改革的譜系,重點是收集和分析之間的互動。最后,我們運用前幾章所描述的理論框架來理解這些改革的本質和它們的演變方式。最后,我們指出了未來研究的潛在領域。

付費5元查看完整內容

我們研究了不確定環境中的穩健和適應性的最大網絡流量問題,其中網絡參數(如容量)是已知和確定的,但網絡結構(如邊)容易受到對手的攻擊或失敗。我們提出了一個穩健和可持續的網絡流模型,以有效和主動地對抗在預算約束下運作的對手的合理攻擊行為。具體來說,我們引入了一種新的場景生成方法,該方法基于防御者和對手之間的迭代式雙人博弈。我們假設對手總是采取最佳的近視反應(在一些可行的攻擊中)來對付防御者準備的當前流量場景。另一方面,我們假設防御者考慮到對手在之前的博弈迭代中所揭示的所有攻擊行為,以產生一個新的保守的流量策略,該策略對所有這些攻擊是穩健的(最大化)。這種迭代博弈一直持續到對手和管理員的目標都趨于一致。我們表明,防御者要解決的穩健網絡流量問題是NP-hard,而對手的決策問題的復雜性隨著網絡規模和對手的預算值呈指數級增長。我們提出了兩種原則性的啟發式方法來解決大型城市網絡規模下的對抗者問題。在多個合成和真實世界數據集上的廣泛計算結果表明,與四種最先進的基準方法相比,防御者問題提供的解決方案大大增加了通過網絡推送的流量,并減少了預期的流量損失量。

本文的主要貢獻有以下幾點。

1.我們正式定義了計算關鍵基礎設施網絡的穩健和自適應的最大流量策略的問題,即利用一個被破壞的邊緣的流量可能通過有剩余容量的相鄰的邊緣改道的事實。為了解決這個問題,我們提出了一個網絡管理員和對手之間的迭代式雙人博弈,這被稱為網絡流量博弈(NFG)。

2.我們開發了新的優化模型來解決雙方在博弈的每個迭代中的決策問題。管理者的優化模型考慮到對手在以前的迭代中產生的所有攻擊策略,并計算出一個穩健的流量策略,在所有以前的攻擊中,在最壞的情況下使通過網絡推動的流量最大化。對手的決策問題檢查管理員在當前迭代中產生的流量策略,并產生一個攻擊(在給定預算約束下的可行攻擊中),以最佳方式破壞當前流量策略。

3.我們提出了兩種新的啟發式方法,用于解決大型城市網絡規模下的對手的復雜決策問題。第一種啟發式方法是一種加速的貪婪方法,它可以逐步確定要攻擊的最佳邊緣。第二種啟發式方法是一種基于網絡分區的方法,它迭代地確定網絡中要攻擊的一組最佳候選邊,然后在這些候選邊上解決對手的決策問題。

4.我們在多個合成和真實世界的基準數據集上提供了大量的計算結果,以證明我們提出的解決方法可以優雅地擴展到大規模的問題,并且比四個最先進的基準方法顯著增加了通過網絡推送的流量。

付費5元查看完整內容

本文利用基于博弈論的粒子群優化(GPSO)為多個無人駕駛飛行器(UAVs)提出了新的合作路徑規劃算法。首先,編隊路徑規劃被表述為成本函數的最小化,其中包括每個無人機的多個目標和約束條件。然后,建立了一個基于博弈論的框架,將最小化問題歸結為尋找Stackelberg-Nash均衡的問題。接下來,開發了層次化的粒子群優化算法來獲得全局最優解。仿真結果顯示,GPSO算法可以為多個無人機生成高效可行的飛行路徑,在收斂率和靈活性方面優于其他路徑規劃方法。該編隊可以調整其幾何形狀以適應工作環境。對一組三個無人機的實驗測試證實了所提出的方法在實際應用中的優勢。

付費5元查看完整內容

該研究項目的目標是開發高效的大規模非線性優化算法,以解決通信和導航方面的數據分析問題。這些問題被公認為在數學上具有挑戰性,并與空軍的利益直接相關。

在資助期間,我們成功研究了兩個研究方向。首先,我們設計了大規模非線性優化問題的最佳一階方法。在這個方向上,我們提出了兩個一階方法,可以對決策變量進行近似梯度更新。這兩種方法都可以解決分散通信的多Agent優化所產生的非線性優化問題。通過將多代理優化重新表述為約束性問題,我們開發的方法可以以最佳梯度/操作者評估復雜度來解決問題。我們開發的方法也可用于解決圖像重建問題。

第二,我們分析了機器學習模型中的解決方案質量和安全問題。在這個方向上,我們完成了兩個研究結果。我們的第一個成果是關于在多集群環境下,從二元結果的條件邏輯回歸模型中計算出來的估計值的屬性。我們表明,當每個單獨的數據點被無限次復制時,來自該模型的條件最大似然估計值漸進地接近最大似然估計值。我們的第二個結果是關于安全的矩陣乘法問題,我們設計了一種準確和安全地進行分布式矩陣乘法的方法。我們的安全協議可以確保在進行這種矩陣乘法的通信過程中沒有任何信息被泄露。

兩名博士生作為研究生研究助理得到支持,并在執行期間接受培訓。擬議項目的成果包括四篇學術期刊論文。一篇論文已經發表,另一篇正在進行第二輪審查,另外兩篇正在準備,不久將提交發表。[1-3]

付費5元查看完整內容

在新環境中有效的自主導航對于智能體達到更復雜的自主水平至關重要。我們對改善攜帶輕型光電傳感器有效載荷的車輛在未知環境中的自主導航和估計感興趣。由于傳感的限制,在非瑣碎的新環境中,世界的許多幾何結構還沒有被觀察到,導致了嚴重的幾何模糊性。盡管收集額外的幾何信息可以減少模糊性,但這樣做往往與任務的目標相抵觸。我們建議將對象層面的語義信息和幾何信息結合起來,以切實改善導航和估計。

在這篇論文中,我們提出了在新環境中改善自主導航的三個貢獻。首先,我們通過將有用的導航行為編碼在由部分占有率和對象級地圖告知的抽樣分布中,來提高新環境中的導航效率。我們認識到,在有效導航時,在有限的視角下,對象層面的估計是具有挑戰性的,因此我們還開發了兩種在線建立對象層面表征的方法。在我們的第二個貢獻中,我們通過引入額外的紋理測量和語義類形狀先驗,提高了帶有橢圓體表征的對象級SLAM的視點效率。最后,在我們的第三個貢獻中,我們提出了一種新的深度學習的三維對象估計方法,利用間接的圖像空間注釋和類內形狀一致性來實現從單一的RGB圖像的三維對象估計。

付費5元查看完整內容
北京阿比特科技有限公司