這項工作包括首個已知的基于能力的脆弱性分析過程,能夠評估暴露在核武器環境中的系統體系:核系統簇能力分析流程(NuSCAP)。該方法由 Python? 自動應用程序執行,通過調用美國戰略司令部損傷概率計算器 (PDCALC) 代碼、洛斯阿拉莫斯國家實驗室簡單核效應計算器 (SNEC) 程序和蒙特卡洛 N-Particle? (MCNP?) 代碼,計算八個核武器環境量的大小。將計算出的核武器環境值與用戶提供的模型中所有組件、子系統和系統的功能障礙閾值進行比較,以確定每個模型元素的功能。通過遍歷系統架構圖的路徑,確定殘余系統和系統級功能和能力。通過使用 Dijkstra 算法遍歷圖確定的離散退化狀態指標來報告能力。結果以 JSON 輸出文件和圖形可視化描述的形式提供。
三項案例研究展示了 NuSCAP 在三種不同的核武器爆炸場景下提供系統脆弱性分析的能力。這些研究分析了暴露于 10 千噸級核武器爆炸的具有代表性的美國陸軍常規系統。案例研究中考慮的爆炸與目標系統之間的地面距離從幾米到近 4 公里不等。由于目前無法獲得大多數組件的實際故障水平,因此研究結果是基于名義上但合理的功能障礙閾值得出的。這三個案例研究表明,NuSCAP 有能力判定核武器對軍事目標的影響并匯總損害情況,從而確定軍事系統的最大剩余能力。評估的能力包括發電、通信、目標觀察和識別以及武器系統交戰,這些能力都支持軍事單元射擊、移動和通信的基本需求。
本文討論了所需數據、這些數據的來源、現實建模和模擬面臨的挑戰以及未來的研究領域。此外,還提供了 NuSCAP 應用 Python 軟件包、數據文件和輸出文件。
這項工作研究了在任務式指揮設備中嵌入模擬器的實用性和有效性。其目標是僅使用戰區作戰計劃作為模擬輸入,向操作員隱藏所有模擬器細節,使其無需學習新工具。本文討論了一種原型功能,該功能可根據 SitaWare 中生成的作戰計劃以及嵌入式無頭 MTWS 和 OneSAF 模擬器的模擬結果,生成行動方案(COA)分析。在輸入作戰計劃后,指揮官選擇要執行的模擬運行次數,并按下按鈕啟動模擬,模擬在后臺的運行速度比實時運行更快。模擬運行完成后,指揮官可通過圖形和圖表查看結果,對多次運行進行比較。預計未來的能力將允許指揮官模擬任何梯隊和命令,用于訓練和兵棋推演。
這份國家標準與技術研究所(NIST)的可信賴與負責任人工智能報告,開發了一套對抗性機器學習(AML)領域概念的分類體系,并定義了相關術語。這個分類體系基于對AML文獻的綜述建立,按照概念層次排列,包括關鍵的機器學習方法類型、攻擊的生命周期階段、攻擊者的目標和目的、以及攻擊者對學習過程的能力和知識。報告還提供了相應的方法,以減輕和管理攻擊的后果,并指出了在人工智能系統生命周期中需要考慮的相關開放性挑戰。報告中使用的術語與AML文獻保持一致,并由一個詞匯表補充,該詞匯表定義了與人工智能系統安全性相關的關鍵術語,旨在幫助非專家讀者理解。綜合來看,這個分類體系和術語旨在為評估和管理人工智能系統的安全性的其他標準和未來的實踐指南提供信息,通過建立一個共同的語言和對迅速發展的AML領域的理解。
這份國家標準與技術研究所(NIST)的可信賴與負責任人工智能報告旨在向發展對抗性機器學習(AML)的分類體系和術語邁出一步,這反過來可能有助于保護人工智能(AI)應用免受AI系統的敵對操縱。大體上,AI系統有兩類:預測型和生成型。AI系統的組成部分至少包括數據、模型以及訓練、測試和部署機器學習(ML)模型的過程和使用它們所需的基礎設施。當適應特定領域和用例時,生成型AI系統也可能與企業文件和數據庫相連。ML的數據驅動方法在ML操作的不同階段引入了額外的安全和隱私挑戰,除了大多數運營系統面臨的傳統安全和隱私威脅。這些安全和隱私挑戰包括操縱訓練數據的敵對潛能、利用模型漏洞對AI系統性能產生負面影響的敵對開發、甚至通過與模型的惡意操縱、修改或僅僅交互來竊取有關數據中代表的人、模型本身或企業專有數據的敏感信息。在現實世界條件下,這類攻擊已被證實,其復雜性和潛在影響穩步增長。AML關注研究攻擊者的能力和目標,以及設計利用ML在開發、訓練和部署階段的漏洞的攻擊方法。AML還關注設計能夠承受這些安全和隱私挑戰的ML算法。當惡意發起攻擊時,ML的魯棒性指的是旨在管理此類攻擊后果的緩解措施。
這份報告從國家標準與技術研究所(NIST)的人工智能風險管理框架[226]中吸納了ML系統的安全性、彈性和魯棒性的概念。安全性、彈性和魯棒性是通過風險來衡量的,風險是衡量一個實體(例如,系統)受潛在情況或事件(例如,攻擊)威脅的程度以及如果發生此類事件將產生的嚴重性。然而,這份報告并沒有就風險容忍度(組織或社會可接受的風險水平)提出建議,因為這高度依賴于上下文和應用/用例的具體情況。這種風險的一般概念為評估和管理人工智能系統組件的安全性、彈性和魯棒性提供了一個有用的方法。量化這些可能性超出了本文檔的范圍。相應地,AML的分類體系是基于以下五個AML風險評估維度定義的:(i)人工智能系統類型(預測型或生成型),(ii)學習方法和攻擊發起時ML生命周期過程的階段,(iii)攻擊者的目標和目的,(iv)攻擊者的能力,(v)攻擊者對學習過程及其以外的知識。
針對ML的有效攻擊范圍廣泛,迅速發展,涵蓋了ML生命周期的所有階段——從設計和實施到訓練、測試,最終到現實世界中的部署。這些攻擊的性質和力量各不相同,它們不僅可以利用ML模型的漏洞,還可以利用部署AI系統的基礎設施的弱點。雖然AI系統組件也可能受到各種非故意因素的負面影響,比如設計和實施缺陷、數據或算法偏見,但這些因素并非故意攻擊。即使這些因素可能被對手利用,它們也不在AML文獻或本報告的范圍內。
這份文檔定義了一套攻擊的分類體系,并在AML領域引入了術語。這個分類體系基于對AML文獻的綜述建立,按照概念層次排列,包括關鍵的ML方法類型和攻擊的生命周期階段、攻擊者的目標和目的、以及攻擊者對學習過程的能力和知識。報告還提供了相應的方法來減輕和管理攻擊的后果,并指出了在人工智能系統的生命周期中需要考慮的相關開放性挑戰。報告中使用的術語與AML文獻保持一致,并由一個詞匯表補充,該詞匯表定義了與人工智能系統安全性相關的關鍵術語,旨在幫助非專家讀者理解。綜合來看,這個分類體系和術語旨在為評估和管理人工智能系統的安全性的其他標準和未來的實踐指南提供信息,通過建立一個共同的語言和對迅速發展的AML領域的理解。與分類體系一樣,術語和定義并非旨在全面,而是為了幫助理解在AML文獻中出現的關鍵概念。
北約人為因素與醫學(HFM)研究任務組(RTG)HFM-297 的成立是為了支持 "評估用于提高人體性能的增強技術"。RTG 成員在 2017 年至 2022 年期間舉行了會議。在此期間,小組定期舉行會議(面對面和虛擬會議),以確定其將考慮的增強技術的范圍。這包括制定一個框架,以指導根據一套與人類性能和任務成果相一致的定義指標對增強工具和方法進行受控評估。目標之一是分析增強技術所支持的人類性能的相對優點,并確定跨領域主題,用于建立建議的最佳做法。這包括為繼續應用和研究增強技術以支持人類在軍事環境中的表現提出建議。在開展這些活動的同時,還經常與軍事領域專家和需求持有者以及研究和行業主題專家進行接觸。
為了管理分析中考慮的增強技術范圍,RTG 決定主要關注 "增強 "任務環境和任務過程的技術(如合成環境、界面技術),而不是直接針對操作者的技術(如外骨骼、神經植入)。盡管有這樣的區別,但要嚴格區分 "環境 "和 "操作員 "之間的增強仍具有挑戰性。盡管如此,在確定了范圍之后,RTG 297 著手開發一個框架來分析這些技術,并將研究文獻中的證據與操作要求相結合。這項調查所采用的框架包括應用 "優勢-劣勢-機會-威脅"(SWOT)分析方法。本報告通過正式的 SWOT 分析,按照從部隊組建到行動再到行動后總結經驗教訓的行動時間表,對以下五個性能領域進行了細分:
對各性能領域進行 SWOT 分析后,發現所有任務領域和人類性能要求都有一些共同的主題。這些主題包括
人類性能前端考慮因素和人為因素原則是成功應用增強技術的核心;
在有效實施這些技術的過程中,對數據和信息技術基礎設施的固有依賴性,以及在制定數據標準和總體數據戰略方面持續投資和努力的必要性,以確保互操作性和可擴展性;
隨著增強技術越來越多地被軍事組織采用,安全、可靠性、隱私和道德方面的考慮將在增強技術中發揮決定性作用;
這些技術本身和可應用這些技術的任務集都具有非常動態(快速發展)的性質,這對系統評估這些技術的有效性和價值提出了重大挑戰,特別是對 RTG 研究中典型的傳統報告形式而言;
盡管如此,RTG 審查的證據表明,一些增強技術在培訓(如自適應教學系統、視覺合成環境)和作戰(如增強現實)環境中已經有了良好的記錄;以及
一些不斷發展的技術(如機器學習、性能監測、虛擬現實的觸覺界面)在近期和遠期應用中大有可為,可支持軍事人類性能和訓練,但在實際應用之前還需要進一步的研究。
考慮到 RTG 在確定研究范圍、分析框架以及與主題專家合作以確保研究的相關性方面所面臨的挑戰,該小組成員建議北約 STO 考慮采用更具動態性和響應性的流程和格式(例如,利用社區提供的信息進行基于網絡的報告輸出),以便對快速發展的技術領域(如用于人類表現和訓練的增強技術)進行研究。
圖1-2:支持感覺和認知增強的增強模型
美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)利用高分辨率傳感器、實驗室儀器和軟件技術,開發了電力測量和分析工具。為支持這些傳感器的使用,開發了一套可擴展的軟件模塊,用戶界面只需一個網絡瀏覽器。ARL 開發的用于 "嵌入式研究系統的可視化和處理 "的軟件框架和模塊稱為 ARL-ViPERS。這種基于傳感器的軟件提供了一種方法,用于配置傳感器以及與傳感器產生的數據進行交互并使其可視化,而無需在終端用戶設備上安裝任何軟件。
美國陸軍作戰能力發展司令部(DEVCOM)陸軍研究實驗室(ARL)的幾個傳感器系統原型建立在通用的模塊化數據采集、存儲、處理和通信硬件上,稱為 ARL 的自主實時電力測量和儀器系統(ARL-ARTEMIS)。ARL 的移動式無人值守地面傳感器 (ARL-MUGS) 和移動式功率計 (ARL-MPM) 就是其中的兩個例子(圖 1)。這些系統配備的軟件可用于傳感器配置,以及對電力 (EP) 系統收集的數據進行實時和后處理分析。ARL 開發的 "嵌入式研究系統可視化和處理 "軟件框架稱為 ARLViPERS。以下將 ARL-ARTEMIS 和 ARL-ViPERS 分別稱為 ARTEMIS 和 ViPERS。
ViPERS 包括嵌入式網絡應用程序(可通過用戶設備,如手機、平板電腦或個人電腦上的網絡瀏覽器訪問)和 Dataserver 應用程序(用于運行自定義處理代碼)。網絡應用程序和 Dataserver 都在傳感器上運行,共同提供用戶界面 (UI),方便用戶配置傳感器,并提供多種數據可視化工具,方便用戶進行 "邊緣 "數據分析。Dataserver 的主要職責是在后臺管理正在進行的數據處理任務,而網絡服務器則用于為用戶提供相應的用戶界面。Dataserver 可以看作是 ViPERS 的 "大腦",而網絡服務器則是 "臉面"。
所有需要的 ViPERS 軟件都在 ARL 傳感器硬件上運行;因此,用戶無需在用戶設備上安裝任何軟件。ViPERS 還考慮到了模塊化。它包括幾個用于 EP 分析的基礎模塊,用戶可以輕松擴展軟件,加入自己的模塊。用戶還可以上傳定制的處理代碼和可視化程序,這些程序將在傳感器上實時運行;詳見第 3.18 節。
本《ViPERS 用戶指南》逐步介紹了通過網絡應用程序向用戶提供的各項功能。第 2 部分提供了連接和使用 ViPERS 所需的基本信息。第 3 部分包括 ViPERS 網絡應用程序各模塊的詳細信息;第 4 部分提供 ViPERS 數據服務器的信息。有關添加新模塊和可用應用編程接口(APIs)的說明,請參閱配套的《ViPERS 實施指南》 和《ViPERS 編程手冊》。
ViPERS 軟件框架包括以下內容:
嵌入式網絡服務器,提供與傳感器交互的用戶界面;
Dataserver 應用程序,用于在傳感器后臺運行處理模塊;以及
用于長期數據存儲的嵌入式實時時間序列數據庫。用戶可將本節作為 ViPERS 的基本 "快速入門 "指南。
盡管人們對聯邦學習和貝葉斯神經網絡進行了研究,但對貝葉斯網絡的聯邦學習的實現卻很少。在本論文中,使用公共代碼庫Flower開發了一個貝葉斯神經網絡的聯邦學習訓練環境。隨之而來的是對最先進的架構、殘差網絡和貝葉斯版本的探索。然后用獨立同分布(IID)數據集和從Dirichlet分布得到的非IID數據集測試這些架構。結果顯示,貝葉斯神經網絡的MC Dropout版本可以通過聯邦學習對CIFAR10數據集的IID分區取得最先進的結果--91%的準確性。當分區為非IID時,通過概率權重的反方差聚合的聯邦學習與它的確定性對應物一樣好,大約有83%的準確性。這表明貝葉斯神經網絡也可以進行聯邦學習并取得最先進的結果。
使用FL是一個在邊緣采用人工智能的機會,并減少收集大量數據集的需要。這將極大地幫助海軍在艦隊中部署和訓練AI模型的工作。例如,通過傳統的人工智能管道,為海軍創建一個人工智能模型將需要每個指揮部合作創建一個全球數據集,無論是被動聲納還是網絡流量分析、維護或人力資源。這是一項非常昂貴和耗時的任務,隨著新數據的出現,在完成時可能已經過時了。然而,FL提供了一種方法,讓每個指揮部在他們本地的、當前的數據上訓練和部署一個模型,并將他們的模型與另一個指揮部的人工智能模型匯總。由于只傳遞模型的權重而不是整個數據集,所以通信成本也是最小的。雖然FL提出了一種在邊緣部署和訓練人工智能模型的方法,但貝葉斯網絡是一種不僅能提供預測,而且能對其評估的不確定性進行估計的模型。士兵在不確定的環境中工作,知道部署的人工智能模型何時對其預測不確定,可以防止人工智能和戰士的過度自信。這一特點可以極大地幫助人工智能-士兵團隊以更高的效率水平運作。將FL的分布式和持續學習特性以及貝葉斯NN的不確定性這兩個方面結合起來,將是海軍在各種應用中的巨大優勢,如網絡流量分析、合成孔徑雷達或無人機圖像分析,或無源聲納分析。
為了證明這一點,開發了一個FL框架來比較貝葉斯NN和它們的確定性對應物,并在本論文中分析了它們的結果。本論文的主要貢獻是在一個已知的數據集CIFAR10[2]上對這個框架進行了基準測試,以比較結果。該數據集在FL研究中被充分研究[3]-[6]。使用的人工智能模型架構是殘差網絡(ResNet)[7]。它是一個最先進的神經網絡架構,為CIFAR10數據集設定了一個基線。這使得貝葉斯ResNets可以在集中式和FL設置中與原始的最先進結果進行比較。本論文打算回答的主要問題有以下幾個:
約翰霍普金斯大學(JHU)與羅切斯特大學合作,致力于研究和開發分析技術,以支持一個更大的知識驅動的假設測試框架。該計劃的參與者負責合作開發一個數據處理框架,該框架從原始的非結構化內容(文本、圖像、帶有音頻的視頻)開始,將這些內容轉換為共享本體下的知識聲明,將各信息源的結果合并為一個知識圖譜,然后對該圖譜進行推理,提出可以從直接觀察到的內容中獲得的額外信息。我們,JHU的團隊,專注于這個過程的第一步。我們提出了一個框架,可以處理所有需要的輸入模式,但被選擇專注于多語言文本和語音(沒有計算機視覺)。我們作為一個獨立的團隊參與了該計劃的初始階段,提供分析結果作為NIST運行的全計劃評估的一部分。在第二階段,我們提供了較少的組件,只專注于文本。在項目評估期間,我們與BBN共享這些組件。在第三階段,我們的主要重點是在新提出的 "聲稱框架(claim frame) "任務下的數據注釋,這鍛煉了我們在眾包豐富語言注釋方面的背景。
我們提出了對語義分割的關注:對意義的細粒度多值化處理。由于該項目的共同目標和集中在一個單一的項目范圍內的本體,我們專注于針對共同任務的新的最先進的語言分析技術,以及針對項目本體之外的方面的新的分解性資源的開發。我們團隊的成果中值得注意的例子包括: 構建RAMs,這是第一個公開可用的多句子事件提取數據集;開發最先進的多語言核心推理模型,包括以固定內存量處理長文件的在線變體,以及專注于多人對話的新多語言數據集; 一個新的有監督的跨語言對齊方法,支持通過從英語到資源較少的語言的投射來自動創建訓練數據;一個句子級的轉述和數據增強的框架;在 "探測 "神經語言模型的新興科學方面的合作;以及開發新的分解資源和跨越一些新語言維度的分析。
在過去的十年里,語言分析的技術水平已經迅速提高。DARPA AIDA發生時,文本分析的神經模型在準確性方面正在迅速突破。這始于對之前的統計NLP管道的改進,然后分析開始被訓練成 "端到端":模型不再需要部分語音標記、同步語法分析等等,以支持整體的語言理解過程。相反,模型直接在目標輸出上進行訓練,并假定在預訓練的語言模型的參數中捕獲足夠的語言特征。AIDA結束時,社區開始考慮方法上的另一個進步,即通過像GPT3這樣的大規模語言模型(LMs)的語境學習(提示-黑客),以及對生成性LMs的普遍關注。
JHU和合作伙伴羅切斯特大學對信息提取的神經模型的技術水平做出了貢獻,同時也對探測大型語言模型的新科學做出了貢獻。模型的新科學。利用我們在分解語義學的數據集創建方面的專長,開發了專門針對信息提取的新數據集。新的數據集,專門針對AIDA計劃的提取問題(特別是在事件提取和核心推理方面)。我們開發了分解語義學的新資源,在項目的最后階段,我們致力于新的倡議 了解如何對文本中的事實主張(所謂的 "主張框架")進行注釋。
在項目評估方面,我們努力滿足NIST及其合作伙伴不斷變化的要求。我們發現,在我們所關注的部分,特別是在多語種核心參考文獻的解決方面,我們經常具有競爭力,甚至優于其他執行者。由于管道要求和知識驅動的工作流程是在項目進行過程中臨時制定的,所以大家都認為在不同的執行者之間進行協調是不容易的,特別是在評估前后的時間敏感的情況下。不幸的是,這導致JHU對管道的貢獻往往是有限的:強大的分析組件并不總是在更大的原型框架中得到充分鍛煉。與正式的評估分開,我們建立了一個獨立的分析框架,并將其開源,重新發布給社區。這個 "LOME "包(大型本體多語言提取)在AIDA計劃之外的相關應用中被采用,并以該計劃所設想的任務需求為目標。我們在AIDA中的努力部分地導致了對其他相關項目的參與,包括DARPA KAIROS和IARPA BETTER,所有這些項目的主要重點都是增強語言技術的發展。
在下文中,我們將重點介紹我們在參與AIDA項目過程中出現的關鍵方法和結果。在有參考資料的地方,我們審查了提供進一步細節的科學文章。正如我們在總結中所說,我們的成果中值得注意的例子包括: 構建了RAMS,這是第一個公開可用的多句子事件提取數據集;開發了最先進的多語言核心推理模型,包括一個用固定內存處理長文檔的在線變體,以及一個專注于多人對話的新的多語言數據集; 一個新的有監督的跨語言對齊方法,支持通過從英語到資源較少的語言的投射來自動創建訓練數據;一個句子級的轉述和數據增強的框架;在 "探測 "神經語言模型的新興科學方面的合作;以及開發新的分解資源和跨越一些新的語言層面的分析。
人類-系統集成(HSI)度量貿易空間探索環境(HMTee)是一個方便的R Shiny應用程序,用于人類因素和HSI分析問題。它構成了確定相關HSI因素的定量準則和指標的數字參考,使從業人員能夠將分析結果可視化,并為決策者提供性能模擬的視覺證據。它允許分析員、研究人員或從業人員探索和記錄假設、參數和性能指標,并隨后在相互競爭的因素之間進行權衡。
本報告旨在為開發人員或其他具有技術專長的人提供技術文件,以了解HMTee的實施情況,并將其他軟件或HSI模型與HMTee的功能相結合。本指南包括對技術方法的概述,對與HMTee集成的模型所需組件的描述(即HMTee應用編程接口[API]),以及將與該工具集成的示范模型的文檔。本指南是美國陸軍作戰能力發展司令部(DEVCOM)分析中心的另一份報告的配套文件,該報告被稱為DAC,即HSI公制貿易空間探索環境(HMTee)。整合人類系統性能量化模型的范式(Garneau,2022)。本指南打算定期更新,并將最新版本與軟件分發一起維護。
擬議的研究活動調查了眼球凝視的空間分布,作為心理負荷的實時測量。最近的研究已經成功地將眼球凝視的分布與心理負荷聯系起來。這個研究項目的范圍是設計一套實驗來分離三類任務需求(即時間上的、精神上的和物理上的)的貢獻,并確定在使用空間分布的指數作為基于眼球的適應系統的觸發器時,應考慮其中的哪一種(以及何時)。
眾所周知,眼球活動對腦力勞動負荷的變化很敏感,人們曾多次嘗試利用眼球追蹤器提供的信息來得出分配給任務的認知資源的穩定測量值。最近在我們實驗室進行的研究已經成功地將眼睛的注視點分布與心理負荷聯系起來,本報告中描述的研究活動的范圍是將三種類型的任務要求(認知、時間和物理)的貢獻分開,并確定其中哪些(以及何時)應該被考慮,以使用空間聚類的指數作為基于眼睛的適應系統的觸發。
更具體地說,這項研究的目的有三個方面:1)用大樣本和被試內設計評估所提出的措施對不同類型的任務要求的敏感性;2)評估所提出的措施作為適應性自動化的觸發器的有效性;3)用更復雜的算法擴展掃描路徑的空間分析。
鑒于這里提出的研究活動的基本性質,在實驗室實驗中使用了一個簡單的視覺-運動任務。盡管這些效果可以擴展到操作環境中,但在復雜/現實環境中的測試活動超出了本研究的范圍。
然而,這里描述的研究活動旨在調查使用眼睛注視點的空間分布作為心理工作量的實時測量,從而作為自適應系統的觸發器。這種方法可以很容易地在所有交通領域實施(見Di Nocera等人,2020),更不用說操作員坐在顯示器前的所有操作環境(如控制室)。這種方法最初是由Di Nocera, Camilli & Terenzi (2007)提出的,最近來自次要來源的證據證實,眼睛注視點的空間分布對心理工作量的變化很敏感(例如Chen等人,2022;Dillard等人,2014;Fidopiastis等人,2009;Foy & Chapman, 2018)。早期對該指數的功能意義及其對不同任務需求的敏感性的研究表明,當任務負荷取決于時間需求時,定影似乎是分散的,而定影聚類似乎取決于視覺空間需求(Camilli, Terenzi & Di Nocera, 2008)。在該研究計劃中使用的最近的鄰居指數(NNI)顯示出與其他通常被用作測量心理負荷的眼部指標相比的幾個競爭優勢。1)它提供被檢查的視覺場景的整個掃描路徑的信息,而不是取決于預先定義的感興趣的區域(就像 "熵 "那樣);2)它可以在相對較小的歷時(1分鐘)內計算,從而有可能獲得關于個人功能狀態的持續信息;3)它是基于已發表的研究,可以使用開放的工具計算,不像其他專利工具,如Marshall(2007)的認知活動指數。此外,NNI不需要事后分析(就像事件相關電位那樣),它在現實世界的環境中具有很強的可操作性,這使得它成為衡量心理負荷的一個很好的候選指標,可以適應性地觸發一些自動化系統。
這里進一步研究了該指數的診斷性,通過操縱強加給個人的需求類型(精神、時間、身體),將其與熵的方法進行比較,并試圖通過對其進行擴展。
本文提出了一個敏捷的協同模擬框架,用于開發新型飛行器的數字孿生原型。該框架能夠在飛行器設計周期的早期階段對其性能和飛行動力學進行快速評估。該框架將用于飛行動力學建模的MATLAB/Simulink環境與AGI STK Aviator任務模擬器整合為一個松散的計算回路。兩個軟件包的結合使飛機不僅可以從飛行動力學的角度進行評估,而且可以從GPS覆蓋和雷達跟蹤的整體任務角度進行評估。
這種虛擬飛行測試和評估框架的優勢在于更快地開發新的飛行器,從設計周期的早期階段就施加任務約束。在不同條件下的復雜任務場景中測試原型模型,可以及早發現設計的局限性,從而改善飛機的設計過程,減少進一步的設計成本。
本文最后以英國兩個城市布里斯托爾和卡迪夫之間的民用eVTOL飛行模擬為例進行了總結。eVTOL的空氣動力學建模是基于數值生成的數據查詢表,而任務分析是基于飛機沿途的GPS和雷達監視能力。
在過去的幾十年里,數字孿生(DTs)在航空航天工程中的逐步使用已經得到了證明。自NASA在阿波羅計劃期間首次將數字孿生體引入航空航天領域以來,真實車輛的數字模型已經幫助解決了許多問題。2002年Grieves博士提出 "數字孿生 "一詞后不久,NASA承認計算能力的進步,并將數字孿生確定為建模、仿真和信息技術領域的三大技術挑戰[1]。最近城市空中交通(UAM)概念的興起,其中電動垂直起降(eVTOL)飛機是最受歡迎的,計算能力的進步表明在飛機設計的早期階段有可能使用數字孿生原型(DTPs)。DTPs允許預測 "所設計的產品在其高低公差之間變化的部件的行為,以確定所設計的產品符合擬議的要求"[2],并且也受到諸如波音等OEM廠商的青睞[3]。如果成功的話,在商業航空工程的歷史上,這將是第一次允許在實際測試飛機被制造之前測試整體的飛機操控質量。這將允許更快和更便宜的認證過程,這對設計和制造eVTOLs的初創公司至關重要[4]。此外,這也可以減少軍用飛機從設計到樣機的時間尺度。
人們普遍認為,第一批eVTOLs雖然被設計成自主飛行器,但在之后的操作過程中,將以駕駛配置[5-6]和/或遠程控制進行測試[4]。這意味著對新飛行器的飛行/操縱質量(FQs/HQs)和飛行性能的徹底分析對于確保飛行安全是最重要的。大多數eVTOLs被設計為像直升機一樣起飛和降落,像飛機一樣飛行,垂直和水平飛行之間的中間階段稱為過渡。HQ通常是作為認證的要求而建立的,例如,歐洲航空安全局對大型運輸機的CS-25和歐洲航空安全局對大型直升機的CS-29。然而,民用飛機的HQ通常非常簡短和靈活。這與軍用飛機的總部要求相反[7-8],后者的定義更加精確,并以所謂的任務要素(MTE)為基礎。MTEs能夠將任務要素區分為不同的任務,如初始起飛、爬升、過渡等。此外,軍事領域導致了垂直/短距離起降(V/STOL)飛機的FQs/HQs規范的發展[9-11]。最著名的是V-22鶚式飛機(螺旋槳驅動)和鷂式/F-35(都是噴氣機驅動)。美國聯邦航空管理局在認證阿古斯塔-韋斯特蘭AW609傾轉VTOL飛機時,使用了這些軍事規格作為支持。民用飛機認證機構使用不同的方法進行eVTOL認證,即FAA使用所謂的混合方法,即要求來自于目前現有的法規,而EASA專門為小類VTOL飛機發布了特殊條件要求[12]。
上述討論得出的結論是,目前的eVTOL認證法規是相當靈活的。因此,在2020年啟動了研究項目[13],調查使用數字工具對新的eVTOL設計進行認證的潛力。本文提出了建模和仿真框架,以測試使用MTE的(e)VTOL飛機設計,作為定義飛行/操縱質量和飛行性能特征的手段。本文定義了所開發的框架、被調查的飛機、任務,并討論了結果和建議框架的進一步發展方向。
擬議的框架將用于飛行動力學建模的MATLAB/Simulink環境與AGI STK Aviator任務模擬器相結合。目前,該框架形成了一個松散耦合的計算回路,因為它需要在兩個軟件包之間手動傳輸數據。
圖1展示了該框架的結構,并確定了兩個軟件包之間的數據流。MATLAB/Simulink為STK Aviator提供飛機狀態,即姿態和位置,STK Aviator為飛機運行的環境建模。MATLAB/Simulink和STK Aviator的這種結合,可以從飛行動力學和整體任務的角度對飛機進行評估。例如,任務評估的一組目標可以是任務期間飛機的GPS覆蓋和雷達跟蹤。這個框架不僅可以評估飛機對預定任務的適用性,還可以在制造實際產品之前及時糾正設計問題。
近年來,針對工業生態系統的高級持續性威脅(APT)的復雜性急劇增加。這使得開發超越傳統解決方案的高級安全服務成為必須,輿論動力學(Opinion Dynamics)就是其中之一。這種新穎的方法提出了一個多智能體協作框架,允許跟蹤APT的整個生命周期。在本文中,我們介紹了TI&TO,這是一個攻擊者和防御者之間的雙人博弈,代表了一個現實的場景,雙方都在爭奪現代工業結構中的資源控制權。通過使用博弈論來驗證這種技術,我們證明,在大多數情況下,輿論動力學包括有效的第一項措施,以阻止和減少APT對基礎設施的影響。為了實現這一目標,攻擊者和防御者的模型都被標準化,并應用了一個公平的評分系統,后者用不同的策略和網絡配置運行了幾個模擬測試案例。
世界各地的公司面對的網絡安全攻擊數量明顯增長,導致了巨大的經濟損失[2]。當涉及到關鍵的基礎設施(即核電站、電網、運輸和制造系統)時,這種情況變得更加嚴重,其工業控制系統必須在所有條件下保持工作。在這里,我們處理的是SCADA(監督控制和數據采集)系統,幾十年來一直在與外部網絡隔離的情況下工作;反過來,如今它們正越來越多地整合新技術,如物聯網(IoT)或云計算,在削減成本的同時外包各種服務。因此,需要做出更大的努力來跟上這種進步,以應對這些系統可能帶來的最新的攻擊載體和可利用的漏洞。
近年來最關鍵的問題之一是高級持續性威脅(APTs),這是一種復雜的攻擊,特別是針對目標基礎設施,由一個資源豐富的組織實施。它們的特點是利用零日漏洞(零時差攻擊),采用隱蔽技術,使威脅在受害者網絡中長期無法被發現。Stuxnet是第一個報道的這種性質的威脅[6],但許多其他的威脅在之后被發現,通常是在攻擊完全執行后的幾個月[7]。在網絡安全方面,只是提出了一些機制來從整體上解決這個問題,超越了傳統的機制(如防火墻、入侵防御系統(IPS)、入侵檢測系統(IDS)、防病毒),這些機制只代表了在第一階段對APT的準時保護[21]。
在這些新穎的機制中,輿論動力學(Opinion Dynamics)[15]包括一個多智能體協作系統,通過分布式異常關聯,使攻擊的整個生命周期都可以被追蹤。在本文中,我們提出了一個理論但現實的方案,以證明該方法在不同類型的攻擊模式下的有效性,使用結構可控性領域[8]和博弈論[14]支持的概念。為了這個目標,我們開發了TI&TO,這是一個雙人博弈,攻擊者和防御者為控制現代工業結構中的資源而競爭。兩個玩家都有自己的動作和相關的分數,分別根據APT和基于Opinion Dynamics的檢測系統的行為。這個博弈最終在不同的模擬中運行,旨在展示算法的能力,同時也建議將該技術與其他防御方案結合起來進行最佳配置。因此,我們可以把我們的貢獻總結為:
本文的其余部分組織如下。第2節介紹了 "輿論動力學"的概念,并強調了應用博弈論來檢測網絡攻擊的建議。在第3節中,定義了博弈,包括規則以及攻擊和防御模型。然后,進行了幾次模擬,并在第4節進行了討論。最后,在第5節中提出了結論和未來的工作。