本文對隱喻性和描述性語言進行了認知導向分析,展示了從事無人機文本研究的學者如何利用對認知語言學的理解來加強和支持其分析。認知語言學為理解語言的概念結構,以及作者在選擇解釋其經驗的方式上所做的選擇提供了一個強大的框架。概念混合理論和認知語法的構解概念被介紹為語言學框架,通過這些框架可以審視無人機話語的意識形態結構。總的來說,它認為認知語言學的方法為理解話語中的常見模式如何(重新)產生和抵制無人機戰爭的意識形態立場提供了寶貴的資源,它提供了來自一系列來源的例子分析,以證明這些特定的框架如何有助于語言和意識形態的分析。
具有高度自主性的軍事系統發展帶來了許多作戰優勢。這些系統通常是高度協作的,并允許優化對復雜問題的多效應對。人工智能,包括深度強化學習,有助于提高這些系統的效率。這項工作提出了一個與信任這些算法有關問題的綜合觀點,并提出了一些改善人機信任的準則。這項工作是在由歐盟資助的30個合作伙伴歐洲財團委托編寫的報告框架內完成的。
法國和英國在2010年啟動了一項計劃,評估和開發 "海上反水雷"(MMCM)能力,包括在與母艦安全距離外遠程操作的無人系統。通過持續化解靜態水下威脅,這些系統將提供戰略、行動和戰術上的機動自由,確保海上力量的安全投送,包括在海峽等高風險地區。
MMCM計劃的目標是提供一種新的敏捷的、可互操作的和強大的水雷戰能力。它將有助于在現有水雷戰艦退役時取代它們。這一雙邊計劃于2010年底根據法國和英國之間的《蘭開斯特宮條約》正式啟動。在2018年1月的法國/英國峰會上,法蘭西共和國總統和英國首相申明了他們打算迅速將該系統投入作戰服務[13]。
特別是,在2020年測試了四種作戰方案,分別采用了:一個水面無人機及其探測聲納、一個拖曳聲納、兩個水下無人機和一個水下滅雷機器人。前兩種情況主要是隨著任務的進行對威脅進行探測、分類和定位,其次是通過與前一次任務的數據進行比較來改變探測結果,最后是重新定位和識別幾枚地雷并解除其中一枚地雷。
該計劃的核心是在水下環境中自主發展的能力。這種自主性是通過使用人工智能算法,特別是DRL來實現的,以便自主地將無人機從母艦上移開[14]。盡管水下無人機必須能夠自主行動,但仍有許多人機互動:任務準備、驗證地雷分類和實時任務監測、授權投擲炸藥。這種人機互動是由MMI(人機界面)實現的,比如你會發現下面這個界面。
有一些項目旨在優化這些關系并建立信任關系:例如,泰雷茲國防任務系統公司DxLab的AR{iA}NE項目,旨在顯示操作者和人工智能之間可以有真正的互動[14]。人工智能在這里由控制臺的下半部分代表。它的突出顯示取決于性能指數:這就是人工智能以非常直觀的方式與操作者交流的方式。這個演示設備是為工業展覽準備的。它的設計經過特別考慮,給人以未來主義的印象,讓客戶感覺到他正在與人工智能進行交流。該控制臺集成了一個軟件分析界面,為聲納數據的利用提供了實質內容,因此非常適用于研究人機互動,更確切地說,是人機互動。
國防公司,如泰利斯、空客和MBDA,正在開發項目,旨在提供反無人機(UAV:無人機)解決方案。商用無人機的擴散化和相當便宜的價格引發了安全和保障問題。例如,在無人機和飛機之間發生了一些事件,還有一些情況,如跨越邊界和在監獄中走私貨物(武器、毒品),或向目標運送爆炸物。這些公司提出了智能解決方案,可以檢測無人機,但也可以通過高度的自主性和人類的環形控制來消除它們。這些系統可以對敵方目標進行探測、識別、定位和消滅。反無人機問題被概念化,并通過以下步驟得到部分解決[16]:
最新項目的目標是創建和展示一個完整的反無人機系統,能夠解決上述六個步驟,并整合兩個主要部分,一個地面部分和一個空中部分。地面部分可由一個作為指揮和控制站的地面控制站和一些地面傳感器組成,其數量和在空間的分布可根據需要和保護空間的配置進行調整。空中部分可以由盟軍無人機隊組成,這些無人機可以是相同的,具有類似的能力(同質蜂群),也可以具有不同的能力,每個都有一套獨特的專長(異質蜂群)。擁有一個空中段提供了兩個優勢。首先,在傳感方面,它使系統具有盯住目標的能力,可能為人類操作員提供實時視覺反饋,但也能對敵方無人機及其有效載荷進行更詳細和有效的分類和識別。第二,在消滅方面,它應該允許防御者部署更多的外科手術式的反措施,特別是避免過多的附帶損害或不想要的副作用。許多國防公司正在為中和部分開發智能DRL解決方案[17],以便在盟軍無人機群中做出自主決定。DRL算法也可用于指揮和控制站,以監測整體作戰情況。
未來戰斗航空系統(FCAS)是一個 "系統簇",它涉及到新一代戰斗機(NGF)、遠程航母(RC)和一個將所有參與者連接在一起的戰斗云系統: NGF、RC群、衛星、戰艦、地面系統等。
遠程運載器是用來做什么的?設想的應用是非常多樣的:通過幾十架飛機的飽和來穿透敵人的防御,誘騙敵機,執行電子戰任務(干擾),為其他飛機指定目標,執行偵察任務,甚至發射導彈而不是作戰飛機。這些新型機組成員為未來幾十年的空中行動開辟了一個巨大的可能性領域:用無人機代替戰斗機發射導彈,這樣就不會有飛行員的生命危險,騷擾敵人的防線,執行偵察任務,等等。這些設備也可以假裝成駕駛飛機,吸引敵人的巡邏隊,為作戰飛機打開缺口。在遠程載具的核心,制造商正在開發人工智能算法,特別是DRL[18],以控制每架無人機,但也控制無人機群。DRL算法出色的適應性在這里被用來管理高層和自主決策。
"系統簇"的非常高的互連性也要求建立一個抗網絡攻擊的戰斗云。這些攻擊確實可以破譯通信以獲取情報,甚至干擾或破壞通信,或者更糟糕的是,向半自主系統發出錯誤指令。DRL算法可用于應對正在進行的網絡攻擊。這些攻擊確實可以快如閃電,而人類沒有能力做出足夠快的反應。因此,必須使用智能自動系統來抵御攻擊。DRL似乎再次成為快速、自主和適應性行動的良好解決方案[19]。
正如我們所說,在自主系統中使用人工智能有很多問題:倫理、法律、政治等等。這就是為什么有必要在這場技術革命的不同參與者之間建立一種信任關系,從研究人員到用戶和工程師。
數學上的保證。為了確保我們提出的技術解決方案的可靠性,最好能在理論上和數學上保證算法的性能。然而,重要的是要記住,有關的保證在性質上是概率性的,因為大多數ML算法的性質是不確定的。因此,我們將試圖證明,例如,如果該算法有無限量的訓練數據可供支配,它就能夠完成提交給它的任務。或者,人們可能會試圖證明該算法收斂到一個解決方案,而且幾乎可以肯定它是以一個已知的和可控的速度收斂的。這種類型的結果保證存在于許多經典的ML算法中,用于解決某些簡單的問題,并受制于關于訓練和測試數據的某些假設。人工智能的整個研究領域都是關于知道什么是或不是可以通過ML學習的問題,以及什么精度:可能是近似正確的學習[20]。在RL方面還有很多工作要做,它仍然是一種年輕的技術,但理論上的保證越來越多[21]。然而,這些理論結果一般都是基于非常強的假設,這些假設往往是還原性的,并沒有考慮無人機在實踐中使用的非常真實的環境,這有時會使它們不那么相關。
可解釋人工智能。第二個軸心是要建立對人工智能所支配的自主系統的信任,即其行動的可解釋性。當我們可以理解導致人工智能獲得結果的原因時,一個算法被認為是可解釋的。一般來說,目前可解釋的ML算法(XAIs)能夠報告相對簡單的決定,例如指出圖像的哪些區域被用來確定它是一個蘋果。關于RL,為算法的可解釋性設想了幾條途徑。
讓我們細化前面的觀點,像一些作者那樣考慮人工智能算法的區別,這些算法不僅是可解釋的,而且是可解釋的。事實上,為了解釋它們的推理,已經建立了一些后驗算法,但它們并不能幫助理解初始算法的 "黑匣子"。出于這個原因,人們正在對可解釋的人工智能方面進行研究,這樣就可以說明導致輸出的不同推理步驟[24]。即使DRL算法的參數數量非常大,仍然是廣泛實施這種方法的技術障礙,但可以預期在這個領域會有明顯的進展。
對受DRL支配的自主系統有信心的第二個論據是測試期間的性能測量。事實上,即使目前關于人工智能可解釋性的知識狀況不允許完美地理解算法是如何達到其輸出的,但實踐中的結果是好的,表明有非常大的發展潛力。
對其他問題進行歸納的能力。首先,用戶對人工智能技術的信心可以建立在算法解決其他問題的良好能力上,或多或少有些類似。例如,眾所周知,Deepmind的AlphaFold 2 DRL算法在預測蛋白質結構方面特別出色[25]。這種優秀的聲譽源于該算法的大量已發表的測試研究,這讓該領域的大多數科學家對其給予了極大的肯定。雖然蛋白質結構預測與自主無人機的使用無關,但將蛋白質中單個原子的放置與無人機在協作作戰任務中的放置相提并論是很容易和有意義的。在前一種情況下使用DRL,以及所獲得的結果,也有可能使最終用戶對DRL應用于另一個領域的潛力充滿信心。
算法驗證。然而,與經典的ML算法不同,不可能在RL中實現我們在第一部分討論的驗證測試。這是因為所涉及的數據是隨時間變化的,而且所提出的問題也是不同的。要限定所識別的對象是否被正確預測是很容易的(是的,它是一個蘋果,或者不是,它是一個梨子)。另一方面,量化無人機和飛機之間合作的成功要微妙得多:許多標準必須被評估(無人機的定位、它們的速度、它們不同行動的時間)。因此,RL算法的性能測量是通過建立針對要解決的任務的指標來完成的。例如,對于負責訪問一個空間區域的無人機來說,比較正確識別目標的比例、任務完成時間或其他更精確的指標是相關的,這取決于情況和要解決的具體問題。
爭取在RL中實現更好的可重復性。最近還強調了RL算法的一個臭名昭著的問題,即當一些研究人員想要復制他們同事的結果時,一些算法的不穩定性[26]。實驗的可重復性是科學中的一個基本問題,因為它構成了被測試定律(例如,萬有引力定律)的有效性證明。在這里,算法性能的證明之一是可以讓它多次承受相同的情況,并在不同的迭代中獲得非常相似的結果。為了克服缺乏可重復性的問題,新的算法開發框架、新的測試程序和明確的指導方針已經到位,使科學和開發團隊對他們的結果有了更大的信心。
優化人機互動
人機協作是現代(協作)戰爭的核心,但人類和智能機器之間的成功協作主要取決于信任。然而,安全與新興技術中心對自主性和人工智能相關的研究[27]發現,在美國軍方的科技項目投資中,789個自主性相關項目中只有18個,287個人工智能相關項目中只有11個提到 "信任 "一詞。研究人員沒有直接研究信任,而是將開發更透明、可解釋和可靠的人工智能作為優先事項。這些努力對于培養人機團隊的信任是必要的,但技術驅動的解決方案并不總是考慮這個等式中的人類因素。
對高性能技術的不充分信任會導致人工智能系統的使用不足或廢棄,而對有限的或未經測試的系統的過度信任會導致對人工智能的過度依賴。這兩種情況在軍事背景下都有獨特的風險,包括事故、友軍交火、對平民的意外傷害和附帶損害。為了讓士兵對自主系統有信心,他們必須知道系統在遇到障礙物時將會做什么。從系統工程的角度來看,這意味著要指定和實施一些能力,如通過假設查詢和信息交流進行信息檢索,以便系統能夠以人類操作者容易理解的方式解釋其推理和行為。換句話說,"在系統中建立信任 "是一種以技術為中心的方法,通過改善與信任密切相關的系統特性和能力,如透明度、可解釋性和可靠性,來建立人機團隊的信任。
DARPA的Squad X計劃[28]將美國陸軍和海軍陸戰隊的步兵小隊與配備先進傳感設備的無人地面和空中飛行器配對,以提高敵對環境中作戰人員的態勢感知和決策。X小隊在2019年初進行的一系列實驗[29]的主要收獲之一是,將人工智能納入任務的規劃和演練階段非常重要。這樣做,士兵可以 "在如何信任人工智能方面進行搏斗"。最終,目標是讓人類作戰人員更好地了解這些自主系統在戰場上的表現,并對它們作為未來任務中的伙伴更有信心。
要怎樣才能讓人們信任技術?在使用先進系統時,一些個人或群體是否更有可能感到自信,而另一些人則更不情愿?人機團隊的部署環境如何影響信任?認知科學、神經科學、心理學、通信、社會科學以及其他研究人類對技術的態度和經驗的相關領域的見解為這些問題提供了寶貴的啟示[30]。
解決道德問題
"殺手機器人 "一直引起人們對潛在自主能力的恐懼[31]。法國國防倫理委員會在2021年批準在武器系統中引入一定程度的自主能力[32]。在法國,沒有辦法授權 "殺手機器人"。這一表述指的是LAWS(致命性自主武器系統)。這只是證實了法國幾年來在這個問題上的立場。但事情很復雜,倫理委員會認為不反對引入一定程度的自主權,因此不反對使用PAWLS(部分自主武器致命系統)。將LAWS與PAWLS區分開來的是 "性質上的差異,這與人類在某些關鍵功能中的地位有關"。致命武器系統的設計是為了演化出自己的操作規則,并自行重新定義其任務。它們不需要指揮部對情況的評估。PAWLS可以自主地被賦予某些任務的責任和執行,但只是暫時的,而且只用于識別、分類、攔截或接觸任務。道德委員會明確表示,它不能在沒有人類控制的情況下采取致命的舉措。即使在這個限制性框架內,也必須制定技術和組織保障措施,以防止任何過度行為。委員會認為,應繼續在與國防有關的人工智能和武器系統自動化領域進行研究。其目的是避免任何 "科學和技術上的放棄",防止對手開發致命性自主武器,并在對手使用這種武器時進行防御。
自主系統不應
G1. 為自主軍事系統上嵌入式人工智能的操作使用案例制定并提供一個法律框架。
G2. 確保在所有情況下都有人類的監督,有人類在環形系統。
G3. 保證在發生事故時的責任追溯。這種責任必須始終由人承擔,而不是由機器承擔。
G4. 開發符合人體工程學的人機界面,允許人與機器之間的對話和理解。
G5. 開發穩健、安全、準確、可重復和可靠的算法,以及評估這些標準的方法。
G6. 為與人工智能互動的軍事人員建立培訓計劃,讓他們了解這些算法的機制、能力和局限性。
G7. 通過對算法、數據和設計過程的評估,確保責任、問責和可審計性。
G8. 制定技術評估程序,以評估對上述準則的遵守情況。
G9. 加快歐洲在人工智能技術方面的培訓工作,特別是針對學術和工業環境的DRL。
G10. 加快歐洲在整合人工智能的國防系統方面的立法工作,以保持歐洲在這一法律方面的領先地位,并確認其在這一領域的領先形象。
G11. 發展國際合作,在自主系統領域進行立法。
G12. 促進研究人員、哲學家、律師、政治家和業務人員之間關于自主系統的對話。
G13. 在有關國防人工智能的研究和應用項目中始終包括信任的概念。
G14. 對協同作戰的未來利害關系有一個明確而具體的看法,以便將人和他們的利益置于系統的中心。
高超音速導彈和人工智能等技術創新代表了當代戰爭的動態變化,為政治和軍事決策者帶來新的挑戰。高超音速導彈前所未有的、不可預測的速度和彈道,以及與人工智能滲透有關的無數不確定性,反映了這些挑戰。在這些系統的背景下,一個納入有限學術研究的領域在威懾理論中是顯而易見的。這項研究旨在彌補高超音速導彈和人工智能如何挑戰瑞典的威懾力方面的知識匱乏,并確定瑞典目前的能力和可信度在應對這些威脅方面的有效性。為了實現這一目標,本研究采用了文本分析法,其中包括從瑞典的報告和政策文件中收集的經驗材料、文獻回顧以及與該領域具有充分知識的專家進行的半結構化訪談。本論文發現,盡管瑞典的國土面積相對較小,但在某種程度上已經成功開發了獨特的系統和技術,以應對高超音速導彈和人工智能威脅。
由于問題和解決方案的復雜性不斷增加,復雜和社會技術系統的系統工程變得越來越困難。這導致了基于模型的系統工程(MBSE)的發展,它在軟件工具的架構框架和建模語言的支持下應用建模。在需求分析和概念開發階段,建模被應用于捕捉和表示系統的利益相關者的心理模型。該軟件工具能夠通過各種圖表和視圖在數據庫中捕獲模型信息。這種以數據為中心的方法確保了定義的模型元素及其關系的一致性和可追溯性。由于指揮和控制(C2)系統可以被看作是復雜的社會技術系統,MBSE應該有助于捕捉需求以支持概念解決方案的開發。本文介紹的MBSE方法有助于捕捉C2系統的需求,以及識別主要的邏輯塊元素和它們所需的功能。這種方法通過開發適合特種作戰的復雜作戰環境的概念C2系統解決方案得到了證明。
系統工程的基本目標是通過使系統的存在來解決問題(Stensson 2010,Walden等人,2015)。系統方法,通過系統思考,旨在理解整體背景下的部分,同時與環境互動并適應環境。系統工程由跨學科活動組成,以確保利益相關者的需求能以低成本和及時的方式得到滿足。然而,今天的問題往往是復雜和不明確的,其影響范圍超過了所關注的系統。
從本質上講,系統工程過程是一種發現、學習和持續改進的迭代方法,以獲得對需求和突發特性的洞察力(Walden等人,2015)。系統工程過程的輸入是來自客戶或利益相關者的需求,必須對其進行分析,以發現定義解決方案系統的目的、目標和高級功能的需求(Buede 2000, Ramos等人2012, Walden等人2015, Oliver等人2009)。從最初的高層次需求中定義操作環境和預期場景,以得出系統所需的角色、任務和功能(Stanton 等人,2012)。
Holt & Perry (2008)列出了系統工程的三害:復雜性、溝通和理解。系統的復雜程度取決于系統元素的數量和它們的互動。對問題和用戶需求的不正確理解導致了不準確的需求和系統工程的不正確應用。工程師、開發團隊和利益相關者之間的溝通問題導致了對需求和相關模型含義的解釋。設計團隊和制造團隊之間的溝通不暢,會進一步加劇這種情況。對系統工程產生能夠在復雜環境中有效運行的系統的要求是不斷增加的。建模是解決復雜問題的一種方式,并能使人們有效地理解和溝通。
基于模型的系統工程(MBSE)作為一種方法,提供了一個由過程和支持工具組成的解決方案,以解決復雜性問題。各種形式的模型和結構可以用來捕捉和表示有關問題的信息和知識。一個合適的模型,從利益相關者的心理模型中衍生出來,用來吸收和解釋重要的信息(De Weck等人,2011,Sterman 1994)。
在系統工程中,模型是通過系統的原理圖和網絡圖來構建的。建模可以通過理解系統整體和部分之間的關系來幫助系統設計,從而得出突發屬性(Buede 2000, Ramos等人 2012, Maria 1997, Ramos等人 2011)。模型也往往比基于文本的系統工程文件更有助于發展系統概念和需求,因為它們支持對問題的知識進行實驗,并發展對不同解決方案的影響的理解(Estefan 2007)。
MBSE采用了建模語言,如系統建模語言(SysML)或統一建模語言(UML)。該語言利用圖形符號,用相關的參數、屬性和限定信息來加強。這些語言被用來通過圖表對復雜的系統及其架構進行建模,這些圖表通過各種一致的觀點捕捉、分析和指定系統的行為、結構、要求、關系和能力。模型的不同觀點可用于實驗問題的知識,并發展對不同解決方案的影響的理解(Ramos等人,2012;Buede,2000;Oosthuizen和Venter,2016)。在規劃中采用MBSE的其他優勢包括管理問題的復雜性、重用信息元素和支持系統性思維(Ramos等人,2012,Walden等人,2015)。
本文報告了通過實施MBSE過程對C2系統進行概念建模的實踐經驗。首先,討論了系統工程和建模文獻,以定義MBSE流程,然后將其與實踐經驗聯系起來。該過程通過為特種作戰開發一個概念性的C2解決方案來展示。與常規部隊相比,特種作戰往往在更復雜的環境中運作,有著獨特的要求。
C2是一個統稱,涉及軍事行動的指揮和控制的多個方面。指揮被定義為賦予或授權給武裝部隊的個人指揮、協調和控制軍事力量的權力(Brown 1996, MoD 2017)。這代表了人類意愿的創造性表達,以闡明和傳遞完成任務所需的意圖。指揮鏈網絡描述了授權的流動,其任務是產生意圖。指揮權來自擁有最多任務狀態信息的個人(Young 2017)。
"控制 "被定義為指揮官對下屬組織的部分活動所行使的權力,其中包含了執行命令或指令的責任。控制包括通過設定邊界、管理資源和調整行動以實現指揮官意圖的結構和流程來管理風險。控制的目的是確保通過調整所需的活動來實現既定意圖(Brown 1996, Young 2017)。
C2系統的目的是指導、調整和協調部隊在多個領域的意圖和活動。C2系統必須靈活適應,以滿足不斷變化的環境、背景和任務的要求(Oosthuizen and Pretorius 2013, MoD 2017)。
C2能力被進一步定義為設計和執行聯合行動的動態和適應性(復雜)社會技術系統(國防部2017)。復雜的社會技術系統包括行為、工具和技術,由人、結構、技術和流程之間的相互作用促成。C2為個人和組織提供了重點,以整合和最大限度地利用他們的資源和活動來實現預期的結果(國防部2017)。具體的C2解決方案的特點是環境和任務類型所需的網絡分權程度。具體的C2解決方案的適當性受到以下三個環境變量的影響(Young 2017):
1.環境的變化率。不尋常的任務類型導致了任務的不確定性。同時,任務期間較快的變化率需要更大程度的情況意識分散和更新率。
2.要素的連接程度。一個環境中的多個獨立元素比一個具有多個高度連接元素的復雜環境更容易分析和理解。復雜環境中的任務更難分解,需要更大程度的控制權下放。
3.利益相關者的利益程度。利益相關者對活動的開展施加標準、約束或期望。利益的程度與指揮所需的集中化程度呈反向關系。
所選擇的C2方法必須適應所應用的作戰環境。當代特種作戰的作戰環境是復雜的。該環境的特點是一個全球性的系統,由許多相互作用的變量組成,這些變量造成了相互交織的國家、政治、經濟、社會、精神、文化和軍事利益、挑戰和威脅。影響特種作戰復雜環境的主要因素包括以下幾個方面(Ott 2002, Madden et al. 2016, Johansen 2015, Votel 2016):
1.全球化。由技術進步(互聯網、移動電話、衛星通信)形成的全球化,成倍地提高了變化、創新和商業的速度。技術允許在全世界范圍內即時傳輸信息。國際恐怖組織可以從偏遠地區有效運作,同時從全球任何地方得到支持(資金、培訓和招募)。重大事件發生時,媒體也會在全球范圍內進行近乎實時的報道。
2.城市化。越來越多的世界人口遷移到城市地區。交戰方越來越多地尋求城市地區的庇護,以隱藏在人口中。這減輕了武器和傳感器的技術優勢,增加了打擊的附帶損害的威脅。
3.地緣政治趨勢。更多的政治權力和軍事能力正被非國家行為者所掌握。這導致了復雜的區域安全發展和來自弱國和失敗國家領土的威脅。這些威脅不能被孤立地解決。
4.軍事技術趨勢。軍事技術繼續快速發展,導致新的軍事競爭領域的出現。因此,運營商可能會對新交戰方的能力感到驚訝。敵人有機會獲得先進的武器系統和網絡能力,為他們提供了越來越多的脅迫性選擇。
5.偏遠作戰地區。崎嶇、多山的地形、洞穴、惡劣的氣候可能會限制武器或行動支持的能力。恐怖組織往往在這些偏遠和不穩定的地區進行訓練、維持、計劃和行動。為了在偏遠地區開展行動,特別行動人員必須與當地居民和領導人進行接觸,獲得他們的認可和信任,以收集情報支持行動。
6.沖突的模式。沖突的模式正在隨著環境的變化而變化。低強度和不對稱的沖突正在世界 "欠發達 "地區展開,一方是正規軍,另一方是游擊隊、恐怖分子,甚至是平民。這些沖突往往是殘酷的、血腥的、丑陋的,不依靠現代武裝力量的高科技武器。其目的是在外部幫助下破壞一個政權的穩定。非正規的威脅通常在國家控制的領土邊緣和無人管理的空間里興風作浪。
7.行動的持續時間。特別行動的財政和政治可持續性使其更具吸引力。特別行動的小規模方法允許采取降低成本的戰略,迫使對手花費不成比例的資源來抵御友好的能力。他們支持對環境有更深入的了解,以預測不穩定的爆發點,減少行動和戰略盲點。
已實施的C2系統要求有能力收集、分配和轉化數據為情報,以執行快速決策。決策必須支持指揮部隊的能力,跨越多個領域和任務。有效的C2取決于基于對形勢的理解而作出的行動決定。理解被定義為對特定情況的感知和解釋,以提供有效決策所需的背景、洞察力和預見性。理解使決策者能夠利用數據分析和可視化,從現有的信息中找出新的機會和威脅(MoD 2017)。
標準和傳統的系統工程方法可能不足以支持這些復雜環境所需系統的開發。這些復雜性可能會導致C2系統的模糊和綜合要求。系統工程兄弟會正在向MBSE發展,以應對復雜問題的系統開發(Walden等人,2015)。
建模是一個反復的過程,通過一個標準的、嚴格的、結構化的方法來開發、使用和更新模型,以獲得對一個系統行為的洞察力。模型被定義為對現實或其選定部分的明確和不完整的表述或理想化的抽象,以幫助其描述和理解(Ramos等人,2012;Maria,1997)。模型必須在真實性和簡單性之間取得平衡,以便能夠理解和模擬(Maria 1997, Gau Pagnanelli等人,2012)。
在系統工程中,模型被用來描述與一個系統相關的結構、行為、操作和特征,以及與操作環境的選定的交互。環境包括使能系統和其他系統(Buede 2000, Hitchins 2008)。建模行為和產生的模型本身支持對問題的洞察,作為決策的基礎(Maria 1997, Harrison et al. 2007, Buede 2000)。模型被用來對問題的知識進行實驗,并發展對不同解決方案的影響的理解。這支持通過用視覺工具澄清需求來改善解決方案的開發決策(Walden等人,2015;Ramos等人,2012)。
在開發系統概念和需求方面,模型往往比基于文本的文件更有用,因為共同的符號以一致的方式描述了許多系統特征和屬性(Buede 2000,Ramos等人,2012)。在系統工程中,建模解決問題的主要優勢可以歸納為以下幾點(Buede 2000,Ramos等人2012,Maria 1997,Walden等人2015):
1.管理復雜度。建模有助于通過以下方式解決系統分析和方案設計的復雜性:
a) 通過對問題的多角度的可視化分析,實現系統理解。
b) 指導識別導致復雜性的元素和相互作用。
c) 改進影響分析,以確定解決方案的潛在后果。
d) 利用模型的可追溯性發現原因和影響。
2.用系統的術語捕捉問題。利益相關者檢查他們自己的思維(心理模型),并將概念傳達給其他人,以確認系統需求和行為。模型通過澄清需求來支持改進的系統開發決策。
3.捕獲、分析、分享和管理信息。擁有一個標準語言的建模方法的好處是改善利益相關者之間的溝通,管理系統復雜性的能力,產品質量,知識捕獲和教授和學習系統工程基本原理的能力。模型支持實驗,以及對問題的知識進行定性和定量分析。
4.重復使用和自動化。建模使現有的信息和知識在新項目中得到重用,從而節省時間和金錢。通過用腳本執行可重復的任務,建模也有利于問題分析過程中的自動化。
然而,復雜的社會技術系統的建模仍然是困難的,因為它必須呈現系統中人類工作的結構和行為。行為是由人、操作者、系統元素和環境之間的動態交互引起的。在多個抽象層次上對系統界面進行建模,可能有助于理解復雜系統及其相互作用(Bahill & Szidarovszky 2009, Piaszczyk 2011, Oosthuizen and Pretorius 2014)。
MBSE被定義為建模的正式應用,以支持整個系統生命周期階段的系統需求、設計、分析、驗證和確認活動(Gau Pagnanelli等人,2012)。MBSE專注于應用豐富的信息模型來補充傳統的系統工程方法(Walden等人,2015;Estefan,2007)。任何MBSE的實施都應該至少解決以下要素(Meyer 2014, Tschirner et al. 2015, Gau Pagnanelli et al. 2012, Karban et al 2012):
1.流程。流程提供了為實現特定目標而在不同的細節和聚合水平上執行的任務的邏輯順序。現有的MBSE流程,需要根據具體的實施環境進行調整。MBSE過程的基本步驟應該包括信息(需求)捕獲、模型生成、驗證和實施。這個過程不需要和傳統的系統工程標準一樣。
2.方法。方法包括執行流程中所列任務的一系列技術。每個方法本身也可以是一個過程。
3.工具集。工具是提高特定方法中任務效率的工具。工具只是促進任務的執行,并提供模型中捕獲的信息的存儲庫。
MBSE不僅僅是開發一套圖來粘貼到基于文本的報告中。僅僅使用標準建模符號來繪制這些圖表并不能改善模型。MBSE的元模型(Holt and Perry 2017),如圖1所示,指出了被建模的系統與架構框架內建模工具的應用之間的關系。這個元模型為開發適合特定應用領域的MBSE方法提供了基礎。
在通過一些視圖對系統進行建模之前,如圖1中間的 "目標 "欄,需要建立支持結構。首先,需要一個架構來定義模型的視圖。建模方法應用了一個架構框架。任何適合問題和解決方案空間的架構框架(如面向服務的架構、NAF、MoDAF或DODAF)都可以被MBSE方法應用。在所有情況下,都需要進行一定程度的定制。架構框架由描述系統及其行為所需的各種觀點組成,這些觀點由標準本體定義。對系統模型的不同觀點被用來分析不同層次的系統(Kossiakoff等人,2011,Ryan等人,2014)。
圖1:基于模型的系統工程元模型
系統的各種觀點通過圖示來體現。為了擁抱MBSE的力量,建模者應該超越基于文本的工具。這些基于文本的工具,如Visio?和Powerpoint只為基于文本的文件提供圖片。它們不能管理復雜圖表中元素之間的關系。應該為MBSE實施專門的以數據為中心的工具。這些工具實現了公認的建模符號,如SysML和UML,以通過圖表開發一致的系統視圖。SysML用于通過系統結構、參數、屬性、要求、行為和關系的圖來對復雜系統進行建模(Friedenthal等人,2012;Hause,2014)。
行為圖表示情況的各個部分及其因果互動(Friedenthal等人,2012;Hause,2014)。系統的行為是用用例圖、活動圖、序列圖和狀態機圖來建模的。用例圖提供了系統功能的高級描述。活動圖中記錄了活動之間的數據流和控制流。順序圖代表了系統中合作部分之間的交互。需求圖確保層次結構和推導、滿足、驗證和細化關系是清晰的。系統參數約束和其他參數,如性能、可靠性和物理特性,在參數圖中被捕獲(Hause 2014)。
Hause 2014)。塊定義圖通過層次、關系和分類來描述系統結構。內部塊狀圖描述了系統的內部結構,包括部件、端口和連接器。塊圖中的塊可以代表系統層次結構的任何一級,將系統描述為部件的集合,以及它們之間的連接,從而實現通信和其他形式的互動。端口提供了對塊的內部結構的訪問,以便在更大的結構范圍內使用該對象。需求視圖指定了從利益相關者需求中得出的所需結構和行為屬性。參數視圖提供了系統的關鍵工程參數,用于評估性能、可靠性和物理特性(Friedenthal等人,2012;Hause,2014)。
實施MBSE的這種元模型將幫助系統工程師(建模者)組織和展示信息,以支持開發基于模型的有形需求,從而開發解決方案的選擇。根據建模工具,模型中捕獲的信息可以以文本形式導出,用于審查和合同目的。通過一個以數據為中心的工具實現的MBSE使系統工程師能夠管理需求和模型元素之間的關系。需求變化的影響可以追溯到它們所影響的模型元素。下一節將提出一個C2系統的建模過程。
從上面的討論可以看出,MBSE是一種設計和開發復雜系統的現代方法。原則上,這個過程遵循自上而下的模型應用,而不是基于文件的文本來指定、設計、集成、驗證和操作一個系統。MBSE采用了一個過程來開發和增加模型的細節,使用一個并發和增量的過程來支持利益相關者之間的溝通(Estefan 2007,Walden等人2015,Oosthuizen和Pretorius 2015)。
圖2:基本MBSE建模過程
圖2中用于C2系統建模的基本MBSE流程是松散地基于MoDAF的。該方法根據INCOSE手冊和其他資料進行了調整和簡化,包括以下活動(Walden等人,2015,Ryan等人,2014,Hause 2014):
1.分析利益相關者的需求。這項活動抓住了 "現有 "系統的局限性和潛在的改進領域,以支持開發 "未來 "的解決方案。現有的基于文本的用戶協議和其他需求文件可以為模擬利益相關者的需求提供有用的輸入。
a) 確定系統的背景。第一步是定義系統的邊界,以及與外部系統或操作環境的接口。系統上下文圖的目的是將注意力集中在開發一套完整的系統需求和約束條件時應該考慮的外部因素和事件上。
b) 生成用例。高層次的系統功能是從用戶需求中捕捉到的,在 "使用視圖 "中,它由包的分層結構中的一些用例圖組成。這項活動定義了支持任務要求的系統要求。系統被建模為一個與外部系統和用戶交互的黑盒子。從用例中,系統所需的結構和行為是通過一個反復的過程得出的。
2.生成功能架構。系統功能以活動圖的形式進行建模,定義從用例中得出的行為之間的關系。用例描述和命名中的動詞應被用來定義活動。功能架構的建模使得系統功能需求的開發成為可能。
3.生成邏輯架構。系統被分解和劃分為邏輯元素,它們相互作用,滿足系統需求。邏輯元素是由用例中的名詞衍生出來的。系統的邏輯元素用方框圖來定義它們之間的關系。場景也用泳圖來建模,泳圖結合了活動圖和塊定義圖。泳圖將活動分配給邏輯塊元素,并呈現出活動的邏輯流程。邏輯架構的建模使得非功能系統需求的開發成為可能。
4.生成解決方案的實施。這一步描述了定義資源分配的物理系統元素或節點之間的關系。在邏輯架構中確定的塊通過塊圖的屬性被實例化。內部塊狀圖被用來模擬系統元素之間的接口,以及交換的信息元素。邏輯架構中的元素可以為多種可能的解決方案實現而實例化。
解決方案架構是這個建模過程的輸出,并將被用來得出系統的功能、接口、數據和性能要求。一些解決方案可能會被生成,以輸入到方案選擇過程中。根據合同準則,需求可能會以文本形式或模型庫的形式輸出。
從圖2中的連接器可以看出,這是一個迭代的過程。每個周期都會提高模型的完整性和準確性。視圖也可用于支持C2系統的作戰概念(ConOps)的發展。用一個以軟件數據為中心的MBSE工具來實施這個過程將確保所有的模型元素和它們的標識被管理,以保持一致性和可追溯性。這個過程適用于大多數架構框架。
在這個過程中尚未解決的方面包括需求和順序圖;它們是在實施解決方案的設計的較低層次上需要的。本文討論的過程中沒有包括的其他步驟包括選擇首選的架構以及驗證和核實擬議的解決方案系統。這個框架是制定指定特種作戰C2系統的過程的基礎。
本節實現了圖2中的過程,為特種作戰定義了一個概念解決方案C2系統。這是在MBSE工具Enterprise Architect?中用SysML生成模型的一些視圖來完成的。為了說明問題,我們將只提供有限數量的模型輸出圖。本節提供的信息將支持下一節的建模方法的演示,以定義一個可能需要用于特種作戰的通用C2系統。本節提供的信息將支持下一節中的建模方法的演示,以定義一個可能需要用于特種作戰的通用C2系統。
對特定作戰環境的方法的每一次應用都將導致不同的C2概念解決方案。為特種作戰量身定做的C2系統的開發必須支持任務,可能會產生關鍵任務的不利后果。特種作戰的主要特征,區別于更多的常規作戰,包括以下內容(Johansen 2015, Kiras 2015, Votel 2016, Brown 1996, Eaton et al:)
1.能力。特種作戰人員實施與普通陸軍、海軍或空軍不同的(專業)能力和技能(如解救人質),而不會產生高成本和失敗的風險。
2.敏捷性和靈活性。特種作戰人員可以迅速抓住機會,適應不可預見的要求和行動挑戰。這使他們能夠與合作伙伴整合,開發戰略機會,以對抗對手采用的非正規和混合方法。他們可以更靈活地直接(外科手術式打擊)以及間接(特種作戰)地運用武力。他們可以在基礎設施有限或受限的惡劣環境中孤立地行動(沒有定期和持續的支持)。
3.作戰規模。特別行動往往是非正統的、高風險的小單位秘密或公開的行動。考慮到特別行動小組的規模相對較小,以及指揮系統很短的事實,小組可以在比大型常規部隊更短的時間內部署。
4.持久和長期的行動。非正規和低強度的沖突需要長期(數月和數年)和持續的行動,以扭轉對手的意志和對抗的根本原因。這就對戰術、行動或戰略層面的連續性和知識管理提出了要求。它允許對人的領域進行深入了解,這對于識別和影響相關行為者以獲得可接受的結果是必要的。
5.支持。行動通常是在國家邊界之外進行的,與OPFOR線后的既定行動或支持基地相距甚遠。這些行動需要專業的支持(公開的和秘密的),不能由任何常規部隊進行。這需要量身定做的能力、保護和后勤支持。特別行動可能需要秘密技術,以確保低能見度,而諸如隱蔽性、欺騙性和間接方法等概念總是被應用。與總部的聯系、進入和保持安全的通信渠道對特種作戰來說是一個挑戰。
6.作戰節奏。由于其規模和靈活性,特別行動單位可以在高節奏下行動。特種作戰人員可以早期、持續和精確地采取行動,以創造所需的決策空間和戰略選擇,提供可持續的結果。
7.國家政策的工具。特別行動組人員經常被部署去執行外交政策,這增加了敏感性和風險程度。可以從軍事或國家指揮的最高層雇用和領導特別行動戰術單位,以實現特定的政治或戰略目標。
8.低層決策。盡管行動是由最高層授權的,但可能產生戰略結果的決定往往是在最低的戰術層面上做出的。各單位積極鼓勵任務指揮,以個人專長為基礎的參與式決策是當務之急。
9.聯合、機構間、政府間和多國行動。當代特別行動傾向于聯合、機構間、政府間和多國行動(JIIM),并以共同的目標和共同的目的形成網絡。目標必須通過本地或代理部隊來實現,并與之合作。人員面臨著與其他行動參與者協調、消除沖突和利用特別行動活動的挑戰。部署特別行動資產是為了收集可能無法通過其他方式獲得的信息。與外部角色的信息共享可能會削弱信任。
以上列出的這些作戰特點將影響到為特種作戰所制定的作戰方案。該解決方案系統必須應對多樣化、自主、復雜和高節奏的行動。由于其應用的多樣性,特種作戰也可以從戰術、作戰或戰略層面進行控制。在較低的戰術層面,外部關系被減少,線性等級制度占主導地位,并以指令的方式提供指揮。在作戰和戰略層面上,與外部伙伴和其他行為者的交往將更加普遍。這些可能不在同一個指揮結構之下,需要以較不直接的方式進行合作和影響。另外,在不同的情況下,不同C2級別的指揮官將獲得不同程度的授權(國防部2017)。
特種作戰ConOps將需要一個模塊化的C2系統,因為同一個用戶在不同的任務中可能面臨不同的挑戰。C2系統必須支持對局勢的理解,以實施對活動的控制和協調(Rantakokko等人,2010年,Alberts 2011)。管理一個模塊化系統的元素和接口可能會成為一個復雜的問題。建議的MBSE過程將協助系統工程師為預期的復雜性和分歧情況得出具體要求。
系統上下文圖,如圖3所示,定義了系統與環境之間的邊界,顯示了系統與之交互的實體。這張圖是感興趣的系統的高層視圖(黑盒)。感興趣的系統和外部系統上的小藍塊是接口,以方便信息在接口上的流動。箭頭表示信息的流動。外部環境主要由系統和系統外的利益相關者組成。它也提供了對將要開發的實際感興趣的系統的關注。這張圖是要設計的解決方案系統的界限。
圖3:上下文圖
C2系統將著重于界面(如顯示器)和信息處理元素,這些元素將被部署在操作人員和他們的指揮官身上。通信系統被看作是C2系統的外部。通信是C2系統的一個促成因素。它通常由外部單位控制,并由其他人用于不同的目的。C2系統還需要與部署在特種作戰人員身邊的外部傳感器相連接。為了使特種作戰C2系統支持實施協作或邊緣C2方法,將需要有效的通信接口和互操作性。
用例是用來捕捉和表示特種作戰C2系統的高層次系統功能和用途。用例還確定了不同的場景,以衍生出系統所需的功能。用例被結構化為包,如下圖4所示,以管理不同層次的建模水平。各包之間的箭頭描述了它們之間的依賴關系。用例的來源包括各種公布的理論文件以及與主題專家和其他利益相關者的互動。用例也構成了開發ConOps的基礎。
圖4:用例包
圖5給出了戰術級用戶使用特種作戰C2系統生成態勢感知信息的簡略用例。態勢感知支持指揮官和操作人員了解作戰情況以支持決策。態勢感知支持C2的快速決策。態勢感知需要支持根據收到的新信息或目標的變化在短時間內改變和調整計劃,即使行動是在有限的信息下進行的。信息由經過分析和添加背景的信息對象組成。信息比數據對象處于更高的抽象水平(經過處理)。
圖5:過程信息用例
系統需要實現基于角色的認證,以保護信息的安全性和完整性。這只允許某些用戶以規定的訪問(需要知道)權限訪問信息。與任務相關的作戰環境信息是由觀察事件的信息收集資源在系統中采集的。要在系統中捕獲的典型信息可能包括圖像、視頻、自己的位置報告、氣象信息、地理(地形)信息和社會媒體。
還需要進行信息整理,以接收、處理和顯示有關友軍和敵軍活動或能力的當前信息。信息被顯示在(覆蓋)地形上,以產生一個共同的作戰圖。對數據進行處理以增加其價值,并使其成為可用的 "信息"。這涉及到對不斷變化的政治和軍事環境的正確評價和理解。來自不同傳感器的數據需要進行融合,以便為特定用途提供最適用和準確的信息。最后,特別行動操作人員需要能夠在緊急情況下銷毀系統中的所有信息,以防止機密信息落入敵對勢力之手。
類似的用例可以被生成,以解決戰略或操作層面的用戶和擬議系統的使用。不同的用例也可以為特定的場景生成。其目的是在啟動下一層次的分析之前,確定系統的所有用途和行為者。
C2要執行的功能是由用例中的動詞得出的。系統的功能邏輯結構被記錄在一些活動圖中,以定義活動(功能)之間的關系。圖6顯示了所選功能活動的層次結構。
圖7提供了功能結構的另一種觀點,它由相同的元素(活動)組成,但它們之間有不同的關系(控制和信息流)。首先,C2系統中的信息是通過對作戰環境中的元素的傳感(集成)和操作人員的視覺觀察來獲取的,包括對感興趣的元素的位置和描述。額外的信息被收集,并與GIS數據進行整理,以建立各種信息位之間的聯系。
圖6:功能架構層次結構
這些信息被儲存起來用于顯示和分析。選定的信息要顯示給操作人員,以便為指揮官提供一個完整的戰斗空間圖,以及命令、回應和協調行動的能力。另一個關鍵方面是分析信息,以提高捕獲信息的價值和可用性。同樣,端口被用來定義各項活動之間的接口。
圖7:功能架構
C2系統的邏輯結構,如圖8所示,包括從用例中的名詞衍生出來的系統元素,以提供結構和工具(系統元素)。系統被分解和劃分為邏輯元素,這些元素相互作用以滿足系統要求,使用塊中的塊。
圖9提供了圖8中C2系統的邏輯元素之間的接口。該圖由相同的元素(塊)組成,但它們之間有不同的關系(接口)。有關系統的外部邊界上的端口與上下文圖中定義的端口相對應。這些端口定義了項目和信息與外部系統和情況管理系統操作者的流動接口。
圖8:系統架構結構
如圖10所示,邏輯架構中定義的邏輯系統元素執行功能。這里,圖6和圖7的活動被分配給圖8和圖9的塊狀元素。特種作戰C2系統中捕獲的信息在顯示器上呈現給操作人員。該顯示器使操作人員能夠查看信息并與之互動。顯示的信息可以包括由地圖組成的共同行動戰場圖,其中有自己的部隊、友軍、威脅部隊和目標位置。可根據需要過濾的其他信息包括任務狀態、人員健康狀態、電子攻擊警告和實時視頻或照片圖像。這些信息可能來自于同地的傳感器,這些傳感器可能被整合到C2系統中。
圖9:帶有接口的系統架構
信息分析工具或應用程序支持對捕獲的信息進行分析和處理,以支持情報過程(周期)以及發展局勢意識。該工具通過態勢感知顯示器訪問存儲的信息,以查看、回放和處理數據庫中的信息。C2系統中的所有信息都存儲在一個集中的數據庫中。該數據庫需要一個適合于所有特種作戰任務的數據元模型和本體論。
圖10:邏輯架構
建模過程的最后一步是將邏輯和功能結構轉換為具體的解決方案選擇,以便進行分析和權衡。選定的解決方案描述將構成所需采購的C2系統的系統需求說明的基礎。如圖11所示,這一步描述了定義資源分配的物理系統元素或節點之間的關系。
在邏輯結構中確定的塊是通過塊圖的屬性來實例化的。SysML塊(UML類)被實例化為屬性(UML對象),以模擬不同的解決方案。一個塊可以通過多個屬性進行實例化,如綜合傳感器和情況意識顯示邏輯元素。信息分析工具在戰術部署的個人綜合C2系統中沒有被實例化,因為操作者可能沒有時間進行信息分析。這種方法使系統工程師能夠在其系統設計中實現模塊化。
圖11:C2系統解決方案實施
用軟件工具實現MBSE的一個優點是能夠保持工具中捕獲的各種元素之間的可追溯性,如圖12所示。這種可追溯性使系統工程師能夠實施變更管理。一個用例中的變化可以被追蹤到系統解決方案中的影響。這些塊中的任何一個都可以被追蹤到用戶、系統或實施的需求。
圖12:元素可追溯性
本節展示了基于MBSE的C2系統開發方法,該方法將在復雜環境中使用。這個過程是獨立于架構框架的,并且可以連接到基于能力的系統建模中。建模的力量是為所有的系統元素及其關系和相互作用提供一個可視化的表示。一張圖片勝過1000個字。模型幫助利益相關者理解他們的需求和系統解決方案的含義。由于復雜的關系更容易被視覺化和管理,模型的圖表在審查時仍然更容易使用。
在這個過程的每一步,都有可能為系統定義和添加需求。每個需求都可以與一個特定的元素相關聯或被追蹤。在需求和系統元素之間甚至可以有多對多的關系。如果存在一個需求列表(如用戶需求),它可以被導入到工具中,并與各種模型元素相聯系。
大多數MBSE工具使建模者能夠為模型元素和關系添加文本描述。這些工具也有自動化的應用,可以將圖與元素的描述導出為基于文本的報告,供利益相關者正式審查和接受。報告可以是需求說明的形式,也可以是只包含模型所要求的特定信息的系統描述的ConOps。
在開發和實施系統的組織中,模型的可移植性也很重要。對模型元素(用例、活動和邏輯塊)的訪問和對需求的追蹤將有助于權衡和設計決策。
本文提出了一個MBSE過程,并通過開發一個用于特種作戰的C2系統對其進行了演示。由于開發復雜的社會技術系統的系統工程變得越來越困難,MBSE提供了一種方法來設計和實施有效的模塊化系統。在需求分析和概念開發階段,捕捉和表現系統的利益相關者的心理模型的模型有助于理解這種復雜性。
使用基于模型(以數據為中心)的軟件工具對系統進行建模,有助于管理復雜性和需求與建議的解決方案概念之間的可追溯性。保持各種系統圖和視圖之間的可追溯性,確保定義的模型元素及其關系的一致性。
為了證明MBSE方法,一個社會技術系統以特種作戰的C2形式在通用水平上進行了建模。這些視圖為深入分析和開發一個實際的C2系統提供了結構。
建立和保持共同的態勢感知是團隊伙伴所面臨的最困難的認知活動之一。它也是團隊和協作工作中最脆弱的領域之一。 在個人和集體層面上,表述是認知決策過程的核心。 對情況的共同理解,即團隊成員之間的類似,對于決策的連貫性是必要的。
態勢感知(SA)及其共享對背景影響特別敏感,有必要提供所有必要的技術支持,既要為其提供便利,又要保證其在管理潛在錯誤方面的安全性。
這種伙伴關系可以成為認知戰的目標。對攻擊者來說,這是一個通過利用所有分享工具(無論是技術還是社會工具)來影響個人表述的問題。 面對影響或操縱的威脅,防御者必須處理這種風險,并促進強有力的態勢感知共享的條件。
Sigma認知架構是智能行為綜合計算模型的開始,旨在實現通用人工智能(AGI)的宏偉目標。然而,盡管它已經被證明能夠對廣泛的智能行為進行建模,但Sigma的現有實現卻受到了幾個重要的限制。最突出的是對連續變量的推理和學習支持不足。在這篇文章中,我們為這一局限性提出了解決方案,這些方案應共同提高Sigma的大統一水平;也就是說,它能夠跨越傳統的認知能力和對一般智能至關重要的非認知能力,彌合符號、概率和神經處理之間的差距。由此產生的設計變化匯聚成了一個能力更強的架構版本,稱為PySigma。我們通過深度生成模型,特別是變異自動編碼器,作為一個具體的例子,證明PySigma在神經概率處理方面的能力。
與基于模型的控制和優化方法相比,強化學習(RL)提供了一個數據驅動的、基于學習的框架來制定和解決連續的決策問題。由于航空業的數據可用性和計算能力的大幅提高,RL框架變得很有前途。許多基于航空的應用可以被制定或處理為順序決策問題。其中一些是離線規劃問題,而另一些則需要以在線方式解決,并且是安全關鍵問題。在這篇調查報告中,我們首先描述了標準的RL公式和解決方案。然后,我們調查了現有的基于RL的航空應用的情況。最后,我們對本文進行了總結,確定了技術上的差距,并提出了航空領域RL研究的未來方向。
在本節的其余部分,我們將全面介紹RL方法。首先,我們簡要地描述了RL問題的表述和一些關鍵概念。之后,將介紹兩類經典的無模型RL算法:基于價值和基于政策的傾斜。然后,我們將介紹更先進的技術以及現代行為者評論方法和多智能體強化學習(MARL)。RL方法的整體結構如圖1所示。
圖1:RL方法結構。
由于航空數據的可得性和計算能力的大幅提高,現在航空領域的許多挑戰性問題都可以用數據驅動和基于機器學習的方法來解決。這些問題不限于以下例子:空中交通管理[32]、飛機排序[33]、空中交通流提取[34]、滑行時間預測[35]、航班延誤預測[36][37]、航跡預測[38]和飛機性能參數預測[39]。
RL方法作為機器學習的一個領域,已經成為研究航空問題的方法。圖3說明了航空領域RL的分類。在下面的章節中,我們將嘗試總結RL在不同應用中的用法。據作者所知,本調查報告是第一份調查航空領域RL方法的研究報告。
圖3 航空RL分類布局。
空中交通管制(ATC)在空中交通管理(ATM)系統中起著至關重要的作用,因為它負責維護飛行安全和效率。避免碰撞是防止空中碰撞的最后一層防御。一方面,空中交通管制員必須在任何時候都保持任何兩架飛機之間的安全分離距離。這個功能被稱為沖突解決或間距保證。另一方面,早期改編的空中防撞系統是交通警報和防撞系統(TCAS)[51]和最近的下一代機載防撞系統(ACAS-X)[52], [53]。后者建立在TCAS的基礎上,引入了部分可觀察的馬爾可夫決策過程(POMDP)來表述問題。它通過評估最接近的時間向飛行員提供語音和視覺警告,以確定是否有可能發生碰撞。最近在基于RL的防撞和間距保證方面進行了許多研究,表I列出了其中的一部分。
表I:從有關避免碰撞的RL的文獻中選出。狀態/行動空間(S/A空間)可以是連續的(C),離散的(D),或混合的(M)。
[50]中介紹了自由飛行空域中的MDP防撞方法。在有合作(飛機主動試圖避開其他飛機)和非合作(那些不關心避免碰撞)的三維環境中,自由飛行的MDP公式能夠避免飛機之間的碰撞。在[49]中,DRL方法被實施為對避撞問題的優化。
在許多具有挑戰性的問題上表現出超越人類水平的性能,無人駕駛飛行器(UAV)的防撞問題已經通過實施DQN算法得到了解決[40]。在[41]中,實施了來自演示的深度Q-Learning(DQfD)和獎勵分解來提供可解釋的飛機防撞解決方案。DQN技術也被應用于無人機的防撞[40],在NASA的33區改變路線和速度[55],在現有防撞方法的基礎上計算修正[51],[53],以及在密集空域的無人自由飛行交通[49]。[56]中提出了一個使用RL和GPS航點來避免碰撞的框架。在[57]中,應用了一個雙深Q網絡(DDQN)來引導飛機通過終端區域而不發生碰撞。該方法解決了傳統防撞方法失敗的情況,即在密集的空域中,那些預計被無人機占據的空域,并證明了提供合理修正的能力,以保持飛機系統之間的足夠安全。
PPO方法被廣泛用于飛機防撞中,并顯示出有希望的成功。使用PPO網絡[42]解決結構化空域中的防撞問題,使用長短時記憶(LSTM)網絡[43],以及注意力網絡[44]來處理可變數量的飛機。雖然這些算法在訓練環境中表現出很高的性能,但評估環境的輕微變化會降低這些PPO模型的性能。有人提出了一個基于MonteCarlo Dropout[58]和執行時間數據增強的安全模塊,以解決環境中的防撞問題,這些環境與訓練環境不同[45]。為無人駕駛飛機提出了一個PPO網絡,以提供安全有效的計算指導操作[59],并在連續狀態和行動空間中指導無人駕駛飛機避免與障礙物相撞[46]。一個消息傳遞網絡[60]被引入以支持避免碰撞。
注入了飛機的先驗物理信息,以建立一個物理學上的DRL算法來避免飛機碰撞[61]。在[62]中提出了一種獎勵工程方法,以支持PPO網絡解決二維空域中的防撞問題。
一些研究將DDPG[21]應用于飛機防撞問題。在[47]中,基于DPG的DRL方法被應用于解決存在不確定性的連續行動空間的兩架飛機之間的沖突。另外,一個智能交互式沖突解決器被用來獲取ATC的偏好,并由RL智能體提出捕捉這些偏好的沖突解決方案[63]。后來,DDPG算法處理了交通量增加的航空部門[64]。在飛機到達航區邊界之前,DDPG算法獲得了一個適當的航向角,以避免碰撞[65]。DDPG方法也被提出來用于減輕高密度情況下的碰撞和不確定因素[66]。有人提出了一種混合方法,它結合了傳統的幾何解決方法和DDPG模型,以避免沖突[67]。多智能體深度確定性策略梯度(MADDPG)被應用于成對地解決兩架飛機之間的碰撞[68]。另一種基于MADDPG的沖突解決方法減少了空管和飛行員在運行中的工作量[69]。
在這種應用中,演員批判算法也很受歡迎。在[48]中提出了K-控制行為批評算法來檢測沖突和解決二維連續行動空間。一個策略函數返回一個基于給定狀態的智能體可以采取的行動的概率分布。[70]為三維非結構化空域中的空管建立了一個基于圖的網絡,通過避免潛在的碰撞和沖突來管理空域。有人提出了一個多層RL模型來引導多維目標問題中的飛機[71]。另外,一個LSTM網絡和一個行為評論模型被用來避免固定翼無人機的碰撞[72]。
除了這些流行的模型,其他RL方法也被用于避免碰撞。在[73]中提出了一種基于消息傳遞的分散計算引導算法,該算法使用了多智能體蒙特卡洛樹搜索(MCTS)[74]公式。該算法還能夠防止無人機在城市空中移動(UAM)環境下的間距損失(LOS)。在[50]中建立了一個高效的基于MDP的分散算法,以防止自由飛行空域中合作和非合作無人機的沖突。在[76]中提出了MuZero算法[75],以緩解碰撞的發生。在[77]中應用了差異獎勵工具,圖卷積強化學習算法解決了多無人機沖突解決問題[78]。
將DRL模型與NN訓練同時進行,可以減少學習時間,并由于消除了離散化問題而執行更精確的模型[79]。盡管DRL在飛機間距保證方面已經顯示出巨大的成功,但仍有許多未解決的問題。這些問題對在現實世界中這一安全關鍵應用中建立DRL模型造成了關鍵障礙。一個主要問題是驗證。用于飛機間距的DRL模型有很深的結構和復雜的輸入狀態。復雜的結構使得使用傳統的形式化方法來驗證DRL模型的屬性變得困難。目前使用形式化方法的工作只能用淺層DRL模型驗證非常簡單的屬性。驗證的缺乏限制了這些DRL模型的可信度以及它們在現實世界中的應用。
另一個重要問題是模擬和現實之間的差距。用于飛機間距保證的DRL是用模擬器訓練的,因為考慮到潛在的損失,現實世界的訓練太昂貴了。然而,不可能讓模擬完全模仿現實。模擬和現實之間的分布變化可能會制約DRL模型的學習性能。
除了這兩個問題,用于飛機間距保證的DRL也面臨著一般DRL模型的問題。例如,目前用于間距保障的DRL的采樣效率很低,這就高度限制了訓練速度。另外,用于間距保證的DRL模型作為一個黑箱工作。它不能在這個過程中提供可解釋的決策。
交通管理是一個涵蓋了任何直接影響或用于決定空中交通運動的系統的術語。這些系統的首要目標是減少延誤,同時保持空域的運行安全。一般來說,空中交通流量和容量管理是共同空中交通服務(ATS)的一部分,并直接或通過ATC與飛行員對接。最后,所有這些設計的系統可以通過兩個分類來考慮;為無人交通管理(UTM)和無人機系統操作設計的系統,以及為更多的常規操作設計的系統。
表II: RL在航空交通流管理中的文獻選取
空中交通流量和管理(ATFM)是交通管理的一個子集,重點是確保可用的空域容量得到有效利用。容量不僅受航段大小、形狀或高度的影響,而且還受風、天氣和緊急情況等隨機變量或機場容量和吞吐量等更多恒定變量的影響。需求能力平衡(DCB)是一種預測方法,以確保空域或地面業務的有效運行。協作方法被引入到DCB中,利用:分配延誤,允許替代軌跡,使用固定的空域劃分,或調整空域劃分來有效管理空域[54]。與其他解決方案不同的是,同步協作-需求容量平衡(SC-DCB)尋求放松空域配置的約束,其結果表明,減少有效扇區,從而更好地利用有效扇區。在最近的工作中[80],RL技術被用來檢查其在UAM流量管理中的效率,使用的狀態空間包括從飛機、天氣、空域容量和交通密度監測中檢索的數據,以及通過Post-Hoc系統構建的訓練數據。流量管理中的多智能體法也出現了[81]-[83],證明了MARL方法可以在交通密集區(熱點)通過采取滯留、離開或合作行動成功解決這些熱點問題。該方法也導致了整體延遲的減少。
地面延誤方案(GDP)處理到達機場的過多的航班,作為另一種空中交通流管理機制。機場處理到達航班的能力可能受到天氣狀況的不利影響。發布航站樓交通管理倡議(TMI)是一種在短期內減少進入機場的飛機數量的技術。這種技術的一種類型是地面延誤計劃。有人提出了一種基于多臂匪徒框架的數據驅動方法來建議TMI行動[84]。這將有利于人類決策者評估建議的解決方案是否合理。這些建議是基于預測和觀察到的需求和容量的歷史數據、選擇的TMI行動和觀察到的性能。結果表明,幾乎所有建議的算法都略微超過了歷史行動。[85]提出了四種在不確定天氣條件下推薦戰略性TMI參數的方法。前兩種方法是基于隨機探索的,而其他方法則是使用-貪婪方法和Softmax算法。快速模擬結果表明,相對于其他方法,后兩種方法的性能很強,而且它們有可能幫助處理天氣的不確定性。[86]對行為克隆(BC)和反強化學習(IRL)在預測每小時專家GDP執行行動方面進行了比較。歷史數據被用來預測舊金山和紐瓦克國際機場的GDP決策。IRL方法被提出來,通過只探索數據中的狀態來降低復雜性。實驗結果表明,BC比IRL的GDP實施模型具有更強的預測性能。實驗還表明,無論是BC還是IRL模型都不能很好地預測相對不頻繁的GDP初始化或取消事件,這與Q-learning不同,后者往往能提供準確的預測時間[87]。更好地預測滑行時間將改善滑行管理,這可以通過使用GDP減少擁堵而有利于軌跡規劃。
隨著空域因更高的交通量和新興的UAS/UTM技術的引入而變得更加密集,交通管理解決方案將需要證明其適應能力,不僅要適應更高的航空交通量和密度,還要適應這種新的航空交通分類所帶來的任何新要求。此外,這些系統的安全和能力將需要正式的驗證和標準化的確認,將ATM中的RL領域從實驗室中移出,準備被官方機構接受。最后,關于UTM/UAS空域如何構建仍有許多未知數,這為解決方案的設計增加了一層復雜性;新系統應接受這一概念,并在空域仍在定義時提供靈活性。
在1970年代,對機票定價和網絡調度的控制是有限的。如果一家航空公司想提高票價,需要得到聯邦機構--民用航空委員會(CAB)的許可。當時的定價監管總是導致票價上漲。1979年解除了對航空公司的管制,允許公司自由安排航班和定價。因此,航空公司收入管理(ARM)作為一種商業慣例出現了,在有易損庫存的情況下制定價格。ARM是航空公司通過優化票價和產品供應來實現收入最大化的策略。經典的ARM問題可以分為兩種類型,基于數量的收入管理和基于價格的收入管理(RM)[94]。
基于數量的收入管理是在一個預先定義的n級票價結構上進行的,并決定每個票價等級有多少張票被保護。同時,它側重于單程和網絡航班段的容量控制。作為基于數量的RM的代表,預期邊際座位收入(EMSR)模型[95]在現代航空業被廣泛使用。基于價格的RM更注重于動態定價情況。
表III:RL在航空公司收益管理中的文獻選取
傳統的和廣泛使用的ARM系統的方法是基于模型和數據驅動的,這在很大程度上取決于預測數據的準確性,如乘客到達分布、支付意愿(WTP)和取消率。最近,研究人員一直在考慮在ARM上應用無模型的學習方法,如最優控制理論或RL。在ARM中使用RL的研究方向始于2002年[88],其中λ-smart算法被設計為在平均獎勵優化準則下,將單腿ARM問題作為無限時間范圍的半馬爾科夫決策問題(SMDP)。后來,在同一問題上應用了有界行為人批評法[89]。這兩項研究都聲稱,該模型的性能優于EMSR模型。已經引入了ARM上的DRL模型,將領域知識與在圖形處理單元(GPU)上訓練的DNN結合起來[90]。一個DRL模型也被應用于庫存控制問題,使用DQN并考慮其環境中的取消和超額預訂[91]。近年來還出現了一些其他對DRL模型的改進。例如,通過結合基于數量的RM和基于價格的RM研究了一個ARM問題[92],而DRL被應用于單腿和網絡腿問題[93]。
以前的基于學習的方法考慮了乘客和航空公司之間的博弈。然而,關于不同航空公司之間的競爭性定價過程的工作有限。我們相信隨著多智能體強化學習的發展,這將是一個令人興奮的話題。
由于系統的非線性、不確定性和環境中固有的作用于系統的噪聲,飛機的姿態控制可能是一個挑戰。最近,研究人員旨在開發基于RL算法的先進控制器。表四列出了姿態控制應用中的一些RL方法。
表IV:態度控制中RL的文獻選擇。
這些提議的控制器已被用于目標跟蹤[96],[97],單/多智能體避障[97],[98],基于視覺的著陸[99],穩定[100]-[103],視覺伺服[104],和平旋恢復[105]。
在[103]中,表明直接通過RL訓練控制器,基于非線性或未知模型,是可行的。在[106]中還比較了基于不同RL算法的控制器的性能。結果顯示,DQN比策略梯度或DDPG更適合于離散任務,而DDPG在更復雜的任務中表現更好。另外,DQN方法被用來設計飛機的姿態控制系統[103], [106]. 此外,基于DDPG的控制器在[97]、[106]、[107]、[110]、[111]中建立。一個改進的DDPG方法與轉移學習相結合,開發了一個控制系統來進行自主機動目標跟蹤[97]。還研究了一個基于DDPG的控制器,引導無人機從任何位置和姿態到水平面的固定位置[110]。
其他研究也采用了PPO方法[98], [101], [108]。開發了一種改進的MARL算法,命名為多智能體聯合近似策略優化(MAJPPO),以進行編隊和避障。該控制器采用了移動平均法,使每個智能體獲得一個集中的狀態值函數[98]。通過進行實驗比較,表明MAJPPO算法可以更好地處理部分可觀測環境。一個基于PPO的控制器被設計用來穩定一個固定翼無人機[101]。訓練后的策略在收斂所需的迭代次數方面優于PID控制器。研究還表明,RL控制器可以適應嚴重的環境干擾。
由于RL在姿態控制方面取得了重大進展,它被認為是設計最佳和穩健控制器的一種有前途的方法。然而,仍有一些挑戰需要解決。實驗證明了模擬和自然環境之間的差距[109],這需要一種新的訓練方法。一個控制器學會了適應訓練模型和真實環境之間的差異。探索和利用的平衡是RL的另一個難題。在訓練過程的開始,使用了探索環境的正態分布噪聲[107]。它還提議在未來的工作中使用Uhlenbeck-Ornstein隨機噪聲。
故障是指一個系統的屬性或參數發生變化,導致系統的行為與設計不同。換句話說,故障是一種使系統無法運行的狀況。容錯控制器(FTC)是一種控制策略,其目的是改善因故障而運行在性能下降的系統的性能[116]。根據用于開發控制器的方法,FTC被描述為基于模型或數據驅動的。基于模型的技術需要了解系統的模型和參數來設計一個容錯控制器。相反,數據驅動的方法直接從系統數據中學習FTC。基于模型的FTC方法的基本問題是,它的有效性取決于系統模型的正確性,而當系統參數因故障而變化時,這種正確性很難建立。此外,復雜的系統需要復雜的控制器,這反過來影響了控制器的穩健性。另一方面,數據驅動技術利用數據來設計FTC,而不知道系統的動態。因此,數據驅動的方法,特別是基于RL的技術,最近得到了很多關注。
表V:容錯控制器RL的文獻選擇。
文獻中提出了幾種方法來解決使用RL的FTC控制器。不同的RL算法,包括DDPG、TRPO和PPO,已經被用于開發四旋翼姿態控制的FTC技術[112]。結果表明,在所開發的基于RL的容錯控制器中,經過訓練的基于PPO的姿態控制器在上升時間、達到的峰值速度和訓練后的控制器組中的總誤差方面優于完全調整的PID控制器。采用基于DPG的技術和積分補償器來開發四旋翼飛機的位置跟蹤控制器[113]。該方法采用了一個兩階段的學習方案,利用簡化模型進行離線學習,并在飛行過程中完善學習的策略。結果表明,學習的FTC對模型錯誤和外部干擾有足夠的魯棒性。[114]中提出了一個基于DDPG的四旋翼飛機位置跟蹤的容錯策略。該框架的運行方式是與基于模型的控制器同時運行,只有當系統的行為與正常運行狀態發生變化時才會激活。
無模型的基于RL的FTC方法的一個重要缺點是不能保證收斂性。為了克服這個問題,有人提出了一個基于模型的八旋翼飛機位置跟蹤框架[115]。提出了四種RL算法,即PPO、DDPG、Twin-Delayed DDPG(TD3)和soft actor-critic(SAC)。結果表明,PPO更適用于容錯任務。
飛行和軌跡規劃是一個眾所周知的航空問題,也是至關重要的。雖然空域用戶希望得到最優化的軌跡,使成本函數最小化,但許多約束條件,如地面障礙物、容量限制或環境威脅,使這個問題難以解決。提出了幾種技術,包括改道或地面延遲,以緩解大多數情況下的交通擁堵。ATM領域基本上是基于時間性的操作,用容量供求模型來管理空中交通流。這種操作會導致容量不平衡,當容量(定義為某一時期內某一航段接受的飛機數量)被超過時,會在航段中產生熱點。飛機軌跡或飛行的規劃可以在ATM領域定義的幾個階段完成;戰略階段包括一年和D-7之間執行的飛行規劃,預戰術階段發生在D-7和D-1之間,最后,戰術階段發生在D日。RL規劃器顯示是解決危險環境下飛行前規劃問題的一個有前途的工具[124]。
表VI:飛行規劃中RL的文獻選擇。
無人機在執行從地形測繪到監視和軍事任務方面的多功能性使得這個問題成為飛機運行的基本組成部分。無人機的許多既定任務之一是飛越地面目標。提出了用于軍事用途的POMDP理論,并使用名義信念狀態優化(NBO)來尋找考慮威脅、風效應或其他智能體的最佳軌跡[117]。此外,還提出了一種RL方法,利用無人機環境的幾何信息,在實時規劃中產生更平滑、更可行的軌跡[118]。在[119]中比較了決斗雙深Q網絡(D3QN)、DDQN和DQN方法,以解決智能體在面臨環境威脅的動態環境中的路徑規劃問題。
一種RL方法被用來解決這些有交通速度調節的熱點問題[125]。代表一個固定點(扇區中的一個二維點)的智能體可以調節流量。通過提高計算能力,航班已被視為智能體,并提出了MARL方法[120]來解決這些容量問題。還研究了各種算法:獨立學習者、邊緣MARL和基于智能體的MARL,基于Q-learning技術。使用GDP來解決熱點問題,在GDP中,航班出發時間被推遲,以轉移整個軌跡[121]。結果表明,協作方法產生了更好的結果。為了減少搜索空間,提出了一個分層的MARL方案,用GDP解決需求-容量平衡(DCB)問題[82],從而允許對時間和狀態動作進行抽象。受監督學習的啟發,有人提出了建立在PPO上的多個監督-MARL框架[81],其中代表航班的智能體有三種行動:保持出發、起飛或協作。這項研究表明,增加監督者可以幫助提高搜索和概括能力。DQN和分布式訓練與分布式執行(DTDE)結合重放經驗[122]也被用來解決DCB問題。此外,還構建了一個多智能體異步優勢行為者-評論者(MAA3C)框架,在適當的地面延遲內解決空域熱點問題[126]。
所有這些工作的目的是通過延遲航班來減少熱點,同時最大限度地減少平均延遲并確保良好的分布。但是,他們仍然沒有研究其他軌跡規劃技術。有人提出了一種RL方法來選擇低水平的啟發式方法,以減輕空中交通的復雜性[127]。飛行等級分配、錯開出發時間和在途路徑偏離減少了擁堵。在UAM概念中,出發前的空域預訂問題被表述為一個MDP[123]。先入先出(FIFO)原則和快速MDP算法在戰略階段提供了一個無沖突的軌跡。調度器允許集中和分散的飛行計劃,利用GPU的計算能力和并行化來處理大量的航班。有人提出了一種學習調度算法,以最大限度地提高颶風災害等緊急情況下的航空容量[128]。
維護調度是計劃何時以及何種類型的維修檢查應該在飛機上進行的過程。航空公司的維修任務通常被分為四個字母的檢查(A、B、C和D)。這些組的維護檢查的詳細程度是不同的。例如,A-和B-檢查被認為是輕度維護,C-和D-檢查為重度維護和更詳細的檢查。通常情況下,天氣狀況和飛行中斷會導致計劃的偏離。這些不確定因素使飛機維修調度成為一項具有挑戰性的任務。
為飛機維修檢查開發了一種前瞻近似的動態編程方法[129]。它的計劃最大限度地減少了維修檢查之間的浪費的利用間隔,同時減少了對額外維修時段的需求。該方法通過對A320系列機隊的維修數據的兩個案例研究進行了測試。所開發的方法顯示了計劃維修時間的顯著變化;它在四年內減少了1.9%的A檢查次數,9.8%的C檢查次數,以及78.3%的額外機位數量。
[130]中提出了一種基于RL的方法來解決飛機的長期維護優化問題。所提出的方法使用有關飛機未來任務、維修成本、預知和健康管理等信息,以提供實時、連續的維修決策。在幾個模擬的維修場景中,RL驅動的方法在根據不同的數據調整其決策原則方面優于現有的三種常用策略。[131]提出了在維護計劃中整合人機協作的RL模型以及基于狀態的維護指標的可視化。同時還提出了在突發事件發生時的最佳維護決策。
在航空系統等安全關鍵應用中,安全是最重要的。最近在RL方面取得的可喜成果鼓勵研究人員將此類技術應用于許多現實世界的應用。然而,基于學習的方法的認證,包括安全關鍵應用中的RL,仍然是一個開放的研究問題[132], [133]。最近的調查對安全關鍵應用中的安全RL的努力進行了全面的概述[134]。雖然人們對安全RL有很多研究興趣,特別是在自動駕駛領域[135]-[137],但在航空研究領域,安全RL問題仍然沒有得到充分的探討。安全RL在航空系統中的應用已經從不同角度進行了研究。例如,最近,有人提出了一種用于自主機載防撞系統的安全RL方法[62]。從沖突解決的角度來看,在分層空域的垂直機動過程中,使用了軟行為者-批評模型[138]。在一個類似的研究思路中,一個安全的深度MARL框架可以識別和解決高密度下飛機之間的沖突[42]。
從運行時保證的角度來看,一種運行時安全保證的方法將該問題作為一個MDP框架,并使用RL來解決它[139]。同樣,路徑規劃問題也被框定為MDP,并利用MCTS進行安全和保證路徑規劃[140]。為了保證實時自主飛行操作的安全,有人提出了一種MCTS算法,同時還提出了高斯過程回歸和貝葉斯優化來離散連續行動空間[141]。此外,一個強化學習框架預測并緩解了擁擠空域中潛在的分離事件損失[142]。最近,為航空系統中基于學習的組件的設計時和運行時保證提出了一個安全驗證框架[133]。
本文在回顧了最常見的RL技術及其總體方法和原理后,提出了RL在航空領域的應用調查。從航空公司的收入管理到飛機的姿態控制,RL方法的使用在過去十年中在文獻中表現出極大的興趣。事實上,隨著計算能力的提高和對大量數據源的訪問,這種數據驅動的方法已被廣泛研究。無論是避撞、交通管理,還是其他與航空有關的問題,這些基于學習的框架都顯示出了很好的效果,各種算法和技術經常被研究用于特定問題。最先進的技術,如DRL或DPG,被用來處理關鍵系統,如避免碰撞或處理交通管理和飛行計劃中不斷增長的航空交通。然而,模擬環境和現實世界的應用之間的差異或其黑箱方案仍然可以成為在航空業實施的障礙,受到眾多安全措施的限制。因此,這種方法的認證是這些創新和顛覆性的航空應用的關鍵點,應該成為該領域的研究重點之一。
隨著廣泛的應用,人工智能(AI)催生了一系列與人工智能相關的研究活動。其中一個領域就是可解釋的人工智能。它是值得信賴的人工智能系統的重要組成部分。本文概述了可解釋的人工智能方法,描述了事后人工智能系統(為先前構建的常規人工智能系統提供解釋)和事后人工智能系統(從一開始就配置為提供解釋)。解釋的形式多種多樣:基于特征的解釋、基于說明性訓練樣本的解釋、基于嵌入式表示的解釋、基于熱度圖的解釋。也有結合了神經網絡模型和圖模型的概率解釋。可解釋人工智能與許多人工智能研究前沿領域密切相關,如神經符號人工智能和機器教學
在復雜的以人為中心的系統中,每天的決策都具有決策相關信息不完全的特點。現有決策理論的主要問題是,它們沒有能力處理概率和事件不精確的情況。在這本書中,我們描述了一個新的理論的決策與不完全的信息。其目的是將決策分析和經濟行為的基礎從領域二價邏輯轉向領域模糊邏輯和Z約束,從行為決策的外部建模轉向組合狀態的框架。
這本書將有助于在模糊邏輯,決策科學,人工智能,數學經濟學,和計算經濟學的專業人員,學者,經理和研究生。
讀者:專業人士,學者,管理者和研究生在模糊邏輯,決策科學,人工智能,數學經濟學,和計算經濟學。
在過去的幾年里,自然語言處理領域由于深度學習模型的大量使用而得到了發展。這份綜述提供了一個NLP領域的簡要介紹和一個快速的深度學習架構和方法的概述。然后,篩選了大量最近的研究論文,并總結了大量相關的貢獻。NLP研究領域除了計算語言學的一些應用外,還包括幾個核心的語言處理問題。然后討論了目前的技術水平,并對該領域今后的研究提出了建議。