亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

在結構良好、信息完備的環境中,決策制定是無法保證的。研究中的任務通常側重于在無限時間框架內利用完整信息做出決策,而在信息缺失或不確定的情況下,當前的研究并未涉及缺失信息在環境中的分布所產生的影響。本文旨在具體了解這些信息分布如何影響時間壓力下的決策者,以及如何在一系列決策策略中為不完美環境下的決策提供最佳支持。這項工作有三方面的貢獻。首先,研究結果表明,在六項以不同信息復雜性和決策策略偏差為特征的獨立人體研究中,所研究的三個信息分布因素(即總信息、完整屬性對和信息不平衡)對決策準確性具有顯著的預測作用。其次,本論文通過信息估計和決策前信息搜索的視角,強調了專家和新手行為的關鍵差異,這進一步解釋了不確定性下的個體差異,并為這些環境下的決策支持系統(DSS)提供了新穎的設計考慮。最后,在啟發式和分析式偏差環境中,信息修正和選項預測決策支持系統的應用表明,各成績組的準確性顯著提高,響應時間顯著縮短。

圖 3.2:參照兩個示例目標(危險程度高的導彈和危險程度低的運輸工具)的可視化決策任務。

決策環境與人體實驗任務

要回答所有研究問題,就必須能夠在信息不完整的情況下,在人體實驗中將這些問題具體化。為此,下文將簡要介紹本論文中使用的兩種決策環境,并在后續章節中對其設計和實施進行詳細說明。

  • 防空作戰協調

第一個環境要求參與者扮演一艘軍艦上的防空作戰協調員(AAWC),其領空內有目標。決定目標敵意的決策標準基于四個二元線索:高度、速度、與中立空中走廊的距離和大小。標準分數由每個選項的提示分數的線性加權組合計算得出,提示按提示加權的等級順序顯示。參與者只需從兩個目標中選擇一個最危險的目標,并與飛機交戰。每個決定都必須在 20-30 秒內做出,參與者可使用彩色計時器進行時間管理。

  • 車道防御游戲

第二個環境是由 Unity 游戲引擎構建和托管的車道防御游戲。游戲的每一輪都有一組獨特的三個選項,它們從屏幕左側沿著三條車道中的一條向屏幕右側移動。參與者有 60 秒的時間來判斷這三個選項中哪個最危險。為了做出決定,參與者可以訪問詳細的情報菜單,該菜單顯示了描述每個敵人敵意程度的五個提示值(武器、體型、裝甲、盾牌、頭盔),這些提示值按提示權重排序顯示。在以前的 AAWC 環境中,參與者需要根據閾值臨界值對每個可用線索值做出敵意/非敵意判斷。在這個環境中,參與者的這一過程被簡化了,非敵意提示值用綠色向下箭頭表示,敵意提示值用紅色向上箭頭表示。新環境的特點包括幾乎雙倍的可能信息總量、信息訪問跟蹤以及更靈活的用戶界面設計,所有這些都有助于對所有三個研究問題進行更詳細的探討。

技術貢獻

在信息缺失或不確定的環境中,信息的分布如何影響決策結果,文獻尚未對此有全面的認識。本論文在一系列決策環境的人類受試者研究中考察了信息結構的三種測量方法(TI、CAP、II),并證明信息不平衡最小化和完整屬性對最大化最有利于提高決策準確性(第 4、5、8 章)。研究發現,總信息量的增加總體上有助于提高準確性,但如果不包含 CAP 和 II,則不足以解釋準確性的提高。此外,生態合理決策策略(由環境結構定義)對這些結果也有影響(第 8 章)。經測試發現,補償生態學(WADD、高分散和低分散)對信息結構的變化更為敏感,而非補償生態學(TTB)則不太敏感,尤其是對信息不平衡的變化。

此外,本論文還研究了對缺失信息進行估計的作用,并首次對決策者的估計策略進行了直接征詢。這項在 AAWC 環境中完成的研究(第 5 章)表明,新手傾向于估計幾乎所有缺失信息,而任務專家則能夠忽略信息,主要根據第一個可用的(也是最重要的)線索來估計信息。這與 Lane Defense 研究(第 8、9、10 章)中的策略選擇數據相吻合,這些數據表明,無論環境結構如何,新手都傾向于補償性決策行為,這違反了非補償偏置環境中的生態合理性。

最后,決策支持在被拒止和退化的環境中所能發揮的作用在這里得到了更充分的證實。第 6 章測試了獲取和限制信息的概率方法和基于規則的方法,結果表明基于規則和基于概率的修改技術都能帶來更大的決策結果。第 9 章將支持系統的設計向前推進了一步,對比了基于圖形用戶界面的隊友與基于獲取的隊友,前者可以卸載信息估算,而后者則采用第 6 章中基于規則的方法為參與者收集缺失的信息。結果發現,這兩種方法都能顯著提高新手和專家的成績。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

各級規劃人員都在努力將當前狀態過渡到更理想、更有利的狀態。本研究探討了通過使用可衡量的故事元素過渡到理想的未來狀態這一主題,這些故事元素可以影響相關行動者的態度、行動和行為。故事是一種經過深入研究的認知過程,具有獨特的元素,使規劃人員能夠在行動規劃和評估中使用故事元素作為框架。此外,在本研究的發現階段,研究發現了聯合規劃條令在如何描述敘事一詞方面存在的理論空白。本研究的主要啟示是,大腦會將故事及其元素按主題排列成敘事,這表明了一種認知過程,有助于個人理解現實以及邏輯上符合現實的可能決策。利用對故事及其元素的理解,規劃者可以更好地描述和預測通過相關行為者的態度、行動和行為所表現出的基于敘事的決策。

付費5元查看完整內容

本文采用對稱視角研究軍事技術及其對城市關系的潛在影響,從而審視當代城市戰爭的空間化問題。雖然城市和建筑研究走在了解決此類緊迫問題的前沿,但占主導地位的批判方法在很大程度上仍然是社會建構主義和人類中心主義的。技術被視為權力的被動投射;它們既不分解也不進化,缺乏與用戶和環境相關的能動性。不接受解釋既有權力結構和社會體系的宏大敘事,而是強調有必要將城市戰爭的空間化作為一個過程來研究,這個過程可以在軍事技術的日常運作層面得到更好的解讀。在這個層面上,生存能力成為一個至關重要的問題,一個有爭議的問題。對生存能力的探索使我們能夠審視將士兵的身體與技術物品和城市景觀聯系在一起的世俗關系政治,在人類和非人類之間構建新的關系。

論文將軍用裝甲車作為動態和不斷發展的技術對象進行分析,并通過其功能和故障追蹤在城市戰爭的平凡層面上引發的生存性關系政治。值得注意的是,將這種關聯追溯到美國軍方在上世紀伊拉克和阿富汗戰爭期間為恢復生存能力和應對致命的爆炸威脅而尋求的 MRAP 型車輛。

分析表明了生存能力是如何成為一個有爭議的問題,一個令人擔憂的問題,成為軍方技術和條令發展的基礎。如果不考慮士兵、裝備和任務/系統的生存能力,就無法投射力量。這種生存能力是兩個相互依存的關鍵過程的結果:具體裝甲概念、材料和技術的技術發展;士兵與裝甲車輛之間的社會技術關聯。從實用專利中分析前者,這些專利記錄了在一系列不同發明中解決裝甲對抗的過程;從軍事出版物、政府政策文件和二手資料中分析后者,這些資料將人類和非人類的工作聯系在一起。實用專利可以幫助解釋實驗室中的技術改進和發展歷程,而軍事出版物和其他資料則可以幫助解釋戰車在戰場上的部署及其遇到的挑戰和故障,無論是與戰斗有關還是無關。此外,還分析了與裝甲車相關的建筑和城市特征,在這里,裝甲車被視為移動的加固圍墻,以一種多功能的關系方式將士兵的身體與不同的環境連接起來。

因此,本文對城市研究、建筑人文學科和 STS 的討論做出了三方面的貢獻:1)論文提出了生存能力與軍事技術物體的功能有著內在聯系這一認識論立場;2)論文擴展了建筑與城市作為一種連接方式的關系理論,裝甲車輛將建筑與城市研究的范圍擴展到了靜態建筑的形象之外;3)論文回答了一個方法論問題,即利用技術物體研究城市戰爭的空間化以及將景觀還原為地形的問題。這三篇文章都從實用主義的角度,通過人與非人之間的相互依存關系,探討了生存能力的關系政治。

付費5元查看完整內容

現有的決策計算模型往往局限于特定的實驗設置。造成這種限制的主要原因是無法捕捉決策者對情況的不確定性。本文提出了一個計算框架,用于研究神經科學和心理學中不確定情況下的決策制定。框架主要側重于決策者對世界狀況的概率評估,即他們的 “信念”。具體來說,它基于部分可觀測馬爾可夫決策過程(POMDPs),結合貝葉斯推理和獎勵最大化來選擇行動。利用感知決策和社會決策方面的各種實驗數據,證明了基于信念的決策框架的可行性。框架解釋了感知決策實驗中決策者的實際表現與他們對實際表現的信念(即決策信心)之間的關系。它還說明了為什么在許多情況下這種評估會偏離現實。這種偏差通常被解釋為次優決策的證據,或選擇和信心的不同過程。我們的框架對這些解釋提出了挑戰,它表明,一個優化收益的規范貝葉斯決策者也會產生同樣的偏差。此外,在定量預測人類在社會決策任務中的行為方面,方法優于現有模型,并提供了對潛在過程的洞察。結果表明,在涉及大型群體的決策任務中,人類采用貝葉斯推理來模擬 “群體心理”,并對他人的決策做出預測。最后,將方法擴展到關于他人的多個推理層次(心智理論層次),并將服從作為群體決策的一種策略聯系起來。這個擴展框架可以解釋人類在各種集體群體決策任務中的行為,為大型群體中的合作與協調提供了新的理論。

圖 1.1: 基于信念的決策框架。智能體通過行動、觀察和獎勵與世界互動。智能體無法完全觀測到世界的狀態,只能根據觀測結果和智能體的內部世界模型,以概率方式表示世界的狀態。智能體的目標是根據當前狀態的概率分布來制定策略,即所謂的信念

付費5元查看完整內容

因果性和推理因果關系的能力是決策的核心。本論文通過提出可用于支持、理解和改進決策的新機器學習方法,為因果推理領域做出了貢獻,重點關注醫療保健領域。

首先,介紹了幾種因果推理工具,通過從觀察數據(如電子健康記錄)中估計干預(治療)的因果效應來支持決策。首先,要解決的是對連續值干預措施的反事實結果進行估計這一尚未充分探索的問題,并提出了一種基于生成對抗網絡的方法,該方法性能一流,可幫助我們為每位患者選擇正確的治療方法和劑量。然后,我們將注意力轉移到時間設置上,開發了一個序列到序列模型,該模型使用域對抗訓練來處理隨時間變化的混雜因素,可以幫助我們為每位患者確定最佳治療序列。此外,我們還介紹了第一種可以處理時間數據中存在的多病因隱藏混雜因素的方法。通過利用隨時間變化的治療分配中的依賴性,我們的方法可以學習到可用于替代隱藏混雜因素的潛在變量。

其次,將反事實推理整合到批量反強化學習中,開發出一種方法,通過對 "假設"(反事實)結果的偏好來模擬專家的獎勵函數,從而更好地理解專家的決策行為。我們的研究表明,這使我們能夠獲得專家決策過程的可解釋參數化,進而揭示與專家行為相關的權衡和偏好。

第三,提出了一種新的批量模仿學習模型,將因果結構納入所學的模仿政策,從而提高了決策的穩健性。通過確保模仿策略只依賴于行動的因果關系,我們學習到的決策準則能夠抵御虛假的相關性,并能很好地泛化到新的環境中。

總之,本論文介紹了能夠推理因果關系的機器學習在方法論上的進步,這些進步能讓我們改善為患者提供的個性化醫療服務,支持臨床決策,并建立更透明的臨床實踐報告。我們在討論中強調了將此類方法應用于實踐所面臨的挑戰,并對未來在這方面的工作提出了建議。

付費5元查看完整內容

隨著大數據的興起,信息的傳播速度也在不斷加快。速度將影響基于信息的決策。問題是,信息速度、連續性和真實性的提高是否有助于提高組織中決策者的決策質量。這種決策質量可以通過解決智能體在決策過程中對速度和準確性的權衡來解決。為了了解信息速度對決策質量的影響,本研究探討了速度對速度-準確性權衡的影響。本研究在決策過程中分析了這種權衡的背景。

現有工作

關于大數據的興起及其對組織決策過程的影響,目前已有相關研究。這些研究從所有四個方面對大數據進行了描述:數量、速度、種類和真實性;不過,有關速度對這些過程的具體影響的研究尚未問世。本研究有助于理解信息速度的概念以及這種速度對決策過程的影響。我們將通過描述信息速度對速度和準確性之間權衡的影響來探討這一問題。有關速度、速度-準確性權衡和決策過程的現有文獻為本研究提供了方向。

研究方法

為了探討信息對速度和準確性之間權衡的影響,本研究采用了基礎理論方法,在現有文獻和收集的數據之間反復推敲,以構建有關信息速度對速度-準確性權衡影響的理論。

我們在 Da Silveira 和 Slack(2001 年)的模型基礎上建立了一個模型,以解決速度對如何在速度和準確性之間進行權衡的影響問題。該模型經過調整,適用于智能體的行為影響過程中的權衡的情況。通過使用該模型,可以確定流程中的下一個因素:必要條件、一個目標給另一個目標帶來的變化、能力的有效性以及智能體如何平衡權衡的選擇。為了確定這些因素,采用了實證研究來解決這一問題,因為智能體的選擇是可以觀察和質疑的。實證研究是在一個案例研究中進行的:荷蘭國防部組織內的一個情報流程。實證研究采用了兩種方法:人種學觀察和訪談。訪談用于了解智能體所感知到的取舍,并深入了解導致這些取舍的因素。在人種學研究過程中,發現智能體在速度和準確性之間的實際權衡。數據收集過程的結果被整合到一個模型中,以解決信息速度對速度和準確性之間權衡的影響。

結論

通過實證研究方法收集的數據,我們構建了一個關于速度和準確性之間權衡影響的模型,如圖 S.1 所示。

圖 S.1: 信息速度對速度-準確性權衡的影響模型

該模型是通過分析在進行實證研究的背景下收集的數據構建的。這種環境受到以下背景因素的影響:所有接收到的信息都應進行分析的規則、交付結果的明確截止日期、流程中特定智能體的特定任務以及主要通過報告共享信息。

信息速度的影響既有消極影響,也有積極影響。積極影響包括信息可用性的提高,盡管這種影響只有在沒有信息進行分析過程時才會顯現。負面影響包括信息的可理解性降低,從而降低分析能力、速度和準確性。另外,當最后期限固定時,高信息速度導致的工作量增加要求智能體具有更高的速度水平。這種效應會導致結果的準確性降低,而在決策可能對人的生命造成高風險的情況下,這種結果往往是不可取的。

雖然速度提高后信息流動速度會加快,但如果不對當前決策過程的組織結構進行調整,決策過程的速度就不可能提高。而且,在特定情況下,當信息速度提高時,決策所依據的信息的準確性也可能降低。速度可以通過提高信息可用性為決策過程帶來機遇,但為了應對速度帶來的負面影響,應改變決策過程的組織結構。

下一步工作

在這項研究中,我們發現了信息速度對速度-準確性權衡的影響。這項研究是在特定背景下進行的,研究人員的主觀性影響了所構建的結果。為驗證研究結果,應在不同組織內,由多名研究人員和受訪者通過訪談和人種學研究開展更多實證研究。此外,基于 Da Silveira 和 Slack 模型開發的模型也應得到驗證,以適合解決智能體如何在目標之間進行權衡的問題。

付費5元查看完整內容

近來,持續圖學習在非靜態環境下處理多樣的圖結構數據任務中被越來越多地采用。盡管其學習能力充滿希望,當前關于持續圖學習的研究主要集中在緩解災難性遺忘問題,而忽視了持續性能改進。為了彌補這一差距,本文旨在提供一個關于持續圖學習最近努力的全面綜述。具體而言,我們從克服災難性遺忘的角度引入了一個新的持續圖學習分類法。此外,我們系統地分析了在持續提高性能中應用這些持續圖學習方法的挑戰,然后討論可能的解決方案。最后,我們提出了與持續圖學習發展相關的開放問題和未來方向,并討論它們如何影響持續性能改進。隨著深度學習在生活各領域的成功應用,社區開始渴望更強大的通用人工智能。盡管具有前景的潛力,基于神經網絡的持續學習面臨著一個嚴重的遺忘問題:在新任務上的學習通常會導致舊任務上性能的急劇下降,這被稱為災難性遺忘(CF)[95]。持續學習(CL)[46, 122] 被認為是克服這一挑戰的有希望的方式。CL 被視為智能代理逐步獲取、更新、積累并利用知識以持續改善其在任務上性能的學習能力[46]。為了緩解災難性遺忘問題,已經提出了許多CL策略,包括重放方法、正則化方法和參數隔離方法[27]。這些策略在智能代理的可塑性和穩定性之間尋找平衡,并減輕了災難性遺忘的問題。然而,當前的CL僅考慮單個數據樣本,并忽略了它們之間普遍存在的聯系。此外,克服CF僅代表著實現持續性能改進(CPI)的一條必不可少的路徑,而不是CL的終點。圖,也稱為網絡,是一種描述和分析具有交互作用實體的通用數據表示。圖已被廣泛采用于模擬不同應用中不同類型的關系,從生物分子到社會網絡。一方面,許多數據自然以圖的形式存在,如引文網絡、社交網絡和交易網絡。另一方面,即使那些看似未連接的數據也可以人為地構建成圖,如文本中的依賴圖、圖像中的特征圖和代碼中的調用圖。最近,圖學習已成為AI和機器學習中一個有前景的領域,由于其在學習實體間錯綜復雜的關系及相應的網絡結構方面的優勢。

然而,圖學習也受到了災難性遺忘現象的困擾。將持續學習與圖學習整合顯然也是緩解災難性遺忘的流行解決方案。持續圖學習(CGL)的整合稱為持續圖學習。盡管CGL具有潛力,但由于歐幾里得數據與圖之間的結構差異,一般CL與CGL之間存在顯著或復雜的差異,包括模型、任務設置和方法。此外,CL和CGL主要關注克服災難性遺忘,而忽視了持續性能改進。盡管關于CGL的研究數量在增加,但關于CGL的綜述很少。為了彌補這一差距,本文旨在提供一個關于CGL研究努力的全面綜述,特別是討論CGL方法如何實現持續性能改進。本綜述與現有綜述的不同之處。由于CGL與持續學習和圖學習高度相關,兩個領域都有許多綜述。表1將相關綜述歸類為CL、圖學習和CGL。特別是,關于持續學習的綜述大多關注(i)特定領域,如自然語言處理(NLP)[11]、計算機視覺(CV)[97]、機器人學[71]和自主系統[109];(ii)特定任務,如分類[27, 88];以及(iii)模型,如神經網絡[8, 46, 93]。然而,它們都只從孤立的角度而非綜合角度考慮數據。此外,它們過分強調緩解災難性遺忘,而忽視了持續性能改進,這是持續學習的最終目標。關于圖學習的綜述主要關注特定技術,包括圖表示學習[12, 24, 43, 48, 49]、圖神經網絡[138, 170]和圖深度學習[9, 41, 164]。此外,這些研究大多數通常考慮樣本級別的連接數據,而忽略了特征級別和任務級別的連接。另外,它們只關注靜態圖而忽略了在動態圖上的持續學習。盡管有幾項綜述考慮了圖的動態性質,包括動態圖學習[171]、動態圖表示學習[10, 62, 145]和動態圖神經網絡[116],它們主要考慮模型是否適應新數據,而忽略了災難性遺忘問題,從而完全排除了CL。據我們所知,只有兩篇綜述全面整合了持續學習和圖學習。特別是,[35] 回顧了CGL的研究進展、潛在應用和挑戰,而 [154] 則分類了克服CGL中災難性遺忘的方法。盡管它們明確考慮了持續學習中數據之間的聯系并專注于CGL,但它們沒有構建一個全面的視角,并且未能徹底闡述CL和CGL之間的關系和差異。此外,它們主要關注緩解災難性遺忘,而忽略了持續性能改進。

貢獻。本綜述總結了CGL領域的最新研究,并討論了當前方法是否以及如何實現持續性能改進。具體來說,我們的主要貢獻如下所述:

  • 一個新的分類法:我們提供了一個新的分類法來總結克服CGL中災難性遺忘的方法。具體來說,從如何實現持續性能改進的角度引入了四個組別(見圖1)。
  • 一個全面的綜述:對于每一類方法,我們討論了克服災難性遺忘的動機和主要挑戰。此外,我們進一步討論了當前方法如何實現持續性能改進。據我們所知,這是第一次對持續性能改進進行探討。
  • 未來方向:專注于持續性能改進,我們進一步提出了一些與持續圖學習相關的開放問題,并討論了它們如何影響持續性能改進以及相應的未來方向。

圖1展示了本文的組織結構。第2節介紹了CL和圖學習的基礎知識。第3節提出了CGL的概述,包括形式化、動機以及克服災難性遺忘的CGL方法的新分類法。具體來說,它從特定維度比較了與CGL相關的領域。第4至第7節根據提出的分類法總結了CGL的最近進展。在每一個類別中,都調查了主要挑戰及其相應的解決方案。此外,還從知識增強和優化控制的角度討論了這些方法如何實現持續性能改進。第8節總結了現有CLG研究中使用的實際應用和數據集。此后,第9節討論了開放問題和未來方向。最后,第10節總結了本文。

持續圖學習分類法持續圖學習本質上是持續學習的一個子領域,因此,持續圖學習的目標與常規持續學習相同:通過增量學習實現模型的持續性能改進。然而,由于圖中節點之間的相互依賴性,持續圖學習在方法上比常規持續學習更為復雜和多樣化。因此,我們提出了當前持續圖學習方法的一個新分類法,該分類法分為四個類別:基于重放的方法、基于正則化的方法、基于架構的方法和基于表示的方法,如圖3所示。所提出的分類法主要關注那些明確聲稱能夠克服災難性遺忘的方法,因為當前的工作很少涉及持續性能改進。然而,我們從知識的角度討論了災難性遺忘的根本原因和持續性能改進的關鍵,并進一步討論這些方法是否以及如何實現持續性能改進。從知識的角度看,災難性遺忘的根本原因是新知識對現有知識的覆蓋。假設某一時期的知識是有限的,并且可以在持續學習的設置中學到,那么持續學習的目標就是學習所有知識并在特定任務上實現持續性能改進。基于這種考慮,持續性能改進等同于持續獲取新知識或對現有知識的補充。這通常可以通過兩種方式實現:知識增強和優化控制。知識增強指的是后續任務的知識可以增強先前任務的知識。例如,人們在低年級學習四則運算,并使用它們來解決現實世界中的問題。然而,他們不使用變量來代表數字,因此在理解對象之間的數量關系時容易犯錯。在他們高年級學習變量和方程式后,他們將使用變量方程來理解和建模對象之間的數量關系,這給他們犯錯的機會更少。在這個例子中,變量和方程是對基本四則運算的增強。知識增強可以通過學習正樣本或負樣本來實現。優化控制指的是控制學習過程。如果學習過程可以用完成度來量化,完全學習肯定優于不完全學習。類比地,那些在課堂上認真聽講并完成所有作業的學生通常會比那些在課堂上分心并留下空白作業的學生表現得更好。在本文中,我們遵循上述考慮來討論和分析當前持續圖學習方法是否以及如何實現持續性能改進。

基于重放的方法利用從先前任務中學到的知識,與當前數據一起進行聯合訓練,以避免在學習新任務時發生災難性遺忘。基于重放方法的關鍵是獲取從先前任務中學到的知識,這通常通過抽樣或生成模型來獲得。圖4總結了基于重放的方法。

基于正則化的方法通過顯式考慮拓撲結構并向損失函數添加相應的正則化項來平衡舊任務和新任務的學習,以此來規范梯度方向,從而限制對先前任務至關重要的參數的劇烈變化,以克服災難性遺忘。正則化項通常有兩種方式:約束和蒸餾。圖5總結了基于正則化的方法。

基于架構的方法通過特定架構為任務分配任務特定的參數或網絡(部分共享或不共享),以避免任務之間的干擾。這些架構可以是固定的或動態的,如圖6所示。

由于節點之間的相互依賴性以及任務間邊緣的存在,新的增量圖將會影響先前的圖,而且先前任務的知識也可以傳遞給后續任務。這種知識難以顯式地納入持續圖學習,但可以隱式地編碼在節點嵌入中,我們將此稱為基于表示的方法。其基本原理是,現有的節點嵌入已經包含了下游任務所需的所有必要信息,而通過這種方法獲得的嵌入等同于弱化的聯合訓練。一般來說,基于表示的方法可以總結為分離和傳輸,如圖7所示。

結論 由于圖在現實世界中的普遍存在和動態性質,由圖神經網絡(GNNs)代表的圖模型已在各個領域得到廣泛應用。持續圖學習是一種新興的學習范式,旨在持續學習設置中進行圖學習任務,并實現持續性能改進。在這篇綜述中,我們提供了對持續圖學習近期研究的全面回顧。我們提出了一種新的分類法,用于總結克服災難性遺忘的持續圖學習方法。此外,對于每個類別,我們簡要闡明了關鍵問題,詳細描述了當前研究中的相應實踐,并討論了實現持續性能改進的可能解決方案。進一步地,我們還提出了一些與持續性能改進相關的開放問題,并建議了相應的有前景的研究方向。我們希望這篇綜述能幫助讀者理解持續圖學習的最近進展,并對這個有前景的領域的未來發展提供一些啟示。

付費5元查看完整內容

本文是研究指揮與控制(C2)未來表現形式的四篇系列論文中的第一篇。第一篇論文通過探討未來指揮與控制(C2)系統需要在其中運行的未來作戰環境,為后續研究設定了基線。具體來說,本文探討了復雜性的驅動因素、表現形式和影響,而此前的研究表明,復雜性很可能是這一環境的特征。為此,它討論了 C2 和復雜性等關鍵術語的定義;介紹了未來運行環境中復雜性的一些驅動因素,并討論了這些因素如何對 C2 系統和組織造成新的壓力;研究了分析和理解復雜性的可能方法;并概述了 2030 年代及以后可能產生的一些實際考慮因素。由于本文旨在為本系列的后續三篇論文提供資料,因此沒有全面涵蓋未來 C2 思考的所有方面,包括提出具體建議。

研究問題

  • 根據當前的全球社會和技術趨勢進行預測,國防和合作伙伴可能面臨的持續競爭和多領域作戰的作戰環境的性質是什么?
  • 基于這種對未來的預測,未來的 C2 系統和組織將面臨怎樣的復雜性;即復雜性的可能來源是什么?
  • 考慮到未來作戰環境的這一特點,未來的 C2 系統和組織需要具備哪些條件?
  • 未來的 C2 系統和組織需要什么樣的新能力和特性才能有效應對這些需求?

有爭議的定義

C2 沒有直截了當的定義,對于該術語在當代作戰環境中的范圍和相關性也存在爭議。對 C2 傳統定義的批判來自于對 21 世紀有效領導力構成要素的更廣泛質疑。在英國、美國和北約,最近出現了大量與 C2 相關的新術語,并將重點從聯合思維轉向多領域思維。我們的研究將 C2 定義為一個動態的、適應性強的社會技術系統,因此有必要考慮組織、技術和人力要素。

同樣,復雜性也沒有一個公認的定義。學術界對復雜性的研究日益增多,涉及多個科學學科,但缺乏統一的方法或理論框架。一個有用的出發點是區分簡單系統、復雜系統、復雜系統和復雜適應系統。文獻還描述了在這些條件下可能出現的所謂 "棘手"或 "超級棘手問題"。還可以對有限博弈和無限博弈進行重要區分--這是考慮作為復雜適應系統的國家間競爭時的一個有用視角。鑒于這些爭論,我們的研究避開了對復雜性的僵化定義,而是從其關鍵屬性的角度對這一現象進行了 DCDC 式的描述。

復雜性的預計驅動因素

未來作戰環境的特征--以及國防 C2 系統和組織預計將執行的任務類型--具有很大的不確定性,因此任何預測都必須謹慎。盡管如此,文獻指出了各種政治、經濟、社會、技術、法律、環境和軍事(PESTLE-M)趨勢,預計這些趨勢將影響國際體系的演變,進而影響 2030 年及以后的國防行動。這些趨勢包括以下宏觀趨勢

  • 日益增強的互聯性、多極化和全球競爭
  • 不斷變化的氣候的影響
  • 技術變革和數字化的影響
  • 傳統和新穎領域的模糊化
  • 國際準則和價值觀的轉變。

最重要的是,沒有一個單一或主要的趨勢推動著變化或復雜性;相反,最令人擔憂的是多種因素的融合及其不可預測的相互作用。這種認識為進一步研究這些趨勢影響國際體系復雜性水平和特征的具體機制提供了基礎,從而為在這一領域開展工作的 C2 帶來了新的挑戰。

復雜性的表現

上述 PESTLE-M 趨勢為未來組織應對 C2 帶來了一系列困境和壓力,包括但不限于

  • 不確定性
  • 模糊性
  • 多義性
  • 信息超載
  • 認知偏差
  • 面對瞬息萬變的事件,決策癱瘓或節奏不足
  • 難以確保決策(包括人工智能)或信任決策所依據的數據、邏輯和假設
  • 難以調動所有必要的權力杠桿,或協調參與制定和執行特定戰略或行動計劃的大量不同參與者(如跨政府合作伙伴、行業、國際盟友、公民)。

此外,無論是理論家還是實踐者,在處理包含非線性動態的問題時,都缺乏有力的措施來衡量所做決定或采取的行動的有效性。因此,很難確切地說未來作戰環境中的復雜性是否在客觀上不斷增加(而不是以不同的形式出現),但對軍隊應處理的復雜任務的政治期望與當前 C2 方法的執行能力之間顯然存在巨大差距。當前的學術理論為決定如何在復雜環境中配置 C2 提供了一個方法工具包的初步輪廓和一些指導原則,但并沒有提供靈丹妙藥。該理論強調審議分析方法,即讓不同利益相關者參與共同設計、借鑒多學科和知識體系的見解,并在分析和決策過程中建立靈活性,以便根據反饋意見不斷迭代和改進的方法。

未來 C2 的實際考慮因素

要應對復雜的自適應系統,就必須摒棄當前的線性 C2 流程和等級結構,盡管在處理非復雜任務和問題時,更傳統的方法可能仍然有用。在競爭激烈的世界中,英國既需要培養能夠對他人施加建設性影響的特性和能力(例如,將復雜性強加給對手的 C2),也需要培養能夠增強自身駕馭復雜性能力的特性和能力。

要影響敵對行動者的觀念、決策和行為,首先要深入了解其 C2 結構、流程和文化。根據這種了解,英國國防需要一套動能和非動能杠桿,對敵方的 C2 施加建設性影響,包括施加復雜性。除了敵對行動者,英國國防部還需要進一步了解如何對 PAG、盟友、合作伙伴、工業界、學術界、公民和對 C2 采取截然不同方法的其他人施加建設性影響。

在增強英國自身應對復雜性的能力方面,未來的 C2 系統和組織必須促進靈活性、復原力以及學習和適應能力等特性。整個決策周期都需要變革。例如,傳感器和通信技術的進步為獲取更多深度和廣度的數據提供了機會,包括有關復雜問題的數據。因此,提高認知能力對于理解所有這些數據至關重要,既要利用人類和機器的優勢,又要減少各自的缺點。要改變決策方法,還需要改變領導風格,以培養更善于駕馭復雜適應系統的決策者。在做出決策或計劃后,提高跨部門或跨層級的能力,在實施階段更好地整合活動或匯聚效應,對于抵消英國的局限性(如在質量方面)至關重要。

同樣,整合也不是萬全的;如果國防缺乏足夠深度的力量和能力,無法在充滿敵意的威脅環境中采取可信行動或維持高節奏行動,那么即使是最高效的指揮控制系統也無法在未來取得成功。此外,還需要采取防御措施以及恢復和失效模式,以阻止或減輕敵方破壞 C2 系統和組織的努力所造成的影響。鑒于所面臨的威脅,以及英國國防可能需要解決的不同形式的復雜問題,很可能會同時出現多種并行的 C2 模式,而不是單一的方法。應對復雜性意味著不斷學習、適應、創新和開放求變。因此,必須從一開始就將效果衡量標準、信號和變革機制納入計劃以及 C2 系統和組織,使其能夠隨著時間的推移不斷學習和調整,以應對各種情況。至關重要的是,未來 C2 系統和組織的設計只是挑戰的一部分--它們還必須得到更廣泛的國防企業緊急改革的支持,以確保獲得所需的使能因素(人員、技術等)。從 C2 的角度來看,這本身就是一個挑戰,因為改變這個企業--一個復雜的適應性系統--本身就是一個棘手的問題。

結論和下一步行動

學術理論家和政府、軍事或工業從業人員對復雜性或復雜適應系統的理解并不全面,而這正是未來 C2 運行環境的特點。雖然文獻提供了處理復雜性的有用方法和工具,以及未來 C2 的一些初步設計考慮,但英國 C2(本身就是一個社會技術系統)的現代化和轉型將是一項高度復雜的工作。這意味著要與不斷發展的作戰環境、不斷變化的威脅和技術環境共同適應,從而進行迭代和不斷學習。因此,最緊迫的挑戰或許是,考慮到 C2 系統在未來面對復雜性時取得成功所需的轉型(技術、結構、流程、文化、教育等)的程度和性質,了解如何在一段時間內最好地引導這一過程。

自相矛盾的是,要克服實現以應對復雜性為目標的 C2 系統所面臨的障礙,可能需要英國國防部已經表現出其所尋求建立的系統的許多特征。面對這樣的循環邏輯,英國國防部可能需要某種外部沖擊來迫使其進行創造性的破壞,或者利用(或不顧)更傳統、線性的 C2 方法來啟動自身的激進改革努力,并隨著時間的推移,隨著變化的到來而進行調整。

付費5元查看完整內容

在美國陸軍的條令中,結束狀態和條件描述的是沖突后的未來。結束狀態意味著沖突的結束--戰爭結束。許多現代戰爭都缺乏明確的輸贏劃分,因此無法達成和平協議,也無法實現最終狀態的解決。因此,軍事規劃人員需要一個成功解決沖突的框架和條件,以實現結束狀態。

本專著探討了戰爭如何結束。案例研究包括以最終地位解決而告終的戰爭、試圖但未能實現最終地位解決的戰爭,以及在僵持沖突中繼續進行的戰爭。北愛爾蘭戰爭以及以色列和埃及之間的戰爭在經過多年談判和實施之后以最終地位的解決而告終。以色列和巴勒斯坦之間的沖突未能解決最終地位問題,導致第二次起義的暴力爆發。塞浦路斯和納戈爾諾-卡拉巴赫存在著僵持不下的沖突,盡管談判仍在繼續,以期達成協議。

和平進程本質上是危險的,因為無論是失敗還是成功,都會導致相關地區的暴力加劇。不過,某些條件可以減輕這種危險。本專著建議,成功解決戰爭的框架應包括以下因素:穩定力量;沖突局部化;適當當事方的參與和消除不相干當事方;交戰人口的分治或隔離;實現和平的激勵措施;以及停火。

付費5元查看完整內容

本報告重點討論與人工智能系統可能缺乏可預測性而導致的有關風險--被稱為可預測性問題--及其對國家安全領域人工智能系統治理的影響。人工智能系統的可預測性表明人們可以在多大程度上回答這個問題:人工智能系統會做什么?可預測性問題既可以指人工智能系統的正確結果,也可以指不正確的結果,因為問題不在于這些結果是否符合系統工作的邏輯,而是在部署時是否有可能預見到這些結果。

人們越來越擔心,使用不可預測的人工智能系統為高風險決策提供信息可能會導致災難性的后果,這將破壞公眾對部署這些系統的組織的信任,并可能侵蝕政府的聲譽。在國家安全領域,人工智能的使用引入了一個新的不確定性來源,可能會阻礙風險管理程序,并可能使責任鏈變得混亂。在這個領域,可預測性問題的影響可能導致關鍵基礎設施的安全風險、個人權利和福祉的風險、沖突升級或外交影響。

在本報告中,我們首先從技術和社會技術的角度分析了可預測性問題,然后集中討論了英國、歐盟和美國的相關政策,考慮它們是否以及如何解決這個問題。從技術角度來看,我們認為,鑒于人工智能系統的設計、開發和部署的多層面過程,不可能考慮到所有的錯誤來源或可能產生的新行為。此外,即使在理想的情況下,在設計或開發階段沒有錯誤可以假設或檢測,一旦部署了人工智能系統,仍然可能發展出形式上正確的(但不想要的)結果,這在部署時是無法預見的。

我們通過關注人機編隊(HMT-AI)來分析可預測性問題的社會技術影響。人機編隊代表了一種越來越普遍的人工智能系統部署模式。在HMT-AI中,人類咨詢、協調、依賴、發展并與人工智能代理交換任務。由于HMT-AI結合了人類和人工的自主性,它們通過增加人工和人類代理及其環境之間的互動的數量和類型而加劇了可預測性問題。在這種情況下,我們發現可預測性問題的三個主要來源:人機交互、人員培訓和(過度)信任。人機交互可能會助長不可預測的結果,因為它們可以掩蓋、扭曲或過分詳細地描述人工智能系統的工作原理,而培訓計劃可能沒有考慮到人工智能技術的學習能力和HMT-AI的長期慣例建設。同樣,在HMTAI中,人類代理人不加批判地接受AI系統的結果,這種過度信任的動態也可能導致無法預測的結果。

在確定了可預測性問題的一些根本原因之后,我們分析了英國、歐盟和美國的政策,以評估這些原因是否在相關的政策文件中被涵蓋,如果是的話,如何以及在何種程度上被涵蓋。我們確定了四個主要主題和一個缺口。它們是:控制、監督和價值調整;資源提升的方法;可信賴人工智能的發展;以及缺乏對風險管理措施的關注,以遏制可預測性問題的影響。

我們的政策分析包括八個建議,以減輕與可預測性問題有關的風險。關鍵的建議是將治理方法集中在HMTAI上,而不僅僅是AI系統,并將可預測性問題概念化為多維度的,解決方案集中在HMT-AI組成的共同標準和準則上。在這些標準和準則中,可信人工智能的要求是特別相關的,應該與評估人工智能系統的可預測性的標準和認證計劃以及審計HMT-AI的程序結合起來。支持在國家安全中使用HMT-AI的決定的成本效益分析和影響評估應該考慮到可預測性問題及其對人權、民主價值的潛在影響,以及意外后果的風險。為了確保在部署潛在的不可預測的人工智能系統時進行充分的風險管理,我們建議調整ALARP原則--在合理可行的情況下盡量降低--作為制定HMT-AI中可預測性問題的人工智能特定風險評估框架的基礎。

擬議的基于ALARP的框架將提供有用的實際指導,但僅僅是這樣還不足以識別和減輕可預測性問題所帶來的風險。需要額外的政策、指導和培訓來充分考慮人工智能可預測性問題帶來的風險。人工智能系統支持的決策的影響越大,設計、開發和使用該系統的人的謹慎責任就越大,可接受的風險門檻也越低。這些分析和建議應該被理解為可操作的見解和實用的建議,以支持相關的利益相關者在國家安全背景下促進社會可接受的和道德上合理的人工智能的使用。

建議

建議1. 政府應撥出研究經費,發展公私合作,對HMT-AI進行縱向研究。這項研究應側重于HMT-AI中的新舊決策模式,以評估編隊協議建設和培訓對績效和控制措施的影響。重點應放在為HMT-AI的具體動態定義新的培訓協議,以及加快風險管理標準和HMT-AI績效評估的發展。

建議2. 應該建立一個專門的HMT-AI認證計劃,以促進行業對為HMT-AI設計的AI系統的設計要求和評估的共識。任務之間的通用性、有效的溝通、性能的一致性以及對新隊友的適應性都應該包括在這樣一個認證計劃中。在開發不足的ISO標準的基礎上,這個認證計劃還應該擴展到過程的可追溯性和決策的問責制,以及評估HMT-AI信任程度的審計機制。這對于抑制HMT-AI中的過度信任和自滿態度是必要的,這種態度維持或擴大了可預測性問題。

建議3. 對國家安全領域的可預測性問題的政策反應應該側重于管理HMT-AI團隊,而不是單獨的AI系統。

建議4. 國家安全領域的HMT-AI的成本效益分析(CBA)應該包括對AI系統的可預測性以及技術和操作層面的相關道德風險的評估。為了促進各安全機構之間的一致評估,應該定義一個評估人工智能系統可預測性的標準量表,在這個量表上,使用(或不使用)人工智能的選擇應該根據上下文的CBA以及考慮公眾對風險和相關利益的態度來證明。這個尺度的定義應屬于獨立的第三方行為者的職權范圍,即與部署HMT-AI的公共機構不同。

建議5. 與其說是 "更多 "或 "更少 "的可預測性,政策建議應側重于可預測性的權衡,明確具體建議旨在解決可預測性問題的哪個方面,以何種方式解決,以及它們有可能加劇哪些方面,哪些緩解措施將被落實到位。政策應該認識到,可預測性是一個多維度的概念,在一個層面上可預測性的收益可能會以另一個層面的損失為代價。

建議6. 關于國家安全中人工智能可預測性問題的政策應該在正式和操作層面上解決可信度和不可預測性之間的聯系。例如,應該給人工智能系統一個可修正的可預測性分數,這應該包括在對系統的可信任度的評估中。人工智能系統的可信賴性應包括成本效益分析,以評估不想要的行為在不同部署背景下可能帶來的風險。

建議7. 應該為不可預測的人工智能建立風險閾值,這些閾值將圍繞不可預測行為的風險嚴重程度映射到其自身的可預測程度(例如,劃分為已知的已知因素、已知的未知因素等)。這些閾值反過來將為風險管理過程的發展提供信息,允許根據風險的可預測性及其影響對其進行優先排序。

建議8. 應該制定一個基于ALARP的框架,以評估不可預測的人工智能和HMT-AI的風險,并為任何給定的環境確定可接受的最大程度的不可預測性。這個框架應該包括:

  • 對特定人工智能系統和HMT-AI的可預測程度的定量評估;
  • 對導致部署人工智能系統的設計、開發和/或采購步驟的可追溯性的評估;
  • 對部署條件的評估,例如,HMT-AI、操作員(或HMT-AI成員)的培訓水平、交互的透明程度、人類對AI系統的控制水平;
  • 對部署該系統的潛在風險和預期收益進行成本效益分析(根據建議4);
  • 對假設情況的分析,以考慮風險暴露或緩解措施的有效性如何隨部署情況而變化;
  • 人為推翻系統的協議和補救機制。

付費5元查看完整內容

本文概述了一個認知維度框架,旨在指導課程開發人員和分析人員組織和評估學習活動,向美海軍陸戰隊員介紹任何行動區的人群認知維度。該框架包括一系列按主題組織的問題和議題,旨在提高海軍陸戰隊員預測和影響作戰環境中各種人群的行動和決策的能力,以實現預期的結果。本文還將該框架置于海軍陸戰隊對信息環境認知層面的理解中,并描述了先進作戰文化中心(CAOCL)如何支持這些行動。

付費5元查看完整內容
北京阿比特科技有限公司