亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

戰爭室效應模型(WREM)及其配套的態勢控制系統是根據決策者個性提出的優化組織支持決策的概念。PEN 人格模型、情感注入模型、弗魯姆-耶頓模型、情境強度和耶克斯-多德森定律的概念和部件為 WREM 作為一個概念模型的建立提供了理論基礎。兩個實驗支持在假設的決策情景中確定性能差異的關鍵來源。其中第一個實驗有力地支持了將 WREM 的核心個性和情境因素作為重要差異來源的觀點。第二個實驗總體上證實了 WREM 核心因素的重要性,并進一步表明,性能變異的主要來源是個性和態勢因素之間的關鍵交互作用。這直接支持了 WREM 作為參數模型的條件驗證。通過響應面分析和模型優化,確定了作為態勢控制系統的個性匹配優化方案。對該系統的隨機模擬表明,在 WREM 個性因素的考察范圍內,決策性能都有顯著提高。通過在經濟學理論和模型中實際而全面地考慮個性和態勢因素,WREM 推進了我們對這些因素之間的動態交互作用及其對決策過程中認知表現的累積效應的基本理解。本研究最后建議將 WREM 作為進一步基礎研究和應用研究的主題,并提出了在工業中實施和應用 WREM 的概念草案。

在整個開發和完善過程中,WREM 為選擇研究目標和實驗方法提供了重點,這些目標和方法是支持整個研究工作所必需的。以下各節將討論該模型的適用性、構成以及為實現該模型而開展的研究的局限性。

WREM 是一個參數模型,代表了與人、情境、喚醒、情感和績效相關的既有模型和理論的整合,為判斷和決策的可變性提供了新的見解。該模型估計了人格和情境因素(即 “作戰室效應”)對決策者認知表現的動態交互影響。通過與之配套的情境控制系統,WREM 可以根據決策者的個性優化決策質量。

適用于 WREM 的決策環境包括:

  • 一個關鍵而復雜的組織問題需要高質量的決策。
  • 確定由一個合格的人來負責決策。
  • 決策事件與相關的決策前活動和執行過程是分離的。
  • 決策制定者在發揮其作用時,可獲得量身定制的資源支持,包括但不限于正式的審議程序、設施和人員。
  • 決策活動的物質條件受到控制。
  • 決策具有權威性和獨立意義。

上述條件被視為正式組織決策過程的標志。對于那些不符合上述條件的情況,世界資源研究所的適用性可能會更加有限。

WREM 由 15 個變量組成,決策有效性是因變量。六個自變量被確定為核心因素,并通過實驗進行多層次測試。另外三個自變量被確定為控制因素,在單一層面上進行測試。另外五個變量作為理論因素,沒有在本研究中進行測試。上圖描述了 WREM:

因變量:

  • 決策有效性--從理論上定性衡量全面實施決策的成功與否。由于決策具有假設性,不需要執行,因此在與本研究相關的任何實驗中都沒有使用這一變量。

獨立變量 :

  • 精神病性 - 決策者的攻擊傾向和精神病發作或與現實脫節(或沒有)的測量水平。
  • 外向性--決策者的積極情感傾向以及社會和外部參與傾向的測量水平。
  • 神經質--決策者情緒化或消極情緒傾向的測量水平。
  • 智力 - 衡量決策者的智力水平。這一變量在本研究中作為控制因素使用。
  • 經驗 - 衡量決策者與任務相關的經驗水平。這一變量也是作為本研究的控制因素而開發的。
  • 支持群體 - 為支持決策活動而建立的社會群體所產生的人際關系和互動刺激的測量水平。在本研究中,該變量包括以下描述性屬性:參與者獲得相關信息的程度;目標的一致性;參與者之間因決策而發生沖突的可能性;以及群體的規模、熟悉程度和交際能力。
  • 環境刺激--在決策活動中,由環境和物理來源產生的感官刺激的測量水平。在本研究中,這一變量包括視覺、聽覺和觸覺(即與觸覺或感覺有關的)刺激,作為描述性屬性。
  • 過程結構--對審議方式或方法的控制程度的衡量。在本研究中,該變量包括邏輯性、嚴謹性和清晰性等描述屬性。
  • 決策類型--根據需要決策的問題的特征對決策進行分類。在本研究中,該變量的部件屬性包括緊迫性、復雜性、非典型性、關鍵性和不確定性。這一變量是作為控制因素開發的。

其他中介變量:

  • 認知表現--在其他地方被稱為決策質量,它是在決策活動的高潮時對決策的適宜性進行的定性測量,而不具體考慮決策的執行情況。這一中介變量被選為本研究機構兩項實驗研究的因變量。
  • 情感狀態--從理論上衡量決策者在情感、情緒和情緒的積極、中立或消極方面的心理狀態。這一變量并未用于本研究的任何相關實驗。
  • 認知處理策略--對決策者在形成決策過程中潛意識選擇的心理過程進行的理論分類。本變量未在與本研究相關的任何實驗中使用。
  • 新出現的屬性--從理論上對群體商議和決策過程中可能出現的動態因素進行分類。該變量未在與本研究相關的任何實驗中使用。
  • 外部因素 - 從理論上對可能影響決策執行的動態因素進行分類。預計這些因素會在審議和決策過程之外和/或之后出現。本變量并非為本研究的相關實驗而開發。

由于實際決策事件并未被規劃為實驗平臺,所選的理論因素被排除在外,因為在實驗刺激的眾多因素中,有效地體現這些因素是不切實際的。其他因素只包含在控制水平上,因為擔心如果完全不體現這些因素,可能會在實驗反應中引起不必要的變異。在排除這些因素的情況下,假定這些因素對決策質量產生隨機影響。如果在控制設置中包含了這些因素,則假定如果在多個層面上對其進行研究,其效果將與其他權威文獻預測的效果基本一致。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

虛擬環境(VE)技術的最新進展,以及虛擬環境在治療和培訓個人方面的應用的增長,為在安全和豐富的環境中進行演練開辟了新的可能性。研究表明,虛擬環境可用于治療創傷后應激障礙(PTSD)患者,但很少有研究提出創建有效環境的良好指導原則。本研究旨在為系統設計提供參考,讓退伍軍人在實際進入該環境之前,在安全的環境中演練潛在的壓力體驗。我們調查了退伍軍人對虛擬環境特定設計組件的反應,以幫助開發對退伍軍人有效的系統。評估了對建議的六種刺激的反應,以及兩種類型的系統視角:第一視角和第三視角。采用的測量方法包括參與者的行為、主觀不適單元(SUD)以及包括心率、心率變異性和呼吸頻率在內的生理反應。對于患有創傷后應激障礙的退伍軍人來說,最有效的系統應該包括一套初始刺激,這些刺激可以進行配置,以便關注個人所經歷的特定創傷,或許還可以改變刺激強度。這些刺激應包括擁擠的房間和驚嚇噪音場景。第一人稱視角和頭戴式顯示器是首選的設計,除非是曾經有過暈動癥的人。這些人應該先在中性的第一人稱 VE 環境中接受網絡暈動癥測試,然后再在演練環境中接受測試。結果表明,創傷后應激障礙患者的心率反應與非創傷后應激障礙患者有明顯不同,創傷后應激障礙患者的 SUD 分數變化提供了有關個人對每種刺激的反應的有用信息。創傷后應激障礙患者在 VE 中也會表現出回避刺激等行為。本研究的結果表明,除虛擬戰斗區域外,其他虛擬環境也能引起創傷后應激障礙患者的行為、情緒和生理反應,因此應進一步研究這些類型的環境是否適用于創傷后應激障礙退伍軍人。

付費5元查看完整內容

現有的決策計算模型往往局限于特定的實驗設置。造成這種限制的主要原因是無法捕捉決策者對情況的不確定性。本文提出了一個計算框架,用于研究神經科學和心理學中不確定情況下的決策制定。框架主要側重于決策者對世界狀況的概率評估,即他們的 “信念”。具體來說,它基于部分可觀測馬爾可夫決策過程(POMDPs),結合貝葉斯推理和獎勵最大化來選擇行動。利用感知決策和社會決策方面的各種實驗數據,證明了基于信念的決策框架的可行性。框架解釋了感知決策實驗中決策者的實際表現與他們對實際表現的信念(即決策信心)之間的關系。它還說明了為什么在許多情況下這種評估會偏離現實。這種偏差通常被解釋為次優決策的證據,或選擇和信心的不同過程。我們的框架對這些解釋提出了挑戰,它表明,一個優化收益的規范貝葉斯決策者也會產生同樣的偏差。此外,在定量預測人類在社會決策任務中的行為方面,方法優于現有模型,并提供了對潛在過程的洞察。結果表明,在涉及大型群體的決策任務中,人類采用貝葉斯推理來模擬 “群體心理”,并對他人的決策做出預測。最后,將方法擴展到關于他人的多個推理層次(心智理論層次),并將服從作為群體決策的一種策略聯系起來。這個擴展框架可以解釋人類在各種集體群體決策任務中的行為,為大型群體中的合作與協調提供了新的理論。

圖 1.1: 基于信念的決策框架。智能體通過行動、觀察和獎勵與世界互動。智能體無法完全觀測到世界的狀態,只能根據觀測結果和智能體的內部世界模型,以概率方式表示世界的狀態。智能體的目標是根據當前狀態的概率分布來制定策略,即所謂的信念

付費5元查看完整內容

本論文研究決策的各個方面,重點是認知建模的概率工具。其中一種工具就是所謂的經典概率理論(CPT,或貝葉斯理論;Tenenbaum & Griffiths, 2001; Chater et al. 其廣泛的論點是,認知處理必須反映出對環境統計結構的某種最佳適應,因此,人類認知必須與貝葉斯理論的原則相一致(Oaksford & Chater, 2009)。在許多情況下,CPT 似乎確實能準確描述行為,尤其是決策制定(Siegel 等人,2018 年),而這正是本研究的重點。

CPT在決策文獻中的主導地位之所以受到挑戰,部分原因在于兩位最具影響力的心理學家:特維爾斯基和卡尼曼(前者是被引用次數最多的心理學家之一,后者獲得過諾貝爾經濟學獎)。Tversky 和 Kahneman 提供了幾個例子,在這些例子中,人類決策者不斷做出與 CPT 原則截然相反的判斷。舉例來說,他們要求參與者判斷假設的女性琳達更有可能是 "銀行出納員和女權主義者",還是 "銀行出納員"。由于琳達被描述為女權主義者,而完全不是銀行出納員,大多數參與者傾向于推斷概率(銀行出納員和女權主義者)>概率(銀行出納員)。這一結論被稱為連接謬誤(CF,Tversky & Kahneman,1983 年)。根據 CPT(在單一概率空間中),這是不可能的,這就好比問倫敦 12 月下雪和下雨的頻率與倫敦 12 月只下雪的頻率。顯然,我們不可能讓前一個(連帶)事件的發生天數多于后一個,這是不可能的。

現代決策理論的發展已經超越了將 CPT 作為決策正規化的主要方法。雖然 CF 與 CPT(基本)框架不兼容,但我們可以借鑒其他框架,如量子理論(QT),來考慮 CF 決策是否可以被視為合理。量子理論已被確立為決策制定的重要替代形式框架。在量子理論中,概率是以不同的方式計算的(使用不同的公理),因此,與 CPT 相比,對于哪些判斷是適當的,所產生的直覺可能會有很大不同。事實上,CPT 和 QT 之間有許多不同之處,這些不同之處為我們提供了一個細微的圖景,說明在什么情況下,CPT 或 QT 可能是更適合理解人類決策的框架。例如,在 CPT 中,事件肯定是真的或假的,但在 QT 中,有些事件可能既不是真的也不是假的。在 CPT 中,原則上一組問題都可以同時得到解決,因此我們可以討論任何問題結果組合的概率(這些聯合概率總是必須存在的)。在 QT 中,有些問題是不相容的,這意味著通常不可能同時解決這些問題。對于不相容的問題,一個問題的確定性會帶來另一個問題的不確定性。QT 中的概率推理強烈依賴于上下文和視角,而 CPT 則(自然地)不依賴于上下文和視角。

CPT 和 QT 都是允許我們理解事件概率的模型,盡管方式不同--CPT 和 QT 基于不同的公理,通常做出不同的預測。讓我們先來探討一下 CPT。假設你擲了一個六面骰子。如果你再擲一百次或一百萬次,每次擲出 4 的概率仍然是六分之一。擲出 4 然后擲出 6 的概率與擲出 6 然后擲出 4 的概率相同。這一點具有重要意義,因為在 CPT 中,我們對結果的任何疑問原則上都可以同時得到解決。例如,連續擲一百次 4 的概率是多少?事實上,我們可以討論任何問題結果組合的概率,以及這些概率是如何始終存在的。

現在讓我們來看看 QT。假設我們現在拿起了一組新的六面 "量子 "骰子(當然,請注意,這個例子是臆造出來的)。它們的量子特性是什么?它們的結果將不再能夠同時得到解決。我們將不得不使用不同的基本算術來計算結果組合的概率,骰子結果的分布將與 CPT 的預期結果形成鮮明對比。例如,這次當我們擲出 4 和 6 時,擲出 6 和 4 的概率是不同的。當我們開始將量子規則應用于行為場景時,這將產生非凡的影響。例如,讓我們問某人一組問題: "你喜歡你的工作嗎?"和 "你快樂嗎?" 根據你回答這些問題的順序,你很可能得到截然不同的回答。

本論文分為五個部分。本章是對當前工作的總體介紹。第 2 章至第 4 章介紹了測試 QT 在不同決策環境中的實用性的實驗研究。第 5 章是總結論,概述了本研究的理論成果和局限性。

付費5元查看完整內容

傳統的建模、仿真和分析(MS&A)大多由工程模型支持,即基于牛頓物理學的封閉系統的確定性表征。這種方法并不適合表現人類行為的復雜性。這項研究倡導并試圖闡明一種更加以人為本的 MS&A 方法的概念,這種方法可以更好地代表決策和人類行為的其他認知方面,就像代表身體活動一樣。

首先將個人和群體視為復雜的適應系統,而這種系統最好使用基于智能體的建模來表示。通過智能體對人類行為的表征包含了決策模型、知識工程和知識表征,以及人與人之間及其與環境之間的心理和生理互動的全部內容。這種表征方式的典型例子是將態勢感知/態勢理解(SA/SU)作為核心要素加以考慮。

由此,開發了一個概念驗證模擬,模擬一個具體、易于理解和量化的人類行為實例:智能體在模擬世界中試圖導航時在空間上 "迷失 "了方向。這個模型被命名為 "智能迷失模型"(MOBIL),因為這兩種狀態的能力是模擬的核心。MOBIL 采用面向對象的軟件原理與基于智能體的建模相結合的方式,建立了應用以人為本的分析方法的實用性。

在一些虛擬實驗中應用該模擬,說明了它如何支持對個人的 SA/SU 和相關決策過程進行調查。

付費5元查看完整內容

本論文為有限時間范圍內的魯棒性分析和綜合提供了理論和計算工具。這項工作的動機之一是對導彈攔截系統性能進行可靠評估,這也將有助于此類系統的穩健設計。典型的性能指標具有無限時間范圍的性質,以穩定性為中心,并依賴于頻域概念,如增益/相位裕度。對于在有限時間范圍內運行的系統(如許多發射場景),這些指標可能不夠充分。相反,本論文側重于時域指標,例如,在考慮干擾、模型不確定性/可變性和初始條件的影響的同時,對系統在視界最后時間的狀態進行約束。建議的方法是沿軌跡對動力學進行數值線性化,以獲得線性時變(LTV)系統。然后在線性化系統上進行分析或綜合,該系統可捕捉到標稱軌跡周圍的一階擾動。與原始非線性模型相比,這種方法犧牲了一些精度,但卻能使用線性系統工具。建議的最壞情況 LTV 分析還提供了具體的不良干擾和不確定參數,可在高保真非線性仿真中進一步研究。

導彈防御: 威脅環境正在以許多前所未有的方式迅速演變,這主要是由于現有導彈能力的增強和無人駕駛飛行器的更加靈活。任何導彈防御系統的首要目標都是保護國土、文明和戰略資產(如航空母艦)。這些復雜的工程系統必須探測、跟蹤和攔截來襲的威脅導彈,在它們到達各自目標之前將其摧毀。目前,最常見的方法之一是使用攔截導彈,通過與威脅導彈碰撞(即命中摧毀)或在其附近爆炸(即定向破片)使其失效。

目前的局限性: 單一攔截器與威脅交戰的性能可能會因多種因素而下降,包括外部干擾(如陣風)、未建模的靈活動態、傳感器噪聲、跟蹤不準確、致動器飽和、威脅的規避機動等。這對單個攔截器系統的精度造成了極大的影響。因此,需要發射多個攔截器來提高成功的可能性。然而,這并不總是可行的;例如,一艘小型海軍艦艇可能只有有限的艦載導彈資源。替代方法包括反火箭、火炮和迫擊炮(C-RAM)系統或 CIWS 雷達控制速射炮,發射多發炮彈,直到成功識別并摧毀威脅。當同時受到多個威脅的攻擊時,這種防御能力很容易被壓垮。有些威脅導彈具有很強的機動性,可使用多種誘餌和反制手段,因此很難被攔截。此外,如果不能在短時間內做出反應,可能會造成災難性后果。總之,目前的多層導彈防御系統嚴重缺乏性能保證。

目標:這項研究的主要目標是開發理論和計算工具,用于對在有限時間范圍內運行的系統進行魯棒性分析。重點是快速可靠地計算適當的魯棒性指標,以確定最壞情況下的性能。這種分析可用于補充現有的蒙特卡洛方法,以便在設計迭代的早期發現邊緣情況,或確定二元結果(如任務成功或在最壞情況下失敗)。

挑戰: 總體而言,由于存在許多不確定性、干擾和參數變化,最壞情況分析問題是非線性和非凸的。目前還沒有任何數值上可靠的工具可用于此類分析。即使存在這樣的工具,其適用范圍也很可能有限,因為它們要么計算速度很慢,無法保證收斂,要么只適用于學術范例。例如,考慮在 F-16 飛機上應用非線性動力算法進行最壞情況軌跡分析[8]。這種算法不僅缺乏收斂性保證,而且計算速度很慢。得出最壞情況下的參數和陣風組合所需的時間(4 到 4.5 小時)與蒙特卡洛模擬所需的時間大致相同。

方法: 方法主要是沿標稱軌跡對系統的動態進行數值線性化,并評估由此產生的線性時變(LTV)系統的穩健性。這種線性化系統只捕捉標稱軌跡周圍的一階擾動。我們利用系統的線性特性,通過解決凸優化問題,為 LTV 性能提供正式保證。然而,這需要犧牲原始不確定非線性系統的精度(即以精度換取計算效益)。這種近似分析只需要一次非線性模擬,速度明顯更快。擬議的有限視界線性化分析還提供了最壞情況下的性能證明(如特定的 "壞 "干擾、參數等),可在非線性模擬中進一步分析。

付費5元查看完整內容

基于模型的決策支持系統(MDSS)在航空、應急管理、軍事指揮與控制、醫療保健、核行動、情報分析和海上行動等許多后果嚴重的專業領域都非常突出。MDSS 通常使用任務和操作員的簡化模型,對決策情況進行結構化處理,并向操作員提供對決策任務有用的信息提示。模型是一種簡化,可能會被錯誤定義,并存在誤差。采用和使用這些錯誤的模型會導致用戶的決策貧乏。本文把決策者的這種貧乏狀態稱為 "模型盲"。我們進行了兩個系列實驗,以研究模型盲對人類決策和績效的不利影響,以及如何通過可解釋人工智能(XAI)干預來減輕這些影響。本論文還報告了模擬結果,通過展示模型盲區和模型盲區緩解技術對性能的影響來激發實驗。實驗將模擬路線推薦系統作為具有真實數據生成模型(不可觀測世界模型)的 MDSS 來實施。在實驗 1 中,生成推薦路線的真實模型以及額外的非推薦路線和相關屬性信息被錯誤地指定為不同級別,從而對 MDSS 用戶造成了模型盲區。在實驗 2 中,同樣的路線推薦系統采用了緩解技術,以克服模型失當對決策質量的影響。總體而言,這兩項實驗的結果幾乎都不支持由于模型盲區而導致的性能下降,因為模型盲區是由錯誤的系統造成的。實驗 1 和實驗 2 中捕捉到的行為對參與者所處的不同誤設統計環境的敏感性極低。有確鑿證據表明,在不同條件下,推薦的替代方案以及參與者對這些方案的依賴或偏離都會產生影響。XAI 干預為了解參與者如何調整決策以考慮系統中的偏差以及如何偏離模型推薦的備選方案提供了寶貴的見解。參與者的決策策略表明,他們能夠從反饋或解釋中理解模型的局限性,并相應地調整策略以考慮模型中的錯誤規范。這些結果為評估決策策略在模型盲區匯合模型中的作用提供了有力支持。這些結果有助于確定在 MDSS 的開發、實施和使用階段仔細評估模型盲區的必要性。

圖 3. 為實驗開發的路線推薦系統中使用的模型

付費5元查看完整內容

許多人都有這樣的設想:學習者通過沉浸在激勵性的學習環境(如游戲)中,將學習者的掌握程度提高到新的水平,從而獲得STEM科目。STEM(科學、技術、工程和數學)的概念是復雜和困難的,需要在更深的層次上學習,而不僅僅是記住事實、規則和程序。在理想情況下,學習者會受到挑戰和激勵,在掌握傳統培訓方法可能無法獲得的復雜課題方面有所提高。他們將花費數百個小時來尋找一個很少有人解決的問題的解決方案,尋找兩個或更多因素之間的權衡點,或解決一組不相容的約束。這正是21世紀培訓的進步愿景。如何在一個激勵性的學習環境中實現深度學習?游戲提供了一個尋找答案的好地方,因為設計良好的游戲是有激勵作用的,而且一些元分析已經報告了游戲對學習的積極影響(Mayer, 2011; O'Neil & Perez, 2008; Ritterfeld, Cody, & Vorderer, 2009; Shute & Ventura, 2013; Tobias & Fletcher, 2011; Wouters, van Nimwegen, van Oostendorp, & van der Spek, 2013)。

本章探討了將游戲與智能輔導系統(ITSs)整合的前景。希望能有這樣的學習環境,通過游戲優化學習動機,通過ITS技術優化深度學習。深度學習指的是獲得布盧姆(1956)分類法或知識-學習-教學(KLI)框架(Koedinger, Corbett, & Perfetti, 2012)中較高層次的知識、技能、策略和推理過程,如將知識應用于新案例、知識分析和綜合、問題解決、批判性思維以及其他困難的認知過程。相比之下,淺層學習涉及感知學習,記憶明確的材料,以及掌握簡單的僵化程序。淺層的知識可能足以應付知識/技能的近距離轉移測試,但無法應付具有一定復雜性的新情況的遠距離轉移測試。

已經有一些人嘗試開發游戲-ITS混合體(Adams & Clark, 2014; Halpern等人, 2012; Jackson & McNamara, 2013; Johnson & Valente, 2008; McNamara, Jackson, & Graesser, 2010; McQuiggan, Robison, & Lester, 2010; Millis等人, 2011; Sabourin, Rowe, Mott, & Lester, 2013)。然而,要知道游戲和ITS之間的“結合”是最終慶祝數十年的紀念日,還是因為兩個世界之間不相容的限制而以“分離”告終,現在還為時過早。深度學習需要努力,往往令人沮喪,通常被視為工作而不是游戲(Baker, D'Mello, Rodrigo, & Graesser, 2010; D'Mello, Lehman, Pekrun, & Graesser, 2014)。事實上,在目前沒有游戲屬性的ITS研究中,喜歡和深度學習之間的關聯往往是負面的(Graesser & D'Mello, 2012; Jackson & Graesser, 2007)。也許游戲屬性可以通過足夠的娛樂性、學習者自由和自我調節的活動將這項工作變成游戲(Lepper & Henderlong, 2000),從而將相關性從負數轉為正數(Sabourin等人,2013)。如果不是這樣,那么游戲可能是為獲取淺顯的知識和技能而保留的,如記憶事實、簡單的技能和僵硬的程序。相反,游戲可能不適合獲取深層次的知識和策略,如理解復雜系統、推理因果心理模型和應用復雜的定量算法。

本章不會揭開在游戲環境中建立一個成功的ITS的秘密。現在講這個故事還為時過早。相反,我們希望實現三個目標。首先,我們將回顧ITS研究和開發中的成功和挑戰。第二,我們將描述通用智能輔導框架(GIFT)中的ITS的組成部分。GIFT最近由美國陸軍研究實驗室開發,作為未來開發ITS的穩定藍圖和指南(Sottilare, Graesser, Hu, & Holden, 2013; Sottilare, Graesser, Hu, & Goldberg, 2014)。第三,我們將反思這些工作如何與游戲相結合。對ITS組件和基礎研究的充分理解是制定ITS和游戲之間有意義的求愛的必要前提。

有必要指出本章不會涉及的兩個研究和應用領域。本章不涉及游戲在獲得和掌握淺層學習方面的作用。經驗證據使我們相信,設計良好的游戲可以有效地提高淺層學習,而對于深層學習是否可以從游戲中獲益,文獻中還沒有確定的說法。本章也不涉及團隊背景下的學習和問題解決。我們的重點是與ITS互動的個人的深度學習。

付費5元查看完整內容

長期目標

在決策或推理網絡中進行適當的推理,需要指揮官(融合中心)對每個下屬的輸入賦予相對權重。最近的工作解決了在復雜網絡中估計智能體行為的問題,其中社會網絡是一個突出的例子。這些工作在各種指揮和控制領域具有相當大的實際意義。然而,這些工作可能受限于理想化假設:指揮官(融合中心)擁有所有下屬歷史全部信息,并且可以假設這些歷史信息之間具有條件統計獨立性。在擬議的項目中,我們打算探索更普遍的情況:依賴性傳感器、(可能的)依賴性的未知結構、缺失的數據和下屬身份被掩蓋/摻雜/完全缺失。對于這樣的動態融合推理問題,我們建議在一些方向上擴展成果:探索數據源之間的依賴性(物理接近或 "群體思維"),在推理任務和量化不一定匹配的情況下,采用有用的通信策略,甚至在每個測量源的身份未知的情況下,采用無標簽的方式--這是數據關聯問題的一種形式。

我們還認識到,對動態情況的推斷是關鍵目標所在。考慮到一個涉及測量和物理 "目標 "的傳統框架,這是一個熟悉的跟蹤問題。但是,來自目標跟蹤和多傳感器數據關聯的技術能否應用于提取非物理狀態(物理狀態如雷達觀察到的飛機)?一個例子可能是恐怖主義威脅或作戰計劃--這些都是通過情報報告和遙測等測量手段從多個來源觀察到的,甚至可能被認為包含了新聞或金融交易等民用來源。這些都不是標準數據,這里所關注的動態系統也不是通常的運動學系統。盡管如此,我們注意到與傳統的目標追蹤有很多共同點(因此也有機會應用成熟的和新興的工具):可能有多個 "目標",有雜波,有可以通過統計學建模的行為。對于這種動態系統的融合推理,我們的目標是提取不尋常的動態模式,這些模式正在演變,值得密切關注。我們特別建議通過將雜波建模為類似活動的豐富集合,并將現代多傳感器數據關聯技術應用于這項任務,來提取特征(身份)信息。

目標

研究的重點是在具有融合觀測的動態系統中進行可靠推理。

方法

1.決策人身份不明。在作戰情況下,融合中心(指揮官)很可能從下屬那里收到無序的傳感器報告:他們的身份可能是混合的,甚至完全沒有。這種情況在 "大數據 "應用中可能是一個問題,在這種情況下,數據血統可能會丟失或由于存儲的原因被丟棄。前一種情況對任務1提出了一個有趣的轉折:身份信息有很強的先驗性,但必須推斷出身份錯誤的位置;建議使用EM算法。然而,這可能會使所有的身份信息都丟。在這種情況下,提出了類型的方法來完成對局部(無標簽)信念水平和正在進行的最佳決策的聯合推斷。

2.動態系統融合推理的操作點。在以前的支持下,我們已經探索了動態事件的提取:我們已經開發了一個合理的隱馬爾科夫模型,學會了提取(身份)特征,有一個多伯努利過濾器啟發的提取方法 - 甚至提供了一些理論分析。作為擬議工作的一部分,將以兩種方式進行擴展。首先,打算將測量結果作為一個融合的數據流,這些數據來自必須被估計的未知可信度的來源。第二,每個這樣的信息源必須被假定為雜亂無章的 "環境 "事件(如一個家庭去度假的財務和旅行足跡),這些事件雖然是良性的,可能也不復雜,但卻是動態的,在某種意義上與所尋求的威脅類似。這些必須被建模(從數據中)和抑制(由多目標追蹤器)。

3.數據融合中的身份不確定性。當數據要從多個來源融合時,當這些數據指的是多個真相對象時,一個關鍵的問題是要確定一個傳感器的哪些數據與另一個傳感器的哪些數據相匹配:"數據關聯 "問題。實際上,這種融合的手段--甚至關聯過程的好方法--都是相當知名的。缺少的是對所做關聯的質量的理解。我們試圖提供這一點,并且我們打算探索傳感器偏差和定位的影響。

4.具有極端通信約束的傳感器網絡。考慮由位置未知、位置受漂移和擴散影響的傳感器網絡進行推理--一個泊松場。此外,假設在這樣的網絡中,傳感器雖然知道自己的身份和其他相關的數據,但為了保護帶寬,選擇不向融合中心傳輸這些數據。可以做什么?又會失去什么?我們研究這些問題,以及評估身份與觀察的作用(在信息論意義上)。也就是說,假設對兩個帶寬相等的網絡進行比較;一個有n個傳感器,只傳輸觀察;另一個有n/2個傳感器,同時傳輸數據和身份。哪一個更合適,什么時候更合適?

5.追蹤COVID-19的流行病狀況。誠然,流行病學并不在擬議研究的直接范圍內,但考慮到所代表的技能以及在目前的健康緊急情況下對這些技能的迫切需要,投機取巧似乎是合理的。通過美國和意大利研究人員組成的聯合小組,我們已經證明,我們可以從當局提供的每日--可能是不確定的--公開信息中可靠地估計和預測感染的演變,例如,每日感染者和康復者的數量。當應用于意大利倫巴第地區和美國的真實數據時,所提出的方法能夠估計感染和恢復參數,并能很準確地跟蹤和預測流行病學曲線。我們目前正在將我們的方法擴展到數據分割、變化檢測(如感染人數的增加/減少)和區域聚類。

付費5元查看完整內容

當前的海軍作戰要求水手們根據動態作戰環境中的不確定態勢信息做出時間緊迫和高風險的決策。最近的悲慘事件導致了不必要的傷亡,海軍行動中涉及決策復雜性,并特別突出了 OODA 循環(觀察、定向、決策和評估)中的挑戰。涉及使用武器系統的殺傷鏈決策是 OODA 循環中一個特別緊張的類別——具有難以確定的意外威脅、縮短的決策反應時間和致命的后果。有效的殺傷鏈需要正確設置和使用船上傳感器;未知接觸者的識別和分類;基于運動學和智能的接觸意圖分析;環境意識;以及決策分析和資源選擇。

該項目探索了使用自動化和人工智能 (AI) 來改進海軍殺傷鏈決策。該團隊研究了海軍殺傷鏈功能,并為每個功能制定了特定的評估標準,以確定特定 AI 方法的功效。該團隊確定并研究了 AI 方法,并應用評估標準將特定的 AI 方法映射到特定的殺傷鏈功能

圖:利用人工智能改進海軍殺傷鏈的作戰概念

總結

當前的海軍行動通常是快節奏的、關鍵的,并且需要做出高風險的決策,這些決策有時基于非常動態的戰區中的不確定信息。許多例子強調了提高決策效率的必要性以及減輕觀察團隊負擔的必要性。缺乏上述情況的例子包括 2017 年的菲茨杰拉德號航空母艦 (DDG 62) 和 MV ACX Crystal相撞,以及 2009 年皇家港口號航空母艦 (CG 73) 的擱淺。一些根本原因是相關人員缺乏經驗、疲勞和壓力.

上述事故展示了軍事行動的難度,并展示了 OODA(觀察、定向、決策和評估)循環中的挑戰(Jones 等人,2020 年)。人為錯誤、人的認知限制和海軍作戰固有的決策復雜性導致了 OODA 循環中的挑戰,更具體地說,是殺傷鏈過程中的挑戰。

現代戰斗空間由來自常規陸地、空中和海洋等多個領域以及來自太空和網絡空間的大量數據組成。決策者需要考慮許多因素,包括交戰規則 (ROE)、要使用的武器、傳感器和意圖評估。發現、修復、跟蹤、瞄準、參與、評估 (F2T2EA) 殺傷鏈模型緩解了該過程的一些困難(參謀長聯席會議,2013 年)。人工智能 (AI) 和機器學習 (ML) 可以通過分析備選方案和使用評估標準將 AI 方法映射到殺傷鏈功能,從而幫助海軍在戰術領域做出殺傷鏈決策。這是在本報告的五個章節中分三個階段完成的。

本報告利用了數百個資源,主要利用了美海軍研究生院 AI-OODA 團隊在其 Capstone 報告(2020 年)中進行的先前研究,“利用人工智能 (AI) 進行空中和導彈防御 (AMD):以結果為導向的決策援助。”他們將他們的工作與 John Boyd 的觀察、定向、決定和行動決策框架相結合。作為他們分析的初步步驟,AI-OODA 團隊將特定的 OODA 功能明確且緊密地耦合到特定的 F2T2EA 功能。然而,本報告斷言 OODA 循環是一個決策循環,它嵌套在殺傷鏈的每個功能中,而不是在高壓力或低壓力情況下專門映射到一個或多個殺傷鏈功能。團隊基于 F2T2EA 模型開發了一組 28 個殺傷鏈功能。

在制定將 AI 方法映射到殺傷鏈的評估標準時,很難確定一個好的決策,這對于決策評估至關重要。在評估決策時,必須考慮選擇行動時的知識意識狀態以及解釋能力。使用了幾種對決策進行評分的方法,從定義和優先考慮感興趣的“武器-目標”到制定評分標準和報告評估結果,以供其他人審查。

目前,人工智能的狀態非常廣泛,必須對其進行解釋,以了解人工智能對殺傷鏈中功能的適用性。本報告討論了所選 AI 方法的高級概述,并突出顯示了部分最流行的方法。首先,沒有普遍接受的定義,這很難定義人工智能。其次,人工智能與機器學習 (ML) 存在差異。 ML 允許在準確性和可預測性方面取得增量收益; AI 接收數據并通過算法提供輸出。人工智能的歷史從 1940 年代艾倫·圖靈 (Alan Turing) 的加密機器到 1980 年代美國政府在戰略計算計劃中的使用,再到今天在聯合人工智能中心 (JAIC) 中的人工智能戰略五個支柱,從領先的人工智能人力到安全和倫理。美國國防高級研究計劃局 (DARPA) 在 3-wave 框架中描述了 AI 的發展方向,分為手工知識 (Wave 1)、統計學習 (Wave 2) 和上下文推理 (Wave 3) 在 1-4 個維度內情報參數的屬性(Launchbury 2017)。這些屬性包括感知、推理、抽象和學習。

人工智能涉及可以根據輸入值預測結果的監督學習。有幾種使用監督學習進行學習的技術。包括線性回歸和分類。此外,許多數值方法可以分析發生的學習有效性,例如 F-score 和 Accuracy score。人工智能還可以使用無監督學習,它使用算法來發現未標記數據集中的數據模式或分組。在分析未知(y)響應以揭示標記(x)數據中的模式時,無監督學習是有益的。數據分析界的一個著名例子是鳶尾花(Iris flower)數據集。僅使用標記的數據,可以看到響應聚集在一起,并且可以確定響應中存在模式(花的種類)。無監督學習的方法包括聚類和 K-means,但還有其他方法。強化學習有一個代理能夠接收來自環境的反饋并理解基本目標。此外,正如 Sutton 和 Barto 在(2018 年)中解釋的那樣,探索和開發之間存在權衡。最后,生成對抗網絡 (GAN) 利用無監督學習和強化學習,通常用于神經網絡 (NN)。神經網絡是機器學習算法的極好來源,它有大量的輸入,而這些輸入又會產生大量的計算。 NN 非常適合用于模擬、自然語言處理、博弈論和計算機視覺。 NN 只是一種將輸入映射到輸出的簡單方法,可以在此過程中進行學習。然而,NN 可以被描述為一種“黑盒”學習技術,因為很難解釋正在發生的事情,并且通常需要一種可解釋的 AI (XAI) 技術。 XAI 的三個主要組成部分是可解釋模型、解釋界面和解釋心理學(Gunning 2019)。數據安全必須與“大數據”一起考慮,“大數據”是指非結構化、復雜和大型數據集,具有五個 v 特征:數量、速度(數據量隨時間變化的增加)、多樣性、真實性和價值。其他理論包括決策理論、模糊邏輯和效用函數

使用上述文獻綜述,該團隊開發了一個框架,用于將 AI/ML 映射到 AMD(空中導彈防御)殺傷鏈。采取了四個步驟:1) 建立模型框架,2) 確定決策點,3) 應用 AI/ML 方法,以及 4) 分析結果。該團隊確定了以下用于殺傷鏈映射分析的 AI/ML 方法:線性回歸、邏輯回歸、聚類、關聯、隨機森林、神經網絡、GAN 和樸素貝葉斯。評估標準被稱為“決策點”并提出四個問題:(1)所需輸出的類型是什么,(2)所需的學習類型是什么,(3)可解釋性(XAI)是什么水平需要,以及 (4) 需要多少個預測變量?該團隊通過基于一組決策點和評分過程評估每個殺傷鏈功能的每種方法來執行映射。對于被認為非常適合某項任務的方法,得分為+1,如果該方法適合但次優,則為0,如果該方法不適合該任務,則為–1。

該團隊進行了映射分析,根據與殺傷鏈的 28 個功能中的每一個功能相關的評估標準(決策點)分析 AI 方法。該團隊使用評分方法來確定每個殺傷鏈功能的最佳整體 AI/ML 分數。團隊的映射顯示為 0。

該團隊的 AI/ML 映射到殺傷鏈功能為國防部和海軍提供了兩個關鍵好處。首先,映射本身是設計和開發支持殺傷鏈決策的人工智能戰術決策輔助工具的重要起點和基礎。其次,該團隊將 AI 方法映射到殺傷鏈的分析過程可用于了解 AI 在許多其他軍事和非軍事領域的應用。識別適當的人工智能方法、制定評估標準和評分過程以及制定過程功能以進行分析映射的過程對于支持許多不同人工智能系統的工程具有深遠的潛力。

表1:AI/ML方法到殺傷鏈的映射

付費5元查看完整內容

在復雜的以人為中心的系統中,每天的決策都具有決策相關信息不完全的特點。現有決策理論的主要問題是,它們沒有能力處理概率和事件不精確的情況。在這本書中,我們描述了一個新的理論的決策與不完全的信息。其目的是將決策分析和經濟行為的基礎從領域二價邏輯轉向領域模糊邏輯和Z約束,從行為決策的外部建模轉向組合狀態的框架。

這本書將有助于在模糊邏輯,決策科學,人工智能,數學經濟學,和計算經濟學的專業人員,學者,經理和研究生。

讀者:專業人士,學者,管理者和研究生在模糊邏輯,決策科學,人工智能,數學經濟學,和計算經濟學。

付費5元查看完整內容
北京阿比特科技有限公司