基于模型的決策支持系統(MDSS)在航空、應急管理、軍事指揮與控制、醫療保健、核行動、情報分析和海上行動等許多后果嚴重的專業領域都非常突出。MDSS 通常使用任務和操作員的簡化模型,對決策情況進行結構化處理,并向操作員提供對決策任務有用的信息提示。模型是一種簡化,可能會被錯誤定義,并存在誤差。采用和使用這些錯誤的模型會導致用戶的決策貧乏。本文把決策者的這種貧乏狀態稱為 "模型盲"。我們進行了兩個系列實驗,以研究模型盲對人類決策和績效的不利影響,以及如何通過可解釋人工智能(XAI)干預來減輕這些影響。本論文還報告了模擬結果,通過展示模型盲區和模型盲區緩解技術對性能的影響來激發實驗。實驗將模擬路線推薦系統作為具有真實數據生成模型(不可觀測世界模型)的 MDSS 來實施。在實驗 1 中,生成推薦路線的真實模型以及額外的非推薦路線和相關屬性信息被錯誤地指定為不同級別,從而對 MDSS 用戶造成了模型盲區。在實驗 2 中,同樣的路線推薦系統采用了緩解技術,以克服模型失當對決策質量的影響。總體而言,這兩項實驗的結果幾乎都不支持由于模型盲區而導致的性能下降,因為模型盲區是由錯誤的系統造成的。實驗 1 和實驗 2 中捕捉到的行為對參與者所處的不同誤設統計環境的敏感性極低。有確鑿證據表明,在不同條件下,推薦的替代方案以及參與者對這些方案的依賴或偏離都會產生影響。XAI 干預為了解參與者如何調整決策以考慮系統中的偏差以及如何偏離模型推薦的備選方案提供了寶貴的見解。參與者的決策策略表明,他們能夠從反饋或解釋中理解模型的局限性,并相應地調整策略以考慮模型中的錯誤規范。這些結果為評估決策策略在模型盲區匯合模型中的作用提供了有力支持。這些結果有助于確定在 MDSS 的開發、實施和使用階段仔細評估模型盲區的必要性。
圖 3. 為實驗開發的路線推薦系統中使用的模型
近年來,對無人駕駛車輛等自主實體的研究開始給軍事和民用設備帶來革命性的變化。自主實體的一個重要研究重點是自主機器人群的協調問題。傳統上,機器人模型被用于考慮操作機器人群所需最低規格的算法。然而,這些理論模型也忽略了重要的實際細節。其中一些細節,如時間,以前也曾被考慮過(如執行的歷時)。在本論文中,將結合幾個問題來研究這些細節,并引入新的性能指標來捕捉實際細節。具體來說,我們引入了三個新指標:(1) 距離復雜度(反映機器人的耗電量和損耗),(2) 空間復雜度(反映算法運行所需的空間),(3) 局部計算復雜度(反映蜂群中每個機器人的計算要求)。
將這些指標應用于研究一些著名的重要問題,如完全可見性和任意模式形成。還引入并研究了一個新問題--"門道出口",它抓住了機器人群在受限空間中導航的本質。首先,研究了一類完全可見性算法所使用的距離和空間復雜性。其次,提供了整數平面上的完全可見性算法,包括一些在時間、距離復雜度和空間復雜度方面漸近最優的算法。第三,介紹了門道出口問題,并為各種機器人群模型提供了不同最優性的算法。最后,還提供了網格上任意圖案形成的最優算法。
現有的決策計算模型往往局限于特定的實驗設置。造成這種限制的主要原因是無法捕捉決策者對情況的不確定性。本文提出了一個計算框架,用于研究神經科學和心理學中不確定情況下的決策制定。框架主要側重于決策者對世界狀況的概率評估,即他們的 “信念”。具體來說,它基于部分可觀測馬爾可夫決策過程(POMDPs),結合貝葉斯推理和獎勵最大化來選擇行動。利用感知決策和社會決策方面的各種實驗數據,證明了基于信念的決策框架的可行性。框架解釋了感知決策實驗中決策者的實際表現與他們對實際表現的信念(即決策信心)之間的關系。它還說明了為什么在許多情況下這種評估會偏離現實。這種偏差通常被解釋為次優決策的證據,或選擇和信心的不同過程。我們的框架對這些解釋提出了挑戰,它表明,一個優化收益的規范貝葉斯決策者也會產生同樣的偏差。此外,在定量預測人類在社會決策任務中的行為方面,方法優于現有模型,并提供了對潛在過程的洞察。結果表明,在涉及大型群體的決策任務中,人類采用貝葉斯推理來模擬 “群體心理”,并對他人的決策做出預測。最后,將方法擴展到關于他人的多個推理層次(心智理論層次),并將服從作為群體決策的一種策略聯系起來。這個擴展框架可以解釋人類在各種集體群體決策任務中的行為,為大型群體中的合作與協調提供了新的理論。
圖 1.1: 基于信念的決策框架。智能體通過行動、觀察和獎勵與世界互動。智能體無法完全觀測到世界的狀態,只能根據觀測結果和智能體的內部世界模型,以概率方式表示世界的狀態。智能體的目標是根據當前狀態的概率分布來制定策略,即所謂的信念
美國國防部(DOD)的規劃規劃目前致力于將國家戰略目標轉化為兵力結構。用于采購的聯合能力集成與開發系統(JCIDS)需求生成過程是兵力結構的主要驅動因素,其核心是減少組織間的冗余、實現基于能力的采購,以及在聯合層面評估需求和解決方案。JCIDS 流程是提高組織層級的一個范例,在此層級上決定需求和由此產生的資源請求。當前的采購環境帶來了新的財政和政治限制(如預算削減、持續決議),而任務要求卻隨著行動需求的增加而提高。資源和需求的不確定性是由預算波動和不斷變化的業務需求驅動的。技術更新、資產資本化和資產重新分配之間的權衡已成為采購決策過程中的主要驅動因素,以平衡制約因素、需求和不確定性。我們需要新的方法來確保國防部的各利益相關方能夠最大限度地成功完成任務,同時在當前的限制條件下應對不確定性,而不需要另一個層面的綜合協調。針對其他利益相關方的決策和未來的不確定性,制定技術投資、系統開發和系統分配戰略 "劇本 "的新方法將有助于各利益相關方更好地分配資源。 軍事力量結構可定義為一個公認的系統簇(SoS)。目前已有大量工作涉及 SoS 工程流程、SoS 性能評估和 SoS 系統評估。然而,很少有方法能在協助國防利益相關者進行戰略規劃所需的層面上全面解決 SoS 規劃和演化問題。當前的方法無法解決多個利益相關者決策的影響、每個利益相關者的多重目標、決策結果的不確定性以及戰略決策的時間因素。
作者在回顧當前最新技術并綜合其他領域現有方法的基礎上,開發了一種三步方法來解決上述不足,從而為單個利益相關者制作游戲手冊提供參考。
這項工作假定了一個被視為真相模型的博弈框架,它代表了利益相關者的決策以及隨著時間推移而產生的結果。第一步是從復雜的博弈框架中創建一個計算上合理的元模型。使用蒙特卡洛技術對真相模型進行采樣,生成 s、a、r、s 樣本圖元。這些圖元用于訓練元模型 MDP。元模型會產生一個較低維度的狀態空間,該空間由元模型狀態、基于特定行動的轉換概率和隨機利益相關者獎勵組成。
第二步是利用現在可計算管理的決策空間,提取利益相關者的有用信息。MDP 元模型用于評估基于風險的策略、狀態重要性和行動重要性。在均值-方差組合理論的基礎上,開發了一種適用于利益相關者效用的新算法,并與強化學習(RL)策略迭代法相結合,利用 MDP 元模型構建基于風險的策略。在每個狀態前后都會對利益相關者指標進行熵測量,以衡量狀態的重要性。通過比較平均結果和結果方差,來衡量每個元模型狀態-行動對的給定行動的單個利益相關者指標之間的機會成本。
最后一步是生成信息,為利益相關者的具體行動手冊提供信息。基于風險的策略可用于在每個狀態下開發風險容忍度敏感性配置文件(RTSP)。狀態 RTSP 可以確定與風險和回報相關的帕累托效率行動和低效行動。狀態 RTSP 還能識別最差、低風險和高風險行動。此外,還可以對決策空間進行分析,以確定類似 RTSP 之間的一致趨勢,以及作為狀態值函數的 RTSP 分叉。使用熵和機會成本指標可識別重要的狀態和行動。
該方法的輸出結果是推導出的基于行動和狀態的風險信息,并提供給利益相關者,以支持制定基于風險的行動手冊。
制定該方法的部分目的是為了測試現有和新穎結構的適用性。在審查現有方法、綜合新方法和制定總體方法的過程中,提出了三個假設。假設 1 認為,使用基于風險的新型策略算法,可以確定帕累托效率行動。假設 2 斷言,可以應用狀態空間縮減技術來創建縮減的 MDP 元模型,以減少計算時間,同時保持可用的基于風險的策略輸出。假設 3 斷言,基于風險的策略度量可用于獲得超越當前最先進的信息,即最優策略方法所代表的信息。
實驗 1 使用一組日益復雜的 MDP 檢驗了假設 1,并證明了基于風險的策略算法識別帕累托有效和無效行動的能力。實驗 2 通過改變狀態壓縮率來檢驗假設 2,結果表明計算時間縮短,基于風險的策略也更加相似。實驗 3 利用不太復雜的情景和單一的完全復雜情景對假設 3 進行了檢驗。演示了該方法的全部能力,并與最優策略方法進行了比較。與最優政策方法的結果相比,這套方法所提供的信息更加細致入微。
對每個假設的成功評估表明,該方法可為軍事防御規劃人員(單一 SoS 利益相關者)提供信息,以制定基于風險的行動手冊,從而在具有多個合作和非合作利益相關者、預算限制和不斷擴大的作戰需求的不確定環境中協助長期決策。這將允許在利益相關者層面進行穩健的規劃,而無需額外的合并和審查。
傳統的建模、仿真和分析(MS&A)大多由工程模型支持,即基于牛頓物理學的封閉系統的確定性表征。這種方法并不適合表現人類行為的復雜性。這項研究倡導并試圖闡明一種更加以人為本的 MS&A 方法的概念,這種方法可以更好地代表決策和人類行為的其他認知方面,就像代表身體活動一樣。
首先將個人和群體視為復雜的適應系統,而這種系統最好使用基于智能體的建模來表示。通過智能體對人類行為的表征包含了決策模型、知識工程和知識表征,以及人與人之間及其與環境之間的心理和生理互動的全部內容。這種表征方式的典型例子是將態勢感知/態勢理解(SA/SU)作為核心要素加以考慮。
由此,開發了一個概念驗證模擬,模擬一個具體、易于理解和量化的人類行為實例:智能體在模擬世界中試圖導航時在空間上 "迷失 "了方向。這個模型被命名為 "智能迷失模型"(MOBIL),因為這兩種狀態的能力是模擬的核心。MOBIL 采用面向對象的軟件原理與基于智能體的建模相結合的方式,建立了應用以人為本的分析方法的實用性。
在一些虛擬實驗中應用該模擬,說明了它如何支持對個人的 SA/SU 和相關決策過程進行調查。
軍事行動需要具備對復雜的大城市環境進行態勢了解的能力。這通常是在情報、監視和偵察(ISR)任務中制定的。這些任務類型發生在戰斗的不同階段,包括戰斗行動和穩定與支持行動(SASO)。自主移動機器人小組可在已知的動態城市環境中執行巡邏和偵察任務,為士兵提供支持。
本文旨在開發一個名為 "風險地圖 "的概率框架。自主機器人將使用 "風險地圖 "規劃其行動,"風險地圖 "顯示了一個與戰術相關的位置,在該位置的暴露或環境可能使攻擊造成最大傷害(例如,可能的簡易爆炸裝置或狙擊手位置)。
“風險地圖”以決策過程為基礎,針對適應性對手事件分配機器人巡邏。這些技術將利用時間演化來防止對手不可避免地適應這些策略,因為這可能會使這些策略的效果大打折扣。
使用多機器人協調方法進行分散、信息量大且自適應的采樣應用不會出現單點故障。它允許隨時預測,任何機器人在任何時間點都能獲得環境的合理模型。此外,它還能將所需的通信量保持在最低水平。此外,適當的地理信息系統(GIS)技術為軍事指揮官提供了快速整合數據集、評估條件、規劃戰略和評估選項的手段。
圖:UGV和無人機之間的交互作用,進行源搜索和目視目標識別。
未來,人類將與人工智能系統密切合作。智能系統將成為團隊成員,并將起到擴展單個單元的覆蓋范圍和能力的作用,從而實現前所未有的能力。
自主機器人的智能探索和強大的協作監控將成為城市行動的關鍵,使其能夠預防未來的脆弱性和威脅風險。本論文探討了環境的先驗知識和類似場景中的行動歷史如何預測和預防未來的攻擊。在這篇論文中,我們提出了一個概率框架,在這個框架中,可以將一套領域專家規則與空間和語義知識結合起來,使自主智能體能夠收集信息。然后,自主智能體可以利用這個不斷演化的框架,針對不斷變化的信息環境規劃最佳行動,從而以最佳方式完成任務。我們的方法擴展了[Pit+08; ZST15]中描述的技術,用于本論文中介紹的 MAST/ARL 導航模塊所使用的基于信息的探索框架。Pita 等人創建了系統架構: ARMOR。該系統提供的月歷滿足了洛杉磯國際機場官員對檢查站和警犬在洛杉磯國際機場部署的所有關鍵要求。
多機器人團隊為部隊提供支持的一大挑戰是了解環境是如何動態變化的,以便為車隊選擇最明顯或最便捷路線的區域提供安全保障。為了應對這一挑戰,利用有關特定地點的地理信息系統數據和活動日志很有意義。實現這一目標的一種方法是使用基于信息的地圖(風險地圖),該地圖由一組模塊化組件組成,在評估風險的先驗概率時,這些組件代表了敵方戰略知識。此外,風險地圖還有一個時間組件,可逐漸回到先前的地圖狀態,代表戰爭迷霧。
我們考慮的現實場景是,由不同能力的機器人組成的團隊探索未知環境,每個機器人獲取并計算自己的地圖,并與團隊其他成員交換這些信息,同時考慮到通信限制,即機器人只能在特定距離內通信,信息量的交換受帶寬限制。此外,每個機器人都能從探索任務切換到尋找任務源,并能在需要時提供或請求援助。
利用自適應信息采樣的多機器人探索和導航協調策略,使機器人平臺能夠在未知環境中自主執行情報、監視和偵察(ISR)任務,從而防止未來的脆弱性和威脅風險。
本論文的所有貢獻都通過使用模擬和真實數據的實驗結果得到了驗證。
圖:模擬地圖,用于在舞臺模擬器內的各類環境中測試協調策略。機器人在其初始起始區域顯示為一排紅點,該區域代表一個突破口。導航關鍵點用紅色 "X "標記表示。
與決策相關的活動,如自下而上和自上而下的策略制定、分析和規劃,都將受益于基于計算機的模型的開發和應用,這些模型能夠在當地環境中表現人類的時空社會行為。在努力了解和尋找減緩氣候變化特定影響的方法時尤其如此,在這種情況下,此類模型需要包括相互影響的社會和生態要素。此類模型的開發和應用一直受到以下挑戰的嚴重阻礙:設計行為以經驗證據和理論為基礎的智能體,以及測試智能體代表現實世界決策者行為的能力。本論文通過以下方法克服了這些挑戰,從而提高了開發此類模型的能力: (a) 三個新框架,(b) 兩種新方法,以及 (c) 兩種新的開源建模工具。這三個新框架包括 (a) SOSIEL 框架,它為開發新一代認知、多智能體和基于知識的模型提供了一個有理論基礎的藍圖,這些模型由具有認知架構的智能體組成; (b) 一個分析決策者有界理性的新框架,它為分析決策情境與決策者決策之間的關系提供了洞察力和便利;以及 (c) 一個分析人工智能體雙重有界理性(DBR)的新框架,它對決策情境與人工智能體決策之間的關系做了同樣的分析。這兩種新方法包括 (a) 用于獲取和操作決策知識的 SOSIEL 方法,它提高了我們為認知模型、多智能體模型和基于知識的模型獲取、處理和表示決策知識的能力;以及 (b) 用于測試人工智能體表示人類決策能力的 DBR 方法。這兩個開源建模工具包括 (a) SOSIEL 平臺,這是一個基于認知、多智能體和知識的平臺,用于模擬人類決策;以及 (b) 將該平臺作為 SOSIEL 人類擴展(SHE)應用于現有的森林氣候變化模型,即 LANDIS-II,以便分析人類與森林氣候之間的共同進化互動。為了提供示例背景和知識獲取指南,論文包括烏克蘭喀爾巴阡山地區社會生態互動的案例研究,該地區目前正在應用 LANDIS-II 和 SHE。因此,本論文通過以下方式推動科學發展 (a) 為下一代基于認知、多智能體和知識的模型提供理論基礎并展示其實施;(b) 為理解、分析和測試人工智能體代表人類決策的能力提供植根于心理學的新視角。
在決策或推理網絡中進行適當的推理,需要指揮官(融合中心)對每個下屬的輸入賦予相對權重。最近的工作解決了在復雜網絡中估計智能體行為的問題,其中社會網絡是一個突出的例子。這些工作在各種指揮和控制領域具有相當大的實際意義。然而,這些工作可能受限于理想化假設:指揮官(融合中心)擁有所有下屬歷史全部信息,并且可以假設這些歷史信息之間具有條件統計獨立性。在擬議的項目中,我們打算探索更普遍的情況:依賴性傳感器、(可能的)依賴性的未知結構、缺失的數據和下屬身份被掩蓋/摻雜/完全缺失。對于這樣的動態融合推理問題,我們建議在一些方向上擴展成果:探索數據源之間的依賴性(物理接近或 "群體思維"),在推理任務和量化不一定匹配的情況下,采用有用的通信策略,甚至在每個測量源的身份未知的情況下,采用無標簽的方式--這是數據關聯問題的一種形式。
我們還認識到,對動態情況的推斷是關鍵目標所在。考慮到一個涉及測量和物理 "目標 "的傳統框架,這是一個熟悉的跟蹤問題。但是,來自目標跟蹤和多傳感器數據關聯的技術能否應用于提取非物理狀態(物理狀態如雷達觀察到的飛機)?一個例子可能是恐怖主義威脅或作戰計劃--這些都是通過情報報告和遙測等測量手段從多個來源觀察到的,甚至可能被認為包含了新聞或金融交易等民用來源。這些都不是標準數據,這里所關注的動態系統也不是通常的運動學系統。盡管如此,我們注意到與傳統的目標追蹤有很多共同點(因此也有機會應用成熟的和新興的工具):可能有多個 "目標",有雜波,有可以通過統計學建模的行為。對于這種動態系統的融合推理,我們的目標是提取不尋常的動態模式,這些模式正在演變,值得密切關注。我們特別建議通過將雜波建模為類似活動的豐富集合,并將現代多傳感器數據關聯技術應用于這項任務,來提取特征(身份)信息。
研究的重點是在具有融合觀測的動態系統中進行可靠推理。
1.決策人身份不明。在作戰情況下,融合中心(指揮官)很可能從下屬那里收到無序的傳感器報告:他們的身份可能是混合的,甚至完全沒有。這種情況在 "大數據 "應用中可能是一個問題,在這種情況下,數據血統可能會丟失或由于存儲的原因被丟棄。前一種情況對任務1提出了一個有趣的轉折:身份信息有很強的先驗性,但必須推斷出身份錯誤的位置;建議使用EM算法。然而,這可能會使所有的身份信息都丟。在這種情況下,提出了類型的方法來完成對局部(無標簽)信念水平和正在進行的最佳決策的聯合推斷。
2.動態系統融合推理的操作點。在以前的支持下,我們已經探索了動態事件的提取:我們已經開發了一個合理的隱馬爾科夫模型,學會了提取(身份)特征,有一個多伯努利過濾器啟發的提取方法 - 甚至提供了一些理論分析。作為擬議工作的一部分,將以兩種方式進行擴展。首先,打算將測量結果作為一個融合的數據流,這些數據來自必須被估計的未知可信度的來源。第二,每個這樣的信息源必須被假定為雜亂無章的 "環境 "事件(如一個家庭去度假的財務和旅行足跡),這些事件雖然是良性的,可能也不復雜,但卻是動態的,在某種意義上與所尋求的威脅類似。這些必須被建模(從數據中)和抑制(由多目標追蹤器)。
3.數據融合中的身份不確定性。當數據要從多個來源融合時,當這些數據指的是多個真相對象時,一個關鍵的問題是要確定一個傳感器的哪些數據與另一個傳感器的哪些數據相匹配:"數據關聯 "問題。實際上,這種融合的手段--甚至關聯過程的好方法--都是相當知名的。缺少的是對所做關聯的質量的理解。我們試圖提供這一點,并且我們打算探索傳感器偏差和定位的影響。
4.具有極端通信約束的傳感器網絡。考慮由位置未知、位置受漂移和擴散影響的傳感器網絡進行推理--一個泊松場。此外,假設在這樣的網絡中,傳感器雖然知道自己的身份和其他相關的數據,但為了保護帶寬,選擇不向融合中心傳輸這些數據。可以做什么?又會失去什么?我們研究這些問題,以及評估身份與觀察的作用(在信息論意義上)。也就是說,假設對兩個帶寬相等的網絡進行比較;一個有n個傳感器,只傳輸觀察;另一個有n/2個傳感器,同時傳輸數據和身份。哪一個更合適,什么時候更合適?
5.追蹤COVID-19的流行病狀況。誠然,流行病學并不在擬議研究的直接范圍內,但考慮到所代表的技能以及在目前的健康緊急情況下對這些技能的迫切需要,投機取巧似乎是合理的。通過美國和意大利研究人員組成的聯合小組,我們已經證明,我們可以從當局提供的每日--可能是不確定的--公開信息中可靠地估計和預測感染的演變,例如,每日感染者和康復者的數量。當應用于意大利倫巴第地區和美國的真實數據時,所提出的方法能夠估計感染和恢復參數,并能很準確地跟蹤和預測流行病學曲線。我們目前正在將我們的方法擴展到數據分割、變化檢測(如感染人數的增加/減少)和區域聚類。
許多國家都使用了像“三角洲” (Delta) 這樣的作戰管理系統(BMS),包括烏克蘭,使指揮部能夠共享態勢感知信息;本研究的重點是信息在作戰網絡中的分配。與自然系統類似,螞蟻和蜜蜂等自主代理遵循一套簡單的規則,BMS是一個由基地和電子作戰平臺組成的網絡,在國防條令的指導下,軍事資產作為網絡內的智能體。這種系統的可操作性的原理是基于多個子系統相互作用時每個子系統都是可靠的。然而,潛在相互作用的排列組合會引起不可預測的負反饋或正反饋循環,導致不可預測的和不想要的結果。突現行為的結果是出乎意料的,有時在情報和無線網絡等領域是不受歡迎的。理解突發行為對于理解復雜的工程系統是勢在必行的,并且要提出新的見解,采取切實可行的措施來改善復雜系統的設計和分析。本文介紹了BMS和網絡與用戶定義的系統集成的網絡士兵概念的例子。作者認為,烏克蘭和其他軍隊可以直接從利用元控制論、元元系統模型分析來控制突現。
圖2:作戰管理系統(BMS)的集中式指揮通信網絡
最近,深度強化學習(RL)方法已被成功應用于多智能體場景。通常情況下,分布式決策的觀測向量是由一個智能體收集的關于其他智能體(局部)信息的串聯來表示。然而,串聯法在具有大量同質智能體的集群系統中的擴展性很差,因為它沒有利用這些系統固有的基本特性:(i)集群中的智能體是可以互換的;(ii)集群中智能體的確切數量是不相關的。因此,我們提出了一種新的基于分布式均值嵌入的深度多智能體RL狀態表示,我們將智能體視為樣本,并使用經驗的均值嵌入作為分布式策略的輸入。我們使用直方圖、徑向基函數和端到端訓練的神經網絡來定義均值嵌入的不同特征空間。我們對集群文獻中的兩個著名問題--交會和追趕逃避--在全局和局部可觀察的設置中評估了該表示。對于本地設置,我們進一步引入了簡單的通信協議。在所有的方法中,使用神經網絡特征的平均嵌入表示能夠在相鄰的智能體之間進行最豐富的信息交流,促進復雜的集體策略的開發。
這項工作提出了一個支持決策過程的算法框架,其中終端用戶在領域專家的協助下解決一個問題。此外,終端用戶和領域專家之間的交流的特點是問題和答案的數量有限。開發的框架可以幫助領域專家向終端用戶精確定位少量的問題,以增加其見解正確的可能性。建議的框架是基于領域專家的知識,包括與領域專家和終端用戶的互動。領域專家的知識由知識圖譜表示,而終端用戶與問題相關的信息作為證據被輸入圖譜。這就觸發了圖中的推理算法,該算法向領域專家建議最終用戶的下一個問題。本文在醫學診斷領域提出了一個詳細的建議框架;然而,它也可以適應具有類似設置的其他領域。我們開發的軟件框架使決策過程以互動和可解釋的方式進行,這包括使用語義技術,因此是創新的。
近年來,"大數據 "世界獲得了巨大的發展動力,并不斷產生機遇和挑戰[1,2]。大數據的各種用途已經滲透到技術世界的幾乎每一個領域。我們對在處理決策過程的技術領域整合大數據的挑戰感興趣,以便利用這些過程。
這些過程可以在各種各樣的內容世界(醫學、商業、教育等)中找到,并且需要了解情況意識、數據建模以及提供智能見解的算法。然而,這些過程為不同的需求提供不同的答案;因此,有幾種類型的決策過程,每一種都有合適的設置[3,4]。
在這項工作中,我們專注于具有以下設置的決策過程:(a)該過程涉及兩個實體:一個最終用戶和一個領域專家,(b)最終用戶啟動該過程,(c)兩個實體之間存在互動,包括(領域專家的)問題和(最終用戶的)答案,(d)兩個實體之間的互動盡可能有限(在時間、問題數量、金錢等方面)。
鑒于上述情況,本報告的目的是提供一個基于語義技術的框架,該框架能夠整合大數據,在決策過程中協助領域專家,向他們建議一套針對最終用戶的問題(從數據中推斷出來的),這將減少問題和答案的循環。 考慮以下兩個領域的例子,其流程自然適合這樣的設置:醫療診斷[5]和家電維修[6](表1)。
如前所述,上述兩個領域包含了一個兩方面的有限互動。這種限制可以用時間、問題的數量等來表示。請注意,醫療和家電維修這兩個領域都是寬泛的領域,可以被專門化為特定的子領域。例如,家電維修領域可以被專業化為建筑服務、互聯網服務、家庭故障服務等。醫療領域也是如此。它也可以包含一些子域,如各領域的醫療咨詢(如心理學)、緊急醫療電話的處理等。
建議的框架包括兩個主要部分:(a) 使用語義技術對相關領域專家的知識進行正式表示,特別是知識圖譜,以及(b) 一套互動的算法,從一組初始領域值(即最終用戶的先驗知識)開始,然后,基于這些先驗知識和知識圖譜表示,它將向最終用戶提出具體問題。這些問題的答案將推動領域專家的決策過程,并成為下一次迭代的輸入。迭代將繼續進行,直到領域專家感到滿意并做出決定。
我們有動力通過知識圖譜來表示專家的知識,因為圖譜已經成為表示連接數據的一種自然方式[7]。在過去的十年中,人們努力將大量的數據組織成節點和邊的集合,特別是在推薦系統、搜索引擎優化和決策過程中[8,9,10]。由此產生的靈活結構,稱為知識圖譜,允許快速適應復雜的數據和通過關系的連接。它們固有的互連性使人們能夠使用圖算法來揭示隱藏的模式和推斷新的知識[11,12,13,14]。此外,知識圖譜在計算上是高效的,并且可以擴展到非常大的規模,社會圖譜分析就是一個例子[15,16]。
我們的框架受到了Musen和他的同事[17]的啟發,他們是生物醫學信息學領域的知名研究者,提出了關于協助臨床決策支持(CDS)的信息技術的看法。Musen等人[17]提出了提供CDS的系統的指導原則:他們的論述是關于交流而不是檢索信息,建議而不是產生報告,以及協助領域專家發展更多的知情判斷。分別來說,引導我們開發框架的概念是為領域專家提供從分析圖表示的相關數據中推斷出的建議,并使他能夠做出明智的決定。然而,另外一個領先的概念是以有限的迭代次數來進行。我們的框架可以擴展到其他領域。
在所提交的工作中,我們為一個交互式框架引入了一種新的方法,以支持以有限的交互次數為特征的決策過程。該框架通過使用圖數據模型、圖算法和語義技術,以通用的方式進行創新。我們在一個真實的數據集上運行我們的算法,并在一個可能的現實場景中展示框架的可行性。因此,我們為我們的框架提供了一個概念證明。
為了說明擬議的框架,我們首先回顧了知識圖譜和決策過程(第2節)。然后,我們定義了該框架的術語和算法(第3節)。隨后,我們在醫學診斷領域使用由疾病和病人癥狀組成的數據集來演示該框架(第4節)。最后,我們總結并考慮潛在的未來方向(第5節)。
這一節中介紹了所提出的框架,其中包括一個算法集合和它們之間的互動。
目標是基于互動的決策過程。互動是在領域專家和終端用戶之間進行的,結果是有限的迭代,由框架建議領域專家問終端用戶的問題組成。決策過程將根據終端用戶的回答而進行。
當分析這些類型的過程時,我們得出結論,它們可以被籠統地建模為一個癥狀和疾病的集合。最終,該過程的目標是協助領域專家決定診斷(即在分析現有數據的基礎上為一組給定的癥狀提供解釋)。Musen將診斷過程描述為決定要問哪些問題,要做哪些測試,或要執行哪些程序[7,17]。診斷過程中可能出現的問題有以下幾種類型。終端用戶是否有一個特定的癥狀?
上述術語(即癥狀、疾病、問題和診斷)產生的行話可以自然地用于醫學診斷領域,然而它也適用于其他領域,如家電維修:癥狀代表問題,疾病代表故障,診斷是一種故障識別,一個典型的問題可以是。終端用戶的電器有什么特別的問題嗎?
當在提議的框架中使用這個行話時,我們用假設一詞來代替診斷,因為該框架并不向領域專家提供診斷,而是提供可能的假設。每個假說實際上是一種潛在的疾病,它伴隨著一個問題,是表明疾病(假說)的癥狀。因此,我們在本文中用來描述框架及其各種算法的行話包括:癥狀、疾病、問題和假設。特別是,該框架推斷出假設及其相關的問題,并將它們提交給領域專家,后者決定是否使用(或不使用)這些問題來確認(或不確認)這些假設(疾病)。
在本節的其余部分,我們將描述該框架及其算法,首先是一般的,然后是詳細的。
一般來說,我們首先從原始數據建立一個知識圖譜,這將有助于探索疾病和癥狀之間的關系。在此之后,我們在KG上使用魯汶分層聚類法[21](算法1)來尋找社區(即具有類似癥狀的疾病群)。然后,給定最終用戶報告的癥狀(稱為證據癥狀),我們使用KG上的推理找到與證據癥狀相匹配的可能疾病(算法2)。在這一點上,我們推斷出最可能的社區,以包括最終用戶的疾病,并向領域專家建議一個表明這個社區的問題(癥狀)(算法3)。最后,我們找到最佳假設建議給領域專家(算法4),也就是說,我們向領域專家建議最終用戶可能有的疾病和癥狀,以解決診斷過程的改進。
整個框架分為兩個主要部分:第一部分,預處理部分,在框架啟動后進行;而第二部分,處理部分,在每次有新請求到達框架時進行。預處理部分包括兩個步驟和一個算法(算法1),而處理部分包括三個步驟和三個算法(算法2-4),正如我們在下面描述的那樣。
我們使用的數據結構包括代表KG的結構(默認是鄰接列表)和運行算法所需的額外結構。在下面描述算法的段落中,我們將詳細介紹這些結構和它們的用途。
預處理部分:
輸入:一個疾病及其癥狀的列表
第1步:構建一個疾病和癥狀的知識圖(KG)(見第3.1節)。
第2步:根據疾病的癥狀將其聚類為一組(稱為社區),即具有類似癥狀的疾病將在同一個社區中(算法1)。
輸出:(1)每一種疾病都與KG中的一個社區相關聯;(2)額外的數據結構,稱為癥狀社區矩陣(SCM),表示疾病組和各種癥狀之間的聯系 處理部分:
輸入:K證據癥狀
第一步:尋找最可能的疾病,即與證據癥狀相匹配的可能疾病(算法2)。
第2步:推斷并向領域專家建議(根據需要重復)一個問題(癥狀),表明最可能的社區包括最終用戶疾病(算法3)。
第3步:推斷并向領域專家建議一個假說(最終用戶可能患有的疾病)及其相關問題(癥狀)的列表,并按相關性排序(算法4)。
圖1顯示了整個建議框架的高級視圖。