要開發一個完全集成的網絡簇(network of networks)系統,促進復雜網絡拓撲結構中節點之間的無縫信息交換,需要考慮許多不同的方面。例如,單個鏈路的彈性、增強的波形能力、頻譜和空間多樣性都是提供通信的關鍵特征,可實現延伸到多個領域(地面、地面、空中和太空)的完全網絡化系統的連接性和互操作性。新興的毫米波(mmW)和高頻段天線技術可與未來的戰術多功能軟件定義無線電(SDR)集成,實現重要網絡參與者(包括第五代飛機)之間的信息分發。將討論小型、輕量級毫米波和高頻段天線設計,這些設計將使小分隊戰術行動在電子戰條件下得以持續。這些小型單位通常配備多種通信無線電,但功能有限,無法在移動中進行快速通信,也無法在停止時進行大容量數據傳輸。
此外,還介紹了一種革命性的認知天線(CA),其中提出了人工智能(AI)技術來幫助改善天線功能、支持自愈屬性并促進自主通信操作。將介紹一種為未來航天器(S/C)通信系統設計的具有環境感知能力的認知天線,它可以感知和傳輸射頻(RF)信號,并與認知無線電(CR)合作修改波形和波束模式特征,以增強彈性和通信能力。
從互操作性和信息交換的角度推斷,數據必須始終保持安全。本文介紹了通用通信有效載荷安全架構,以此為基礎,不僅為系統本身提供數據保護,還為作為大型企業解決方案一部分的網絡提供數據保護。同樣,還提出了機器學習方法,以便在基于企業安全空間的通信架構內打擊惡意網絡攻擊,從而提供更具彈性、保護性更強的自適應框架。此外,機器學習算法還力求為在高度動態環境中識別、分類和檢測可能的入侵提供可行的解決方案。
機器學習還應用于網絡策略,以在擁塞發生之前進行預測,從而防止網絡出現瓶頸。這對于關鍵的高價值信息尤為重要。本文提出了一種基于擁塞感知意圖的路由(CONAIR)架構,可促進終端用戶之間更快、更可靠的數據交換。CONAIR 架構利用平臺和任務信息來推導服務質量 (QoS) 指標,這些指標可用于支持網絡路由優化,具體做法是使用具有機器學習功能的網絡控制器 (NC) 來預測未來的網絡行為。
最后,將 CA、多功能 SDR 和 NC 子系統集成到無人飛行器 (UAV) 上的穩健架構中,形成可應對緊張工作條件的協作認知通信系統。通過協作行為和互動,可以優化通信。這些鑒別技術支持軍事通信系統不斷走向成熟的雄心壯志,從而有利于多跳復雜網絡中不同用戶之間的合作互動和信息交流。
本論文借鑒了啟發式和元啟發式算法開發、資源分配問題和調度等領域的知識,以解決空軍的關鍵問題。世界依靠許多時間表運行。人們依賴于這些時間表,并期望它們準確無誤。需要一個可以動態調整時間表的過程,以便高效地完成任務。例如,太空監視網絡依靠時間表來跟蹤太空中的物體。該計劃必須利用傳感器資源跟蹤盡可能多的高優先級衛星,以獲得軌道路徑,并對碰撞路徑發出警告。衛星與其他軌道物質之間發生的任何碰撞都可能是災難性的。為了解決這一關鍵問題領域,本論文引入了單目標進化任務器算法和多目標進化算法方法。這兩種方法的目的都是制定太空物體跟蹤時間表,以確保對優先級較高的物體進行適當的潛在問題評估。模擬結果表明,這些進化算法技術可以有效地制定時間表,確保對優先級較高的太空物體進行跟蹤。這些算法適用于一系列動態調度領域,包括太空物體跟蹤、災難搜救和異構傳感器調度。
采用神經網絡模型的預測系統已被部署到非安全關鍵領域和高度安全關鍵領域。當模型無法達到預期性能時,通常很難找出根本原因。在故障可能造成不可挽回的損失或生命或財產損失的領域,必須采取措施向使用這些系統的人員提供可靠性,在設計過程中已經通過深思熟慮的分析降低了風險。本論文展示了系統理論過程分析(STPA)作為一種可重復的方法,用于選擇和校準機器學習開發行為,從而在機器學習開發生命周期(MDLC)中提供保證。STPA 是一種系統分析方法,可識別安全關鍵型系統中由組件級交互引起的組件危險。在這項研究中,STPA 被用于評估機器學習開發的安全性,它符合負責任的人工智能(AI)原則,適用于一個利用分類模型根據音頻特征檢測海上船只的系統。分析結果提出了一些建議,這些建議可以主動指導人工智能設計過程,從而使生命周期每個階段的決策都能得到解釋。結果表明,通過應用這種方法,人工智能系統的可靠性更高,部署更安全。
圖 4.1:相關系統內的活動示意圖。在這個擬議版本中,矢量傳感器與信號處理能力和神經網絡模型一起部署。在執行聯合和主動學習程序時,每個傳感器部署的本地模型都會更新。
無人駕駛飛行器(UAV)的應用非常廣泛。在軍事領域,這些系統可以充當地面單元和近海單元之間的通信中繼,或加強監視和偵察;然而,普通無線網絡設備的低傳輸功率和障礙物限制了這些系統的覆蓋范圍。多無人機中繼網絡可解決這一問題,提供更遠的距離和更大的覆蓋范圍。本論文的主要貢獻在于設計并實現了一個可擴展的無人機網絡,該網絡利用廉價的 IEEE 802.11 路由器和樹莓派(Raspberry Pis)同時控制六架商用四旋翼無人機。此外,還編寫了用于聯網、通信和數據傳輸的附加程序。對由此產生的網絡進行了室內測試,并對其性能進行了分析。
軍事和災難響應應用中的機器人集體需要聯盟組建算法將機器人劃分為適當的任務小組。機器人集體的任務往往包含需要多種高級機器人行為或服務的任務,而聯盟組建必須滿足這些要求。此外,高度動態和非結構化的應用領域還要求聯盟組建算法能在接近實時的時間內(即 < 5 分鐘)為超大型集體(即數百個機器人)提供接近最優的解決方案(即 > 95% 的效用)。以前的聯盟組建算法都無法滿足這些要求。初步評估發現,傳統的基于拍賣的算法運行時間太長,即使集中式模擬器包含了現實世界部署中不太可能出現的理想條件(即機器人之間的同步和完美的即時通信)。基于享樂博弈的 GRAPE 算法可以近乎實時地生成解決方案,但無法應用于多個服務集體。本手稿整合了 GRAPE 和服務模型,產生了 GRAPE-S 和 PairGRAPE-S。這些算法和兩個拍賣基線分別通過使用多達 1000 個機器人的集中式模擬器和使用多達 500 個機器人的迄今為止最大的分布式聯盟形成模擬評估進行了評估。評估結果表明,拍賣無法很好地轉移到分布式集體中,導致運行時間過長和解決方案效用較低。GRAPE-S 滿足了目標領域的聯盟組建要求,能在接近實時的情況下生成接近最優的解決方案,而 Pair-GRAPE-S 則更能滿足領域要求,能在接近實時的情況下生成最優的解決方案。GRAPE-S 和 Pair-GRAPE-S 是首批支持超大型分布式多服務集體近實時聯盟組建的算法。
多智能體搜索與任務分配(MASTA)應用廣泛,包括搜索與救援、生態監測與采樣、軍事應用等。在設計這類系統時遇到的相當大的困難是缺乏分析建模工具,這就要求研究人員和工程師依賴計算機建模與仿真(M&S)。雖然 M&S 是一種非凡而重要的工具,但它往往不容易被人類洞察,可能需要大量的時間和精力,而且往往無法快速做出決策。本論文介紹了 MASTA 的分析模型,并將其與作為基線的 MASTA 計算機實施進行了比較。分析模型的預演誤差在百分之幾以內,并能更深入地了解系統行為和參數之間的相互作用。該模型可縮短 MASTA 系統的設計時間,并通過快速決策對此類系統進行更好的控制。
圖 1:a) [15] 分類法中的三個維度:第一,可由一個機器人解決的任務 (SR) 與需要多個機器人解決的任務 (MR);第二,只能同時解決一個任務的機器人 (ST) 與同時解決多個任務的機器人 (MT)。第三,不考慮未來分配的瞬時分配與可獲得足夠信息從而需要考慮未來分配的最優分配的時間擴展分配。 b) [46] 所描述的任務類型,以及 c) 多機器人任務分配。
多機器人任務分配(MRTA)涉及由多個機器人組成的系統,而這些機器人往往無法獨立完成任務。它可以被視為一個最優分配問題。[20]. 這個問題通常很復雜,而且通常是 NP 難問題[21]。 因此,人們開發了許多不同的方法。其中最受歡迎的分散式多智能體系統是基于市場的方法。在單項拍賣中,一個智能體將開始拍賣一項任務,其他智能體將根據自己的效用出價,拍賣者將選擇獲勝者。我們感興趣的是需要搜索任務并分配任務的系統,因此我們將搜索和任務分配結合起來。在實際系統中,通信半徑和探測任務的能力是有限的,而且成本可能過高,尤其是在水下。我們建議將簡單、廉價的智能體自適應地組合起來,以創建能夠進行較遠距離通信和任務檢測的移動相控陣。我們將這些智能體稱為組成體,因為它們共同組成了一個嚎叫智能體(復合體)。據我們所知,以前的文獻中還沒有探討過這種組成智能體的想法。合成智能體的最佳形成是一個復雜的問題,因為它會影響搜索、通信和任務分配性能。如果能開發出有效的方法來組建復合智能體并使之相互作用,就能讓一大批簡單的機器人承擔起昂貴得多的設備的任務。
研究人員對帶有檢索約束條件的搜索和檢索的動態任務分配進行了研究。檢索對象是通過搜索一組位置找到的,每個機器人都能做到這一點。對象與類型相關聯;在搜索和檢索之前,會創建一個列表,列出每種類型的任務何時可以相互交付。例如,對于紅色和藍色類型,給定一個列表 {紅、藍、紅、紅},找到的任何紅色或藍色物體都能滿足要求,但只能按照指定的順序進行。首先,開發了一種擴展的順序單項拍賣,并與隱式協調(共識控制)方法進行了比較。他們發現,共識控制能更快地完成所有任務,但智能體在拍賣方法下的移動速度較慢。
一個潛在的應用領域是水下任務,在這種任務中,通信和導航的成本過高;自主水下航行器(AUV)的價格高達十幾萬美元。研究人員[13]提出了一種方法,利用水聽器,一個昂貴的水下機器人可以引導一群較簡單的廉價機器人。智能體通過發射頻率的多普勒頻移來估計相對航向,通過振幅來估計距離。組成相控陣列的智能體或許可以充當領航員,與更靠近水面的飛行器進行通信,以進行導航。
動物界也有智能體聚集在一起,發出更強的信號。例如,螢火蟲(雷蟲、閃電蟲)在交配季節會用生物發光相互吸引。當螢火蟲聚集在一起時,它們的發光強度會增加,從而吸引更遠處的螢火蟲。因此,某些螢火蟲物種會同步發光,數百只螢火蟲一起以恒定的頻率照亮樹木,中間則是完全的黑暗[19]。
論文旨在對智能體搜索和任務分配在一系列參數(如智能體數量、探測半徑、任務數量等)下的性能進行數學建模。這些模型旨在加深對 MASTA 系統的理解,減少設計時間和計算需求。此外,數學模型還有助于設計和開發 MASTA 控制器。我們的目標是回答以下研究問題:
1.是否有可能對 MASTA 系統進行數學建模?
2.這些模型是否能加深對 MASTA 的理解?
3.這些模型是否減少了計算需求?
第 2 節介紹了背景材料,包括論文相關領域的簡短概述。第 3 節介紹了實施的計算機模型和軟件。第 4 節包含實驗和結果分析。第 5 節討論第 4 節的結果。最后,在第 6 節中得出結論,并提出今后工作的設想。
最近無人駕駛飛行器(UAV)能力的進步導致對蜂群系統的研究越來越多。然而,無人機群的戰術應用將需要安全通信。不幸的是,到目前為止的努力還沒有產生可行的安全通信框架。此外,這些系統的特點是有限的處理能力和受限的網絡環境,這使得許多現有的安全群體通信協議無法使用。最近在安全群組通信方面的研究表明,消息層安全(MLS)協議可能為這些類型的系統提供一個有吸引力的選擇。這篇論文記錄了MLS與先進機器人系統工程實驗室(ARSENL)無人機群系統的整合情況。ARSENL的實施是為了證明MLS在安全蜂群通信中的功效,是一個概念驗證。實施的測試結果是在模擬環境中進行的實驗和用物理無人機進行的實驗。這些結果表明,MLS適用于蜂群,但需要注意的是,測試中沒有實施交付機制以確保數據包的可靠交付。對于未來的工作,如果要維持一個可靠的MLS系統,需要緩解不可靠的通信路徑。
目前,無人駕駛飛行器(UAVs)的進步已經導致了對蜂群能力的研究。目前,多無人機群已被建議或用于一系列廣泛的應用,包括但不限于: 1:
無人機群的戰術利用將取決于安全通信。不幸的是,單個蜂群平臺的處理能力有限,而且蜂群系統通常依賴于帶寬有限且可能不可靠的通信框架。這些限制使這些系統滿足安全要求的能力受到質疑。
以前的設備群通信安全方法不太可能適用于現有或設想中的蜂群系統。然而,最近對安全群組通信的研究表明,消息層安全(MLS)協議[10]可以提供一個有吸引力的選擇,其特點似乎特別適合這些類型的系統。該協議提供了一種有效的計算方法來實現異步安全的群體密鑰管理,但需要在現實的系統中進行實驗,以評估該協議在這些計算和通信有限的環境中的功能。這項工作是在海軍研究生院(NPS)高級機器人系統工程實驗室(ARSENL)的無人機群中實施MLS協議,以保護特定的信息流。
NPS ARSENL開發并利用了一個無人駕駛飛行器(UAV)群系統,該系統已經成功地演示了多達50個UAV[11]。盡管這種能力為軍事行動提供了巨大的潛力,但ARSENL系統缺乏最終在現實世界中使用所需的通信安全功能。本論文在ARSENL蜂群系統上實現了MLS,以評估其對此類系統更廣泛的適用性。
MLS提供了一些與多無人機系統特別相關的能力。MLS提供了一個動態添加和刪除成員的機制,同時不斷地在群組成員之間提供安全的通信。由于無人機群成員可能是高度動態的,添加和刪除群成員是很重要的能力。隨著蜂群規模的增加,群體安全協議必須有效地擴展。同樣有利的是,MLS協議有利于強制移除已經被劫持的、被破壞的或發生故障的無人機。在這些情況下,該協議為小組提供了更新通信密鑰的手段,以排除被破壞或故障的無人機。本論文旨在解決以下問題:
1.MLS協議能否適用于ARSENL無人機群的使用?
2.MLS對ARSENL無人機群的性能有何影響?
3.ARSENL無人機能否加入群組并與群組的其他成員安全地進行通信?
4.小組密鑰是否能夠通過不可靠的ARSENL蜂群網絡定期更新?
5.在出現紕漏或其他標準的情況下,是否可以將無人機從ARSENL群中移除,不再解密信息?
在本論文中,研究了在NPS ARSENL無人機群中使用MLS作為一個連續的組密鑰協議。來自MLS GitHub倉庫[12]的社區維護的C++代碼被調整為納入ARSENL蜂群系統代碼庫。特別是,MLS組的密鑰更新、成員添加和成員刪除等操作被實現和測試。該研究包括分析MLS協議的使用對ARSENL蜂群性能的影響。指標包括各個無人機之間的數據包傳輸和接收率、可擴展性和時間。
本文的其余部分分為四章。第二章提供了理解MLS和無人機群的必要背景信息。這包括討論多無人機群和常見的群組通信架構,ARSENL群組系統,以及潛在的安全通信方法,包括成對和分組協議。本章最后討論了MLS和它是如何工作的。
第三章描述了代碼開發過程。它首先總結了ARSENL機載軟件的機器人操作系統(ROS)框架和用于實現MLS功能的C++應用編程接口(API)。然后,本章討論了代碼的實現,包括代碼概述和討論將MLS集成到ARSENL蜂群中的經驗教訓。
第四章討論了MLS實現的實驗,并分析了它對各個ARSENL蜂群平臺的影響,這些影響受蜂群大小和密鑰更新率的影響。本章包括對測試過程的描述和對結果的描述。
最后,第5章提供了一個結論,包括本研究的意義和對未來工作的建議。
最近,深度強化學習(RL)方法已被成功應用于多智能體場景。通常情況下,分布式決策的觀測向量是由一個智能體收集的關于其他智能體(局部)信息的串聯來表示。然而,串聯法在具有大量同質智能體的集群系統中的擴展性很差,因為它沒有利用這些系統固有的基本特性:(i)集群中的智能體是可以互換的;(ii)集群中智能體的確切數量是不相關的。因此,我們提出了一種新的基于分布式均值嵌入的深度多智能體RL狀態表示,我們將智能體視為樣本,并使用經驗的均值嵌入作為分布式策略的輸入。我們使用直方圖、徑向基函數和端到端訓練的神經網絡來定義均值嵌入的不同特征空間。我們對集群文獻中的兩個著名問題--交會和追趕逃避--在全局和局部可觀察的設置中評估了該表示。對于本地設置,我們進一步引入了簡單的通信協議。在所有的方法中,使用神經網絡特征的平均嵌入表示能夠在相鄰的智能體之間進行最豐富的信息交流,促進復雜的集體策略的開發。
這項工作提出了一個支持決策過程的算法框架,其中終端用戶在領域專家的協助下解決一個問題。此外,終端用戶和領域專家之間的交流的特點是問題和答案的數量有限。開發的框架可以幫助領域專家向終端用戶精確定位少量的問題,以增加其見解正確的可能性。建議的框架是基于領域專家的知識,包括與領域專家和終端用戶的互動。領域專家的知識由知識圖譜表示,而終端用戶與問題相關的信息作為證據被輸入圖譜。這就觸發了圖中的推理算法,該算法向領域專家建議最終用戶的下一個問題。本文在醫學診斷領域提出了一個詳細的建議框架;然而,它也可以適應具有類似設置的其他領域。我們開發的軟件框架使決策過程以互動和可解釋的方式進行,這包括使用語義技術,因此是創新的。
近年來,"大數據 "世界獲得了巨大的發展動力,并不斷產生機遇和挑戰[1,2]。大數據的各種用途已經滲透到技術世界的幾乎每一個領域。我們對在處理決策過程的技術領域整合大數據的挑戰感興趣,以便利用這些過程。
這些過程可以在各種各樣的內容世界(醫學、商業、教育等)中找到,并且需要了解情況意識、數據建模以及提供智能見解的算法。然而,這些過程為不同的需求提供不同的答案;因此,有幾種類型的決策過程,每一種都有合適的設置[3,4]。
在這項工作中,我們專注于具有以下設置的決策過程:(a)該過程涉及兩個實體:一個最終用戶和一個領域專家,(b)最終用戶啟動該過程,(c)兩個實體之間存在互動,包括(領域專家的)問題和(最終用戶的)答案,(d)兩個實體之間的互動盡可能有限(在時間、問題數量、金錢等方面)。
鑒于上述情況,本報告的目的是提供一個基于語義技術的框架,該框架能夠整合大數據,在決策過程中協助領域專家,向他們建議一套針對最終用戶的問題(從數據中推斷出來的),這將減少問題和答案的循環。 考慮以下兩個領域的例子,其流程自然適合這樣的設置:醫療診斷[5]和家電維修[6](表1)。
如前所述,上述兩個領域包含了一個兩方面的有限互動。這種限制可以用時間、問題的數量等來表示。請注意,醫療和家電維修這兩個領域都是寬泛的領域,可以被專門化為特定的子領域。例如,家電維修領域可以被專業化為建筑服務、互聯網服務、家庭故障服務等。醫療領域也是如此。它也可以包含一些子域,如各領域的醫療咨詢(如心理學)、緊急醫療電話的處理等。
建議的框架包括兩個主要部分:(a) 使用語義技術對相關領域專家的知識進行正式表示,特別是知識圖譜,以及(b) 一套互動的算法,從一組初始領域值(即最終用戶的先驗知識)開始,然后,基于這些先驗知識和知識圖譜表示,它將向最終用戶提出具體問題。這些問題的答案將推動領域專家的決策過程,并成為下一次迭代的輸入。迭代將繼續進行,直到領域專家感到滿意并做出決定。
我們有動力通過知識圖譜來表示專家的知識,因為圖譜已經成為表示連接數據的一種自然方式[7]。在過去的十年中,人們努力將大量的數據組織成節點和邊的集合,特別是在推薦系統、搜索引擎優化和決策過程中[8,9,10]。由此產生的靈活結構,稱為知識圖譜,允許快速適應復雜的數據和通過關系的連接。它們固有的互連性使人們能夠使用圖算法來揭示隱藏的模式和推斷新的知識[11,12,13,14]。此外,知識圖譜在計算上是高效的,并且可以擴展到非常大的規模,社會圖譜分析就是一個例子[15,16]。
我們的框架受到了Musen和他的同事[17]的啟發,他們是生物醫學信息學領域的知名研究者,提出了關于協助臨床決策支持(CDS)的信息技術的看法。Musen等人[17]提出了提供CDS的系統的指導原則:他們的論述是關于交流而不是檢索信息,建議而不是產生報告,以及協助領域專家發展更多的知情判斷。分別來說,引導我們開發框架的概念是為領域專家提供從分析圖表示的相關數據中推斷出的建議,并使他能夠做出明智的決定。然而,另外一個領先的概念是以有限的迭代次數來進行。我們的框架可以擴展到其他領域。
在所提交的工作中,我們為一個交互式框架引入了一種新的方法,以支持以有限的交互次數為特征的決策過程。該框架通過使用圖數據模型、圖算法和語義技術,以通用的方式進行創新。我們在一個真實的數據集上運行我們的算法,并在一個可能的現實場景中展示框架的可行性。因此,我們為我們的框架提供了一個概念證明。
為了說明擬議的框架,我們首先回顧了知識圖譜和決策過程(第2節)。然后,我們定義了該框架的術語和算法(第3節)。隨后,我們在醫學診斷領域使用由疾病和病人癥狀組成的數據集來演示該框架(第4節)。最后,我們總結并考慮潛在的未來方向(第5節)。
這一節中介紹了所提出的框架,其中包括一個算法集合和它們之間的互動。
目標是基于互動的決策過程。互動是在領域專家和終端用戶之間進行的,結果是有限的迭代,由框架建議領域專家問終端用戶的問題組成。決策過程將根據終端用戶的回答而進行。
當分析這些類型的過程時,我們得出結論,它們可以被籠統地建模為一個癥狀和疾病的集合。最終,該過程的目標是協助領域專家決定診斷(即在分析現有數據的基礎上為一組給定的癥狀提供解釋)。Musen將診斷過程描述為決定要問哪些問題,要做哪些測試,或要執行哪些程序[7,17]。診斷過程中可能出現的問題有以下幾種類型。終端用戶是否有一個特定的癥狀?
上述術語(即癥狀、疾病、問題和診斷)產生的行話可以自然地用于醫學診斷領域,然而它也適用于其他領域,如家電維修:癥狀代表問題,疾病代表故障,診斷是一種故障識別,一個典型的問題可以是。終端用戶的電器有什么特別的問題嗎?
當在提議的框架中使用這個行話時,我們用假設一詞來代替診斷,因為該框架并不向領域專家提供診斷,而是提供可能的假設。每個假說實際上是一種潛在的疾病,它伴隨著一個問題,是表明疾病(假說)的癥狀。因此,我們在本文中用來描述框架及其各種算法的行話包括:癥狀、疾病、問題和假設。特別是,該框架推斷出假設及其相關的問題,并將它們提交給領域專家,后者決定是否使用(或不使用)這些問題來確認(或不確認)這些假設(疾病)。
在本節的其余部分,我們將描述該框架及其算法,首先是一般的,然后是詳細的。
一般來說,我們首先從原始數據建立一個知識圖譜,這將有助于探索疾病和癥狀之間的關系。在此之后,我們在KG上使用魯汶分層聚類法[21](算法1)來尋找社區(即具有類似癥狀的疾病群)。然后,給定最終用戶報告的癥狀(稱為證據癥狀),我們使用KG上的推理找到與證據癥狀相匹配的可能疾病(算法2)。在這一點上,我們推斷出最可能的社區,以包括最終用戶的疾病,并向領域專家建議一個表明這個社區的問題(癥狀)(算法3)。最后,我們找到最佳假設建議給領域專家(算法4),也就是說,我們向領域專家建議最終用戶可能有的疾病和癥狀,以解決診斷過程的改進。
整個框架分為兩個主要部分:第一部分,預處理部分,在框架啟動后進行;而第二部分,處理部分,在每次有新請求到達框架時進行。預處理部分包括兩個步驟和一個算法(算法1),而處理部分包括三個步驟和三個算法(算法2-4),正如我們在下面描述的那樣。
我們使用的數據結構包括代表KG的結構(默認是鄰接列表)和運行算法所需的額外結構。在下面描述算法的段落中,我們將詳細介紹這些結構和它們的用途。
預處理部分:
輸入:一個疾病及其癥狀的列表
第1步:構建一個疾病和癥狀的知識圖(KG)(見第3.1節)。
第2步:根據疾病的癥狀將其聚類為一組(稱為社區),即具有類似癥狀的疾病將在同一個社區中(算法1)。
輸出:(1)每一種疾病都與KG中的一個社區相關聯;(2)額外的數據結構,稱為癥狀社區矩陣(SCM),表示疾病組和各種癥狀之間的聯系 處理部分:
輸入:K證據癥狀
第一步:尋找最可能的疾病,即與證據癥狀相匹配的可能疾病(算法2)。
第2步:推斷并向領域專家建議(根據需要重復)一個問題(癥狀),表明最可能的社區包括最終用戶疾病(算法3)。
第3步:推斷并向領域專家建議一個假說(最終用戶可能患有的疾病)及其相關問題(癥狀)的列表,并按相關性排序(算法4)。
圖1顯示了整個建議框架的高級視圖。
隨著web技術的發展,多模態或多視圖數據已經成為大數據的主要流,每個模態/視圖編碼數據對象的單個屬性。不同的模態往往是相輔相成的。這就引起了人們對融合多模態特征空間來綜合表征數據對象的研究。大多數現有的先進技術集中于如何融合來自多模態空間的能量或信息,以提供比單一模態的同行更優越的性能。最近,深度神經網絡展示了一種強大的架構,可以很好地捕捉高維多媒體數據的非線性分布,對多模態數據自然也是如此。大量的實證研究證明了深多模態方法的優勢,從本質上深化了多模態深特征空間的融合。在這篇文章中,我們提供了從淺到深空間的多模態數據分析領域的現有狀態的實質性概述。在整個調查過程中,我們進一步指出,該領域的關鍵要素是多模式空間的協作、對抗性競爭和融合。最后,我們就這一領域未來的一些方向分享我們的觀點。