亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

摘要

第四次工業革命,即工業4.0(I40)的目的是創建智能工廠,其中采用網絡物理系統(CPS)、物聯網(IoT)和人工智能(AI)。根據I40的愿景,實現智能工廠需要智能的人與機器和機器與機器的溝通。為了實現這種通信,需要對CPS及其數據進行描述,并解決由各種表現形式引起的互操作性沖突。為了建立互操作性,工業界已經創建了標準和標準化框架。標準描述了實體、系統和流程的主要屬性,以及它們之間的相互作用。標準化框架根據其目的和特點對工業標準進行分類、調整和整合。盡管是由官方國際組織發布的,不同的標準對類似的實體可能包含不同的定義。此外,當利用同一標準來設計CPS時,不同的觀點會產生互操作性沖突。盡管標準化框架具有表達性,但在某種程度上可能代表了同一標準的不同分類,需要解決互操作性沖突,以支持智能工廠的有效和高效通信。

為了實現互操作性,需要對數據進行語義整合,調解現有的沖突。這個問題已經在文獻中得到了廣泛的研究。獲得的結果可以應用于一般的集成問題。然而,目前的方法未能考慮I40場景中實體之間發生的特定互操作性沖突。在這篇論文中,我們解決了I40場景中的語義數據整合問題。我們提出了一種基于知識圖譜的方法,允許在考慮其語義的同時整合I40中的實體。為了實現這種整合,在不同的概念層面上有一些挑戰需要解決。首先,定義標準和標準化框架之間的映射;其次,代表標準所描述的I40場景中的實體知識;第三,在解決語義異質性問題的同時,整合CPS設計的觀點;最后,確定所提出方法的實際行業應用。

我們首先設計了一種知識驅動的方法,允許將標準和標準化框架整合到工業4.0知識圖譜(I40KG)中。標準本體用于表示標準和標準化框架的主要屬性,以及它們之間的關系。I40KG允許整合標準和標準化框架,同時解決該領域中特定的語義異質性沖突。此外,我們在知識圖譜中對標準進行語義描述。為此,我們考慮了對I40場景具有核心重要性的標準,即I40的參考架構模型(RAMI4.0)、AutomationML和供應鏈操作參考模型(SCOR)。此外,描述CPS的實體的不同角度被整合到知識圖譜中。為了評估所提出的方法,我們依靠經驗性的評估以及具體用例的開發。獲得的結果證明,知識圖譜方法能夠在I40場景中對實體進行有效的數據整合,同時解決語義上的互操作性沖突,從而增強了智能工廠中的通信。

1 引言

目前許多領域因數字化進程而產生的數據越來越多地影響著社會的許多方面。全球化、無處不在的通信網絡和互聯網、新的人機協作場景,例如社會和職業網絡,以及復雜的信息系統的存在,是一些消耗和產生大量數據的活動。這些活動實際上正在影響著社會和工業的所有領域。在這些數字化過程中產生的數據對于改善人類發展的許多領域可能具有極其重要的意義。特別是,公司越來越多地將數據視為對提高其流程的效率和效能具有關鍵意義的資產。

在工程和制造領域,目前有一種向數字化生產的新時代出發的氛圍。第四次工業革命在德國被稱為"工業4.0",而相關術語,如美國的 "工業互聯網"、中國的 "智能制造"、法國的 "未來工業",在不同的國家被用來表示同一概念。工業4.0(I40)一詞似乎已被國際社會認可,指的是第四次工業革命。I40的主要目標是通過結合物聯網(IoT)、服務互聯網(IoS)和網絡物理系統(CPS)的優勢創建智能工廠。在智能工廠中,人類、機器、材料以及CPS需要以智能方式合作,以提高產量。

為了實現創建智能工廠的目標,必須確保數據整合的三個方面:1)垂直整合,在工廠/生產車間內;2)水平整合,通過整個價值創造網絡;3)端到端整合,貫穿整個產品生命周期[1,2]。首先,垂直整合包括將不同層次的制造水平的系統整合成一個全面的解決方案。這種集成是在車間層面上進行的,在車間層面上,傳感器、執行器、CPS等設備位于企業規劃層面上的企業資源系統(ERP)。第二,橫向整合,涉及合作伙伴、供應商、客戶以及其他生態系統成員之間的合作,從物流到創新、流動以及利益相關者。智能工廠通過在其運營中使用世界范圍內的生產鏈和數據網絡達到全球。因此,有必要在所有這些參與者之間進行數據整合,也就是橫向整合。橫向整合需要確保工廠能夠作為一個智能工廠在全球市場上進行互動。最后,產品生命周期的發展包括許多工程活動,以創建一個CPS,如構思、設計、生產、利用和終止。在復雜系統(如CPS)的工程中,通常屬于不同工程學科的利益相關者必須進行有效的合作。CPS工程過程的目的是提供高質量的最終產品,例如,完整的生產工廠設計,并滿足嚴格的時間框架。各種工程學科的存在導致了高度復雜和軟件密集型的環境,其特點是:a)眾多的工程工具在設計上不能相互合作;b)各種工程領域的特定表示和數據交換格式的應用;以及c)各相關學科采用的工作流程的差異。不同的系統、組織和利益相關者參與到CPS的工程和運營中,既要跨越工程領域的界限,即橫向整合,又要在系統的不同抽象層次(業務、工程、運營)之間,即縱向整合[3]。此外,這些環境中的一個核心挑戰是確保互操作性,允許在整個產品生命周期中進行數據整合。為了實現這種互操作性,實現CPS的一個關鍵問題依賴于解決這些系統、組織和利益相關者之間的數據整合挑戰。這意味著要開發一個CPS,受影響的學科必須確保生成的數據的整合。

實現這樣的整合是一項復雜的任務,特別是當考慮到世界各地的工廠,它們通常根據不同的商業和法律規則以及不同的標準運作。互操作性是一個主要挑戰,也是I40的設計原則之一[4]。為了實現I40場景中的互操作性,像執行器、傳感器、傳送帶和CPS等實體的含義需要以語義描述的方式,讓機器和人類都能夠理解和分享它們的含義。當試圖在所描述的集成中進行合作時,相關實體之間會出現語義互操作性沖突。語義互操作性沖突表示不同或等同概念的建模以及這些概念的表達方式的差異[5]。為了實現I40的愿景,需要解決不同實體間的這些互操作性沖突。

為了解決智能工廠的互操作性問題,世界各地的工業界都提出了標準和標準化框架。這方面的相關例子有工業4.0參考架構(RAMI4.0)[6] 或工業互聯網參考架構(IIRA)[7]。這些環境的基本價值在于使基于這些標準化框架建立的CPS之間具有互操作性。盡管在對現有標準進行分類和調整方面很有表現力,但標準化框架可能對同一標準提出不同的解釋或分類。例如,OPC UA被RAMI4.0分類為通信標準,而IIRA將OPC UA定位在其架構的框架層[8]。標準分類之間的不匹配產生沖突,對智能工廠的互操作性產生負面影響。因此,盡管為創建標準以及標準化框架做出了所有這些努力,語義互操作性沖突仍然是I40場景中未解決的問題。

由于對實體或過程的不同和/或類似的表述,類似的I40相關標準之間的互操作性受到阻礙。例如,在旨在合作的標準中,不同的名稱被用來表達相同的含義,例如,AutomationML(AML)中的InternalElement描述的含義與OPC UA中的Object相同[9]。如果這些標準被聯合用來為同一個CPS建模,那么他們的信息模型的整合是必須的。為此,所涉及的實體的含義需要被精確定義,并解決互操作性沖突[10]。總之,為了實現I40場景下所需的互操作性,數據需要在語義上進行整合,與所面臨的整合類型無關,即垂直、水平或端到端的工程整合。

圖1.1: I40場景中的語義互操作性沖突。已經定義了四個層次來描述I40場景中的語義互操作性沖突。從標準化框架到由網絡物理系統代表的物理世界。語義互操作性沖突發生在所有層面,對I40場景中的數據集成產生了負面影響。

1.1 問題的定義和挑戰

在概念層面上,面臨著一個語義數據整合問題。指導本論文工作的研究問題可以表達如下:我們研究如何通過描述I40場景中實體的含義來增強這些場景的互操作性。

由于I40場景中的語義數據整合問題包括許多需要解決的問題和障礙,我們認為以下挑戰和問題不屬于本論文的范圍:在I40場景中語義整合數據時的大數據挑戰;I40場景的安全問題;以及I40數據的實時語義數據整合。盡管如此,我們承認本論文中提出的結果為擴展這項工作以涵蓋這些方面奠定了基礎。

為了更好地理解I40場景中的語義數據整合問題,以及需要解決的不同語義互操作性沖突,我們確定了四個層次(參見圖1.1)。頂層對應的是標準化框架。在這個層次中,調查了標準化框架,如RAMI4.0、IIRA、IICF,以及美國國家標準與技術研究院(NIST)的標準化景觀。我們調查了標準化框架用于對標準進行分類的不同分類層次,如維度和層次。此外,我們研究了標準是如何被納入這些層次的,目的是了解需要解決的現有語義互操作性沖突,例如,相同的標準被不同的標準化框架進行不同的分類。第二個層次--工業4.0標準,考慮到了標準之間的關系。這一層次也包括語義上的互操作性沖突。例如,對應于兩個應該互動的標準的信息模型的不同名稱被用來表達一個實體的相同含義,例如,AML中的InternalElement與OPC UA中的Object具有相同的含義。第三層,文檔,指的是基于描述I40實體的特征和關系的標準而生成的文檔,例如,CPS。這些文件是由不同的學科建立的,代表了同一CPS的不同觀點。通常情況下,語義異質性沖突被引入,即對同一領域的不同解釋被建模。這是由參與該過程的不同觀點造成的。第四層,網絡物理系統,描述了物理世界,其中有CPS的存在。在下文中,將介紹本論文所解決的主要挑戰。前三個挑戰是指研究,而第四個挑戰的重點是將研究應用于具體場景。

挑戰1: 定義標準和標準化框架之間的映射關系。標準化框架根據其功能對標準進行分類。然而,標準化框架代表了I40場景中關于標準的區域觀點。一些標準,如OPC UA,可能被RAMI4.0、IIRA和NIST的標準化景觀分類在不同的層次。因此,存在關于標準和標準化框架的不同觀點。需要確定不同標準化框架的標準表述之間的語義沖突。此外,一些標準被不同的標準化組織以不同的方式命名,例如,OPC UA在其國際版本中被命名為IEC 62541。標準化框架中的這些不同的標準表述對I40場景中的互操作性產生了負面影響。因此,需要確定標準化框架和標準之間的映射,以及標準之間的映射。

挑戰2:在工業4.0場景中表示關于實體的知識。標準由信息模型組成,以表示它們所涵蓋的領域的知識。在某些情況下,這些信息模型包含模糊的、冗余的和重疊的信息。此外,這些信息是以半結構化或非結構化格式(如XML或純文本)以及結構化格式(如數據庫模型)進行編碼。以計算機可讀的形式表示這些知識,允許識別和解決I40實體之間的語義互操作性沖突,對于本論文的工作至關重要。

挑戰3:整合工業4.0場景中的實體的沖突觀點。CPS是復雜的系統,通常需要多個學科的投入,如機械、電氣或軟件工程。在設計CPS時,這些學科中的每一個都會產生不同的觀點。不同的觀點需要被整合到最終的CPS設計中。此外,在每個觀點中單獨建模的實體,以及解決可能引起的相應的語義異質性沖突,應根據它們與其他觀點的一致性程度,成為最終CPS設計的一部分。

挑戰4:確定工業4.0中實體的語義數據整合的現實世界應用。互操作性和語義數據整合是公認的設計原則和I40愿景發展的要求。然而,由于以下原因,確定基于語義的方法的附加值的現實世界的應用是困難的。1)對I40背景下產生的數據的語義異質性沖突缺乏了解;2)使用的標準沒有足夠的表達能力來解決I40背景下的數據語義整合問題,例如XML;以及3)缺乏成功案例來證明基于語義的數據整合方法的好處。

1.2 研究問題

經過前面幾節的討論,我們確定了以下研究問題。

問題1:知識圖譜方法如何定義標準和標準化框架的映射并解決它們之間現有的語義互操作性沖突?

為了回答這個研究問題,知識圖譜方法被用來表示和整合各種標準化框架和標準中編碼的知識。通過這種方法,標準化框架和標準之間的語義互操作性沖突得到了調解。

問題2:知識圖譜如何表示工業4.0實體中編碼的語義?

為了回答這個問題,我們開發了涵蓋I40領域不同領域的本體論。與傳統的知識管理方法相比,這種方法所提供的好處被證明。

問題3:如何利用現有的基于規則的方法來解決知識圖譜的語義互操作性沖突?

為了回答這個研究問題,我們研究了用于創建和利用知識圖譜的邏輯編程方法和概率技術。邏輯編程方法和概率技術被用于捕捉不同CPS視角下的知識編碼。這些知識被編碼在知識圖譜中并被利用,目的是識別CPS視角之間的語義互操作性沖突。然后,語義互操作性沖突通過依靠知識圖譜來解決。最后,代表CPS觀點的綜合知識的最終設計被創建。

問題4:基于知識圖譜的實體集成如何應用于工業4.0的真實場景?

為了解決這個問題,研究了I40場景中語義數據集成的不同應用領域。已經開發了真實的用例,并報告了一家制造公司使用這種應用的實際經驗。

圖1.2:論文的貢獻。本論文的四個貢獻提出了基于知識圖譜調和工業4.0場景下的互操作性沖突的解決方案。1)將標準和標準化框架整合到知識圖譜中;2)使用本體對標準進行語義描述;3)將CPS整合到知識圖譜中;4)基于知識圖譜的方法在I40場景中對數據進行語義整合的實際應用建議。標準和標準化框架的語義被編碼在知識圖譜中,以解決工業4.0場景下的語義互操作性沖突。

1.3 論文概述

為了指導讀者閱讀本文,我們對本論文的主要貢獻和研究領域進行了概述。此外,還包括支持這項工作的科學出版物的參考文獻。

1.3.1 貢獻

本論文的貢獻是跨學科的,涉及語義建模、知識圖譜的創建和完善,以及I40場景下的語義數據整合。圖1.2描述了在解決I40場景中語義互操作性沖突的同時,根據確定的層次,提出了整合數據的解決方案。接下來,將概述本論文的貢獻。

事實證明,知識圖譜(KGs)已經成功地應對了不同領域的數據整合過程中的語義互操作性沖突,如醫學[11]、農業[12]和人類交通[13]。對于工廠來說,KGs被認為是下一代企業信息系統的核心[14]。數據的意義與圖一起存儲,以本體的形式捕捉領域的語義。KGs也能在現有的基礎上得出結論和新的知識。這使得KGs成為尋找和理解數據的單一場所。為了實現語義互操作性,由標準和標準化框架描述的數據需要在語義上進行整合。這些數據的意義需要被保留下來,并且在整合過程中需要解決語義異質性沖突。

  • 貢獻1:將標準和標準化框架整合到知識圖譜中。我們提出了一種基于知識圖譜的方法,對遵守I40標準和標準化框架的文件進行語義整合。開發了STO本體,它描述了標準和標準化框架的概念。此外,還提出了一種建立和利用工業4.0標準和標準化框架知識圖的方法。基于這種方法和STO中的語義,我們建立了工業4.0標準知識圖(I40KG)。I40KG包含了對200多個標準、25個以上的標準化組織和100個標準之間關系的描述。最后,I40KG與現有的知識圖譜(如DBpedia)相連接,并實現了自動推理,以揭示標準之間的隱性關系以及跨標準化框架的映射關系。這一貢獻旨在回答RQ1。

  • 貢獻2:使用本體對標準進行語義描述。對于第二層次,即工業4.0標準,建議使用本體對標準進行語義描述。概述了一種新的方法,以語義表示和利用與I40相關的標準和標準化框架的知識。對I40愿景極為重要的標準被建模為本體。首先,RAMI4.0涵蓋了I40解決方案的參考架構和提供資產代表的Administration Shell概念。第二,AML本體,涵蓋AutomationML標準。該標準對于從不同學科角度設計CPS的工業解決方案至關重要,如機械、電氣和軟件工程。最后,SCORVoc代表APICS行業協會的供應鏈運營參考模型。我們展示了工業4.0實體的語義表示的好處。我們開發了I40場景中語義表示的常見用例,例如,測量單位。介紹了這些場景中實體間語義異質性沖突的編纂。此外,通過考慮和應用本體的語義,開發了沖突的解決方案。這一貢獻涵蓋了研究問題RQ2。

  • 貢獻3:將CPS整合到知識圖譜中。我們提出了一種將CPS的觀點融入知識圖譜的方法。知識圖譜是為代表CPS設計的不同角度的信息而創建的,即機械、電氣和軟件觀點。這些觀點之間發生的語義互操作性沖突被描述出來。為此,我們按照兩種邏輯方法對識別和解決CPS視角的I40實體之間的沖突問題進行了形式化:演繹數據庫和概率軟邏輯。這些形式化的規范分別在Alligator和SemCPS中實現。首先,我們介紹了Alligator,一種用于識別和解決CPS文件之間語義互操作性沖突的演繹方法。Alligator依靠Datalog來準確地表示描述CPS文檔中不同類型的語義異質性沖突的知識。Alligator使用一個知識圖譜來編碼CPS觀點的知識。其次,我們開發了SemCPS,一個依靠概率軟邏輯(PSL)的規則庫框架,用于捕捉不同CPS視角中編碼的知識,并在解決現有語義異質性沖突的同時利用這些知識進行CPS視角整合。關于文件層面,以及網絡物理系統層面,我們的目標是創建一個能夠描述和整合由不同標準定義的CPS文件的CPS KG。通過這一提議,研究問題RQ3得到了解決。

  • 貢獻4:為了展示知識圖譜方法的適用性,我們進行了一個基于制造公司的案例研究。開發了對工廠生產效率具有核心意義的兩個用例,即工具可用性和能源消耗。我們調查了與這些用例相關的制造公司的數據源。分析了數據源之間現有的語義互操作性沖突。為了執行這些用例,我們開發了一種知識圖譜的方法來解決公司數據源之間存在的語義互操作性沖突。我們開發了一套本體論來描述數據源的語義,即物料清單、制造執行系統和傳感器數據。此外,還定義了一套映射,將數據源與本體進行映射。定義了一個實現知識圖譜方法的架構。該架構使數據的整合考慮到了數據源、本體、映射和應用。通過使用提議的方法,數據源之間的語義互操作性沖突得到了解決。本報告中獲得的結果回答了RQ4。

1.3.2 出版物

本論文中的部分工作已經作為會議、研討會和期刊文章或書籍章節發表。在每一章的開頭,都提到了該章所依據的出版物。在下文中,將概述作為本論文基礎的主要出版物。

1.Irlán Grangel-González, Lavdim Halilaj, G?khan Coskun, S?ren Auer. Towards Vocabulary Development by Convention. In Proceedings of the International Conference on Knowledge Engineering and Ontology Development (KEOD), 2015, 334-343, SciTePress; 本文是與波恩大學的博士生Lavdim Halilaj的合作作品。在這篇文章中,我參與了問題的定義、詞匯開發方法的開發、評估以及結果的分析。

2.Irlán Grangel-González, Lavdim Halilaj, G?khan Coskun, S?ren Auer, Diego Collarana, Michael Hoffmeister. 邁向工業4.0組件的語義管理殼。在2016年第十屆IEEE國際語義計算會議(ICSC)論文集,230-237,IEEE。Fraunhofer IAIS月度論文,2016年6月。這篇文章是與波恩大學博士生Lavdim Halilaj的合作作品。在這篇文章中,我參與了問題的定義、方法的開發、對最先進方法的回顧、用例的介紹以及對結果的分析。

3.Lavdim Halilaj, Irlán Grangel-González, G?khan Coskun, S?ren Auer. Git4Voc: 基于Git的版本管理,用于協作式詞匯開發。In Proceedings of the Tenth IEEE International Conference on Semantic Computing 2016, 285-292, IEEE; 本文是與波恩大學的博士生Lavdim Halilaj的聯合工作。在這篇文章中,我參與了問題的定義、方法的開發、對最先進技術的批判性審查以及對結果的分析。

4.Irlán Grangel-González, Lavdim Halilaj, G?khan Coskun, S?ren Auer, Diego Collarana. 基于RDF的方法,用Administration Shells實現工業4.0組件。在2016年第21屆IEEE新興技術和工廠自動化國際會議(EFTA)論文集,1-8,IEEE。本文是與波恩大學博士生Lavdim Halilaj的合作作品。在這篇文章中,我參與了問題的定義、方法的開發、對最先進方法的回顧、用例的介紹以及對結果的分析。

5.Niklas Petersen, Irlán Grangel-González, S?ren Auer, G?khan Coskun, Marvin Frommhold, Sebastian Tramp, Maxime Lefranc, Antoine Zimmermann. SCORVoc: 基于詞匯的供應網絡信息集成和交流。2016年第十屆IEEE語義計算國際會議論文集》,132-139頁,IEEE;本文是與波恩大學的博士生Niklas Petersen的合作作品。我對本文的貢獻是致力于問題的定義、本體的建模,以及對相關工作的分析和回顧。

6.Irlán Grangel-González, Diego Collarana Vargas, Lavdim Halilaj, Steffen Lohmann, Christoph Lange, Maria-Esther Vidal, S?ren Auer. Alligator: 用于整合工業4.0標準的演繹方法。In Proceedings of the 20th International Conference of Knowledge Engineering and Knowledge Management (EKAW) 2016, 272-287; 本文是與波恩大學的博士生Diego Collarana Vargas和Lavdim Halilaj的聯合工作。在這篇文章中,我參與了問題和激勵性例子的定義、方法的開發、對最先進方法的修訂、軟件的開發,以及實驗和結果的執行和分析。

7.Irlán Grangel-González, Paul Baptista, Lavdim Halilaj, Steffen Lohmann, MariaEsther Vidal, Christian Mader, S?ren Auer. 從語義整合的角度看工業4.0的標準環境。在2017年第21屆IEEE新興技術和工廠自動化國際會議論文集中,1-8;在這篇文章中,我的貢獻是對問題和激勵性例子的定義、方法的開發、本體和知識圖譜的開發、對最先進方法的修訂,以及實驗和結果的執行和分析。

8.Irlán Grangel-González, Lavdim Halilaj, Omar Rana, Maria-Esther Vidal, Steffen Lohmann, S?ren Auer, Andreas W. Müller. 用于網絡物理系統語義整合的知識圖譜。在2018年第29屆數據庫和專家系統應用國際會議(DEXA)論文集,184-199。在這篇文章中,我參與了問題的定義和激勵性的例子,方法的開發,軟件的實現,相關工作的回顧,以及實驗和結果的執行和分析。

9.Niklas Petersen, Lavdim Halilaj, Irlán Grangel-González, Steffen Lohmann, Christoph Lange, S?ren Auer. 為一家制造公司實現基于RDF的信息模型--一個案例研究。(最佳使用中論文獎的兩個提名者之一)《2017年第16屆國際語義網會議(ISWC)論文集》,350-366,Springer。這是與Niklas Petersen和Lavdim Halilaj兩位波恩大學的博士生共同完成的工作。在這篇文章中,我參與了信息模型的開發、映射的定義、架構的開發、用例的描述,以及對如何用信息模型解決語義異質性沖突的分析。

在博士期間完成的完整的出版物清單見附錄A.1。

1.4 論文結構

本論文的結構分為七章,概述如下。

  • 第1章 - 緒論為論文作序,包括主要的研究問題和挑戰,開展工作的動機,研究問題,解決研究問題的科學貢獻,以及正式描述這些貢獻的已發表的科學文章列表。

  • 第2章--背景和前提介紹了理解本論文工作所需的關鍵概念。最初,解釋了I40場景和核心相關概念。接下來,描述了語義技術的基礎。研究了數據整合的一般原則,重點是語義數據整合;介紹了語義異質性沖突以及它們在I40場景中的存在。最后,研究了用于整合數據同時解決語義異質性沖突的技術描述。

  • 第3章--相關工作研究了當前最先進的方法,以使讀者更好地理解本論文中所進行的工作。對語義數據整合的一般方法進行了調查。此外,還描述了與I40領域的標準語義表示有關的具體工作。接下來,概述了關于將標準整合到知識圖譜中的工作。最后,描述了I40領域中實體語義整合的現有方法。

  • 第4章--將工業4.0標準整合到知識圖譜中,描述了解決標準化框架之間以及標準之間互操作性沖突的知識圖譜方法;還概述了建立和完善知識圖譜的方法。

  • 第5章--使用本體對工業4.0標準進行語義描述,介紹了一種建立本體的方法,這些本體是在I40場景中常用的標準,即RAMI4.0、AML和SCOR。這種方法被用來利用這些標準中編碼的實體的語義,并幫助解決語義異質性問題。

  • 第6章--將網絡物理系統整合到知識圖譜中,概述了將CPS整合到知識圖譜中的情況。對本章所處理的問題提出了兩種解決方案:i)結合Datalog和本體的力量的演繹方法;以及ii)考慮到CPS設計中存在的不確定性并使用概率軟邏輯方法來獲得CPS的最可能的設計的方法。

  • 第7章 - 語義數據集成在工業4.0場景中的應用,展示了知識圖譜方法在實際制造公司中語義集成數據的適用性。

  • 第8章--結論和未來方向最后總結了本論文的結果和對I40場景中語義互操作性問題的貢獻。討論了所提出的方法的現有限制,并對未來研究的可能方向進行了展望。

付費5元查看完整內容

相關內容

知識圖譜(Knowledge Graph),在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。 知識圖譜是通過將應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,并利用可視化的圖譜形象地展示學科的核心結構、發展歷史、前沿領域以及整體知識架構達到多學科融合目的的現代理論。它能為學科研究提供切實的、有價值的參考。

知識薈萃

精品入門和進階教程、論文和代碼整理等

更多

查看相關VIP內容、論文、資訊等

摘要

網絡虛擬化為在密集和異質環境中部署通信服務提供了高度的靈活性。通常存在兩種主要的方法(維度):用于功能虛擬化的網絡功能虛擬化(NFV)技術和用于資源虛擬化的虛擬網絡嵌入(VNE)算法。它們被結合起來應用。這些方法可以應用于不同的網絡層面,如工業網絡的工廠和企業。在應用網絡虛擬化時,應考慮一些可能相互沖突的目標和約束,主要是在復雜的拓撲結構中。本論文提出了一個網絡虛擬化模型,該模型考慮了兩個虛擬化維度、兩個網絡層次以及不同的目標和約束。所考慮的網絡層次是工業網絡中的兩個主要層次。然而,這種考慮并沒有把模型限制在一個特定的環境或某些層次。所考慮的目標/約束是拓撲結構、可靠性、安全性、性能和資源使用。

基于這個模型,我們首先建立了一個自律性和復合虛擬網絡的整體組合解決方案。這個解決方案考慮了兩個虛擬化維度、兩個網絡級別和目標目標。此外,這個解決方案結合了三個新穎的虛擬化子方法,考慮了性能、可靠性和表現。然而,這些子方法適用于不同級別和維度的組合,而可靠性方法則額外考慮了資源使用目標。在介紹了所有的解決方案后,我們將它們映射到定義的模型中。

關于對工業網絡的適用性,綜合方法被應用于企業級的工業物聯網(IIoT)用例,其靈感來自工業4.0中的智能工廠概念。然而,子方法被應用于更具體的用例。性能和可靠性解決方案與作為工業網絡現代技術的時間敏感網絡(TSN)標準的相關組件集成。目標是用網絡虛擬化的靈活性來豐富TSN的可靠性和性能能力。

在組合方法中,我們組成并嵌入了一個環境感知的擴展虛擬網絡(EVN),代表了物理設備、虛擬應用功能和所需的服務功能鏈(SFC)。我們使用圖形轉換方法將抽象的應用需求(由應用請求(AR)表示)轉換成EVN。EVN的組成和嵌入方法都考慮了底層網絡(SN)拓撲結構和不同的安全性、可靠性、性能和資源使用策略。這些政策的應用具有一定的優先級,并取決于通信實體的屬性,如位置和類型。EVN使用基于屬性的節點映射、可靠性感知分支和貪婪的鏈式嵌入啟發法進行嵌入。鏈式嵌入啟發式是使用代表用例的隨機拓撲結構進行評估的。

性能子方法是基于NFV的,并應用于具有時間關鍵型流量(TCT)的特定用例。我們開發并評估了一個完整的框架,用于使用高性能NFV虛擬化時間感知整形器(TAS)。可靠性子方法是基于VNE的,并應用于一個特定的工廠級用例。我們開發了基于可靠性感知的K-最短路徑算法的最小和最大分支啟發式算法,并使用一個典型的工廠拓撲結構對其進行了比較。然后,我們將這些算法與可靠性框架復制和消除(FRER)模擬器整合,通過支持技術的自主和有效配置實現可靠性策略。

安全子方法與兩個虛擬化維度有關,并被應用于通用企業級用例。然而,安全方面對工業網絡的適用性只顯示在組合(EVN)方法及其用例中。我們研究了網絡功能虛擬化基礎設施(NFVI)中的自主安全管理,主要目標是通過虛擬網絡功能(VNF)的實時遷移,通過SFC重新配置對威脅做出早期反應。這個目標是通過支持安全測量的決策架構來實現的,該架構一方面考慮環境中的威脅和事件,另一方面考慮NFVI供應商和用戶之間的服務水平協議(SLA)。為此,我們對針對VNF的攻擊進行分類,并定義可能的早期可檢測行為模式。最后,我們開發了一種安全感知的VNE啟發式,考慮了虛擬網絡(VN)的安全要求和SN的安全能力。這種方法在組合方法中被修改,以考慮部署虛擬化的安全VNF。

1 引言

將網絡虛擬化技術應用于復雜的異構環境,有望減少運營支出(OPEX)和資本支出(CAPEX),并滿足日益增長的需求。然而,有不同的虛擬化技術和不同的應用水平,其中各種目標可能更重要。此外,網絡虛擬化帶來了一些挑戰,如性能下降;更廣泛的攻擊面;考慮可能相互沖突的多個目標和約束[1];考慮多個網絡級別;環境感知的虛擬網絡的自主構成;有效的部署算法;對復雜環境的適用性;以及與實際的,主要是現代技術的整合。這些挑戰大多由研究人員部分和單獨考慮,對適用性的看法有限。

1.1 網絡虛擬化

虛擬網絡嵌入(VNE)是一個基于圖論的領域,它開發了虛擬網絡(VN)及其需求和底層網絡(SN)及其資源的抽象模型。此外,VNE還開發了圖算法來映射物理資源上的VN要求。VNE算法計算出服務器和網絡資源的路徑和分配給由虛擬節點(VNos)和連接它們的虛擬鏈接(VLis)組成的VN。計算結果應被網絡控制器用來實現SN中的實際資源保留。

在另一個層面上,網絡功能虛擬化(NFV)是一種現代網絡虛擬化技術,將網絡功能與專有硬件解耦。這些功能以虛擬網絡功能(VNF)的形式在標準服務器上運行,并在服務功能鏈(SFC)中連鎖,形成端到端的通信服務。SFC可能包括一個或多個子SFC,根據流量規格確定數據流路徑。NFV利用虛擬化技術,在所需位置靈活地按需部署復雜的網絡功能。網絡虛擬化的研究廣泛涉及多目標優化,但他們部分針對重要的約束條件,并提出了大規模問題的啟發式方法。

1.2 工業企業

傳統的部署專有和基于硬件的網絡功能的傳統網絡范式不夠靈活,無法滿足新興和不斷增長的應用需求,主要是5G移動網絡和工業4.0的安全、性能和彈性要求。這一事實是由于部署新設備、升級設備和服務創新的復雜性和高成本。

工業4.0企業應用將通過數據分析和自主決策支持智能工廠。為此,需要在企業的不同層面進行監測、分析和管理功能。例如,當管理員管理不同的遙遠地點,以遠程控制可定制的生產、安全、能源消耗、利用和安全時,就需要遠程資產管理。IIoT通過在整個工廠安裝無線傳感器并通過互聯網網關進行整合,實現了遠程資產監控。這些數據可以被遠程訪問,以實時采取進一步的行動。

然而,除了這種情況下的應用功能外,服務提供商應能夠創建和部署通信服務,以滿足工業企業與監測流量和結果決策有關的具體要求。虛擬化技術通過在邊緣和中央數據中心分別部署數據采集和分析功能,支持管理應用程序的靈活性。在這種情況下,中央數據中心承載著企業功能,而邊緣數據中心則承載著單個工廠功能。

本論文的目標適用領域是未來密集的工業網絡,在那里多目標優化方法并不高效。我們提供了一個完整的智能和復雜企業的虛擬化系統的基礎設計。在這個系統中,我們針對主要的重要目標,提出了新的啟發式方法,并為適用領域調整了一些現有的適當算法。

1.3 解決方法

在這篇論文中,我們用多種組合的虛擬化方法解決網絡虛擬化的挑戰。我們首先研究了復雜環境下的全面和自主的網絡虛擬化,它結合了不同的技術、多個應用層次,以及主要的目標/約束:拓撲、安全、性能、可靠性和資源利用。我們專注于兩個主要的網絡虛擬化方法(維度);功能虛擬化的NFV和資源虛擬化的VNE。我們將這些維度應用于多個目標下的不同層次的工業網絡。我們首先提出了一個綜合的解決方案,然后我們在最關鍵的目標/約束條件下將某些技術應用于某些層面。此外,我們設計了新穎的虛擬化解決方案和算法,提供高效率和可用性。這些解決方案得到了未來工業企業的具體用例的支持,并與時間敏感網絡(TSN)標準中的兩個主要組件集成。

我們首先開發了一個全面的VNE-NFV模型,用于在一組數據中心上部署一個擴展虛擬網絡(EVN)。我們介紹了EVN的概念,它結合了虛擬應用和網絡功能,以及應用和網絡設備。這個EVN是通過對用戶定義的簡單VN(應用請求(AR))進行逐步的圖形轉換來建立的,以代表應用終端節點和一般要求。一組策略(如安全策略)也由用戶定義,并以特定的優先級進行處理,以便用特定的VNos、VLis和VNFs擴展AR,并對資源有相應的需求。政策代表了EVN中的某種模式,以及當這種模式與EVN的當前狀態相匹配時要執行的特定圖轉換操作。網絡模型和策略考慮了節點的位置/領域和類型(拓撲結構),以及安全、冗余(可靠性)、低延遲和負載平衡(性能)要求。然而,降低成本(資源使用)的目標是在嵌入階段考慮的。這個目標直接影響到減少能源消耗的目標。一個轉變的例子是,當VLi連接兩個地點時,添加特定的安全VNFs。

構建EVN的下一步是根據所需的VNF和它們之間的依賴關系,并使用拓撲排序方法來組成候選SFC。嵌入算法首先分配虛擬應用節點,然后它使用一種貪婪的啟發式方法來映射SFC,該方法適應于剩余的SFC和路徑長度。這個啟發式的設計對我們的使用情況是可行的,這也適用于用于評估的隨機拓撲結構。這些解決方案在VNE工具ALgorithms for Embedding of VIrtual Networks (ALEVIN) [11]中實現,這是一個用JAVA編寫的開源VNE框架。一個典型的用例,即IIoT領域的遠程資產管理,被用來說明開發的方法。遠程資產管理是一個企業應用,但被部署在三個層面:工廠大廳、邊緣計算和云計算。然而,在一般的虛擬化模型中,工廠大廳和邊緣計算被合并以代表工廠層面。

考慮到所有目標的全面的VNE-NFV解決方案取決于三個子解決方案,它們考慮了不同級別和虛擬化維度的性能、可靠性和安全目標。對于性能和可靠性,我們分別研究了NFV和VNE對現代工業網絡技術(TSN)的適用性。這里的適用性水平是子解決方案中的工廠和組合解決方案中的企業。我們將NFV應用于流量整形組件(時間感知整形器(TAS)),以提高靈活性,我們研究了性能開銷,這是這種方法的主要挑戰。我們還將VNE應用于冗余組件(Frame Replication and Elimination for Reliability (FRER)),以提高靈活性,同時最大限度地減少資源的使用,這是可靠性方面的一個重大挑戰。對于安全角度和子解決方案,我們通過提出網絡功能虛擬化基礎設施(NFVI)的自主安全管理方法,在企業層面上應用NFV和VNE。NFV通過基于VNF遷移的防御架構來應用,而VNE則通過一個映射算法來應用,該算法了解VN的安全要求和SN的安全能力。

從性能角度來看,我們研究了TSN標準中的一個基本流量整形器TAS及其現有的實現。然后,我們研究了可用于使用高性能NFV實現虛擬TAS的機制。基于這些研究,我們設計、實現并評估了一個初步的虛擬TAS,它是一個由使用數據平面開發工具包(DPDK)構建的多個具有TAS功能的VNF組成的SFC。此外,我們開發了一個完整的框架,包括NFV專用的TAS控制器、調度和傳輸選擇算法、時間同步以及流量生成和性能測量工具。我們提出了一種基于網絡預取的新方法,主要是在虛擬環境中,通過提前測量真實的傳輸和處理時間來支持調度計算。在評估中,我們使用不同的場景測量穿越TAS SFC的時間關鍵型流量(TCT)的幀丟失和延遲,以判斷虛擬TAS在提供與標準中設計的基于硬件的TAS相當的性能的能力。此外,我們還評估了穿越同一SFC的最佳努力流量(BET)和穿越使用相同資源的另一SFC的外部干擾的影響。這些因素在分析虛擬化開銷時很重要。

從可靠性的角度來看,我們將可靠性模型作為網絡實體的一個屬性,并開發了具有不同路徑不連接性策略的可靠性軟件和基于分支的鏈接映射算法,可用于不同的工業流量類別。這些算法依賴于傳統的框圖方法來計算路徑的可靠性。這些算法主要在資源利用率、VN接納率和實現的可靠性方面進行比較。我們使用了一個來自工業網絡的典型評估拓撲,其中包括各種應用類型。此外,我們分析了TSN次級標準IEEE Std 802.1CB FRER,它定義了流復制的方法。我們在此基礎上開發兼容的VNE模型,并使用VNE工具ALEVIN以與FRER兼容的格式導出映射結果。然后我們在TSN模擬器Tsimnet[70]中測試了分支算法和FRER之間的這種整合。我們開發了最小和最大分支方法,并在工業環境中應用和評估了這些方法,因為這些方法是針對復雜環境的有效啟發式方法,能夠以最小或合理的資源使用量提高可靠性。

從安全的角度,我們闡述了VNF的安全性。企業VNF將被部署在標準服務器上,這可能會暴露出更廣泛的攻擊面。我們分析了VNF上的主要安全威脅,這些威脅來自于共同托管的VNF。重點關注的威脅是側面通道、共同定位和遷移利用攻擊。然后,我們設計了一個基于決策引擎和VNF遷移的防御概念。決策引擎將可疑的VNF作為威脅源遷移到一個詳細的分析環境中。此外,我們開發了一種安全感知的節點和鏈路映射算法,考慮了VN的安全約束和SN的安全功能。在本論文中,我們僅在安全和隱私背景下討論與服務水平協議(SLA)相關的VNF放置策略以及相關的QoS問題。

1.4 貢獻

綜上所述,我們開發、調整、應用和評估了幾種高效的啟發式算法,用于優化問題低效的復雜環境。在性能和可靠性方面,我們重點關注虛擬化對工業網絡技術的適用性。在下文中,我們列出了本論文對技術現狀的貢獻。

  • 我們提出了一個虛擬化模型,該模型考慮了網絡層次、虛擬化維度和主要目標/約束。此外,我們將開發的模型和算法映射到這個模型上。圖1.1顯示了所提出的具有兩個網絡層次、兩個虛擬化維度和目標的虛擬化模型。第7章討論了所開發的方法(組合方法和子方法)的映射。這里的目標順序反映了第三章中討論的組合方法的優先級。

  • 我們開發了一個全面的解決方案,用于結合虛擬化技術,并將其應用于不同的網絡層次和多個目標。

    • 在不同的拓撲結構、性能、可靠性和安全目標和約束條件下,我們使用圖變換將一般的應用要求轉換為物理拓撲感知的EVN。然而,資源利用目標是由EVN映射階段解決的。

    • 我們開發并實現了一種貪婪的啟發式算法,根據鏈條和路徑長度嵌入SFC。

    • 我們將組合的解決方案應用于一個受工業4.0概念啟發的IIoT用例,并代表了多個層次和目標。

  • 我們開發了一個可靠性的VNE模型和三種可靠性感知的鏈路映射算法(最短路徑、最大分支和最小分支),并在VN接受度、資源利用率、運行時間和實現的可靠性方面進行了比較。我們使用一個具有不同應用的典型工廠拓撲結構進行評估。基于我們的發現,我們提出了工業網絡的流量類別和這些算法之間的映射。

  • 我們將理論上的網絡虛擬化方法與工業網絡技術(TSN)相結合。

    • 我們設計并實現了一個使用高性能NFV技術的虛擬化TAS的完整框架。我們的解決方案在實現TSN方面實現了高度的靈活性,為企業級工業應用提供了可接受的延遲概率。

    • 我們使用TSN模擬器Tsimnet將可靠性感知鏈路映射算法的映射結果與標準的IEEE Std 802.1CB FRER進行整合。

  • 我們討論了VNF的安全威脅,并在NFVI中設計了一個基于遷移的防御解決方案,其中考慮了相關的隱私和QoS方面。

  • 我們開發了一種安全感知的VNE算法,將VN的安全約束映射到SN的安全能力。

1.5 論文結構

本論文的結構如下:在第二章中,我們介紹了與工業網絡虛擬化有關的工作,我們的組合方法,以及我們對性能(虛擬TSN)、可靠性(分支和FRER)和安全(基于遷移的防御和安全感知的VNE)的子解決方案。在第三章,我們介紹了組合的EVN方法。在第四章中,我們介紹了虛擬化TAS的性能子解決方案。在第5章中,我們提出了分支和與FRER整合的可靠性子解決方案。在第6章中,我們從安全的角度提出了決策引擎和安全感知的映射算法。第七章是本論文的結論,主要是將開發的方法映射到虛擬化模型中。

圖1.2顯示了論文地圖的邏輯元素和主要依賴關系。這些貢獻在各自的章節中詳細說明后,在結論(第7章)中被映射到擬議的虛擬化模型中。第3章中的轉換邏輯是由反映目標的不同轉換實現的。延遲、冗余和安全轉換以及EVN嵌入算法分別使用了第4、5、6章中三個子方法的算法和概念。最后,相關工作方面(EVN和三個主要目標)與各自的章節相聯系,并闡明了技術的現狀和我們的貢獻。

圖1.1: 擬議的虛擬化模型

第2章中的適用性方面(工業網絡的虛擬化)與所有方法相關。然而,為了簡化該圖,沒有顯示這種依賴性。

圖1.2:論文的邏輯要素及其主要依賴關系

付費5元查看完整內容

為了實踐知識表示,知識表示語言具有形式化的語義是最重要的。然而,由于有許多不同的語言都具有形式化的特點,因此有一個統一的框架來捕捉語言和邏輯的語義是很有價值的。一個這樣的框架就是理由論,在這個框架中,語義是通過使用解釋來定義的,在我們的術語中稱為理由。直觀地說,一個理由是一個解釋某些事實的真值的圖。然而這引入了一個潛在的問題:一個事實的理由狀態和它的否定可能是不一致的。因此,為了使辯解語義得到良好的定義,這些狀態應該是相反的。這樣的語義學被稱為是一致的。

在本論文的第一部分,我們證明了理由論的主要語義實際上是一致的。此外,我們還證明了對理由的有用結果,比如將理由組合在一起的能力。理由論語義學的另一個問題是,有不同類別的理由,這可能導致不同的語義學。我們表明,這兩個看似不相關的問題實際上是有深刻聯系的

之后,我們在理由論和博弈論之間建立了一種聯系,這使得理由可以被看作是雙人博弈中的策略。這種聯系通過在系統是有限的情況下為語義提供一個一般條件,為正當性理由論中的這兩個問題提供了一個解決方案。

理由論并不是非單調邏輯語義學的唯一統一框架。另一個著名的框架是近似定點理論(approximation fixpoint theory),它在本質上更加代數化。我們在證明理由論和近似定點理論之間建立了一種聯系。近似定點理論的終極語義的概念可以轉移到理由語義的領域。這使得證明語義學可以比以前捕獲更多的語義。

作為本論文的最后一個主題,我們研究了理由的嵌套,它可以用來定義模塊化語義。在以前的嵌套定義中,由于使用了壓縮操作,大量的信息被丟失。我們提供了一個替代的、更普遍的定義,沒有這個缺點。這允許基于理由的更直觀的模塊化語義。我們證明,這與樹狀理由的壓縮是等價的,在特殊情況下,對于圖狀理由也是如此。我們也研究了這兩種方法的一致性,作為額外的獎勵,我們解決了樹狀證明的一致性問題。

綜上所述,本論文收集了證明理由論中的一些進展,并以實例說明了這些進展。

第1章 緒論

1.1 背景

本論文位于人工智能(AI)領域,特別是知識表示和推理(KRR)子領域。KRR的主要關注點是定義表示知識的語言和邏輯,并構思用這些知識進行推理的工具和技術。當然,這是一個過于簡化的觀點,但它使我們能夠看到更大的畫面。要想擁有一個完美的推理器,首先應該捕捉問題領域的知識,然后釋放出手頭的推理能力。我們應該將其與人工智能其他部分的函數擬合方法進行對比,比如深度學習。這些方法雖然對其他問題(如語音識別)非常有用,但由于其近似的性質,并不總是能夠推理出100%的邏輯正確。Darwiche(2018)將人工智能的這種二分法定義為基于模型與基于函數的人工智能。基于模型的人工智能與基于函數的技術相比有一個明顯的優勢:內部機制通常也被捕獲,與基于函數的技術相比,它們的行為就像黑盒。因此,相對于更不透明的基于函數的方法,這些方法更傾向于可解釋的系統。此外,基于函數的人工智能通常是為一個特定的目標量身定做的。基于模型的人工智能的一個主要部分是知識表示和推理(KRR)。代表性的知識可以用來解決多個問題;因此它是面向多目標的。這個想法是知識庫范式的核心(Cat等人,2014;Denecker和Vennekens,2008)。因此,這些技術可以更好地處理新的場景,例如在因果推理中。由于人工智能的法規和政策,例如解釋權,基于模型的方法的更高程度的可解釋性顯得越來越重要。擁抱解釋將是實踐當代知識表示和推理(KRR)的一個完美起點。

在KRR中,許多語言和邏輯被發明用于不同的目的,從語義網本體語言(Antoniou和van Harmelen,2009;Baader等人,2005)到機器人學(Paulius和Sun,2019),立法和法律(Jones,1990)。通常情況下,這些邏輯都是基于相同的原則,但在工作中略有不同,或者是從不同的角度來解決。為了看清大局,最重要的是我們能在不同的語言和邏輯之間建立關系:它們是具有相同基本原則的不同方言,還是有本質的不同。研究這些關系的一種技術是定義語言之間的轉換。特別是,我們可以找到一種語言對另一種語言的嵌入。然而,由于現有的知識表示語言數量龐大,這是不現實的。另一個更可行的方法是設想統一一大批邏輯學的語義的框架。

幸運的是,證明理論既解決了可解釋性的問題,也解決了統一性的問題。理由論的語義(意義)是基于理由的概念,它是一個解釋某事為何成立的圖3。例如,理由(在這一點上完全理解這些圖片并不重要)作為一種解釋,為什么一個蘋果是美味的(當然你對美味的定義可以不同)。

理由語義學的工作方式是給每個理由打分,說明它是否好。通過改變我們對理由的評級方式,我們可以改變同一領域的語義。為了改變領域,辯解理論使用一套規則作為構建解釋的基礎。因此,不難看出,辯解理論作為一個統一的框架。再加上理由(解釋)是語義的主要構成部分,理由理論是KRR的一個很好的研究對象。

1.2 KRR中的理由說明

本論文所詳述的理由理論起源于Denecker(1993)的博士論文,并由Denecker, Brewka, and Strass(2015)進一步正式化。理由--盡管并不總是以Denecker(1993);Denecker等人(2015)所描述的確切形式出現--以不同的方式出現在KRR的不同領域中。理由論起源于邏輯編程,其中理由的概念已經存在了相當長的時間。根據Fandinno和Schulz(2019)的說法,理由的概念起源于Shapiro(1983);Sterling和Lalee(1986)關于調試的工作。在這項工作的基礎上,Lloyd(1987)為聲明式錯誤診斷器引入了不正確的規則和未發現的原子的概念。這些概念說明了什么時候一個結構不是給定邏輯程序的模型。第二年,Sterling和Yal?inalp(1989)用元解釋器解釋了Prolog專家系統。1990年,Fages(1990)用理由來定義邏輯程序的穩定語義,在這種情況下,理由是原子的集合。很多論證方法都使用了支持集/值的概念,這個概念是由Pereira等人(1992,1993)首次提出的。這大約是在Denecker和Schreye(1993)介紹早期版本的論證理論的同一時間。2000年,Roychoudhury等人(2000)通過為邏輯程序提供理由來證明基于表的證明。

Fandinno和Schulz(2019)列舉了除了證明理論之外的幾種突出的答案集編程(ASP)的證明方法。

  • 離線論證(Pontelli和Son,2006)

  • 基于標簽的假設論證的答案集(LABAS)論證(Schulz和Toni,2016)。

  • 因果證明(Cabalar和Fandinno,2016;Cabalar等人,2014)

  • Why-not出處(Damásio等人,2013年)

  • 基于規則的論證(Béatrix等人,2016)

前三種方法與論證理論相似,因為論證也是字詞或規則之間的依賴圖。

離線證明(Pontelli and Son, 2006)是一種圖結構,描述了一個原子相對于給定答案集的真值。因為離線論證只使用原子作為節點,所以節點必須用 "+"或"-"來表示它是真的還是假的。同樣地,邊也必須用 "+"和"-"來表示正或負的關系。負數字的真實性被認為是真實的,不做進一步解釋。

LABAS論證(Schulz和Toni,2016)與離線論證非常相似,但它們對中間的規則應用進行了抽象。所以他們只指出有問題的字詞和推導中使用的規則中出現的事實。此外,否定字詞的真實性不是假設的,而是根據基礎原子的真值來進一步解釋。

因果圖論證(Cabalar and Fandinno, 2016, 2017; Cabalar et al., 2014),與離線和LABAS論證相反,被用來對因果知識進行形式化和推理,這是它的主要焦點。它們也可以用來解釋為什么一個字詞包含在一個答案集中。此外,還定義了一個用于組合論證的代數。

Why-not provenance(Damásio等人,2013)是基于數據庫文獻的。這里的論證不是基于圖的,而是用來解釋原子的真值。

基于規則的證明(Béatrix等人,2016)是在基于規則的答案集計算的背景下定義的(Lefèvre等人,2017):搜索算法猜測的是規則的應用或不應用,而不是原子的真值。ASP-求解器ASPeRiX使用這些理由進行反跳。

對不同論證方法之間錯綜復雜的差異感興趣的讀者應該看看Fandinno和Schulz(2019)的出色工作。除了這些方法,還有一些應用也使用了論證方法。Mari?n(2009);Mari?n等人(2005,2007,2008)關于歸納定義的工作將理由作為歸納定義的推理技術的語義基礎。理由被用來進行非因果的局部搜索(J?rvisalo等人,2008)。類似于理由的數據結構也被用于答案集求解器的實現中(它們構成了無根據集算法中所謂的源-指針方法的基礎(Gebser等人,2009))。此外,理由被證明是分析懶人接地背景下沖突的關鍵(Bogaerts和Weinzierl,2018)。最近,Lapauw等人(2020)使用理由來改進奇偶性博弈求解器。

1.3 研究目的和動機

從廣義上講,我們的目標是推進論證理由論。特別是,在本文中,我們廣泛地研究了兩個帶有相關研究問題的屬性。

第一個屬性是關于正當化語義的合理性。理由論的一個好處是它提供了很大的自由度,可以通過分支評價的方式來創建新的語義。這些評價為解釋圖中的路徑賦值,從而決定一個理由是否被認為是好的。在論證理由論中,一個事實和它的否定之間沒有真正的區別。這意味著一個事實和它的否定都可以有好的理由,這在正常情況下被認為是一種矛盾。例如,如果你有一個很好的理由說明x成立,又有一個很好的理由說明x不成立,那么我們就得到一個矛盾。如果這種矛盾沒有發生,我們就說它的正當性語義是一致的。

理由論最初是為了捕捉歸納定義的語義而開發的。歸納定義在數學中極為重要,因為它們被用來生成數學對象,如子集生成的子群、博勒集、自然數、遞歸公式、邏輯中的真值關系等(Buchholz等人,1981)。引用甘迪(1974年,第265頁)的話來說

數學邏輯當然滲透著歸納性的定義

例如,我們可以在給定父關系的情況下歸納定義祖先關系,規則如下:

  • 如果一個人p是q的父母,他就是q的祖先。

  • 如果有一個人r,使p是r的父母,并且r是q的祖先,那么p就是q的祖先。

直觀地講,這應該是很清楚的意思。然而,一組歸納規則的形式語義并不立即清楚。一般來說,有兩種方法可以為歸納定義提供形式語義。第一種方法是構造性的,從下往上建立關系:你從空的關系開始,反復地應用歸納定義中的規則,直到關系停止增加。第二種方法是將關系定義為滿足歸納規則的最小的關系。如果歸納規則中不出現否定,這兩種方法都能提供相同的結果,然而當涉及到否定時,這種方法就失效了。正當化理論遵循構造方法,但將其擴展到更廣泛的構造類別。在這個意義上,我們可以把正當化看作是對一個事實為什么屬于一個集合/關系的構造。回到祖先關系,下面的理由代表了為什么Alice是Bob的祖先的構造過程。

上面的論證描述了Alice是Bob的祖先的過程:需要哪些歸納規則。

仍然存在的問題是,像Bob不是Alice的祖先這樣的事實的理由意味著什么。這樣的理由提供了一個證據,說明為什么鮑勃是Alice的祖先是不可構造的。可建構性的概念當然是經典的:某物不可能既在一個關系中又不在一個關系中。這意味著,研究理由語義的一致性是最重要的。

第二個屬性更關心我們的解釋可以是什么形狀。用更專業的術語來說,理由是有向圖。然而,我們允許兩種形式,一種是總是做出相同的 "選擇",另一種是可以做出多種選擇。讓我們看一下一個聯鎖齒輪的例子。

在這種情況下,我們有以下兩個理由:

在左邊,你看到一個循環推理,第一個齒輪的順時針轉動被第二個齒輪的逆時針轉動所證明,反之亦然。而在右邊,第一個齒輪的順時針轉動首先被第二個齒輪的逆時針轉動所證明,而后又被第三個齒輪的順時針轉動所證明。由于寫下正確的圖形類型,我們會得到一個樹狀結構(或根狀結構,取決于方向),我們說正確的類型是樹狀證明。為了對比樹狀證明,第一種類型被稱為類圖證明。最初,Denecker和Schreye(1993)發明了樹狀證明,但后來Denecker等人(2015)發明了圖狀證明。

現在我們有足夠的信息來說明本論文的第二個中心問題:這兩種類型的理由在什么時候是等價的;也就是說,當且僅當一個事實有一個好的樹狀理由時,它就有一個好的樹狀的理由。這一屬性被稱為圖式重現性,第二章中解釋了它被這樣稱呼的原因。

研究這兩個屬性是本論文的中心目標。特別是,我們的目標是找到對分支評價的限制,使這些屬性成立。此外,這些屬性是未來新的證明語義的準則。如果新的證明語義被設計出來,它應該滿足這兩個屬性才有實際用途,因為第一個屬性確保語義不矛盾,而第二個屬性允許將樹狀證明壓縮成圖狀證明。這在實際的計算機應用中有著重要的影響,因為大多數時候,樹狀的理由是一個無限的結構,因此不適合放在內存中。因此,如果有一個同樣好的類似圖的理由,那么就可以用它來代替。例如,理由被用于奇偶性博弈求解器中,見Lapauw等人(2020)的工作。

有點出乎意料的是,這些屬性在本質上是相互關聯的:如果類圖證明是一致的,那么圖的可重復性就成立,樹狀證明也是一致的。

除了這兩個屬性之外,我們還有兩個額外的研究方向。如前所述,論證理論旨在成為一個統一的框架。另一個起源于邏輯編程的框架是AFT。AFT的基礎在于Tarksi的fixpoint理論(Tarski, 1955);因此AFT的基本對象是運算符和它們的fixpoint。由于邏輯論證和AFT捕獲之間存在重疊,這就引出了這兩種形式主義之間的關系問題。

我們最后的研究方向是關于知識表示的模塊化。為了擁有高效的知識表征,最重要的是,如果增加了新的邏輯構造,語義學就不需要完全被改造來獲得它的工作。也就是說,知識表示應該是可組合的。Denecker等人(2015)提供了一種通過嵌套理由框架來組合不同理由語義的方法。然而,為了賦予嵌套以意義,它被壓縮到常規的辯解語義。這樣做,在理由中失去了很多信息,其效果是,理由沒有一個合適的解釋特征。因此,這就提出了一個問題:我們是否可以通過提供另一種方法來改善嵌套,而不丟失理由中的信息。

1.4 論文的結構

在下一章中,我們建立了論證理由論的前期工作,其中包括論證理由論的詳細定義以及四個主要分支的評價。我們為接下來的章節做了一些基礎工作,如關于粘貼在一起的理由的結果,以及正式定義我們的兩個研究問題和目標。本章最后表明,理由論可以捕捉到邏輯編程語義和抽象的論證框架。

在第三章中,我們深入研究了四個主要理由語義的一致性,并證明了這些主要理由語義的模型之間的一些關系。

第四章進一步研究了一致性問題,但是從另一個角度進行的,即把理由論嵌入到博弈論中。這種嵌入有效地表明,理由可以被看作是一些雙人游戲中的策略。利用博弈論的結果,我們為分支評價找到了兩個額外的屬性,這意味著它在有限環境下的一致性。

之前,我們談到理由論是一個統一的框架。另一個試圖捕捉類似語義的統一框架是AFT。在第五章中,我們將探討這兩個統一框架之間的關系。作為額外的收獲,我們將終極語義(AFT中的一個概念)轉移到了證明理論中;進一步擴大了證明理論能夠捕獲的語義的數量。

我們還沒有討論的理由論的一個好處是它的模塊化。理由論通過嵌套實現了這一點。直觀地說,這可以被看作是理由中的理由。這將在第六章進一步探討。作為一個出乎意料的結果,我們發現了一個意味著滿足圖再現性的屬性。此外,我們還解決了樹狀證明的一致性問題。在本章的最后,我們介紹了一些使用嵌套證明系統的應用。

第七章也是最后一章提供了一個結論和這一研究方向的可能。

大多數章節都是獨立的主題,除了第二章,因為它為后面的章節打下了基礎。每一章都有一個結論,闡述了該研究方向的未來。

付費5元查看完整內容

幾個世紀以來,人類一直在收集數據和表征信息,但數字技術的出現,特別是萬維網的出現,導致了新的挑戰:穩步增長的各種數據需要以系統和有意義的方式進行整合管理。否則,只剩下質量不明的大量無關聯的數據。

為了實現信息的智能管理,我們需要以統一的方式表示數據。此外,我們需要表示限制條件,以定義哪些數據連接在某個用例中是有意義的或有效的,以表示手頭的信息。一個簡單但強大的方法是通過兩件事來表示信息:概念和概念之間的關系。這就形成了一個以概念為節點、以連接節點的關系為邊的圖結構,即所謂的知識圖譜。像這樣,我們可以表示 "作者"、"人 "和 "書 "這三個概念,以及 "寫 "或 "買 "這樣的關系。而作者 "安迪-威爾 "寫了《火星人》一書的信息是有意義的信息,《火星人》一書不能寫作者 "安迪-威爾"。然而,對于計算機來說,如果沒有限制條件來限制連接概念與關系的可能方式,這兩個例子都是有效的。

表達什么是在特定環境下有意義的或者什么是高質量的限制是主觀的,必須由人類來定義。在給定的例子中,限制可以是作者寫書,作者也是一個人。在這種情況下,這些限制是所謂的公理:說明根據模型什么是真的。這些限制可以被計算機用來推斷新的知識:根據安迪-威爾寫了《火星人》這本書的知識,可以推斷出他是一個作家和一個人。另一個限制可能是,只有人可以寫書,而且數據庫中的所有書都需要有作者。在這種情況下,這些限制是所謂的約束,用來識別無效的數據。這可以用于質量評估,以識別缺失的作者信息或錯誤的數據。

本論文主要研究人類對知識圖譜的創建和使用限制。當定義抽象的概念,如 "作者 "或 "書 "時,人們通常把它稱為詞匯表。它的術語可以通過公理來限制意義,那么這個詞匯就可以被稱為本體論。當連接知識圖譜中的具體數據時,如作者 "安迪-威爾 "和書 "火星人",人們使用這種詞匯表的術語將其稱為數據,例如 "安迪-威爾是一位作者 "和 "火星人是一本書"。在某種情況下,對這些數據有效的東西可能受到限制。為了用機器友好的方式表示所有這些,我們可以使用萬維網聯盟(W3C)推薦的以下語言:(i)資源描述框架(RDF)來表示術語,(ii)RDF Schema(RDFS)和網絡本體語言(OWL)來表示公理(iii)和形狀約束語言(SHACL)來表示約束。

第一個挑戰是支持用戶根據使用的限制條件來評估知識圖譜。在構建知識圖譜時,現有的詞匯表經常被重復使用,這使得一個系統中的信息在其他系統中也能被理解。這些詞匯表通常包含影響潛在重用的公理:一些公理在計算上更加復雜,人們可能希望在某個使用案例中避免重用包含這些公理的詞匯表。同樣地,人們可能要評估現有約束條件對通用詞匯的使用。但在這兩種情況下,目前對用戶比較和選擇所使用的限制條件的知識圖譜的支持有限。

第二個挑戰是如何支持用戶創建約束條件。通常情況下,領域專家最清楚他們要施加哪些限制,但他們不是知識圖譜專家,需要一種用戶友好的方式來創建知識圖譜限制。其他研究表明,表示如何以視覺方式表示某些概念的可視化符號可以支持用戶。目前,還沒有這樣的可視化符號來可視化知識圖譜的約束。

限制條件的使用是特定的,因此在本論文中,我們專注于數據管理的某個用例:支持國家圖書館對社會媒體的保存。一方面,在保存動態社交媒體內容時,需要考慮不同的異質數據源。然而,目前還沒有一個完整的社交媒體歸檔工作流程,可以有意義地結合不同的數據片段。另一方面,保存的內容需要被訪問和查詢,這對主觀的數據質量約束提出了挑戰。

為了解決第一個挑戰,我們提出了一種方法來衡量知識圖譜中限制條件的使用,并提出了收集到的原理和限制條件的統計數據。我們首先介紹了Montolo,這是一種定義抽象限制類型的方法,如 "subclass "和RDF中的具體表達,如rdfs:subClassOf。然后,我們介紹了一個在RDF中創建可互操作的限制使用統計的實現。我們通過測量(i)RDFS和OWL公理在來自通用LOV和特定領域的BioPortal資源庫的一千多個本體中的使用情況,以及(ii)來自確定的GitHub資源庫的SHACL形狀中的限制使用情況,來證明這種方法的可行性。

為了解決第二個挑戰,我們關注的是如何支持人類用視覺符號來創建約束,這些符號可以直觀地顯示SHACL中指定的所有約束。我們在計算機科學和知識圖譜領域現有的常用可視化符號的基礎上,提出了兩個可視化符號ShapeUML和ShapeVOWL。我們根據認知有效的設計原則對它們進行了比較,因為它們是要被人類用戶認知處理的,并在一個用戶比較研究中對這兩種符號進行了評估。

為了解決第三個挑戰,我們引入了一個基于知識圖譜的社交媒體歸檔解決方案和相應的質量評估與約束。我們的BESOCIAL解決方案是基于聲明式的知識圖譜生成:使用通用詞匯及其公理來有意義地整合異質的社會媒體歸檔相關數據。此外,我們提出了社交媒體檔案相關的數據質量類別、維度和指標,以及用知識圖譜約束的低級驗證來衡量相應的高級數據質量指標。我們遵循既定的方法,但與現有作品相比,我們的質量評估依賴于萬維網聯盟(W3C)的相關規范,而不是定制軟件。

本論文的貢獻為評估和處理知識圖譜的限制提供了可互操作的手段

Montolo使用戶能夠評估現有的知識圖譜在公理和約束方面的使用情況。關于公理,我們發現來自通用LOV和特定領域的BioPortal資源庫的詞匯顯示出類似的模式:95%以上使用基于RDFS的限制,但只有一半使用基于OWL的限制。創建的統計數據可以支持本體的重用:本體工程師現在可以依靠公理的使用統計數據來評估現有的本體。關于約束,我們發現了與公理使用類似的模式:概念之間的關系經常被限制在某些類別或數據類型中,而關于字面價值的約束則使用得較少。我們的統計數據揭示了一個可能的問題:一個自我實現的預言,即創建約束的工具只關注常用的約束類型,最終產生更多這樣的約束。因此,少用的約束類型應該得到更多的關注。

ShapeUML和ShapeVOWL的可視化符號獨立于特定的約束語言,并且是在考慮到認知有效性的情況下建立的。因此,人類可以利用他們的快速認知系統,而不必依賴特定的文本語法。我們的比較分析的定量部分顯示,用戶使用一種視覺符號或另一種視覺符號所犯的錯誤并沒有減少,而且兩種符號都有超過80%的問題被正確回答。因此,兩種可視化符號都有可能被用于不同的使用案例,我們的定性分析也指出了可能的改進。

我們的BESOCIAL社交媒體歸檔工作流程使文化遺產專家能夠使用聲明性的手段來保存社交媒體,因此無需他們編寫代碼。此外,我們還定義了與社交媒體收集相關的質量類別、維度和指標,可供社區重新使用。這個用例體現了使用公理和約束來實現數據管理,并在數據整合和數據質量方面提供附加價值。開發的數據質量評估也可以應用于其他用例,因為我們的解決方案只依賴于公開的W3C相關規范。

未來方向包括增加對約束條件的可視化符號的采用,以及創建知識圖譜限制的方法。

關于約束條件的創建,我們對兩種可視化符號與知識圖譜專家的比較評估所得到的結果,是向用戶友好型支持知識圖譜約束條件工作邁出的第一步。類似的研究可以與來自不同領域的專家一起進行,以改進可視化符號和實現符號的工具。后者可以通過調查不同的編輯工作流程來改進。此外,還可以研究如何用我們的可視化符號來表示SHACL以外的其他約束語言。一個有希望的候選語言是形狀表達語言(ShEx),它在從事維基數據工作的社區中引起了關注。

目前有幾種本體工程方法,但特別是隨著SHACL等約束語言的出現,出現了新的建模范式。在這篇論文中,我們將公理和約束同時應用于文化遺產的使用案例,未來的工作可以研究一種通用的方法來支持知識工程師創建知識圖譜。創建知識圖譜的方法論支持何時使用哪些公理,何時使用哪些約束。這使得與限制有關的設計決策透明化,從而最大限度地減少了關于使用公理和使用限制的主觀討論。

付費5元查看完整內容

隨著互聯網的興起,每天都有不同形式的大量的文本數據產生:新聞、研究文獻、 博客、論壇文字以及社交媒體評論等。很多重要有用的信息隱藏在其中,如何從這些自 由文本中自動抽取所需要的信息是一個關鍵并且重要的一步。信息抽取任務就是為此目 標而誕生。本文主要研究信息抽取子任務之一的實體關系抽取任務。該任務旨在識別文 本中出現的實體,并判斷出實體之間存在的關系。

傳統的有監督實體關系抽取通常采用基于流水線的方法,即實體模型和關系模型 分開訓練。在測試階段,先用實體模型識別出實體,然后關系模型找出這些實體之間的 關系。這種流水線的方法存在著錯誤傳播的缺點,前一個任務的錯誤會累積到后一個任 務。為了緩解這一問題,研究人員提出了聯合模型。聯合模型將兩個子模型統一建模, 可以進一步利用兩個任務之間的潛在信息,以緩解錯誤傳播的缺點。聯合模型的難點是 如何加強實體模型和關系模型之間的交互,比如實體模型和關系模型的輸出之間存在著 一定的約束,在建模的時候考慮到此類約束將有助于聯合模型的性能。

另一方面,為了解決實體關系抽取數據集難以獲得的問題,遠程監督的方法也被提 出來。其主要思想是利用知識庫和大規模文本數據對齊,自動構建大規模的訓練集。然 而,遠程監督方法的缺點是自動構建的訓練集中存在著很多的噪音數據,這些噪音數據 的存在對遠程監督實體關系抽取有著很大的負面影響。此外,在有些應用場景中可能沒 有現成的知識庫可以用來進行遠程監督,如何解決類似的數據噪音和數據缺失問題也是 一大挑戰。

根據實體關系抽取方法的研究現狀,本文從數據和聯合模型兩個角度探索了幾種實 體關系抽取聯合模型,并且探究了所提出模型的優勢和不足。具體來說,本文的主要貢 獻有

    1. 為了緩解遠程監督中的噪音樣本問題,本文提出利用少量高質量異構的人工標注 數據集幫助遠程監督實體關系抽取任務。本文設計了一個基于多任務學習的融合 框架,并且在融合過程中考慮到子模型之間的一致性約束,從而實現知識的遷移。本文提出的系統在標準遠程監督數據集能夠顯著的提高聯合抽取的性能(數據角 度)。
    1. 為了解決某些領域沒有現成知識庫無法進行遠程監督的問題,本文提出利用語言 學規則進行遠程監督。首先應用領域無關的語言學規則自動構建訓練集,然后使用 分類器在得到的訓練集上進行訓練,最后利用分類器進一步抽取語言學規則無法 覆蓋的新的實體關系。本文提出的算法很快并且適用于大規模數據。在 Amazon 在 i 線評論數據集上的實驗表明了本文提出的算法明顯優于多個基準模型(數據角度)。
    1. 為了加強實體模型和關系模型之間的交互,本文提出基于風險最小化訓練方法的 聯合實體關系抽取模型,通過優化全局的損失函數以達到加強實體模型和關系模 型之間聯系的目的。在 ACE05 數據集上的實驗證明了提出模型的有效性(聯合模 型角度)。
    1. 為了同時考慮到實體類型和關系類型的信息,本文提出一個基于圖卷積網絡的聯 合模型用于實體關系抽取。我們構造了實體-關系二分圖,并在圖上運行圖卷積網 絡,從而捕獲多個實體和多個關系之間的信息。在 ACE05 數據集上的實驗證明了 提出模型的有效性(聯合模型角度)。

//www.czsun.site/

付費5元查看完整內容
北京阿比特科技有限公司