針對知識圖譜(KG)在知識驅動的人工智能研究中發揮的強大支撐作用,分析并總結了現有知識圖譜和知識超圖技術。首先,從知識圖譜的定義與發展歷程出發,介紹了知識圖譜的分類和架構;其次,對現有的知識表示與存儲方式進行了闡述;然后,基于知識圖譜的構建流程,分析了各類知識圖譜構建技術的研究現狀。特別是針對知識圖譜中的知識推理這一重要環節,分析了基于邏輯規則、嵌入表示和神經網絡的三類典型的知識推理方法。此外,以異構超圖引出知識超圖的研究進展,并提出三層架構的知識超圖,從而更好地表示和提取超關系特征,實現對超關系數據的建模及快速的知識推理。最后,總結了知識圖譜和知識超圖的典型應用場景并對未來的研究作出了展望。
隨著計算機科學相關領域研究的不斷深入,人工智能的 研究重心由感知智能轉向認知智能。專家系統和語義網絡作 為認知智能的早期代表,提出“將知識引入人工智能領域”,在 某些特定領域具備一定的問題解決能力,但仍存在規模較小、 自動化構建能力不足、知識獲取困難等一系列問題。知識圖譜(Knowledge Graph,KG)的出現,改變了傳統的 知識獲取模式,將知識工程“自上而下”方式轉變為挖掘數據、 抽取知識的“自下而上”方式。經過長期的理論創新與實踐探 索,知識圖譜已經具備體系化的構建與推理方法。然而,對于 實體關系,知識圖譜雖然有較強的建模能力,但難以表達普遍存在的多元關系。知識超圖通過引入超邊關系,能夠完整表 達各種復雜的關系類型,得到學術界和工業界的高度關注。此 外 ,知 識 圖 譜 和 知 識 超 圖 能 夠 結 合 深 度 學 習(Deep Learning,DL)等人工智能技術,實現高效推理。
近些年,知識圖譜的構建技術得到了極大的發展,構建好的知識圖譜已經被應用到眾多領域。在此基礎上,研究者將目光從知識圖譜轉向事件圖譜。事件圖譜以事件為核心,準確地描述了事件信息以及事件之間的關聯關系。基于此,總結了事件圖譜在構建、推理與應用方面的關鍵技術,主要包括事件抽取、事件信息補全、事件關系推斷以及事件預測技術。給出了事件圖譜的具體應用場景,并且針對事件圖譜研究中存在的挑戰,對未來的研究趨勢進行了展望。
隨著信息技術的飛速發展,目前整個社會已經邁入了大數據時代。大數據時代下每時每刻都在產生龐大的數據。在龐大數據的背后,蘊含著眾多有價值的信息。但是由于數據種類繁多、數據量龐大,難以高效、準確地獲取有用的信息。為了更加高效地獲取數據背后的信息,提高獲取信息的效率,研究人員開始研究并使用自動化的工具從原始數據中抽取有價值的信息。這種自動化的技術被稱為信息抽取技術[1],可以極大地提高工作效率,節省時間。與此同時,由于信息抽取技術逐漸走向成熟,一種新的數據組織形式逐漸形成,實現了知識互聯,適應了用戶的認知需求,其被稱為知識圖譜。
知識圖譜的概念由Google公司在2012年正式提出[2],目的是提高搜索引擎的性能,提供更加友好的搜索結果。隨后知識圖譜在學術界受到了極大的關注,其構建技術也在飛速發展。目前,知識圖譜已經被廣泛地應用到知識問答、智能搜索、個性化推薦、軟件復用[3]、政府治理[4]等多個領域。隨著技術的不斷發展,現有研究內容已經從知識圖譜的實體識別[5]、關系抽取[6]技術擴展到了事件圖譜的構建與推理技術。事件圖譜刻畫了現實世界中發生的事件,對事件信息進行了準確描述。事件圖譜中蘊含眾多事件知識,事件知識的特點是擁有眾多維度,例如時間維度、邏輯維度、關系維度等。
本文對現有的關于事件知識的研究做了總結,從事件圖譜的構建、推理與應用3個方面闡述了相關技術的研究現狀。最后,本文展望了事件圖譜的發展方向。
摘要: 知識圖譜的概念由谷歌于2012年提出,隨后逐漸成為人工智能領域的一個研究熱點,已在信息搜索、自動問答、決策分析等應用中發揮作用。雖然知識圖譜在各領域展現出了巨大的潛力,但不難發現目前缺乏成熟的知識圖譜構建平臺,需要對知識圖譜的構建體系進行研究,以滿足不同的行業應用需求。文中以知識圖譜構建為主線,首先介紹目前主流的通用知識圖譜和領域知識圖譜,描述兩者在構建過程中的區別;然后,分類討論圖譜構建過程中存在的問題和挑戰,并針對這些問題和挑戰,分類描述目前圖譜構建過程中的知識抽取、知識表示、知識融合、知識推理、知識存儲5個層面的解決方法和策略;最后,展望未來可能的研究方向。
摘要:數據和知識是新一代信息技術與智能制造深度融合的基礎。然而,當前產品設計、制造、裝配和服務等過程中,數據及知識的存儲大多以傳統關系型數據庫為基礎,這導致了數據及知識的冗余性和搜索及推理的低效性。近年來,知識圖譜技術飛速發展起來,它本質上是基于語義網絡的思想,可以實現對現實世界的事物及其相互關系的形式化描述。該技術為智能制造領域數據及知識的關聯性表達和相關性搜索推理問題的解決帶來了可能性,因此其在智能制造的實現過程中扮演著越來越重要的角色。為了給知識圖譜在智能制造領域的應用提供理論支撐,總結了知識圖譜領域的研究進展;同時探索了知識圖譜在智能制造領域的3大類應用方向,共15小類應用前景,分析了在各個應用前景上與傳統方法的不同之處,應用過程中所需要使用的知識圖譜相關技術以及實施過程中所待突破的關鍵技術,希望可以為進一步展開針對知識圖譜在智能制造領域的研究提供啟發,同時為相關企業針對知識圖譜的實際應用提供參考;最后以數控車床故障分析為案例,驗證了知識圖譜在智能制造領域應用的有效性。
物聯網、云計算、人工智能等新一代信息技術的迅猛發展,帶來了制造業的新一輪突破,推動著制造系統向智能化方向發展,驅動著未來制造模式的創新[1]。其中數據和知識是實現制造業與新一代信息技術融合的基礎,是實現智能制造的保障。一方面,產品在其生命周期的各個階段將會產生海量工業數據和知識[2];另一方面,工業數據和知識是制造領域的信息化進程的必備資源,其中蘊含了大量有用的模式。然而,當前制造領域產品設計、制造、裝配、服務等生命周期過程中數據以及知識的存儲大多以傳統關系型數據庫為基礎,冗余性較高、分布分散、關聯性較弱且儲量相對較小,強調對數據以及知識的檢索卻較少從語義層面研究數據以及知識的關聯、認知、理解與推理。因此,如何從冗 余的數據與知識文本中抽取有用信息,如何有效表 達數據之間的內在關聯與知識之間的內在關聯,如 何有效利用數據的關聯性與知識的關聯性實現高效 的信息檢索與信息推理,是當前實現智能制造目標 的核心瓶頸之一。知識圖譜(Knowledge graph,KG)來源于谷歌下 一代智能語義搜索引擎技術。其本質上基于語義網 絡的思想,是一種有向圖結構的語義知識庫,用于 以符號形式描述物理世界中的概念及其相互關 系 [3],其應用服務架構如圖 1 所示。在知識圖譜內 部,數據和知識的存儲結構為三元組,形如 s p o , ,其中 s 和 o 為知識圖譜中的節點,分別 代表了主語實體知識和賓語實體知識, p 為知識圖 譜中的邊,代表了從 s 指向 o 的關系知識(謂語)。
知識圖譜具有如下 3 種特點:① 數據及知識的 存儲結構為有向圖結構。有向圖結構允許知識圖譜 有效地存儲數據和知識之間的關聯關系;② 具備高 效的數據和知識檢索能力。知識圖譜可以通過圖匹 配算法,實現高效的數據和知識訪問;③ 具備智能 化的數據和知識推理能力。知識圖譜可以自動化、 智能化地從已有的知識中發現和推理多角度的隱含知識。
目前,知識圖譜技術已經在互聯網領域如搜索引擎、智能問答等發揮了重要作用,同時也已經在 多個領域進行初步應用,比如:金融、電商、醫療 等 [4]。許多國際著名企業也已經開始探索知識圖譜 的應用,比如谷歌、微軟、IBM、蘋果等。與此同 時,在智能制造領域,西門子于 2018 年提出了他們 在知識圖譜領域的規劃[5];博世公司于 2019 年構建 了底盤系統控制相關數據的大型知識圖譜,以提供 有效地數據訪問[6]。然而國內的機械行業針對知識 圖譜的探索卻有些許不足。在研究過程中以及與多家機械相關企業的交流中發現,當前知識圖譜在智 能制造領域應用過程還存在以下不足。
(1) 缺乏對知識圖譜理論的深入認識。目前知 識圖譜相關理論與技術在迅速發展,但是智能制造 領域的專家大多對該技術缺乏深入的了解,無法有 效管理和應用知識圖譜中的數據及知識。
(2) 知識圖譜相關技術在智能制造領域的優勢 不明晰。目前知識圖譜在智能制造領域的應用處于 起步階段,針對產品設計、制造、裝配、服務等過 程所帶來的優勢不是很明確,且在知識圖譜應用于 智能制造領域過程中可能遇到的問題尚不明確。
(3) 知識圖譜相關技術在智能制造領域的應用 場景模糊。當前企業對知識圖譜在智能制造領域的 應用前景有所疑問,不確定知識圖譜技術在產品設 計、制造、裝配和服務等過程的切入點和切入方式。
(4) 知識圖譜在智能制造領域落地所需要的技 術不明確。目前在通用領域上的知識圖譜的研究角 度十分廣泛,但是針對智能制造領域各個應用場景, 所需要使用的知識圖譜相關技術類別卻還不是很明晰。
(5) 智能制造領域相關數據缺乏。目前基于深 度學習的知識圖譜相關技術需要構建一定量的有標 簽數據集,目前通用領域的相關數據集比較多,而 智能制造領域的相關數據卻比較缺乏。
針對以上問題,本文總結了可以應用于智能制 造領域的知識圖譜技術的研究進展。同時從應用出 發,探索了知識圖譜在智能制造領域的 3 大類應用 方向,共 15 小類應用前景,分析了在各個應用前景 上與傳統方法的不同之處,應用過程中所需要的知 識圖譜技術以及實施過程中所待突破的關鍵技術, 為后續知識圖譜在智能制造領域的進一步落地提供 理論支撐和方法參考。
以研究科學創新與演化規律為目的的科學學近年來迎來了進一步的發展, 科技大數據領域知識圖譜在其中發揮了重大的作用. 本文將從科技大數據知識圖譜構建及應用研究角度, 對科學學研究過程中發揮重大推動作用的科技領域知識圖譜技術進行系統、深入的綜述, 闡述科技大數據知識圖譜構建過程中涉及的科技實體抽取、科技實體消歧、科技關系抽取、科技關系推斷等問題, 對科技實體推薦、科技社區發現、科技實體評價、學科交叉以及學科演化等科技大數據知識圖譜分析挖掘方法進行系統梳理, 并給出科技大數據知識圖譜未來的研究及應用方向.
//engine.scichina.com/publisher/scp/journal/SSI/50/7/10.1360/SSI-2019-0271?slug=abstract
隨著谷歌知識圖譜、DBpedia、微軟 Concept Graph、YAGO 等眾多知識圖譜的不斷出現, 根據 RDF 來構建的知識表達體系越來越為人們所熟知. 利用 RDF 三元組表達形式成為人們對現實世界中 知識的基本描述方式, 由于其結構簡單、邏輯清晰, 所以易于理解和實現, 但也因為如此, 當其面對現 實中無比繁雜的知識和很多常識時, 往往也無法做到對知識的認識面面俱到, 知識圖譜的構建過程注 定會使其中包含的知識不具有完整性, 即知識庫無法包含全部的已知知識. 此時知識庫補全技術在應 對此種情形時就顯得尤為重要, 任何現有的知識圖譜都需要通過補全來不斷完善知識本身, 甚至可以 推理出新的知識. 本文從知識圖譜構建過程出發, 將知識圖譜補全問題分為概念補全和實例補全兩個 層次: (1) 概念補全層次主要針對實體類型補全問題, 按照基于描述邏輯的邏輯推理機制、基于傳統機 器學習的類型推理機制和基于表示學習的類型推理機制等 3 個發展階段展開描述; (2) 實例補全層次 又可以分為 RDF 三元組補全和新實例發現兩個方面, 本文主要針對 RDF 三元組補全問題沿著統計 關系學習、基于隨機游走的概率學習和知識表示學習等發展階段來闡述實體補全或關系補全的方法. 通過對以上大規模知識圖譜補全技術研究歷程、發展現狀和最新進展的回顧與探討, 最后提出了未來 該技術需要應對的挑戰和相關方向的發展前景.