近些年,知識圖譜的構建技術得到了極大的發展,構建好的知識圖譜已經被應用到眾多領域。在此基礎上,研究者將目光從知識圖譜轉向事件圖譜。事件圖譜以事件為核心,準確地描述了事件信息以及事件之間的關聯關系。基于此,總結了事件圖譜在構建、推理與應用方面的關鍵技術,主要包括事件抽取、事件信息補全、事件關系推斷以及事件預測技術。給出了事件圖譜的具體應用場景,并且針對事件圖譜研究中存在的挑戰,對未來的研究趨勢進行了展望。
隨著信息技術的飛速發展,目前整個社會已經邁入了大數據時代。大數據時代下每時每刻都在產生龐大的數據。在龐大數據的背后,蘊含著眾多有價值的信息。但是由于數據種類繁多、數據量龐大,難以高效、準確地獲取有用的信息。為了更加高效地獲取數據背后的信息,提高獲取信息的效率,研究人員開始研究并使用自動化的工具從原始數據中抽取有價值的信息。這種自動化的技術被稱為信息抽取技術[1],可以極大地提高工作效率,節省時間。與此同時,由于信息抽取技術逐漸走向成熟,一種新的數據組織形式逐漸形成,實現了知識互聯,適應了用戶的認知需求,其被稱為知識圖譜。
知識圖譜的概念由Google公司在2012年正式提出[2],目的是提高搜索引擎的性能,提供更加友好的搜索結果。隨后知識圖譜在學術界受到了極大的關注,其構建技術也在飛速發展。目前,知識圖譜已經被廣泛地應用到知識問答、智能搜索、個性化推薦、軟件復用[3]、政府治理[4]等多個領域。隨著技術的不斷發展,現有研究內容已經從知識圖譜的實體識別[5]、關系抽取[6]技術擴展到了事件圖譜的構建與推理技術。事件圖譜刻畫了現實世界中發生的事件,對事件信息進行了準確描述。事件圖譜中蘊含眾多事件知識,事件知識的特點是擁有眾多維度,例如時間維度、邏輯維度、關系維度等。
本文對現有的關于事件知識的研究做了總結,從事件圖譜的構建、推理與應用3個方面闡述了相關技術的研究現狀。最后,本文展望了事件圖譜的發展方向。
目前百度事件圖譜已構建了千萬級規模的事件圖譜,在收錄時效上達到分鐘級。事件圖譜技術已應用到搜索、信息流等百度內部的產品中,相關能力也對外輸出到媒體等多個行業。另外,事件圖譜的前沿推理技術在金融領域的探索也初步取得成果,并已形成一個金融事件歸因和預測的推理平臺。本文將為大家詳細介紹百度的事件圖譜技術與應用,主要內容包括: