當前人工智能正在經歷從感知智能到認知智能的重要發展階段。認知是人們獲取和應用 知識的過程,因此,作為人類對客觀世界認知的一種表現形式,知識圖譜是認知智能研究不 可或缺的組成部分。知識圖譜可以幫助機器積累人在解決問題中使用的知識,可以幫助組織 互聯網資源,進而用知識賦能行業智能應用,知識圖譜及其知識引擎技術已經成為人工智能 系統的基礎設施。《知識圖譜發展報告》(2022)是中國中文信息學會語言與知識計算專委會 邀請知識圖譜領域專家結合人工智能和知識圖譜技術的最新發展,在《知識圖譜發展報告》 (2018)基礎上對本方向前沿技術和應用的又一次系統總結,并對未來前沿趨勢進行展望。
近年來,隨著人工智能特別是大數據、深度學習和大規模預訓練模型的快速發展,知識 圖譜的理論、方法和應用也有了很大進展。
在知識表示和建模中,知識圖譜表示形式更加多樣化,從單一語言和符號表示的知識圖 譜,到多語言和多模態的知識圖譜;從結構化知識表示發展到與半結構化和非結構化數據融 合的概念-實體-上下文一體化知識表示,從符號知識表示到融合符號和數值的知識表示。
在知識獲取方面,低資源、真實場景下的知識獲取技術也有了長足進步,由傳統限定領 域的知識抽取,到如今開放領域的多類別知識抽取;由基于知識庫的關系獲取,到以知識為 指導的面向大規模預訓練技術的關系獲取;由粗粒度有監督學習到細粒度小樣本學習,以及 由單一模態的概念抽取到跨模態的聯合學習。
在知識圖譜應用方面,知識圖譜領域應用越來越廣泛,以多模態知識為驅動的虛擬數字 人推動著人工智能走向更廣闊的應用場景,“知識圖譜+產業”的新范式凸顯著以知識為中心 的應用與現實業務的深度融合。“知識圖譜+其他學科(如區塊鏈、物聯網)”的交叉研究也 正在興起和發展。
知識圖譜未來發展趨勢和面臨的挑戰在于,能否利用大規模預訓練模型進一步促進知識 表示、獲取和推理技術的發展,能否基于認知推理實現具有認知能力的人工智能新架構,能 否利用知識的可解釋性釋放更多產業潛能和應用。 本發展報告的定位是深度科普,旨在向政府、企業、媒體中對知識圖譜感興趣的社會各 界人士簡要介紹相關領域的基本概念、基本方法和應用方向,向高等院校、科研院所和高新 技術企業中從事相關工作的專業人士介紹相關領域的前沿技術和發展趨勢。 本報告共由 13 章組成,每一章按照 1)任務定義、目標和研究意義;2)研究內容和關 鍵科學問題;3)技術方法和研究現狀;4)技術展望與發展趨勢等四部分的結構形成每一章的內容。每一章我們邀請了本專業領域內的專家協同撰寫完成。具體結構如下:
來源:華為
來源 | 華為(轉載請注明來源)
中國人工智能產業發展聯盟、華為云和中國信息通信研究院聯合編寫的《知識計算白皮書》,多維度、多角度、多層次地剖析了知識在企業從數字化到智能化的過程中發揮的重要作用,綜合闡述并客觀分析了知識計算從知識層、模型層、算子層到行業應用的框架體系,通過能源、工業、醫療、政務、金融等行業的知識計算應用案例闡釋知識計算為產業、行業、企業帶來的價值,描繪了未來知識計算在技術、產業、標準、生態等方面的發展愿景。
知識計算是一種新的計算模式,利用AI技術實現機器將知識轉化成可計算的模型。
具體來說,知識計算將行業中各種形態的知識,以數學模型的方式,協同行業數據進行計算。將該過程中所涉及的方法和能力納入知識計算框架當中,為行業實現智能化轉型升級提供有力支撐。
隨著AI技術的高速發展,AI在行業中的應用逐步進入快車道。然而,AI解決方案落地成本高的問題阻礙了AI在各行業中的廣泛滲透。過往經驗表明,行業知識的有效利用能夠降低企業使用AI解決業務問題的成本。然而,大多數行業的核心知識分布相對雜亂,比如以文字、圖像等方式顯性地存在企業文檔、手冊中,或者以經驗、學識等方式隱性地存在于行業專家、資深員工的大腦中。知識呈現的方式不同,以及零散的分布,導致企業知識難以傳承、利用。
知識計算聚焦于對行業知識進行有效、充分的利用,將行業知識與AI技術有機結合,融會貫通雜亂的知識并使其參與計算,喚醒行業知識的生命力,發揮行業知識的力量。知識計算將行業長期積累的知識貫穿至解決行業問題的整個過程中,克服AI落地過程中所面臨的諸多問題,提升企業運行效率,比如在業務上,知識計算的應用一方面可以提升企業員工效率,有效釋放專家的精力,另一方面也能夠幫助企業降本增效,為企業高效生產、靈活組織、便捷獲取提供支持與保障;在管理上,知識計算能夠提供更加客觀、準確、科學的決策依據,實現超前預測,降低決策風險,提升企業管理水平。
知識參與計算,將讓知識在建模、求解和應用各階段都發揮重要作用。首先,在AI解決行業問題的過程中,基于專家經驗、行業研究成果構建的知識體系將指導業務場景數據的形成,以及AI模型的構建。其次,在求解過程,行業知識的引入將幫助AI模型更高效地求得更優解。最后在應用階段,行業知識一方面能夠提供決策依據,提升AI模型的可遷移性以及可解釋性,另一方面也可以識別模型運行過程中所產生的有效數據,迭代優化建模和求解。
知識計算通過結合行業知識與AI技術,實現數據與知識雙輪驅動,幫助AI進入企業核心生產系統,為行業智能化轉型升級帶來新的驅動力,也為行業創新帶來無限可能。
具體內容如下
本文件給出了知識圖譜的技術框架中知識圖譜供應方、知識圖譜集成方、知識圖譜用戶、知識圖 譜生態合作伙伴的主要活動、任務組成和質量一般性能等。本文件適用于知識圖譜及其應用系統的構建、應用、實施與維護。
本文件給出了知識圖譜的技術框架中知識圖譜供應方、知識圖譜集成方、知識圖譜用戶、知識圖譜生態合作伙伴的主要活動、任務組成和質量一般性能等。本文件適用于知識圖譜及其應用系統的構建、應用、實施與維護。
目的意義
當前,人工智能發展進入新階段,其迅速發展正在深刻改變人類社會生活、 改變世界,成為國際競爭的新焦點和經濟發展的新引擎。其中,如何從海量數據 中獲取有用的信息是人工智能關注的一個重要問題。知識圖譜技術提供了一種從 海量文本和圖像等數據中抽取結構化知識的手段,是搜索引擎、問答系統等應用 的核心技術。在國務院發布的《新一代人工智能發展規劃》中明確指出要發展“知 識計算引擎和知識服務技術”,重點突破知識加工、深度搜索和可視交互核心技術,實現對知識持續增量的自動獲取,具備概念識別、實體發現、屬性預測、知 識演化建模和關系挖掘能力,形成涵蓋數十億實體規模的多源、多學科和多數據 類型的跨媒體知識圖譜。知識圖譜技術提供了一種從海量文本和圖像等數據中抽 取結構化知識的手段,是搜索引擎、問答系統等應用的核心技術,并在金融證券、 生物醫療、交通、教育、農業、電信、電商、出版等行業已有非常豐富的應用場 景。但是,目前還缺少一套規范化的知識圖譜技術框架指導相關企業,特別是中 小型企業和創業公司有效開展技術研發,同時與其他行業的現有系統之間實現互 聯互通和信息融合。存在的問題如下: 1)知識圖譜相關核心術語定義缺失,各方使用術語混雜、內容不明確、體 系不統一;2)知識圖譜構成描述不統一、不明確,內容劃分混亂; 3)知識圖譜構建技術路徑及主要組成活動間關系不明確; 4)知識圖譜應用系統架構不統一,核心模塊定義缺失; 5)知識圖譜應用系統集成與部署路徑及主要組成活動間關系不明確。
本文件在編制過程中,通過參考大量已經發布的國內外標準,并廣泛聽取產 學研用相關單位的意見和建議,結合知識圖譜技術水平和應用現狀,對知識圖譜 供應方、知識圖譜集成方、知識圖譜用戶、知識圖譜生態合作伙伴等利益相關方 劃分進行明確,提出了各利益相關方的輸入輸出關系和主要活動構成等。
范圍和主要技術內容
本標準規定了知識圖譜的框架,包括知識圖譜的輸入要求,知識圖譜的建立過程,即知識圖譜的提取、存儲、挖掘與推斷、性能指標、知識圖譜的應用、相關領域、知識圖譜涉及的人工智能技術以及其他需要的數字基礎設施。 本標準的目標使用者包括:任意類型與規模的企業,包括應用或實施知識圖譜系統的公有和民營企業、政府主管部門、非營利組織等。 本標準的主要技術內容包括:知識圖譜架構、輸入要求、場景定義、性能指標、構建知識圖譜所需的人工智能技術和數字基礎設施等。
產業化情況、推廣應用論證和預期達到的經濟效果
知識圖譜作為機器認知智能實現的基礎之一,是人工智能的重要組成部分, 有助于實現自動化和智能化獲取、挖掘和應用知識,獲得了產業界和學術界的廣 泛關注。知識圖譜是以結構化的形式描述客觀世界中的概念、實體及其關系的大 型知識網絡,將信息表達成更接近人類認知的形式,提供了一種更好地組織、管 理和理解海量信息的能力。在政策部署、技術研發、標準研制、產業化推廣、前 沿應用場景試點等多方面因素的共同驅動下,知識圖譜逐漸實現在智慧金融、智 慧醫療、智慧能源、智能制造等眾多領域的落地應用和深度融合,同時在各行業 的數字化轉型過程中,跨領域、行業或產業的知識圖譜也逐漸獲得關注。在上述背景下,本標準對目前知識圖譜應用比較好的金融證券、生物醫療、 交通、教育、農業、電信、電商、出版等行業的應用過程特點、需求、主要問題 和未來趨勢進行了歸納總結。制定本標準有助于不同類型的企業基于規范化的實 施路徑進行知識圖譜應用的開發。同時,該標準還有利于給知識圖譜研發企業提 供數字化基礎設施支持的人員,如云平臺研發人員,信息安全工程師等理解知識 圖譜,從而提供更有效的技術支持。不同行業的應用企業和人員也可通過這一框 架提取出更多類型的知識,產生更多可能的應用場景。此外,本標準的研制對推 動企業進行知識驅動的數字化轉型升級具有重要意義,為進一步加快知識要素的 規劃化獲取、挖掘、應用與流通奠定了基礎。
知識圖譜概念模型
知識圖譜的概念模型可劃分為本體層和實例層,如圖1所示。其中,本體層由實體類型和其屬性、 實體類型間關系類型、規則等本體相關知識元素構成;實例層是對本體層的實例化,由實體類型對應 的實體及其屬性以及實體間關系等實體相關知識元素構成。 圖1示出的知識圖譜概念模式的主體是實體。實體是真實對象的抽象,實體類型是某類實體的進一 步抽象。基于不同層次的抽象,圖中的本體層和與實例層是相對的。構建某個知識領域的某個層次的 特定知識圖譜時,“實體”這個抽象稱呼將使用所關注的特定對象的具體名稱取代。圖中名為“屬性” 的兩個方框是分別針對本體層的所有實體類型和實例層的所有實體。本體層的“屬性”是指對應實體 類型的屬性,各個屬性是概括性描述;實體層的“屬性”是指對應實體的屬性,是某實體類型實例的 屬性的具體描述。同時,多個實體和關系的組合可以構成新的復雜實體,如:由時間、人物、地點等 要素構成的事件,由不同模塊構成的產品等。
知識圖譜技術框架
圖2示出從構建到使用知識圖譜涉及的各類技術活動的框架,簡稱技術框架。這些活動歸納為知識 圖譜的構建、基于知識圖譜的產品或服務的開發、知識圖譜的使用、以及面向知識圖譜開發和使用的 輔助支持四大類。
圖 2 知識圖譜技術框架
圖2示出的四大類知識圖譜相關活動簡述如下: a) 知識圖譜的構建:此組活動主要包括知識表示、知識建模、知識獲取等活動。其主要目標是構 建出所需的知識圖譜,同時開發出相應的基礎工具和/或服務。此組活動的主要依據是知識圖 譜應用需求和質量要求;往往需要行業知識、業務數據、輔助知識等予以支持。 b) 基于知識圖譜的產品或服務開發:此組活動主要包括需求分析、系統設計、知識圖譜集成等活 動。這些活動的執行基于上述a)描述的活動構建的知識圖譜和相應的知識圖譜應用需求等完成 知識圖譜應用系統的開發和集成,并提供配套的產品或服務。 c) 知識圖譜的使用:此組活動主要包括知識應用、知識維護、知識提供等活動。這些活動的執行 基于上述b)描述的活動產生的知識圖譜應用系統或服務。通過這些活動完成知識的使用和維護, 并對外提供必要的知識。 d) 知識圖譜開發和使用的支持:此組活動主要包括基礎設施提供、數據提供、安全保障、咨詢評 估等。它們對上述a)、b)和c)描述的活動的執行提供必要支持,例如:提供輔助數據或知識、 支撐技術或服務等。
上述四大類活動分別主要由以下四類參與者執行:
來自“ 知識圖譜標準化” //mp.weixin.qq.com/s/vLmnMIaL9-AeKW6eKeVrzw
自2017年國務院印發實施《新一代人工智能發展規劃》以來,人工智能產業被上升為國家戰略的高度,人工智能技術的基礎研究、產業轉化和傳統行業應用都取得了長足的進展。人工智能技術既有獨特的自身產業屬性,又具有明顯的對其它產業賦能、促進實體經濟發展的特征,因而應用范圍和影響力極為廣泛。它所涉及的知識產權問題也具有很強的時代性,尤其在近年實體經濟融合和產業數字化轉型的過程中,也產生了許多新的挑戰。
自2018年起,由AIIA學術與知識產權工作組組織,在上海交通大學蘇州人工智能研究院的牽頭下,聯合各會員單位、法學界、人工智能產業界、知識產權服務機構等在內的專業團隊,分年度組建了人工智能產業知識產權研究課題組,對不斷產生的新問題和挑戰進行研究,并將研究成果以白皮書的形式發表出來。
2018年課題組由11家單位組成,發布《2018人工智能產業知識產權與數據白皮書》(以下簡稱“2018白皮書”),從基本法律概況(保護端)、專利分析(創新端)和專利價值評估(運營端)三個具體角度,呈現了AI領域的知識產權現狀,并通過既有爭議和案例的展示,對數據相關權利的幾個主要問題進行了梳理。2018白皮書一經發布,就在社會各界引起了強烈反響。
在此基礎上,2019年更多單位主動參與,21家單位協同工作,擴大研究范圍,提供了更多詳實的數據,完成《人工智能產業知識產權白皮書2019》(以下簡稱“2019白皮書”),形成了更為規范和完整的框架,即:以人工智能的定義和分類標準為開篇引領,在共識的定義和標準下進行專利檢索以及基于檢索事實的專利分析,之后結合知識產權布局現狀對人工智能企事業單位面臨的知識產權實務問題進行了一定的分析和探討。
在2019年白皮書初步形成的“內涵定義-專利檢索和分析-知識產權實務”的結構框架下,2020年課題組進一步擴大規模,50余家單位參與進來,進行全面而細致的討論和事實補充,形成了《中國人工智能產業知識產權白皮書2020》(以下簡稱“2020白皮書”)。2020白皮書第一章和第二章從基礎層、感知認知層、行業應用層、綜合運用層4個層面22個子主題,展現當下人工智能全產業鏈的產業發展狀況和專利布局趨勢;第三章至第六章內容覆蓋人工智能知識產權管理工作的主要環節——知識產權創造、運用、保護、風險防控,成為人工智能領域知識產權相關實務工作的實操指南。
2021年,仍有50家左右單位參與白皮書的制作。針對白皮書篇幅龐大的問題,課題組對知識產權白皮書形式進行了革新:根據主題的不同,將白皮書總體劃分成三個分冊和一個案例選編,形成《中國人工智能產業知識產權白皮書2021》的《分冊一:產業專利分析白皮書》(簡稱“專利分析白皮書”)、《分冊二:數據治理白皮書》(簡稱“數據治理白皮書”)、《分冊三:知識產權管理白皮書》(簡稱“知識產權管理白皮書”)和《附錄:知識產權優秀案例選編》(簡稱“案例選編”),其中:
專利分析白皮書重點在于人工智能基礎層、感知認知層和行業應用層上的技術和專利分析,展現人工智能在產業鏈上的發展狀況和專利布局趨勢,除了提供權威統計數據和分析結論外,還延續了2019年、2020年白皮書的傳統,即專利檢索式、檢索策略、數據來源等信息全部公開,充分體現了編纂作者的奉獻精神與白皮書的公開透明。相較于往年,白皮書緊跟AI熱點技術,在行業應用層中新增了智能媒體、智慧城建兩個新型領域的專利分析;
數據治理白皮書聚焦于當前熱點的人工智能數據治理話題,介紹了全球人工智能數據相關政策、數據合規和安全風險及其應對措施,并提供了豐富的案例和解析,來力爭讓人工智能從業者從中獲得啟發,指導實踐工作,盡量避免觸犯法律紅線,這也是課題組在歷屆白皮書中首次對人工智能數據治理這一主題進行系統地研究和介紹;
知識產權管理白皮書側重于人工智能企事業單位對知識產權的高質量創造、保護、許可運營、開源、技術秘密等方面的管理,包括高價值專利培育、應對海外審查規則、標準必要專利及其許可、風險防控、專利商標技術秘密的保護、管理體系的高質量建設等方面的研究等,并提出相關的實務工作建議;
另外,本白皮書還附有工作組征集的來自小米、眼控科技、中國移動、商湯、快手、追一、同方威視等多個企業的、各具特色的知識產權優秀案例,涉及人工智能企業知識產權制度體系建設、專利布局、專利侵權風險管理、企業知識產權管理服務、技術和專利的協同融合、專利資本化等多個領域,供聯盟單位及社會各界同行進行學習和參考。
2021年將以年度白皮書合集的方式發布各個白皮書分冊和案例選編。我們希望2021年度白皮書合集有助于從業者和決策者清晰并精準了解人工智能領域的知識產權發展現狀和未來趨勢,以及其中的風險和應對措施,并以此制定專業合理的知識產權工作策略、管理體系與框架,共同推動人工智能領域技術的發展與運用。
歷經半個世紀的發展,人工智能正在社會經濟生活中發揮越來越重要的作用。認知智能是一種賦予機器模擬人類認知思考能力的技術,作為人工智能發展的高級階段,具有交互性、情境性與適應性等特點。認知智能“能理解、會思考”的能力,可以極大地將人類從重復體力勞動和簡單腦力勞動中解放出來。
當前,認知智能產業生態已初步形成,產業應用加快落地,技術研發持續突破,涌現出一批具有代表性的企業,儼然成為城市數字化浪潮中的關鍵驅動力。中國信息通信研究院華東分院聯合竹間智能科技(上海)有限公司就人工智能全球態勢、認知智能產業生態、技術融合、典型案例與未來趨勢等方面開展了產業技術分析,形成《2021 認知智能發展研究報告》。
本報告由五大篇章組成:第一篇章:全球態勢篇,對全球人工智能政策環境、發展現狀與發展熱點進行了詳細介紹;第二篇章:產業生態篇,闡述了認知智能發展歷程,并從行業生態、技術專利、學術研究和產業標準等方面展開具體分析;第三篇章:技術融合篇,闡述了當前認知智能領域情感計算、知識圖譜、圖像理解等六大行業技術領域的融合發展情況;第四篇章:典型案例篇,闡述了當前認知智能在金融、制造、教育等六大場景的應用落地總體情況與典型產品案例;第五篇章:未來趨勢篇,總結了認知智能發展面臨的問題挑戰,對未來發展做出展望。

近日,清華大學人工智能研究院、清華 - 中國工程院知識智能聯合研究中心聯合發布了《人工智能發展報告 2020》。不僅從人才現狀、技術趨勢和技術影響力等方面展示了過去十年人工智能的最新進展,而且匯總分析了全球主要國家人工智能戰略支持政策,以及各國人才儲備和專利申請情況。
過去十年里,人工智能從實驗室走向產業化生產,重塑傳統行業模式、引領未來的價值已經凸顯,并為全球經濟和社會活動做出了不容忽視的貢獻。當前全球人工智能浪潮洶涌,各國學者正努力實現人工智能從感知到認知的跨越,使之具有推理、可解釋性、認知性。未來十年,人工智能技術將實現從感知智能到認知智能的新突破。
近日,清華大學人工智能研究院、清華 - 中國工程院知識智能聯合研究中心聯合發布了《人工智能發展報告 2020》。
該報告基于清華大學唐杰教授團隊自主研發的 “科技情報大數據挖掘與服務平臺”(簡稱 AMiner)平臺,根據 2011-2020 年期間人工智能領域的頂級期刊和會議(共計 44 個)所收錄的全部論文和專利數據,全面展現了人工智能發展至今所獲得的重大科研進展、成果產出以及科研熱點。該報告不僅從人才現狀、技術趨勢和技術影響力等方面展示了過去十年人工智能的最新進展,而且匯總分析了全球主要國家人工智能戰略支持政策,以及各國人才儲備和專利申請情況。該報告匠心獨具,將知識圖譜與自然語言處理、可視化、文獻計量學等技術手段相結合,分析得到人工智能及其子領域的技術研究熱點和發展趨勢方向,高層次人才特征。此外,基于 Gartner 技術成熟度曲線,該報告還深入探討了人工智能的未來發展藍圖,提出理論、技術和應用方面的重大變化與挑戰,以及如何賦能其他產業發展等重要議題。
科技情報大數據挖掘與服務系統平臺 AMiner 評選出過去十 年十大 AI 研究熱點,分別為:深度神經網絡、特征抽取、圖像分 類、目標檢測、語義分割、表示學習、生成對抗網絡、語義網絡、 協同過濾和機器翻譯。
過去十年有 5 位人工智能領域學者獲得圖靈獎殊榮,分別是 在計算理論做出重要貢獻的 Leslie Valiant ,通過概率和因果推理 促進人工智能發展的 Judea Pearl,以及在深度神經網絡概念和工程 上做出重大突破的 Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun。
過去十年人工智能國際頂刊頂會的最佳論文獎項較多授予的 領域是計算理論、安全與隱私和機器學習。
人工智能不同子領域論文的最高引用量量級跨度很大。最高 引用量前十的論文研究主題以機器學習為首,其次是計算機視覺領 域研究,二者的論文引用率均達到 25 萬次以上。
中國在自然語言處理、芯片技術、機器學習、信息檢索與挖 掘等 10 多個 AI 子領域的科研產出水平都緊隨美國之后,居于世界前列;在多媒體與物聯網領域的論文產出量超過美國,居于全球第 一;而在人機交互、知識工程、機器人、計算機圖形、計算理論領 域,中國還需努力追趕。
全球范圍內,美國 AI 高層次學者的數量最多,占比 62.2%,是第二位國家(中國)AI 高層次學者數量的 6 倍以上。
清華大學是唯一入選全球人工智能領域高層次學者數量 TOP10 的中國機構。
國內人工智能領域高層次人才主要分布在京津冀、長三角和 珠三角地區。四成以上的 AI 高層次人才集聚在北京。
過去十年全球人工智能專利申請量 521264。中國專利申請 量為 389571,位居世界第一,占全球總量的 74.7%,是排名第二 的美國專利申請量的 8.2 倍。
人工智能未來重點發展的技術方向包括:強化學習、神經 形態硬件、知識圖譜、智能機器人、可解釋性 AI、數字倫理、知識 指導的自然語言處理等。
地址: //www.aminer.cn/research_report/6008402fe8a87f775ad224d8?download=false