隨著網絡信息和人工智能技術的快速發展,態勢感知(Situational Awareness,SA)正在由傳 統的以人為主轉向人機智能融合發展階段,構建人機融合的 SA 生態系統將成為未來戰場勝負的 重要決定因素。 未來的 SA 是智能化的人、機、環境在各方面深度交互形成的人機融合新型“計算- 算計”博弈系統。 本文面向人機智能融合 SA 生態系統的建設,探討了新型 SA 技術的概念、發展歷 程,提出人機智能融合 SA 體系架構和框架模型,構建了深度學習、強化學習、遷移學習人機融合技 術的智能 SA 典型應用模型。 最后,展望人機融合智慧技術面臨的挑戰,把握未來的發展趨勢,對 構建新型的 SA 生態系統提供參考借鑒。 隨著戰場感知獲取、信息傳輸處理和指揮控制 技術的快速發展,未來的戰爭形態和作戰樣式正在 經歷快速的變革。 戰爭形態已從機械化到信息化再 到智能化不斷演變,海[1] 、陸、空[2] 、天[3] 、電磁[4] 、 網絡[5]空間的六維戰爭環境將變得越來越龐大和 復雜,各種軍事威脅和對抗方式層出不窮。 傳統的 態勢感知技術過度依賴于作戰和指揮人員,作戰方 式單一、戰場信息感知不全、裝備智能化協同不足, 導致了人員很難連續快速地從大量的繁雜冗余、互 相關聯的感知信息中獲取感興趣的關鍵、有價值戰 場態勢信息,在短時間內做出多域聯動和準確反應, 形 成 協 同 認 知 并 做 出 快 速 合 理 的 判 斷 與 決 策 控制[6-8] 。 在未來信息化生存和作戰條件下,任何軍事作 戰行動都在六維空間中展開,需要相互配合形成綜 合效能優勢。 隨著各種先進智能化技術和模型算法 的快速興起、迭代進展以及在軍事領域中的廣泛應 用,將徹底改變指揮和作戰人員的認知水平、作戰思 維、作戰方式、作戰范圍,傳統的態勢感知(Situation? al Awareness,SA) 技術和能力建設正面臨巨大的 挑戰[9-16] 。
隨著大數據、云計算、物聯網等一系列新興技術的大量涌現,人工智能技術不斷 取得突破性進展。深度強化學習技術作為人工智能的最新成果之一,正被逐漸引入軍事領域 中,促使軍事領域走向信息化和智能化。在未來戰爭作戰模式及軍隊發展建設中,網絡化、 信息化、智能化和無人化形成重要特征已經成為不可逆轉的趨勢。因此,本文在回顧了深度 強化學習基本原理和主要算法的基礎上,對當前深度強化學習在武器裝備、網絡安全、無人 機編隊、智能決策與博弈等方面的應用現狀進行了系統的梳理與總結。最后,針對實際推進 深度強化學習技術在軍事領域應用落地所面臨的一系列問題和挑戰,提供了未來進一步研究 的思路。
近年來,隨著大數據、云計算、物聯網等 一系列新興技術的大量涌現,人工智能技術不 斷取得突破性進展。作為 21 世紀的頂尖技術之 一,人工智能給各個領域的發展都帶來了前所 未有的機遇和挑戰,軍事領域也不例外。2016 年 6 月,由國防大學舉辦的“戰爭復雜性與信息化戰爭模擬”學術研討會,對大數據時代的軍事 信息體系與發展戰略進行了重點研究[1],軍事 智能化已不再是一個陌生的概念,正在全面影 響著軍隊建設和未來戰爭形態[2]。從應用角度 來看,軍事智能化主要體現在五個層次[3]:以 無人機、無人車等仿生智能為主的單裝智能;以人機融合、集群、協同等概念為核心的協同 智能;以智能感知、決策、打擊、防御等多要 素作戰力量綜合運用的體系智能;以通信、網 絡、電子、輿情等專業領域管控的專項智能;以作戰體系基于數據、模型、算法獲取涌現效 應為目標的進化智能。人工智能技術為這些應 用的落地提供了堅實的基礎。深度學習(deep learning,DL)和強化學 習(reinforcement learning,RL)作為實現人工 智能的先進技術,分別在信息感知和認知決策 領域有著出色的表現[4]-[5]。深度強化學習(Deep Reinforcement Learning,DRL)[6]則是近幾年 提出的新興概念,結合了 DL 與 RL 的優勢, 是人工智能的最新成果之一,在機器人控制、 計算機視覺、自然語言處理、博弈論等領域都 取得了重要研究成果。在軍事領域中,針對作 戰任務規劃、智能軍事決策與智能博弈對抗等 問題的解決,DRL 也有著巨大的應用潛力,引 起了研究人員的廣泛關注。
目前,關于 DRL 的研究已經取得了較大進 展,有一些關于 DRL 的綜述性文獻陸續發表 [6]-[7],但它們更加偏向于對 DRL 算法的總結。除此之外,也有一些關于 DRL 在領域應用中的 綜述,如無人機[8]、通信與網絡[9]、智能制造[10] 等領域,然而關于 DRL 在軍事領域中的應用, 并沒有專門的綜述性文獻對其進行深入梳理和 總結。基于此,本文首先回顧了 DRL 的理論發 展歷程;然后對 DRL 的基本算法及改進算法進 行了歸納總結;最后對前人研究中 DRL 在軍事 領域武器裝備、網絡安全、無人機編隊、智能 決策與博弈等問題的應用現狀進行了系統性的 總結,并展望了其發展方向和前景。
在人工智能技術展現出洶涌澎湃發展趨勢的當下,建設以智能技術武裝的新型軍隊,打贏 以信息化智能化為特征的新型戰爭,成為當前世界主要軍事強國的優先發展目標。以“意志的屈 服”、“不戰而屈人之兵”為標志的“制智能權、制意識權”將成為未來軍事斗爭的最高級、最有效、最 具震懾力的軍事優勢。文中從軍事作戰特點和人工智能的優勢入手,分析軍事領域對人工智能的 需求。針對感知、指揮、打擊、互聯的作戰鏈條,提出人工智能技術在軍事領域的應用方向,探索如 何通過人工智能在軍事領域的應用“有效塑造態勢、管控危機、遏制戰爭、打贏戰爭”。
引言
隨著深度學習、機器視覺等核心技術的大發展 和大突破,人工智能迎來新一輪的發展熱潮,并邁入 “黃金時期”。如今,人工智能技術已經深入交通、 服務、醫療健康、教育、就業、公共安全與防護等民用 領域[1] ,代替“懶人”完成部分體力和腦力工作。當前,智能技術正不斷顛覆信息化時代下的軍 事理論、作戰規則和作戰方法,有力推進新軍事體制變革,逐漸改變未來戰爭的形態[2] 。美軍將人工智 能視為“改變游戲規則”的顛覆性技術,并已經在無 人作戰平臺、電子戰、輔助指揮決策等技術領域中對 人工智能技術進行嘗試和應用。 加快軍事智能化發展,提高基于網絡信息體系 的聯合作戰能力、全域作戰能力 [3] 。智能技術對我 們來說,既有挑戰也存在機遇。面臨新形勢下的威 脅態勢,面向新時期軍事作戰需求,我們要找準定 位、明確目標、奮勇攻關,有效應對內外環境變化帶 來的風險挑戰,努力抓住科技進步創造的發展機遇, 實現“彎道超車”。
軍事領域對人工智能的需求
2.1 軍事作戰特點
按照克勞塞維茨《戰爭論》的定義,戰爭無非是 擴大了的搏斗,是迫使敵人服從我們意志的暴力行 為[26] 。千百年來戰爭形態和手段及樣式雖歷經變 遷,但戰爭本質核心卻始終如一,這就是消滅敵人, 保存自己。軍事作戰特點主要包括以下三點。 1)非友好、非合作、不可控。戰爭的成敗可能 決定了對抗雙方的生死存亡,使得對抗雙方盡其所 能地欺騙對方、盡可能地隱瞞自己的真實意圖、盡可 能地利用對方所有可能漏洞,從而使得對抗雙方都 無法全面有效地掌握戰爭的真實狀態,導致戰場局 勢不可控。正如丘吉爾所說:“一旦開了第一槍或 引爆第一顆炸彈,政治領導人就失去了對戰爭的掌 控權,戰爭本身成為了主導者。” 2)不確定性大。作戰是敵我雙方持續對抗的 過程,然而,復雜戰場環境、指揮決策、對抗手段等多 種不確定性因素必然會產生作戰空間、作戰力量、作 戰規則、作戰流程等要素的不確定性。由此,要求指 揮員要善于未雨綢繆,周密制定計劃,創造有利于我 而不利于敵的戰機,能夠基于瞬息萬變的戰場情報 數據及時調整作戰行動。 3)作戰規律難以掌握。一方面,由于“戰爭迷 霧”的存在,在戰場環境下對作戰數據的獲取往往 是不完整的、不完備的、甚至是虛假的,使得軍事裝 備自身難以自己學習訓練,從而無法掌握作戰客觀 規律繼而變成軍隊可用裝備。另一方面,隨著各種 偵察探測手段引入現代戰爭中,各種信息充斥戰場, 數據的過剩、超載、盈余、膨脹使得很多有價值的信 息淹沒在數據海洋中,導致不可靠、不相關、模棱兩 可和互相矛盾的信息呈指數級的增加,進而增加判 斷的復雜性。伴隨一批新興技術理論的不斷突破和技術應用 范圍的持續擴大,多種新質武器的相繼問世,未來戰 爭將會是在陸、海、空、天、電、網上進行的全維戰爭, 是戰場信息處理能力、輔助決策能力、快速打擊能力 的比拼。未來戰爭空間多維、力量多元、樣式多樣、 節奏加快等突出趨勢,對戰場信息的接收與認知、對 戰場態勢的評估與預測、對作戰行動的快速應變等 能力要求將遠遠超出作戰人員的思維能力,必然需 要依靠具有超強計算、學習和理解能力的機器進行 威脅研判和作戰輔助決策。
2.2 人工智能的優勢
人工智能自誕生之日起即被賦予了一項崇高使 命,即代替人類完成繁重、危險和重復性工作。面對 這些工作,人工智能具有速度更快、精度更高以及抗 疲勞性更強等顯著優勢。隨著人工智能的發展,其 對軍事調度、戰場行動認知與決策的能力將逐漸超 越人類。 1)人工智能善于解決復雜信息認知問題。人 工智能技術能夠打破現有作戰規則,使得機器像人一樣對復雜問題進行認知,積累經驗,解決問題。通 過對戰場大數據的有效開發,提高指揮員對多個戰 場空間情報的發現和深度認知能力,利用數據挖掘 分析方法從海量多源異構信息中得到高價值軍事情 報信息,大幅度提高情報分析處理能力,從而能夠把 握戰場發展動向,預估敵我態勢變化,破除“戰場迷 霧”。 2)人工智能善于解決復雜狀態空間問題。人 工智能技術在繼承機器優勢的同時,具備針對復雜 任務進行高效率的信息搜索和優化處理能力,是解 決不確定性和復雜性的有力武器。圍棋在走法上有 10 170 種可能,比全宇宙的原子數 10 80 都要多,然而 相比于圍棋,戰爭要更加的復雜多變。戰爭具有更 強的戰場開放性、攻防隱蔽性、作戰多維化等特點。如今,人工智能已經攻破圍棋的堡壘,正在向復雜度 更高的“星際爭霸”游戲發起挑戰。 3)人工智能善于自我學習實現能力升級。人 工智能技術可以通過系統后臺進行無監督學習和機 器博弈,從而達到系統性能的自我提升和優化的目 的。以圍棋為例,AlphaGo 只花了幾個月的時間,學 習人類對弈的三千萬棋局,在通過海量的歷史棋譜 學習參悟人類棋藝的基礎之上,進行自我訓練,擊敗 了人類頂尖棋手。而 AlphaGo Zero 與 AlphaGo 有著 本質的不同,它不需要通過學習歷史棋譜從而掌握 人類的先驗知識,而僅靠了解圍棋對弈的基本規則, 通過自我博弈和自我進化,迅速提升棋藝,實現對 AlphaGo 的百戰百勝[27] 。可以預見,應用人工智能技術,能夠在很大程度 上提升作戰指揮活動的觀察、判斷、決策、行動等關 鍵過程的作戰能力。人工智能技術將成為軍事變革 的重要推手,必將催生新的戰爭樣式,推動戰爭形態 的加速轉變。
3 人工智能軍事應用方向
3.1 軍事智能技術體系框架
未來戰爭,從能力上我們希望具備更加透徹的 感知、更加高效的指揮、更加精確的打擊和更加自由 的互聯。由此帶來的眾多跨作戰空間裝備之間數據 互聯、任務協同及海量戰場異構數據實時處理等問 題必須由更加深入的智能才能得到有效的解決,繼 而對感知、指揮、打擊、互聯等作戰能力產生催化劑 的作用,形成一體化智能作戰鏈條,顛覆性提升體系 作戰效能。軍事智能技術體系框架如圖 1 所示,包括賦能 體系、軍事智能系統、作戰體系等三個方面。
圖 1 軍事智能技術體系框架 賦能體系:以機器學習、人機交互、計算機視覺 等人工智能算法為依托,形成面向軍事應用的人工 智能優化算法引擎,實現人工智能技術在軍事領域 的賦能。軍事智能系統:應用賦能技術,面向軍事作戰需 求,依托作為人工智能算法“倍增器” 的基礎支撐, 實現感知、指揮、打擊、互聯形成的 OODA 作戰鏈路 的智能化。作戰體系:在空中作戰、反導反臨作戰、太空對 抗、陸海作戰等行動中,作戰部隊利用軍事智能系 統,與人協同,提升作戰效能,形成對敵方的非對稱 優勢。
3.2 更加透徹的感知,實現信息優勢
在探測感知領域,主要可在目標信息獲取、戰場 數據分析等方面應用自然語言處理、元學習、隨機森 林等職能技術,實現信息優勢,如圖 2 所示。
1)應用于目標信息獲取。 綜合利用微波輻射、 可見光、多光譜、紅外、聲學、磁力等多種探測手段, 實現對戰場目標信息的高效準確采集和獲取;應用 多譜段-多體制協同探測、多源數據智能融合等技 術,提高對目標的多維特征提取,精確解算目標位 置,實現對目標屬性、類型、國別、身份、敵我等快速 準確識別,實現目標信息的所見即所得[28] 。美國防 部高級研究計劃局(DARPA) 2010 年啟動了“心靈 之眼”項目[29] ,旨在研發視覺智能系統,通過無人作 戰平臺觀察目標作戰信息,并為作戰人員及時提供 應對手段。該項目主要通過運用智能圖像處理和機 器視覺等技術,對視頻信息中物體的動作和行為進行辨別和分析,通過對物體動態行為信息的準確感 知,以實現復雜作戰環境中對潛在威脅進行識別和 認知。無獨有偶,美國防部于 2017 年成立了“算法 戰跨職能小組” [30] ,旨在解決美軍在中東地區對 I? SIS 進行反恐作戰過程中遇到的海量情報分析困難 問題。該項目通過運用深度學習、計算機視覺等技 術,利用數臺計算機代替數以千計的情報分析人員, 提高情報提取的效率和精度,以支撐更及時有效的 決策[31] 。
2)應用于戰場數據分析。 綜合利用大數據、機 器學習、數據挖掘等技術,尋找在復雜作戰過程中產 生的海量數據之間的內在關聯關系,快速高效分析 戰場作戰行動和態勢變化,將偵測到的戰斗力量分 布與活動和作戰環境、敵作戰意圖及機動性有機聯 系起來,分析并推理事件發生的原因,得到敵方兵力 結構和使用特點的估計,通過已知事件推測將來可 能發生的事件[32] 。DARPA 于 2011 年設立“洞悉” 項目[33] ,旨在研發一套情報分析系統,將操作員的 知識和推理能力融入到系統當中,從而提高快速應 對網絡威脅和非常規戰爭的能力。該項目主要運用 異構信息關聯、多源智能融合等技術,通過分析和綜 合多源傳感器探測信息和不同資源情報數據,輔助 增強情報分析人員的信息處理與共享能力。DAR? PA 于 2019 年設立了“以知識為導向的人工智能推 理模式”項目[34] ,旨在研發一套半自動化的人工智 能推理系統,將通過語言和常識推理得到的知識庫 應用于復雜現實事件的理解中,解決多源信息阻礙事 件理解的問題。該項目運用知識圖譜等技術,通過對 復雜事件內部組成元素和時間線進行推理和預測,快 速識別不同事件之間的關聯性,提升事件理解能力。
3. 3 更加高效的指揮,實現決策優勢
在指揮控制領域,主要可在作戰方案推演、遠程 指揮控制等方面應用平行仿真推演、腦機融合等智 能技術,實現決策優勢,如圖 3 所示。 1)應用于作戰方案推演。通過深度學習技術, 訓練智能體對戰場交戰規則、作戰指揮決策、事件認 知推理等知識進行學習和模擬,提升智能體認知的 智能性、實時性與科學性。在戰場態勢實時共享的 基礎上,對戰場數據進行智能化處理,通過平行仿真 推演作戰方案,形成對對手下一步可能的軍事行動 和戰場演進趨勢的智能預測,自動匹配最佳行動策 略[35] 。2007 年,DARPA 安排了名為“深綠”的系統 研發項目[36] ,旨在建造一套人工智能作戰輔助決策 系統。該系統利用平行仿真、動態博弈等技術,基于 戰場實時數據,可動態模擬戰場敵我雙方作戰行動, 并預測戰場態勢走向,幫助指揮官提前思考,縮短決 策時間。DARPA 于 2018 年啟動了 “ 指南針” 項 目[37] ,該項目主要通過利用大數據分析、博弈對抗 等方法對戰場數據進行分析,構建敵方作戰行動與 路徑模型,幫助作戰人員確定敵方真實作戰意圖,制 定并選取我方最有效的行動方案。
2)應用于智能化遠程指揮控制。應用“元宇 宙”概念,利用人工智能技術構建與真實戰場平行 的虛擬作戰空間,采用語音識別、手勢識別、腦機接 口等智能人機交互技術,使指揮員、作戰人員有沉浸 式的體驗,實現人與機器之間,指揮單元、精確打擊 武器與信息應用系統之間的無障礙溝通[38] 。2021 年 8 月,在美國海軍年度最大規模活動“海-空-天 博覽會”上[39] ,海軍信息戰系統司令部首次驗證了 “周邊環境智能談話接口”項目開發的能力,展示了 智能化、自然交互技術如何實現未來信息戰。該項 目旨在為海軍指揮控制引入下一代數字助手,通過 使用人工智能和機器學習來理解說話的人是誰、談 話的內容是什么,談話可被決策者當作一種獲取所 需信息的直接途徑,幫助決策者獲得及時的、合成后 的資訊。
3. 4 更加精確的打擊,實現力量優勢
在武器打擊領域,主要可在單武器平臺自主作 戰、作戰編組分布式殺傷等方面應用計算機視覺、多 智能體協同等智能技術, 實現力量優勢, 如圖 4 所示。
1)應用于單武器平臺自主作戰。 以人工智能 技術為核心,綜合多種嵌入人工智能算法的武器裝 備平臺為手段,在多重維度實時精確打擊,實現武器 的單體智能[40] 。美國戰斧導彈在攻擊目標過程中, 如果目標或任務發生變化,便根據指令在戰區上空 盤旋,然后自主搜索和重新選擇、確定合適的攻擊目 標。美國研制的“黃蜂” 導彈,裝有一套先進的探 測、控制設備,可實現目標偽裝設施的識別以及多任 務目標的智能化自主分配,從而達到最大的效費比 和命中精度。
2)應用于作戰編組分布式殺傷。 借鑒自然界 生物群體行為的智能集群與協同技術,通過去中心 化提高了系統抗毀傷性以及任務成功率;通過簡單 作戰單元間的信息高效交互提升系統的整體效應和 群體智能水平,從而最終實現復雜戰場條件下任務 的自主分解、作戰單元的自主協同、作戰方案的自主 規劃和作戰對象的自主打擊[41] 。DARPA 于 2014 年設立了“拒止環境中的協同作戰” 項目[42] ,旨在 研發一套自主協同作戰系統,實現一名操作人員對 多架無人機進行指揮。該項目通過先進算法和模塊 化軟件架構,解決無人機集群在復雜干擾條件下無 法完成作戰任務的問題,提升無人機集群完成任務 的能力。DARPA 于 2015 年設立了 “ 小精靈” 項 目[43] ,旨在建立一套可回收重復使用的無人機作戰 集群,實現一種穩定可靠、經濟實惠的作戰方式。該 項目通過運用一體化設計、自主協同規劃等技術,完 成戰前對戰場區域的大規模快速偵查和欺騙干擾等 作戰任務。
3. 5 更加自由的互聯,實現網絡優勢
在戰場互聯領域,主要可在戰場網絡韌性通聯、 網絡攻防等方面應用認知計算、博弈對抗等智能技 術,實現網絡優勢,如圖 5 所示。1)應用于戰場網絡韌性通聯。利用人工智能 技術敏捷感知網絡環境、靈活加載通信波形、自主管 控網絡資源,提升戰場通信網絡體系韌性。近年來, 為了不斷適應新的軍事戰略和作戰形勢,美軍一直 在探索如何在反介入/ 區域拒止作戰環境中確保靈 活、敏捷、彈性的有保障通信系統。美國空軍實驗室 與加拿大國防研發中心通信研發中心開展了“挑戰 與對抗性環境中有保障通信”項目研究[44] ,主要針 對未來作戰人員可能面臨的惡劣通信條件,特別是 在偏遠與服務欠缺條件下以及動態與對抗環境中, 通過開發新的概念與技術,實現靈活與自適應頻譜 接入,保證魯棒而可靠的通信能力。2017 年,DAR? PA 啟動了“無線電頻譜機器學習系統”項目[45] ,通 過人工智能理解無線電信號,改善推廣頻譜共享技 術,增強無線通信能力。2)應用于網絡攻防。以人工智能為武器,使惡 意攻擊行為可以自我學習,并根據目標防御體系的 差異自適應地“隨機應變”,通過群招潛在的漏洞達 到攻擊的目的。同時,采用人工智能技術可以改善 網絡安全現狀,能更快地識別已知或未知威脅并及 時響應。美國斯坦福大學和 Infinite 初創公司于 2017 年聯合推出了一型自主網絡攻擊系統,該系統 圖 5 網絡互聯+AI 技術的應用 的核心處理單元是一種定制的人工智能處理芯 片[46] 。該新型網絡攻擊系統能夠在特定的網絡中 運行,完成信息的自主采集、學習和攻擊程序的自主 編寫,并且可以對攻擊程序進行自適應動態調整,具 備較強的隱蔽性和破壞性。2018 年 DARPA 啟動了 “利用自主系統對抗網絡對手計劃” 項目[47] ,旨在 建立安全可靠的網絡代理,實現對僵尸網絡的有效
遏制。該項目通過開發定量框架和算法,完成對僵 尸網絡的精確識別、推斷存在的漏洞以及生成軟件 補丁,減少對系統的不良影響。
3. 6 更加堅實的支撐,實現賦能優勢
1)具有智慧的人工智能系統為軍事智能化提 供“新動能”。傳統機器學習方法需要在系統部署 前,利用數據集對系統進行訓練。一旦完成訓練智 能體所應對的場景和問題將被固化從而無法應對新 場景,而再次訓練效率低下且工作量大。在執行軍 事作戰行動時,需要人工智能系統能夠在任務中自 我學習和改進,將先前的技能和知識應用于新的情 況,以應對各類作戰場景[42] 。2017 年,DARPA 安 排了名為“終身學習機器” 的項目[48] ,通過利用目 標驅動感知進行持續學習,形成對新情景的自主適 應,改變當前智能體無法應對未訓練場景的情況。2)低功耗、強算力、易擴展的智能芯片為軍事 智能化提供“新基建”。作為人工智能技術的重要 物理基礎,當前主流人工智能芯片存在功耗大、內存 帶寬不足、框架固化等瓶頸。為更好支撐人工智能 的軍事領域應用,下一代人工智能芯片應具備低功 耗、強算力、易擴展等特點。2020 年,英偉達公布了 其用于超級計算任務的人工智能芯片[49] ,算力提升 20 倍以上。2020 年 10 月,英特爾宣布獲批一項與 美國軍方合作項目的第二階段合同[49] ,旨在幫助美 國軍方在國內生產更先進的人工智能芯片原型,這 種封裝技術能夠將來自不同供應商的“小芯片” 集 成到一個封裝中,從而實現把更多功能整合進一個 更小的成品中,同時降低其功耗.
近年來,以人工智能、區塊鏈、大數據、云計算和物聯網等為代表的新一代信息技術高速發展,人類社會正逐步從傳統的信息化社會向智能化社會發展,人工智能技術創新和行業應用呈現出新的發展趨勢。黨的十九大報告提出,“加快發展先進制造業,推動互聯網、大數據、人工智能和實體經濟深度融合,在中高端消費、創新引領、綠色低碳、共享經濟、現代供應鏈、人力資本服務等領域培育新增長點、形成新動能”。目前,人工智能已實現從實驗技術向通用技術的轉變,“云計算+大數據+深度學習”成為人工智能發展的主要技術路線。人工智能基礎技術和通用技術特征越來越明顯,技術應用也從服務業向制造業、農業拓展,對浙江傳統制造業的影響日漸突顯。浙江必須緊緊抓住人工智能與制造業融合發展機遇,認清智能制造發展階段,解決發展中的瓶頸問題,加快推動人工智能與傳統制造業的深度融合,為制造強國、質量強省持續注入發展動能。過去幾年中,我們國家先后發布了《中國制造 2025》、《國務院關于深化制造業與互聯網融合發展的指導意見》、《智能制造發展規劃(2016-2020 年)》、《新一代人工智能發展規劃》等政策規劃,通過加速人工智能技術發展助推傳統制造業轉型升級,加快建設制造強國。
根據埃森哲發布的研究報告,到 2035 年,人工智能將使中國勞動生產率提高 27%,經濟增長率比預期高出 1.6%。也就是說,當年傳統產業模式預期年增長率為 6.3%,而由于人工智能的助力,實際增長水平將達到接近8.0%,人工智能為該年經濟增加值(GVA)額外貢獻超過 7.1 萬億美元。圖1.1 為埃森哲對2035年人工智能與中國各行業的融合與影響程度的預測,制造業將成為智能化程度最高的行業。 浙江一直是制造大省,傳統制造業生產總值占 GDP 的40%左右。制造業作為浙江的支柱產業,在促進增收、穩定稅源、保證就業等方面地位無可替代。不斷推進傳統制造業智能化進程,實現從制造大省到制造強省的轉變,對于浙江經濟社會發展具有重要的作用。2015 年 9 月,“兩化”深度融合國家示范區建設領導小組會議明確提出,“浙江制造”的主攻方向是智能制造。浙江省借建設信息化和工業化深度融合國家示范區之機,大力推進智能制造的發展,以“互聯網+制造業”為新手段,加快釋放發展新動能。 2015 年 10 月發布的《浙江省加快推進智能制造發展行動方案(2015-2017)》要求浙江省將以智能制造創新工程、智能制造模式推廣工程、智能制造試點示范工程、智能制造標準支撐工程等四大工程為抓手,實現推進智能產品和裝備的發展、推進制造業智能化改造、開展智能制造試點示范、完善智能制造支撐體系的四大任務。2018 年 2 月發布的《浙江省智能制造行動計劃(2018-2020 年)》啟動了智能制造關鍵技術裝備研發推廣工程、重點領域智能制造試點示范工程、智能制造標準體系引領工程、智能制造發展載體培育工程、智能制造應用模式和機制創新工程、智能制造融合推進工程、智能制造協同發展工程等七大行動工程。根據《浙江省“機器人+”行動計劃》,2020 年浙江省內在役工業機器人數量將達到 10 萬臺,制造業機器人密度將會達到 120 臺/萬人以上,居全國前列。
當前,浙江正聚力數字經濟“一號工程”,堅定不移建設制造強省。研究人工智能與傳統制造業融合發展的現狀、模式、問題、對策,價值和意義非常明顯
自動駕駛車輛的本質是輪式移動機器人,是一個集模式識別、環境感知、規劃決策和智能控制等功能于一體的綜合系統。人工智能和機器學習領域的進步極大推動了自動駕駛技術的發展。當前主流的機器學習方法分為:監督學習、非監督學習和強化學習3種。強化學習方法更適用于復雜交通場景下自動駕駛系統決策和控制的智能處理,有利于提高自動駕駛的舒適性和安全性。深度學習和強化學習相結合產生的深度強化學習方法成為機器學習領域中的熱門研究方向。首先對自動駕駛技術、強化學習方法以及自動駕駛控制架構進行簡要介紹,并闡述了強化學習方法的基本原理和研究現狀。隨后重點闡述了強化學習方法在自動駕駛控制領域的研究歷史和現狀,并結合北京聯合大學智能車研究團隊的研究和測試工作介紹了典型的基于強化學習的自動駕駛控制技術應用,討論了深度強化學習的潛力。最后提出了強化學習方法在自動駕駛控制領域研究和應用時遇到的困難和挑戰,包括真實環境下自動駕駛安全性、多智能體強化學習和符合人類駕駛特性的獎勵函數設計等。研究有助于深入了解強化學習方法在自動駕駛控制方面的優勢和局限性,在應用中也可作為自動駕駛控制系統的設計參考。
//www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20210103&flag=1
隨著大數據對全球生產、流通、分配、消費等國計民生領域產生重要影響, 事理作為認知智能 重要概念, 不僅幫助人們發現大數據所蘊含的國計民生的線索與發展規律, 而且幫助人們更好認知人 機物三元世界未來發展趨勢. 考慮到人機物事理動態演化是工業大數據有別于其他行業大數據處理 的本質區別, 本文從人機物事理動態演化特性智能認知著手, 結合傳統知識圖譜在互聯網領域取得的 成功經驗, 提出了面向大數據領域的事理認知圖譜構建與推斷分析. 首先論述了事理認知圖譜對推動 認知智能研究發展的貢獻, 剖析了它與知識圖譜異同之處, 深度理解人類社會發展變化規律的重要價 值. 其次闡述了事理抽取與泛化、多模態聯合網絡化合成表示、進化認知和推斷分析等關鍵技術研究 最新進展以及面臨的挑戰. 最后, 結合我們課題組在事理認知圖譜的研究進展情況, 歸納總結了事理 認知圖譜在預防網絡電話詐騙和安全生產管控等領域最新應用效果. 本文結尾總結和展望事理認知圖 譜的未來研究方向和發展前景.