來源:中國信息通信研究院
人形機器人作為未來產業的重要賽道,是科技自立自強的標志型成果,是人工智能、機械工程、電子工程等領域融合創新的典范,也是實現新質生產力的最佳手段之一。人形機器人憑借其類人的感知交互能力、肢體結構和運動方式,能夠快速融入為人類設計的各種環境,未來有望在簡單重復勞動和危險場景中替代人類,在復雜技能場景中輔助人類,在商業和家庭場景中服務人類。可以預見,未來人形機器人的廣泛應用將深刻改變社會形態和人們的生產生活方式,已成為全球科技領域的發展熱點。業界普遍認為,人形機器人未來有望成為繼個人電腦、智能手機、新能源汽車后的新終端,形成新的萬億級市場。 2024年12月26日,在2025中國信通院深度觀察報告會成果發布會上,中國信息通信研究院(簡稱“中國信通院”)泰爾系統實驗室發布了《人形機器人產業發展研究報告》。中國信通院泰爾系統實驗室王堯從概念內涵、技術演進、產業現狀、未來展望等方面對報告進行了解讀。
//www.caict.ac.cn/kxyj/qwfb/ztbg/202412/t20241227_649391.htm
本報告從人形機器人內涵出發,深入分析人形機器人的核心技術及重點產品的發展現狀和演進路徑、產業布局的重點方向、應用需求和市場預期等。同時,聚焦生產制造、社會服務、特種作業等方向,梳理典型應用場景,明確不同場景對人形機器人的共性需求和差異化需求。最后,研究提出了對未來人形機器人產業發展的路徑考慮,助力推動我國人形機器人高質量發展。
一、人形機器人的內涵和發展歷程 (一)人形機器人的內涵 人形機器人指模仿人類外觀和行為,具備較高智能化水平的機器人。與傳統工業機器人、服務機器人相比,最大的特點是其與人類相似的“軀體”結構、運動方式和感知方式,并在人工智能大模型的賦能下,從體能、技能、智能三方面,實現對人的模仿。人形機器人具有擬人智能、類人形態和廣泛適用三個特點: 一是擬人智能。一方面,人形機器人可以通過人工智能大模型技術的賦能,實現擬人化的感知、決策、控制能力;另一方面,人形機器人還可以選擇通過云“大腦”和智能化聯網的方式,突破“一個軀體、一個大腦”的限制,實現算力和智能的飛躍。 二是類人形態。人的形態是生物進化自然選擇的結果,目前社會中的所有城市基礎設施、生產生活的工具產品均為人類形態設計。人形機器人通過對人類形態的高度模擬,能快速融入到人類設計的各類環境中執行復雜任務,具有更強的通用性和適應性。 三是廣泛適用。人形機器人具備比人類更強的耐受性和適應性,能夠在非常復雜化環境中長期以低成本運行,有效解決未來勞動力短缺問題,將在工業生產、民生服務、特種作業等領域廣泛應用,甚至在部分領域發揮更大優勢。 對“人形”追求的本質是機器人通用性的問題,核心點是當前是否有必要通過外形的擬人設計賦予機器人等同人類的“通用能力”,是“一機多用”還是“專機專用”。從現階段的發展情況看,人形機器人主要是在工業場景試水,相比后期服務應用場景中的復雜工作,工業場景任務相對重復和單一,人形需求并不強烈。隨著“大腦”的逐步完善,通用人形機器人將會是終極形態,但在此之前不同進化階段及分支是必要條件,主體人形+定制化組件的類人形可能是商業化初步完成前的最優解。所以,從長遠看,“人形”是機器人的理想形態;從現狀看,完全的“人形”不是現階段的唯一選擇。
本藍皮書全面剖析了人形機器人產業從技術研發到商業化落地的關鍵路徑。2025年被視為人形機器人邁向量產的元年,其核心技術進步主要集中在人工智能算法優化、材料創新和人機交互能力提升等領域。報告指出,國際領先企業如特斯拉、波士頓動力等已在硬件平臺與商業模式上取得顯著進展,中國企業則以華為、京東等為代表,在智能制造和應用場景上逐步追趕。
報告特別分析了商業化的核心挑戰,包括高昂的制造成本、標準體系缺乏及應用場景有限等問題。為推動行業持續發展,藍皮書提出了多項建議,如建立行業標準、加強跨領域協作以及拓展多元化應用場景。未來,人形機器人將在智慧物流、醫療護理及教育等領域釋放更大的商業潛力。
2025年人形機器人將迎來量產元年,產業鏈發展前景廣闊 人形機器人是AI應用落地的主要載體。大模型問世是人工智能發展的分水嶺,以人工智能大模型為代表的人工智能第三發展階段未來會有一段較長的發展紅利期,將成為新一輪科技革命和產業變革的重要驅動力量。人形機器人作為人工智能落地物理世界的優質載體,將受益于人工智能的快速發展,其擁有感知、思考、決策等能力不再遙不可及。人形機器人集成人工智能、高端制造、新材料等先進技術,有望成為繼計算機、智能手機、新能源汽車后的顛覆性產品。 2025年人形機器人將進入量產元年,優秀企業有望逐步顯現。2025年,特斯拉optimus有望進入小批量量產階段,將有數千臺人形機器人落地在內部工廠運行,2026年有望對外銷售。英偉達在GTC2024大會推出人形機器人通用基礎模型ProjectGR00T。2024年11月,華為(深圳)全球具身智能產業創新中心宣布正式運營。Figure、1X、宇樹、智元、開普勒、優必選等國內外機器人領先企業已經先后開啟人形機器人的量產。 人形機器人產業鏈空間廣闊,未來或達到萬億市場空間。馬斯克在2024年股東大會上表示,到2040年人形機器人未來數量將超過人類,可以替代人類完成無聊、危險和人類不愿意做的工作,成為工業主力,預計有望達到100億臺。我們預計當人形機器人年產量達到1000萬臺時,售價2萬美元,對應市場空間可以達到2000億美元,擁有超萬億人民幣的市場空間。高工機器人產業研究所(GGII)預測,2024年全球人形機器人市場規模為10.17億美元,到2030年全球人形機器人市場規模將達到151億美元,2024-2030年CAGR將超過56%,全球人形機器人銷量將從1.19萬臺增長至60.57萬臺。
來源:中國信息通信研究院、北京人形機器人創新中心有限公司 具身智能是人工智能(AI)與其他學科交叉融合發展的智能新范式,從字面可理解為“具身+智能”,通過賦予AI“身體”,能夠與現實產生交互,讓AI從僅存于數字世界的軟件算法走向真實的物理世界,并在物理世界也能呈現模擬人類甚至超越人類的智能水平。中國信息通信研究院、北京人形機器人創新中心有限公司聯合發布了《具身智能發展報告(2024年)》報告。
報告致力于厘清具身智能的概念內涵、演進歷程、技術體系,通過梳理當前具身智能技術發展現狀,研判分析具身智能應用潛力與帶來的影響,并總結當前產業應用困難與挑戰,展望思維智能和行動智能有機融合的無限可能。
報告核心觀點
1. 具身智能:依靠物理實體通過與環境交互來實現智能增長的智能系統
當前,針對具身智能各家觀點百花齊放,但都明確了“智能”的核心地位。因此,本報告從AI視角切入,認為具身智能是指通過機器人等物理實體與環境交互,能進行環境感知、信息認知、自主決策和采取行動,并能夠從經驗反饋中實現智能增長和行動自適應的智能系統。
2. 具身智能與離身智能相互補充、協作發展共同促進了對智能的理解、模擬與擴展——具身智能時代有望來臨
結合人工智能的演進歷程,具身智能的發展大致可以分為三個階段,即:早期萌芽階段(1950s-1990s),在對智能的激烈爭論和分立研究中,形成AI三大學派,尚未形成成熟的智能理論;技術積累階段(1990s-2022),隨著智能理論的完善、底層數學理論的深耕,AI三大學派從各自突破,逐步走向取長補短的綜合性研究,為具身智能發展奠定理論和算法基礎;技術突破階段(2022年至今),以ChatGPT為代表大模型的通用知識和智能涌現能力為機器人實現智能感知、自主決策乃至擬人化交互方面帶來巨大潛力。當前人們的關注點轉向如何將AI應用于物理世界,并期望通過AI的“具身化”找到新的智能增長點。
3. 具身智能技術尚處于多條路徑探索發展階段,可以類比于自然語言處理領域的“BERT”發展時期
具身智能技術體系可分為“感知—決策—行動—反饋”四個模塊形成一個閉環,在與環境的不斷交互中,實現對環境的重構映射、自主決策和自適應行動,并從經驗反饋中不斷學習進化。
4. 具身智能將在技術涌現式創新和突破下,實現“一腦多形”“一機多用”
具身智能將成為與各行各業深度融合的創新驅動力,其相關應用有望快速擴展至社會經濟的各個層面,推動著生產力的躍升和生活方式的變革。有望實現“一腦多形”即讓一個智能系統適配各種形態的物理實體,如智能機器人、智能車輛等; 將實現“一機多用”,即讓一個機器設備可以靈活地執行多種任務,適應多樣化場景。未來將從工業協作生產到柔性制造,從家務助手到醫療護理,從災難救援到太空探索,深入融入人類社會。
**5. 具身智能在感知與認知、學習與泛化、計算能力、多任務處理、安全性、隱私保護以及人機關系等多個方面都面臨著挑戰 **
**算法層面:**具身智能系統在實現通用智能時面臨兩大根本性挑戰。一是系統需要人類智能的介入,二是尚未實現感知到行動間的認知映射。**數據層面:**缺乏數據成為具身智能能力突破的重要壁壘。一方面,真實數據面臨獲取成本過高,廣泛、高質量和多樣化的挑戰。另一方面仿真合成數據面臨“現實差距”——即模擬環境與現實世界之間的差異挑戰。**軟件層面:**缺乏統一的操作系統和標準化軟件開發工具鏈。**硬件層面:**耐用性和能源效率以及與軟件的深度集成需求構成了具身智能硬件發展的主要障礙。**標準與合規層面:**具身智能技術、評測、安全倫理等標準缺失,面臨信息安全、個人隱私等一系列倫理和社會學問題。
一、全球具身智能發展態勢
1950 年,圖靈在其經典論文《Computing Machinery and Intelligence》中探討“機器是否能思考”這一根本問題,認為人工智能的終極形態是使機器像人一樣能與環境交互感知、自主規劃、決策、行動和執行的機器人/仿真人(在虛擬環境中)。而有望實現的兩條路徑,一是來源于抽象計算(比如下棋)所需的智能,二是為機器配備最好的傳感器,使其可以與人類交流,像嬰兒一樣進行學習。后續,這兩條路徑逐漸演變成了離身智能(Disembodied Artificial Intelligence)和具身智能(Embodied Artificial Intelligence,簡稱“EAI”)。 當前,依靠海量數據,結合算法和計算能力的提升,以 ChatGPT 為代表的離身智能實現智能涌現。自其推出之后,數字世界的 AI 技術逐步展現出由遙遠人類甚至超越人類的思維能力。加利福尼亞大學圣迭戈分校的研究團隊在交互式雙人圖靈測試中發現,人們無法區分 GPT-4 與人類。但在物理世界中,智能機器人仍然僅是智力有限的任務工具。在此背景下,人們的關注點逐漸轉向如何讓 AI 的認知從互聯網的數字信息拓展到現實的物理概念,包括感官、空間、行動等情感,并將其更好地應用于物理世界。實際上,大模型對互聯網上述大量圖文信息的處理和學習,本質上是“讀寫卷書”的過程,這樣的訓練本質決定了具身智能所面臨的挑戰。 可以增強智能體的感知、知識理解和思維能力,但無法取代“行萬里路”所帶來的體驗。就像人類在真實世界中的親身體驗和勞動,無法僅通過閱讀和觀看視頻來替代。具身智能可以賦予 AI 身體,并具備與物理世界的交互學習能力,這是不能通過看圖、看文字這些數字信息所能夠彌補、習得的。2023 年,Nature 子刊刊登了由 Yoshua Bengio、Yann LeCun 等科學家聯名發表的文章,提出下一代 AI 的終極挑戰是通過具身圖靈測試,即復現生物體的感應運動能力,包括與世界互動、靈活的行為、高效的能量利用等。具身智能被譽為邁向通用人工智能的重要一步,引發了新一輪的技術浪潮。
人形機器人是人工智能與物理世界交互的優質載體。 大模型問世是人工智能發展的分水嶺, 以人工智能大模型為代表的人工智能第三發展階段未來會有一段較長的發展紅利期, 將成為新一輪科技革命和產業變革的重要驅動力量。 人形機器人作為人工智能落地物理世界的優質載體, 將受益于人工智能的快速發展, 其擁有感知、 思考、 決策等能力不再遙不可及。 人形機器人集成人工智能、 高端制造、 新材料等先進技術, 有望成為繼計算機、 智能手機、 新能源汽車后的顛覆性產品。 當前人形機器人正處于從實驗室研發到產業化轉化的關鍵時期, 產業規模快速增長, 生態活力不斷提升。
應用場景多元化, 勞動力缺口加速機器人產業化進程。 人形機器人下游應用場景豐富, 包括生產制造、 應急救援、 家庭陪護、 教育、 醫療等。 在產業場景中, 人形機器人主要在智能制造領域發力, 如IBM結合AI、 遙感和邊緣計算的力量打造新一代安防巡檢機器人, 亞馬遜采用AI技術驅動機器人用于自動化的倉庫操作和物流處理等。 勞動力缺口擴大導致用工成本上升, 工廠機器替人需求逐漸增加, 有望進一步加速機器人產業化進程。 多方入局, 人形機器人正迎來產業高速發展窗口期。 外資巨頭紛紛加速推進人形機器人業務進程, 2024年3月, OpenAI與FigureAI合作推出通用型機器人Figure01, 全球AI算力頭部廠商英偉達發布人形機器人通用基礎模型ProjectGR00T; 4月, 波士頓動力新版Atlas人形機器人亮相; 5月, 特斯拉發布人形機器人Optimus最新進展視頻, 展現其已具備分揀電池、 行走、 執行工廠任務的能力。 在激烈競爭的市場環境下, 我國人形機器人產業也呈現出蓬勃發展的態勢。 優必選Walker、 小米CyberOne、 達闥Ginger、 傅利葉GR-1等一批國產人形機器人陸續面市, 全球人形機器人產業競爭按下加速鍵。
來源:中國信息通信研究院
近幾年,大模型推動人工智能技術迅猛發展,極大地拓展了機器智能的邊界,展現出通用人工智能的“曙光”。如何準確、客觀、全面衡量當前大模型能力,成為產學研用各界關注的重要問題。設計合理的任務、數據集和指標,對大模型進行基準測試,是定量評價大模型技術水平的主要方式。大模型基準測試不僅可以評估當前技術水平,指引未來學術研究,牽引產品研發、支撐行業應用,還可以輔助監管治理,也有利于增進社會公眾對人工智能的正確認知,是促進人工智能技術產業發展的重要抓手。全球主要學術機構和頭部企業都十分重視大模型基準測試,陸續發布了一系列評測數據集、框架和結果榜單,對于推動大模型技術發展產生了積極作用。然而,隨著大模型能力不斷增強和行業賦能逐漸深入,大模型基準測試體系還需要與時俱進,不斷完善。
一、大模型基準測試發展概述 近幾年,大模型推動人工智能技術迅猛發展,極大地拓展了機器 智能的邊界,展現出通用人工智能的“曙光”,全球各大科技巨頭和創 新型企業紛紛圍繞大模型加強布局。如圖 1 所示,2018 年,谷歌公司 提出基于 Transformer 實現的預訓練模型 BERT,在機器閱讀理解水 平測試 SQuAD 中刷新記錄。同年,OpenAI 公司發布了第一代生成式 預訓練模型 GPT-1,擅長文本內容生成任務。隨后幾年,OpenAI 相 繼推出了 GPT-2 和 GPT-3,在技術架構、模型能力等方面進行持續創 新。2022 年 11 月,OpenAI 發布的 ChatGPT 在智能問答領域上的表 現引起產業界轟動。除了大語言模型,2023 年,OpenAI 還發布了多 模態大模型 GPT-4。同期國內大模型的發展也呈現不斷加速態勢,已 經發布了華為“盤古”、百度“文心一言”、阿里“通義千問”、騰訊“混元” 和智譜“清言”等 200 多個通用和行業大模型產品。
二、大模型基準測試現狀分析 2023 年,大模型基準測試迎來飛速發展的一年,大模型的評測體 系、數據集、方法、工具如雨后春筍般出現。本章對已發布的大模型 基準測試成果進行簡要介紹,主要分為評測體系、數據集和方法等, 以梳理大模型基準測試的整體發展趨勢,并探尋未來發展方向。 (一)大模型基準測試體系總體介紹 與傳統認為 Benchmark 僅包含評測數據集不同,大模型基準測試 體系包括關鍵四要素:測試指標體系、測試數據集、測試方法和測試 工具。指標體系定義了“測什么?”,測試方法決定“如何測?”, 測試數據集確定“用什么測?”,測試工具決定“如何執行?”。
(二)代表性的大模型基準測試體系 當前已發布的評測榜單背后均有相應的評測體系和方法,國內外 知名度較高的大模型基準測試體系包括:
HELM HELM(Holistic Evaluation of Language Models)是由斯坦福大學 在2022年推出的大模型評測體系。該體系主要包括了場景(Scenarios)、 適配(Adaptation)和指標(Metrics)三個核心模塊,每次評測都需要 “自頂而下”指定一個場景、一個適配模型的提示工程詞和一個或多 個指標來進行。如圖 10 所示,HELM 使用了幾十個場景和多個指標 的核心集完成大模型評測,場景涉及問答、信息檢索、摘要、毒性檢 測等多種典型評測任務,指標包括準確性、校準、魯棒性、公平性、 偏差、毒性、效率等。
HEIM HEIM(Holistic Evaluation of Text-to-Image Models)是由斯坦福 大學在 2023 年推出的多模態大模型評測體系。與之前文本生成圖像 的評測主要關注文本圖像對齊和圖像質量不同,HEIM 定義包括文本 圖像對齊、圖像質量、美學、原創性、推理、知識、偏見、毒性、公 平性、魯棒性、多語言性和效率在內的 12 個維度。HEIM 確定包含這些維度的 62 個場景,并在這個場景上評測了 26 個最先進的文本到 圖像的生成模型。
HRS-Bench HRS-Bench(Holistic Reliable Scalable Bench)是由沙特的 KAUST 在 2023 年推出的全面、可靠、可擴展的多模態大模型評測體系。與 之前文本生成圖像僅考察有限維度不同,HRS-Bench 重點評測大模型 的 13 種技能,可分為準確率、魯棒性、泛化性、公平性和偏見 5 個 類別,覆蓋了包括動物、交通、食物、時尚等 50 多個場景。
OpenCompass OpenCompass(司南)是由上海 AI 實驗室推出的開源、高效、 全面的評測大模型體系及開放平臺,其包括評測工具 CompassKit、數 據集社區 CompassHub 和評測榜單 CompassRank。在已發布的評測榜 單中,對語言大模型主要考察語言、知識、推理、數學、代碼和智能 體方面的表現。對多模態大模型主要評測在 MMBench、MME 等數據 集上的指標。OpenCompass 提供了開源大模型基準測試工具,已集成 大量的開源大模型和閉源商業化 API,在產業界影響力較大。
FlagEval FlagEval (天秤)是由北京智源研究院推出的大模型評測體系及 開放平臺,其旨在建立科學、公正、開放的評測基準、方法、工具集, 協助研究人員全方位評估基礎模型性能,同時探索提升評測的效率和 客觀性的新方法。FlagEval 通過構建“能力-任務-指標”三維評測框 架,細粒度刻畫基礎模型的認知能力邊界,包含 6 大評測任務,近 30個評測數據集和超 10 萬道評測題目。在 FlagEval 已發布的榜單中, 其主要通過中、英文的主、客觀題目對大模型進行評測,具體任務包 括選擇問答和文本分類等。
SuperCLUE SuperCLUE 是由 ChineseCLUE 團隊提出的一個針對中文大模型 的通用、綜合性測評基準。其評測范圍包括模型的基礎能力、專業能 力和中文特性,基礎能力包括語言理解與抽取、閑聊、上下文對話、 生成與創作、知識與百科、代碼、邏輯與推理、計算、角色扮演和安 全。目前提供的基準榜單包括 OPEN 多輪開放式問題評測、OPT 三 大能力客觀題評測、瑯琊榜匿名對戰基準、Agent 智能體能力評估、 Safety 多輪對抗安全評估等。除此之外,還針對長文本、角色扮演、 搜索增強、工業領域、視頻質量、代碼生成、數學推理、汽車等領域 單獨發布大模型能力榜單。 三、大模型基準測試體系框架 大模型基準測試體系涵蓋大模型的測評指標、方法、數據集等多 項關鍵要素,是指導大模型基準測試落地實踐的規范。大模型基準測 試體系的建設和完善,旨在形成一個全面、客觀、規范的大模型基準 測試的方法論,從而保障大模型評測結果的公正性和客觀性。當前大 模型的基準測試偏重模型的通用能力,產業界也亟需面向具體場景和 實際落地效果的模型評測能力。
來源:中國信息通信研究院、人工智能關鍵技術和應用評測工業和信息化部重點實驗室
隨著“十四五”規劃等國家政策的深化落地,人工智能(AI)發展迎來又一輪紅利,特別是以ChatGPT為代表的生成AI產品預示著AI商業變現過程將進一步提速,AI工程化熱度進一步提升。人工智能研發運營體系(MLOps)作為AI工程化重要組成部分,呈現出方法論逐漸成熟、落地應用持續推進的態勢。
2023年3月16日,“AI工程化論壇暨MLOps實踐指南發布會”在京舉辦。會上,中國信息通信研究院(簡稱”中國信通院“)發布《人工智能研發運營體系(MLOps)實踐指南(2023年)》。
指南從組織如何布局和落地MLOps的角度出發,以模型的高質量、可持續交付作為核心邏輯,系統性梳理MLOps概念內涵、發展過程、落地挑戰,為組織高效構建MLOps框架體系和關鍵能力提供方法論和實踐案例的參考與借鑒,并研判MLOps未來發展趨勢。
指南核心觀點
**1. MLOps概念漸晰,為解決AI生產過程管理問題意義明顯。**MLOps是通過構建和運行機器學習流水線(Pipeline),統一機器學習(ML)項目研發(Dev)和運營(Ops)過程的一種方法,目的是為了提高AI模型生產質效,推動AI從滿足基本需求的“能用”變為滿足高效率、高性能的“好用”,有效化解模型全鏈路生命周期管理存在問題,包括跨團隊協作難度大、過程和資產管理欠缺、生產和交付周期長等。
**2. 國內外MLOps發展百花齊放,落地仍面臨問題和挑戰。**2015年至今,從業界意識到機器學習項目技術債給AI生產上線帶來的潛在巨大影響伊始,MLOps前后經歷了斟酌發酵、概念明確、落地應用三大階段,且隨著新工具不斷涌現,在IT、金融、電信等行業得到了廣泛應用和落地。但在這個漸進式發展過程中,MLOps落地面臨著諸多挑戰,包括組織落地驅動力不足、支撐工具選型難集成難、模型治理和可信道阻且長、環境間的交互難以平衡等。
**3. 圍繞流水線的構建,MLOps框架體系逐步完善。**基于機器學習項目全生命周期,以CI/CD/CT/CM為核心,通過構建各條機器學習流水線,包含需求分析與開發、數據工程流水線、模型實驗工程流水線、持續集成流水線、模型訓練流水線、模型服務流水線、持續監控流水線,MLOps全生命周期閉環框架逐步完善。
**4. 漸進式建設關鍵能力,MLOps落地效應逐步形成。**通過數據處理、模型訓練、構建繼承、模型服務、運營監控、模型重訓、實驗管理和流水線管理等能力的建設,形成MLOps過程管理能力的全面把控。通過特征管理、模型管理和倉庫管理等能力的建設,形成制品管理能力的提升。同時以模型安全作為AI生產過程中的關鍵保障之一,MLOps落地效應日益凸顯。
隨著國家新型基礎設施建設發展戰略(2020)、國家“十四五規劃和 2035 年遠景目標綱要”等系列政策的出臺,人工智能(AI)發展迎來新一輪紅利,科技革命和產業升級處于進行時。近年來,AI 工程化的研究熱度持續提升,其目的是幫助組織在數智化轉型過程中,更高效、大規模地利用 AI 創造業務價值。人工智能研發運營體系(MLOps)作為 AI 工程化重要組成部分,其核心思想是解決 AI 生產過程中團隊協作難、管理亂、交付周期長等問題,最終實現高質量、高效率、可持續的 AI 生產過程。 MLOps 的發展呈現出逐漸成熟的態勢,近幾年國內外 MLOps 落地應用正持續快速推進,特別是在 IT、銀行、電信等行業取得明顯效果。與此同時,MLOps 行業應用成熟度不足,使得組織在制度規范的建立、流程的打通、工具鏈的建設等諸多環節面臨困難。因此本指南旨在成為組織落地 MLOps 并賦能業務的“口袋書”,圍繞機器學習全生命周期,為模型的持續構建、持續交付、持續運營等過程提供參考,推進組織的 MLOps 落地進程,提高組織 AI 生產質效。 本指南由中國信通院云計算與大數據研究所、人工智能關鍵技術和應用評測工業和信息化部重點實驗室聯合發布。本指南站在組織如何布局和落地 MLOps 的視角,以模型的高質量、可持續交付作為核心邏輯,系統性梳理 MLOps 概念內涵、發展過程、落地挑戰等現狀,并基于 MLOps 的理論研究和實踐案例分析組織如何構建 MLOps 框架體系和關鍵能力,最后總結和展望其發展趨勢。由于 AI 產業的快速變革,MLOps 落地應用持續深入,工具市場不斷迭代,我們對 MLOps 的認識還有待繼續深化,本指南可能仍存在不足之處,歡迎大家批評指正。
伴隨全球數字化進程的加快,人工智能成為引領未來世界發展的關鍵技術。近年來,各國政府、科研教育機構、科技企業及專家學者紛紛加入到推動人工智能產業發展的進程中,人工智能技術與產業融合程度不斷加深。
2022年,尚普研究院從全球視角出發,聯合中科創星、智譜AI、紫荊數字經濟研究院、中國風險投資有限公司、中電海康科創基金、容億投資等6家機構于近日正式發布《2022年全球人工智能產業研究報告》。
《2022年全球人工智能產業研究報告》包括人工智能產業概況、人工智能底層基礎、人工智能核心技術、人工智能應用領域、人工智能趨勢展望五大篇章。對人工智能的發展歷程、產業鏈、核心技術、應用領域及發展趨勢等方面進行全面梳理,為政府部門、從業人員、教育工作者、社會公眾更好了解人工智能的過去、現狀及未來提供參考。以下為報告部分內容,
來源:中國信息通信研究院
人工智能技術是釋放數字化疊加倍增效應、加快戰略新興產業發展、構筑綜合競爭優勢的必然選擇。縱觀全球,國內外人工智能相關不斷強化,持續推動釋放人工智能紅利;以深度學習為代表的人工智能技術飛速發展,新技術開始探索落地應用;工程化能力不斷增強,在醫療、制造、自動駕駛等領域的應用持續深入;可信人工智能技術引起社會廣泛關注。人工智能治理受到全球高度關注,各國規制進程不斷加速,基于可信人工智能的產業實踐不斷深入。
近日,中國信息通信研究院正式發布《人工智能白皮書(2022年)》,全面回顧了2021年以來全球人工智能在政策、技術、應用和治理等方面的最新動向,重點分析了人工智能所面臨的新發展形勢及其所處的新發展階段,致力于全面梳理當前人工智能發展態勢,為各界提供參考,共同推動人工智能持續健康發展。
白皮書核心觀點
1、人工智能邁入新階段,將由技術創新、工程實踐、可信安全“三維”坐標來定義和牽引。
第一個維度突出創新,圍繞著算法和算力方面的創新仍會不斷涌現。第二個維度突出工程,工程化能力逐漸成為人工智能大規模賦能千行百業的關鍵要素。第三個維度突出可信,發展負責任和可信的人工智能成為共識,將抽象的治理原則落實到人工智能全生命流程將成為重點。
2、人工智能技術創新仍是主旋律,新算法不斷涌現。
超大規模預訓練模型推動技術效果不斷提升,繼續朝著規模更大、模態更多的方向發展;“生成式人工智能”技術不斷成熟,未來聽、說、讀、寫等能力將有機結合;知識計算成為推動人工智能從感知智能向認知智能轉變的重要探索;人工智能與科學研究融合不斷深入,開始“顛覆”傳統研究范式。
3、人工智能工程化聚焦工具體系、開發流程、模型管理全生命流程的高效耦合。
工具體系層面:體系化與開放化成為研發平臺技術工具鏈的發展特點。 開發流程層面:工程化關注人工智能模型開發的生命流程,追求高效且標準化的持續生產、持續交付和持續部署,最終以最佳的模型進入應用層面產生商業價值。 模型管理層面:企業需要建設對模型生命周期的管理機制,對模型的版本歷程、性能表現、屬性、相關數據、衍生的模型檔案等進行標準化的管理運維。
4、人工智能治理邁入軟硬法協同和場景規制新階段。
人工智能治理實質化進程加速推進:各國人工智能治理側重各有不同,但整體上呈現加速演進態勢,即從初期構建以“軟法”為導向的社會規范體系,開始推進以“硬法”為保障的風險防控體系。 典型場景化治理加速落地:各國紛紛注意到人工智能應用場景多樣化和差異化給治理帶來的復雜性,典型場景的治理成為各國的工作重點,特別聚焦于自動駕駛、智慧醫療和人臉識別等領域。
數字孿生是一種“實踐先行、概念后成”的新興技術理念,與物聯網、模型構建、仿真分析等成熟技術有非常強的關聯性和延續性。
來源 | 中國移動通信有限公司研究院(轉載請注明來源)
編輯 | 蒲蒲 數字孿生是一種數字化理念和技術手段,它以數據與模型的集成融合為基礎與核心,通過在數字空間實時構建物理對象的精準數字化映射,基于數據整合與分析預測來模擬、驗證、預測、控制物理實體全生命周期過程,最終形成智能決策的優化閉環。其中,面向的物理對象包括實物、行為、過程,構建孿生體涉及到的數據包括實時傳感數據和運行歷史數據,集成的模型涵蓋物理模型、機理模型和流程模型等。
隨著經濟社會數字化轉型的持續推進,數字孿生逐漸成為產業各界關注的熱點技術。數字孿生起源航天軍工領域,近年來持續向智能制造、智慧城市等垂直行業拓展,實現機理描述、異常診斷、風險預測、決策輔助等應用價值,已成為助力企業數字化轉型、促進數字經濟發展的重要抓手。
《數字孿生技術應用白皮書(2021)》聚焦數字孿生關鍵技術和行業應用發展,梳理數字孿生整體發展情況,深入分析技術體系和典型垂直行業應用場景,旨在為產業界在規劃實施數字孿生相關應用時提供參考借鑒,助力數字孿生技術演進和產業發展。
白皮書指出,從政策層面來看,數字孿生成為各國推進經濟社會數字化進程的重要抓手;從行業應用層面來看,數字孿生成為垂直行業數字化轉型的重要使能技術;從企業主體層面來看,數字孿生被納入眾多科技企業戰略大方向,成為數字領域技術和市場競爭主航道;從標準化層面來看,數字孿生標準體系初步建立,關鍵領域標準制修訂進入快車道。
數字孿生具有四個典型的技術特征:
(一)虛實映射。數字孿生技術要求在數字空間構建物理對象的數字化表示,現實世界中的物理對象和數字空間中的孿生體能夠實現雙向映射、數據連接和狀態交互。
(二)實時同步。基于實時傳感等多元數據的獲取,孿生體可全面、精準、動態反映物理對象的狀態變化,包括外觀、性能、位置、異常等。
(三)共生演進。在理想狀態下,數字孿生所實現的映射和同步狀態應覆蓋孿生對象從設計、生產、運營到報廢的全生命周期,孿生體應隨孿生對象生命周期進程而不斷演進更新。
(四)閉環優化。建立孿生體的最終目的,是通過描述物理實體內在機理,分析規律、洞察趨勢,基于分析與仿真對物理世界形成優化指令或策略,實現對物理實體決策優化功能的閉環。
作為發展數字經濟的重要使能技術,數字孿生近年來備受業界關注,技術體系不斷發展,核心技術快速演進,產業生態持續完備,行業應用走深向實,成為促進工業、城市、交通、網絡等垂直行業實現數智化轉型的重要抓手。
但同時也需要注意,數字孿生作為一項新興技術理念,尚處于發展初期,仍存在許多短板問題亟待破解。
一是實施成本高企。數字孿生技術的實現涉及到企業研發、生產、供應鏈、管理等系統的改造,投資大、沉沒成本高。受限于此,目前數字孿生往往僅能成為大企業“錦上添花”的高端技術應用,而難以成為廣大小企業“雪中送炭”的普適技術應用。
二是產業基礎薄弱。數字孿生產業鏈長、分工細致、碎片化程度高,跨領域之間的技術融合性較差、資源整合難,存在IT企業不懂行業機理、OT企業難以報團的突出痛點,亟需產業整合者的出現。
三是商業模式不成熟。不同垂直行業對數字孿生的需求差異大,垂直行業內需求“長尾效應”顯著,解決方案的可復制性不強,導致數字孿生應用多以項目交付型為主,平臺化、模塊化程度較低,不利于高效推廣。
四是技術短板凸顯。在機理建模、仿真分析、數據集成等方面的技術短板制約了數字孿生技術整體的應用深度,同時部分核心技術被國外龍頭企業壟斷,“安可”有潛在風險。
整體上來看,為進一步促進數字孿生技術融合發展,形成產業合力,推廣技術應用,打造賦能千行百業的通用技術底座,業界需要從頂層設計、技術攻關、生態構建和標準化四個層面重點突破。
一是頂層設計層面,在相關部委指導下聯合產業多方智庫力量盡快研究明確數字孿生中長期發展規劃,為技術產業發展指明方向和路徑。同時建立完備的數字孿生評價體系,從建模精度、數據互通性、同步演進性、智能化程度、系統間數據的共享程度等多種維度構建評價指標,牽引數字孿生向高階演進。
二是技術攻關層面,聚焦數字孿生基礎理論及關鍵核心技術,鼓勵產學研聯合研發,在信息建模、機理建模、模型同步、模型融合、智能決策、智能感知和信息安全等方面突破一批技術瓶頸,形成基礎扎實、穩定成熟的技術體系。
三是生態構建層面,數字孿生產業鏈長,技術體系復雜,垂直行業壁壘高筑,需要產業各方協同創新、優勢互補、形成合力,特別是在基礎設施共建、跨領域技術融合、數據共享互認、能力開放互用等方面形成長效協同機制,依托產業聯盟、創新中心等方式加深產業鏈的交流合作與需求對接,構建優勢互補、協同共贏的產業生態。
四是標準化層面,在技術發展初期,盡快完善術語、通用架構等基礎共性標準,形成統一的話語體系和規范性指導框架。在此基礎上,進一步對信息模型、數據集成、平臺等數字孿生核心要素和垂直行業應用模式進行規范統一,力求快速形成覆蓋數字孿生基礎共性、關鍵技術和行業應用的標準體系。