來源:弗若斯特沙利文 日前,面對相繼上市的眾多模型,國際知名調研機構弗若斯特沙利文(Frost&Sullivan)聯合頭豹研究院發布《2024年中國大模型能力評測報告》(以下簡稱“報告”)。
報告選定了中外19個具有代表性的大模型進行評測,其中覆蓋15家國內主流模型,與此同時,國際方面選擇了OpenAI的GPT3.5和GPT4、谷歌的Gemini1.0以及Anthropic的Claude2,并將這四大模型的平均水平設為國際大模型均線。 報告以五大細分維度——數理科學、語言能力、道德責任、行業能力及綜合能力為衡量標準,深入探索了大模型的能力邊界,為社會各界提供了對當前中國大模型產業發展現狀的清晰認知,以及大模型技術發展的潛力和在實際應用中的價值體現。
報告的核心內容包括以下幾個方面:
具體內容如下
來源:InfoQ研究中心
進入 2024 年,InfoQ 研究中心發現大模型市場的發展態勢與產品動向都已迅速變化。因此,InfoQ 研究中心期望以季度為單位,全面分析大模型領域的市場趨勢,技術成果亮點和產品發展潛力,為相關企業和研究人員提供有價值的參考信息。 《中國大模型季度監測報告》將聚焦在政策、融資、大模型更新迭代、發展路線、應用場景、典型產品和發展挑戰,從微觀出發,總結大模型市場的潛在發展趨勢。 具體內容如下
來源:人民網 日前,人民網財經研究院、至頂科技聯合發布《開啟智能新時代:2024年中國AI大模型產業發展報告》(以下簡稱《報告》),對于AI大模型產業發展背景、產業發展現狀、典型案例、挑戰及未來趨勢等方面進行了系統全面的梳理,為政府部門、行業從業者以及社會公眾更好地了解AI大模型產業提供參考。
政策、技術、市場驅動AI大模型產業發展
近年來,我國始終高度重視人工智能發展機遇和頂層設計,發布多項人工智能支持政策。國務院于2017年發布《新一代人工智能發展規劃》,科技部等六部門于2022年印發《關于加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見》對規劃進行落實。2024年《政府工作報告》中提出開展“人工智能+”行動。 伴隨人工智能領域大模型技術的快速發展,我國不少地方政府出臺相關支持政策,加快大模型產業的持續發展。當前,北京、上海、廣東、安徽、福建和深圳、杭州、成都等地均發布了AI大模型的相關產業政策。 《報告》認為,中國AI大模型產業發展源于多領域的廣泛需求,例如來自辦公、制造、金融、醫療、政務等場景中降本增效、生產自動化、降低風險、提高診斷準確率、提高政務服務效率等訴求。相關領域的創新和發展共同推動著中國AI大模型產業的蓬勃發展,預示著未來更廣闊的市場前景。 中國AI大模型產業呈現蓬勃發展的態勢
《報告》對目前的AI大模型按照部署方式進行了劃分,主要分為云側大模型和端側大模型兩類。具體而言,云側大模型分為通用大模型和行業大模型;端側大模型主要有手機大模型、PC大模型。 伴隨多家科技廠商推出的AI大模型落地商用,各類通用、行業以及端側大模型已在多個領域取得了顯著的成果,如在金融、醫療、政務等領域,AI大模型已成為提升服務質量和效率的重要手段。 我國具有代表性的通用AI大模型主要包含科大訊飛的訊飛星火認知大模型、百度公司的文心一言大模型、阿里巴巴的通義千問大模型等;行業AI大模型主要涵蓋蜜度的文修大模型、容聯云的赤兔大模型、用友的YonGPT大模型;同時具有云側和端側大模型的端云結合AI大模型主要有vivo的藍心大模型;端側AI大模型主要以蔚來的NOMIGPT大模型為代表。 中國AI大模型產業發展仍存多方面挑戰
大模型產業遭遇算力瓶頸。隨著AI大模型規模呈現指數級增長,訓練大模型越發依賴高性能AI芯片。國內AI高性能芯片市場受進口限制和國內技術瓶頸的雙重影響,大模型產業發展受到算力層面的一些制約。 主流大模型架構仍存在諸多局限。首先,Transformer架構消耗的算力資源普遍較大;其次,基于Transformer架構的大模型對存儲設備的要求也更高。 高質量的訓練數據集仍需擴展。國內的AI大模型數據主要來自互聯網、電商、社交、搜索等渠道,存在數據類型不全面,信息可信度不高等問題。整體來看,我國可用于大模型訓練的中文數據庫體量嚴重不足。 大模型爆款應用尚未出現。國內的AI大模型產業至今沒有出現爆款級應用,原因在于尚未找到商業化思路,缺乏滿足客戶需求的個性化應用。我國大模型產業要推出爆款級應用,勢必要在應用領域做深做細,讓每一個用戶都可以充分享受到大模型所帶來的真正便利。
展望中國AI大模型四大產業趨勢
AI大模型的出現,使得利用人工智能技術來生成內容,從“可用”跨越到“好用”。未來,人工智能生成內容從“好用”到“高效”,也許會再經歷一次或多次技術范式的顛覆。同時,《報告》提出了中國AI大模型四大產業趨勢展望: AI云側與端側大模型滿足不同需求,C端用戶將成為端側的主要客群 強大的算力和海量的訓練數據庫,支撐大語言模型高參數,云側大模型能夠提供語言理解、知識問答、數學推理、代碼生成等能力。 一方面,面向C端個人用戶,云側大模型提供智能問答、文本生成、圖片生成、視頻生成等功能。另一方面,面向B端企業用戶,云側大模型變革企業傳統業務模式,提供營銷、客服、會議記錄、文本翻譯、預算管理等個性化服務。 AI大模型趨于通用化與專用化,垂直行業將是大模型的主戰場 與通用大模型相比,行業大模型具有專業性強、數據安全性高等特點,未來大模型真正的價值體現在更多行業及企業的應用落地層面。 一方面,行業大模型將通用大模型用于形成多領域能力的資源集中于特定領域,模型參數相對較小,對于企業落地而言具有顯著的成本優勢。另一方面,行業大模型結合企業或機構內部數據,為B端用戶的實際經營場景提供服務,能更加體現模型對于機構的降本增效作用。 AI大模型將廣泛開源,小型開發者可調用大模型能力提升開發效率 小型開發者通過調用大模型能力,大幅提升編程效率,進一步推動AI應用落地。 一方面,小型開發者可基于大模型進行項目、應用以及插件等開發工作,不再局限于算力資源、無需進行復雜的模型訓練、調參,輕松實現應用落地。另一方面,小型開發者利用大模型技術提升開發效率,通過在代碼工具中集成大模型能力,輔助完成部分重復性工作,為開發人員提供量身定制的代碼建議,還可以自動檢測代碼中的Bug,并生成相應的測試用例,縮短工程師開發流程中的編碼和糾錯時間。 AI高性能芯片不斷升級,AI大模型產業生態體系將不斷完善 在大模型場景下,AI高性能芯片主要用于大模型的訓練環節,芯片性能的強弱直接影響大模型的性能和表現。在全球AI高性能芯片市場中,英偉達的芯片產品采用最前沿半導體工藝和創新GPU架構保持行業的領先地位。 《報告》認為,AI大模型可以創造新價值、適應新產業、重塑新動能,是加快發展新質生產力的關鍵要素。面對未來,我國需進一步加強資源與研發力量的統籌,強化大模型在發展中的場景牽引作用,促進經濟社會的高質量發展,以實現大模型技術的高質量應用突破,驅動實體經濟的蝶變和產業變革。 具體內容如下
來源:奇安信 近日,奇安信集團對外發布《2024人工智能安全報告》(以下簡稱《報告》)。據悉,這是我國首份人工智能安全報告。《報告》認為,人工智能是新一輪科技革命和產業變革的核心技術,被譽為下一個生產力前沿。具有巨大潛力的 AI 技術同時也帶來兩大主要挑戰:一個是放大現有威脅,另一個是引入新型威脅。 數據顯示,在2023年,基于AI的深度偽造欺詐暴增了3000%,基于AI的釣魚郵件數量增長了1000%。據了解,奇安信威脅情報中心監測發現,已有多個有國家背景的APT組織利用AI實施了十余起網絡攻擊事件。同時,各類基于AI的新型攻擊種類與手段不斷出現,甚至出現泛濫,包括深度偽造(Deepfake)、黑產大語言模型、惡意AI機器人、自動化攻擊等,在全球造成了嚴重的危害。 《報告》指出,AI與大語言模型本身伴隨著安全風險,業內對潛在影響的研究與重視程度仍遠遠不足。AI技術推動安全范式變革,全行業需啟動人工智能網絡防御推進計劃,包括利用防御人工智能對抗惡意人工智能,扭轉“防御者困境”。 業內普遍預測,未來十年該技術的惡意使用將迅速增長,人工智能的惡意使用在網絡安全、物理安全、政治安全、軍事安全等方面構成嚴重威脅。 大模型引爆AI熱潮 雙刃劍效應顯現
2022年以后,以ChaGPT為代表的大語言模型(Large Language Model,LLM)AI技術快速崛起,后續的進展可謂一日千里,迎來了AI技術應用的大爆發,展現出來的能力和效果震驚世界。IDC調研顯示,67%的中國企業已經開始探索 AIGC 在企業內的應用機會或進行相關資金投入。IDC預測,2026年中國AI大模型市場規模將達到211億美元,人工智能將進入大規模落地應用關鍵期。 《報告》認為,“AI是一種通用技術,通用就意味著既可以用來做好事,也可以被用來干壞事”。具有巨大潛力的AI技術同時帶來兩大主要挑戰:一是放大現有威脅,另一個是引入新型威脅。奇安信預計,未來十年,人工智能技術的惡意使用將快速增長,將在政治安全、網絡安全、物理安全和軍事安全等方面構成嚴重威脅。
研究發現,人工智能已成攻擊工具,并帶來迫在眉睫的威脅,相關的網絡攻擊頻次越來越高。數據顯示,2023年基于AI的深度偽造欺詐暴增了3000%,基于AI的釣魚郵件數量增長了1000%;奇安信威脅情報中心監測發現,已有多個有國家背景的APT組織利用AI實施了十余起網絡攻擊事件。各類基于AI的新型攻擊種類與手段不斷出現,甚至出現泛濫,包括深度偽造(Deepfake)、黑產大語言模型、惡意AI機器人、自動化攻擊等,在全球造成了嚴重危害。 在當前波譎云詭、風高浪急的國際形勢下,快速發展的AI帶來了更加復雜和難以預測的軍事威脅,包括相關武器系統的誤用、濫用甚至惡用,導致戰爭不可控性增加。例如人工智能被用在“機器人殺手”等致命性自主武器(LAWS)上,可能會導致無差別殺戮。數據顯示,2024財年,美國國防部計劃增加與AI相關的網絡安全投資,總額約2457億美元,其中674億美元用于網絡IT和電子戰能力。 ** AI引入或放大12種威脅 業界對AI風險重視不足**
《報告》深入研究了基于AI的深度偽造(Deepfake)、黑產大語言模型基礎設施、利用AI的自動化攻擊、AI武器化、LLM自身安全風險、惡意軟件、釣魚郵件、虛假內容和活動生成、硬件傳感器安全等12種重要威脅,對其技術原理、危害情況、真實案例等進行了深入的剖析,旨在讓業界更全面的認識到AI普及帶來的兩大主要挑戰:一方面放大了現有威脅,比如釣魚郵件、惡意軟件和社會工程學等;另一方面是引入了新型威脅,如AI自動化攻擊、AI深度偽造等。
以AI武器化為例,據法新社2月10日報道,以色列軍隊首次在加沙地帶的戰斗中采用了人工智能(AI)軍事技術,包括AI驅動的瞄準器和無人機等.引發了人們對現代戰爭中使用自主武器的擔憂。這些技術正在摧毀對手的無人機,并被用于繪制哈馬斯組織在加沙的龐大隧道網絡地圖等。這僅僅是AI武器化、加劇軍事威脅趨勢的冰山一角。
《報告》認為,AI與大語言模型本身伴隨著安全風險,業內對潛在影響的研究與重視程度仍遠遠不足。 全球知名應用安全組織OWASP發布大模型應用的十大安全風險,包括提示注入、數據泄漏、沙箱不足和未經授權的代碼執行等。此外,因訓練語料存在不良信息,導致生成的內容不安全,正持續引發災難性的后果,危害國家安全,公共安全甚至個人安全,這些都亟需業內的高度重視和積極應對。 ** AI威脅該如何應對?**
《報告》從安全行業、監管機構、政企機構、網絡用戶等群體角度,給出了應對AI威脅的建議。其中安全行業需要繼續發揮能力優勢,確保人工智能本身的安全性,并積極利用人工智能用于安全防護;監管機構需要對AI潛在風險與影響保持持續關注,在制度和法規上及時提供支持;政企機構需及時部署AI安全框架和解決方案,以及AI安全評估服務和檢測工具,還要依托AI推動安全升級;網絡用戶在嘗試最新人工智能應用的同時,同樣需要更新安全知識,形成良好的安全習慣。 面對AI網絡攻擊、AI武器化等日益嚴峻的安全威脅,《報告》認為,AI技術將會推動安全領域發生范式變革,全行業需啟動人工智能網絡防御推進計劃。新一代AI技術與大語言模型改變安全對抗格局,將會對地緣政治競爭和國家安全造成深遠的影響,各國正在競相加強在人工智能領域的競爭,以獲得面向未來的戰略優勢。全行業需啟動人工智能網絡防御推進計劃,包括利用防御人工智能對抗惡意人工智能,扭轉“防御者困境”。 具體內容如下
來源:中國信通院華東分院 近日,中國信通院聯合上海人工智能實驗室成立的大模型測試驗證與協同創新中心牽頭,首次面向全國范圍征集全行業優秀應用實踐,并形成《2023大模型落地應用案例集》(以下簡稱“《案例集》”)。 作為首部聚焦落地應用的權威研究成果,《案例集》全面展示了大模型前沿技術和發展成果,推動了大模型為代表的人工智能技術賦能社會經濟高質量發展。經專家組的多輪評審,共52個各自領域的典型大模型技術落地應用成功入選。 2022年底ChatGPT的橫空出世,引爆了國內外大模型的熱情,各行各業的創業者已經集結在十字路口蓄勢待發。 從國內市場來看,目前人工智能(AI)大模型已經在各行各業“落子不斷”。據公開資料不完全統計顯示,國內大模型的發展路徑是“通用+垂直”兩條腿走路,其中垂類大模型落地速度最快。《案例集》顯示,有近65%+的AI大模型是垂直大模型。 趨勢已然,大模型技術突破代表了AI發展的一個重要里程碑,下面筆者將梳理中國從業者構建的“底層原創技術-中層基礎模型-上層行業應用”的大模型圖鑒。 ** PART 1**
** 大模型領域中國學者的技術貢獻**
圖注:ResNet的四位作者分別是:何愷明、張祥雨、任少卿、孫劍 2016年,來自微軟亞洲研究院的四位學者提出深度殘差學習(ResNet),解決了深度網絡的梯度傳遞問題。要知道,2015年之前深度學習最多只能訓練20層,ResNet之后,就可以有效地訓練超過百層的深度神經網絡。
2017年Google發布Transformer,它的出現打穩了AI大模型的“地基”,不僅“顛覆”了自然語言處理(NLP)中的機器翻譯任務,而且還提供了一種新的思路來處理圖像數據。 中國學者也圍繞Transformer做了許多改進和完善,例如微軟亞洲研究院聯合西安交通大學推出LONGNET,將Transformer的序列長度擴展10億+;京東探索研究院聯合武漢大學提出全球首個面向遙感任務設計的億級視覺Transformer大模型;阿里達摩院提出新的Transformer結構FMViT,大幅度提升AI模型精度與速度…… 在大模型領域細數中國學者貢獻,許多原創性貢獻來自本土。已故的商湯科技創始人湯曉鷗(緬懷)在2023世界人工智能大會上,發表演講時表示:在深度學習的大門上,我們按了18次門鈴,取得了許多跨時代的突破。其中湯曉鷗提到了上海人工智能實驗室領軍科學家林達華,他當時設計的計算機視覺開源算法體系OpenMMLab,目前已經成為國際上最具影響力的視覺算法開源體系。值得一提的是,林達華也是書生大模型體系的重要貢獻者。 京東探索研究院早在2021年年初就展開了大模型體系(超級深度學習)的建設和基礎研究,領導京東建設了中國第一個NVIDIA DGX Superpod天琴alpah-α超算集群。在此基礎上,京東探索研究院的織女模型vega v2 在2022年登頂SuperGLUE榜首,一舉超越同場競技的谷歌、微軟、Meta等業界頂尖企業;2021年研究院開發的大規模視覺模型ViTAE,在ImageNet Real的目標識別和MS COCO的人體姿態估計等權威榜單上均獲得世界第一。
圖注:(上)2022年京東探索研究院發表論文《Self-Evolution Learning for Discriminative Language Model Pretraining》,提出自我進化學習方法,為vega v2大模型的設計提供核心思想; (下)2021年京東探索研究院發表論文《ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias》,嘗試將 CNN和transformer相結合。 因此,國內公司的 AI 大模型研發雖然比國外公司晚,但是發展卻異常地迅速,其內在邏輯便是:本土企業和學者對深度學習技術的深入理解與創新。在大模型的底層技術已經固定的時代,他們靠著持續的探索和努力才能構建出秀麗的“上層建筑”。 在OpenAI發布ChatGPT之前,國內的一些企業就已經押注AI大模型技術:例如2021 年 4 月,華為云聯合循環智能發布盤古超大規模預訓練語言模型,參數規模達 1 000 億;2021 年 6 月,北京智源人工智能研究院發布了超大規模智能模型“悟道 2.0”,參數規模達到 1.75 萬億;2021 年 12 月,百度推出 ERNIE 3.0 Titan 模型,參數規模達 2 600 億,同期,阿里巴巴達摩院的 M6 模型參數達到 10 萬億,將大模型參數直接提升了一個量級。 到2023年,大模型繼續火熱,國內的AI大模型團隊已逐漸拓展到視覺、決策領域,甚至用于解決蛋白質預測、航天等領域的重大科學問題,阿里、京東、oppo等大廠都有相應的成果。 ** PART 2**
** 大模型應用拐點已至**
圖靈獎獲得者Yann LeCun說過:AI大模型的技術都是公開的,算不上底層技術上的創新,如果你愿意一探究竟的話,可以發現它背后沒有任何秘密可言。 但借著這些“過時”的技術,在中國擁有龐大的人才基數和數據集的情況下,可以發展出更適合本土環境和語境的大模型。 那么如何形象理解大模型?前科技部長王志剛從高維度表示,大模型,就是大數據、大算力、強算法。形象一些:大模型事實上就是算法、數據、算力上的有效結合。傳統巨頭在大模型領域的技術投入普遍都是在積極防御,而中國企業在非常積極地推動向應用中的落地。 目前,業界除了把AI大模型商業落地模式統分為 toB 和 toC之外,在市場劃分上則遵循通用與垂直兩大路徑,兩者在參數級別、應用場景等方面差異正在顯性化。 通用大模型往往是指具備處理多種不同類型任務的AI模型,這些模型通常是通過大規模的數據訓練而成,能夠在多個領域和應用中表現出良好的效能。大家耳熟能詳的幾個通用大模型均來財力雄厚的企業: 1.書生浦語開源大模型:由上海人工智能實驗室研發,涵蓋 70 億參數的輕量級版本 InternLM-7B,以及 200 億參數的中量級版本和 InternLM-20B,以及完整的開源工具鏈體系。InternLM-7B 在包含 40 個評測集的全維度評測中展現出卓越且平衡的性能,它在兩個被廣泛采用的基準 MMLU 和 CEval 上分別取得了 50.8 和 52.8 的高分,開源一度刷新了 7B 量級模型的紀錄。 2.昆侖萬維天工大模型:“天工”是一個 AI 搜索引擎,一個對話式 AI 助手。“天工”擁有強大的自然語言處理和智能交互能力,能夠實現個性化 AI 搜索、智能問答、聊天互動、文本生成、編寫代碼、語言翻譯等多種應用場景并且具有豐富的知識儲備,涵蓋科學、技術、文化、藝術、歷史等領域。 3.通義千問 2.0:由阿里云研發的超大規模的語言模型,具備多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等功能。通義千問 2.0 在復雜指令理解、文學創作、通用數學、知識記憶、幻覺抵御等能力上均比上代有顯著提升。 4.MiniMax-abab:由科技創業公司MiniMax研發。據悉,“Max-abab”是文本、語音、視覺三模態的千億參數大語言模型,在中、英文服務領域均已超過GPT-3.5 的水平。今年8月份,“MiniMax-abab”大模型通過了國家首批大模型服務備案,面向社會公眾提供服務。 5.言犀基礎大模型:由京東科技研發,該模型融合了70%的通用數據和30%的數智供應鏈原生數據,具有更高的產業屬性。 6.百靈語言大模型:由螞蟻集團基于Transfromer架構研發。該模型基于萬億級Token語料訓練而成,支持窗口長度達32K,在主流推理類榜單中排名前列。據悉,螞蟻百靈大模型已完成備案,基于百靈大模型的多款產品已陸續完成內測,正陸續向公眾開放。
這些通用大模型包含千億甚至萬億參數,覆蓋自然語言處理、圖像識別、語音識別等方面的任務,已在知識問答、醫療咨詢、娛樂領域、視頻生成等數十個行業場景領域,展現出廣闊的落地應用潛力。 與通用大模型相比,垂類大模型參數量相對較小。但是因為有一些行業的核心數據和業務系統的生產數據參與,所以在相應行業解決問題更為高效、直接。 從《案例集》來看,在金融、教育、醫療等領域,已經有不少公司發布了相應產品。
根據《案例集》入選案例的應用場景,垂類大模型更針對于企業級應用場景的垂直性和專業性要求,而在模型部署層面,更少的模型參數、訓練數據意味著更少的成本,因此垂直應用領域有望實現“萬模齊發”。 《案例集》公布的名單,也恰恰驗證了目前垂類大模型發展的一些趨勢: 1. 加注端側、邊緣側應用。輕量化參數能讓手機助手接入AI大模型能力。目前已有案例包括OPPO的小布助手、華為的智能助手小藝等等。 2. 更傾向于“解決方案”式的交付方式。由于垂類大模型接受了大量特定領域的數據和知識,因此可以基于領域知識生成更具深度的解決方案。例如ChatDD 新一代對話式藥物研發助手,面向游戲行業的圖像內容生成式大模型等等。 3. 大模型開始向多模態領域發展。多模態意味著豐富的數據形式,包含視覺、聽覺和時序信息。對于大模型模型來說,這意味著可以從多模態中提取和學習更多維度的信息。類似于《案例集》中的單晶爐自動化工藝識別多模態模型,相信未來將會出現更多。 4. “通用+垂直”模型互相融通的態勢。隨著AI技術的發展,不同類型的模型之間的界限變得越來越模糊。例如,一些通用模型開始整合垂直領域的知識,而一些垂直模型也開始利用通用模型的技術來增強其功能。例如百川大模型在娛樂領域的應用。 ** PART 3**
** 搶灘大模型未來:構建生態**
對于AI大模型這種劃時代的超級機遇而言,勝負不在于做出一個爆款應用,賺到幾億盈利,而在于,是否抓到了大時代的方向。 換句話說,當下的大模型競爭早已超過了技術的范疇,更多是一種生態層面的比拼,具體表現在有多少應用、有多少插件、有多少開發者以及用戶等。誰能夠率先圍繞大模型構建生態,或者說誰率先融入生態,誰就能成為領先者。 大模型要想像電力一樣輸送給千行百業和千家萬戶,必然需要一個體系化的產業生態,構建這個生態需要一系列相互關聯的因素,包括技術發展、應用場景、數據管理、倫理與法律問題、以及社會影響等。 在生態建構的路徑上,目前企業可分為兩派。一派將大模型接入原有的產品線,做升級和優化;另一派試圖以大模型產品為中心,建構新一代的“超級應用”。而有些企業試圖跳過這兩種路徑,多方面融入AI大模型生態。從《案例集》公布的大模型服務類案例,我們可以看到有些中國企業做了以下嘗試:
例如螞蟻集團實現了一個大模型數據高效高質量供給平臺,不僅可降低數據獲取和使用成本,且保證來源合規,并能夠有效提升數據質量、過濾風險數據保障訓練安全;優刻得開發的AGI云上模型服務平臺,能提供數據標準化整合、安全合規、提供算力等服務;上海道客研發的云原生大模型知識庫平臺能夠幫助解決信息孤島,以及定制個性化的私人語料庫;泡泡瑪特的AI 整合平臺集成多個知名AI大模型,為用戶提供一站式 AI服務…… 這些大模型服務工具,在一定程度上能有效地解決“幻覺”、“道德”、“性能”、“數據合規”等當前AI大模型遇到的問題。更重要的是借助這些服務,可以建設規范可控的自主工具鏈,幫助AI企業探索“大而強”的通用模型,助力公司研發“小而美”的垂直行業模型,從而構建基礎大模型和專業小模型交互共生、迭代進化的良好生態。 具體內容如下
來源:SuperCLUE 自2023年以來,AI大模型在全球范圍內掀起了有史以來規模最大的人工智能浪潮。國內學術和產業界在過去一年也有了實質性的突破。中文大模型測評基準SuperCLUE在過去一年對國內外大模型的發展趨勢和綜合效果進行了實時跟蹤。 基于此,我們發布了《中文大模型基準測評2023年度報告》,在AI大模型發展的巨大浪潮中,通過多維度綜合性測評,對國內外大模型發展現狀進行觀察與思考。 國內大模型關鍵進展
1. 2023年大模型關鍵進展與中文大模型全景圖 國內學術和產業界在過去一年也有了實質性的突破。大致可以分為三個階段,即準備期(ChatGPT發布后國內產學研迅速形成大模型共識)、成長期(國內大模型數量和質量開始逐漸增長)、爆發期(各行各業開源閉源大模型層出不窮,形成百模大戰的競爭態勢)。
截止目前為止,國內已發布開源、閉源通用大模型及行業大模型已有上百個,SuperCLUE梳理了2023年值得關注的大模型全景圖。
2. 2023年國內外大模型發展趨勢 過去半年,國內領軍大模型企業實現了大模型代際追趕的奇跡,從7月份與GPT3.5的20分差距,每個月都有穩定且巨大的提升,到11月份測評時已經完成總分上對GPT3.5的超越。
數據來源于SuperCLUE基準得分(7月-12月) 我們可以看到GPT3.5和GPT4在中文上的表現情況基本一致,在11月份測評結果中顯示,在中文能力都有一定的下滑,而國內頭部模型則展現了繼續穩健提升的能力。在12月份的測評結果中可以看到,國內第一梯隊模型與GPT4的差距在縮小。但仍有較大的距離需要追趕。
數據來源于SuperCLUE基準得分(7月-12月) 說明: 趨勢展示,選取了7月-12月SuperCLUE-OPEN測評分數。國內代表性模型,選取了文心一言、通義千問、ChatGLM。原因是綜合考慮了過去半年SuperCLUE測評結果、長期穩定迭代及對國內大模型生態的貢獻;GPT4成績,由GPT4-API(7-9月)與GPT4-Turbo(10-12月)組成,用以表現國外最好模型發展。 大模型綜合測評結果 1. 測評模型列表 本次測評數據選取了SuperCLUE-12月測評結果,模型選取了國內外有代表性的26個大模型在12月份的版本。
2. SuperCLUE模型象限 SuperCLUE評測任務可劃分為基礎能力和應用能力兩個維度。 基礎能力,包含:專業與技能、語言與知識(不包括角色扮演)、傳統安全; 應用能力,包括:工具使用、角色扮演。 基于此,SuperCLUE構建了大模型四個象限,它們代表大模型所處的不同階段與定位,其中【潛力探索者】代表模型正在技術探索階段擁有較大潛力;【技術領跑者】代表模型聚焦基礎技術研究;【實用主義者】代表模型在場景應用上處于領先定位;【卓越領導者】代表模型在基礎和場景應用上處于領先位置,引領國內大模型發展。 SuperCLUE模型象限
3. 國內外大模型總體表現
來源:SuperCLUE, 2023年12月28日 國內外差距依然明顯。GPT4-Turbo總分90.63分遙遙領先,高于其他國內大模型及國外大模型。其中國內最好模型文心一言4.0(API)總分79.02分,距離GPT4-Turbo有11.61分,距離GPT4(網頁)有4.9分的差距。 必須看到的是,過去1年國內大模型已經有了長足的進步。綜合能力超過GPT3.5和Gemini-Pro的模型有11個,比如百度的文心一言4.0、阿里云的通義千問2.0和Qwen-72B-Chat、OPPO的AndesGPT、清華&智譜AI的智譜清言、字節跳動的云雀大模型等都有比較好的表現。 另外國內開源模型在中文上表現要好于國外開源模型,如百川智能的Baichuan2-13B-Chat、阿里云的Qwen-72B、Yi-34B-Chat均優于Llama2-13B-Chat。 國外模型平均成績 VS 國內模型平均成績
在SuperCLUE測評中,國外模型的平均成績為69.42分,國內模型平均成績為65.95分,差距在4分左右。可以看出,國內外的平均水平差距在縮小,11月差距在10分左右。 4. 國內大模型競爭格局 通過SuperCLUE測評結果發現,國內大模型的第一梯隊有了更多新的模型加入。頭部模型如文心一言4.0、通義千問2.0引領國內大模型的研發進度,部分高質量大模型緊追不舍,分別在閉源應用和開源生態中形成自己獨特的優勢。
來源:SuperCLUE, 2023年12月28日 從國內TOP19大模型的數量來看,創業公司有9個,大廠有10個,占比幾乎持平。
從大廠和創業公司的平均成績來看,大廠研發的大模型平均成績為69.42分,創業公司研發的大模型平均成績為62.09分,差值約6.33分,較11月份差距在略有增大。這說明大廠在大模型競爭中長期資源投入方面有一定優勢。
5. 國內大模型歷月前三甲 過去八個月國內模型在SuperCLUE基準上的前三名。
來源:SuperCLUE 曾經取得過SuperCLUE月榜首位的大模型有6個。分別是文心一言、BlueLM、SenseChat3.0、Baichuan2-13B-Chat、360智腦。其中,百度的文心一言登頂SuperCLUE月榜的次數最多,分別在7月、11月、12月取得了SuperCLUE最好成績。 我們可以看到,在國內大模型技術發展初期階段,各家大模型公司都投入了巨大的人力、算力和數據資源,以至于每個月測評結果的前三甲都不同程度的變化,經常會因為新發布的高質量模型引起榜單的變化。預計未來一年同樣會發生類似的情況。也非常期待有高質量模型能夠持續保持非常高的水準。 6. 大模型對戰勝率分布圖 從勝率來看,全球領跑者GPT4-Turbo勝率為41.77%,和率為52.46%,大幅領先于其他模型,而敗率僅為5.77%,足以說明GPT4-Turbo對GPT3.5在各項能力上的全面壓倒性優勢。而國內模型中,百度的文心一言4.0勝率國內最高,接近30%。勝率超過25%的模型有智譜清言、通義千問2.0和AndesGPT。
來源:SuperCLUE, 2023年12月28日 在200億參數量級的開源模型中Baichuan2-13B-Chat的勝率排在首位,展現出不俗的對戰能力。排在2至3位的是XVERSE-13B-2-Chat、Qwen-14B-Chat,同樣表現可圈可點。 從勝率分布數據可以發現,所有模型的和率都在50%以上。這說明國內外大部分模型在基礎題目上與GPT3.5的水平相近,隨著任務難度的提升,不同模型的表現才會有區分度。后續的測評數據會在題目難度的區分性和評價顆粒度上加強提升。 7. 主觀與客觀對比 通過對比模型在主觀簡答題OPEN和客觀選擇題OPT上的不同表現,可以發現,國內大模型多數擅長做選擇題。普遍選擇題的分數會高于簡答題的分數。
注:計算分值為模型的OPEN分與OPT分值的差值,用以觀察模型在主觀題和客觀題上的不同表現。數據來源:SuperCLUE, 2023年12月28日 其中,文心一言4.0和智譜清言表現相對穩定,分別為(-13.38)和(-14.01)。GPT-4 Turbo的表現最為穩定,差值僅有0.86。 SuperCLUE認為,客觀題相對主觀題更容易通過題庫形式進行訓練和提升;同時也由于客觀題中包含中文特性問題,中文模型自然有一定的優勢,所以應該綜合來看模型的評測效果。 值得關注的是,在本次測評中,國外的代表性大模型如GPT4的不同版本、Claude2、Llama2都很好的穩定性表現,值得國內大模型進一步分析研究。 8. 開源競爭格局 總體上國內開源模型表現較好,成績最好的開源模型在中文的某些場景或任務上接近GPT4,其中Qwen-72B-Chat和Yi-34B-Chat總分上已經超過GPT3.5,Baichuan2-13B-Chat也有接近GPT3.5的表現。
來源:SuperCLUE, 2023年12月28日 總體上大版本(如34B)的模型優于中小版本(13B、6B)的開源模型,更大的版本(如72B)的模型表現要更好。開源模型的發展也從最開始的6B,到13B,到現在更大的34B、72B的開源模型。 雖然也有少量大廠(阿里云)參與,但眾多的創業公司是開源模型的主力,如智譜AI、百川智能、零一萬物和元象科技。 具體內容如下
來源:新華社研究院中國企業發展研究中心
近日,新華社研究院中國企業發展研究中心發布《人工智能大模型體驗報告3.0》(以下簡稱報告)。報告顯示,迭代風潮之下,大模型產品正在迅速適應并引領市場變革。其中,訊飛星火、商湯商量和智譜AI-ChatGLM等廠商表現總體優秀。
報告顯示,大模型廠商在技術實力上呈現出百家爭鳴態勢。不同廠商在產品特點和優勢上各有千秋。一些廠商在安全性能上表現出色,通過加強模型的魯棒性和數據保護措施,為用戶提供更可靠、更放心的服務。另一些廠商則在易用性上下功夫,致力于降低用戶的學習曲線,使產品更貼近用戶需求,提升用戶體驗。 為進一步直觀感受我國當前主流科技企業所推出的大模型產品的現狀、優勢和特點,新華社研究院中國企業發展研究中心于今年10月啟動了本次測評研究。與前兩次發布的《人工智能大模型體驗報告》相比,本次測評在多個方面進行了升級。 本次研究抓取了2023年10月25日-2023年11月6日的數據,通過人機互動提問等形式,對國內主流大模型進行使用體驗評測。在評測過程中,不僅考慮模型產品的實際表現,還深入評估了廠商的技術實力和未來發展潛力。此外,評測題庫擴充到了1000道,并精選其中的400道進行實際問答測試。這大大提升了評測的廣度和深度,能更準確地反映大模型在不同場景和問題下的實際表現。 報告顯示,與2023年8月相比,當前中國大模型產品進步顯著。具體來看,科大訊飛星火繼續保持領先優勢,商湯商量、智譜AI-ChatGLM等廠商整體表現優秀。針對各維度能力測評,該報告還給出了相應的案例展示和分析。
在基礎能力部分,科大訊飛星火表現搶眼,能夠準確地理解指令,并且能夠生成圖像;字節跳動豆包同樣能較為準確地理解指令并且完成部分生產圖像的指令;智譜AI-ChatGLM和瀾舟科技孟子都能較為準確地理解指令,表現優良。 在智商部分,科大訊飛星火在回答基本正確的同時能夠理解指令,不給出多余的回答;商湯商量、瀾舟科技孟子和智譜AI-ChatGLM大多數時候能夠根據指令回答問題。 在情商部分,各大模型表現差距不大。在給定的場景中基本均能展現較高的靈活性及人文關懷。其中,商湯商量、騰訊混元所給方案詳盡,問題切入角度多樣,且一定程度上引導用戶進行更深入的思考。科大訊飛星火、字節跳動豆包、阿里通義千問、智譜AI ChatGLM和昆侖萬維天工在分析問題時能夠考慮到不同的策略,并給出令人信服的理由。總體具備較高的情商能力。 在工作提效部分,在不同專業技能場景下測評模型均能一定程度上提升問題分析和解決水平。科大訊飛星火、商湯商量和字節跳動豆包不僅能夠較好地解答日常疑惑,在法學、經濟學、文學方向上也表現不凡,能夠以較快的速度響應并給出較為準確可信的結果。360智腦、瀾舟科技-孟子、智譜AI-ChatGLM在多語種翻譯、代碼編程和文字摘錄方面表現優異,給出的回答能夠起到輔助作用,并為專業從業人員提供參考。 報告還顯示,隨著大模型快速升級迭代,大模型的技術能力開始越來越多地體現在產品能力上。在C端,職場、營銷、出行、生活、公文、客服等多個場景個人助手陸續上線;在B端,制造、電力、金融、手機、傳媒等行業的大模型和產業融合優秀案例也在不斷出現。 報告認為,雖然人工智能大模型的發展取得了較大進步,但不可忽視的是,人工智能大模型依然存在不穩定等問題,需要進一步解決,另外大模型的安全問題也不容忽視。報告同時指出,人工智能大模型將進一步推動數字經濟和產業經濟的深度融合,掀起新一輪技術革命,為社會經濟發展提供源源不斷的科技動力。 具體內容如下:
來源:弗若斯特沙利文 近日,弗若斯特沙利文(Frost & Sullivan,簡稱“沙利文”)發布《AI 大模型市場研究報告(2023)——邁向通用人工智能,大模型拉開新時代序幕》。 報告認為,伴隨基于大模型發展的各類應用的爆發,尤其是生成式 AI,促使大模型帶來的價值進一步升級到人類生產力工具的顛覆式革新,逐漸拉開了通用人工智能(AGI)的發展序幕。 在通往AGI時代的旅程上,大模型和人類反饋的強化學習(RLHF)的結合,不僅重構了AI開發范式,未來軟件80% 的價值將由 AI 大模型提供,剩余 20% 會由提示工程和傳統業務開發組成,開發者的生產力將得到極大釋放;與此同時,AI的發展也將由之前單向發展的數據飛輪升級到不斷迭代進化的智慧飛輪,更高效的解決海量的開放式任務。 報告指出,中國大模型廠商的成功因素主要包括:全棧大模型訓練與研發能力、業務場景落地經驗、AI安全治理舉措、以及生態開放性4個方面,其中全棧大模型訓練與研發能力還包括數據管理經驗,AI基礎設施建設與運營,以及大模型系統和算法設計3個部分。這些成功因素分別體現著大模型廠商的產品技術能力、戰略愿景能力、生態開放能力三個維度。 基于這三個維度,沙利文制定了超過70個評估指標,對大模型廠商進行了全面的能力評估。 關鍵發現點
AI大模型的高速發展離不開底層技術支持和應用場景迭代。大模型作為AGI時代的曙光,相關廠商也將迎來廣闊的發展空間。本報告將呈現從發展現狀、驅動因素洞察AI大模型廠商競爭與發展關鍵點,并推演競爭格局的邏輯分析過程: 前瞻洞察:
通向AGI的技術路徑具有多元性,目前大模型是最佳實現方式。大模型具有強大的泛化性、通用性和實用性,能夠降低AI開發門檻、提高模型精度和泛化能力、提高內容生成質量和效率等多種價值,實現了對傳統AI技術的突破,并成為AGI的重要起點。 進而將AI發展由數據飛輪升級到智慧飛輪,最終邁向人機共智。大模型和人類反饋的強化學習(RLHF)的結合,進一步重構了AI開發范式,進入大模型主導的軟件2.0時代。另一方面,AI開發則形成新的“二八定律”,開發者的生產力將得到極大釋放。 驅動因素:
大模型“基礎設施-底層技術-基礎通用-垂直應用”發展路線逐漸清晰,國內各廠商加速戰略布局,加大資金和技術投入,迎頭趕上全球大模型產業化浪潮,本土化大模型迎來發展新機遇。整體上,行業驅動因素主要包含三個層面: (1)政策端:政策環境持續優化,賦能AI大模型市場高速發展。 (2)供給端:下一代AI基礎設施等快速發展,助力大模型應用落地。 (3)需求端:AI市場高景氣,大模型下游行業需求旺盛。 行業觀點:
大模型未來發展將趨于通用化與專用化并行、平臺化與簡易化并進。同時,MaaS模式將成為AI應用的全新形式且快速發展,重構AI產業的商業化結構生態,激發新的產業鏈分工和商業模式。未來,大模型將深入應用于用戶生活和企業生產模式,釋放創造力和生產力,活躍創造思維、重塑工作模式,助力企業的組織變革和經營效率,賦能產業變革。 關鍵成功因素:
大模型面臨算力需求大、訓練和推理成本高、數據質量不佳等挑戰。一個可對外商業化輸出的大模型的成功,要求其廠商擁有全棧大模型訓練與研發能力、業務場景落地經驗、AI安全治理舉措、以及生態開放性4大核心優勢,才能保證其在競爭中突出重圍。其中,全棧大模型訓練與研發能力還包括數據管理經驗,AI基礎設施建設與運營,以及大模型系統和算法設計3個關鍵要素。 競爭格局:
在競爭格局漸趨明晰的過程中,相關廠商需跨越技術、人才、資金等壁壘,在產品技術能力、戰略愿景能力、生態開放能力三大維度上展開角逐。通過遴選,報告選擇了5家大模型廠商,分別為商湯、百度、阿里巴巴、華為、騰訊,評價模型包含15個一級指標、56個二級指標,對廠商大模型的各個能力進行評估。 用戶建議:
通過此報告能夠了解大模型廠商的競爭態勢,關注領先廠商,內部創建大模型戰略文件,明確其優勢、帶來的風險和機遇,以及部署路線圖,針對具體的用例,權衡模型的優勢和風險,并選擇合適場景試點、評估大模型的應用價值。 具體內容如下
來源:浪潮 近日,IDC與浪潮信息聯合發布《2022-2023 中國人工智能計算力發展評估報告》(以下簡稱《報告》)。《報告》指出,中國人工智能計算力繼續保持快速增長,2022年智能算力規模達到268百億億次/秒(EFLOPS),超過通用算力規模。預計未來5年中國智能算力規模的年復合增長率將達52.3%。 《報告》從人工智能計算力產業發展趨勢、區域算力分布和行業滲透度等維度進行全面評估,旨在科學描繪中國人工智能發展的階段和整體情況,為推動數字經濟與實體經濟的融合提供極具價值的參考依據和行動建議。 01
智能算力規模持續擴大,算力、算法基建化成為共識
智能算力對于提升國家、區域經濟核心競爭力的重要作用已經成為業界共識。 隨著“東數西算”工程的啟動以及智能計算中心的建設,從國家層面實現有效的資源結構整合,助力產業結構調整,構建更為健全的算力、算法基礎設施。 目前,國家在8地啟動建設國家算力樞紐節點,并規劃了10個國家數據中心集群,協調區域平衡化發展,推進集約化、綠色節能、安全穩定的算力基礎設施的建設。
中國智能算力規模及預測,2019-2026
IDC預測,中國智能算力規模將持續高速增長,預計到2026年中國智能算力規模將達到1271.4EFLOPS,未來五年復合增長率達52.3%,同期通用算力規模的復合增長率為18.5%。 02
人工智能城市排行榜
《報告》針對不同城市在人工智能投資規模、相關政策支持力度、政策落地情況和實施進展、人工智能技術成熟度,以及勞動供給等維度的情況,對中國城市人工智能發展進行綜合評估。 在2022年中國人工智能城市排行榜中,北京、杭州、深圳繼續保持前三名,上海和廣州分列第四、五名,其中北京連續四年蟬聯首位,天津首次進入前十,成都、蘇州、南京、濟南保持前十。 綜合TOP10城市發展情況,頭部城市的共性特征是,較早的政策引導和配套政策保障,充分的智算基礎設施規劃、投入,達到上百家AI企業集聚、十萬級人才保障,千億級AI產業集群規模。
近五年人工智能TOP10城市排名變化
城市智能算力的投入已經成為推動區域數字經濟發展,加速人工智能產業創新的重要支撐,除了TOP10城市之外,合肥、武漢、長沙等多個城市在自身產業優勢及各種因素推動下,人工智能應用也取得了較大進展。 此外,一些城市深耕特定的人工智能應用并取得了明顯成果,成為城市智能化新標簽,如安徽宿州淮海智算中心、浙江青田元宇宙智算中心陸續投建。 03
互聯網、金融、政府、電信和制造等行業AI滲透度提升
從行業維度看,2022年中國人工智能行業應用滲透度排名前五的行業依次為互聯網、金融、政府、電信和制造。與21年相比,行業AI滲透度明顯提升。 其中,互聯網行業依然是人工智能應用滲透度和投資最高的行業;金融行業的人工智能滲透度從2021年的55提升到62,智能客服、實體機器人、智慧網點、云上網點等成為人工智能在金融行業的應用典型;電信行業的人工智能滲透度從2021年的45增長到51,人工智能技術融入電信網絡的構建、優化,并為下一代智慧網絡建設提供支撐;制造行業的人工智能滲透度從40增長到45,預計到2023年年底,中國50%的制造業供應鏈環節將采用人工智能。
中國人工智能行業滲透度,2022vs2021
從場景應用維度看,智能化場景在行業的落地隨著時間的推移,正呈現出更加深入、更加廣泛的趨勢。 人工智能持續為提升用戶體驗做出貢獻,當前諸如智能客服、智能推薦、精準營銷等場景深入落地到各行業;人工智能也在精準科學防疫,加強公共衛生安全體系建設中承擔重要角色,在病毒演變預測、疫苗藥物研發、輔助診斷等維度實現廣泛應用;長期來看,企業通過在數字人等數字化營銷內容創作領域布局,創造差異化的營銷體驗,升級品牌形象;另外,科學家們越來越多地利用人工智能技術和方法,從數據中建立模型,重點圍繞新藥創制、基因研究、新材料研發等領域加速對前沿科學問題的探究。
人工智能應用場景發展
04
算力多元化發展提速,大模型加速行業落地
《報告》從算力層面,對人工智能芯片、服務器、 計算架構、算法及應用等方面的發展近況進行了全面分析。 從整體看AI服務器是人工智能市場增長的主力軍。IDC數據顯示,2021年全球人工智能服務器市場的同比增速為39.1%,超過全球整體人工智能市場增速(20.9%),是整體人工智能市場增長的推動力。中國AI服務器市場領跑全球,2021年人工智能服務器市場規模59.2億美元,與2020年相比增長68.2%,預計到2026年,中國人工智能服務器市場將達到123.4億美元。 從人工智能芯片角度,人工智能產業技術不斷提升,產業AI化加速落地,推動全球人工智能芯片市場高速增長。IDC預計,到2025年人工智能芯片市場規模將達726億美元。異構計算成為主流趨勢,未來18個月全球人工智能服務器GPU、ASIC和FPGA的搭載率均會上升,算力多元化發展趨勢明顯。 從計算架構發展來看,基于 DSA( Domain-Specific Architectures)思想設計的人工智能芯片正在成為主導,推動了人工智能芯片多元化發展。多元算力從“能用”到“好用”并且為企業創造業務價值,離不開通用性強、綠色高效、安全可靠的計算系統的支持。業內正在推動多元算力系統架構創新,基于計算節點內和節點間的互聯技術破局現有計算架構的瓶頸,通過充分調動起多芯片、多板卡、多節點的系統級能力,實現各種加速單元以及跨節點系統的高效協同,提升計算性能。 《報告》對于大模型的行業落地和發展情況也進行了分析。IDC調研顯示,未來超過80%的組織會優先考慮購買預先訓練好的人工智能模型。大模型是智算力驅動下典型的重大創新,被認為是“通用智能”的雛形,是業內探索實現普惠人工智能的重要途徑之一。 大模型發展的背后是龐大的算力支撐,例如AI+Science領域的AlphaFold2、自動駕駛系統、GPT-3等模型訓練需要幾百甚至幾千PD(PetaFlops/s-day,PD)的算力當量支持。 2022年,大模型正在成為AIGC領域發展的算法引擎,文生圖、虛擬數字人等AIGC類應用將快速進入到商業化階段,并為元宇宙內容生產帶來巨大的變革。 05
智能算力成為數字化創新的源動力
人工智能算力的增長為人工智能的持續創新發展提供支撐。宏觀層面,人工智能算力為國家創新力的發展帶來實質性推進,不僅在應用科學的突破上發揮了重要作用,也開始滲透到基礎科學領域,極大提高了科學研究的效率和科學發展的進程。 《報告》指出,人工智能應用正在從單點技術到多種技術能力融合方向發展、從事后分析向事前預判和主動執行方向發展、從計算智能和感知智能向認知智能和決策智能方向發展,創新應用場景逐步增多。 未來五年,隨著人機交互、機器學習、計算機視覺、語音識別技術的成熟,人工智能將在企業市場中加快應用與落地,智能算力將成為未來創新的核心推動力。 具體內容如下
來源:阿里研究院
近日,阿里研究院、智譜AI聯合發布《2023全球數字科技發展研究報告—全球科研實力對比》,報告認為,中國數字科技基礎研究勢力增長勢頭強勁,增量上已經趕超美國,但在高價值部分同發達國家仍有不小差距。未來需要產、學、研一起努力,共同推動中國數字技術產業向價值鏈高端躍升。
報告對全球數字技術論文進行全景式梳理分析。結果顯示,中美兩國在數字科技論文整體影響力上實力相當,其中國產出居世界第二,僅次美國。領先全球其他國家的優勢明顯。但是,中國數字科技領域Top 1%“頂尖論文”數量明顯少于美國,且平均被引量也明顯落后于美國。
中國論文總量和“頂尖論文”增速均與美國實現“黃金交叉”
隨著科研實力的逐步增強,中國近年來增長勢頭非常突出,中國與美國的差距在逐年縮小。數據顯示,中國2019年數字科技領域論文發表數量開始超過美國,且在2021年拉開較大差距。2020年開始“Top1%”論文數量反超美國。都與美國出現了“黃金交叉”,并逐年擴大與之優勢。 ** **
2012-2021年中美兩國論文發表數量變化態勢
** **
2012-2021 年中美兩國被引量 Top1% 論文數量變化
美國加州大學和中國科學院是全球生產數字科技“頂尖論文”最多的機構
從研究機構上看,中美兩國最重要的數字科技基礎研究機構分別為中國科學院和美國加州大學。其中,中科院數字科技論文發表數量高居全球第一,領先加州大學萬余篇。但在“Top1%”論文方面,加州大學發表數量多于中科院。另外,在平均引用率方面,中科院在前10強榜單上墊底。美國斯坦福大學、麻省理工學院和哈佛大學等機構被引用次數優勢明顯。
全球數字科技領域論文數量前10強機構
中國數字科技專利總數全球遙遙領先,但高價值專利落后于美日韓三國
全球數字技術專利對比,中國是數字技術專利大國,而非強國。雖然在數字技術專利數量上全球領先,中國的數字科技專利總量全球第一,是排名第二美國的2.9倍但中國數字技術高價值專利(市場價值100萬美金以上)數量在全球相對落后,美國數字科技高價值專利數量是中國的8倍,仍與世界頂級水平存在一定距離。
全球數字科技專利前10強國家
整體看,中國數字技術領域基礎研究,在論文與專利數量上有大幅度提升,高價值部分同發達國家研究機構相比,仍有一些差距。專利是傾向于應用技術的科研成果,其市場價值直接反映該技術應用產品處于產業價值鏈的位置。從專利市場價值分布看,中國數字技術專利價值在 30 萬美元以下的占 98%,因此中國數字技術產業仍處于全球價值鏈低端。論文是傾向于基礎研究的科研成果,往往是科技創新突破的先導。未來中國數字科技的發展前景在于從日益強大的基礎研究成果中實現實際應用轉化,推動數字技術產業向價值鏈高端躍升。 具體內容如下
來源:中國工業互聯網研究院 2022年11月7日,中國工業互聯網研究院在2022全球工業互聯網大會上發布了《全球工業互聯網創新發展報告》(以下簡稱“報告”)。報告從發展政策、網絡技術、平臺生態、安全保障、人才體系、產業經濟等六個維度,系統總結了全球工業互聯網發展情況。
發布內容全文
全球工業互聯網創新發展報告
中國工業互聯網研究院院長 魯春叢 (2022年11月7日 遼寧沈陽)
《全球工業互聯網創新發展報告》是在去年發布的《工業互聯網創新發展成效報告(2021-2023年)》基礎上對全球發展的新觀察和新審視。《報告》包括六個方面內容。 **第一,主要國家數字化政策密集發布。**近年來,深化數字技術應用、推動數字化轉型已成為各國發展實體經濟、培育競爭優勢的普遍選擇。美國連續十年推進先進制造業戰略,加速制造業數字化的技術創新和應用。歐盟實施“工業5.0”戰略,推動數字化綠色化雙轉型,構建以人為本、彈性、可持續的產業鏈供應鏈。特別是疫情發生以來,產業鏈供應鏈已成為數字化發展的關鍵基礎和重要保障。德國發力“工業4.0”,以智能工廠、智能產線為基礎,著力鞏固制造業競爭優勢。英法日等傳統工業強國和新興經濟體都在強化數字技術優勢,提高制造業競爭力。可以說,工業互聯網“不是工具的革命,而是革命的工具”,正在全球形成共識。我國體系化推進工業互聯網發展,各領域支持政策不斷完善,地方支持力度不斷加大,政策環境不斷優化,為推動數字化轉型注入強勁動力。 **第二,工業互聯網網絡技術創新活躍。**技術邊界不斷融合。工業現場復雜環境推動組網技術融合貫通,工業無線網絡成為傳統工業現場總線的重要補充,5G+TSN等融合技術加快發展。工業設備的海量連接和頻繁交互,對工業數據實時分析提出更高要求,推動形成云網邊端融合的網絡技術架構,帶動云化PLC、邊緣智能終端等新型OT技術加速創新。技術專利快速增長。從總體看,工業互聯網網絡技術的全球專利申請量近10年年均增速超20%。從新興領域看,5G、TSN、工業以太網等新型網絡技術全球專利申請多年來均保持兩位數增速。分級分業應用加速推進。新型網絡技術快速演進迭代,已初步滿足工業現場對大帶寬、低時延、廣連接、高可靠的通信要求,正在逐步融入生產制造全環節、全過程,創新應用持續深化。特別是我國在保持5G領先基礎上,5G和工業融合進程不斷加快,已在制造業、采礦、能源等重點行業形成了20多個較為普遍的應用場景。 **第三,工業互聯網平臺生態不斷壯大。**全球平臺發展迅猛。新主體不斷涌入,微軟、霍尼韋爾等龍頭企業加快工業互聯網平臺建設,加速工業大數據、人工智能、區塊鏈、邊緣計算、工業元宇宙等新一代信息通信技術應用,推動工業互聯網平臺服務能力創新。新生態加速構建,西門子、SAP等工業基礎軟硬件企業不斷深化數字業務集成,打造強強聯合的生態化服務體系。特別是近年來,企業巨頭并購工業軟件公司數量顯著增加,進一步推動平臺生態重構。我國工業互聯網平臺建設快速推進。“綜合型+特色型+專業型”平臺體系初步構建。28個跨行業跨領域平臺縱向整合行業資源、橫向跨界賦能,加速構建產業生態。特色型平臺融合應用持續深化,面向重點行業加速沉淀知識經驗。專業型平臺在數字孿生、工業智能、工業大數據分析等特定領域不斷深入,服務能力加快提升。“六大模式”應用持續深化,“平臺+園區”“平臺+基地”等模式加速推廣,行業數字化轉型解決方案供給能力持續增強。 **第四,工業互聯網安全防護日益深化。**安全技術加速演進。監測感知、威脅防護、處置恢復等通用安全技術的工業應用持續深入,在應對網絡安全、設備安全、控制安全、數據安全等方面發揮了積極作用,不斷提升工業企業網絡安全防護能力。零信任、人工智能、區塊鏈、邊緣計算安全等新興技術逐步拓展工業互聯網安全技術架構,為增強工控系統內生安全防護能力、應對新型攻擊威脅等提供了新選擇、新路徑。重點企業積極布局。國內外網絡解決方案供應商和網絡安全企業積極拓展工業互聯網安全業務,聚焦關鍵基礎設施網絡安全防護、工控安全等重點領域,加大研發投入與產品服務創新,工業互聯網安全技術支撐能力加快提升。 **第五,工業互聯網人才體系加速構建。**全球數字人才普遍缺失,歐盟數字技能人才儲備不足、我國工業互聯網人才缺口較大,人才問題已成為制約工業互聯網創新發展和制造業數字化轉型的關鍵因素。全球數字人才逐步集聚,從區域看,進一步向北美、歐洲、亞太經濟發達地區主要城市群集中。從行業看,以制造業為代表的實體經濟成為數字人才的重要就業選擇。各國加速人才體系建設,積極培養具備數字素養與技能的復合型人才。我國從標準體系、評價機制、學科設置、產教融合等方面加快工業互聯網人才培養,取得積極進展。 **第六,工業互聯網產業經濟蓬勃發展。**全球工業互聯網產業發展勢頭總體向好。2021年,全球工業互聯網產業增加值規模達到3.73萬億美元,年均增速近6%。工業大國領跑全球產業發展,在59個主要工業國家中,美中日德四國工業互聯網產業增加值規模占比超過50%。美國工業互(物)聯網聯盟(IIC)、德國工業4.0平臺等組織聚焦差異化方向持續推動產業生態建設。我國工業互聯網經濟增長強勁。2021年,我國工業互聯網產業增加值超4萬億元,其中核心產業增加值達到1.17萬億元,名義增速超16%。工業互聯網平臺創新合作中心、工業互聯網產業聯盟等合作載體快速壯大,推動產學研用深度同創新。
具體內容如下