來源:世界互聯網大會 近日,在烏鎮召開的人工智能賦能產業發展論壇上,來自企業、研究機構、國際組織等各方的代表,共同發布了《發展負責任的生成式人工智能研究報告及共識文件》。 回顧人工智能60余年的發展歷程,技術突破不僅會創造發展機遇,也會帶來相應的挑戰。統籌人工智能發展和治理逐漸成為全球共識,自2016年以來,全球多個國際組織、國家、地區及產業界,積極探索人工智能發展與治理路徑,已經形成了系列共識原則、治理要求、實踐范式等。考慮到人工智能尚處在快速發展的過程中,相關工作仍需要持續推進。 信息技術革命在進入人工智能階段之后,以生成式人工智能為代表的技術,又取得了長足的進步和發展。如《研究報告及共識文件》中所明確指出的那樣: 其一,在“模型、數據、算力”等三大要素持續迭代和高速演進的推動下,人工智能不斷在工程維度的發展和應用中,實現快速突破。就全球范圍的發展情況來看,Transformer為主的基礎模型依托相關研究主體的長期持續投入,通過ChatGPT、Stabel Diffusion、BLIP-2等,在大語言模型、視覺生成模型、多模態模型等細分領域,持續實現模型能力的躍升。這種躍升的主要體現,是參數規模進入1000億量級,處理復雜自然語言能力因此呈現顯著發展;在數據領域,多場景的大模型預訓練數據集不斷涌現,研究機構形成了通過發布微調數據集方式,提升預訓練用數據集的效能;合成數據解決訓練數據資源可持續性的探索也取得了較為顯著的成效;算力芯片和架構的持續迭代,在訓練效能、云邊端算力效能優化等方面,對生成式人工智能的發展提供了有效的支撐。 其二,應用前景催生了開源開放驅動生成式人工智能生態的迅速發展,整體趨向繁榮發展。從應用場景看,開源生態與開放驅動成為當下推動人工智能生態發展的主基調,模型迭代優化、研發門檻降低、縮短初創成本等,成為各方廣泛認知的主要優勢。與此相應的,在ChatGPT的刺激下,生成式人工智能的開發者社區迅速涌現,成為支撐和推動相關技術與應用發展的主渠道。Hugging Face、華為云AI Gallery、阿里巴巴、FlagOpen飛智、百度的飛槳星河等社區憑借各自比較優勢,在其中發揮了至關重要的作用。 其三,生成式人工智能的階段性高速發展再度激發了人們對于發展通用式人工智能的勇敢想象與積極探索。如《研究報告及共識文件》指出的那樣,由于生成式人工智能的這一輪突破,尤其是其中與多模態方向發展相一致的發展,催生了人們新的想象與探索:人們預期,伴隨著多模態生成模型技術的突破,能夠更好地理解和處理復雜的現實場景,或許將帶來更多的想象空間,比如可以探索將多模態生成模型與機器人技術結合等方式,繼而以某種形式盡可能趨近模仿人類感知復雜世界能力的呈現。 很自然的,生成式人工智能帶來的機遇和挑戰,同步存在: 從積極的角度看,生成式人工智能可能帶來的經濟增長前景,日趨明朗。根據麥肯錫2023年6月的樂觀預測,生成式人工智能每年可能為全球經濟增加2.6萬億至4.4萬億美元的價值。根據高盛研究,在滿足增長條件的情況下,生成式人工智能的突破將在10年內推動全球GDP增長7%。對生成式人工智能以及通用式人工智能未來發展前景的合理展望,有助于人們確信人類的生產活動和滿足特定要求的服務行業,未來均可能面臨顯著的增長前景,有理由保持樂觀預期。 從生成式人工智能的可能應用場景來看,現代社會的基礎服務體系可能獲得有效賦能,預期城市運營管理、災害救助與事故分析、實時預警與風險管理、定制化個性化的新型教育體系、新型就業崗位與就業機會、以及迫切需要得到實質性賦能的醫療和養老行業,均可能從人工智能的負責任發展中獲得實質性的收益。此外公益事業中的無障礙數字環境建設、全球文化成果保護和傳播,以及全球環境治理和可持續發展,也有希望從生成式人工智能的噴薄發展中得到全新的賦能與助力。作為高質量的“聰明”助手,生成式人工智能在助力科學研究中所具有的廣闊前景,也同時日趨清晰地呈現。 客觀而謹慎地看,生成式人工智能帶來的風險挑戰也是顯而易見的,預先訓練大模型時投喂的數據不可避免地存在缺陷,價值偏見、隱私泄露、數據污染等,如《研究報告及共識文件》所指出的那樣,是已經被廣泛察覺到的主要風險;算法模型的“幻覺”,虛假信息干擾,指向模型的網絡攻擊等,均揭示了人工智能發展帶來的新型安全隱患和風險;此外,高速技術迭代帶來的科技倫理失范以及人類社會發展失衡等問題,也日趨明顯地成為各方必須共同關注,并探究治理方案的關鍵所在;在更廣義的政治經濟學分析框架中,生成式人工智能對數字勞動和能源損耗等領域的重大影響,也已經到了必須早日提上議事日程的時候,其后帶來的發展,值得我們各方高度關注。 具體內容如下:
近日,畢馬威聯合中關村產業研究院通過行業調研和專家訪談,結合深入研究共同發布《人工智能全域變革圖景展望:躍遷點來臨(2023)》。 全球人工智能產業洞察
報告指出,全球人工智能企業數量由爆發式轉入穩步增長區間。截止2023年6月底,全球人工智能企業共計3.6萬家。人工智能企業數量逐年增長,2016年-2019年全球人工智能爆發式增長,每年新增注冊企業數量超3000家,尤其是2017年新增注冊企業數量達到頂峰(3714家)。2019年開始,人工智能新增注冊企業數量有所下降,2022年當年新增企業數量與2013年基本持平。 美國人工智能企業數量位居全球首位,中國緊隨其后,英國位居全球第三。美國人工智能企業約1.3萬家,在全球占比達到33.6%,中國占比為16.0%,英國為6.6%,以上三個國家的人工智能企業數量合計占到全球的56.2%。 截止2023年6月底,全球人工智能領域獨角獸總數達291家,分布在20個國家。來自美國的獨角獸企業有131家,占全球總數的45%:來自中國的獨角獸企業有108家,占全球總數的37%。 ** 人工智能發展十大趨勢**
大模型爆發以來,人工智能技術發日新月異,創新成果紛紛涌現,報告立足全球及中國的人工智能產業現狀,結合市場觀察提出人工智能產業未來發展的十大趨勢。 ** 趨勢一**
** 多模態預訓練大模型是人工智能產業的標配**
在算法方面,預訓練大模型發展起源于自然語言處理(NLP)領域,當前已進入“百模大戰”階段,預計隨著大模型創新從單模態轉向多模態,多模態預訓練大模型將逐漸成為人工智能產業的標配。目前,國內大模型雖在市場影響力方面稍遜色于GPT系列模型、PaLM-E等,但在中文語料訓練、中國文化理解方面具備本土優勢。 此外,國內制造業等實體產業為大模型提供了豐富的訓練數據和應用場景。未來,在大模型面向產業賦能方面,中國大模型極有可能后發先至,也會是國內大模型競爭的關鍵因素之一。 ** 趨勢二**
** 高質量數據愈發稀缺將倒逼數據智能飛躍**
數據方面,大模型的訓練需要大量的高質量數據,但是目前在數據質量方面還存在一定的問題,包括數據噪聲、數據缺失、數據不平衡等問題。這會影響大模型的訓練效果和準確性。 根據一項來自Epoch Al Research團隊的研究,高質量的語言數據存量將在2026年耗盡,低質量的語言數據和圖像數據的存量則分別在2030年至2050年、2030年至2060年枯竭。 這意味著,如果沒有新增數據源或是數據利用效率未能顯著提升,那么2030年以后,AI大模型的發展速度將明顯放緩。 ** 趨勢三**
** 智能算力無處不在的計算新范式加速實現**
算力方面,新硬件、新架構競相涌現,現有芯片、操作系統、應用軟件等都可能被推翻重來,預計有望實現“萬物皆數據”“無數不計算”“無算不智能”,即智能算力將無處不在,呈現“多元異構、軟硬件協同、綠色集約、云邊端一體化”四大特征。 ** 趨勢四**
** 人工智能生成內容應用向全場景滲透**
在AIGC(Artificial Intelligence Generated Content,人工智能生成內容)應用方面,其發展源頭在數字內容創作領域,從單模態內容到多模態數字化內容創建已初顯雛形,預計未來會進一步提高人類創造內容的效率,豐富數字內容生態,開啟人機協同創作時代,各種需要創意和新內容的場景,都可能被AIGC重新定義,AIGC向全場景滲透指日可待。 ** 趨勢五**
** 人工智能驅動科學研究從單點突破加速邁向平臺化**
AI4S(AI for Science,人工智能驅動的科學研究)應用方面,有望從單點突破加速邁向平臺化。在“單點突破”階段,AI4S發展由科研學者主導,數據、模型、算法及方法論的原創性是市場關注重點,AI4S在特定任務或場景中的“單點應用”初步證明了對應解決方案的落地價值。 ** 趨勢六**
** 具身智能、腦機接口等開啟通用人工智能應用探索**
AGI(General Artificial Intelligence,通用人工智能)應用方面,其技術原理強調兩大特性:一是需要基于先進算法實現智能處理和決策,包括深度學習、強化學習、進化計算等;二是需要具備和人類大腦相似的認知架構,包括感知、記憶、分析、思考、決策、創造等模塊。 ** 趨勢七**
** 人工智能安全治理趨嚴、趨緊、趨難**
人工智能安全治理呈現出趨嚴、趨緊、趨難三大特征,主要包括“黑箱”困境等技術安全挑戰,虛假信息、偏見歧視乃至意識滲透等應用安全挑戰,數據泄漏、篡改和真實性難驗證等數據安全隱患,此背景下,中美歐三國作為人工智能發展的領軍國和地區正積極開展相關立法,呈現出政策法規先行、監管趨嚴等特征。 ** 趨勢八**
** 可解釋AI、倫理安全、隱私保護等催生技術創新機遇**
人工智能在發展過程中面臨的技術倫理與社會倫理風險表明,人工智能安全、可信的發展之路任重道遠,在解決AI風險的過程中催生出可解釋AI、聯邦學習等技術創新機遇。其中,聯邦學習正成為新型的“技術基礎設施”,有望成為下一代人工智能協同算法,隱私計算和協作網絡的基礎,使數據在合法合規、安全高效的基礎上,實現數據價值流動。 ** 趨勢九**
** 開源創新將是AGI生態建設的基石**
開源的自由度越高,越有利于吸引更多開發者參與到生態建設中。AGI強調人工智能的通用性,意味著其生態需滿足大量細分場景和長尾需求,這種情況下,生態系統越是繁榮開放,越能窮盡可能地覆蓋所有專用化、場景化乃至碎片化的需求,保證AGI生態的豐富性和完整性。 進一步地,開發者越多,意味著底層模型和上層應用等的迭代速度也會越快。但是,開源也存在一定風險,對于產業生態中的主體企業來說,選擇開源某種程度上就意味著公開商業機密,不利于其構建競爭壁壘。此外,開源模式還可能會引發專利侵權風險,對開源的知識產權管理規則和流程規范建立提出了挑戰。 ** 趨勢十**
** 多型即服務(MaaS)將是AGI生態構建的核心**
商業模式關乎整體生態能否實現從價值創造到價值實現的完整閉環,目前AGI生態的商業模式主要以AIGC相關的商業模式為代表,主要體現為MaaS(Model as a Service,模型即服務)模式。該模式核心價值可歸納為:降低算法需求側的開發技術和使用成本門檻,使AI模型和應用成為簡單易用、觸手可得的工具。 具體內容如下
來源:人工智能計算大會 2023年是人工智能發展的重要轉折年,企業正加速從業務數字化邁向業務智能化。大模型的突破和生成式人工智能的興起為企業實現產品/流程的革新提供先進生產工具,引領企業和產業邁入智能創新的新階段。 大模型和生成式人工智能的發展顯著拉動了人工智能服務器市場的增長。IDC預計,全球人工智能硬件市場(服務器)規模將從2022年的195億美元增長到2026年的347億美元,五年年復合增長率達17.3%。 在中國,預計2023年中國人工智能服務器市場規模將達到91億美元,同比增長82.5%,2027年將達到134億美元,五年年復合增長率達21.8%。算力規模而言,預計到2027年通用算力規模將達到117.3EFLOPS,智能算力規模達1117.4EFLOPS;2022-2027年期間,預計中國智能算力規模年復合增長率達33.9%,同期通用算力規模年復合增長率為16.6%。 近日,在AICC2023中國人工智能算力大會上,國際數據公司(IDC)與浪潮信息聯合發布《2023-2024中國人工智能計算力發展評估報告》(簡稱《報告》)。《報告》指出,人工智能正在加速從感知智能到生成式智能邁進,中國人工智能算力市場規模快速成長擴大。 2023年,中國人工智能服務器市場規模將達91億美元,同比增長82.5%;智能算力規模預計達到414.1EFLOPS(每秒百億億次浮點運算),同比增長59.3%;2022-2027年期間,年復合增長率預計達33.9% 《報告》從算力規模、區域分布和行業滲透度等多維度,對我國人工智能計算力發展進行綜合評估,給出大模型和AIGC的發展將引發AI算力產業之變的核心洞察,并提出針對性的行動建議。作為中國AI算力發展“風向標”,《報告》第六次發布,旨在為推動中國人工智能產業的高質量發展提供參考。 ** 人工智能加速向行業和城市滲透**
《報告》通過多年持續跟蹤中國人工智能計算力發展狀況發現,從行業看,人工智能從單點應用到多元化應用、從通用場景到行業特定場景正在不斷深入,而AIGC在2023年快速發展,也在進一步賦能各行各業;從城市看,越來越多的城市參與到人工智能發展浪潮中,持續加大在相關領域的投資,不斷推進人工智能產業的發展。 在2023年人工智能行業滲透度排名中,Top5的行業依次為互聯網、電信、政府、金融和制造。此外,交通、服務、教育等行業在人工智能領域的投資力度也可圈可點。其中,互聯網依然是AIGC技術應用和研發的主戰場;電信行業排名從2022年的第四躍升至2023年的第二,主要歸因于運營商緊跟國家東數西算戰略,加速云數據中心、智算中心的建設。 在2023年中國人工智能城市排行榜中,北京、杭州、深圳繼續保持前三名。其中,北京在大模型領域表現突出,聚集了大批大模型企業。此外,位居TOP10的城市還有上海,蘇州,廣州,濟南,合肥、重慶和成都。整體來說,排名靠前的城市因具有更好的政策、資金和技術支持,可以穩定吸引更多的人才和企業聚集;智算中心的建設也是拉動地區實現人工智能發展的重要驅動力,既可以提升基礎設施建設水平,也為吸引更多企業共謀發展起到積極的推動作用。 ** AIGC引發算力產業“三變”**
2023年,由ChatGPT引爆的新一輪人工智能熱潮,開啟了由大模型驅動的AIGC時代。IDC調研顯示,67%的中國企業已經開始探索AIGC在企業內的應用機會或已經開始進行資金投入。 中國企業對生成式人工智能的態度 《報告》指出,當前在AIGC的帶動下,人工智能計算力技術及應用趨勢發生了較大的變化,體現為“三變: 一是計算范式之變。大模型和AIGC的發展加速了更高計算性能、更快互聯性能的算力基礎設施建設,推進人工智能在云-邊-端的覆蓋。此外,伴隨應用場景多樣性,底層基礎設施呈現多元化發展。 二是產業動量之變。AIGC可重構現有的工作方式,在內容創作、自動駕駛、零售、醫療等諸多領域改變著人們的生活和生產方式,同時也帶來更大的市場機會。算力、算法、應用、服務等諸多產業變量將成為創新的加速器,在算力生態鏈上的各個環節催生出新的玩家。 三是算力服務格局之變。由于基礎大模型的本地訓練成本不菲,企業將更多地使用已有的人工智能數據中心設施和生成式AI服務器集群,這將為算力服務市場帶來新機會。算力服務供應商要能夠提供定制化的基礎設施服務能力,滿足單個用戶對訓練和推理資源的獨占式、大規模、長時間使用的訴求,同時幫助用戶實現成本控制。 ** “以應用為導向、系統為核心”是算力升級新路徑**
大模型和AIGC的發展提升了智能算力需求,給計算市場帶來了發展機遇,同時也帶來了算力緊缺等挑戰。對此,《報告》認為,面對單芯片算力瓶頸、算力緊缺等問題,中國市場對于智能算力供給能力的衡量標準將發生變化——評估指標將從硬件性能向應用效果轉變,用戶在獲得算力服務的過程中,會更加以應用為導向進行綜合考量,增加對于諸如單位時間可處理Token數量、可靠性、時延、訓練時間和資金成本、數據集質量等指標的關注。 針對這一轉變,《報告》指出,算力供應商需要“以應用為導向、系統為核心”,構建算力基礎設施平臺,提高算力利用率,提升諸如卡間互聯、多節點間互聯等水平,支持靈活穩定擴展和彈性容錯,積極打造通用的人工智能軟件和硬件平臺,以先進的系統性能力滿足市場的應用需求。也就是說,與其過分關注單一芯片的性能強弱,不如根據人工智能業務場景需求,設計更具針對性的算力系統,實現整體性能最優。 具體內容如下:
來源:阿里云 近日,阿里云研究院、阿里云創新中心和阿里云中小企業事業部聯合發布了《專精特新企業數字化轉型升級研究報告》。 報告指出,伴隨新一輪科技革命的浪潮,以及全球產業鏈分工和分布加快重構,數字經濟和實體經濟深度融合發展,科技創新成為經濟發展的核心動能,關鍵技術成為產業發展的重要命脈,更成為大國博弈的焦點和必解的命題。進入新階段,面對新形勢,著力抓好和大力推動專精特新企業發展,將培優中小企業與做強產業相結合,加快培育一批專注于細分市場、聚焦主業、創新能力強、成長性好的專精特新企業,推動提升專精特新企業數量和質量,有利于助力實體經濟特別是制造業做實做強做優,加快實施創新驅動發展戰略,提升產業鏈供應鏈穩定性和競爭力,更好地引領中國經濟高質量發展并從根本上增強中國經濟發展的韌性。 針對專精特新企業進行數字化轉型的必要性,報告指出,數字化轉型升級對于專精特新企業提高領域專業化程度、提升管理精細化水平、強化產品特色化價值、增強技術創新性能力具有重要意義和價值。第一,通過業務流程數字化,再以數據驅動生產管理,能夠降低生產成本,提升生產效率,提高產品質量;第二,借助數字化生產工具可以提升內外部協同和管理效率,實現精細運營和敏捷管理;第三,憑借數字化技術平臺可促進產業鏈供應鏈上下游的融通發展和協作配套,提升自身經營能力與抗風險能力;第四,利用數字技術賦能能夠提高企業創新能力,加速科技創新應用落地,有利于培育壯大創新型領軍型企業。 根據阿里云組織的傾聽中小企業以及中小企業數字化能力測評的調研結果顯示,企業高層重視不夠、線上線下融合不充分、業務場景與數字應用結合點不明確、缺乏全面的數字化規劃設計和數字化運營能力較低等是中小企業目前面臨的主要挑戰和問題,而造成中小企業追求數字化過程中產生以上困境的主要原因為:一、數字化路徑不清,技術能力不足;二、數字化成本過高,顯性收益回報不明;三、數字化方案不匹配,陣痛期長。受訪的84.3%中小企業仍處于數字化轉型的起步探索和基礎應用階段,僅10.7%達到深度應用程度,仍有5%的受訪企業尚不具備數字化意愿和能力。 報告認為,數字化轉型升級已然成為促進專精特新中小企業高質量發展的必由之路,為使數字化轉型升級充分發揮出價值和效益,一方面專精特新中小企業需要提升自身的數字化意識和數字化能力,從思維認知、路徑規劃、人才培養、能力建設、技術應用等方面著手,構建包含管理機制、業務流程、組織架構、人員能力、技術支撐的全新體系,另一方面也需要政府部門、產業機構、龍頭企業和平臺企業的共同協力,從加大轉型政策支持、提升產業服務水平、促進產業生態融通、加強數字供給能力等多個方面,共同推動我國專精特新企業數字化轉型升級進程,加速實現云上創新與成長。 具體內容如下:
來源:中國信息通信研究院
2022年12月,“數據二十條”正式印發,確立了數據基礎制度體系的“四梁八柱”。隨著“數據二十條”等一系列政策措施相繼出臺,數據要素市場培育進展加速,暢通數據資源大循環的方向愈加明確。尤其是面對人工智能快速迭代、大模型與大數據相得益彰的發展態勢,數據要素戰略地位進一步凸顯。各主體加快數據要素領域布局,從多角度開展落地方案的深度探索,涌現出數據要素價值釋放新熱潮。 近日,中國信息通信研究院在“2023年數據要素發展大會”上發布了《數據要素白皮書(2023年)》。白皮書在《數據要素白皮書(2022年)》的基礎上,進一步探討數據要素理論認識,聚焦過去一年來數據要素探索過程中不斷涌現的新模式、新業態、新熱點,重點關注資源、主體、市場、技術四大方面的發展,期望能為社會各界進一步參與數據要素實踐探索提供有價值的參考。 白皮書核心觀點
公共、企業、個人三類數據有不同重點突破方向
在推進數據開發利用、釋放數據價值過程中,不同類型數據面臨不同的重點任務與關鍵問題,分類推進數據要素探索已成為當前共識。其中,如何加大供給規模、推動供給提質增效成為公共數據發展的關鍵問題;如何認定企業數據的業務貢獻,促進數據價值“顯性化”成為企業數據面臨的關鍵問題;如何在加強相關個人權益保護的基礎上進行開發利用是個人數據面臨的關鍵問題。 企業政府雙向發力推進可持續探索
企業和政府構成推進數據要素發展的核心力量。其中,企業是沖鋒在前的創新主體,政府則主要發揮有序引導和規范發展的作用。在數據要素市場建設過程中,企業側應不斷提升數據管理能力和應用能力,政府側應推動建立公平高效的機制,在扮演好各自角色的基礎上守正創新、雙向發力,共同推進數據要素發展的可持續探索。 數據流通場內外結合推動數據資源最優配置
數據要素市場是實現數據要素價值第三次飛躍的關鍵。數據在市場中流通使數據流向更需要的地方,讓不同來源的優質數據在新的業務需求和場景中匯聚融合,實現雙贏、多贏的價值利用。在此基礎上,不同的數據流通形態串聯起各類主體,推動場內外數據要素市場活躍探索,引導數據要素在供需關系與價格機制的作用下實現最優配置,創造更大的經濟效益。 數據技術基于業務需求加速創新與體系重構
數據技術是伴隨業務要求發展的。當前,第一代數據技術、第二代數據技術體系已基本成熟,第三代數據技術逐漸興起。新技術不斷涌現,云原生、軟硬協同、湖倉一體、人工智能、隱私計算、時空數據庫等技術在助力降本增效、促進安全流通和釋放數據價值方面發揮了重要作用。隨著數據規模爆炸式增長、數據類型日漸豐富,傳統大數據處理技術面臨著諸多挑戰,以滿足業務需求為導向的數據技術體系正不斷變革創新,在采集、存儲、計算、管理、流通、安全等方面加速重構。 具體內容如下:
來源:大數據技術標準推進委員會
日前,在2023可信數據庫發展大會上,《數據庫發展研究報告(2023年)》正式發布。 黨的二十大報告提出,堅持創新在我國現代化建設全局中的核心地位,加快實現高水平科技自立自強,加快建設科技強國。隨著新一輪科技革命和產業變革深入發展,互聯網、大數據、云計算、人工智能、區塊鏈等數字技術創新活躍,數據作為關鍵生產要素的價值日益凸顯,深入滲透到經濟社會各領域全過程,數字化產業正在成為全球經濟新的驅動引擎。 作為各行業數據存儲、計算、流通的基礎軟件,數據庫管理系統經過六十余年發展,理論技術不斷創新、產品形態日益豐富、產業生態加速變革、產業熱度持續升溫。當前,我國數據庫行業市場前景廣闊,產業欣欣向榮,正在經歷由“數量型”向“質量型”關鍵轉變期。 隨著數字化轉型深入推進和數據量的爆炸式增長,千行百業應用對數據庫的需求變化推動數據庫技術加速創新,全球數據庫產業快速發展,我國已經邁入第一梯隊。報告顯示,2022年全球數據庫市場規模為833億美元,中國數據庫市場規模為59.7億美元(約合403.6億元人民幣),占全球7.2%。預計到2027年,中國數據庫市場總規模將達到1286.8億元,市場年復合增長率(CAGR)為26.1%。2022年,公有云數據庫市場規模為219.15億元占市場總體的54.3%,較2021年增速51.6%,我國公有云數據庫市場規模首次過半。 此外,產業方面,報告從產業主體、研發模式、產品分布、推廣策略等方面,分析我國數據庫產業的主體特點、市場格局、發展態勢等;技術方面,報告梳理了數據庫技術發展在助力用戶降本增效、護航數據要素安全流通以及賦能新興業務場景三個方面的細分12個演進趨勢;應用方面,報告以金融、電信和制造業為代表,研究當前應用現狀、問題以及發展前景。 報告核心觀點
** 1、市場規模:全球近833億美元,我國公有云數據庫市場規模首次過半**
來源:CCSA TC601,2023年6月 圖 1 2022-2027年中國數據庫市場規模及增速
據CCSA TC601測算,2022年全球數據庫市場規模為833億美元,中國數據庫市場規模為59.7億美元(約合403.6億元人民幣),占全球7.2% 。預計到2027年,中國數據庫市場總規模將達到1286.8億元,市場年復合增長率(CAGR)為26.1%。按數據庫部署方式劃分市場規模,2022年中國公有云數據庫市場規模為219.15億元,較2021年增速51.6%,本地部署數據庫市場規模為184.45億元,較2021年增速14.4%,公有云和本地部署模式市場規模分別占總市場54.3%和45.7%,2022年公有云數據庫市場規模首次過半,預計2023年公有云市場占比將進一步擴大達到59.8%,規模達到323.16億元,本地部署模式市場增速達到17.8%,規模為217.24億元。 2、發展周期,全球數據庫發展經歷兩輪熱周期
來源:CCSA TC601,2023年6月
圖 2 全球數據庫企業開展業務時間
全球數據庫發展經歷兩次熱潮,21世紀后進入蓬勃發展期。全球數據庫企業起步于20世紀60年代,隨著80年代關系型數據庫的理論突破和技術創新,全球數據庫迎來第一波發展熱潮。步入21世紀后,PC互聯網逐步向移動互聯網發展,數據庫的應用場景不斷豐富,全球數據庫在2010-2019年進入發展高峰期,新興企業不斷成立。這十年間,一共出現了230家企業,全球48.7%的數據庫企業均成立于這一時期。中國數據庫產業始于20世紀末,并在2013年后迎來繁榮發展。2014-2022這段時期迎來發展高峰。 3、從地域看,全球數據庫產業聚集效應明顯
北京為我國數據庫產業貢獻主要力量。中國150家數據庫廠商總部大多集中在超一線城市。數量最多的前四名分別是北京、杭州、上海和深圳,數量為80、15、12、8個。天津、南京、廣州、成都數據庫企業數量均為4個,其中南京市和成都市由于高校資源豐富,成為很多數據庫企業設立研發中心的青睞地點。 4、從類型看,非關系型數據庫在全球范圍占比略大
來源:CCSA TC601,2023年6月 圖 3 全球數據庫產品類型分布 全球數據庫產品數量整體分布呈現以非關系型及混合型數據庫為主。據CCSA TC601統計分析,截止2023年6月,全球數據庫產品共有 655 款。除了早期的兩款網狀數據庫和層次數據庫,在剩余的653個數據庫產品中,關系型數據庫為309個,非關系型數據庫有344個,占比分別為47.3%和52.7%。非關系型數據庫中,鍵值型數據庫82個、時序數據庫53個、圖數據庫52個,在非關系數據庫中依次占比23.8%、15.4%和15.1%。
來源:CCSA TC601,2023年6月 圖 4 中國數據庫產品類型分布 我國數據庫產品數量呈現以關系型為主,非關系型數據庫為輔的局面。關系型數據庫156個,非關系型數據庫有82個,占比分別為65.5%和34.5%。非關系型數據庫中,圖數據庫24個、時序數據庫24個、鍵值數據庫10個、列存數據庫10個,在非關系數據庫中依次占比29.3%、29.3%、12.2%和12.2%。 5、從模式看,開源模式在全球范圍內發展勢頭迅猛
來源:CCSA TC601,2023年6月 圖 5 全球現存開源數據庫的開源時間
來源:CCSA TC601,2023年6月 圖 6 中國現存開源數據庫的開源時間
我國開源數據庫產品始于2010年前后,但開源數據庫在總數中占比較小,開源數據庫中七成為關系型數據庫。我國數據庫產品以商用為主,開源數據庫產品共有42款,商用和開源占我國數據庫產品總數分別為82.4%和17.6%。開源產品中,關系型數據庫29個,非關系型數據庫有13個,占比分別為69.0%和31.0%。我國開源數據庫整體起步較晚,在2017年之后迎來發展高峰。2017年至今,一共新增29款開源數據庫產品,近7成產品采用Apache許可證2.0版。 6、創新方面,我國創新實力不斷增強
來源:CCSA TC601,2023年6月 圖 7 2020-2022年VLDB、ICDE和SIGMOD論文分布情況 從VLDB、SIGMOD和ICDE三個數據庫領域權威的學術會議研究方向看,當前關系型數據庫和非關系型數據庫研究內容數量占比相當,非關系型數據庫研究方向成為熱點。以VLDB為例,2020-2022年,各領域論文總數分別為110、81和483篇,關系型和非關系型數據庫論文分別占三年論文總數量的16%和13%。SIGMOD各領域論文總數分別為87、87和350篇,關系型和非關系型數據庫論文總數均占17%。ICDE各領域論文總數分別為75、85和574篇,關系型和非關系型數據庫論文總數占三年論文總數比例分別為10%和12%,非關系型數據庫占比略微超過關系型數據庫。
來源:CCSA TC601,2023年6月
圖 8 2020-2022年中國高校及企業學術會議論文貢獻情況
我國在全球三大數據庫領域學術會議的影響力持續提升。高校及企業在ICDE論文貢獻占比最高,三年依次為43.15%、44.68%和65.43%,三大會議每年貢獻占比平均為23.81%、27.17%和40.70%,數量呈逐年上升趨勢,且2022年增長幅度相較前兩年十分明顯。大部分由我國貢獻的論文是以企業、高校合作或者高校間合作的方式發表到頂級會議上。 7、從標準看,我國數據庫產業標準引領作用初見成效
來源:CCSA TC601,2023年6月 圖 9 CCSA TC601數據庫領域標準化工作體系 中國通信標準化協會大數據技術標準推進委員會(CCSA TC601)緊跟國家戰略,圍繞數據庫領域標準化工作,設立數據庫與存儲工作組(WG4)。自2015年起共推出30項數據庫相關標準,逐步構建以數據庫產品、服務和應用為目標的標準體系。 8、技術方面,圍繞三大方面向12個技術方向不斷演進
來源:CCSA TC601,2023年6月 圖 10 數據庫技術演進趨勢圖 數據庫技術將圍繞助力用戶降本增效、護航數據要素安全流通和賦能新興業務場景三個目標持續發展,具體細分為12個技術方向,分別是交易分析一體化支撐多類業務,多模處理一體化實現一庫多用,數據湖倉一體化降低存算成本,軟硬協同一體化提升系統性能,AI與數據庫融合迸發無限潛力,云計算成為數據庫重要驅動力,隱私計算保障密態數據安全流通,區塊鏈技術賦能數據資產高度可信,圖聯邦學習技術打破圖數據孤島,AI大模型催生向量數據庫新應用,圖分析技術洞察數據連接新價值,時空數據庫釋放時空數據新潛能。 9、應用方面,由邊緣系統至核心系統、由重點行業向全行業應用鋪開
近些年隨著各行業數字化轉型不斷加速,我國數據庫應用創新實踐邁入新階段,其應用范圍已從對能力需求較低的辦公、郵件等外圍系統,逐步向金融、電信等關鍵行業中,對性能需求極高、穩定性要求極強的賬務、調度等核心系統深入。 具體內容如下:
來源:阿里研究院
近日,阿里研究院、智譜AI聯合發布《2023全球數字科技發展研究報告—全球科研實力對比》,報告認為,中國數字科技基礎研究勢力增長勢頭強勁,增量上已經趕超美國,但在高價值部分同發達國家仍有不小差距。未來需要產、學、研一起努力,共同推動中國數字技術產業向價值鏈高端躍升。
報告對全球數字技術論文進行全景式梳理分析。結果顯示,中美兩國在數字科技論文整體影響力上實力相當,其中國產出居世界第二,僅次美國。領先全球其他國家的優勢明顯。但是,中國數字科技領域Top 1%“頂尖論文”數量明顯少于美國,且平均被引量也明顯落后于美國。
中國論文總量和“頂尖論文”增速均與美國實現“黃金交叉”
隨著科研實力的逐步增強,中國近年來增長勢頭非常突出,中國與美國的差距在逐年縮小。數據顯示,中國2019年數字科技領域論文發表數量開始超過美國,且在2021年拉開較大差距。2020年開始“Top1%”論文數量反超美國。都與美國出現了“黃金交叉”,并逐年擴大與之優勢。 ** **
2012-2021年中美兩國論文發表數量變化態勢
** **
2012-2021 年中美兩國被引量 Top1% 論文數量變化
美國加州大學和中國科學院是全球生產數字科技“頂尖論文”最多的機構
從研究機構上看,中美兩國最重要的數字科技基礎研究機構分別為中國科學院和美國加州大學。其中,中科院數字科技論文發表數量高居全球第一,領先加州大學萬余篇。但在“Top1%”論文方面,加州大學發表數量多于中科院。另外,在平均引用率方面,中科院在前10強榜單上墊底。美國斯坦福大學、麻省理工學院和哈佛大學等機構被引用次數優勢明顯。
全球數字科技領域論文數量前10強機構
中國數字科技專利總數全球遙遙領先,但高價值專利落后于美日韓三國
全球數字技術專利對比,中國是數字技術專利大國,而非強國。雖然在數字技術專利數量上全球領先,中國的數字科技專利總量全球第一,是排名第二美國的2.9倍但中國數字技術高價值專利(市場價值100萬美金以上)數量在全球相對落后,美國數字科技高價值專利數量是中國的8倍,仍與世界頂級水平存在一定距離。
全球數字科技專利前10強國家
整體看,中國數字技術領域基礎研究,在論文與專利數量上有大幅度提升,高價值部分同發達國家研究機構相比,仍有一些差距。專利是傾向于應用技術的科研成果,其市場價值直接反映該技術應用產品處于產業價值鏈的位置。從專利市場價值分布看,中國數字技術專利價值在 30 萬美元以下的占 98%,因此中國數字技術產業仍處于全球價值鏈低端。論文是傾向于基礎研究的科研成果,往往是科技創新突破的先導。未來中國數字科技的發展前景在于從日益強大的基礎研究成果中實現實際應用轉化,推動數字技術產業向價值鏈高端躍升。 具體內容如下
來源:中國信息通信研究院
隨著新一輪科技革命和產業變革的深入推進,人工智能呈現爆發式成長,廣泛應用于日常生產、生活的方方面面,社會各界對可信品質的關注度也提升到了前所未有的高度。近年來,各界均在不斷探索將更多的可信理念從基礎能力、算法技術、應用場景和產品設備等不同層面進行融合實踐,實現了人工智能在安全性、可靠性、可解釋、可問責等一系列內在屬性的可信賴程度逐步提升,為構建我國可信人工智能產業生態提供了有益參考。
為廣泛吸納產學研用各界的優秀經驗,中國信息通信研究院聯合京東探索研究院及政產學研多家單位共同編寫《可信人工智能產業生態發展報告》,對人工智能產業融合可信要素的發展態勢進行總體分析,研判發展趨勢并提出措施建議,希望能為社會各界提供借鑒和參考。報告主要觀點如下:全球可信人工智能發展態勢向好。人工智能監管向立法執法拓展,歐盟發布全球首部《人工智能法案》,美國推出《2022 算法問責法案》,中國人工智能地方立法相繼落地;穩定性、隱私保護成為熱點,可解釋性、公平性等研究正逐步開展;標準層面,行業組織、企業和研究機構共同推進,全力打造可信 AI 標準體系。
可信人工智能產業生態加快形成。可信人工智能倫理、法律研究進一步深入,在硬件、技術、應用及支撐體系等層面蓬勃發展,形成兼顧穩定性、可解釋性、隱私保護和公平性,涵蓋基礎硬件、技術平臺、產品設備、應用場景等多元化產業生態。
未來,可信人工智能向著形成產業共識、突出理念落地、優化技術布局、注重動態平衡、強化多元主體發展。凝聚強化產業共識,進一步向具體實踐邁進,可信人工智能一體化研究和技術發展加速創新,能力之間的動態平衡引發更多關注,并形成了多元化主體參與的可信人工智能生態。
建議從加強要素協同、前瞻布局研究、健全標準體系、強化可信流程管理、推動產業交流合作等方面推動深入落地。協調制度、技術、人員整體推進;前瞻布局技術研究,將可信理念融入全流程管理;健全標準評估體系,系統性推進更多領域可信落地;強化產業交流合作,共同打造可信產業生態朋友圈。
來源:云計算開源產業聯盟 日前,在2022數字化轉型發展高峰論壇上,《數字政府行業趨勢洞察報告(2022年)》和《2022數字政府產業圖譜》正式發布,報告聚焦我國數字政府產業發展各環節,繪制產業全景,同時展望數字政府未來發展趨勢,旨在為我國數字政府的規劃、建設、發展等環節提供參考。 加快數字政府建設,是推動國家治理體系和治理能力現代化的重大舉措,是迎接數字時代浪潮、適應經濟社會全面數字化轉型的必然要求,也是新時代建設服務型政府的有力抓手。 近年來,國家出臺多項政策指導數字政府建設。2022年6月,國務院發布《關于加強數字政府建設的指導意見》,對全面開創數字政府建設新局面做出戰略謀劃和系統部署。同時,各地紛紛出臺相關政策,將數字政府建設作為地方“一把手工程”。 我國數字政府產業增長勢頭強勁
**從市場規模看,**我國數字政府市場規模保持高速增長,以政務云為例,2021年,我國政務云市場規模達到802.6億元,政務云作為資源整合共享、業務系統開發和部署的底座,未來仍將保持穩定增長態勢,預計2023年市場規模將達到1203.9億元。隨著各地基礎設施建設的逐步完善,數字政府進入到以深化應用和政府治理為導向的新階段,政務數據、軟件和服務市場份額將會持續擴大。 **從產業格局看,**數字政府具有覆蓋面廣、服務用戶多、應用場景豐富、穩定性要求高等特征,政府對供應商所提供的滿足“智能集約、數據共享、業務協同”需求的整體解決方案與服務能力需求迫切。 未來,數字政府行業生態將從過去垂直、分化的產業鏈分工演進到集約、共贏的生態共同體。包括咨詢規劃、軟硬件和應用提供商在內的各類參與者正面臨前所未有的發展機遇,產業鏈上下游的緊密融合將助力數字政府跑出“加速度”。
數字政府產業圖譜全景
《2022數字政府產業圖譜》由中國信通院發布的數字政府產業全景圖,重點圍繞政務云、智慧中臺、行業應用、城市大腦、安全五大核心領域,繪制覆蓋產業鏈上下游關鍵環節的服務提供商圖譜,力求全面客觀展現數字政府產業現狀和發展趨勢,為相關從業者提供參考。
數字政府行業八大趨勢洞察
“十四五”時期,我國數字政府建設進入快車道,其發展勢頭強勁,整體呈現出以下八大發展趨勢。 1.更注重數字化管理和數字化素養
科學統籌的管理機制是數字政府建設整體協同推進的重要條件。 人才是政府數字化轉型的“千里馬”,是數字政府建設的關鍵推動力量。 干部隊伍數字化管理思維不斷轉變是適應數字時代的必然要求。 2.更注重智能集約的數字化平臺建設
一體化智能化將成為未來政務云建設與運營的主旋律。 共性應用支撐平臺是數字政府基礎設施的重要組成部分。 3.更注重數據賦能驅動政府治理能力提升
數據要素價值化成為推動政府治理能力現代化的核心動力。 數據精準高效共享力度將進一步加大。 **4.**更注重需求牽引的業務和運營模式創新
以人民為中心是數字政府業務模式創新的出發點和落腳點。 地方探索是數字政府業務模式創新的重要來源。 5.更注重以城市大腦為抓手的智慧城市建設
城市大腦是數字政府建設重要內容和主要抓手。 城市大腦建設逐步細化下沉。
6.更注重以數字技術提升基層治理精細化水平
一是通過云數底座的建立為基層社會治理數字化提供基礎。 二是通過規范數據采集建立基層治理數據庫,實現市、區、街道多級數據互聯互通。 三是重視圍繞基層不同人群需求的公共服務創新。 7.更注重構建全方位安全保障體系
安全保障是數字政府穩定運行的“根基”。 8.更注重以標準化建設推動整體價值提升
標準和評價體系是數字政府提質增效的推動力。 具體內容如下