來源:奇安信 近日,奇安信集團對外發布《2024人工智能安全報告》(以下簡稱《報告》)。據悉,這是我國首份人工智能安全報告。《報告》認為,人工智能是新一輪科技革命和產業變革的核心技術,被譽為下一個生產力前沿。具有巨大潛力的 AI 技術同時也帶來兩大主要挑戰:一個是放大現有威脅,另一個是引入新型威脅。 數據顯示,在2023年,基于AI的深度偽造欺詐暴增了3000%,基于AI的釣魚郵件數量增長了1000%。據了解,奇安信威脅情報中心監測發現,已有多個有國家背景的APT組織利用AI實施了十余起網絡攻擊事件。同時,各類基于AI的新型攻擊種類與手段不斷出現,甚至出現泛濫,包括深度偽造(Deepfake)、黑產大語言模型、惡意AI機器人、自動化攻擊等,在全球造成了嚴重的危害。 《報告》指出,AI與大語言模型本身伴隨著安全風險,業內對潛在影響的研究與重視程度仍遠遠不足。AI技術推動安全范式變革,全行業需啟動人工智能網絡防御推進計劃,包括利用防御人工智能對抗惡意人工智能,扭轉“防御者困境”。 業內普遍預測,未來十年該技術的惡意使用將迅速增長,人工智能的惡意使用在網絡安全、物理安全、政治安全、軍事安全等方面構成嚴重威脅。 大模型引爆AI熱潮 雙刃劍效應顯現
2022年以后,以ChaGPT為代表的大語言模型(Large Language Model,LLM)AI技術快速崛起,后續的進展可謂一日千里,迎來了AI技術應用的大爆發,展現出來的能力和效果震驚世界。IDC調研顯示,67%的中國企業已經開始探索 AIGC 在企業內的應用機會或進行相關資金投入。IDC預測,2026年中國AI大模型市場規模將達到211億美元,人工智能將進入大規模落地應用關鍵期。 《報告》認為,“AI是一種通用技術,通用就意味著既可以用來做好事,也可以被用來干壞事”。具有巨大潛力的AI技術同時帶來兩大主要挑戰:一是放大現有威脅,另一個是引入新型威脅。奇安信預計,未來十年,人工智能技術的惡意使用將快速增長,將在政治安全、網絡安全、物理安全和軍事安全等方面構成嚴重威脅。
研究發現,人工智能已成攻擊工具,并帶來迫在眉睫的威脅,相關的網絡攻擊頻次越來越高。數據顯示,2023年基于AI的深度偽造欺詐暴增了3000%,基于AI的釣魚郵件數量增長了1000%;奇安信威脅情報中心監測發現,已有多個有國家背景的APT組織利用AI實施了十余起網絡攻擊事件。各類基于AI的新型攻擊種類與手段不斷出現,甚至出現泛濫,包括深度偽造(Deepfake)、黑產大語言模型、惡意AI機器人、自動化攻擊等,在全球造成了嚴重危害。 在當前波譎云詭、風高浪急的國際形勢下,快速發展的AI帶來了更加復雜和難以預測的軍事威脅,包括相關武器系統的誤用、濫用甚至惡用,導致戰爭不可控性增加。例如人工智能被用在“機器人殺手”等致命性自主武器(LAWS)上,可能會導致無差別殺戮。數據顯示,2024財年,美國國防部計劃增加與AI相關的網絡安全投資,總額約2457億美元,其中674億美元用于網絡IT和電子戰能力。 ** AI引入或放大12種威脅 業界對AI風險重視不足**
《報告》深入研究了基于AI的深度偽造(Deepfake)、黑產大語言模型基礎設施、利用AI的自動化攻擊、AI武器化、LLM自身安全風險、惡意軟件、釣魚郵件、虛假內容和活動生成、硬件傳感器安全等12種重要威脅,對其技術原理、危害情況、真實案例等進行了深入的剖析,旨在讓業界更全面的認識到AI普及帶來的兩大主要挑戰:一方面放大了現有威脅,比如釣魚郵件、惡意軟件和社會工程學等;另一方面是引入了新型威脅,如AI自動化攻擊、AI深度偽造等。
以AI武器化為例,據法新社2月10日報道,以色列軍隊首次在加沙地帶的戰斗中采用了人工智能(AI)軍事技術,包括AI驅動的瞄準器和無人機等.引發了人們對現代戰爭中使用自主武器的擔憂。這些技術正在摧毀對手的無人機,并被用于繪制哈馬斯組織在加沙的龐大隧道網絡地圖等。這僅僅是AI武器化、加劇軍事威脅趨勢的冰山一角。
《報告》認為,AI與大語言模型本身伴隨著安全風險,業內對潛在影響的研究與重視程度仍遠遠不足。 全球知名應用安全組織OWASP發布大模型應用的十大安全風險,包括提示注入、數據泄漏、沙箱不足和未經授權的代碼執行等。此外,因訓練語料存在不良信息,導致生成的內容不安全,正持續引發災難性的后果,危害國家安全,公共安全甚至個人安全,這些都亟需業內的高度重視和積極應對。 ** AI威脅該如何應對?**
《報告》從安全行業、監管機構、政企機構、網絡用戶等群體角度,給出了應對AI威脅的建議。其中安全行業需要繼續發揮能力優勢,確保人工智能本身的安全性,并積極利用人工智能用于安全防護;監管機構需要對AI潛在風險與影響保持持續關注,在制度和法規上及時提供支持;政企機構需及時部署AI安全框架和解決方案,以及AI安全評估服務和檢測工具,還要依托AI推動安全升級;網絡用戶在嘗試最新人工智能應用的同時,同樣需要更新安全知識,形成良好的安全習慣。 面對AI網絡攻擊、AI武器化等日益嚴峻的安全威脅,《報告》認為,AI技術將會推動安全領域發生范式變革,全行業需啟動人工智能網絡防御推進計劃。新一代AI技術與大語言模型改變安全對抗格局,將會對地緣政治競爭和國家安全造成深遠的影響,各國正在競相加強在人工智能領域的競爭,以獲得面向未來的戰略優勢。全行業需啟動人工智能網絡防御推進計劃,包括利用防御人工智能對抗惡意人工智能,扭轉“防御者困境”。 具體內容如下
來源:人工智能計算大會 2023年是人工智能發展的重要轉折年,企業正加速從業務數字化邁向業務智能化。大模型的突破和生成式人工智能的興起為企業實現產品/流程的革新提供先進生產工具,引領企業和產業邁入智能創新的新階段。 大模型和生成式人工智能的發展顯著拉動了人工智能服務器市場的增長。IDC預計,全球人工智能硬件市場(服務器)規模將從2022年的195億美元增長到2026年的347億美元,五年年復合增長率達17.3%。 在中國,預計2023年中國人工智能服務器市場規模將達到91億美元,同比增長82.5%,2027年將達到134億美元,五年年復合增長率達21.8%。算力規模而言,預計到2027年通用算力規模將達到117.3EFLOPS,智能算力規模達1117.4EFLOPS;2022-2027年期間,預計中國智能算力規模年復合增長率達33.9%,同期通用算力規模年復合增長率為16.6%。 近日,在AICC2023中國人工智能算力大會上,國際數據公司(IDC)與浪潮信息聯合發布《2023-2024中國人工智能計算力發展評估報告》(簡稱《報告》)。《報告》指出,人工智能正在加速從感知智能到生成式智能邁進,中國人工智能算力市場規模快速成長擴大。 2023年,中國人工智能服務器市場規模將達91億美元,同比增長82.5%;智能算力規模預計達到414.1EFLOPS(每秒百億億次浮點運算),同比增長59.3%;2022-2027年期間,年復合增長率預計達33.9% 《報告》從算力規模、區域分布和行業滲透度等多維度,對我國人工智能計算力發展進行綜合評估,給出大模型和AIGC的發展將引發AI算力產業之變的核心洞察,并提出針對性的行動建議。作為中國AI算力發展“風向標”,《報告》第六次發布,旨在為推動中國人工智能產業的高質量發展提供參考。 ** 人工智能加速向行業和城市滲透**
《報告》通過多年持續跟蹤中國人工智能計算力發展狀況發現,從行業看,人工智能從單點應用到多元化應用、從通用場景到行業特定場景正在不斷深入,而AIGC在2023年快速發展,也在進一步賦能各行各業;從城市看,越來越多的城市參與到人工智能發展浪潮中,持續加大在相關領域的投資,不斷推進人工智能產業的發展。 在2023年人工智能行業滲透度排名中,Top5的行業依次為互聯網、電信、政府、金融和制造。此外,交通、服務、教育等行業在人工智能領域的投資力度也可圈可點。其中,互聯網依然是AIGC技術應用和研發的主戰場;電信行業排名從2022年的第四躍升至2023年的第二,主要歸因于運營商緊跟國家東數西算戰略,加速云數據中心、智算中心的建設。 在2023年中國人工智能城市排行榜中,北京、杭州、深圳繼續保持前三名。其中,北京在大模型領域表現突出,聚集了大批大模型企業。此外,位居TOP10的城市還有上海,蘇州,廣州,濟南,合肥、重慶和成都。整體來說,排名靠前的城市因具有更好的政策、資金和技術支持,可以穩定吸引更多的人才和企業聚集;智算中心的建設也是拉動地區實現人工智能發展的重要驅動力,既可以提升基礎設施建設水平,也為吸引更多企業共謀發展起到積極的推動作用。 ** AIGC引發算力產業“三變”**
2023年,由ChatGPT引爆的新一輪人工智能熱潮,開啟了由大模型驅動的AIGC時代。IDC調研顯示,67%的中國企業已經開始探索AIGC在企業內的應用機會或已經開始進行資金投入。 中國企業對生成式人工智能的態度 《報告》指出,當前在AIGC的帶動下,人工智能計算力技術及應用趨勢發生了較大的變化,體現為“三變: 一是計算范式之變。大模型和AIGC的發展加速了更高計算性能、更快互聯性能的算力基礎設施建設,推進人工智能在云-邊-端的覆蓋。此外,伴隨應用場景多樣性,底層基礎設施呈現多元化發展。 二是產業動量之變。AIGC可重構現有的工作方式,在內容創作、自動駕駛、零售、醫療等諸多領域改變著人們的生活和生產方式,同時也帶來更大的市場機會。算力、算法、應用、服務等諸多產業變量將成為創新的加速器,在算力生態鏈上的各個環節催生出新的玩家。 三是算力服務格局之變。由于基礎大模型的本地訓練成本不菲,企業將更多地使用已有的人工智能數據中心設施和生成式AI服務器集群,這將為算力服務市場帶來新機會。算力服務供應商要能夠提供定制化的基礎設施服務能力,滿足單個用戶對訓練和推理資源的獨占式、大規模、長時間使用的訴求,同時幫助用戶實現成本控制。 ** “以應用為導向、系統為核心”是算力升級新路徑**
大模型和AIGC的發展提升了智能算力需求,給計算市場帶來了發展機遇,同時也帶來了算力緊缺等挑戰。對此,《報告》認為,面對單芯片算力瓶頸、算力緊缺等問題,中國市場對于智能算力供給能力的衡量標準將發生變化——評估指標將從硬件性能向應用效果轉變,用戶在獲得算力服務的過程中,會更加以應用為導向進行綜合考量,增加對于諸如單位時間可處理Token數量、可靠性、時延、訓練時間和資金成本、數據集質量等指標的關注。 針對這一轉變,《報告》指出,算力供應商需要“以應用為導向、系統為核心”,構建算力基礎設施平臺,提高算力利用率,提升諸如卡間互聯、多節點間互聯等水平,支持靈活穩定擴展和彈性容錯,積極打造通用的人工智能軟件和硬件平臺,以先進的系統性能力滿足市場的應用需求。也就是說,與其過分關注單一芯片的性能強弱,不如根據人工智能業務場景需求,設計更具針對性的算力系統,實現整體性能最優。 具體內容如下:
來源:新華社研究院中國企業發展研究中心
近日,新華社研究院中國企業發展研究中心發布《人工智能大模型體驗報告3.0》(以下簡稱報告)。報告顯示,迭代風潮之下,大模型產品正在迅速適應并引領市場變革。其中,訊飛星火、商湯商量和智譜AI-ChatGLM等廠商表現總體優秀。
報告顯示,大模型廠商在技術實力上呈現出百家爭鳴態勢。不同廠商在產品特點和優勢上各有千秋。一些廠商在安全性能上表現出色,通過加強模型的魯棒性和數據保護措施,為用戶提供更可靠、更放心的服務。另一些廠商則在易用性上下功夫,致力于降低用戶的學習曲線,使產品更貼近用戶需求,提升用戶體驗。 為進一步直觀感受我國當前主流科技企業所推出的大模型產品的現狀、優勢和特點,新華社研究院中國企業發展研究中心于今年10月啟動了本次測評研究。與前兩次發布的《人工智能大模型體驗報告》相比,本次測評在多個方面進行了升級。 本次研究抓取了2023年10月25日-2023年11月6日的數據,通過人機互動提問等形式,對國內主流大模型進行使用體驗評測。在評測過程中,不僅考慮模型產品的實際表現,還深入評估了廠商的技術實力和未來發展潛力。此外,評測題庫擴充到了1000道,并精選其中的400道進行實際問答測試。這大大提升了評測的廣度和深度,能更準確地反映大模型在不同場景和問題下的實際表現。 報告顯示,與2023年8月相比,當前中國大模型產品進步顯著。具體來看,科大訊飛星火繼續保持領先優勢,商湯商量、智譜AI-ChatGLM等廠商整體表現優秀。針對各維度能力測評,該報告還給出了相應的案例展示和分析。
在基礎能力部分,科大訊飛星火表現搶眼,能夠準確地理解指令,并且能夠生成圖像;字節跳動豆包同樣能較為準確地理解指令并且完成部分生產圖像的指令;智譜AI-ChatGLM和瀾舟科技孟子都能較為準確地理解指令,表現優良。 在智商部分,科大訊飛星火在回答基本正確的同時能夠理解指令,不給出多余的回答;商湯商量、瀾舟科技孟子和智譜AI-ChatGLM大多數時候能夠根據指令回答問題。 在情商部分,各大模型表現差距不大。在給定的場景中基本均能展現較高的靈活性及人文關懷。其中,商湯商量、騰訊混元所給方案詳盡,問題切入角度多樣,且一定程度上引導用戶進行更深入的思考。科大訊飛星火、字節跳動豆包、阿里通義千問、智譜AI ChatGLM和昆侖萬維天工在分析問題時能夠考慮到不同的策略,并給出令人信服的理由。總體具備較高的情商能力。 在工作提效部分,在不同專業技能場景下測評模型均能一定程度上提升問題分析和解決水平。科大訊飛星火、商湯商量和字節跳動豆包不僅能夠較好地解答日常疑惑,在法學、經濟學、文學方向上也表現不凡,能夠以較快的速度響應并給出較為準確可信的結果。360智腦、瀾舟科技-孟子、智譜AI-ChatGLM在多語種翻譯、代碼編程和文字摘錄方面表現優異,給出的回答能夠起到輔助作用,并為專業從業人員提供參考。 報告還顯示,隨著大模型快速升級迭代,大模型的技術能力開始越來越多地體現在產品能力上。在C端,職場、營銷、出行、生活、公文、客服等多個場景個人助手陸續上線;在B端,制造、電力、金融、手機、傳媒等行業的大模型和產業融合優秀案例也在不斷出現。 報告認為,雖然人工智能大模型的發展取得了較大進步,但不可忽視的是,人工智能大模型依然存在不穩定等問題,需要進一步解決,另外大模型的安全問題也不容忽視。報告同時指出,人工智能大模型將進一步推動數字經濟和產業經濟的深度融合,掀起新一輪技術革命,為社會經濟發展提供源源不斷的科技動力。 具體內容如下:
來源:世界互聯網大會 近日,在烏鎮召開的人工智能賦能產業發展論壇上,來自企業、研究機構、國際組織等各方的代表,共同發布了《發展負責任的生成式人工智能研究報告及共識文件》。 回顧人工智能60余年的發展歷程,技術突破不僅會創造發展機遇,也會帶來相應的挑戰。統籌人工智能發展和治理逐漸成為全球共識,自2016年以來,全球多個國際組織、國家、地區及產業界,積極探索人工智能發展與治理路徑,已經形成了系列共識原則、治理要求、實踐范式等。考慮到人工智能尚處在快速發展的過程中,相關工作仍需要持續推進。 信息技術革命在進入人工智能階段之后,以生成式人工智能為代表的技術,又取得了長足的進步和發展。如《研究報告及共識文件》中所明確指出的那樣: 其一,在“模型、數據、算力”等三大要素持續迭代和高速演進的推動下,人工智能不斷在工程維度的發展和應用中,實現快速突破。就全球范圍的發展情況來看,Transformer為主的基礎模型依托相關研究主體的長期持續投入,通過ChatGPT、Stabel Diffusion、BLIP-2等,在大語言模型、視覺生成模型、多模態模型等細分領域,持續實現模型能力的躍升。這種躍升的主要體現,是參數規模進入1000億量級,處理復雜自然語言能力因此呈現顯著發展;在數據領域,多場景的大模型預訓練數據集不斷涌現,研究機構形成了通過發布微調數據集方式,提升預訓練用數據集的效能;合成數據解決訓練數據資源可持續性的探索也取得了較為顯著的成效;算力芯片和架構的持續迭代,在訓練效能、云邊端算力效能優化等方面,對生成式人工智能的發展提供了有效的支撐。 其二,應用前景催生了開源開放驅動生成式人工智能生態的迅速發展,整體趨向繁榮發展。從應用場景看,開源生態與開放驅動成為當下推動人工智能生態發展的主基調,模型迭代優化、研發門檻降低、縮短初創成本等,成為各方廣泛認知的主要優勢。與此相應的,在ChatGPT的刺激下,生成式人工智能的開發者社區迅速涌現,成為支撐和推動相關技術與應用發展的主渠道。Hugging Face、華為云AI Gallery、阿里巴巴、FlagOpen飛智、百度的飛槳星河等社區憑借各自比較優勢,在其中發揮了至關重要的作用。 其三,生成式人工智能的階段性高速發展再度激發了人們對于發展通用式人工智能的勇敢想象與積極探索。如《研究報告及共識文件》指出的那樣,由于生成式人工智能的這一輪突破,尤其是其中與多模態方向發展相一致的發展,催生了人們新的想象與探索:人們預期,伴隨著多模態生成模型技術的突破,能夠更好地理解和處理復雜的現實場景,或許將帶來更多的想象空間,比如可以探索將多模態生成模型與機器人技術結合等方式,繼而以某種形式盡可能趨近模仿人類感知復雜世界能力的呈現。 很自然的,生成式人工智能帶來的機遇和挑戰,同步存在: 從積極的角度看,生成式人工智能可能帶來的經濟增長前景,日趨明朗。根據麥肯錫2023年6月的樂觀預測,生成式人工智能每年可能為全球經濟增加2.6萬億至4.4萬億美元的價值。根據高盛研究,在滿足增長條件的情況下,生成式人工智能的突破將在10年內推動全球GDP增長7%。對生成式人工智能以及通用式人工智能未來發展前景的合理展望,有助于人們確信人類的生產活動和滿足特定要求的服務行業,未來均可能面臨顯著的增長前景,有理由保持樂觀預期。 從生成式人工智能的可能應用場景來看,現代社會的基礎服務體系可能獲得有效賦能,預期城市運營管理、災害救助與事故分析、實時預警與風險管理、定制化個性化的新型教育體系、新型就業崗位與就業機會、以及迫切需要得到實質性賦能的醫療和養老行業,均可能從人工智能的負責任發展中獲得實質性的收益。此外公益事業中的無障礙數字環境建設、全球文化成果保護和傳播,以及全球環境治理和可持續發展,也有希望從生成式人工智能的噴薄發展中得到全新的賦能與助力。作為高質量的“聰明”助手,生成式人工智能在助力科學研究中所具有的廣闊前景,也同時日趨清晰地呈現。 客觀而謹慎地看,生成式人工智能帶來的風險挑戰也是顯而易見的,預先訓練大模型時投喂的數據不可避免地存在缺陷,價值偏見、隱私泄露、數據污染等,如《研究報告及共識文件》所指出的那樣,是已經被廣泛察覺到的主要風險;算法模型的“幻覺”,虛假信息干擾,指向模型的網絡攻擊等,均揭示了人工智能發展帶來的新型安全隱患和風險;此外,高速技術迭代帶來的科技倫理失范以及人類社會發展失衡等問題,也日趨明顯地成為各方必須共同關注,并探究治理方案的關鍵所在;在更廣義的政治經濟學分析框架中,生成式人工智能對數字勞動和能源損耗等領域的重大影響,也已經到了必須早日提上議事日程的時候,其后帶來的發展,值得我們各方高度關注。 具體內容如下:
來源:大數據技術標準推進委員會
日前,在2023可信數據庫發展大會上,《數據庫發展研究報告(2023年)》正式發布。 黨的二十大報告提出,堅持創新在我國現代化建設全局中的核心地位,加快實現高水平科技自立自強,加快建設科技強國。隨著新一輪科技革命和產業變革深入發展,互聯網、大數據、云計算、人工智能、區塊鏈等數字技術創新活躍,數據作為關鍵生產要素的價值日益凸顯,深入滲透到經濟社會各領域全過程,數字化產業正在成為全球經濟新的驅動引擎。 作為各行業數據存儲、計算、流通的基礎軟件,數據庫管理系統經過六十余年發展,理論技術不斷創新、產品形態日益豐富、產業生態加速變革、產業熱度持續升溫。當前,我國數據庫行業市場前景廣闊,產業欣欣向榮,正在經歷由“數量型”向“質量型”關鍵轉變期。 隨著數字化轉型深入推進和數據量的爆炸式增長,千行百業應用對數據庫的需求變化推動數據庫技術加速創新,全球數據庫產業快速發展,我國已經邁入第一梯隊。報告顯示,2022年全球數據庫市場規模為833億美元,中國數據庫市場規模為59.7億美元(約合403.6億元人民幣),占全球7.2%。預計到2027年,中國數據庫市場總規模將達到1286.8億元,市場年復合增長率(CAGR)為26.1%。2022年,公有云數據庫市場規模為219.15億元占市場總體的54.3%,較2021年增速51.6%,我國公有云數據庫市場規模首次過半。 此外,產業方面,報告從產業主體、研發模式、產品分布、推廣策略等方面,分析我國數據庫產業的主體特點、市場格局、發展態勢等;技術方面,報告梳理了數據庫技術發展在助力用戶降本增效、護航數據要素安全流通以及賦能新興業務場景三個方面的細分12個演進趨勢;應用方面,報告以金融、電信和制造業為代表,研究當前應用現狀、問題以及發展前景。 報告核心觀點
** 1、市場規模:全球近833億美元,我國公有云數據庫市場規模首次過半**
來源:CCSA TC601,2023年6月 圖 1 2022-2027年中國數據庫市場規模及增速
據CCSA TC601測算,2022年全球數據庫市場規模為833億美元,中國數據庫市場規模為59.7億美元(約合403.6億元人民幣),占全球7.2% 。預計到2027年,中國數據庫市場總規模將達到1286.8億元,市場年復合增長率(CAGR)為26.1%。按數據庫部署方式劃分市場規模,2022年中國公有云數據庫市場規模為219.15億元,較2021年增速51.6%,本地部署數據庫市場規模為184.45億元,較2021年增速14.4%,公有云和本地部署模式市場規模分別占總市場54.3%和45.7%,2022年公有云數據庫市場規模首次過半,預計2023年公有云市場占比將進一步擴大達到59.8%,規模達到323.16億元,本地部署模式市場增速達到17.8%,規模為217.24億元。 2、發展周期,全球數據庫發展經歷兩輪熱周期
來源:CCSA TC601,2023年6月
圖 2 全球數據庫企業開展業務時間
全球數據庫發展經歷兩次熱潮,21世紀后進入蓬勃發展期。全球數據庫企業起步于20世紀60年代,隨著80年代關系型數據庫的理論突破和技術創新,全球數據庫迎來第一波發展熱潮。步入21世紀后,PC互聯網逐步向移動互聯網發展,數據庫的應用場景不斷豐富,全球數據庫在2010-2019年進入發展高峰期,新興企業不斷成立。這十年間,一共出現了230家企業,全球48.7%的數據庫企業均成立于這一時期。中國數據庫產業始于20世紀末,并在2013年后迎來繁榮發展。2014-2022這段時期迎來發展高峰。 3、從地域看,全球數據庫產業聚集效應明顯
北京為我國數據庫產業貢獻主要力量。中國150家數據庫廠商總部大多集中在超一線城市。數量最多的前四名分別是北京、杭州、上海和深圳,數量為80、15、12、8個。天津、南京、廣州、成都數據庫企業數量均為4個,其中南京市和成都市由于高校資源豐富,成為很多數據庫企業設立研發中心的青睞地點。 4、從類型看,非關系型數據庫在全球范圍占比略大
來源:CCSA TC601,2023年6月 圖 3 全球數據庫產品類型分布 全球數據庫產品數量整體分布呈現以非關系型及混合型數據庫為主。據CCSA TC601統計分析,截止2023年6月,全球數據庫產品共有 655 款。除了早期的兩款網狀數據庫和層次數據庫,在剩余的653個數據庫產品中,關系型數據庫為309個,非關系型數據庫有344個,占比分別為47.3%和52.7%。非關系型數據庫中,鍵值型數據庫82個、時序數據庫53個、圖數據庫52個,在非關系數據庫中依次占比23.8%、15.4%和15.1%。
來源:CCSA TC601,2023年6月 圖 4 中國數據庫產品類型分布 我國數據庫產品數量呈現以關系型為主,非關系型數據庫為輔的局面。關系型數據庫156個,非關系型數據庫有82個,占比分別為65.5%和34.5%。非關系型數據庫中,圖數據庫24個、時序數據庫24個、鍵值數據庫10個、列存數據庫10個,在非關系數據庫中依次占比29.3%、29.3%、12.2%和12.2%。 5、從模式看,開源模式在全球范圍內發展勢頭迅猛
來源:CCSA TC601,2023年6月 圖 5 全球現存開源數據庫的開源時間
來源:CCSA TC601,2023年6月 圖 6 中國現存開源數據庫的開源時間
我國開源數據庫產品始于2010年前后,但開源數據庫在總數中占比較小,開源數據庫中七成為關系型數據庫。我國數據庫產品以商用為主,開源數據庫產品共有42款,商用和開源占我國數據庫產品總數分別為82.4%和17.6%。開源產品中,關系型數據庫29個,非關系型數據庫有13個,占比分別為69.0%和31.0%。我國開源數據庫整體起步較晚,在2017年之后迎來發展高峰。2017年至今,一共新增29款開源數據庫產品,近7成產品采用Apache許可證2.0版。 6、創新方面,我國創新實力不斷增強
來源:CCSA TC601,2023年6月 圖 7 2020-2022年VLDB、ICDE和SIGMOD論文分布情況 從VLDB、SIGMOD和ICDE三個數據庫領域權威的學術會議研究方向看,當前關系型數據庫和非關系型數據庫研究內容數量占比相當,非關系型數據庫研究方向成為熱點。以VLDB為例,2020-2022年,各領域論文總數分別為110、81和483篇,關系型和非關系型數據庫論文分別占三年論文總數量的16%和13%。SIGMOD各領域論文總數分別為87、87和350篇,關系型和非關系型數據庫論文總數均占17%。ICDE各領域論文總數分別為75、85和574篇,關系型和非關系型數據庫論文總數占三年論文總數比例分別為10%和12%,非關系型數據庫占比略微超過關系型數據庫。
來源:CCSA TC601,2023年6月
圖 8 2020-2022年中國高校及企業學術會議論文貢獻情況
我國在全球三大數據庫領域學術會議的影響力持續提升。高校及企業在ICDE論文貢獻占比最高,三年依次為43.15%、44.68%和65.43%,三大會議每年貢獻占比平均為23.81%、27.17%和40.70%,數量呈逐年上升趨勢,且2022年增長幅度相較前兩年十分明顯。大部分由我國貢獻的論文是以企業、高校合作或者高校間合作的方式發表到頂級會議上。 7、從標準看,我國數據庫產業標準引領作用初見成效
來源:CCSA TC601,2023年6月 圖 9 CCSA TC601數據庫領域標準化工作體系 中國通信標準化協會大數據技術標準推進委員會(CCSA TC601)緊跟國家戰略,圍繞數據庫領域標準化工作,設立數據庫與存儲工作組(WG4)。自2015年起共推出30項數據庫相關標準,逐步構建以數據庫產品、服務和應用為目標的標準體系。 8、技術方面,圍繞三大方面向12個技術方向不斷演進
來源:CCSA TC601,2023年6月 圖 10 數據庫技術演進趨勢圖 數據庫技術將圍繞助力用戶降本增效、護航數據要素安全流通和賦能新興業務場景三個目標持續發展,具體細分為12個技術方向,分別是交易分析一體化支撐多類業務,多模處理一體化實現一庫多用,數據湖倉一體化降低存算成本,軟硬協同一體化提升系統性能,AI與數據庫融合迸發無限潛力,云計算成為數據庫重要驅動力,隱私計算保障密態數據安全流通,區塊鏈技術賦能數據資產高度可信,圖聯邦學習技術打破圖數據孤島,AI大模型催生向量數據庫新應用,圖分析技術洞察數據連接新價值,時空數據庫釋放時空數據新潛能。 9、應用方面,由邊緣系統至核心系統、由重點行業向全行業應用鋪開
近些年隨著各行業數字化轉型不斷加速,我國數據庫應用創新實踐邁入新階段,其應用范圍已從對能力需求較低的辦公、郵件等外圍系統,逐步向金融、電信等關鍵行業中,對性能需求極高、穩定性要求極強的賬務、調度等核心系統深入。 具體內容如下:
來源:新華社客戶端
近年來,人工智能技術迎來了新一輪大變革,其中由OpenAI開發的ChatGPT在推出短短2個月后便成為了月活破億的應用。隨著海外科技巨頭微軟、谷歌、Meta等加大投入,國內科技企業如百度、華為、阿里等紛紛布局,人工智能大模型的發展日新月異。
為直觀感受我國當前主流科技企業所推出的大模型產品的現狀、優勢和特點,新華社研究院中國企業發展研究中心于今年4月啟動了人工智能產業創新活力研究。本次研究設置了用戶體驗項目,抓取了05月22日—05月26日數據,通過人機互動提問等形式,對國內主流大模型進行使用體驗評測,旨在為科技企業調整努力方向提供參考。
在綜合指數評價方面,本次評測選取4大維度(基礎能力、智商測試、情商測試、工作提效能力)、36個子能力,共300個問題,對目前主流大模型產品進行測試,并邀請相關專家組成評測團隊深入分析各個產品的語義理解、知識儲備、邏輯能力等,最終得出各廠商的大模型綜合指數評價。
在評價規則上,課題組以各個大模型對參與測評的題目回答完成度,進行了綜合考量,其中評測規則分為:答案較為完美,內容可在實際場景中直接使用;基本可用,可在實際場景中使用;調整可用,但需人工進行調整后方可使用;大略可用,需要較多人工調整方可使用;不可用,答非所問、語言不通等五個層級。
圖片
注:基于評測條件、評測時間等限制,本次評測結果存在一定主觀性,未來將進一步優化完善評測模型,提供更精確結果。
通過圍繞四個維度的綜合測試,課題組發現,由OpenAI開發的Chat-GPT系列模型各項指標表現優異,且Chat-GPT4.0版本各項能力在3.5版本的基礎上均有一定程度提升。而由百度開發的人工智能大模型文心一言表現較為搶眼,是目前國內自主研發的大模型中具有優勢的產品。其余大模型產品也在基礎能力方面表現優良,但面對較復雜的工作內容或情商環境仍有不同程度的進步空間。
針對各維度能力測評,該報告還給出了相應的案例展示和分析。
在基礎能力部分,百度文心一言表現最為搶眼,訊飛星火、阿里巴巴通義千問、智譜ChatGLM表現優良;商湯商量、Vicuna-13B表現尚佳。
在智商測試部分,百度文心一言在該環節意外超過ChatGPT3.5,表現突出,阿里巴巴通義千問分數接近GPT3.5,商湯商量、訊飛星火、智譜ChatGLM表現尚佳;Vicuna-13B表現有待改進。
在情商測試部分,百度文心一言表現最佳;阿里巴巴通義千問與訊飛星火表現優良;商湯商量、智譜ChatGLM表現尚可;Vicuna-13B表現一般。
在工作提效部分,百度文心一言與智譜ChatGLM最佳,訊飛星火次之;阿里巴巴通義千問及Vicuna-13B表現尚可;商湯商量表現一般。
研究發現,人工智能與各行業的深度融合是促進產業升級和轉型的重要方式之一,“大模型+行業”的發展應用尤為重要。目前大模型在金融、工業、醫療等領域已經取得了顯著的成果,如何為行業領域提供更為精準、更為高效的解決方案,成為大模型廠商未來彎道超車的機會。
報告指出,隨著人工智能的地位和作用越來越重要,政府、企業和社會需要共同努力,各大廠商應投入更多資源,頭部企業可以持續發力自研大模型,而專注于解決方案的行業廠商可以考慮通過深耕行業來彰顯特色。
來源:浪潮 近日,IDC與浪潮信息聯合發布《2022-2023 中國人工智能計算力發展評估報告》(以下簡稱《報告》)。《報告》指出,中國人工智能計算力繼續保持快速增長,2022年智能算力規模達到268百億億次/秒(EFLOPS),超過通用算力規模。預計未來5年中國智能算力規模的年復合增長率將達52.3%。 《報告》從人工智能計算力產業發展趨勢、區域算力分布和行業滲透度等維度進行全面評估,旨在科學描繪中國人工智能發展的階段和整體情況,為推動數字經濟與實體經濟的融合提供極具價值的參考依據和行動建議。 01
智能算力規模持續擴大,算力、算法基建化成為共識
智能算力對于提升國家、區域經濟核心競爭力的重要作用已經成為業界共識。 隨著“東數西算”工程的啟動以及智能計算中心的建設,從國家層面實現有效的資源結構整合,助力產業結構調整,構建更為健全的算力、算法基礎設施。 目前,國家在8地啟動建設國家算力樞紐節點,并規劃了10個國家數據中心集群,協調區域平衡化發展,推進集約化、綠色節能、安全穩定的算力基礎設施的建設。
中國智能算力規模及預測,2019-2026
IDC預測,中國智能算力規模將持續高速增長,預計到2026年中國智能算力規模將達到1271.4EFLOPS,未來五年復合增長率達52.3%,同期通用算力規模的復合增長率為18.5%。 02
人工智能城市排行榜
《報告》針對不同城市在人工智能投資規模、相關政策支持力度、政策落地情況和實施進展、人工智能技術成熟度,以及勞動供給等維度的情況,對中國城市人工智能發展進行綜合評估。 在2022年中國人工智能城市排行榜中,北京、杭州、深圳繼續保持前三名,上海和廣州分列第四、五名,其中北京連續四年蟬聯首位,天津首次進入前十,成都、蘇州、南京、濟南保持前十。 綜合TOP10城市發展情況,頭部城市的共性特征是,較早的政策引導和配套政策保障,充分的智算基礎設施規劃、投入,達到上百家AI企業集聚、十萬級人才保障,千億級AI產業集群規模。
近五年人工智能TOP10城市排名變化
城市智能算力的投入已經成為推動區域數字經濟發展,加速人工智能產業創新的重要支撐,除了TOP10城市之外,合肥、武漢、長沙等多個城市在自身產業優勢及各種因素推動下,人工智能應用也取得了較大進展。 此外,一些城市深耕特定的人工智能應用并取得了明顯成果,成為城市智能化新標簽,如安徽宿州淮海智算中心、浙江青田元宇宙智算中心陸續投建。 03
互聯網、金融、政府、電信和制造等行業AI滲透度提升
從行業維度看,2022年中國人工智能行業應用滲透度排名前五的行業依次為互聯網、金融、政府、電信和制造。與21年相比,行業AI滲透度明顯提升。 其中,互聯網行業依然是人工智能應用滲透度和投資最高的行業;金融行業的人工智能滲透度從2021年的55提升到62,智能客服、實體機器人、智慧網點、云上網點等成為人工智能在金融行業的應用典型;電信行業的人工智能滲透度從2021年的45增長到51,人工智能技術融入電信網絡的構建、優化,并為下一代智慧網絡建設提供支撐;制造行業的人工智能滲透度從40增長到45,預計到2023年年底,中國50%的制造業供應鏈環節將采用人工智能。
中國人工智能行業滲透度,2022vs2021
從場景應用維度看,智能化場景在行業的落地隨著時間的推移,正呈現出更加深入、更加廣泛的趨勢。 人工智能持續為提升用戶體驗做出貢獻,當前諸如智能客服、智能推薦、精準營銷等場景深入落地到各行業;人工智能也在精準科學防疫,加強公共衛生安全體系建設中承擔重要角色,在病毒演變預測、疫苗藥物研發、輔助診斷等維度實現廣泛應用;長期來看,企業通過在數字人等數字化營銷內容創作領域布局,創造差異化的營銷體驗,升級品牌形象;另外,科學家們越來越多地利用人工智能技術和方法,從數據中建立模型,重點圍繞新藥創制、基因研究、新材料研發等領域加速對前沿科學問題的探究。
人工智能應用場景發展
04
算力多元化發展提速,大模型加速行業落地
《報告》從算力層面,對人工智能芯片、服務器、 計算架構、算法及應用等方面的發展近況進行了全面分析。 從整體看AI服務器是人工智能市場增長的主力軍。IDC數據顯示,2021年全球人工智能服務器市場的同比增速為39.1%,超過全球整體人工智能市場增速(20.9%),是整體人工智能市場增長的推動力。中國AI服務器市場領跑全球,2021年人工智能服務器市場規模59.2億美元,與2020年相比增長68.2%,預計到2026年,中國人工智能服務器市場將達到123.4億美元。 從人工智能芯片角度,人工智能產業技術不斷提升,產業AI化加速落地,推動全球人工智能芯片市場高速增長。IDC預計,到2025年人工智能芯片市場規模將達726億美元。異構計算成為主流趨勢,未來18個月全球人工智能服務器GPU、ASIC和FPGA的搭載率均會上升,算力多元化發展趨勢明顯。 從計算架構發展來看,基于 DSA( Domain-Specific Architectures)思想設計的人工智能芯片正在成為主導,推動了人工智能芯片多元化發展。多元算力從“能用”到“好用”并且為企業創造業務價值,離不開通用性強、綠色高效、安全可靠的計算系統的支持。業內正在推動多元算力系統架構創新,基于計算節點內和節點間的互聯技術破局現有計算架構的瓶頸,通過充分調動起多芯片、多板卡、多節點的系統級能力,實現各種加速單元以及跨節點系統的高效協同,提升計算性能。 《報告》對于大模型的行業落地和發展情況也進行了分析。IDC調研顯示,未來超過80%的組織會優先考慮購買預先訓練好的人工智能模型。大模型是智算力驅動下典型的重大創新,被認為是“通用智能”的雛形,是業內探索實現普惠人工智能的重要途徑之一。 大模型發展的背后是龐大的算力支撐,例如AI+Science領域的AlphaFold2、自動駕駛系統、GPT-3等模型訓練需要幾百甚至幾千PD(PetaFlops/s-day,PD)的算力當量支持。 2022年,大模型正在成為AIGC領域發展的算法引擎,文生圖、虛擬數字人等AIGC類應用將快速進入到商業化階段,并為元宇宙內容生產帶來巨大的變革。 05
智能算力成為數字化創新的源動力
人工智能算力的增長為人工智能的持續創新發展提供支撐。宏觀層面,人工智能算力為國家創新力的發展帶來實質性推進,不僅在應用科學的突破上發揮了重要作用,也開始滲透到基礎科學領域,極大提高了科學研究的效率和科學發展的進程。 《報告》指出,人工智能應用正在從單點技術到多種技術能力融合方向發展、從事后分析向事前預判和主動執行方向發展、從計算智能和感知智能向認知智能和決策智能方向發展,創新應用場景逐步增多。 未來五年,隨著人機交互、機器學習、計算機視覺、語音識別技術的成熟,人工智能將在企業市場中加快應用與落地,智能算力將成為未來創新的核心推動力。 具體內容如下
來源:阿里研究院
近日,阿里研究院、智譜AI聯合發布《2023全球數字科技發展研究報告—全球科研實力對比》,報告認為,中國數字科技基礎研究勢力增長勢頭強勁,增量上已經趕超美國,但在高價值部分同發達國家仍有不小差距。未來需要產、學、研一起努力,共同推動中國數字技術產業向價值鏈高端躍升。
報告對全球數字技術論文進行全景式梳理分析。結果顯示,中美兩國在數字科技論文整體影響力上實力相當,其中國產出居世界第二,僅次美國。領先全球其他國家的優勢明顯。但是,中國數字科技領域Top 1%“頂尖論文”數量明顯少于美國,且平均被引量也明顯落后于美國。
中國論文總量和“頂尖論文”增速均與美國實現“黃金交叉”
隨著科研實力的逐步增強,中國近年來增長勢頭非常突出,中國與美國的差距在逐年縮小。數據顯示,中國2019年數字科技領域論文發表數量開始超過美國,且在2021年拉開較大差距。2020年開始“Top1%”論文數量反超美國。都與美國出現了“黃金交叉”,并逐年擴大與之優勢。 ** **
2012-2021年中美兩國論文發表數量變化態勢
** **
2012-2021 年中美兩國被引量 Top1% 論文數量變化
美國加州大學和中國科學院是全球生產數字科技“頂尖論文”最多的機構
從研究機構上看,中美兩國最重要的數字科技基礎研究機構分別為中國科學院和美國加州大學。其中,中科院數字科技論文發表數量高居全球第一,領先加州大學萬余篇。但在“Top1%”論文方面,加州大學發表數量多于中科院。另外,在平均引用率方面,中科院在前10強榜單上墊底。美國斯坦福大學、麻省理工學院和哈佛大學等機構被引用次數優勢明顯。
全球數字科技領域論文數量前10強機構
中國數字科技專利總數全球遙遙領先,但高價值專利落后于美日韓三國
全球數字技術專利對比,中國是數字技術專利大國,而非強國。雖然在數字技術專利數量上全球領先,中國的數字科技專利總量全球第一,是排名第二美國的2.9倍但中國數字技術高價值專利(市場價值100萬美金以上)數量在全球相對落后,美國數字科技高價值專利數量是中國的8倍,仍與世界頂級水平存在一定距離。
全球數字科技專利前10強國家
整體看,中國數字技術領域基礎研究,在論文與專利數量上有大幅度提升,高價值部分同發達國家研究機構相比,仍有一些差距。專利是傾向于應用技術的科研成果,其市場價值直接反映該技術應用產品處于產業價值鏈的位置。從專利市場價值分布看,中國數字技術專利價值在 30 萬美元以下的占 98%,因此中國數字技術產業仍處于全球價值鏈低端。論文是傾向于基礎研究的科研成果,往往是科技創新突破的先導。未來中國數字科技的發展前景在于從日益強大的基礎研究成果中實現實際應用轉化,推動數字技術產業向價值鏈高端躍升。 具體內容如下
觀眾在2021世界計算大會現場試用AI翻譯設備。新華社記者陳思汗攝
在日前舉行的2021人工智能計算大會上,國際數據公司IDC和浪潮信息聯合發布的《2021—2022中國人工智能計算力發展評估報告》顯示,相比2020年,人工智能在金融、制造、能源、公共事業和交通等行業體現的推動作用尤為顯著。同時,以智能計算中心為代表的算力基礎設施,通過提供公共的算力、數據及算法服務,讓算力服務易用,解決算力服務的供給問題。
“4年來,我們發現人工智能算力越來越受到重視,這方面的應用越來越成熟,無論是芯片的多元化還是人工智能服務器的計算能力、計算容量等都比4年前有了很大的提高。”IDC企業研究助理副總裁周震剛接受經濟日報記者采訪時說。
周震剛表示,相比去年,人工智能在各個行業的滲透度都在提升,尤其是在互聯網行業和金融行業。此外,制造、交通和能源行業在人工智能的應用也更加深入。
據了解,全球已有60多個國家和地區出臺人工智能政策,發布國家級人工智能戰略。IDC預測,2021年全球企業在人工智能軟件、硬件和服務的總投資將超850億美元,預計在2025年將增至2045億美元,5年復合增長率達24.5%。
不過,中國工程院院士、浪潮首席科學家王恩東認為,人工智能也帶來了指數級增長的算力需求,計算產業正面臨著多元化、巨量化、生態離散化交織的趨勢與挑戰。一方面,多樣化的智能場景需要多元化的算力,算力已經成為人工智能繼續發展的重中之重;另一方面,從芯片到算力的轉化依然存在巨大鴻溝,多元算力價值并未得到充分釋放。如何快速完成多元芯片到計算系統的創新,已經成為推動人工智能產業發展的關鍵環節。
人工智能產業化對算力的需求正在激增,浪潮信息副總裁劉軍表示,算法模型發展也將更加復雜,巨量模型將是規模化創新的基礎,“源1.0”等巨量模型的出現,讓構建大模型、提升人工智能處理性能成為發展趨勢。
目前,全球知名的人工智能公司在巨量模型上都投入巨大,谷歌、微軟、英偉達、浪潮、智源人工智能研究院、百度、阿里等公司相繼推出了各自的巨量模型。“巨量化的一個核心特征就是模型參數多、訓練數據量大。”劉軍以浪潮人工智能研究院開發的中文人工智能巨量模型“源1.0”為例介紹說,其數量高達2457億,訓練數據集規模達到5000GB。“我們對算力的追求沒有極限。”劉軍說。
人工智能芯片正呈現多元化發展趨勢,芯片的多元化為人工智能產業化的加速提供了重要的產業基礎和更加豐富的選擇。但是,芯片從造出來到大規模用起來,還隔著一個巨大的產業鴻溝。以一臺人工智能服務器研制為例,整個系統需要經過30多個開發流程,使用150多種加工制造工藝,對280多個關鍵過程控制點的質量進行嚴格把控,還要實現與算法框架和人工智能應用的優化與適配等問題。
“要想釋放多元算力價值、促進人工智能創新,一是要重視智算系統的創新,加大人工智能新型基礎設施建設,把從技術到應用的鏈條設計好,從體系結構、芯片設計、系統設計、系統軟件、開發環境等各個領域形成既分工明確又協同創新的局面;二是要加快推動開放標準建設,通過統一、規范的標準,將多元化算力轉變為可調度的資源,讓算力好用、易用。”王恩東說。
中國人工智能基礎設施市場規模保持高速增長,中國服務器廠商已成為全球服務器市場的中堅力量。IDC預計,2021年人工智能加速服務器市場規模將達56.9億美元,相比2020年增長61.6%,到2025年,中國人工智能加速服務器市場將達108.6億美元。
我國明確提出在全國布局算力網絡國家樞紐節點,同時積極推進智能計算中心建設,發力構建普適普惠、安全可靠的現代化基礎設施體系和生態。智能計算中心已被越來越多的地方政府視為實現支撐和引領數字經濟、智能產業、智慧城市、智慧社會發展的關鍵性信息基礎設施,為算力、數據、生態和產業發展提供平臺化支持。