來源:弗若斯特沙利文 近日,弗若斯特沙利文(Frost & Sullivan,簡稱“沙利文”)發布《AI 大模型市場研究報告(2023)——邁向通用人工智能,大模型拉開新時代序幕》。 報告認為,伴隨基于大模型發展的各類應用的爆發,尤其是生成式 AI,促使大模型帶來的價值進一步升級到人類生產力工具的顛覆式革新,逐漸拉開了通用人工智能(AGI)的發展序幕。 在通往AGI時代的旅程上,大模型和人類反饋的強化學習(RLHF)的結合,不僅重構了AI開發范式,未來軟件80% 的價值將由 AI 大模型提供,剩余 20% 會由提示工程和傳統業務開發組成,開發者的生產力將得到極大釋放;與此同時,AI的發展也將由之前單向發展的數據飛輪升級到不斷迭代進化的智慧飛輪,更高效的解決海量的開放式任務。 報告指出,中國大模型廠商的成功因素主要包括:全棧大模型訓練與研發能力、業務場景落地經驗、AI安全治理舉措、以及生態開放性4個方面,其中全棧大模型訓練與研發能力還包括數據管理經驗,AI基礎設施建設與運營,以及大模型系統和算法設計3個部分。這些成功因素分別體現著大模型廠商的產品技術能力、戰略愿景能力、生態開放能力三個維度。 基于這三個維度,沙利文制定了超過70個評估指標,對大模型廠商進行了全面的能力評估。 關鍵發現點
AI大模型的高速發展離不開底層技術支持和應用場景迭代。大模型作為AGI時代的曙光,相關廠商也將迎來廣闊的發展空間。本報告將呈現從發展現狀、驅動因素洞察AI大模型廠商競爭與發展關鍵點,并推演競爭格局的邏輯分析過程: 前瞻洞察:
通向AGI的技術路徑具有多元性,目前大模型是最佳實現方式。大模型具有強大的泛化性、通用性和實用性,能夠降低AI開發門檻、提高模型精度和泛化能力、提高內容生成質量和效率等多種價值,實現了對傳統AI技術的突破,并成為AGI的重要起點。 進而將AI發展由數據飛輪升級到智慧飛輪,最終邁向人機共智。大模型和人類反饋的強化學習(RLHF)的結合,進一步重構了AI開發范式,進入大模型主導的軟件2.0時代。另一方面,AI開發則形成新的“二八定律”,開發者的生產力將得到極大釋放。 驅動因素:
大模型“基礎設施-底層技術-基礎通用-垂直應用”發展路線逐漸清晰,國內各廠商加速戰略布局,加大資金和技術投入,迎頭趕上全球大模型產業化浪潮,本土化大模型迎來發展新機遇。整體上,行業驅動因素主要包含三個層面: (1)政策端:政策環境持續優化,賦能AI大模型市場高速發展。 (2)供給端:下一代AI基礎設施等快速發展,助力大模型應用落地。 (3)需求端:AI市場高景氣,大模型下游行業需求旺盛。 行業觀點:
大模型未來發展將趨于通用化與專用化并行、平臺化與簡易化并進。同時,MaaS模式將成為AI應用的全新形式且快速發展,重構AI產業的商業化結構生態,激發新的產業鏈分工和商業模式。未來,大模型將深入應用于用戶生活和企業生產模式,釋放創造力和生產力,活躍創造思維、重塑工作模式,助力企業的組織變革和經營效率,賦能產業變革。 關鍵成功因素:
大模型面臨算力需求大、訓練和推理成本高、數據質量不佳等挑戰。一個可對外商業化輸出的大模型的成功,要求其廠商擁有全棧大模型訓練與研發能力、業務場景落地經驗、AI安全治理舉措、以及生態開放性4大核心優勢,才能保證其在競爭中突出重圍。其中,全棧大模型訓練與研發能力還包括數據管理經驗,AI基礎設施建設與運營,以及大模型系統和算法設計3個關鍵要素。 競爭格局:
在競爭格局漸趨明晰的過程中,相關廠商需跨越技術、人才、資金等壁壘,在產品技術能力、戰略愿景能力、生態開放能力三大維度上展開角逐。通過遴選,報告選擇了5家大模型廠商,分別為商湯、百度、阿里巴巴、華為、騰訊,評價模型包含15個一級指標、56個二級指標,對廠商大模型的各個能力進行評估。 用戶建議:
通過此報告能夠了解大模型廠商的競爭態勢,關注領先廠商,內部創建大模型戰略文件,明確其優勢、帶來的風險和機遇,以及部署路線圖,針對具體的用例,權衡模型的優勢和風險,并選擇合適場景試點、評估大模型的應用價值。 具體內容如下
大模型主導的生成式AI,尤其是GPT-4的發布,讓人類社會看到了通用人工智能時代的曙光。這意味著,經過“大工業化”的高效預訓練后,具備了強大的泛化能力,能夠在眾多領域像人類一樣進行思考、解決問題,并進行持續、快速的自我進化,大模型主導的生成式AI,將擁有極為廣闊的應用前景,有望賦能千行百業。未來,每個行業都將再進行一次智能化改造!
在政策層面,中央首次提到通用人工智能,為AIGC產業的發展提供了積極政策環境。
技術層面,作為AIGC生態的核心,大模型本身可根據可交互對象分成文本、音頻、圖像、視頻等不同模態以及跨模態,更多的模態,則意味著更多的交互和應用場景組合。我國AIGC產業目前尚處于發展初期,各模態技術發展進度不盡相同。目前,以文本生成、音頻生成應用相對廣泛。
當前,在應用層面,縱向看,在垂直應用方向上,傳媒、教育、營銷、客服、數字人等數字化程度更高、容錯率相對較高的領域先行先試;橫向看,在價值鏈角度,主要集中于技術嘗鮮、組織內部的提效降本,下一步將朝著終端用戶側的價值創造及傳遞場景展開。
圖片報告關鍵發現
大模型支撐的生成式AI,讓人類社會有望步入通用人工智能時代,擁有廣闊的應用前景,有望賦能千行百業。 當前生成式AI的落地整體處于初級階段,不同模態的落地時間表差異明顯,企業需求主要集中在數字化程度高、容錯率相對較高的領域,以借助中間件調用大模型能力為主要方式。數字內容產業、客戶服務是生成式AI滲透的典型行業和場景。 AIGC+數字內容:數字經濟快速發展,帶來國內數字內容消費需求的持續快速增長,但國內數字內容產業面臨需求變化快、供給側內容整體過剩而優質供給不足的問題。以長音頻數字內容生產為例,AIGC能夠助力內容生產的工程化、高質量、個性化。 AIGC+客戶服務:大模型依托自身強大泛化能力優勢,有望給國內智能客服領域的服務前、服務中、服務后各環節帶來效能提升。但由于存在效果不明、數據安全等問題,短期內大模型很難對現有智能客服體系實現完全替代和顛覆,廠商需要探索如何在融合大模型能力的同時實現模式突破。
AI大模型是一個資本密集,人才密集和數據密集的產業,如何形成“數據-模型-應用”的飛輪,是大模型企業成功的關鍵。通過深度復盤海外基礎大模型企業,梳理各公司的資源稟賦和路徑選擇,我們看到:
2)谷歌有深厚的人才和技術積累,但管理架構上未形成合力;
3)英偉達通過CUDA框 架,形成了其它芯片公司難以逾越的護城河;
4)Meta等正通過模型開源進 行反擊。當前,國內百度、阿里、商湯、華為等積極加入,行業呈現“百模大戰”的競爭格局,是否能形成飛輪是最后勝出的關鍵。
OpenAI與微軟是目前AI大模型技術水平、產品化落地最為前沿的領軍者。復盤OpenAI發展歷程,我們認為以下特質和戰略選擇至關重要: 1)高人才密度,內部堅定信仰 AGI;
2)把握正確的技術路線不動搖,Transformer架構誕生后快速選擇,并堅定其中的解碼器路線;
3)與微軟合作,解決算力不足問題;
4)推動產品落地,形成模型調用、數據反饋和模型迭代的正反饋循環。目前,微軟已經將OpenAI的大模型能力整合至其辦公軟件、搜 索、操作系統、云服務等各ToB、ToC產品或服務中。
谷歌AI技術和人才儲備豐厚,但產品化一度落后于OpenAI:算法上,于 2017年推出當前最主要的LLM基礎架構——Transformer,并推出 BERT、 PaLM-E等具有里程碑意義的大模型;算力上自研TPU芯片;TensorFlow框架亦由谷歌推出。谷歌擁有包括搜索引擎、地圖、郵箱、辦公套件等在內的豐富產品生態,AI大模型落地空間廣闊。23年以來,谷歌加速追趕微軟及OpenAI: 1)合并谷歌大腦、DeepMind兩大AI團隊,以匯聚資源;
2) 加速大模型產品化落地。I/O大會上發布PaLM-2,并已應用在超過25 種功能和產品中,強化聊天機器人Bard與谷歌以及外部其他應用的協同能力。
Transformer大模型在自動駕駛中應用趨勢明確。Transformer基于Attention機制,憑借優秀的長序列處理能力和更高的并行計算效率,2021年由特斯拉引入自動駕駛領域。Transformer與CNN相比最大的優勢在于其泛化性更強。CNN只能對標注過的物體進行相似度的比對,通過不斷學習完成對該物體識別的任務;而Transformer可以通過注意力層的結構找到更基本的元素與元素間之間多個維度的相關信息進而找到一種更泛化的相似規律,進而提高自動駕駛的泛化能力。同時,不同于RNN存在存儲時間長度有限以及順序依賴的問題,Transformer模型具有更高的并行計算效率并且可以學習到長時間距離的依賴關系。目前,Transformer主要應用在自動駕駛感知模塊中從2D特征圖向BEV鳥瞰圖的視角轉換。
城市領航輔助駕駛落地在即,AI大模型助力實現“脫高精度地圖”。目前,主機廠正逐步從高速場景向城市場景拓展,2023年有望成為城市領航輔助駕駛的大規模落地的元年。相比于高速場景,城市場景所面臨的Cornercase大幅提升,要求自動駕駛系統具備更強的泛化能力。目前已落地城市NGP主要基于高精度地圖方案,高精地圖能夠提供超視距、厘米級相對定位及導航信息,在數據和算法尚未成熟之前,對于主機廠實現高級別自動駕駛具有重要意義。但高精度地圖應用過程中無法做到實施更新、法規風險高、高成本的三大問題難以解決。BEV感知算法通過將不同視角的攝像頭采集到的圖片統一轉換到上帝視角,相當于車輛實施生成活地圖,補足了自動駕駛后續決策所需要的道路拓撲信息,因而可以實現去高精度地圖化。目前,小鵬、華為等頭部自動駕駛廠商均明確提出“脫圖時間表”,自動駕駛算法“重感知,輕地圖”趨勢明確。 大數據和大算力是大模型應用的重要前置條件。Transformer大模型量變引起質變需要1億公里的里程數據。并且,傳感器采集得到的rawdata需進行標注后才可用于算法模型訓練,自動標注工具可大幅提升數據處理速度。2018年至今,特斯拉數據標注從2D人工標注逐步發展至4D空間自動標注;國內廠商中小鵬、毫末智行等亦相繼推出自動標注工具大幅提升標注效率。除真實數據外,仿真場景是彌補訓練大模型數據不足問題的重要解決方式。生成式AI有望推動仿真場景大幅提升泛化能力,幫助主機廠提升仿真場景數據的應用比例,從而提高自動駕駛模型的迭代速度、縮短開發周期。大算力是Transformer模型訓練的另一重要條件,超算中心成為自動駕駛廠商重要的基礎設施。特斯拉AI計算中心Dojo總計使用了1.4萬個英偉達的GPU來訓練AI模型,網絡訓練速度提升30%,國內廠商中小鵬與阿里聯合出資打造自動駕駛AI智算中心“扶搖”,將自動駕駛算法的模型訓練時間提速170倍。
大模型提升機器理解能力,優化人機交互方式。AI大模型是實現通用人工智能(AGI)的重要方向,包含自然語言處理(NLP)、計算機視覺(CV),多模態大模型等。ChatGPT推出兩個月MAU突破1億,是自然語言處理領域突破性的創新,大力出奇跡后出現涌現能力,更理解人類語言。大模型“預訓練+精調”即可對下游應用賦能。我們認為大模型優化人類與機器交互方式,是效率的革命。大模型是“大數據+大算力+強算法”結合的產物,對比國內外大模型,算力儲備上國內并無短板;算法上OpenAI有先發優勢;前期數據的豐富度和量對大模型的訓練至關重要。
百度文心大模型:包含NLP、CV等在內的系列大模型。文心大模型包含NLP大模型、CV大模型、跨模態大模型、生物計算大模型、行業大模型等。與Bing類似,文心一言有望優化C端用戶搜索、創作體驗;ToB方面,百度已開放大模型API接口,在文案、AI作畫、開放域對話方面賦能企業。對于具體行業,百度推出文心行業大模型,以“行業知識增強”為核心特色。 阿里巴巴通義大模型:由通義-M6模型融合語言模型和視覺模型組成,率先應用在硬件終端天貓精靈和軟件通義千問。通義大模型包括統一底座“M6-OFA”,三大通用模型“通義-M6”“通義-AliceMind”“通義-視覺大模型”,以及行業層面的不同垂直領域專業模型。在應用上,天貓精靈基于通義大模型推出擬聲助手“鳥鳥分鳥”;對話式通義千問已經開始內測。 騰訊混元大模型:采用熱啟動降低訓練成本,文字視頻等多領域表現優異,已在廣告游戲等多場景落地。目前騰訊混元大模型已在騰訊廣告、內容創作、游戲、對話式智能助手等方面實現落地,大幅提升工作效率并降低成本。 華為盤古大模型:基于ModelArts研發設計的系列模型,在物流、藥物研發、氣象預測等多領域已實現落地。目前盤古CV大模型已覆蓋了物流倉庫監控等領域;NLP大模型覆蓋了智能文檔檢索、智能ERP和小語種大模型;科學計算大模型則應用于氣象預報、海浪預測等方面。 字節跳動AI探索基礎扎實,在語言大模型和圖像大模型初步布局。字節跳動AIGC大模型將從語言和圖像兩種模態發力,預期在今年年中推出大模型。字節跳動在算力、算法、數據方面并無短板。目前模型可用于圖文、視頻內容生成等,飛書將推出智能AI助手“MyAI”。
1、ChatGPT火爆的背后:算法革新+算力支持+數據共振 ChatGPT引起全球熱烈反響,上線僅五天用戶突破百萬,ChatGPT在文本交互和語言理解方面能力的顯著進步或為通用人工智能的實現帶來曙光。究其先進性根本,ChatGPT在以往基礎上推進算法革新優化,輔以強大算力支持,并以大規模數據共振,協同助推這一劃時代產品誕生。OpenAI以B端提供API接口流量+C端訂閱收費模式,探索ChatGPT商業化路徑。展望未來AI將橫縱向并行,結合技術深化與能力邊界拓展,進一步鋪開應用面。 2、數字內容生產新方式——AIGC AIGC的興起推動人類叩響強人工智能之門,可應用于文本、音頻、圖片、視頻、跨模態、策略生成等,有望開啟新一輪內容生產力革命。隨著Transformer、DiffusionModel等算力模型的迭代,推動AIGC在設計、內容創作、游戲智能、機器交互等領域實現降本增效。 3、新時代生產力工具,AIGC賦能內容生產 基于AI生成內容技術,AIGC已在游戲、廣告營銷、影視、媒體、互聯網、娛樂等領域初顯成效,并展現出較大的潛力。 AIGC將推動游戲生產范式升級,并豐富游戲資產生成,高效輔助游戲測試,使制作成本顯著降低,全流程賦能游戲買量; AIGC貫穿廣告營銷全流程,將優化案頭工作環節,提供更專業的個性化營銷方案,并充實廣告素材,實現廣告自動化生成; AIGC提升影視行業全管線效率。影視劇本創作已初見成效,多AI技術將助力電影中期拍攝,后期制作將更快完成; AIGC帶給媒體行業人機協作方案。新聞寫作編排效率提升,傳媒向智媒轉向開啟新篇章; AIGC提供互聯網行業豐富內容,和更便捷的服務。ChatGPT賦能智慧搜索,互為供給加速發展內容平臺發展,虛擬結合激發電商沉浸式體驗; AIGC為娛樂行業提供了更多樣的體驗。人際交互娛樂邁入新臺階,AIGC或成元宇宙之匙。
自ChatGPT推出以來,國內學術界和科技企業相繼宣布或將推出類似機器人對話模型,有望推動大模型發展。2月7日,百度官宣“文心一言”。2月20日,復旦大學發布了類ChatGPT模型“MOSS”,并面向大眾公開邀請內測,國產大模型有望迎來爆發式增長。 需求和政策兩方面,合力推動AI產業增長。國內應用層面的需求推動AI產業的加速發展。根據IDC數據預測,2021年中國人工智能軟件及應用市場規模為51億美元,預計2026年將會達到211億美元。數據、算法、算力是AI發展的驅動力,其中數據是AI發展的基石,中國數據規模增速有望排名全球第一。政策方面,“十四五”規劃中提到“瞄準人工智能”,“聚焦人工智能關鍵算法”,加快推進“基礎算法”的“突破與迭代應用”;北京、上海、廣州等城市發布相關規劃。 頭部企業采取“模型+工具平臺+生態”三層共建模式,有助于業務的良性循環,也更容易借助長期積累形成競爭壁壘。大模型廠商主要包括百度(文心大模型)、騰訊(HunYuan大模型)、阿里(通義大模型)、商湯、華為(盤古大模型)等企業,也有智源研究院、中科院自動化所等研究機構,同時英偉達等芯片廠商也紛紛入局。大模型增強了AI技術的通用性,助力普惠AI的實現。未來,大模型有望于場景深度融合,配合專業工具和平臺支持應用落地,開放的生態來激發創新,形成良性循環。 技術發展有望促進生產效率提升,并進一步創造新的消費和需求,有利于文娛內容和互聯網行業。在AIGC和ChatGPT方面,我們建議持續關注技術發展和應用情況,把握技術催化和商業化落地帶來的投資機會:1)具備AIGC和ChatGPT的技術探索和應用的公司:百度集團-SW、商湯-W、萬興科技、拓爾思等;2)具有海量內容素材且具有AIGC探索布局的,圖片/文字/音樂/視頻內容及平臺公司騰訊控股,閱文集團、美圖公司、昆侖萬維、湯姆貓、神州泰岳、視覺中國、中文在線、漢儀股份、天娛數科、風語筑等。
1月11日,阿里巴巴達摩院發布《2023十大科技趨勢》。 達摩院今年推出的十大科技趨勢涵蓋范式重置、產業革新和場景變化三大領域,其中有些趨勢——例如多模態與訓練大模型和生成式AI的價值已經開始在現實社會有所顯現,有些趨勢——例如Chiplet和存算一體等技術正在引起全社會的深入思考,有些趨勢——例如云原生安全則提出了非常廣闊的命題并需要越來越多的人投入其中才能予以兌現。 展望 2023,多元技術的協同并進驅動計算與通信的融合、硬件和軟件的融合,應用需求的爆發驅動 AI 技術與行業的融合,數字技術與產業生態的融合,企業、個人與政府在安全技術與管理上的融合。科技進步與產業應用雙輪驅動的融合創新已成為不可逆轉的宏大趨勢。 范式重置
多模態預訓練大模型
基于多模態的預訓練大模型將實現圖文音統一知識表示,成為人工智能基礎設施。
人工智能正在從文本、語音、視覺等單模態智能,向著多種模態融合的通用人工智能方向發展。多模態統一建模,目的是增強模型的跨模態語義對齊能力,打通各個模態之間的關系,使得模型逐步標準化。目前,技術上的突出進展來自于 CLIP(匹配圖像和文本)和 BEiT-3(通用多模態基礎模型)。 基于多領域知識,構建統一的、跨場景、多任務的多模態基礎模型已成為人工智能的重點發展方向。未來大模型作為基礎設施,將實現圖像、文本、音頻統一知識表示,并朝著能推理、能回答問題、能總結、做創作的認知智能方向演進。 Chiplet
Chiplet 的互聯標準將逐漸統一,重構芯片研發流程。
Chiplet 是硅片級別的“解構 - 重構 -復用”,它把傳統的 SoC 分解為多個芯粒模塊,將這些芯粒分開制備后再通過互聯封裝形成一個完整芯片。芯粒可以采用不同工藝進行分離制造,可以顯著降低成本,并實現一種新形式的 IP 復用。 隨著摩爾定律的放緩,Chiplet 成為持續提高 SoC 集成度和算力的重要途徑,特別是隨著 2022 年 3 月份 UCle 聯盟的成立,Chiplet 互聯標準將逐漸統一,產業化進程將進一步加速。基于先進封裝技術的 Chiplet 可能將重構芯片研發流程,從制造到封測,從 EDA 到設計,全方位影響芯片的區域與產業格局。 存算一體
資本和產業雙輪驅動,存算一體芯片將在垂直細分領域迎來規模化商用。
存算一體旨在計算單元與存儲單元融合,在實現數據存儲的同時直接進行計算,以消除數據搬移帶來的開銷,極大提升運算效率,以實現計算存儲的高效節能。存算一體非常符合高訪存、高 并 行 的 人 工 智 能 場 景 計 算 需 求。在產 業 和 投 資 的 驅 動 下, 基 于SRAM,DRAM,Flash 存儲介質的產品進入驗證期,將優先在低功耗、小算力的端側如智能家居、可穿戴設備、泛機器人、智能安防等計算場景落地。 未來,隨著存算一體芯片在云端推理大算力場景落地,或將帶來計算架構的變革。它推動傳統的以計算為中心的架構向以數據為中心的架構演進,并對云計算、人工智能、物聯網等產業發展帶來積極影響。 產業革新
云原生安全
安全技術與云緊密結合,打造平臺化、智能化的新型安全體系。
云原生安全是安全理念從邊界防御向縱深防御、從外掛模式向內生安全的轉變,實現云基礎設施的原生安全,并基于云原生技術提升安全的服務能力。安全技術與云計算由相對松散走向緊密結合,經過“容器化部署”、“微服務化轉型”走向“無服務器化”的技術路線,實現安全服務的原生化、精細化、平臺化和智能化: * 以安全左移為原則,構建產品研發、安全、運維一體化的產品安全體系,增進研發,安全和運維融合協同;
以統一的身份驗證和配置管理為基礎,實現精準授權和動態策略配置;
以縱深防御體系為架構,平臺級的安全產品為依托,實現精準主動防御,化解傳統安全產品碎片化的問題;
以安全運營為牽引,實現涵蓋應用、云產品、網絡等全鏈路的實時檢測、精準響應、快速溯源和威脅狩獵。
軟硬融合云計算體系架構
云計算向以 CIPU 為中心的全新云計算體系架構深度演進,通過軟件定義,硬件加速, 在保持云上應用。
開發的高彈性和敏捷性同時,帶來云上應用的全面加速。云計算從以 CPU 為中心的計算體系架構向以云基礎設施處理器(CIPU)為中心的全新體系架構深度演進。通過軟件定義,硬件加速,在保持云上應用開發的高彈性和敏捷性同時,帶來云上應用的全面加速。新的體系架構下,軟硬一體化帶來硬件結構的融合,接入物理的計算、存儲、網絡資源,通過硬件資源的快速云化實現硬件加速。 此外,新架構也帶來軟件系統的融合。這意味著以 CIPU 云化加速后的算力資源,可通過 CIPU 上的控制器接入分布式平臺,實現云資源的靈活管理、調度和編排。在此基礎上,CIPU 將定義下一代云計算的服務標準,給核心軟件研發和專用芯片行業帶來新的發展機遇。 端網融合的可預期網絡
基于云定義的可預期網絡技術,即將從數據中心的局域應用走向全網推廣。
可預期網絡(Predictable Fabric)是由云計算定義,服務器端側和網絡協同的高性能網絡互聯系統。計算體系和網絡體系正在相互融合,高性能網絡互聯使能算力集群的規模擴展,從而形成了大算力資源池,加速了算力普惠化,讓算力走向大規模產業應用。 可預期網絡不僅支持新興的大算力和高性能計算場景,也適用于通用計算場景,是融合了傳統網絡和未來網絡的產業趨勢。通過云定義的協議、軟件、芯片、硬件、架構、平臺的全棧創新,可預期高算力網絡有望顛覆目前基于傳統互聯網 TCP 協議的技術體系,成為下一代數據中心網絡的基本特征,并從數據中心的局域應用走向全網推廣。 雙引擎智能決策
融合運籌優化和機器學習的雙引擎智能決策,將推進全局動態資源配置優化。
企業需在紛繁復雜、動態變化的環境中快速精準地做出經營決策。經典決策優化基于運籌學,通過對現實問題進行準確描述來構建數學模型,同時結合運籌優化算法,在多重約束條件下求目標函數最優解。隨著外部環境復雜程度和變化速度不斷加劇,經典決策優化對不確定性問題處理不夠好、大規模求解響應速度不夠快的局限性日益突顯。學術界和產業界開始探索引入機器學習,構建數學模型與數據模型雙引擎新型智能決策體系,彌補彼此局限性、提升決策速度和質量。 未來,雙引擎智能決策將進一步拓展應用場景,在大規模實時電力調度、港口吞吐量優化、機場停機安排、制造工藝優化等特定領域推進全局實時動態資源配置優化。 計算光學成像
計算光學成像突破傳統光學成像極限,將帶來更具創造力和想象力的應用。
計算光學成像是一個新興多學科交叉領域。它以具體應用任務為準則,通過多維度獲取或編碼光場信息(如角度、偏振、相位等),為傳感器設計遠超人眼的感知新范式;同時,結合數學和信號處理知識,深度挖掘光場信息,突破傳統光學成像極限。 目前,計算光學成像處于高速發展階段,已取得許多令人振奮的研究成果,并在手機攝像、醫療、無人駕駛等領域開始規模化應用。未來,計算光學成像有望進一步顛覆傳統成像體系,帶來更具創造力和想象力的應用,如無透鏡成像、非視域成像等。 場景變換
大規模城市數字孿生
城市數字孿生在大規模趨勢基礎上,繼續向立體化、無人化、全局化方向演進。
城市數字孿生自 2017 年首度被提出以來,受到廣泛推廣和認可,成為城市精細化治理的新方法。近年來,城市數字孿生關鍵技術實現了從量到質的突破,具體體現在大規模方面,實現了大規模動態感知映射(更低建模成本)、大規模在線實時渲染(更短響應時間),以及大規模聯合仿真推演(更高精確性)。 目前,大規模城數字孿生已在交通治理、災害防控、雙碳管理等應用場景取得較大進展。未來城市數字孿生將在大規模趨勢的基礎上,繼續向立體化、無人化、全局化方向演進。 生成式 AI
生成式 AI 進入應用爆發期,將極大地推動數字化內容生產與創造。
生成式 AI(Generative AI 或 AIGC)是利用現有文本、音頻文件或圖像創建新內容的技術。過去一年,其技術上的進展主要來自于三大領域:圖像生成領域, 以 DALL·E-2、Stable Diffusion 為代表的擴散模型(Diffusion Model);自然語言處理(NLP)領域基于 GPT-3.5的 ChatGPT;代碼生成領域基于Codex的 Copilot。 現階段的生成式 AI 通常被用來生成產品原型或初稿,應用場景涵蓋圖文創作、代碼生成、游戲、廣告、藝術平面設計等。未來,生成式 AI 將成為一項大眾化的基礎技術,極大地提高數字化內容的豐富度、創造性與生產效率,其應用邊界也將隨著技術的進步與成本的降低擴展到更多領域。 具體內容如下
如同蒸汽時代的蒸汽機、電氣時代的發電機、信息時代的計算機和互聯網,人工智能正成為推動人類進入智能時代的決定性力量。全球產業界充分認識到人工智能技術引領新一輪產業變革的重大意義,紛紛轉型發展,搶灘布局人工智能創新生態。人工智能細分賽道持續創新下變革在即,本報告重點關注AIGC領域。
AIGC顛覆傳統內容產出模式,或為web3.0內容創造新引擎。AIGC本質上是一種AI賦能技術,能夠通過其高通量、低門檻、高自由度的生成能力廣泛服務于各類內容的相關場景及生產者。隨著人工智能生成能力的突破進展,內容生產已經從專業生成內容(PGC)、用戶生成內容(UGC),進入到人工智能生成內容(AIGC,AI generated content)時代,AIGC被認為是web3.0的重要基礎設施。AIGC的快速興起源于深度學習技術的快速突破和日益增長的數字內容供給需求;應用價值層面,AIGC有望成為數字內容創新發展新引擎,為數字經濟發展注入新能量。數據+算法+算力三大核心要素,決定AIGC產出質量。①數據,海量優質的應用場景數據是訓練算法精確性關鍵基礎。②算法,神經網絡、深度學習等算法是挖掘數據智能的有效方法。與傳統機器深度機器學習算法不同,神經網絡在學習范式+網絡結構上的迭代提升了AI算法的學習能力,未來多模態大模型或為核心趨勢,賦能產業空間及實踐潛力。③算力,計算機、芯片等載體為AIGC提供基本的計算能力。 AIGC技術場景中,個性化及自動化內容產出為核心價值。①技術成熟度較高結構化領域大部分是在和人力生成內容進行競爭。其中的存量價值來源于同類內容的降本增效,而增量價值則來源于跨模態的內容生成以及AI本身帶來的科技感。對內容渠道的把控將成為核心競爭力。發行商、內容最終消費渠道具有強的產業鏈話語權。②底層技術基本明確/仍待完善的原創性創作領域,本質為AI下的個性化數字內容的自動化構建。該領域重點關注和其配套數據或底層原理是否清晰、商業化路徑。目前AIGC整體影響仍十分有限,主要是中國市場供給端仍處于起步階段。 AIGC應用場景中,數字化程度高及內容需求豐富的領域有廣闊應用空間。隨著AIGC技術快速迭代,其可高效生成不同模態的信息產出(包括文字、音頻、視頻及跨模態),以真實性、多樣性、可控性及綜合性等特征,有望幫助企業提高內容生產的效率,以及為其提供更加豐富多元、動態且可交互的內容,或將率先在傳媒、電商、影視、娛樂等數字化程度高、內容需求豐富的行業取得重大創新發展。 深度學習模型+開源模式加速AIGC普及,海外AIGC已到了“快速發展階段”。①隨著深度學習模型不斷迭代,人工智能生成內容百花齊放,產出效果逐漸逼真直至人類難以分辨。2018年,人工智能生成的畫作在佳士得拍賣行以43.25萬美元成交,成為首個出售的人工智能藝術品;2019年,DeepMind發布DVD-GAN模型用以生成連續視頻;2022年11月,OpenAI上線了智能對話系統(聊天機器人)ChatGPT,引發全球熱潮。ChatGPT的成功離不開參數競賽時代下的“大模型”,顯卡等硬件優化帶來的“大算力基礎”與基于“大數據”的RLHF訓練模式。但由于訓練數據的缺乏及訓練數據的偏差,ChatGPT仍需要高成本的調優及持續訓練,進而實現商業化落地。②“開源模式”加速AIGC產業發展。以深度學習模型CLIP為例,開源模式加速CLIP模型的廣泛應用,使之成為當前最為先進的圖像分類人工智能,并讓更多機器學習從業人員將CLIP模型嫁接到其他AI應用。 中國AIGC仍處“萌芽期”,技術能力與產品形態的成熟、核心場景的確定及產業的接納態度為行業關鍵發展節點。據量子位預測,AIGC在中國發展可分為三個階段:助手階段(摸索磨合期,2021年~2026年):AIGC輔助人類進行生產,優先變現的關鍵在于編輯優化功能,行業創新關鍵能力為素材模塊分拆+個性化推薦;協作階段(推廣應用期,2026年~2028年):人機共創,主要價值為降本增效及提供創意,預計互聯網大廠將普遍布局,競爭熱度提升;原創階段(價值增長期,2028年之后):AIGC將獨立完成內容創作,產生附加價值。中國AIGC企業均在初創階段,機會也許藏在垂直應用領域中,對賽道的選擇十分關鍵。
過去十年,人工智能從實驗室走向產業化,并在全球范圍內掀起新一輪的技術革命。AI在迅速融入細分場景的同時也在不斷地重塑傳統行業模式,為經濟社會輸出獨一無二的未來價值。弗若斯特沙利文(Frost & Sullivan,以下簡稱“沙利文”)發布了最新的《中國深度學習軟件框架市場研究報告(2021)》,對2021年中國深度學習軟件框架市場進行了深度的調研與分析。
深度學習是本輪人工智能爆發的關鍵技術,而深度學習軟件框架則是解決該技術“落地難”困境的底層開發工具。當前,深度學習技術已然邁入升級優化階段,帶動相關產業高速蓬勃發展。本報告旨在通過對行業發展歷程及產業鏈的梳理探究行業核心驅動因素,剖析當下深度學習軟件框架行業市場趨勢,并基于應用、產品及生態三大關鍵維度構建廠商競爭力體系,評價主流玩家的核心競爭優勢及綜合壁壘,形成對中國市場深度學習軟件框架發展情況的客觀評價,并為行業未來發展提供參照建議與關鍵啟發。
深度學習軟件框架是一種通過對算法進行模塊化封裝,以實現快速搭建深度學習模型的工具。作為一種底層開發工具,它可以有效降低AI應用開發技術門檻,助力深度學習技術突破發展瓶頸。從承擔任務、部署位置和工作流程三個維度進行考察,深度學習軟件框架的細分類型具有不同的關鍵技術要求,也為各類廠商提供了多樣化的戰略切入點。
縱觀深度學習軟件框架的發展歷程,大致可以分為起步、調整和加速發展三階段。2014年開始,全球人工智能學術界及產業界各研發主體陸續開源旗下自主研發深度學習軟件框架,并以框架為主體搭建人工智能開放開發平臺,推動人工智能產業生態的建立。其中,由谷歌團隊開發的TensorFlow及由Meta團隊開發的PyTorch兩款深度學習軟件框架占據業界相對主導地位。
同時,中國正在快速進行開源開發框架的系統化布局,百度飛槳PaddlePaddle、騰訊優圖NCNN、華為MindSpore、阿里XDL等自研的開源深度學習軟件框架加速升級。其中,百度飛槳PaddlePaddle作為中國最早推出的開放框架之一,已廣泛應用于智能制造、智能金融、智能醫療等業務場景。目前,隨著主流廠商產品的更迭推進,深度學習軟件框架已步入加速發展階段。
深度學習軟件框架產業鏈主要由上游硬件、中游框架開發商和下游應用場景構成。上游是深度學習實現的基礎,主要包括計算硬件(芯片),為深度學習軟件框架提供算法及算力支撐。中游是深度學習軟件框架的核心,以模擬人的智能相關特征為出發點,構建應用技術路徑,主要包括語音識別、計算機視覺和自然語言處理。下游主要為深度學習軟件框架在各細分場景的應用,主要包括制造、安防、金融、醫療、零售、交通、物流、農業等領域。未來,上游基礎運算升級、中游應用技術成熟以及下游應用場景融合,都將為其后續發展深度賦能。
自研AI芯片、云原生架構、彈性分布式訓練服務以及MLOps能力成為平臺核心能力
AI芯片將持續架構創新、形態演進以及軟硬一體化趨勢;云原生應用可以為AI開發平臺的用戶(開發者)提供更敏捷高質量的應用交付以及更簡單和高效的應用管理;分茍式訓練可提供底層資源的彈性配置,提升系統的資源利用率;MLOps為AI開發平臺帶來靈活性與速度。
開發者流量與平臺規模是AI開發平臺營收決定性要素
AI開發平臺商業模式相對簡單。AI開發平臺經營模式是通過為企業或并發者提供Ai技術接口或AI并發工具而獲利I計費方式主要包括免費、按調用量計費、包年或包月三種。
模型調用業務營收將提升
2016-2020年,中國AI開發平臺營收規模快速擴張,2020年中國AI開發平臺營收突破200億元^現階段算力、數據、模型調用、部署/維護四項業務占AI并發平臺的營收占比約為4:3:21。未來,隨著推斷應用占比的提升,數據業務的營收占比預計將下降;而隨著AI在各垂直場景中應用的深入,模型調用業務的營收占比預計將提升。