AI編程:重構代碼編寫的范式。AI編程已經成為AI發展的一個重要的細分領域,正在逐步賦能編程工作的各個方面,包括代碼自動補全、代碼生成、測試驗收等。根據《2024年中國AI代碼生成市場觀測報告》,2023年中國AI代碼生成市場規模達到65億元,隨著規范化開發需求和中小型企業用戶對輔助開發工具的需求增加,預計到2028年,中國AI代碼生成市場規模預計將增長至330億元,年復合增長率達38%。 GitHub Copilot引領AI編程,智能體、多模態等技術持續提升行業潛力。 據2024年7月微軟財報電話會議所披露信息,Github Copilot的年度經常性收入(ARR)已經成功突破3億美元大關,ARR數值占Github當年整體增長的40%,已然成為推動Github業務拓展的核心驅動力之一。而對比2023年,Github Copilot在2023年的ARR約為1億美元。 2025年2月納德拉表示GitHub Copilot將all-in智能體,GitHub現任CEOThomas Dohmke表示自主SWE智能體也將融入GitHub用戶體驗。智能體將GitHub Copilot的體驗提升到人類程序員水平,在處理代碼問題時,無需開發者特別指定相關代碼,便可主動定位合適代碼并解決問題,如同為每個代碼庫配備了專屬的工程師,并且具有強大的自主能力,識別錯誤并自動修復。與此同時,Github Copilot也將實現“Vision”等功能,向多模態等方向不斷進發。 國內企業重點發力,大廠已實現在內部的大量應用。科技大廠中,以百度、阿里、字節的火山引擎為例,均在AI編程領域取得成績,在三方基準測試平臺Chatbot Arena公布的最新的大模型盲測榜單中,Qwen2.5-Max在數學和編程等單項能力上排名第一;截至2024年4月,Baidu Comate深度融入開發流程,參與了大量項目的開發工作,編寫了百度內部四分之一的代碼;在字節內部,豆包MarsCode已經覆蓋了70%以上的開發者,從編碼階段就開始為開發者貢獻代碼和技術解決方案。 上市公司中,卓易信息旗下艾普陽的SnapDevelop集成ChatGPT,在智能化時代引領IDE新發展;普元的低代碼開發平臺推動AI編程效率提升,同時與華為等國產化生態持續深入融合;截至2024年9月,商湯的代碼小浣熊個人用戶超過10萬人,實現了單日生成代碼量突破十億Tokens;金現代自身低代碼平臺持續迭代,已經積累多個重要政企客戶。
deepseek模型密集更新,用戶數將持續高速增長 自2024年起,DeepSeek在AI領域迅速掘起并不斷選代。2024年12月底至2025年1月底,更新尤為密集,發布了參數眾多且性能提升的V3、支持思維鏈輸出和模型訓練的R1,以及深耕圖像領域的視覺和多模態模型。2024年12月底到2025年1月底,全球用戶數從34.7萬激增至1.19億。與ChatGPT相比,DeepSeek僅用一年多就達到ChatGPT兩年的用戶規模,在國內1月躍居月均活躍用戶數榜首,APP下載量也大幅增長。 Deepseek具備低成本、高性能、強推理三大特點 DeepSeek-V3通過算法創新和工程優化大幅提升模型效率,從而降低成本,提高性價比。DeepSeekV3訓練成本僅為557萬美元,耗時不到兩個月。DeepSeek通用及推理模型成本相較于OpenA等同類模型大幅下降。DeepSeek-R1在繼承了V3的創新架構的基礎上,在后訓練階段大規模使用了強化學習技術,自動選擇有價值的數據進行標注和訓練,減少數據標注量和計算資源浪費,并在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,DeepSeek在AIME2024測評中上獲得79.8%的pass@1得分,略微超過OpenAl-01;在MATH-500上,獲得了97.3%的得分,與OpenAl-01性能相當,并且顯著優于其他模型 DeepSeek驅動模型平價化,建議關注算力、AI應用和端側的投資機會 1)算力:隨著更多用戶對DeepSeek的使用,以及未來更多AI應用的不斷涌現,對算力的需求呈現出幾何級增長超勢。AI技術的進步,雖然模型效率提高了,但不斷增長的用戶和應用數量,卻對算力資源提出了更高要求,消耗也隨之劇增。2)B端應用:AlAgent正在對傳統SaaS應用進行全面重構。與傳統知識庫結構化管理模式相比,AlAgent的向量數據庫具備強大的自主學習能力,能夠自動理解文檔內容,實現更加高效的知識管理,為企業的數字化轉型提供了有力支持。C端應用:作為生成式AI的重要商業化應用,AlAgent在電商、教育、旅游、酒店以及客服等多個行業得到了廣泛應用。3)端側:AI正在內容、應用、硬件、生態上影響世界,AlAgent從“數字”走向“具身”隨著市場發展,大模型更廣泛地接入硬件產品,做好軟硬件協同發展是未來競爭的關鍵。
DeepSeek發展突飛猛進,領跑開源大模型技術與生態,DeepSeek模型已成為全球現象級模型。DeepSeek(深度求索)公司成立于2023年7月,是一家致力于實現通用人工智能(AGI)的創新型科技公司。2024年12月,DeepSeek-V3發布,性能對齊海外領軍閉源模型。據官方技術論文披露,V3模型的總訓練成本為557.6萬美元,對比GPT-4o等模型的訓練成本約為1億美元。2025年1月,DeepSeek-R1發布,性能對標OpenAI-o1正式版。在數學、代碼、自然語言推理等任務上,性能比肩OpenAI-o1正式版。2月1日消息,據彭博社報道,DeepSeek的人工智能助手在140個市場下載次數最多的移動應用程序排行榜上名列前茅。國外大型科技公司如微軟、英偉達、亞馬遜等已先后上線部署支持用戶訪問DeepSeek-R1模型。2月1日,華為云官方發布消息,硅基流動和華為云團隊聯合首發并上線基于華為云昇騰云服務的DeepSeekR1/V3推理服務。 DeepSeek通過MLA和DeepSeekMoE實現高效的推理和低成本訓練,構建DualPipe算法和混合精度訓練優化計算與通信負載;通過(分階段)強化學習實現性能突破。多頭潛在注意力(MLA)通過低秩聯合壓縮技術,大幅削減了注意力鍵(keys)和值(values)的存儲空間,顯著降低了內存需求。DeepSeekMoE架構采用了更為精細粒度的專家設置,能夠更加靈活且高效地調配資源,進一步提升了整體的運行效率和表現。DeepSeek模型對跨節點的全對全通信機制進行優化,充分利用InfiniBand和NVLink提供的高帶寬。創新性提出了DualPipe算法,通過優化計算與通信的重疊,有效減少了流水線中的空閑時間。采用FP8混合精度訓練技術,不僅極大地加快了訓練速度,還大幅降低了GPU內存的消耗。DeepSeek-R1-Zero通過強化學習架構創新實現突破性性能,核心技術創新體現在訓練效能優化策略、雙維度評價體系、結構化訓練范式三個維度。DeepSeek-R1采用分階段強化學習架構演進,包括冷啟動階段、面向推理的強化學習、拒絕采樣與監督式微調、全場景強化學習等。 AI應用爆發在即,算力需求持續攀升,關注ASIC及服務器產業鏈。ScalingLaw與“涌現”能力是大模型訓練遵循的重要法則,隨著ChatGPT引領全球AI浪潮,國內外科技公司紛紛發布AI大模型,截至24年7月,全球AI大模型數量約1328個(其中美國位居第一位,占比44%;中國位居第二位,占比36%),模型的迭代加速、競爭加劇。同時,AI模型向多模態全方位轉變,AI應用百花齊放,企業主動擁抱AI應用市場。因此,模型數量、模型參數、數據總量的持續增長及AI應用需求推動全球算力爆發式增長。在英偉達GPU隨著架構的不斷演進及算力的成倍增長,于AI大模型訓練中得到廣泛運用的同時,為了滿足CSP客戶更高性能和更好功能的需求,定制化芯片ASIC的需求持續提升,牧本鐘擺從標準化逐漸擺向定制化。與之相應的算力基礎設施持續建設和升級,促使國內外云服務商資本開支持續高速增長,帶來AI服務器市場規模大幅提升,預計到26年全球AI服務器出貨量將達到237萬臺,對應2023-2026年CAGR為26%。
混合AI是未來AI發展的主要趨勢。隨著生成式AI技術的快速發展以及算力需求的不斷上升,AI要實現規模化擴展并發揮最大技術應用潛能,必須依賴云端和終端的協同工作。展望未來,AI推理規模將遠超AI訓練,云端推理成本劣勢突顯,通過云端搭配終端進行AI計算工作負載的分流,將帶來成本、能耗、性能等優勢,AI處理的發展重心正在向手機、PC等終端載體轉移。
2024年有望成為AI手機元年,出貨量呈現指數級增長。根據IDC預測數據,隨著新的芯片和用戶使用場景的快速迭代,疊加移動端大模型的加速發展,新一代AI手機出貨量有望自2024年起開始進入到快速增長階段,預計2024年全球AI手機出貨量將達2.34億臺,2027年有望增長至8.27億臺,2023-2027年年復合增長率達100.7%。國內市場方面,預計2024年中國AI手機出貨量將達0.4億臺,2027年有望增長至1.5億臺,占中國手機整體市場比例達51.9%,2023-2027年年復合增長率達96.8%。 AI手機的核心硬件升級主要集中在SoC和存儲。相較于傳統智能手機,SoC和存儲是AI手機實現流暢運行AI應用的主要硬件升級方向。一方面,SoC的算力對本地部署的大模型參數規模起著決定性作用,并直接影響AI手機的生成式AI功能,另一方面,存取、加載大模型需要搭載更高容量和性能的存儲,根據聯發科數據,端側130億參數大模型需要配備70TOPS算力的處理器芯片以及13GB容量的內存。除此之外,AI任務的高頻高密特性對手機散熱、電池、攝像頭、PCB等零部件同樣提出了更高的標準。
模型、算力、生態推動AI應用進入大爆發時代: 1)算法及模型的快速進步:2017年Transformer模型及2022年ChatGPT的發布標志著生成式AI在文本領域的重大飛躍,并在多項能力上超越了人類基準,未來隨著更強大的語言大模型(如GPT-5),以及多模態生態和視覺大模型的技術持續突破,將推動AI應用的持續進化。 2)算力基礎設施將更快、更便宜:雖然短期內大模型訓練需求的激增推高了算力成本,但隨著英偉達GPU性能的持續升級,以及微軟、亞馬遜、谷歌和Facebook等巨頭正在加大對AI算力云服務的資本開支,并積極布局自研A芯片,未來AI算力將更快、更便宜,以更好的支撐應用層的快速發展。 3)AI生態的逐漸成熟:AI組件層(AIStack)的完善和產業分工細化,為A應用在模型訓練、數據整合、應用開發、應用部署等環節提供全生命周期的支撐。 全球科技股復盤:算力基礎設施層公司率先受益于本輪AI產業浪潮,應用層公司同樣有所演繹,從兌現節奏上晚于基礎設施層。在基礎設施層中,英偉達是AI“掘金買鏟”邏輯的核心受益者,其次為微軟、Google、AWS、Oracle等頭部云服務廠商和大模型廠商。在應用層中,美股年初至今漲幅靠前的AI應用公司有:Palantir(136%)、Duolingo(109%)、Shopify(92%)、PaloAltoNetworks(74%)、Salesforce(67%)、adobe(67%)、ServiceNow(52%)。相較于AI基礎設施廠商已經能夠從模型訓練所產生的巨大需求,訂單和業績也得到了持續驗證,B端應用還處于早期,大多數AI應用廠商還尚未進入到商業化階段,從兌現時間來看預計要晚于基礎設施層2-3個季度。 全球生成式AI項目及投融資現狀: 1)AI項目數量激增:GitHub上AI開源項目截止8月底數量達到了91萬,相較于去年全年的增幅達到264%。根據Replit的數據,23年二季度AI項目環比增速達80%,相較于去年同期同比增長了34倍; 2)OpenAI在大模型上依然具備統治級地位:95%以上的應用項目均是基于OpenAI的模型來構建,同時開源項目數量也開始大幅增長; 3)2023年是生成式AI投融資創紀錄的年份:根據CBInsights的數據,截至2023年第二季度,生成式AI的投融資相較于去年全年的25億美元,增長了4.6倍; 4)生成式AI應用層融資金融僅占三成:目前約七成資金投向了包括大模型開發在內AI基礎設施層。而從應用層的融資中,AI數字代理獲得融資最多,其次為文本、圖像、代碼及音頻的生成工具。 生成式AI應用按應用領域可以分為工具型應用、通用軟件、行業軟件、智能硬件四大類,從產品形態上將沿著AIGC(內容生成)、Copilot(智能助手)、Insight(知識洞察)、Agent(數字代理)四個重要的方向演進。 1)工具型應用:包括聊天機器人、搜索引擎、文本工具、AI作畫以及代碼工具等,主要集中在C端,產品的同質化程度較高,對于大多數文本、圖像、視頻、代碼、3D模型等AIGC工具,模型/算法的能力決定了產品的受歡迎程度,對底層模型特別是GPT-4存在高度依賴。目前行業進入第一輪洗牌期,競爭優勢的構建來自于差異化的產品定位以及持續訓練更強大的底層模型和算法。 2)通用軟件:包括辦公軟件、企業服務、IT運維、軟件開發、網絡安全、數據智能等領域,各領域頭部廠商均已出現標桿產品,最常見的產品形態主要是AI智能助理(Coplilot),代表有Office365Copilot、SalesforceEinsteinGPT及AdobeFirefly。目前各個賽道競爭格局變化不大,各個賽道的龍頭廠商依然率先受益于生成式AI所創造的新的產品功能,未來的競爭關鍵在于AI與場景/工作流的深度融合,目前通用軟件頭部廠商預計將在四季度進入商業化落地的關鍵階段; 3)行業軟件:涉及金融、醫療、教育、工業、游戲、法律等多個行業,生成式AI在游戲、法律、教育、電商等C端場景有較多的結合,而在醫療、金融、工業等B端場景下生成式AI產品的成熟度仍然偏低。AI助手(Copilot)同樣得到了廣泛應用,而未來在金融、醫療、工業等領域,最具前景的應用來自于數據分析和知識洞察(Insight)工具。同時,目前各行業頭部廠商也在開始自建垂類大模型,包括彭博社的金融大模型Bloomberg,以及Meta蛋白質大模型ESMFold,當前垂類大模型在其專業領域的性能普遍超過通用大模型。 4)智能硬件:包括智能汽車、機器人、智能終端等,目前生產式AI與智能硬件的結合主要分為兩個方面:一是語音助手,應用場景包括智能座艙、智能音箱、家用機器人等各類智能終端,相較于過去的語音交互模式,大模型和生成式AI技術提升了感知和生成能力,進而帶來了用戶體驗的提升,但是總體而言產品門檻相對較低,另一類則為數字代理AIAgent,主要應用包括自動駕駛、智能機器人等,具備更加廣闊的應用空間。目前AIAgent在感知與決策能力上仍存在瓶頸,未來應用空間打開的關鍵在計算機視覺、具身智能等底層技術的突破。 生成式AI產品目前的商業模式主要包括功能訂閱、按量付費、產品銷售等,其中C端應用以功能訂閱和按量付費為主,商業化已經趨于成熟,而B端應用則主要為功能訂閱、解決方案和產品銷售,即將進入全面商業化階段。目前第一批生成式AI應用包括JasperAI、NotionAI、MidJourney等均已經成功實現商業化。其中Office365Copilot的定價為每個用戶30美元/月。相較于Office主線產品15-30美元/月的定價,最高提升了2倍以上。Salesforce的生成式AI模塊服務GPT和銷售GPT分別單用戶每月付費為50美元。此外,Palantir、PaloAltoNetworks的AI產品已經在實際場景中得到應用且已經帶來了明顯的收入貢獻,四季度AI應用將正式進入商業化落地階段。
邊緣域AI的“寒武大爆發”。自ChatGPT問世以來,從GPT-1到GPT-3.5,GPT模型的智能化程度不斷提升,GPT-4多模態模型的發布進一步加速產業革命。ChatGPT對智能終端的賦能開啟新一輪“寒武大爆發”時代。
大模型發展歷程復盤,AI全面重構科技產業。ChatGPT引領大模型浪潮,AI的“iPhone“時刻來臨。3月21日,英偉達CEO黃仁勛在GTC2023大會上將ChatGPT比作AI的“iPhone“時刻,AI時代加速來臨。國際科技巨頭加緊布局多模態模型領域。2023年3月,微軟和谷歌兩大巨頭相繼推出大模型,OpenAI推出GPT-4模型,谷歌推出PaLM-E模型;隨后,OpenAl推出APIplugins,進一步擴大了ChatGPT的應用能力并催化至多場景的業務處理能力,AI的“APPStore“時代到來。2023年4月,Meta發布SAM模型,機器視覺顛覆式創新。2023年5月,谷歌發布輕量級PaLM2模型,能夠運行于移動端,有望帶動邊緣AI計算成長,邊緣AI迎“安卓時刻”。
從音頻到視頻,探討硬件終端的重估值潛力。我們看好AI+智能終端的趨勢,AI將帶來產品邏輯的深度變革,加速硬件的智能化、伴侶化趨勢。無論是手機、PC、AIOT、MR、汽車電子,都有重估值的潛力。當下,各大廠商紛紛布局,應用端革新漸漸開:1)手機端:高通利用驍龍AI軟件棧,運行StableDiffusion模型;華為P60率先搭載多模態大模型智慧搜圖;2)PC端:蘋果推出M2Ultra,配備32核神經網絡引擎,AMD、Intel均推出嵌入專用AI模塊的x86處理器,AIPC呼之欲出;3)AIOT:百度融合文心一言,打造AI音箱“小度靈機”;阿里巴巴天貓精靈,接入“通義千問”大模型;4)MR:蘋果發布AppleVisionPro,推出首款空間計算設備;5)智能汽車:奔馳與微軟AzureOpenAIService達成合作;特斯拉的FSD將取消Beta版本,V12有望落地。
從計算到連接,芯片為邊緣算力核心。邊緣AI芯片是邊緣算力的核心,主要可分為“計算+連接”兩方面,其中:計算芯片處于邊緣AI的核心,用于接受感知外界環境,同時對視頻語音信息加以處理運算,實現邊緣AI功能,賦能硬件終端;連接芯片位于諸多終端,更多是通過網絡協議接收指令,執行功能。伴隨產業發展,計算+連接芯片有二者融合的趨勢。當前,邊緣計算市場上參與者眾多,不同陣營廠商正以不同的路線共同推動邊緣計算快速發展。海外以英特爾、AMD等為代表的芯片廠商積極推出CPU、GPU、FPGA、DPU、IPU等邊緣算力芯片;國內芯片廠商則發揮在邊緣智能終端的優勢,加大邊緣AI芯片的布局。
ChatGPT引領AI技術新一輪熱潮,預示著NLP技術有望迅速進入平民化應用時代。2022年11月30日,OpenAI公司上線了聊天機器人模型ChatGPT,迅速引發了全球的熱潮。ChatGPT是一種預訓練的語言大模型,采用大量的參數和大量的數據進行訓練,基于人類反饋的強化學習算法,將NLP技術和機器學習結合,極大地提升了模型算法的效率和能力。隨著ChatGPT的熱度不斷攀升,多家科技公司都開始布局ChatGPT相關技術領域,NLP技術有望迅速進入平民化應用時代。
ChatGPT具有良好的商業價值,未來應用空間廣闊。ChatGPT相關技術不僅對眾多的C端應用帶來革新,同時也將對B端應用產生重大影響,企業數字化轉型有望真正從數字化走向智能化,ChatGPT在企業辦公中的應用,具備很大的想象空間。我們認為,協同辦公類應用作為企業各類應用的入口,同時具備知識管理、流程引擎等功能,具備很強卡位價值,在把ChatGPT技術引入后,可以極大提升產品的功能與應用體驗。員工僅需給出想要辦理的流程,由ChatGPT進行智能化辦理,從而改變過去員工需要自行在OA、ERP及業務系統中完成信息錄入、功能查找、業務辦理的現狀,將極大地提升辦公效率和使用體驗。目前微軟已經將ChatGPT應用到了Dynamics365、Teams等產品線,未來將要應用到Bing搜索中,未來的商業價值空間十分可觀。 AIGC有望成為未來人工智能的重要方向,商業化模式仍需摸索。AIGC即人工智能內容生成,ChatGPT就是典型的文本生成式的AIGC,其目前的成功也有望帶動AIGC在圖像、音樂、視頻等其他領域落地。Gartner曾多次將生成式AI列為未來的重要技術趨勢,是當下最引人注目的人工智能技術之一。據Gartner預計,到2025年,生成式人工智能將占所有生成數據的10%,而目前這一比例還不到1%。隨著ChatGPT開啟付費訂閱試點,AIGC的商業化進程正式拉開帷幕。據量子位報告統計,到2030年,AIGC的市場規模將超過萬億人民幣,但由于AIGC目前產業化程度有限,大量業務場景尚未成功變現,商業模式也還處于探索階段。我們認為,在當下時點,AIGC基于其出色的降本增效能力,在企業級市場的應用前景較為明朗和穩定,在C端消費市場的商業模式仍需進一步摸索。