具身智能+人形機器人或將成為AI終極形態:人工智能的進步正在成為機器人產業發展的關鍵引擎。生成式人工智能的爆發,催生了初代“AI+機器人”的人形機器人。 政策推進人形機器人發展:國家層面頻繁發布關于機器人的相關政策,特別關注人形機器人這一未來產業的關鍵領域。相關政府部門調整戰略方向,出臺一系列政策推動和引領中國人形機器人產業向高質量方向發展。 市場空間廣闊:隨著人形機器人功能邁向多樣化和普適化,產業分工日趨成熟,成本持續下探,潛在應用場景有望涵蓋制造業、家庭服務等多個領域,市場機遇廣闊。中國電子學會數據顯示,到2030年,中國人形機器人市場規模有望達約8700億元。
AIPC&手機是大模型落地的重要載體,顛覆傳統應用模式,AI進化加速端側落地,新一輪換機潮蓄勢待發。AIPC是算力平臺+個人大模型+AI應用的新型混合體,通過整合AI技術,提供個性化、智能化的服務,提升了傳統PC的功能和用戶體驗,成為未來計算平臺的重要發展方向。生成式AI手機是利用大規模、預訓練的生成式AI模型,實現多模態內容生成、情境感知,并具備不斷增強的類人能力。近兩年消費電子市場需求持續受壓。根據IDC數據,2022與2023年連續兩年全球智能手機、PC、平板電腦出貨量同比下滑,隨著AI的端側落地,AI手機、AIPC的推出有望打破消費電子近年來創新不足無法打動消費者換機的局面,有望推動消費電子換機需求的到來。根據CounterpointResearch預計,2024年全球生成式AI智能手機出貨量將超過1億部,2027年將達5.22億部,在整個智能手機出貨量當中的占比達40%,年復合增長率高達83%。IDC預計2024年將是PC的擴張年,全球出貨量將達到2.654億臺,比上一年增長2.0%,因為AIPC的推出,最終將推動市場在2028年達到2.922億臺,在2024-2028年預測期內的復合年增長率(CAGR)為2.4%。
硬件端:處理器架構變化,內存價值量提升。1)ARM架構因其低功耗的特點份額有望逐步提升,高通+微軟聯手發力推動WOA,Copilot+PC的推出可能是WOA的重要轉折點,根據counterpointresearch預測,2027年基于ARM架構的筆記本電腦市場份額有望達到25%。2)AIPC處理器異構計算成為共性,增加NPU本質是為了進行低功耗計算,NPU專為實現以低功耗加速AI推理而全新打造,并隨著新AI用例、模型和需求的發展不斷演進。引入NPU對于提升計算效率、降低能耗與成本具有重要意義。3)大模型的端側落地,同樣要求內存空間的提升,由此帶來內存需求的提升,單機價值量提升,根據集邦咨詢預測,DRAM于筆電的單機平均搭載容量年增率約12.4%,后續隨著AIPC量產后,2025年成長幅度會更明顯。 大模型端:輕量化小模型陸續推出,多模態大模型改變人機交互體驗。端云混合有望成為未來AI計算的最終解決方案,AI落地終端具有必要性。據高通《混合AI是AI的未來》,AI落地終端能夠在全球范圍帶來成本、能耗、性能、隱私、安全和個性化優勢。大模型壓縮技術使得復雜大模型在端側運行成為可能,多模態大模型,如GPT-4o和ProjectAstra,使得人機交互變得更加自然,豐富AI應用場景。 AI落地端側為產業鏈各環節帶來投資機會,首推比亞迪電子,建議關注蘋果、高通、微軟、聯想集團。從硬件層面來看,CPU是核心,高通具備先發優勢,有望在intel和AMD的產品尚未滿足微軟AIPC要求的情況下,率先搶占部分市場;從系統軟件層面來看,微軟copilot滲透率迅速提升,形成正向循環,一方面可以促進其windowsOEM業務增長,另一方面同樣可以促進其云業務需求;從整機組裝環節來看,比亞迪電子受益其海外大客戶落地AI,有望推動其手機出貨量,此外AI落地端側,推動消費電子景氣度復蘇,公司消費電子組裝和零部件業務有望受益;從品牌運營的角度來看,建議關注聯想集團,公司率先布局本地大模型,AIPC有望帶動公司智能設備業務恢復增長;此外建議關注蘋果,自身在硬件、軟件生態、終端產品具備一體化優勢,蘋果AI正式落地,多環節有望受益。
在當下新一輪科技革命和產業變革加速發展的背景下,數據已成為新的生產要素,算力成為新的基礎能源,而人工智能則成為新質生產力。2024年的政府工作報告中,明確指出要深化人工智能應用,并首次提出開展“人工智能+”行動。該行動打開了新質生產力的大門,人工智能正在成為產業創新的關鍵抓手。尤其是以大模型為代表的生成式AI技術,已成為推動新一代產業變革的核心動力。 為抓住此次技術機遇,企業開始積極嘗試將生成式AI融入工作流程,以探索各種創新可能性。生成式AI已經成為企業各個層面關注的焦點,CEO寄望于新技術成為公司業績增長的引擎而員工則期待新技術成為他們創意性工作的源泉。在這個變革的時代,企業不斷努力將技術機遇轉化為競爭優勢,不斷拓展業務領域,迎接未來的挑戰。 對于企業而言,探索生成式AI應用落地是一項具有挑戰性的任務。本報告提出了生成式AI應用場景矩陣,用以協助企業完善自身可落地應用場景。同時,報告還基于落地實踐經驗總結出生成式AI應用落地路線,指導企業遺選適合自身情況的落地方式。結合Gartner的產業技術研究,本報告力圖為企業帶來騰訊云的思考、實踐經驗與建議,希望幫助企業捕捉這一歷史性新機遇,譜寫第二增長曲線。 大模型技術發展迅速,激發企業生成式AI應用需求 伴隨2022年末ChatGPT的問世,以大模型為代表的生成式AI技術得到各行各業的高度關注和熱議。最早由谷歌提出了Transformer架構,隨后,谷歌相繼發布了基于Transformer架構的Bert、T5等預訓練模型,同時OpenAl也推出了GPT預訓練模型。模型的參數量迅速提升至千億甚至萬億級別,成為超大規模參數模型,同時通過對豐富知識數據的學習,大模型技術在泛化能力、多模態能力、開放域交互和模型可解釋性等方面均有巨大提升。 2020年,GPT3.0發布,在文本生成方面的能力表現優異。其生成的文本準確、連貫,并且更加貼近人類的表達方式,這使得大模型在內容創作、對話交互等場景具備實用性。2022年,Midjourney發布,大模型的圖像生成能力得到廣泛認可,應用于廣告、游戲等創意設計場景。2024年,Sora發布,可以根據文本、圖像生成通真且具有想象力的視頻。教育和娛樂等行業正在積極應用Sora制作視頻。 大模型技術發展帶來的生成式AI效果提升催生出了新的場景和產業模式,企業探泰生成式AI的需求迅速增長。 根據Gartner對822 位企業領導者進行的“2024 年新一代人工智能規劃“調查顯示,絕大多數正在實施或積極計劃實施生成式AI的企業高管已經預期或實現了實施收益。平均而言,受訪者調查報告:收入增加 15.8%,成本節約 15.2%,員工人數減少4.6%,生產率提高 22.6%。" 來源:騰訊云&Gartner
近期,OpenAI的Sora的橫空出世再一次引發市場對AIGC的關注,文生視頻領域取得重大突破,效果遠超預期。我們將圍繞Sora的核心優勢、技術特點、行業影響、未來趨勢等方面進行闡述。 相較于此前的文生視頻模型,Sora取得哪些突破? 近期,OpenAI發布了文生視頻模型Sora,可以用文字指令生成長達1分鐘的高清視頻。相較于此前市場上的同類模型,如Runway、Pika等,Sora的生成效果有大幅提升,遠超預期: 首先,視頻長度方面,Sora可以生成長達60秒的視頻,長度遠遠大于其他AI視頻模型的幾秒鐘長度。 其次,Sora在視頻內容質量穩定性方面有大幅的提升,鏡頭多角度切換,視頻中的主角和背景能夠保持高度一致性和穩定性。 此外,Sora還展示了其對物理世界部分規律的理解,這也是一重大突破,甚至能夠實現一定程度的物理交互。 Sora的核心優勢和技術特點體現在哪些方面? Sora的技術優勢在于“Patches”和深度語言理解。Sora是一個在不同時長、分辨率和寬高比的視頻及圖像上訓練而成的擴散模型,同時采用了Transformer架構。Sora模型的技術優勢和特點主要在于: 視覺數據Patches化:相較于大語音模型把所有的文本、符號、代碼都抽象為Tokens,Sora則把視頻抽象為Patches(補片),是一種具備高度擴展性且適用于視頻和圖片生成式模型訓練的有效表示; 視頻壓縮網絡(Video compression network):將原始視頻進行壓縮,從而降低視覺數據維度,用于訓練并生成視頻; 時空補片技術(Spacetime latent patches):給定一個壓縮的輸入視頻,模型提取一系列時空補片(patches),用于對不同分辨率、時長和長寬比的視頻和圖像進行訓練; 擴展Transformer視頻生成:Sora是一個擴散Transformer模型,通過輸入噪聲patches訓練來預測除噪的原始patches。OpenAI在這項研究中發現,擴散型Transformer同樣能在視頻模型領域中完成高效擴展; 視頻多樣化:相較于一些模型使用標準尺寸視頻用于訓練或生成,Sora能夠處理不同分辨率、時長、寬高比的視頻,在采樣靈活性、改進框架和構圖方面有顯著優勢; 語言理解:基于GPT模型的深度語言理解,能夠更加準確地理解提示詞所表達的真實需求; 圖生視頻、視頻生視頻:除了文生視頻外,Sora也能夠通過輸入圖像和視頻用于生成視頻,能夠實現靜態圖片動態化、視頻向前和向后拓展、視頻編輯等能力。 Sora模型對哪些行業影響更大? Sora最直接的影響主要是對視頻行業造成沖擊,這將對于廣告業、電影預告片、短視頻行業以及游戲帶來顛覆。Sora大大降低了視頻制作的門檻和成本。 對于國內AI創業公司的影響:和ChatGPT一樣,我們認為Sora的出現也會吸引國內玩家追隨,但由于文生視頻模型的訓練難度和成本更大,準入門檻也進一步提高。 Sora影響最大的將是短視頻行業,未來或將極大地提升內容供給及創作質量,尤其是流量熱點驅動的內容,或將進入“全民創作”時代。同時,文生視頻技術或將為當下熱門的短劇市場帶來變數,短劇重心有望回歸高質量劇本創作。 長視頻由于對內容質量等專業化要求較高,AI生成視頻在精準度、可編輯性等方面仍需進一步打磨,高額的成本也或是短期應用落地阻礙,但長期來看其未來發展空間足夠廣闊。 對于游戲行業,Sora模型有助于進一步提高開發效率。文生視頻能力可降低游戲CG和PV制作成本,可用于豐富游戲劇情和故事情節,提升玩家代入感。 視頻相較于文字而言,對于算力的需求將會是幾何式的增長。我們認為算力限制可能是影響文生視頻類應用開放使用的重要因素。 2024年AIGC行業有哪些趨勢? 多模態模型或在2024年迎來爆發。此前大模型在各個領域的應用,主要集中在文生文、文生圖之上,而在文生視頻領域卻進步緩慢。此次文生視頻模型Sora的發布,將給長短視頻,游戲和廣告行業帶來顛覆性創新。隨著文生圖、圖片對話技術的成熟,文生視頻已成為多模態大模型下一步發展的重點。大模型領域的競爭將進一步白熱化,多模態大模型將成為生成式AI的重點發展方向,并有望推動本輪AI行情進一步擴散。 除了在計算機視覺、自然語言處理等特定領域模型的發展,多模態大模型的進一步交叉融合或將成為未來重要的應用方向。未來人與機器之間的交互方式將更加豐富,或通過文字、視覺、語音等多維度溝通,進而提升效率。AI所創造的虛擬世界與現實世界的邊界逐漸模糊,逐漸向AGI方向邁進。
智能設備作為人工智能觸達用戶的載體,AIPC將深入變革PC產業。生成式AI和LLM的飛躍式發展,深刻變革了個人生活與工作模式,加速各行各業智能化轉型。AI發展正從軟件主導轉向硬件+軟件并行驅動,而智能設備作為AI觸達用戶的終極載體,正成為AI未來發展與落地的重要突破口。AIPC將AI模型與PC結合,帶來架構設計、交互方式、內容、應用生態等創新,將深入變革PC產業。 AIPC顛覆軟硬件形式,2024年有望成為AIPC元年。硬件方面,AIPC的功能將擴展至“計算+存儲+傳感”,在架構設計上形成了“CPU+GPU+NPU”的異構方案。軟件方面,AIPC整合了輕量化AI模型,將實現各種生成式AI應用的離線穩態運行。作為設備、邊緣計算和云技術的混合體,AIPC不僅具有強大的計算能力和先進的AI技術,還帶來了創新的交互方式和視覺體驗。預計2024年將各品牌的AIPC產品陸續上市,2024年有望成為AIPC的元年。 AIPC將重構PC廠商價值,關注滲透率提升+軟件服務增量。1)未來AIPC或向本地化訓練+推理、全新立體化交互方式等方向發展,并將重構PC廠商價值。2)從量的角度看,AIPC的滲透率不斷提升。從價的角度看,終端價格區間或從高定價逐步下沉,AI軟件服務有望提供價值增量。 AIPC長期或改變現有競爭格局。從AI賦能來看,個人電腦中AI功能的增加和創新將催生市場新需求。從更換周期來看,新一輪換機潮拐點顯現,未來Windows10停更將成為2024-2025年換機潮的重要推力。競爭格局上,終端層面,PC整機廠商相繼發布AIPC相關規劃,從目前各家進展看聯想或具備先發優勢;芯片層面,英特爾有望維持CPU主導地位,長期或面臨ARM架構的競爭。
全面對標英偉達,華為開啟國產自主可控新征程。我們認為英偉達作為全球AI算力芯片龍頭坐擁三大法寶,分別是高性能芯片、其中IC設計是重點,CUDA架構、助力AI加速計算生態,Nvlink、NVSwitch助力芯片快速互聯互通與InfiniBand配合組網技術實現高效互聯互通;而華為作為國產計算之光全面對標英偉達,在算力方面,昇騰910芯片單卡算力已經可以與英偉達A100相媲美;統一達芬奇架構助力AI計算引擎;HCCS互聯技術,實現卡間高速互聯。 華為構筑世界AI算力第二選擇:全連接大會上,華為發布多款AI產品,為世界AI算力第二選擇。華為Atlas900SuperCluster、全新的華為星河AI智算交換機亮相,打開國產算力集群想象空間,同時發布“三力四總線”,打造智能世界數字基礎大設施,此外發布星河AI網絡解決方案,以高運力釋放AI時代的高算力;軟件方面,華為攜手基礎軟硬件創新,開啟國產AI生態;華為鯤鵬、昇騰、AI助力國產千行百業數字化升級,包括金融、智能制造、工業、教育、醫療等方面。 為領銜演繹國產AI計算產業崛起:我們認為華為AI計算產業的核心在于芯片的自主可控,其中以鯤鵬和昇騰為主導的海思芯片尤為重要,因此與之相關的國產集成電路產業突圍尤為重要,其中重中之重是EDA、光刻、代工產業;AI與信創雙輪驅動,國產服務器需求火爆,AI服務器中的主要元器件包括CPU、GPU板組、內存、硬盤、網絡接口卡組成,配合電源、主板、機箱、散熱系統等基礎硬件以提供信息服務,計算服務器基礎硬件供應商和華為生態伙伴也將迎來發展機遇;算力組網方面,華為有望帶動相關產品快速放量,其中包括國產AI服務器、交換機、光模塊等產品,此外,在算網的趨勢下,網絡可視化將迎來黃金發展周期。
人形機器人到達發展奇點:全球又進入新一輪科技涌現期,AI助力下海外人形機器人研發不斷迭代更新,同時國內人形機器人產業也迅速發展,小米、優必選、達闥、追覓、宇數、智元、伊艾克斯、博實股份(排名不分先后)等多家優秀人形機器人公司開始不斷涌現。
運控算法迭代,機器人走好第一步:谷歌deep mind團隊推出RT-2,李飛飛團隊開發具身智能等系列運控算法推陳出新,大模型、深度學習等前沿內容逐步深入機器人運控算法。多模態大模型主力下,人形機器人產業化進程有望加速。
硬件設計方案與選擇呈現多元化趨勢:電機、減速器方案,傳感器方案、外觀結構方案多樣化,根據應用場景與應用需求不斷調整。
一、 產業端看好人形機器人商業化, 投資端看好核心零部件 隨著特斯拉人型機器人產業化推進、 ChatGPT等AI技術加速, 人工交互及人工智能成為一大趨勢, 人形機器人作為“ 具身智能” 最理想載體, 站在多重產業共振的交匯點, 有望引領未來產業變革。特斯拉作為目前人形機器人技術領先廠商, 基于FSD自動駕駛技術可遷移性、 具備工廠應用場景的特點, 解決了此前人型機器人產業化的兩大痛點, 產業端看好Tesla Bot突出重圍。為了實現人形機器人2萬美金/臺的平價目標, 產業化過程中離不開國產硬件供應鏈的支持, 沿著產業鏈降本主線脈絡, 投資端我們看好核心零部件。從市場規模看, 按照短中長期分場景滲透率, 即初期特斯拉超級工廠人數5%、 中期工業及服務業人數5%-8%、 長期家庭戶數15%-35%測算,未來人形機器人市場規模有望達到萬億+級別, 其中人形機器人零部件價值量占比61%, 拉動機器人零部件萬億藍海賽道啟航。 二、 人形機器人產業鏈縱析, 尋找供應鏈“ 隱形冠軍” 按照一臺人型機器人成本2萬美金, 我們預計核心零部件價值量占比排序如下:①FSD系統占比39%, 即自動駕駛系統系統+D1超算芯片, 組成核心控制系統, 相當于機器人“ 大腦” , 為特斯拉核心能力體現, 自研為主;②電機占比19%, 包含28個應用于大關節的無框電機, 12個應用于手指的空心杯電機, 價值量占比分別為15%、4%, 主要廠商包括三花智控、 鳴志電器、 鼎智科技、 拓普集團等。③減速器占比14%, 應用于16個旋轉關節, 其中包括12個諧波減速器+4個行星減速器, 主要廠商為綠的諧波、 雙環傳動、 中大力德等;④行星滾柱絲桿占比9%, 應用于12個線性關節, 主要廠商為拓普集團、 秦川機床等;⑤傳感器占比3%左右, 包括視覺傳感及力傳感器, 主要廠商包括奧比中光、 舜宇光學及柯力傳感等。
人工智能:ChatGPT推動產業迎來iPhone時刻,并從“小作坊”走向工業化時代。ChatGPT在全球市場的爆發,正將AI 產業推到過去70年以來前所未有的高度,科技巨頭紛紛入局,繼微軟、谷歌之后,國內企業百度、阿里巴巴等先后發布大模型,并進行用戶測試和企業應用接入。全球一線科技巨頭在AI領域的軍備競賽,以及在大模型方向的持續下注,必將極大加速全球AI產業的發展進程,并推動產業從過去的“小作坊”式發展快速進入“工業化”時代。
算法模型:AI發展的靈魂,技術路線料將快速向GPT方向收斂,并有望在中期形成少數大模型(底層)+若干垂類模型 (應用層)的格局。ChatGPT的成功證明了高質量數據+反饋激勵(大模型預訓練+小數據微調)的有效性。GPT在自然語 言理解、生成方面的整體優勢,有望驅動AI大模型技術路線快速向GPT方向收斂,同時少數科技巨頭&機構專注于基礎大模型的研發,更多企業則發揮各自在垂類數據、場景理解等層面優勢,并最終構建少數大模型+若干應用模型的生態格局。
芯片&算力:算法快速迭代,以及對算力的巨大需求,料推動通用AI芯片(GPU)、云廠商早期高確定性受益。目前AI大模型領域的創新正在以月、周為單位快速向前推進,短期維度,預計通用AI芯片仍將是底層算法快速迭代的核心受益者。同時當前大模型在訓練、推理環節仍需要巨大的算力承載,云廠商在算力基礎設施、基礎軟件框架等層面綜合優勢明顯, AI帶來的算力增量料將主要向云計算平臺轉移,云廠商有望充分受益。但若后續算法迭代速度放緩,以及針對部分應用場景的專門優化,ASIC芯片需求料將快速展開,AI單位算力成本有望快速下降,但亦同時帶來應用需求的進一步增長。
數據:AI的糧食和血液。當前AI算法的發展正轉向以大模型為主的數據依賴,豐富、高質量數據集是AI產業持續向前的核心基礎。伴隨公開數據集的逐步耗盡,借助算法實現數據合成,以及垂類領域專有數據集將是企業后續差異化優勢主要來源,同時數據使用合規、用戶隱私保護等亦將成為持續監管領域。
Part1:確立對話式AI市場:對話式AI產品定位為“實現替代與輔助人工對話的共生,以達到最優人機協作”,為企業帶來最原始直觀的“"降本增效”實現。對話式AI產品的商業價值逐步得到市場充分認可,成為了人工智能產業落地的先行環節與價值凸顯賽道。
Part2:剖析對話式AI進程:在消費者行為線上化、公域流量私有化、用戶信息收集合規的需求背景下,對話洞察成為了收集分析用戶畫像、行為偏好等信息的合規高效的洞察方式。而對話式A產品也已步入了擬人智能化與深層價值挖掘的產品階段,其中金融與互聯網走在產品迭代前列,運營商與政務緊隨其后。
Part3:評估對話式AI效果:對話式AI產品的核心功能為“替代以釋放人力,輔助以優化體驗”。因此,企業可從降本增效出發,根據自身情況判斷是否采購或續約。企業在項目咨詢的供應商評選階段時,可從案例交付經驗、產品性能、產品成熟度、產品完整度和產品價格五大維度去評估考量,保證對話式AI項目實施的高效落地與產品上線后的優質運行。
Part4:進階對話式A技術:對話式AI產品的AI技術底座由智能語音、自然語言理解與知識工程核心支撐。本章節從這三大AI核心技術角度出發,對各AI技術難點進行剖析解讀,為未來對話式A廠商可進一步追求突破的技術方向給到參考。
Part5:探究對話式A邊界:為追求收入增長,各家廠商逐步嘗試公有云產品與私有化模式的試水融合。未來,半標場景的營銷與決策賦能的對話洞察可成為對話式AI廠商的重點發力方向。而在數字人產品行業,對話式AI廠商需回歸產品經營本質著重考慮評估數字人帶來的投入產出,同時行業也需對相關問題盡早分析預判,出臺完善相關法律法規,以保障整體行業的良性發展。