1、底層技術:AI通過三大能力賦能辦公場景,大模型技術提升辦公生產力
AI通過提升人類的內容生成能力、人機交互能力和非結構數據處理能力,來賦能辦公場景:1)AIGC技術開啟辦公軟件發展新階段,辦公產品從效率工具向生成工具轉變;2)大模型提升人機交互能力,降低辦公軟件使用成本;3)AI提升辦公軟件非結構化數據處理能力,幫助企業更加高效地挖掘數據資源價值。
大模型技術的成熟和商業化推廣,為下游辦公應用向智能化演進提供支撐。1)GPT-4在辦公領域展現出四個極為重要的能力:會話式交互方式、跨語言及多模態交流能力、長文本處理能力、復雜推理能力。四大能力作為支撐,使得大模型在辦公軟件市場應用前景廣闊。2)文心一言強大的中文理解能力展現出廣闊的應用前景,中文場景的內容生成方面具有優勢。3)訊飛星火大模型:辦公是星火模型未來重點應用的領域,依托訊飛在各行業積淀的海量數據,可賦能細分領域的辦公場景。
2、辦公智能化實踐:國內外廠商齊發力,AI+辦公應用百花齊放
AI與辦公應用的融合,國內外廠商已有諸多實踐案例:微軟和谷歌都發布了融合AI的辦公應用Microsoft365 Copilot和Workspace,幫助用戶提高工具生產力;Salesforce通過接入通用大模型+自研小模型的方式,推出GPT程序賦能協作產品,提升溝通效率;Notion AI和印象筆記等筆記類應用,通過接入大語言模型實現文檔自動寫作;飛書推出AI助手“My AI”,以對話形式提供多種功能,包括優化和續寫文字內容、創建日程、自動匯總會議紀要、搜索公司內部知識庫等。
大模型提升機器理解能力,優化人機交互方式。AI大模型是實現通用人工智能(AGI)的重要方向,包含自然語言處理(NLP)、計算機視覺(CV),多模態大模型等。ChatGPT推出兩個月MAU突破1億,是自然語言處理領域突破性的創新,大力出奇跡后出現涌現能力,更理解人類語言。大模型“預訓練+精調”即可對下游應用賦能。我們認為大模型優化人類與機器交互方式,是效率的革命。大模型是“大數據+大算力+強算法”結合的產物,對比國內外大模型,算力儲備上國內并無短板;算法上OpenAI有先發優勢;前期數據的豐富度和量對大模型的訓練至關重要。
百度文心大模型:包含NLP、CV等在內的系列大模型。文心大模型包含NLP大模型、CV大模型、跨模態大模型、生物計算大模型、行業大模型等。與Bing類似,文心一言有望優化C端用戶搜索、創作體驗;ToB方面,百度已開放大模型API接口,在文案、AI作畫、開放域對話方面賦能企業。對于具體行業,百度推出文心行業大模型,以“行業知識增強”為核心特色。 阿里巴巴通義大模型:由通義-M6模型融合語言模型和視覺模型組成,率先應用在硬件終端天貓精靈和軟件通義千問。通義大模型包括統一底座“M6-OFA”,三大通用模型“通義-M6”“通義-AliceMind”“通義-視覺大模型”,以及行業層面的不同垂直領域專業模型。在應用上,天貓精靈基于通義大模型推出擬聲助手“鳥鳥分鳥”;對話式通義千問已經開始內測。 騰訊混元大模型:采用熱啟動降低訓練成本,文字視頻等多領域表現優異,已在廣告游戲等多場景落地。目前騰訊混元大模型已在騰訊廣告、內容創作、游戲、對話式智能助手等方面實現落地,大幅提升工作效率并降低成本。 華為盤古大模型:基于ModelArts研發設計的系列模型,在物流、藥物研發、氣象預測等多領域已實現落地。目前盤古CV大模型已覆蓋了物流倉庫監控等領域;NLP大模型覆蓋了智能文檔檢索、智能ERP和小語種大模型;科學計算大模型則應用于氣象預報、海浪預測等方面。 字節跳動AI探索基礎扎實,在語言大模型和圖像大模型初步布局。字節跳動AIGC大模型將從語言和圖像兩種模態發力,預期在今年年中推出大模型。字節跳動在算力、算法、數據方面并無短板。目前模型可用于圖文、視頻內容生成等,飛書將推出智能AI助手“MyAI”。
1、國內外大廠發力布局,AI應用生態加速構建,行業應用前景有望打開: (1)硬件端,以NVIDA為代表的國內外廠商布局AI芯片等硬件,有望降低行業內公司AI部署的成本和門檻,為AI商業化應用創造條件; (2)軟件端,國內外大廠相繼發布AI大模型,并展現出出色的實際任務解決能力,應用空間廣闊; (3)商業模式層面,ChatGPT插件大幅提升AI大模型的實用性和準確性,未來“AI大模型+應用插件”有望成為主流模式; 2、AI+行業應用有望加速融合,關注各賽道內具備布局優勢的廠商: (1)隨著AI商用空間的逐步打開,AI結合各行業應用的進程有望加速,建議關注AI與辦公、教育、工業、醫療、安全、遙感、建筑、法律和金融行業的深度融合; (2)對標Microsoft365Copilot,我們認為AI結合工具有望在實際業務場景中大幅提升用戶效率,實現降本增效,重點推薦廣聯達; (3)我們認為AI大模型在文本生成領域技術已經成熟,在具備一定格式的文本生成中可輔助使用者完成任務,推薦AI+法律標的,通達海;
隨著ChatGPT等語言大模型落地,AIGC技術落地在各行各業中得到發展和推進。根據模型的分類,AIGC的應用可被分為單模態和多模態兩類。單模態模型可以助力各個應用,提升原有的能力和生產力。諸如ChatGPT已與Bing結合,使搜索更智能化。同時,搜索引擎又能很好地彌補語言模型預訓練時不具備的數據實時性。單模態模型與操作系統的連接也能改變傳統的人機交互模式,使系統響應更智能,軟件間的數據流通更廣泛;與游戲應用的結合可以使NPC更鮮活,與玩家的對話更真實;應用于文學作品可以激發創作靈感,提高寫作效率,掀起AI電子書熱潮;應用于客服場景可以提升原智能客服的多輪對話能力,個性化回答能力。 多模態的模型是AIGC的發展趨勢,現有的DALL-E或StableDiffusion已經在文本到圖像的跨模態領域很好地落地,可以更容易地生成高質量海報和提升三維場景重建的效果;與視頻剪輯應用的結合降低視頻制作的門檻,拓展影視領域的空間;Google的多模態模型PaLM-E將豐富機器人操作場景,智能化機器人反饋。最新的GPT4多模態模型與Office辦公軟件的結合將顯著提升生產力,使辦公軟件間的聯動更智能;GPT4可以賦能教育科研領域,緩解教育資源短缺,降低獲取知識的門檻;GPT4可以賦能數字人,使數字人落地場景更豐富,交互更擬人;GPT4還能助力應用開發,簡化發開周期,降低開發的門檻。
3月15日 OpenAI發布多模態大模型GPT-4,其不僅在語言處理能力上提高,還具備對圖像的理解和分析能力。GPT-4商業化進程加快,開放API的同時還發布了在6個不同商業場景的應用落地。隨后微軟發布了震撼的微軟365 Copilot,極大提升office的生產力和交互方式。此前,ChatGPT就已經展示了強大的能力,在文字創造、人機交互、教育、影音、零售等多場景落地應用。我們認為,多模態大模型已在多領域具有專家能力,未來將深度賦能千行百業,改變生產生活方式。 **1. 2023年3月15日,OpenAI目前最強大的多模態預訓練大模型GPT-4正式發布。**其能夠處理文本、圖像兩種模態的輸入信息,單次處理文本量是ChatGPT的8倍,GPT-4的表現大大優于目前最好的語言模型,同時在學術考試中的水平遠超GPT3.5。這意味著GPT-4不僅在學術層面上實現了模型優化與突破,同時也展現出了成為部分領域專家的能力。
**2. GPT-4商業化進程加快。**GPT-4在發布時便開放了其純文本輸入的API,這與GPT-3和GPT-3.5的滯后開放不同。同時,GPT-4這次一起推出了6個商業場景的具體應用落地,在優化人機交互體驗、提供專業服務、提升組織效能、文化傳承與保護等方面都展現了巨大的潛能,未來有望看到更多場景中的商業化拓展與落地。 **3. ChatGPT已經刮起GPT生態狂潮。**2023年3月1號,OpenAI基于GPT 3.5 Turbo模型開放了ChatGPT API。API收費模式為0.002美元/1000tokens。相較于前一代開放接口GPT 3.5,性能更強的同時,價格下降90%,加速ChatGPT相關應用生態的發展。 **4.應用百花齊放,創造新的生產方式。**微軟先后在搜索引擎Bing、企業服務平臺Dynamic 365及開發者工具平臺Power Platform等接入 ChatGPT/GPT-4能力。微軟還發布了震撼的Microsoft 365 Copilot,極大提升office的生產力和交互方式。與此同時,在越來越多的企業宣布接入ChatGPT的能力,其中不乏一些已經取得優秀商業化的應用。如Jasper、Quizlet、Shop等,在語言文字創造、人機交互、教育、繪畫、影音、零售等多場景落地應用。 5. 我們認為以GPT4/ChatGPT為代表的預訓練大模型是這一輪AI浪潮的重要革新,重點推薦關注海內外優秀應用落地情況,AI芯片產業鏈等投資機遇。
**GPT技術發展不及預期:**GPT屬于先進AI算法,若后續GPT算法更新迭代效果不及預期,則會影響GPT演進及拓展,進而會影響其商業化落地等; **算法歧視與人權道德風險:**GPT引入基于人工反饋的強化學習,在人工反饋中,不可避免的會參雜歧視問題,從而會將歧視帶入后續的人機交互中;大模型在進行預訓練過程中,使用了大量數據,其中會涉及相關隱私問題; **數據數量與數據質量不及預期:**大模型需要大量的高質量數據進行訓練,若數據數量和質量存在短板,則會影響模型效果。 **GPT接口開放不明確:**目前GPT是否能對國內開放API還不明朗,若未來無法接入,可能將導致相關應用在國內無法落地。 **算力受限:**目前大模型訓練以GPU為主,尤其是英偉達的GPU。未來若GPU產能或者中美摩擦升級,可能導致國內廠商的算力布局。
百度于2023年3月16日召開關于“文心一言”的主題發布會,“文心一言”作為國內首款正式發布的生成式語言大模型,擁有文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成等功能。文心平臺依托于百度自研的產業級深度學習平臺飛槳(PaddlePaddle)打造,致力于為用戶提供一站式AI開發服務: AI大模型與行業大模型:文心平臺提供NLP、CV、跨模態、生物計算四大主流AI研究領域的多個基礎大模型,多個模型在技術層面實現突破創新,處于世界領先水平。其中,NLP領域的ERNIE3.0Zeus采用自回歸網絡和自編碼網絡,能夠兼顧自然語言理解和生成功能;CV領域的VIMER-UFO2.0使用超網絡結構,推理時僅需激活總參數量的1/30;ERNIE-ViLG2.0引入基于語言和圖像的知識增強算法,在文本圖像生成任務中的表現已經超越了OpenAI旗下的DALLE-2。文心平臺與各行業企業聯手打造行業大模型,目前已覆蓋能源、金融、航天、制造、傳媒、城市、社科、電影等8個領域。目前已有650余家知名企業宣布接入“文心一言”,涵蓋企業服務、金融IT、汽車、傳媒、教育、家電、金融等10余個行業。 一站式開發平臺與開發工具:開發平臺方面,文心面向專業知識有限的AI應用開發者提供零門檻平臺EasyDL,面向專業開發者提供全功能平臺BML。目前這兩個平臺均僅支持使用百度文心的云端算力,可采用公有云、私有化離線、軟硬一體等部署方式。開發工具方面,文心提供ERNIEKit自然語言處理開發工具及PaddleFleetX全流程開發套件。此外,現階段文心平臺還向開發者免費提供大模型API。 產品與社區:百度文心通過構建產品與社區經營,對外展示生成式模型的強大性能,以此吸引愛好者投入創作,進而構筑成熟的AIGC社區,可在實踐中探索AI商業化模式。目前除“文心一言”外,文心平臺提供產業級搜索系統“文心百中”、藝術創意輔助平臺“文心一格”,以及采用眾創模式的旸谷社區。 目前百度文心生成式語言大模型在參數規模、技術創新、應用落地方面均在國內同業中處于領先水平。3月16日起,“文心一言”首批用戶可通過邀請測試碼接入體驗,同時百度智能云將面向企業客戶開放“文心一言”API調用接口,有望進一步豐富百度AI生態,賦能更多行業伙伴。
1、ChatGPT火爆的背后:算法革新+算力支持+數據共振 ChatGPT引起全球熱烈反響,上線僅五天用戶突破百萬,ChatGPT在文本交互和語言理解方面能力的顯著進步或為通用人工智能的實現帶來曙光。究其先進性根本,ChatGPT在以往基礎上推進算法革新優化,輔以強大算力支持,并以大規模數據共振,協同助推這一劃時代產品誕生。OpenAI以B端提供API接口流量+C端訂閱收費模式,探索ChatGPT商業化路徑。展望未來AI將橫縱向并行,結合技術深化與能力邊界拓展,進一步鋪開應用面。 2、數字內容生產新方式——AIGC AIGC的興起推動人類叩響強人工智能之門,可應用于文本、音頻、圖片、視頻、跨模態、策略生成等,有望開啟新一輪內容生產力革命。隨著Transformer、DiffusionModel等算力模型的迭代,推動AIGC在設計、內容創作、游戲智能、機器交互等領域實現降本增效。 3、新時代生產力工具,AIGC賦能內容生產 基于AI生成內容技術,AIGC已在游戲、廣告營銷、影視、媒體、互聯網、娛樂等領域初顯成效,并展現出較大的潛力。 AIGC將推動游戲生產范式升級,并豐富游戲資產生成,高效輔助游戲測試,使制作成本顯著降低,全流程賦能游戲買量; AIGC貫穿廣告營銷全流程,將優化案頭工作環節,提供更專業的個性化營銷方案,并充實廣告素材,實現廣告自動化生成; AIGC提升影視行業全管線效率。影視劇本創作已初見成效,多AI技術將助力電影中期拍攝,后期制作將更快完成; AIGC帶給媒體行業人機協作方案。新聞寫作編排效率提升,傳媒向智媒轉向開啟新篇章; AIGC提供互聯網行業豐富內容,和更便捷的服務。ChatGPT賦能智慧搜索,互為供給加速發展內容平臺發展,虛擬結合激發電商沉浸式體驗; AIGC為娛樂行業提供了更多樣的體驗。人際交互娛樂邁入新臺階,AIGC或成元宇宙之匙。
AIGC空間廣闊,商業化落地持續推進
AIGC的落地痛點在于成本高昂的通用大模型與下游垂直應用場景需求的不匹配。ChatGPT熱度持續提升,一方面推動了科技巨頭持續加大AI投入,另一方面也直接帶動下游付費意愿提升,進一步加速AIGC應用落地和商業變現,AIGC產業迎來發展良機。 (1)從內容形態來看,AIGC應用包括文本、音頻、圖像、視頻、代碼、多模態等內容生成形式,根據紅衫資本預測,AIGC將首先在文本和代碼領域落地應用,隨后逐漸拓展至圖像和視頻領域。 (2)從應用價值來看,AIGC應用價值體現在降本增效、提升內容質量、增加內容多樣性、生成個性化內容等方面。在垂直領域,目前國內已有機器寫稿、對話式AI、報告生成等AIGC應用落地,技術價值主要在于替代人工實現降本增效。隨著科技巨頭的持續投入以及技術的迭代升級,AIGC技術應用場景進一步拓寬,技術價值也有望從將本增效向額外價值轉移。 AI賦能價值凸顯,AI應用大有可為 (1)AI+搜索:搜索是互聯網的流量入口,微軟、谷歌、百度均表示將率先將AI技術應用于搜索,未來有望重塑信息生成和呈現方式,成為新的流量入口。 (2)AI寫作:AI寫作可大幅提升效率,在具有較強規律性的結構化寫作方面具有豐富應用場景。目前已在辦公軟件、新聞媒體等專業應用場景商業化落地。 (3)AI對話:AI對話主要用于替代人類完成大量重復性、規則性對話任務,在金融、互聯網、運營商等擁有大量C端用戶的行業擁有廣闊應用前景。ChatGPT在多項測試中已經超過人類,將對話AI提升至新的高度,未來應用空間廣闊。 (4)AI翻譯:在AI技術支持下,機器翻譯效果持續優化,但在廣義理解層面仍面臨挑戰。相比專業搜索工具,ChatGPT具有更強的理解能力,在部分場景的翻譯表現優于谷歌翻譯和DeepL,表現驚艷。 (5)AI作畫:AI作畫可解決視覺內容創作門檻高、耗時長的痛點,對于內容創作的價值凸顯。根據6pen預測,未來五年10%-30%的圖片內容將由AI參與生成,預計2027年市場規模有望超過600億,空間廣闊。 (6)AI視頻:AI已經可以輔助完成視頻生成、替換、剪輯等多項任務,已在短視頻、AI修復等領域廣發應用,下游需求旺盛,未來應用潛力廣闊。
主要觀點: ChatGPT帶來大模型時代變革,數據要素重要性提升 ChatGPT是由OpenAI研發的一種語言AI模型,其特點在于使用海量語料庫來生成與人類相似的反應。初代GPT模型參數1.17億,GPT2模型、GPT3模型參數分別達到15億、1750億。不斷提升的參數量級,使得ChatGPT3當前已經能夠應用在商業、研究和開發活動中。 當前此類參數體量龐大的模型,成為各大科技廠商研發重點。大模型的基礎為高質量大數據。ChatGPT的前身GPT-3就使用了3,000億單詞、超過40T的數據。此類大數據基礎的前提為三部分1)有效場景下的采集數據;2)大數據的存儲、清洗和標注;3)數據質量檢驗。 大模型發展之下,算力與網絡設施建設成為剛需 算力:ChatGPT類人工智能需要更充足的算力支持其處理數據,帶來更多高性能的算力芯片需求。英偉達表示,GPT-3需要512顆V100顯卡訓練7個月,或者1024顆A100芯片訓練一個月。2012年以來,AI訓練任務中的算力增長(所需算力每3.5月翻一倍)已經超越摩爾定律(晶體管數量每18月翻一倍)。 網絡設施:以微軟Azure為例,其AI基礎設施由互聯的英偉達AmpereA100TensorCoreGPU組成,并由QuantuminfiniBand交換機提供橫向擴展能力。服務器節點多、跨服務器通信需求巨大,網絡帶寬性能成為GPU集群系統的瓶頸,解決方式包括增加單節點通信帶寬與降低網絡收斂比,帶來光模塊、交換機等需求。 下游應用場景豐富,多行業落地可期 1)“生成式AI(generativeAI)”在互聯網及元宇宙領域市場化空間較為廣闊。基于現行的NLP算法發展程度及數據集規模。在不久的將來,生成式AI有較大可能在“智能客服”和“搜索引擎”進行增值,并有希望以“插件”的形式賦能現有的“生產力工具鏈(工程軟件/音視頻制作工具等)”。 2)AI在制造業的應用可分為三方面:a)智能裝備:指具有感知、分析、推理、決策、控制功能的制造裝備,典型代表有工業機器人、協作機器人、數控機床等;b)智能工廠:重點在于實現工廠的辦公、管理及生產自動化,典型的代表場景有協作機器人、智能倉儲物流系統等;c)智能服務:指個性化定制、遠程運維及預測性維護等。 3)人工智能在智能汽車領域的應用包括:a)智能駕駛依托AI,將從駕駛輔助發展至自動駕駛;b)智能座艙在AI支持下,從出行工具演變為出行管家。
ChatGPT,有望重新定義搜索”入口”。我們認為ChatGPT是實現“模糊搜索”到“精準推送”的跨時代巔峰之作,復盤Chrome與IE瀏覽器之爭,Chrome獲勝關鍵因素在于1、界面便捷,2、多進程架構,3、運行效率高,4、生態建設,而ChatGPT(AIGC)有望成為下一代搜索引擎的催化劑,原因是其符合以上特征,此外可以幫助用戶實現程序生成、文本生成以及代碼編寫,提高用戶使用效率,因此AIGC有望加速下一代搜索引擎的到來。 AIGC技術有望幫助內容生成跨越新時代。AIGC也被認為是繼UGC、PGC/OGC之后的新型內容生產方式。復盤UGC、PGC、OGC的商業模式,我們認為內容生產平臺的關鍵因素在于內容數量、內容質量、客戶互動上,而AIGC符合以上三點因素1、內容數量,AIGC有望使編輯制作成本大幅下降,內容數量明顯增多;2、內容質量有望大幅提高,例如DALL·E的效果已經接近中等畫師的水平;3、客戶交互,AIGC,客戶的交互效果在疊加平臺交互屬性之上有望大幅提升,此外我們認為AIGC快速商業化發展的根本原因是算法的不斷演進,同時AIGC也具備跨時代的代表意義,AIGC有望幫助內容生成平臺實現AI輔助生成到AI自動生產內容的跨越。 AIGC有望賦能千行百業,目前已有雛形,有望走向SAAS未來。1、搜索引擎,引入AIGC的搜索引擎搜索更便捷、溝通更高效、功能更多元,且可靠性已大幅提升,例如2月8日的新版MicrosoftEDGE,新版BING可以實現長文章歸納總結提煉重點、對比篩選文章內容、創造新內容、協助用戶生成內容包括電子郵件、旅游規劃等功能;2、新聞媒體,AIGC技術可有效代替人類對已有信息進行語言整合、文字輸出,與資訊平臺類的數字媒體高度適配;3、客戶管理,AIGC有望幫助企業實現提高服務質量降本增效;4、數字人,有望打開海量市場,廣泛應用在電商直播、新聞播報、接待指引、展覽展示等場景中,目前已有實際案例。此外AIGC產業鏈雛形初現,正逐步走向SAAS的未來。