3月15日 OpenAI發布多模態大模型GPT-4,其不僅在語言處理能力上提高,還具備對圖像的理解和分析能力。GPT-4商業化進程加快,開放API的同時還發布了在6個不同商業場景的應用落地。隨后微軟發布了震撼的微軟365 Copilot,極大提升office的生產力和交互方式。此前,ChatGPT就已經展示了強大的能力,在文字創造、人機交互、教育、影音、零售等多場景落地應用。我們認為,多模態大模型已在多領域具有專家能力,未來將深度賦能千行百業,改變生產生活方式。 **1. 2023年3月15日,OpenAI目前最強大的多模態預訓練大模型GPT-4正式發布。**其能夠處理文本、圖像兩種模態的輸入信息,單次處理文本量是ChatGPT的8倍,GPT-4的表現大大優于目前最好的語言模型,同時在學術考試中的水平遠超GPT3.5。這意味著GPT-4不僅在學術層面上實現了模型優化與突破,同時也展現出了成為部分領域專家的能力。
**2. GPT-4商業化進程加快。**GPT-4在發布時便開放了其純文本輸入的API,這與GPT-3和GPT-3.5的滯后開放不同。同時,GPT-4這次一起推出了6個商業場景的具體應用落地,在優化人機交互體驗、提供專業服務、提升組織效能、文化傳承與保護等方面都展現了巨大的潛能,未來有望看到更多場景中的商業化拓展與落地。 **3. ChatGPT已經刮起GPT生態狂潮。**2023年3月1號,OpenAI基于GPT 3.5 Turbo模型開放了ChatGPT API。API收費模式為0.002美元/1000tokens。相較于前一代開放接口GPT 3.5,性能更強的同時,價格下降90%,加速ChatGPT相關應用生態的發展。 **4.應用百花齊放,創造新的生產方式。**微軟先后在搜索引擎Bing、企業服務平臺Dynamic 365及開發者工具平臺Power Platform等接入 ChatGPT/GPT-4能力。微軟還發布了震撼的Microsoft 365 Copilot,極大提升office的生產力和交互方式。與此同時,在越來越多的企業宣布接入ChatGPT的能力,其中不乏一些已經取得優秀商業化的應用。如Jasper、Quizlet、Shop等,在語言文字創造、人機交互、教育、繪畫、影音、零售等多場景落地應用。 5. 我們認為以GPT4/ChatGPT為代表的預訓練大模型是這一輪AI浪潮的重要革新,重點推薦關注海內外優秀應用落地情況,AI芯片產業鏈等投資機遇。
**GPT技術發展不及預期:**GPT屬于先進AI算法,若后續GPT算法更新迭代效果不及預期,則會影響GPT演進及拓展,進而會影響其商業化落地等; **算法歧視與人權道德風險:**GPT引入基于人工反饋的強化學習,在人工反饋中,不可避免的會參雜歧視問題,從而會將歧視帶入后續的人機交互中;大模型在進行預訓練過程中,使用了大量數據,其中會涉及相關隱私問題; **數據數量與數據質量不及預期:**大模型需要大量的高質量數據進行訓練,若數據數量和質量存在短板,則會影響模型效果。 **GPT接口開放不明確:**目前GPT是否能對國內開放API還不明朗,若未來無法接入,可能將導致相關應用在國內無法落地。 **算力受限:**目前大模型訓練以GPU為主,尤其是英偉達的GPU。未來若GPU產能或者中美摩擦升級,可能導致國內廠商的算力布局。
1、底層技術:AI通過三大能力賦能辦公場景,大模型技術提升辦公生產力
AI通過提升人類的內容生成能力、人機交互能力和非結構數據處理能力,來賦能辦公場景:1)AIGC技術開啟辦公軟件發展新階段,辦公產品從效率工具向生成工具轉變;2)大模型提升人機交互能力,降低辦公軟件使用成本;3)AI提升辦公軟件非結構化數據處理能力,幫助企業更加高效地挖掘數據資源價值。
大模型技術的成熟和商業化推廣,為下游辦公應用向智能化演進提供支撐。1)GPT-4在辦公領域展現出四個極為重要的能力:會話式交互方式、跨語言及多模態交流能力、長文本處理能力、復雜推理能力。四大能力作為支撐,使得大模型在辦公軟件市場應用前景廣闊。2)文心一言強大的中文理解能力展現出廣闊的應用前景,中文場景的內容生成方面具有優勢。3)訊飛星火大模型:辦公是星火模型未來重點應用的領域,依托訊飛在各行業積淀的海量數據,可賦能細分領域的辦公場景。
2、辦公智能化實踐:國內外廠商齊發力,AI+辦公應用百花齊放
AI與辦公應用的融合,國內外廠商已有諸多實踐案例:微軟和谷歌都發布了融合AI的辦公應用Microsoft365 Copilot和Workspace,幫助用戶提高工具生產力;Salesforce通過接入通用大模型+自研小模型的方式,推出GPT程序賦能協作產品,提升溝通效率;Notion AI和印象筆記等筆記類應用,通過接入大語言模型實現文檔自動寫作;飛書推出AI助手“My AI”,以對話形式提供多種功能,包括優化和續寫文字內容、創建日程、自動匯總會議紀要、搜索公司內部知識庫等。
1、國內外大廠發力布局,AI應用生態加速構建,行業應用前景有望打開: (1)硬件端,以NVIDA為代表的國內外廠商布局AI芯片等硬件,有望降低行業內公司AI部署的成本和門檻,為AI商業化應用創造條件; (2)軟件端,國內外大廠相繼發布AI大模型,并展現出出色的實際任務解決能力,應用空間廣闊; (3)商業模式層面,ChatGPT插件大幅提升AI大模型的實用性和準確性,未來“AI大模型+應用插件”有望成為主流模式; 2、AI+行業應用有望加速融合,關注各賽道內具備布局優勢的廠商: (1)隨著AI商用空間的逐步打開,AI結合各行業應用的進程有望加速,建議關注AI與辦公、教育、工業、醫療、安全、遙感、建筑、法律和金融行業的深度融合; (2)對標Microsoft365Copilot,我們認為AI結合工具有望在實際業務場景中大幅提升用戶效率,實現降本增效,重點推薦廣聯達; (3)我們認為AI大模型在文本生成領域技術已經成熟,在具備一定格式的文本生成中可輔助使用者完成任務,推薦AI+法律標的,通達海;
AI大模型持續演進,GPT-4理解能力大幅提升。2022年11月30日,OpenAI發布ChatGPT,5天后即達到100萬用戶,是歷史上用戶增長最快的應用程序。2023年3月15日,OpenAI發布GPT-4,GPT4相比ChatGPT基于的GPT-3.5模型,其在多模態、理解能力、角色認知、長文本支持方面有了明顯進展。我們認為,無論從應用上的用戶增長,還是在模型上的能力提升方面,均具備極大優勢。 AI大模型加速應用升級,AIGC有望對多個行業帶來顛覆式創新。2023年2月8日,微軟正式將ChatGPT引入Bing,3月17日微軟宣布其正在將基于GPT-4的AI技術植入Office辦公軟件中,標志著以GPT-3.5和GPT-4為代表的大模型開啟了辦公和搜索新方式,我們認為,未來AI大模型的發展和推廣將率先帶來游戲、代碼編碼、生命科學3個行業的變革。此外,多模態將賦能生成式AI,在文本、音頻、圖像和視頻等場景實現商業化落地,軟件端和硬件端有望迎來新機遇,其中,我們將重點關注大模型對工具類軟件和多場景的賦能,在工具側有望帶來以CAD、EDA、ERP為主的工具類軟件的估值重構。 GPT-4引發海量算力需求,把握算力產業鏈機會。根據測算,我們認為,在中性假設下,ChatGPT一年產生的API調用費用約為6.2億美元,與此同時,ChatGPT將在訓練和推理層面對GPU產生巨大需求。根據OpenAI公開信息,GPT-3.5模型的API價格為0.002美元/千token,而GPT-4在請求方面的API價格為0.06美元/千token,回復方面為0.12美元/千token,以0.06美元/千token計算,GPT-4的API調用成本是GPT-3.5的30倍以上,算力相關需求有望翻倍增長。
隨著ChatGPT等語言大模型落地,AIGC技術落地在各行各業中得到發展和推進。根據模型的分類,AIGC的應用可被分為單模態和多模態兩類。單模態模型可以助力各個應用,提升原有的能力和生產力。諸如ChatGPT已與Bing結合,使搜索更智能化。同時,搜索引擎又能很好地彌補語言模型預訓練時不具備的數據實時性。單模態模型與操作系統的連接也能改變傳統的人機交互模式,使系統響應更智能,軟件間的數據流通更廣泛;與游戲應用的結合可以使NPC更鮮活,與玩家的對話更真實;應用于文學作品可以激發創作靈感,提高寫作效率,掀起AI電子書熱潮;應用于客服場景可以提升原智能客服的多輪對話能力,個性化回答能力。 多模態的模型是AIGC的發展趨勢,現有的DALL-E或StableDiffusion已經在文本到圖像的跨模態領域很好地落地,可以更容易地生成高質量海報和提升三維場景重建的效果;與視頻剪輯應用的結合降低視頻制作的門檻,拓展影視領域的空間;Google的多模態模型PaLM-E將豐富機器人操作場景,智能化機器人反饋。最新的GPT4多模態模型與Office辦公軟件的結合將顯著提升生產力,使辦公軟件間的聯動更智能;GPT4可以賦能教育科研領域,緩解教育資源短缺,降低獲取知識的門檻;GPT4可以賦能數字人,使數字人落地場景更豐富,交互更擬人;GPT4還能助力應用開發,簡化發開周期,降低開發的門檻。
百度于2023年3月16日召開關于“文心一言”的主題發布會,“文心一言”作為國內首款正式發布的生成式語言大模型,擁有文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成等功能。文心平臺依托于百度自研的產業級深度學習平臺飛槳(PaddlePaddle)打造,致力于為用戶提供一站式AI開發服務: AI大模型與行業大模型:文心平臺提供NLP、CV、跨模態、生物計算四大主流AI研究領域的多個基礎大模型,多個模型在技術層面實現突破創新,處于世界領先水平。其中,NLP領域的ERNIE3.0Zeus采用自回歸網絡和自編碼網絡,能夠兼顧自然語言理解和生成功能;CV領域的VIMER-UFO2.0使用超網絡結構,推理時僅需激活總參數量的1/30;ERNIE-ViLG2.0引入基于語言和圖像的知識增強算法,在文本圖像生成任務中的表現已經超越了OpenAI旗下的DALLE-2。文心平臺與各行業企業聯手打造行業大模型,目前已覆蓋能源、金融、航天、制造、傳媒、城市、社科、電影等8個領域。目前已有650余家知名企業宣布接入“文心一言”,涵蓋企業服務、金融IT、汽車、傳媒、教育、家電、金融等10余個行業。 一站式開發平臺與開發工具:開發平臺方面,文心面向專業知識有限的AI應用開發者提供零門檻平臺EasyDL,面向專業開發者提供全功能平臺BML。目前這兩個平臺均僅支持使用百度文心的云端算力,可采用公有云、私有化離線、軟硬一體等部署方式。開發工具方面,文心提供ERNIEKit自然語言處理開發工具及PaddleFleetX全流程開發套件。此外,現階段文心平臺還向開發者免費提供大模型API。 產品與社區:百度文心通過構建產品與社區經營,對外展示生成式模型的強大性能,以此吸引愛好者投入創作,進而構筑成熟的AIGC社區,可在實踐中探索AI商業化模式。目前除“文心一言”外,文心平臺提供產業級搜索系統“文心百中”、藝術創意輔助平臺“文心一格”,以及采用眾創模式的旸谷社區。 目前百度文心生成式語言大模型在參數規模、技術創新、應用落地方面均在國內同業中處于領先水平。3月16日起,“文心一言”首批用戶可通過邀請測試碼接入體驗,同時百度智能云將面向企業客戶開放“文心一言”API調用接口,有望進一步豐富百度AI生態,賦能更多行業伙伴。
自ChatGPT推出以來,國內學術界和科技企業相繼宣布或將推出類似機器人對話模型,有望推動大模型發展。2月7日,百度官宣“文心一言”。2月20日,復旦大學發布了類ChatGPT模型“MOSS”,并面向大眾公開邀請內測,國產大模型有望迎來爆發式增長。 需求和政策兩方面,合力推動AI產業增長。國內應用層面的需求推動AI產業的加速發展。根據IDC數據預測,2021年中國人工智能軟件及應用市場規模為51億美元,預計2026年將會達到211億美元。數據、算法、算力是AI發展的驅動力,其中數據是AI發展的基石,中國數據規模增速有望排名全球第一。政策方面,“十四五”規劃中提到“瞄準人工智能”,“聚焦人工智能關鍵算法”,加快推進“基礎算法”的“突破與迭代應用”;北京、上海、廣州等城市發布相關規劃。 頭部企業采取“模型+工具平臺+生態”三層共建模式,有助于業務的良性循環,也更容易借助長期積累形成競爭壁壘。大模型廠商主要包括百度(文心大模型)、騰訊(HunYuan大模型)、阿里(通義大模型)、商湯、華為(盤古大模型)等企業,也有智源研究院、中科院自動化所等研究機構,同時英偉達等芯片廠商也紛紛入局。大模型增強了AI技術的通用性,助力普惠AI的實現。未來,大模型有望于場景深度融合,配合專業工具和平臺支持應用落地,開放的生態來激發創新,形成良性循環。 技術發展有望促進生產效率提升,并進一步創造新的消費和需求,有利于文娛內容和互聯網行業。在AIGC和ChatGPT方面,我們建議持續關注技術發展和應用情況,把握技術催化和商業化落地帶來的投資機會:1)具備AIGC和ChatGPT的技術探索和應用的公司:百度集團-SW、商湯-W、萬興科技、拓爾思等;2)具有海量內容素材且具有AIGC探索布局的,圖片/文字/音樂/視頻內容及平臺公司騰訊控股,閱文集團、美圖公司、昆侖萬維、湯姆貓、神州泰岳、視覺中國、中文在線、漢儀股份、天娛數科、風語筑等。
AIGC空間廣闊,商業化落地持續推進
AIGC的落地痛點在于成本高昂的通用大模型與下游垂直應用場景需求的不匹配。ChatGPT熱度持續提升,一方面推動了科技巨頭持續加大AI投入,另一方面也直接帶動下游付費意愿提升,進一步加速AIGC應用落地和商業變現,AIGC產業迎來發展良機。 (1)從內容形態來看,AIGC應用包括文本、音頻、圖像、視頻、代碼、多模態等內容生成形式,根據紅衫資本預測,AIGC將首先在文本和代碼領域落地應用,隨后逐漸拓展至圖像和視頻領域。 (2)從應用價值來看,AIGC應用價值體現在降本增效、提升內容質量、增加內容多樣性、生成個性化內容等方面。在垂直領域,目前國內已有機器寫稿、對話式AI、報告生成等AIGC應用落地,技術價值主要在于替代人工實現降本增效。隨著科技巨頭的持續投入以及技術的迭代升級,AIGC技術應用場景進一步拓寬,技術價值也有望從將本增效向額外價值轉移。 AI賦能價值凸顯,AI應用大有可為 (1)AI+搜索:搜索是互聯網的流量入口,微軟、谷歌、百度均表示將率先將AI技術應用于搜索,未來有望重塑信息生成和呈現方式,成為新的流量入口。 (2)AI寫作:AI寫作可大幅提升效率,在具有較強規律性的結構化寫作方面具有豐富應用場景。目前已在辦公軟件、新聞媒體等專業應用場景商業化落地。 (3)AI對話:AI對話主要用于替代人類完成大量重復性、規則性對話任務,在金融、互聯網、運營商等擁有大量C端用戶的行業擁有廣闊應用前景。ChatGPT在多項測試中已經超過人類,將對話AI提升至新的高度,未來應用空間廣闊。 (4)AI翻譯:在AI技術支持下,機器翻譯效果持續優化,但在廣義理解層面仍面臨挑戰。相比專業搜索工具,ChatGPT具有更強的理解能力,在部分場景的翻譯表現優于谷歌翻譯和DeepL,表現驚艷。 (5)AI作畫:AI作畫可解決視覺內容創作門檻高、耗時長的痛點,對于內容創作的價值凸顯。根據6pen預測,未來五年10%-30%的圖片內容將由AI參與生成,預計2027年市場規模有望超過600億,空間廣闊。 (6)AI視頻:AI已經可以輔助完成視頻生成、替換、剪輯等多項任務,已在短視頻、AI修復等領域廣發應用,下游需求旺盛,未來應用潛力廣闊。
國產“ChatGPT”揚帆啟航。OpenAI的商業模式為API接口收費。我們認為此種商業模式具有“卡脖子”的風險,因此我國需要發展自主可控的“ChatGPT”。國產生態正在逐步繁榮,百度打響國產ChatGPT領域“第一槍”,其在算法、算力、數據、生態、平臺五方面皆有儲備;ChatGPT的競爭本質即大模型儲備競賽,大模型是人工智能發展的必然趨勢,也是輔助式人工智能向通用性人工智能轉變的堅實底座。大模型分為NLP(自然語言處理)、CV(計算機視覺)、多模態和科學計算四類。此外,中美科技巨頭已經開啟大模型儲備“軍備賽”。
百度文心一言,開啟國產ChatGPT新征程。百度是少有大模型語言訓練能力的公司,模型儲備方面,百度實現了全生態布局。1、NLP(自然語言處理),已經具備智能創作、摘要生成、問答、語義檢索、情感分析、信息抽取等能力,且可以讓機器人像人一樣具有邏輯且自由對話;2、CV(計算機視覺),可用于應用于圖像分類、目標檢測、語義分割等場景,此外還可以應用于文檔、卡證、票據等圖像文字識別和結構化理解;3、跨境大模型,可實現AI作畫、場景融合視覺常識推理、跨模態圖像檢索、跨模態文本檢索等多場景;4、生物計算,應用場景為蛋白結構預測和小分子藥物研發等領域。 百度為國產ChatGPT“領軍企業”,具有算力積累和生態優勢。平臺方面:擁有自主生態的百度百舸·AI異構計算平臺,具備高效率、多密度、高易用性、多場景部署、樂高式拼接等能力。算力方面:百度自身具有建設智能算力中心的實力,技術領先且自主可控,已有典型落地案例;服務器方面擁有自研的昆侖芯云服務器;芯片方面,昆侖芯AI芯片是百度自主研發的芯片,2代芯片已量產,具備算力支撐強、高速互聯等多重優勢。生態:百度大模型賦能千行百業,已有落地應用,合作廠商分別覆蓋科技、金融、航天、影視、汽車、電子制造等諸多產業。此外,我們推測ChatGPT有望成為搜索引擎的流量入口,百度搜索引擎有望借助文心一言大模型的能力重回巔峰。此外,目前國產科技巨頭已經開啟大模型的“軍備競賽”,因此,我們判斷,未來AI+有望賦能千行百業,具有AI+能力的廠商有望呈現“百花齊放”的態勢。
**刷爆的ChatGPT什么算法這么強!臺大李宏毅老師國語講解《ChatGPT (可能)是怎么煉成的 》! **
** **
** **
AIGC多模態跨模態應用逐漸成熟,市場空間廣闊。 廣義的AIGC指具備生成創造能力的AI技術,即生成式AI。可以基于訓練數據和生成算法模型,自主生成創造新的文本、圖像、音樂、視頻等內容。2022年被稱為AIGC元年,未來兼具大模型和多模態模型的AIGC模型有望成為新的技術平臺。據《中國AI數字商業產業展望2021-2025》報告,預測AI數字商業內容的市場規模將從2020年的40億元,增加到2025年的495億元。 ChatGPT產品歷經多代技術演進,產品與商業模式逐漸成熟。 ChatGPT是文本生成式AI,過去的傳統AI偏向于分析能力,主要基于已有內容;現在文本生成式AI基于底層Transformer模型,不斷訓練數據和迭代生成算法模型,歷經GPT-1、GPT-2、GPT-3,模型不斷升級,到ChatGPT的GPT3.5模型,已可以自主生成各種形式的內容。近期收費版ChatGPTPlus版本發布,AI商業化序幕逐漸拉開。 AI商業化落地在即,行業算法側和算力側投資機會有望超預期。 根據數據顯示,ChatGPT總算力消耗約為3640PF-Days,按國內的數據中心算力測算,需要7-8個數據中心才能支持其運行。各模態AI數據訓練到應用均需要算法和算力的加持,未來要想大規模應用,算法訓練和算力部署均需先行。