亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

作者 | 李振華 螞蟻集團研究院院長 倪丹成 螞蟻集團研究院研究總監 徐潤 螞蟻集團研究院高級專家

來源 |《中國外匯》2023年第6期

要點人工智能大模型作為中美新一輪技術競爭的核心領域之一,國家層面應積極鼓勵國內基礎模型研究的發展、配套硬件基礎設施建設及應用落地,相關配套管理措施也需及時跟進。

從2022年下半年人工智能繪畫熱潮,到人工智能對話機器人程序ChatGPT在全球走紅,ChatGPT上線僅2個月全球活躍用戶數量達1億,超越TikTok成為史上用戶增長最快的消費者應用,再到3月14日OpenAI發布下一代里程碑大模型GPT-4,生成式人工智能領域持續爆出令人驚喜的技術突破和產品體驗,并催生多家獨角獸公司。生成式人工智能領域的爆發主要歸功于人工智能大模型技術的巨大突破,標志著人工智能技術從專用人工智能轉向通用人工智能的拐點,有望大幅提升人工智能的適用場景和研發效率,并打開大規模商業化的想象空間。目前以微軟、谷歌、Meta、百度、騰訊、阿里巴巴、字節跳動等為代表的頭部科技企業紛紛摩拳擦掌,積極投身于人工智能大模型研發熱潮之中。

人工智能大模型技術演進趨勢

人工智能大模型的定義和優勢 人工智能大模型即基礎模型(Foundation Model)(《On the Opportunities and Risk of Foundation Models》,2021.08,李飛飛等100位學者聯合發表),國際上稱為預訓練模型,指通過在大規模寬泛的數據上進行訓練后能適應一系列下游任務的模型。 相較于小模型(針對特定場景需求、使用人工標注數據訓練出來的模型),大模型主要有以下三點優勢: 涌現能力。通過簡單的規則和相互作用,大模型能夠有效集成自然語言處理等多項人工智能核心技術,并涌現出強大的智能表現,將人工智能的能力從感知提升至理解、推理,甚至近似人類“無中生有”的原創能力。 適用場景廣泛。人工智能大模型通過在海量、多類型的場景數據中學習,能夠總結不同場景、不同業務下的通用能力,擺脫了小模型場景碎片化、難以復用的局限性,為大規模落地人工智能應用提供可能。 研發效率提高。傳統小模型研發普遍為手工作坊式,高度依賴人工標注數據和人工調優調參,研發成本高、周期長、效率低。大模型則將研發模式升級為 大規模工廠式,采用自監督學習方法,減少對人工標注數據的依賴,顯著降低人力成本、提升研發效率。人工智能大模型的技術演進趨勢 階段一,訓練數據演進:從追求規模到重視質量 追求規模。2018年以來,以BERT、GPT-3等為代表的人工智能大模型的成功使人們認識到通過提升參數規模、訓練數據量有助于顯著提升人工智能的智能水平,引發了大模型研發的軍備競賽,大模型參數呈現數量級增長,充分享受算法進步下的數據規模紅利。 人工智能大模型的發展也經歷預訓練模型、大規模預訓練模型、超大規模預訓練模型三個階段,參數量實現從億級到百萬億級突破(見圖1)。

重視質量。伴隨大模型參數的持續擴大,訓練數據的質量對模型表現的重要性愈發凸顯。OpenAI對其研發的InstructGPT模型進行實驗發現:隨著參數量增加,模型性能均得到不同程度的提高;利用人工標注數據進行有監督的微調訓練后的小參數模型,比100倍參數規模無監督的GPT模型效果更好。未來,提升大模型的訓練數據質量或許比提升數據規模更為重要,人工標注數據仍有其存在的價值和意義,相關產業鏈的發展也值得重視(見圖2)。

階段二,模態支持演進:從單一模態到多模態 從支持的模態來看,人工智能大模型先后經歷了單語言預訓練模型、多語言預訓練模型、多模態預訓練模型三個階段,模型能力持續升級(見圖3)。

多模態預訓練模型代表有2022年大火的開源模型Stable Diffusion,掀起一波人工智能繪畫熱潮,已有大量產品級應用;以及谷歌、Meta推出的文字生成視頻、文字生成音樂等預訓練模型,但仍在早期研發階段,技術尚未成熟。 ChatGPT所基于的InstructGPT模型仍屬于自然語言處理(NLP)領域的單模態模型,擅長理解和生成文本,但不支持從文本生成圖片、音頻、視頻等功能。OpenAI最新發布的大模型里程碑之作GPT-4并沒有一味追求更大規模參數,而是轉向多模態,支持輸入圖像或文本后生成文本。 階段三,架構設計演進:從稠密結構到稀疏結構 人工智能大模型架構設計指模型的計算架構,分為稠密結構和稀疏結構,二者區別為:在訓練中,稠密結構需激活全部神經元參與運算,而稀疏結構僅需部分神經元參與運算。 稠密結構導致高昂的大模型訓練成本。以GPT-3為代表的早期的人工智能大模型均為稠密結構,在計算時需激活整個神經網絡,帶來極大的算力開銷和內存開銷。根據國盛證券的測算,GPT-3一次訓練成本高達140萬美元。 稀疏結構能夠顯著降低大模型訓練成本。稀疏結構是一種更像人腦的神經網絡結構,在執行具體任務的過程中只有部分特定的神經元會被激活,顯著降低模型算力消耗。目前稀疏結構已經應用至人工智能前沿研究。2022年6月,谷歌發布了第一個基于稀疏結構的多模態模型LIMoE,證明了稀疏結構在降低模型算力消耗的同時,還能在多項任務中取得不亞于稠密結構的效果。

中美人工智能大模型技術現狀對比及原因探析

國內在人工智能大模型研究上具備良好的基礎 從2018年至今推出大模型數量來看,美國頭部科技企業如谷歌、Meta、OpenAI、微軟等在人工智能大模型領域積累深厚,但我國研究機構在全球前十大排名中也占據四個席位,包括智源人工智能研究院、清華大學、百度、阿里巴巴(見圖4)。 我國與國外最領先的技術相比仍有2—3年差距 從大模型的參數量來看,美國人工智能研究機構總是率先取得突破,比如谷歌2017年提出Transformer模型奠定了大模型的底層模型基礎,OpenAI的GPT系列持續引領潮流;中國人工智能大模型雖然具備追趕的能力,但追趕的過程需要花費1—2年時間,此后在模型技能上仍需時間打磨,完全拉齊效果大概需要2—3年時間(見圖5)。例如,OpenAI于2019年1月推出擁有15億參數量的GPT-2大模型,而國內直至2021年1月由智源人工智能研究院研發出26億參數量的大模型——悟道文源1.0。

中美大模型技術差距的原因探析

人工智能大模型研發已成為全球新一輪技術競爭的核心領域之一,但以下多種因素制約了我國大模型技術的進一步發展,導致與美國大模型技術存在較大差距。 底層算法原創性不足,頂尖人才欠缺。人工智能大模型研發的關鍵因素之一是算法,而算法的進步依賴于最頂級的人才進行前沿性研究。根據2022年入選AI 2000榜單的學者國籍來看,美國共入選了1146人次,占全球57.3%,是排名第二的中國的5倍,我國在頂尖人工智能人才儲備上仍相距美國有很大差距。 產業鏈仍有短板,人工智能芯片自研能力不足制約算力發展。伴隨大模型參數量的指數級擴張,對于算力的要求也呈爆炸式增長,而算力增長主要依靠高端人工智能芯片的儲備和芯片技術的持續進步。但在芯片方面,美國占據絕對領先地位,我國起步晚,對美國進口依賴程度高,存在“卡脖子”風險。近年來,國內大廠如阿里巴巴、華為、百度、騰訊等也正加快投入積極研發本土人工智能芯片。 長期主義精神和持續投入上存在一定差距。近年來國內科技企業在業務競爭壓力加劇、發展環境穩定性不足等背景下,不計回報的長期投入決心一定程度上受到影響,更加重視短期商業回報,在高風險創新領域,更傾向采取保守和追隨的策略。

人工智能大模型應用場景和商業化前景展望

人工智能大模型有望賦能乃至顛覆各行各業 賦能制造業。首先,人工智能大模型能夠大幅提高制造業的從研發、銷售到售后各個環節的工作效率。比如研發環節可利用人工智能生成圖像或生成3D模型技術賦能產品設計、工藝設計、工廠設計等流程。在銷售和售后環節,可利用生成式人工智能技術打造更懂用戶需求、更個性化的智能客服及數字人帶貨主播,大幅提高銷售和售后服務能力及效率。其次,人工智能大模型結合機器人流程自動化(RPA)有望解決人工智能無法直接指揮工廠機器設備的痛點。RPA作為“四肢”連接作為“大腦”的人工智能大模型和作為“工具”的機器設備,降低流程銜接難度,實現工廠生產全流程自動化。最后,人工智能大模型合成數據能夠解決制造業缺乏人工智能模型訓練數據的痛點。以搬運機器人(AMR)為例,核心痛點是它對工廠本身的地圖識別、干擾情景訓練數據積累有限,自動駕駛的算法精度較差,顯著影響產品性能。但人工智能大模型合成的數據可作為真實場景數據的廉價替代品,大幅縮短訓練模型的周期,提高生產效率。 賦能醫療行業。首先,人工智能大模型能夠幫助提升醫療通用需求的處理效率,比如呼叫中心自動分診、常見病的問診輔助、醫療影像解讀輔助等。其次,人工智能大模型通過合成數據支持醫學研究。醫藥研發所需數據存在法律限制和病人授權等約束,難以規模化;通過合成數據,能夠精確復制原始數據集的統計特征,但又與原始數據不存在關聯性,賦能醫學研究進步。此外,人工智能大模型通過生成3D虛擬人像和合成人聲,解決部分輔助醫療設備匱乏的痛點,幫助喪失表情、聲音等表達能力的病人更好地求醫問診。 賦能金融行業。對于銀行業,可以在智慧網點、智能服務、智能風控、智能運營、智能營銷等場景開展人工智能大模型技術應用;對于保險業,人工智能大模型應用包括智能保險銷售助手、智能培訓助手等,但在精算、理賠、資管等核心價值鏈環節賦能仍需根據專業知識做模型訓練和微調;對于證券期貨業,人工智能大模型可以運用在智能投研、智能營銷、降低自動化交易門檻等領域。 賦能乃至顛覆傳媒與互聯網行業。首先,人工智能大模型將顯著提升文娛內容生產效率、降低成本。此前人工智能只能輔助生產初級重復性或結構化內容,如人工智能自動寫新聞稿、人工智能播報天氣等。在大模型賦能下,已經可以實現人工智能營銷文案撰寫(如美國獨角獸公司Jasper.ai)、人工智能生成游戲原畫(目前國內游戲廠商積極應用人工智能繪畫技術)、人工智能撰寫劇本(僅憑一段大綱可以自動生成完整劇本的產品Dramatron)等,后續伴隨音樂生成、動畫視頻生成等AIGC技術的持續突破,人工智能大模型將顯著縮短內容生產周期、降低制作成本。其次,人工智能大模型將顛覆互聯網已有業態及場景入口。短期來看,傳統搜索引擎最容易被類似ChatGPT的對話式信息生成服務所取代,因為后者具備更高的信息獲取效率和更好的交互體驗;同時傳統搜索引擎商業模式搜索競價廣告也將迎來嚴峻的挑戰,未來可能會衍生出付費會員模式或新一代營銷科技。中長期看,其他互聯網業態,如內容聚合分發平臺、生活服務平臺、電商購物平臺、社交社區等流量入口都將有被人工智能大模型重塑或顛覆的可能性。人工智能大模型的商業模式及前景分析 短期內,人工智能大模型的變現方式仍然以開放付費應用程序編程接口(API)調用為主。由于人工智能大模型投入成本高昂,大模型廠商前期投入巨大,通過開放API模式向各行業開放模型并收取調用費,能夠規避集中押注單一行業的風險,構建相對穩定且輕量的收入模型。而行業應用開發者通過較低的價格便可調用最領先的大模型技術,應用于自身產品中提升服務質量。以OpenAI為例,2023年3月1日宣布正式允許第三方開發者通過API將ChatGPT集成到其應用程序(APP)和服務中,同時采取低價搶占市場策略,將優化后API定價降至此前的十分之一,對后發大模型公司帶來巨大追趕壓力。這一舉措大幅降低使用門檻,商業用戶數量將迎來快速增長。 長期來看,人工智能大模型廠商仍會深度介入某些具備重要價值的垂類應用場景,比如信息咨詢、金融服務、醫療服務等,通過戰略投資生態合作伙伴或自研應用級產品的方式,并通過付費訂閱或新一代廣告模式來進行變現。

相關建議

現階段,人工智能大模型發展存在著一定挑戰。首先,人工智能大模型本身仍有一定技術風險:魯棒性(即系統的健壯性)不足,系統在面對黑天鵝事件和對抗性威脅時可能會表現出能力缺失;可解釋性較低,缺乏理論支撐,本質基于條件概率,只能接近但無法重現人類思維邏輯,存在部分事實性錯誤;算法偏見,訓練語料庫若缺乏代表性或包含人類偏見,模型會存在算法偏見問題。其次,人工智能大模型發展也會帶來一定的社會風險:數字鴻溝,可能會加劇技術擁有者和缺乏者在信息獲取層面的不公平現象;壟斷風險,領先的大模型技術若被海外巨頭壟斷,將對國內的技術進步和經濟發展造成不利影響;內容風險,人工智能生成內容爆發后可能會產生大量錯誤信息污染互聯網環境。 為此,人工智能大模型作為中美新一輪技術競爭的核心領域之一,國家層面應積極鼓勵國內基礎模型研究的發展、配套硬件基礎設施建設及應用落地,配套管理措施也需及時跟進。 基礎研究方面,人工智能大模型是高資金投入、高人才壁壘的研究領域,頭部效應明顯,應構建以領軍企業為主體、產學研合作的創新體系,對于重點人才需加大力度引進,強化科學家之家的國際交流合作,加速追趕國際前沿水平。 產業配套方面,大力支持國產人工智能芯片和超算平臺的發展,構建國家數據資源平臺、發展數據標注產業及合成數據產業等,為國產人工智能大模型研發提供算力和數據保障。 應用落地方面,應積極推動大模型在制造業、醫療、金融、傳媒、互聯網領域的行業示范應用和規模化價值落地,打造一批可復制、可推廣的標桿型示范案例。 行業監管方面,在人工智能大模型及相關應用產業發展的早期,監管層應以更為包容的態度展開相關工作,鼓勵探索創新,大模型帶來的風險主要是技術層面的問題,通過行業共同探索技術解決方案能夠有效把控相關風險。

版權聲明

凡注明“來源:中國外匯”的所有作品,均為國家外匯管理局外匯研究中心合法擁有版權或有權使用的作品,未經本公眾號授權不得進行營利性使用。非營利性轉載或引用,應注明“來源:中國外匯”。違反上述聲明者,本公眾號將保留追究其相關法律責任的權利。

付費5元查看完整內容

相關內容

大模型是基于海量多源數據打造的預訓練模型,是對原有算法模型的技術升級和產品迭代,用戶可通過開源或開放API/工具等形式進行模型零樣本/小樣本數據學習,以實現更優的識別、理解、決策、生成效果和更低成本的開發部署方案。

來源:弗若斯特沙利文   近日,弗若斯特沙利文(Frost & Sullivan,簡稱“沙利文”)發布《AI 大模型市場研究報告(2023)——邁向通用人工智能,大模型拉開新時代序幕》。   報告認為,伴隨基于大模型發展的各類應用的爆發,尤其是生成式 AI,促使大模型帶來的價值進一步升級到人類生產力工具的顛覆式革新,逐漸拉開了通用人工智能(AGI)的發展序幕。   在通往AGI時代的旅程上,大模型和人類反饋的強化學習(RLHF)的結合,不僅重構了AI開發范式,未來軟件80% 的價值將由 AI 大模型提供,剩余 20% 會由提示工程和傳統業務開發組成,開發者的生產力將得到極大釋放;與此同時,AI的發展也將由之前單向發展的數據飛輪升級到不斷迭代進化的智慧飛輪,更高效的解決海量的開放式任務。   報告指出,中國大模型廠商的成功因素主要包括:全棧大模型訓練與研發能力、業務場景落地經驗、AI安全治理舉措、以及生態開放性4個方面,其中全棧大模型訓練與研發能力還包括數據管理經驗,AI基礎設施建設與運營,以及大模型系統和算法設計3個部分。這些成功因素分別體現著大模型廠商的產品技術能力、戰略愿景能力、生態開放能力三個維度。   基于這三個維度,沙利文制定了超過70個評估指標,對大模型廠商進行了全面的能力評估。   關鍵發現點

  AI大模型的高速發展離不開底層技術支持和應用場景迭代。大模型作為AGI時代的曙光,相關廠商也將迎來廣闊的發展空間。本報告將呈現從發展現狀、驅動因素洞察AI大模型廠商競爭與發展關鍵點,并推演競爭格局的邏輯分析過程:     前瞻洞察:

  通向AGI的技術路徑具有多元性,目前大模型是最佳實現方式。大模型具有強大的泛化性、通用性和實用性,能夠降低AI開發門檻、提高模型精度和泛化能力、提高內容生成質量和效率等多種價值,實現了對傳統AI技術的突破,并成為AGI的重要起點。   進而將AI發展由數據飛輪升級到智慧飛輪,最終邁向人機共智。大模型和人類反饋的強化學習(RLHF)的結合,進一步重構了AI開發范式,進入大模型主導的軟件2.0時代。另一方面,AI開發則形成新的“二八定律”,開發者的生產力將得到極大釋放。     驅動因素:

  大模型“基礎設施-底層技術-基礎通用-垂直應用”發展路線逐漸清晰,國內各廠商加速戰略布局,加大資金和技術投入,迎頭趕上全球大模型產業化浪潮,本土化大模型迎來發展新機遇。整體上,行業驅動因素主要包含三個層面:   (1)政策端:政策環境持續優化,賦能AI大模型市場高速發展。   (2)供給端:下一代AI基礎設施等快速發展,助力大模型應用落地。   (3)需求端:AI市場高景氣,大模型下游行業需求旺盛。     行業觀點:

  大模型未來發展將趨于通用化與專用化并行、平臺化與簡易化并進。同時,MaaS模式將成為AI應用的全新形式且快速發展,重構AI產業的商業化結構生態,激發新的產業鏈分工和商業模式。未來,大模型將深入應用于用戶生活和企業生產模式,釋放創造力和生產力,活躍創造思維、重塑工作模式,助力企業的組織變革和經營效率,賦能產業變革。     關鍵成功因素:

  大模型面臨算力需求大、訓練和推理成本高、數據質量不佳等挑戰。一個可對外商業化輸出的大模型的成功,要求其廠商擁有全棧大模型訓練與研發能力、業務場景落地經驗、AI安全治理舉措、以及生態開放性4大核心優勢,才能保證其在競爭中突出重圍。其中,全棧大模型訓練與研發能力還包括數據管理經驗,AI基礎設施建設與運營,以及大模型系統和算法設計3個關鍵要素。       競爭格局:

  在競爭格局漸趨明晰的過程中,相關廠商需跨越技術、人才、資金等壁壘,在產品技術能力、戰略愿景能力、生態開放能力三大維度上展開角逐。通過遴選,報告選擇了5家大模型廠商,分別為商湯、百度、阿里巴巴、華為、騰訊,評價模型包含15個一級指標、56個二級指標,對廠商大模型的各個能力進行評估。     用戶建議:

  通過此報告能夠了解大模型廠商的競爭態勢,關注領先廠商,內部創建大模型戰略文件,明確其優勢、帶來的風險和機遇,以及部署路線圖,針對具體的用例,權衡模型的優勢和風險,并選擇合適場景試點、評估大模型的應用價值。   具體內容如下

付費5元查看完整內容

近年來,人工智能技術接連取得突破,尤其是在強化學習、大規模語言模型和人工智能生成內容技術等方 面,正逐步成為各個行業的創新驅動力。OpenAI于 2022年 11月 30日發布的 ChatGPT由于具有驚人的自然語言理 解和生成能力,引起全社會大范圍的關注,成為全球熱議的話題,并被廣泛應用于各個行業。僅兩個月后,ChatGPT 的月活躍用戶數便達1億,成為史上用戶數增長最快的消費者應用。鑒于ChatGPT目前造成的影響,對其進行全面 的分析較為必要。本文從歷史沿革、應用現狀和前景展望這3個角度對ChatGPT進行剖析,探究其對社會的影響、技 術的原理和挑戰以及未來發展的可能性,并從模型能力的角度簡要介紹 GPT-4相對于 ChatGPT的改進。作為一個 現象級技術產品,從技術角度而言ChatGPT對相關領域具有里程碑式的重要意義,從應用角度而言其可能會給人類 社會帶來巨大的影響。ChatGPT有潛力成為計算機領域最偉大的成就之一。但就目前而言,ChatGPT仍然存在一些 局限,尚未達到強人工智能的水平。在當前階段,研究人員需要對人工智能技術持有自信和謙虛學習的態度,繼續 發展相關的技術研究和應用。在人工智能時代,人工智能技術已經普及到許 多行業,為底層技術賦能升級,并在各種應用場景中 發揮著重要作用。其中,最常見的應用場景包括自 然語言處理、計算機視覺、推薦系統以及預測分析 等。

人工智能技術在持續提高和改進,并不斷沖擊 著人類的認知。 2012年,ImageNet圖像識別比賽中,一種神經網 絡模型(AlexNet)(Krizhevsky 等,2017)首次展現了 明顯超越傳統方法的能力。2016年,AlphaGo(Silver 等,2016)戰勝了圍棋世界冠軍。在那之前,人們普 遍認為這個古老的中國棋類游戲由于具有過高的復 雜性而難以被人工智能系統模擬。2017 年,Google 的 Vaswani等人(2017)提出 Transformer 深度學習模 型架構,奠定了當前大模型領域主流的算法架構基 礎。2018 年,谷歌提出了大規模預訓練語言模型 BERT (bidirectional encoder representations from transformers)(Devlin等,2019),該模型是基于 Transformer 的雙向深層預訓練模型,其模型參數首次超 過了 3億規模(BERT-Large約有 3. 4個參數);同年, OpenAI 提出了生成式預訓練 Transformer 模型—— GPT(generative pre-training)(Radford等,2018),大大 地推動了自然語言處理領域的發展。2018年,人工 智能系統 OpenAI Five(Berner 等,2019)戰勝了世界 頂級的 Dota 2 人類隊伍,人工智能在復雜任務領域 樹立了一個新的里程碑;此后,Google DeepMind 團 隊提出的AlphaFold(Jumper等,2021)以前所未有的 準確度超越了人類研究者在蛋白質結構預測上的表 現,突破了人們對人工智能在生物學領域的應用的 想象。2019 年,一種人工智能系統 AlphaStar(Viny? als 等,2019)戰勝了世界頂級的 StarCraft II 人類選 手,為人工智能在復雜任務領域的未來發展提供了 更加強有力的支持。2020年,隨著OpenAI GPT-3模 型(Brown 等,2020)(模型參數約 1 750 億)的問世, 在 眾 多 自 然 語 言 處 理(natural language processing, NLP)任務中,人工智能均表現出超過人類水平的能 力。2021 年 1 月,Google Brain 提出了 Switch Trans? former模型(Fedus等,2021),以高達1. 6萬億的參數 量成為史上首個萬億級語言模型;同年 12 月,谷歌 還提出了 1. 2億參數的通用稀疏模型 GLaM(Du等, 2022),在多個小樣本學習任務的性能超過 GPT-3。 2022年 2月,人工智能生成內容(artifical intelligence generated content,AIGC)技 術 被《MIT Technology Review》評選為 2022年全球突破性技術之一。同年 8月,Stability AI開源了文字轉圖像的Stable Diffusion 模型(Rombach等,2022)。同樣在8月,藝術家杰森· 艾倫(Jason Allen)利用AI工具制作的繪畫作品《太空 歌劇院》(Théatre D’opéra Spatial),榮獲美國科羅拉 多州藝術博覽會藝術競賽冠軍,相關技術于年底入 選 全 球 知 名 期 刊《Science》年 度 科 技 突 破(Break? through of the Year 2022)Runners-up 第 2 位(// www. science. org/content/article/breakthrough-2022)。

近幾年,自然語言處理技術逐漸成為了各個行 業關鍵的創新驅動力。其中 2022 年 12 月公布的 ChatGPT 則是生成式人工智能技術的佼佼者,幾乎 可以賦能各個行業。隨著人工智能技術的不斷提 高,ChatGPT 作為一種先進的語言模型受益于更大 的模型尺寸、更先進的預訓練方法、更快的計算資源 和更多的語言處理任務。因此,它已廣泛應用于各 行各業,并成為全球熱議的話題。本文將嘗試剖析 ChatGPT,評估其輿論影響力 和應用現狀,歸納其特性;簡要分析其背后的技術原 理,探討其可擴展性;評估其存在的技術挑戰及局 限,討論其未來的發展和應用前景,并從模型能力的 角度簡要介紹GPT-4相比于ChatGPT的改進

付費5元查看完整內容

來源:艾瑞咨詢   ChatGPT被稱為AI的“iPhone時刻”,以ChatGPT為代表的生成式AI讓每個人命令計算機解決問題成為了可能。可對生產工具、對話引擎、個人助理等各類應用,起到協助人、服務人甚至超越人的角色。   通用基礎大語言模型的價值與自研卡點

  大廠的絕對戰略優先級,但也是一場重投入的持久戰。   2023年3月中,OpenAI宣布ChatGPT整合GPT4,實現多模態交互、大幅提升復雜長文本理解與生成能力、可控性增強,引起全球科技界震動。   在國內科技及投資各領域的高度關注下,百度舉辦了“文心一言”產品發布會,雖說從產品功能、成熟度、支持用戶并發等維度距ChatGPT還有不足,但也是中國在這新一輪“科技軍備競賽”中的勇于嘗試與發聲,目前百度也已啟動API接口開放測試,瞄準B端市場。   緊隨其后,360、阿里、華為、商湯、京東、科大訊飛、字節跳動等巨頭企業也動作頻頻。   從自研通用預訓練大語言模型的必要性角度分析:在全球政治經濟局勢下,自主可控是保障網絡安全、信息安全的前提,自研基石模型具有高度戰略意義;從自研的可行性角度分析:基于前文討論的通用基礎LLMs研發所需的算力、數據、算法、人才、資金儲備等,中國僅有少數頭部互聯網企業具備研發“入場券”。   宣布入局的頭部企業基于自身業務生態選擇的戰略路線也不盡相同。但可以大膽假設,未來若形成大模型能力領先,誰擁有通用基礎大模型與生態和流量入口,誰就更有可能擁有從應用層到算力層的營收話語權。   價值:自主可控的戰略意義、大模型的商業價值   卡點:高端AI算力、數據、算法、人才、資金儲備   調用國外大模型將涉及數據跨境的合規風險、中國中大型企業與政府部門均存在私有化部署需求、以及受美國科技保護主義影響。種種原因,國內必將且必需產生自主可控的通用基礎大模型產品與服務。   “滾雪球效應”使通用基礎大模型的門檻越來越高,但其可以提供“超級大腦”一樣的價值。OpenAI與微軟的成功路線表明,依托ChatGPT有望打造新的個人與企業應用開發生態以及拉升云廠商業務營收。   美國芯片禁令下高端AI算力資源不足,算力資金投入上還需支撐智算集群的訓練與運營成本。   互聯網中文高質量數據資源小于英文,差距20-30倍,需要高質量數據清洗。   通用基礎大模型開發是一個系統工程,需具備分布式訓練、模型蒸餾等各類技術能力與工程化能力。   如何把know-how數據轉化成Q&A的能力,需要大量提示(人與機器進行交互的指令語言)工程師。  ** 中國大語言模型產業參與廠商類型與定位邏輯**

  垂直基礎大模型廠商與應用開發廠商需在窗口期加快建立“數據飛輪”壁壘。   此輪基于ChatGPT的大模型浪潮興起伊始,結合我國AI產業鏈與競爭格局現狀,一種判斷是:基于大模型的通用和泛化性提高,未來手握通用基礎大模型的巨頭企業會逐漸侵蝕垂直領域廠商業務。這種壓力長期來看的確存在,但大模型與產品結合,尤其在非檢索或開放域交互等場景中,需要依賴垂直領域數據和行業know-how、應用場景和用戶數據反哺、一站式端到端工程化能力等。

  在此窗口期,垂直領域與應用層廠商應積極將大模型能力整合入自己的技術棧,服務于產品功能優化,建立“數據飛輪”壁壘。在下游豐富的基于大語言模型、AIGC應用開發需求的影響下,還將分化出一類工具型或平臺型廠商,主要提供基于各類大模型的開發平臺服務,幫助客戶實現便捷的AIGC應用開發與落地。   大語言模型落地應用對數字產業影響

  1)變革人機交互方式:既有軟件將接入對話能力,交互界面發生變革,自然語言成為用戶發布操作指令的新模態。這一影響將從搜索引擎等知識信息平臺拓展到一切人機交互型應用。友好度和功能性的顯著提升將激活軟件服務的增量用戶市場;

  2)豐富產品種類:將誕生新一批AI-first的應用,如創意設計、AI營銷、AI運營等領域;   3)塑造新興商業模式:AI主導的“模型即服務”商業邏輯將重構應用開發流程,傳統企業可享受低成本構建應用模型的便利;   4)構建新興生態平臺:超級應用的出現,本質上搭建了用戶需求與各類信息服務之間的基于自然語言交互的平臺生態,塑造了移動互聯網后新的流量入口。   具體內容如下:

付費5元查看完整內容

ChatGPT快速滲透, AI產業迎發展新機   ChatGPT是由OpenAI公司開發的人工智能聊天機器人程序, 于2022年11月發布, 推出不久便在全球范圍內爆火。根據World of Engineering數據顯示, ChatGPT達到1億用戶量用時僅2個月, 成為史上用戶增長速度最快的消費級應用程序。與之相比, TikTok達到1億用戶用了9個月, Instagram則花了2年半的時間。從用戶體驗來看, ChatGPT不僅能實現流暢的文字聊天, 還可以勝任翻譯、 作詩、 寫新聞、 做報表、 編代碼等相對復雜的語言工作。   ChatGPT爆火的背后是人工智能算法的迭代升級。ChatGPT是基于GPT-3.5微調得到的新版本模型, 能夠借助人類反饋的強化學習(RLHF) 技術來指導模型訓練, 實現模型輸出與人類預期的需求, 使對話內容更加人性化和富有邏輯性。從2008年第一代生成式預訓練模型GPT-1誕生以來, GPT系列模型幾乎按照每年一代的速度進行迭代升級, 未來隨著大語言模型(LLM) 技術的不斷突破, AI相關應用有望加速落地, AI產業或將迎來新一輪發展機遇。   ChatGPT激起AI浪潮,大算力芯片迎來產業機遇   ChatGPT是生成式人工智能技術(AIGC) 的一種, 與傳統的決策/分析式AI相比, 生成式AI并非通過簡單分析已有數據來進行分析與決策, 而是在學習歸納已有數據后進行演技創造, 基于歷史進行模仿式、 縫合式創作, 生成全新的內容。AIGC的應用非常廣泛, 包括自然語言生成、 圖像生成、 視頻生成、 音樂生成、 藝術創作等領域。   AIGC產業鏈主要分為上游算力硬件層、 中游數據/算法軟件層和下游行業應用層。硬件層依靠高性能AI芯片、 服務器和數據中心為AIGC模型的訓練提供算力支持, 是承載行業發展的基礎設施;數據/算法層軟件層主要負責AI數據的采集、 清洗、 標注及模型的開發與訓練, 多方廠商入局自然語言處理、 計算機視覺、 多模態模型等領域;行業應用層目前主要涉及搜索、 對話、推薦等場景, 未來有望在多個行業呈現井噴式革新。   多模態賦能下游行業智慧化升級   多模態大模型有望成為AI主流, 賦能下游行業智能升級。生成式AI主要依賴于人工智能大模型, 如Transformer、 BERT、GPT系列等。這些模型通常包含數十億至數萬億個參數, 需要龐大的數據集進行訓練, 致使AI算力的需求也呈現出指數級的增長。多模態是一種全新的交互、 生成模式, 集合了圖像、 語音、 文本等方式, 因其可以結合多種數據類型和模態的學習,將有望徹底改變我們與機器互動的方式, 快速占據人工智能主導地位。我們認為多模態大模型長期來看不僅可以從成本端降本增效, 需求端也將通過快速滲透推廣為下游行業帶來持續增長需求, 從而快速推動下游行業智慧化應用升級。   模型更新升級帶動下游行業不斷發展   從GPT-1到ChatGPT, 模型參數與訓練數據量不斷增加, 所需算力資源不斷提升:   GPT-1:最早的GPT模型之一, 包含了1.17億個參數, 預訓練數據量約為5GB。   GPT-2:參數數量達到了1.5億個, 預訓練數據量達40GB。   GPT-3:是目前為止最大的語言模型之一, 包含了1750億個參數, 預訓練數據量為45TB。   ChatGPT:基于GPT-3模型的變種之一, 參數量預計與GPT-3相近。   GPT-4性能提升顯著, AIGC應用市場空間廣闊   多模態模型是實現人工智能應用的關鍵。3月14日OpenAI發布GPT-4多模態大模型, 擁有1) 強大的識圖能力;2) 文字輸入限制提升至2.5萬字;3) 回答準確性顯著提高;4) 能夠生成歌詞、 創意文本、 實現風格變化。在各種專業和學術基準上,GPT-4已具備與人類水平相當表現。如在模擬律師考試中, 其分數在應試者前10%, 相比下GPT-3.5在倒數10%左右。多模態大模型在整體復雜度及交互性上已有較大提升, 模型升級有望加速細分垂直應用成熟, 賦能下游智慧化升級, 帶動需求快速增長。   AIGC下游市場滲透率低, 增長空間廣闊。根據 Gartner數據, 目前由人工智能生成的數據占所有數據的 1%以下, 預計2023年將有 20%的內容被生成式AI 所創建, 2025 年人工智能生成數據占比將達到 10%。根據前瞻產業研究院數據, 2025年中國生成式商業AI應用規模將達2070億元, CAGR(2020-2025) 為84.06%。

付費5元查看完整內容

 1、ChatGPT火爆的背后:算法革新+算力支持+數據共振   ChatGPT引起全球熱烈反響,上線僅五天用戶突破百萬,ChatGPT在文本交互和語言理解方面能力的顯著進步或為通用人工智能的實現帶來曙光。究其先進性根本,ChatGPT在以往基礎上推進算法革新優化,輔以強大算力支持,并以大規模數據共振,協同助推這一劃時代產品誕生。OpenAI以B端提供API接口流量+C端訂閱收費模式,探索ChatGPT商業化路徑。展望未來AI將橫縱向并行,結合技術深化與能力邊界拓展,進一步鋪開應用面。   2、數字內容生產新方式——AIGC   AIGC的興起推動人類叩響強人工智能之門,可應用于文本、音頻、圖片、視頻、跨模態、策略生成等,有望開啟新一輪內容生產力革命。隨著Transformer、DiffusionModel等算力模型的迭代,推動AIGC在設計、內容創作、游戲智能、機器交互等領域實現降本增效。   3、新時代生產力工具,AIGC賦能內容生產   基于AI生成內容技術,AIGC已在游戲、廣告營銷、影視、媒體、互聯網、娛樂等領域初顯成效,并展現出較大的潛力。   AIGC將推動游戲生產范式升級,并豐富游戲資產生成,高效輔助游戲測試,使制作成本顯著降低,全流程賦能游戲買量;   AIGC貫穿廣告營銷全流程,將優化案頭工作環節,提供更專業的個性化營銷方案,并充實廣告素材,實現廣告自動化生成;   AIGC提升影視行業全管線效率。影視劇本創作已初見成效,多AI技術將助力電影中期拍攝,后期制作將更快完成;   AIGC帶給媒體行業人機協作方案。新聞寫作編排效率提升,傳媒向智媒轉向開啟新篇章;   AIGC提供互聯網行業豐富內容,和更便捷的服務。ChatGPT賦能智慧搜索,互為供給加速發展內容平臺發展,虛擬結合激發電商沉浸式體驗;   AIGC為娛樂行業提供了更多樣的體驗。人際交互娛樂邁入新臺階,AIGC或成元宇宙之匙。

付費5元查看完整內容

自ChatGPT推出以來,國內學術界和科技企業相繼宣布或將推出類似機器人對話模型,有望推動大模型發展。2月7日,百度官宣“文心一言”。2月20日,復旦大學發布了類ChatGPT模型“MOSS”,并面向大眾公開邀請內測,國產大模型有望迎來爆發式增長。   需求和政策兩方面,合力推動AI產業增長。國內應用層面的需求推動AI產業的加速發展。根據IDC數據預測,2021年中國人工智能軟件及應用市場規模為51億美元,預計2026年將會達到211億美元。數據、算法、算力是AI發展的驅動力,其中數據是AI發展的基石,中國數據規模增速有望排名全球第一。政策方面,“十四五”規劃中提到“瞄準人工智能”,“聚焦人工智能關鍵算法”,加快推進“基礎算法”的“突破與迭代應用”;北京、上海、廣州等城市發布相關規劃。   頭部企業采取“模型+工具平臺+生態”三層共建模式,有助于業務的良性循環,也更容易借助長期積累形成競爭壁壘。大模型廠商主要包括百度(文心大模型)、騰訊(HunYuan大模型)、阿里(通義大模型)、商湯、華為(盤古大模型)等企業,也有智源研究院、中科院自動化所等研究機構,同時英偉達等芯片廠商也紛紛入局。大模型增強了AI技術的通用性,助力普惠AI的實現。未來,大模型有望于場景深度融合,配合專業工具和平臺支持應用落地,開放的生態來激發創新,形成良性循環。   技術發展有望促進生產效率提升,并進一步創造新的消費和需求,有利于文娛內容和互聯網行業。在AIGC和ChatGPT方面,我們建議持續關注技術發展和應用情況,把握技術催化和商業化落地帶來的投資機會:1)具備AIGC和ChatGPT的技術探索和應用的公司:百度集團-SW、商湯-W、萬興科技、拓爾思等;2)具有海量內容素材且具有AIGC探索布局的,圖片/文字/音樂/視頻內容及平臺公司騰訊控股,閱文集團、美圖公司、昆侖萬維、湯姆貓、神州泰岳、視覺中國、中文在線、漢儀股份、天娛數科、風語筑等。

付費5元查看完整內容

數據、算法、算力共振推動AIGC發展,模型開源及商業化帶來的產品化浪潮及通用人工智能領域的初探推動AIGC破圈。AIGC傳媒相關應用有望超千億。   復盤AIGC算法迭代:競爭中發展,模型開源及商業化推動應用破圈。2017年推出的Transformer架構的并行訓練優勢奠定了大模型訓練的基礎,以GPT為代表的預訓練模型,通過使用無標注數據預訓練及微調,緩解了標注數據不足的問題,并不斷提升參數量級及模型通用性,ChatGPT在此基礎上加入了利用人類反饋強化學習的訓練方法。擴散模型取代GAN成為圖像生成領域的主流模型,CLIP模型推動跨模態生成技術的發展。GPT3的商業化及CLIP及Stable Diffusion模型的開源推動文本生成、文生圖產品化的浪潮。谷歌、Meta持續探索文字生成視頻領域模型。   國內傳媒領域應用有望超千億。Gartner預測至2023年將有20%的內容被生成式AI所創建;至2025年生成式AI產生的數據將占所有數據的10%(目前不到1%)。紅杉預測生成式ai將產生數萬億美元經濟價值。2025年,國內生成式ai應用規模有望突破2000億,我們預測國內傳媒領域應用空間超1000億。   AIGC應用于文本、音頻、跨模態、策略生成,在設計、內容創作、廣告營銷、游戲、企業服務等領域開啟商業化,有望開啟新一輪內容生產力革命。   文本生成:應用于輔助寫作、營銷、社交、瀏覽器、企業級服務、心理咨詢等領域。代表公司Jasper.ai,通過SaaS訂閱收費模式,獲得B端客戶認可,率先實現規模化收入;OpenAI旗下ChatGPT由于其通用性被集成至瀏覽器、辦公自動化軟件、企業級服務產品中,作為增值服務項目。   音頻生成:應用于智能客服、有聲讀物制作、配音、導航、虛擬歌手、作曲等領域。代表公司喜馬拉雅、倒映有聲、標貝科技、StarXMusicXLab等。   跨模態生成:包括文生圖、文生視頻,圖片視頻生成文字等應用。AI繪畫代表產品Midjourney、DALL-E2、Dreamstudio、文心一格,主要按生成次數收費。   策略生成:應用于游戲、自動駕駛、機器人控制、智能交互數字人等領域。游戲領域代表性公司騰訊AILab、網易伏羲、啟元世界、rct.ai、超參數等。

付費5元查看完整內容

結論:大模型的出現促進底層技術迭代,衍生出AIGC應用受到關注;大小模型路線分化加劇,傳統深度學習關注下游場景落地情況

  回顧:AI傳統領軍全面下跌,行業多方面挑戰,宏觀經濟下行初期需求增量釋放緩慢。

  落地場景需探索,人臉等已經紅海,工業、醫療等尚在早期,AI獨角獸IPO后股價表現較弱,與收入-薪酬匹配度仍然較低有關。

  行業熱點在大模型:大規模預訓練+無監督,大幅提升AI效率

以GPT-3為代表的大模型,可以從大量未標記的數據中捕獲知識,極大擴展模型的泛化能力。

  但仍存在缺陷:對邏輯理解欠缺,訓練成本過高,普通機構難以復現。

  大模型應用:AIGC圖像生成、GPTChat、自動駕駛等成為熱點

隨著模型改進和像素提升,DALL-E2、Stable Diffusion等圖像生產AIGC應用爆發;

InstructGPT在GPTChat工具中應用效果提升,做到與人類進行談話般的交互。

  重點行業AI落地場景逐一分析:智能制造、智慧倉儲物流、智慧金融、智慧醫療、智能家居等。成熟的AI應用場景正在涌現,領軍AI公司已有大量標桿案例

付費5元查看完整內容

自研AI芯片、云原生架構、彈性分布式訓練服務以及MLOps能力成為平臺核心能力

  AI芯片將持續架構創新、形態演進以及軟硬一體化趨勢;云原生應用可以為AI開發平臺的用戶(開發者)提供更敏捷高質量的應用交付以及更簡單和高效的應用管理;分茍式訓練可提供底層資源的彈性配置,提升系統的資源利用率;MLOps為AI開發平臺帶來靈活性與速度。

  開發者流量與平臺規模是AI開發平臺營收決定性要素

  AI開發平臺商業模式相對簡單。AI開發平臺經營模式是通過為企業或并發者提供Ai技術接口或AI并發工具而獲利I計費方式主要包括免費、按調用量計費、包年或包月三種。

  模型調用業務營收將提升

  2016-2020年,中國AI開發平臺營收規模快速擴張,2020年中國AI開發平臺營收突破200億元^現階段算力、數據、模型調用、部署/維護四項業務占AI并發平臺的營收占比約為4:3:21。未來,隨著推斷應用占比的提升,數據業務的營收占比預計將下降;而隨著AI在各垂直場景中應用的深入,模型調用業務的營收占比預計將提升。

付費5元查看完整內容
北京阿比特科技有限公司