亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

AIGC(Artificial Intelligence Generated Content),即人工智能內容生成。AIGC通常基于深度學習和自然語言處理技術,利用大規模的語料庫進行訓練,從而讓機器能夠自動生成與人類語言相似的內 容。一般來說,AIGC需要輸入一些指令或者關鍵詞,然后系統就會自動產生相應的內容,例如文章、新聞、評論、詩歌、小說、音樂、視頻字幕等等。當下,樹立對AIGC正確的認知已經成為重要的知識素養。下文將從概念、技術和熱點話題等多個角度出發,幫助讀者形成對AIGC概念的初步認識。

理解AIGC,需要結合人工智能(Artificial Intelligence)、內容生成(Generated Content)兩個角度。一方面,AIGC屬于AI的分支,從人工智能的角度理解有利于掌握其技術內涵。AI指人工智能,它是一種能夠通過計算機程序實現人類智能的技術。AI在上個世紀50年代出現,并在之后幾十年里得到了廣泛的發展和應用。它包括了許多不同的子領域,如機器學習、自然語言處理、 計算機視覺等,可以應用于廣泛的領域,如醫療、金融、工業等。

AIGC 技術的興起可以追溯到近年來機器學習和深度學習等技術的發展。AIGC指人工智能生成技術,它是一種利用機器學習和神經網絡等技術來生成各種形式內容的技術。這些內容包括文本、圖像、音頻等等,通常是通過輸入大量的訓練數據來訓練模型,并使用這些模型來生成新的內容。2023年,ChatGPT應用的出現展示了AIGC的潛 力,掀起了AIGC的發展浪潮。AGI指通用人工智能,它是一種可以像人類一樣進行多種任務和活動的人工智能技術。與目前的AI技術相比,AGI具有更高的靈活性和智能性,可以在不同的環境和任務中進行適應和學習。然而,AGI技術仍處于概念發展的初級階段,目前還沒有實現真正意義上的 AGI系統。 以上三個概念之間的關系可以這樣理解:AI是整個人工智能領域的總稱,包括了AIGC和AGI等不同的技術方向。AIGC是AI領域中的一個重要分支,主要指通過機器學習等技術生成內容的技術范疇。而AGI則是AI領域一個更高級的目標,指向一個能夠像人類一樣進行多種任務和活動的智能系統。

付費5元查看完整內容

相關內容

來源:騰訊研究院

  近日,針對大模型AI技術發展,騰訊研究院、同濟大學、騰訊云、騰訊新聞基于產學研等多方在AI領域的研究,共同發布了《人機共生——大模型時代的AI十大趨勢觀察》報告,從技術、應用、社會等角度,提出大模型時代的關鍵性趨勢觀察,并帶來了大模型時代AI的十個關鍵詞。

  技術趨勢:大語言模型和多模態技術將助力人工智能向AGI發展

  AGI(通用人工智能)是一種具有所有人類智能能力的機器,它可以理解、學習、適應和實現任何知識工作。報告顯示,自2010年代初深度學習問世以來,人工智能進入到第三次高潮,而2017年出現的Transformer算法,又將深度學習推向了大模型時代。以ChatGPT為代表的大語言模型,展現出來的推理、思維鏈等能力,讓人類感到驚訝,尤其是GPT4在多種能力測試中達到人類頂級水平,更是讓人類看到了AGI的曙光。

  未來真正的AGI可以自然地處理多種類型信息,它需要具有高效的多模態信息處理機制。報告認為,多模態AI不僅能夠處理單一數據類型的任務,而且可以在不同數據類型間建立聯系和融合,為解決復雜問題提供支持,因此多模態AI也將助力人工智能向AGI發展。

  報告還強調,多模態AI也將帶來創新應用的藍海,例如多模態AI可以擴展在社交媒體中的實時語音、文字、圖像和視頻的處理能力,為傳統游戲和增強現實/虛擬現實(AR/VR)應用帶來更為豐富和沉浸式體驗。

  應用趨勢:AI將給產品交互、企業生態、商業模式等多個領域帶來變革

  在應用層面,報告重點提到了AI對產品交互、企業生態、商業模式、個人創作能力等方面的變革。

  在產品交互方面,過去人類用鍵盤鼠標與電腦交互,用手指觸屏與手機交互,用喚醒詞與智能音箱交互,但生成式AI讓人類可以用自然語言的方式跟機器對話,機器也可以通過大模型擁有理解人類語言的能力。報告顯示,過去的數次人機交互變革,都帶來了從終端到連接,到各類應用的顛覆式變革,生成式AI也必將帶來產業鏈、價值鏈和生態的重塑。

  在商業模式方面,大模型促進了AI的工業化,并且正在重構現有的商業模式,未來將形成模型即服務的MaaS生態。報告顯示,未來的數字化商業將分為大模型基礎設施型企業、垂直行業領域的小模型應用企業,以及更加貼合個人用戶的模型應用和服務。這一生態的建立和發展,將更廣泛地賦能各行業應用,加快社會各領域數字化轉型、智能化發展,帶來全社會的生產效率提升。

  此外,垂直領域應用將是大模型的主戰場。隨著生成式人工智能技術的飛速發展,它已經在多個領域展現出全新的商業價值。在中國,諸多行業企業也已經看到生成式AI、大模型可能為企業帶來競爭優勢。金融行業、文化娛樂行業等頭部機構預計會在一年內,在相對成熟的場景中嘗試引入大模型以及生成式AI能力。

  與此同時,MaaS服務正助力加速行業大模型落地。騰訊云從產業客戶需求場景出發,基于大模型高性能計算集群和大模型能力,依托騰訊云TI平臺打造模型精選商店,為客戶提供MaaS一站式服務和行業大模型解決方案,全面降低落地門檻,助力客戶構建專屬大模型及智能應用。截至目前,騰訊云已聯合行業頭部企業,為10大行業輸出了超過50個解決方案,提供一整套模型服務工具鏈,幫助企業高效宰、高品質、低成本創建和部署AI應用。

  對于個人來講,AI大模型將助力個體成為超級生產者。報告指出,基于生成式AI的新應用快速進化,涌現出許多新型面向個體的生產力應用。在創意制作、文本生成、圖像和視頻工具、學習工具、閱讀工具、市場分析、編程等各個領域快速融入工作流,從信息處理、個性化學習、輔助創作、智能優化等方面協助人類創作,賦能個體成為超級生產者。在大模型的加持下,人工智能正在從“工具”變成“伙伴”,人機關系將進入到下一階段。

  社會趨勢:重點審視版權歸屬難題和倫理挑戰

  在社會觀察層面,報告重點關注當下受到AI沖擊最為明顯的兩個領域:版權與治理。

  傳統的版權制度立足于“思想表達二分法”這一基本原則,即“只保護自然人思想的表達,而不保護自然人的思想本身”。報告指出,在人工智能時代,版權制度如果無法對“人的創造性思想”和“AI模型的獨創性表達”加以有效回應,那么其適用價值將會受到極大影響。

  同時,生成式AI也帶來了更加復雜難控的風險,包括對人類未來生存的潛在風險。報告指出,AI時代需要成為一個負責任創新的時代,人們需要建立合理審慎的AI倫理和治理框架,塑造負責任的AI生態,打造人機和諧共生的未來。

  其中,生成式AI領域的創新主體需要積極探索技術上和管理上的安全保障措施,為生成式AI的健康發展和安全可控應用構筑起防護欄。

  具體內容如下:

付費5元查看完整內容

大模型主導的生成式AI,尤其是GPT-4的發布,讓人類社會看到了通用人工智能時代的曙光。這意味著,經過“大工業化”的高效預訓練后,具備了強大的泛化能力,能夠在眾多領域像人類一樣進行思考、解決問題,并進行持續、快速的自我進化,大模型主導的生成式AI,將擁有極為廣闊的應用前景,有望賦能千行百業。未來,每個行業都將再進行一次智能化改造!

在政策層面,中央首次提到通用人工智能,為AIGC產業的發展提供了積極政策環境。

技術層面,作為AIGC生態的核心,大模型本身可根據可交互對象分成文本、音頻、圖像、視頻等不同模態以及跨模態,更多的模態,則意味著更多的交互和應用場景組合。我國AIGC產業目前尚處于發展初期,各模態技術發展進度不盡相同。目前,以文本生成、音頻生成應用相對廣泛。

當前,在應用層面,縱向看,在垂直應用方向上,傳媒、教育、營銷、客服、數字人等數字化程度更高、容錯率相對較高的領域先行先試;橫向看,在價值鏈角度,主要集中于技術嘗鮮、組織內部的提效降本,下一步將朝著終端用戶側的價值創造及傳遞場景展開。

圖片報告關鍵發現

大模型支撐的生成式AI,讓人類社會有望步入通用人工智能時代,擁有廣闊的應用前景,有望賦能千行百業。 當前生成式AI的落地整體處于初級階段,不同模態的落地時間表差異明顯,企業需求主要集中在數字化程度高、容錯率相對較高的領域,以借助中間件調用大模型能力為主要方式。數字內容產業、客戶服務是生成式AI滲透的典型行業和場景。 AIGC+數字內容:數字經濟快速發展,帶來國內數字內容消費需求的持續快速增長,但國內數字內容產業面臨需求變化快、供給側內容整體過剩而優質供給不足的問題。以長音頻數字內容生產為例,AIGC能夠助力內容生產的工程化、高質量、個性化。 AIGC+客戶服務:大模型依托自身強大泛化能力優勢,有望給國內智能客服領域的服務前、服務中、服務后各環節帶來效能提升。但由于存在效果不明、數據安全等問題,短期內大模型很難對現有智能客服體系實現完全替代和顛覆,廠商需要探索如何在融合大模型能力的同時實現模式突破。

付費5元查看完整內容

AIGC發展過程:AI自行生成內容

  AIGC(ArtificialIntelligenceGeneratedContent)指的是人工智能系統生成的內容,通常是文字、圖像、音頻或視頻。這類內容可以通過自然語言處理,機器學習和計算機視覺等技術生成,即生成式AI。AI最初設立的目的是讓機器像人類一樣思考解決問題。目前AI的總體目的是通過各種算法解決問題提高生產效率。

  AIGC多樣化的內容生成能力使其覆蓋各類內容形式,各類應用場景正隨技術進步逐漸落地。AIGC不僅可覆蓋文本、音頻、圖像、視頻等基本內容模態,還可綜合圖像、視頻、文本進行跨模態生成,并應用于各類細分行業成為具體的生產力要素,例如游戲行業中的AI、NPC、虛擬人的視頻制作與生成等。

  AIGC發展過程:GPT助力,進入黃金期

  ChatGPT的發展帶動了文字類AI生成,或將在2023年進入黃金時期,圖片類AI生成黃金時期將在2025年左右抵達,3D和視頻類AI生成在2023年可能正處于草稿階段,進入黃金時期或許在2030年。

  AIGC產業應用,如在制造業、建筑業等巨型垂直實體領域中,AIGC的C/Content內容將不僅停留在圖片和文字的領域,而是進入信息更為豐富的領域。

付費5元查看完整內容

最近,ChatGPT與DALL-E-2[1]和Codex[2]一起受到了社會的廣泛關注。因此,許多人對相關資源感興趣,并試圖揭開其令人印象深刻的性能背后的背景和秘密。**事實上,ChatGPT和其他生成式AI (GAI)技術屬于人工智能生成內容(AIGC)的范疇,它涉及通過AI模型創建數字內容,如圖像、音樂和自然語言。AIGC的目標是使內容創建過程更加高效和可訪問,允許以更快的速度生產高質量的內容。**AIGC是通過從人類提供的指令中提取和理解意圖信息,并根據其知識和意圖信息生成內容來實現的。近年來,大規模模型在AIGC中變得越來越重要,因為它們提供了更好的意圖提取,從而改善了生成結果。隨著數據和模型規模的增長,模型可以學習的分布變得更加全面和接近現實,從而產生更加真實和高質量的內容。**本文全面回顧了生成模型的歷史,基本組件,以及AIGC的最新進展,從單模態交互和多模態交互。**從單模態的角度,介紹了文本和圖像的生成任務和相關模型。從多模態的角度出發,介紹上述模態之間的交叉應用。最后討論了AIGC存在的開放問題和未來的挑戰。

1. 引言

近年來,人工智能生成內容(Artificial Intelligence Generated Content, AIGC)受到了計算機科學界以外的廣泛關注,全社會開始關注大型科技公司[3]構建的各種內容生成產品,如ChatGPT[4]和DALL-E2[5]。AIGC指的是使用高級生成AI (GAI)技術生成的內容,而不是由人類作者創建的內容,AIGC可以在短時間內自動創建大量內容。例如,ChatGPT是OpenAI開發的用于構建對話式人工智能系統的語言模型,可以有效地理解并以有意義的方式響應人類的語言輸入。此外,DALL-E-2是另一個最先進的GAI模型,也是由OpenAI開發的,它能夠在幾分鐘內從文本描述中創建獨特的高質量圖像,如圖1所示的“一個宇航員以逼真的風格騎馬”。隨著AIGC的卓越成就,許多人認為這將是人工智能的新時代,并將對整個世界產生重大影響。

**從技術上講,AIGC是指給定人工指令,可以幫助教學和指導模型完成任務,利用GAI算法生成滿足指令的內容。**該生成過程通常包括兩個步驟:從人工指令中提取意圖信息和根據提取的意圖生成內容。然而,如之前的研究[6,7]所示,包含上述兩個步驟的GAI模型的范式并不完全新穎。與之前的工作相比,最近的AIGC的核心進展是在更大的數據集上訓練更復雜的生成模型,使用更大的基礎模型架構,并能夠訪問廣泛的計算資源。例如,GPT-3的主框架保持與GPT-2相同,但預訓練數據大小從WebText 8增長到CommonCrawl9,基礎模型大小從1.5B增長到175B。因此,在人類意圖提取等任務上,GPT-3比GPT-2具有更好的泛化能力。

除了數據量和計算能力增加帶來的好處,研究人員還在探索將新技術與GAI算法集成的方法。例如,ChatGPT利用來自人類反饋的強化學習(RLHF)[10-12]來確定給定指令的最適當響應,從而隨著時間的推移提高模型的可靠性和準確性。這種方法使ChatGPT能夠更好地理解人類在長對話中的偏好。同時,在計算機視覺領域,由Stability提出了穩定擴散[13]。AI在2022年也在圖像生成方面取得了巨大成功。與之前的方法不同,生成擴散模型可以通過控制探索和利用之間的權衡來幫助生成高分辨率圖像,從而將生成圖像的多樣性和與訓練數據的相似性和諧地結合起來。

結合這些進展,模型在AIGC任務上取得了顯著進展,并被應用于各個行業,包括藝術[14]、廣告[15]、教育[16]等。在不久的將來,AIGC將繼續成為機器學習的一個重要研究領域。因此,對過去的研究進行廣泛的調研并確定該領域的開放問題至關重要。對AIGC領域的核心技術和應用進行了綜述。 **這是對AIGC的首次全面綜述,從技術和應用兩個方面對GAI進行了總結。之前的研究從不同的角度關注GAI,包括自然語言生成[17],圖像生成[18],多模態機器學習中的生成[7,19]。**然而,之前的工作只關注AIGC的特定部分。本文首先回顧了AIGC中常用的基礎技術。進一步對先進的GAI算法進行了全面的總結,包括單峰生成和多峰生成,如圖2所示。此外,還討論了AIGC的應用和潛在挑戰。最后指出了該領域存在的問題和未來的研究方向。

綜上所述,本文的主要貢獻如下:

據我們所知,我們是第一個為AIGC和AI增強生成過程提供正式定義和徹底調研的人。

回顧了AIGC的歷史和基礎技術,并從單模態生成和多模態生成的角度對GAI任務和模型的最新進展進行了全面分析。

討論了AIGC面臨的主要挑戰以及AIGC未來的研究趨勢。

調研的其余部分組織如下。第二節主要從視覺模態和語言模態兩個方面回顧了AIGC的歷史。第3節介紹了目前在GAI模型訓練中廣泛使用的基本組件。第4節總結了GAI模型的最新進展,其中第4.1節從單模態角度回顧了進展,第4.2節從多模態生成的角度回顧了進展。在多模態生成中,介紹了視覺語言模型、文本音頻模型、文本圖模型和文本代碼模型。第5節和第6節介紹了GAI模型在AIGC中的應用以及與該領域相關的一些重要研究。第7、8節揭示了AIGC技術存在的風險、存在的問題和未來的發展方向。最后,我們在9中總結了我們的研究。2. 生成式人工智能的歷史生成模型在人工智能領域有著悠久的歷史,可以追溯到20世紀50年代,隱馬爾可夫模型(HMM)[20]和高斯混合模型(GMMs)[21]的發展。這些模型生成了語音和時間序列等順序數據。然而,直到深度學習的出現,生成模型才在性能上看到了顯著的改進。

在早期的深度生成模型中,不同的領域通常沒有太多的重疊。在自然語言處理(NLP)中,傳統的生成句子的方法是使用N-gram語言建模[22]學習單詞分布,然后搜索最佳序列。然而,該方法不能有效地適應長句子。為了解決這個問題,循環神經網絡(RNN)[23]后來被引入到語言建模任務中,允許對相對較長的依賴關系進行建模。隨后,長短期記憶(LSTM)[24]和門控循環單元(GRU)[25]的發育,它們利用門控機制在訓練過程中控制記憶。這些方法能夠處理樣本[26]中的約200個標記,與N-gram語言模型相比,這是一個顯著的改進。 同時,在計算機視覺(CV)領域,在基于深度學習的方法出現之前,傳統的圖像生成算法使用紋理合成[27]和紋理映射[28]等技術。這些算法基于手工設計的特征,在生成復雜多樣的圖像方面能力有限。2014年,生成對抗網絡(Generative Adversarial Networks, GANs)[29]被首次提出,在各種應用中取得了令人印象深刻的結果,是該領域的一個重要里程碑。變分自動編碼器(vae)[30]和其他方法,如擴散生成模型[31],也已開發用于對圖像生成過程進行更細粒度的控制和生成高質量圖像的能力

生成模型在不同領域的發展遵循不同的路徑,但最終出現了交叉的問題:transformer架構[32]。Vaswani等人在2017年引入了NLP任務,Transformer后來被應用于CV中,然后成為不同領域許多生成模型的主要骨干[9,33,34]。在NLP領域,許多著名的大型語言模型,如BERT和GPT,采用transformer架構作為其主要的構建塊,比之前的構建塊(如LSTM和GRU)具有優勢。在CV中,Vision Transformer (ViT)[35]和Swin Transformer[36]后來通過將Transformer架構與視覺組件相結合,進一步發展了這一概念,使其可以應用于基于圖像的下游。除了transformer給單個模態帶來的改進之外,這種交叉還使來自不同領域的模型能夠融合在一起,以完成多模態任務。多模態模型的一個例子是CLIP[37]。CLIP是一種視覺-語言聯合模型,將transformer架構與視覺組件相結合,允許它在大量文本和圖像數據上進行訓練。由于它在預訓練時結合了視覺和語言知識,因此也可以作為多模態提示生成中的圖像編碼器。總而言之,基于transformer的模型的出現徹底改變了人工智能的產生,并導致了大規模訓練的可能性。

近年來,研究人員也開始引入基于這些模型的新技術。例如,在NLP中,人們有時喜歡少樣本提示[38],而不是微調,這是指在提示中包括從數據集中選擇的一些示例,以幫助模型更好地理解任務需求。在視覺語言中,研究人員經常將特定模態模型與自監督對比學習目標相結合,以提供更魯棒的表示。在未來,隨著AIGC越來越重要,會有越來越多的技術被引入,讓這個領域充滿活力。

3. 生成式人工智能

我們將介紹最先進的單模態生成模型。這些模型被設計為接受特定的原始數據模態作為輸入,例如文本或圖像,然后以與輸入相同的模態生成預測。我們將討論這些模型中使用的一些最有前途的方法和技術,包括生成語言模型,如GPT3[9]、BART[34]、T5[56]和生成視覺模型,如GAN[29]、VAE[30]和歸一化流[57]。

多模態模型

多模態生成是當今AIGC的重要組成部分。多模態生成的目標是通過學習數據[7]的多模態連接和交互來學習生成原始模態的模型。模態之間的這種連接和相互作用有時是非常復雜的,這使得多模態表示空間與單模態表示空間相比很難學習。然而,隨著前面提到的強大的特定于模式的基礎架構的出現,越來越多的方法被提出來應對這一挑戰。在本節中,我們將介紹視覺語言生成、文本音頻生成、文本圖形生成和文本代碼生成中的最先進的多模態模型。由于大多數多模態生成模型總是與實際應用高度相關,本節主要從下游任務的角度進行介紹。

4. 應用

5. 效率

在過去的十年中,具有神經網絡的深度生成式人工智能模型一直主導著機器學習領域,其崛起歸功于2012年的ImageNet競賽[210],這導致了一場創建更深入和更復雜模型的競賽。這種趨勢也出現在自然語言理解領域,像BERT和GPT-3這樣的模型已經開發出了大量參數。然而,不斷增加的模型占用空間和復雜性,以及訓練和部署所需的成本和資源,給現實世界中的實際部署帶來了挑戰。核心挑戰是效率,可以分解如下:

推理效率: 這與部署用于推理的模型的實際考慮有關,即為給定的輸入計算模型的輸出。推理效率主要與推理期間模型的大小、速度和資源消耗(例如,磁盤和RAM使用)有關。 * 訓練效率: 這涵蓋了影響訓練模型的速度和資源需求的因素,如訓練時間、內存占用和跨多個設備的可伸縮性。它還可能包括考慮在給定任務上實現最佳性能所需的數據量。

付費5元查看完整內容

 AIGC空間廣闊,商業化落地持續推進

  AIGC的落地痛點在于成本高昂的通用大模型與下游垂直應用場景需求的不匹配。ChatGPT熱度持續提升,一方面推動了科技巨頭持續加大AI投入,另一方面也直接帶動下游付費意愿提升,進一步加速AIGC應用落地和商業變現,AIGC產業迎來發展良機。   (1)從內容形態來看,AIGC應用包括文本、音頻、圖像、視頻、代碼、多模態等內容生成形式,根據紅衫資本預測,AIGC將首先在文本和代碼領域落地應用,隨后逐漸拓展至圖像和視頻領域。   (2)從應用價值來看,AIGC應用價值體現在降本增效、提升內容質量、增加內容多樣性、生成個性化內容等方面。在垂直領域,目前國內已有機器寫稿、對話式AI、報告生成等AIGC應用落地,技術價值主要在于替代人工實現降本增效。隨著科技巨頭的持續投入以及技術的迭代升級,AIGC技術應用場景進一步拓寬,技術價值也有望從將本增效向額外價值轉移。   AI賦能價值凸顯,AI應用大有可為   (1)AI+搜索:搜索是互聯網的流量入口,微軟、谷歌、百度均表示將率先將AI技術應用于搜索,未來有望重塑信息生成和呈現方式,成為新的流量入口。   (2)AI寫作:AI寫作可大幅提升效率,在具有較強規律性的結構化寫作方面具有豐富應用場景。目前已在辦公軟件、新聞媒體等專業應用場景商業化落地。   (3)AI對話:AI對話主要用于替代人類完成大量重復性、規則性對話任務,在金融、互聯網、運營商等擁有大量C端用戶的行業擁有廣闊應用前景。ChatGPT在多項測試中已經超過人類,將對話AI提升至新的高度,未來應用空間廣闊。   (4)AI翻譯:在AI技術支持下,機器翻譯效果持續優化,但在廣義理解層面仍面臨挑戰。相比專業搜索工具,ChatGPT具有更強的理解能力,在部分場景的翻譯表現優于谷歌翻譯和DeepL,表現驚艷。   (5)AI作畫:AI作畫可解決視覺內容創作門檻高、耗時長的痛點,對于內容創作的價值凸顯。根據6pen預測,未來五年10%-30%的圖片內容將由AI參與生成,預計2027年市場規模有望超過600億,空間廣闊。   (6)AI視頻:AI已經可以輔助完成視頻生成、替換、剪輯等多項任務,已在短視頻、AI修復等領域廣發應用,下游需求旺盛,未來應用潛力廣闊。

付費5元查看完整內容

AIGC成為新的內容生產方式,跨模態生成值得重點關注。區別于PGC與UGC,AIGC是利用人工智能技術自動生成內容的新型生產方式。按照模態區分,AIGC可分為音頻生成、文本生成、圖像生成、視頻生成及圖像、視頻、文本間的跨模態生成,細分場景眾多,其中,跨模態生成需要重點關注。   自然語言處理(NLP)賦予了AI理解和生成能力,大規模預訓練模型是NLP的發展趨勢。NLP的兩個核心任務分別是自然語言理解(NLU)和自然語言生成(NLG)。以ELMo、BERT、GPT為代表的預訓練模型,降低了NLP的技術門檻。ELMo解決了“一詞多義”的問題;BERT通過MLM(類似于完形填空)和NLP(判斷句子是否相連)進行預訓練,增強了上下文的理解能力。GPT通過預測下一個詞,獲得了生成能力;GPT-3在此基礎上使用了更大的數據和更大模型,無需針對下游任務進行傳統的微調,并且采用了小樣本學習提升生成效果。   ChatGPT是NLP發展中具有里程碑式意義的模型之一。ChatGPT是OpenAI從GPT-3.5系列中的模型進行微調產生的聊天機器人模型。它能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,真正像人類一樣來聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。   生成模型賦予了AI創造力,擴散模型是最前沿的技術之一。AIGC的快速發展歸功于生成算法領域的技術積累。GAN的核心思想是“生成”與“對抗”,相比傳統的深度神經網絡,GAN能產生更好的生成樣本,但是仍需解決應用中的問題。擴散模型較GAN更接近人的思維模式,是基于馬爾科夫鏈,通過學習噪聲來生成數據。擴散模型實現了跨模態應用,包括OpenAI的GLIDE和DALL·E2、谷歌的Imagen、StabilityAI的StableDiffusion等。   人工智能由單模態智能,向多種模態融合方向發展。建立統一的、跨場景、多任務的多模態基礎模型或將成為人工智能發展的主流趨勢之一。CLIP模型將語言信息和圖像信息聯合訓練,能夠鏈接文本和圖片,成為跨模態生成應用的一個重要節點,“CLIP+其他模型”在跨模態生成領域成為一種較為通用的做法。2022年,微軟提出的BEiT-3多模態基礎模型,在視覺-語言任務處理上具備出色表現,包括視覺問答、圖片描述生成和跨模態檢索等。多模態提高了基礎模型的靈活性,使其在其他模態的應用中發揮新的潛質。   未來,值得關注的技術要素包括:長文本生成、開放式文本生成、NeRF模型、擴散模型、跨模態大型預訓練模型(支持的模態數據類型、模態對齊架構設計、支持的下游應用)、小樣本學習及自監督算法、強化學習及環境學習等。

付費5元查看完整內容

ChatGPT引領AI技術新一輪熱潮,預示著NLP技術有望迅速進入平民化應用時代。2022年11月30日,OpenAI公司上線了聊天機器人模型ChatGPT,迅速引發了全球的熱潮。ChatGPT是一種預訓練的語言大模型,采用大量的參數和大量的數據進行訓練,基于人類反饋的強化學習算法,將NLP技術和機器學習結合,極大地提升了模型算法的效率和能力。隨著ChatGPT的熱度不斷攀升,多家科技公司都開始布局ChatGPT相關技術領域,NLP技術有望迅速進入平民化應用時代。

  ChatGPT具有良好的商業價值,未來應用空間廣闊。ChatGPT相關技術不僅對眾多的C端應用帶來革新,同時也將對B端應用產生重大影響,企業數字化轉型有望真正從數字化走向智能化,ChatGPT在企業辦公中的應用,具備很大的想象空間。我們認為,協同辦公類應用作為企業各類應用的入口,同時具備知識管理、流程引擎等功能,具備很強卡位價值,在把ChatGPT技術引入后,可以極大提升產品的功能與應用體驗。員工僅需給出想要辦理的流程,由ChatGPT進行智能化辦理,從而改變過去員工需要自行在OA、ERP及業務系統中完成信息錄入、功能查找、業務辦理的現狀,將極大地提升辦公效率和使用體驗。目前微軟已經將ChatGPT應用到了Dynamics365、Teams等產品線,未來將要應用到Bing搜索中,未來的商業價值空間十分可觀。     AIGC有望成為未來人工智能的重要方向,商業化模式仍需摸索。AIGC即人工智能內容生成,ChatGPT就是典型的文本生成式的AIGC,其目前的成功也有望帶動AIGC在圖像、音樂、視頻等其他領域落地。Gartner曾多次將生成式AI列為未來的重要技術趨勢,是當下最引人注目的人工智能技術之一。據Gartner預計,到2025年,生成式人工智能將占所有生成數據的10%,而目前這一比例還不到1%。隨著ChatGPT開啟付費訂閱試點,AIGC的商業化進程正式拉開帷幕。據量子位報告統計,到2030年,AIGC的市場規模將超過萬億人民幣,但由于AIGC目前產業化程度有限,大量業務場景尚未成功變現,商業模式也還處于探索階段。我們認為,在當下時點,AIGC基于其出色的降本增效能力,在企業級市場的應用前景較為明朗和穩定,在C端消費市場的商業模式仍需進一步摸索。  

付費5元查看完整內容

如同蒸汽時代的蒸汽機、電氣時代的發電機、信息時代的計算機和互聯網,人工智能正成為推動人類進入智能時代的決定性力量。全球產業界充分認識到人工智能技術引領新一輪產業變革的重大意義,紛紛轉型發展,搶灘布局人工智能創新生態。人工智能細分賽道持續創新下變革在即,本報告重點關注AIGC領域。

  AIGC顛覆傳統內容產出模式,或為web3.0內容創造新引擎。AIGC本質上是一種AI賦能技術,能夠通過其高通量、低門檻、高自由度的生成能力廣泛服務于各類內容的相關場景及生產者。隨著人工智能生成能力的突破進展,內容生產已經從專業生成內容(PGC)、用戶生成內容(UGC),進入到人工智能生成內容(AIGC,AI generated content)時代,AIGC被認為是web3.0的重要基礎設施。AIGC的快速興起源于深度學習技術的快速突破和日益增長的數字內容供給需求;應用價值層面,AIGC有望成為數字內容創新發展新引擎,為數字經濟發展注入新能量。數據+算法+算力三大核心要素,決定AIGC產出質量。①數據,海量優質的應用場景數據是訓練算法精確性關鍵基礎。②算法,神經網絡、深度學習等算法是挖掘數據智能的有效方法。與傳統機器深度機器學習算法不同,神經網絡在學習范式+網絡結構上的迭代提升了AI算法的學習能力,未來多模態大模型或為核心趨勢,賦能產業空間及實踐潛力。③算力,計算機、芯片等載體為AIGC提供基本的計算能力。     AIGC技術場景中,個性化及自動化內容產出為核心價值。①技術成熟度較高結構化領域大部分是在和人力生成內容進行競爭。其中的存量價值來源于同類內容的降本增效,而增量價值則來源于跨模態的內容生成以及AI本身帶來的科技感。對內容渠道的把控將成為核心競爭力。發行商、內容最終消費渠道具有強的產業鏈話語權。②底層技術基本明確/仍待完善的原創性創作領域,本質為AI下的個性化數字內容的自動化構建。該領域重點關注和其配套數據或底層原理是否清晰、商業化路徑。目前AIGC整體影響仍十分有限,主要是中國市場供給端仍處于起步階段。     AIGC應用場景中,數字化程度高及內容需求豐富的領域有廣闊應用空間。隨著AIGC技術快速迭代,其可高效生成不同模態的信息產出(包括文字、音頻、視頻及跨模態),以真實性、多樣性、可控性及綜合性等特征,有望幫助企業提高內容生產的效率,以及為其提供更加豐富多元、動態且可交互的內容,或將率先在傳媒、電商、影視、娛樂等數字化程度高、內容需求豐富的行業取得重大創新發展。     深度學習模型+開源模式加速AIGC普及,海外AIGC已到了“快速發展階段”。①隨著深度學習模型不斷迭代,人工智能生成內容百花齊放,產出效果逐漸逼真直至人類難以分辨。2018年,人工智能生成的畫作在佳士得拍賣行以43.25萬美元成交,成為首個出售的人工智能藝術品;2019年,DeepMind發布DVD-GAN模型用以生成連續視頻;2022年11月,OpenAI上線了智能對話系統(聊天機器人)ChatGPT,引發全球熱潮。ChatGPT的成功離不開參數競賽時代下的“大模型”,顯卡等硬件優化帶來的“大算力基礎”與基于“大數據”的RLHF訓練模式。但由于訓練數據的缺乏及訓練數據的偏差,ChatGPT仍需要高成本的調優及持續訓練,進而實現商業化落地。②“開源模式”加速AIGC產業發展。以深度學習模型CLIP為例,開源模式加速CLIP模型的廣泛應用,使之成為當前最為先進的圖像分類人工智能,并讓更多機器學習從業人員將CLIP模型嫁接到其他AI應用。     中國AIGC仍處“萌芽期”,技術能力與產品形態的成熟、核心場景的確定及產業的接納態度為行業關鍵發展節點。據量子位預測,AIGC在中國發展可分為三個階段:助手階段(摸索磨合期,2021年~2026年):AIGC輔助人類進行生產,優先變現的關鍵在于編輯優化功能,行業創新關鍵能力為素材模塊分拆+個性化推薦;協作階段(推廣應用期,2026年~2028年):人機共創,主要價值為降本增效及提供創意,預計互聯網大廠將普遍布局,競爭熱度提升;原創階段(價值增長期,2028年之后):AIGC將獨立完成內容創作,產生附加價值。中國AIGC企業均在初創階段,機會也許藏在垂直應用領域中,對賽道的選擇十分關鍵。  

付費5元查看完整內容

全真互聯時代正在悄然到來,加速線上線下的跨時空融合,作為全真互聯的重要入口,數字人可以推動線上和線下更加全面地一體化,打造出沉浸式的“全真”體驗與可操作的“互聯”交互。進入2022年以來,數字人在諸多應用場景大放光彩,特別是在北京冬奧會的開幕式表演、氣象播報、手語解說中頻頻現身,使其用戶基礎不斷擴大。爆點事件推動數字人產業被用戶不斷加深認知,數字人形態、技術及應用受到大量關注,而支持產業快速發展的底層元素則包括技術的發展、用戶新需求、生態完善和標準的支持等。

伴隨著全真互聯的到來,未來數字人應用還將具有哪些可能性,技術路線會產生哪些變化? 騰訊研究院、騰訊云智能創業黑馬合作,先后對數十家從事數字人的企業進行深度調研與跟蹤訪談 ,分析產業發展現狀,底層驅動力、未來方向和挑戰等。形成****《數字人產業發展趨勢報告(2023)》****(文末附下載二維碼)。從數字人的價值定位、核心技術、行業應用、C端發展、產業聚集 等十個不同維度進行剖析,挖掘出產業發展的十大趨勢。

****趨勢1:數字人制造和運營服務的B端市場不斷擴大,將面向更廣大的C端用戶提供服務,各類數字人價值定位和商業模式有差異。****數字人的最終服務對象為C端用戶,在B端的應用領域從電影動畫向廣告營銷、電商直播、虛擬偶像等領域不斷擴展。未來,以虛擬分身為代表的應用潛力巨大。從需求角度,數字人制造和運營服務在B端市場不斷擴大領域和規模,面向更廣大的C端用戶提供服務,而制作方式也從PGC向UGC發展。在20世紀80年代電影、動畫等領域早期的手繪數字人最先出現,伴隨著21世紀初計算機動畫和動捕技術的成熟,內容/IP型數字人大量應用在影視行業中,主要是增強影視中觀眾的體驗效果,隨后逐漸在文娛、市場營銷、文旅、虛擬偶像等場景推廣應用。近年,伴隨AI驅動技術的成熟,功能服務型數字人陸續出現,主要應用于行業服務場景,如金融數字人客服、傳媒數字人口播等。在虛擬空間中的虛擬分身數字人大范圍出現相對較晚,虛擬空間的技術和產品還在發展中,待產業進一步完善,此類應用潛力巨大,是數字人市場的增量空間。


****趨勢2:技術集綜合迭代驅動數字人形似人,制作效能將繼續提升。****多元技術推動數字人外形更像真人:建模技術發展推動超寫實數字人制作門檻、成本和周期進一步下降;物理仿真算法迭代推動服裝動態展示趨向真實;渲染引擎迭代和GPU算力提升推動數字人畫面更加精細和實時化;算法的優化推動專業動捕設備趨向便捷化,視覺動捕在C端應用潛力更大;面部捕捉技術向更簡單的硬件、更細膩的表情、更自動化的流程方向發展。

****趨勢3:AI技術驅動數字人多模態交互更神似人,并逐步覆蓋數字人全流程。****當前數字人對語言理解還是以文本為主,動作合成上聲唇同步較為完善:(1)AI驅動數字人是指數字人等語音表達、面部表情和動作形態等通過深度學習模型進行運算,并將其結果實時或者離線驅動,并進行渲染。目前主流的 方式是圍繞NLP能力通過文本驅動,本質是通過ASR-NLP-TTS等AI技術進行感知-決策-表達的閉環來驅動數字人交互,同時需要預先設置相關的知 識圖譜或問答庫等,與數字人的對話系統對接,但目前NLP在通用性場景的能力還需要進一步完善。 (2)計算機視覺(CV)目前數字人聲唇同步技術相對完善,在游戲中已經大量應用;而其他表情和動作還需要描述性的數據或者標簽驅動,尚未智能合成, 表情動作也是是AI驅動未來發展的重點方向。 未來AI技術的重點方向是在輸入端實現多模態感知輸入,在輸出端提升多模態交互能力,綜合提升數字人的表現力,從目前的基于文本的交互,轉化為基 于語義的交互,特別是需要強化對人情緒的感知和表達。此外除了利用ASR-NLP-TTS等技術驅動數字人交互外,AI技術也應用在2D數字人的視頻生成、3D數字人的建模、視頻驅動、物理仿真等多個環節。

****趨勢4:數字人技術與SLAM、3D交互、體積視頻、空間音頻等技術深度融合,渲染將從本地到云端。****數字人作為3D呈現的一種方式,未來將與其他3D技術如SLAM(即時定位與地圖構建)、體積視頻、空間音頻等融合,進一步完善數字人和真實空間的交互。例如在直播場景中虛擬/真實空間中真人和數字人的交互,數字人對真實空間的感知等。同時由于數字人對渲染能力要求較高,未來云端渲染是重要的方向,將推動云服務商從算力(CPU)云服務,到渲染力(GPU)的云服務。但成本仍是云渲染普及的關鍵阻礙,需要突破。

****趨勢5:千行千面的數字人將成為人機交互新入口,但深度上仍需挖掘。****AI驅動的數字人通過AI能力建立人與大數據的連接,提高效率并滿足人情感交流需求,提升用戶體驗,將成為人機交互新入口:應用廣度上:目前使用文字或語音交互的場景都可用AI數字人軟著陸的方式替代,不需要改變原有的業務邏輯和商業模式,大眾接受成本較低,并提供更好的用戶體驗,未來應用場景非常廣泛,可以與各種領域相結合,服務規模化和標準化。應用深度上:數字人作為企業的數字資產,是對員工工作的增強,具有生產力的屬性,可以進一步釋放生產力,同時降本增效。未來數字人將根據不同行業的業務特點和應用場景進行更深度結合,孵化千行千面的數字員工,提供差異化服務。

****趨勢6:UGC數字人將加速出現,成為未來產業的增量空間。****未來1-2年技術門檻和成本將快速下降,會出現更開放的創作者生態、更豐富的UGC內容和商業模式,UGC將成為數字人的增量空間,同時也是數字人在C端應用的主要生產方式


********趨勢7:數字人仍以2D顯示設備為主,3D顯示設備成為特定領域的新解法。****數字人的顯示載體包括手機、平板電腦、AR/VR眼鏡、智慧大屏或線下一體機等多種終端設備。PC、手機、智慧大屏、銀行VTM機等2D主流顯示設備仍是數字人顯示的主要載體。數字人和3D的數字內容,對于裸眼3D、VR、AR等3D顯示設備的普及具有推動重要。特別在VR/AR設備中,6dof交互更突出數字人特點,因此會在特定領域成為新解法,如在XR設備中的線上演唱會、展會和會議等應用場景。

****趨勢8:在場是數字人發展的高級階段,將與應用場景深度耦合。****離線階段--目前數字人產業正處于快速發展期間:離線渲染、非交互類型的數字人仍是主流,在數字化營銷、文娛等領域應用廣泛;AI驅動的數字人在行業服務中,虛擬分身數字人在虛擬空間中處于爆發前期。在線階段--伴隨數字人快速發展和大量使用,用戶將很快進入體驗突破階段,在此階段利用AI驅動提供初級的實時交互和實時渲染技術不斷突破在場階段--實時交互,更加智能的數字人,并結合更深的行業理解,帶來更真實的沉浸感和更大的價值。

****趨勢9:藝術和技術雙輪驅動,北京有望成為產業新高地。****作為科技產品,數字人需要技術研發、人工智能、產品設計、運營、融資環境等多方面人才,因此互聯網發展較好的區域,如北京、杭州、上海、深圳等互聯網和數字內容高地,將成為數字人產業的重要聚居地。在眾多因素中,藝術和科技是最強驅動力,北京藝術資源相對集中,擁有中國傳媒大學、中央美術學院頭部藝術類院校和專家資源;科技產業優勢突出,互聯網企業數量較多,聚集了大量技術研發、AI算法等方面的人才;同時政府高度重視數字人產業,第一個發布數字人發展政策。在產業和政策的推動下,有望成為數字人產業聚焦的新高地。


********趨勢10.:數字人版權保護及行業合規體系需同步建設,推動實現可用、可靠、可知、可控。****數字人行業總體還在快速發展階段,發展和生存是企業的重點和方向,數字人著作權、外觀設計專利、商標等知識產權保護體系亟待完善。面向未來,數字人會正朝幾個方向加速迭代:一是外貌更加精致,形象更加逼真,動作更加自然,即“皮囊更好看”,跨越恐怖谷效應后,會使人覺得數字人和真人無異,有利于建立良好的心理連接;二是隨著AI技術的不斷完善,數字人多模態感知和交互的能力會得到顯著提升,數字人未來有可能具備記憶力和判斷力,從而更加智能,行為和思想上更趨于接近人,擁有“有趣的靈魂”。此外,數字人產業的加速發展,也需要渲染、動捕等行業開發工具、云渲染等技術支持體系的進一步完善,從而大幅提升制作效能,有效降低制作時間和成本。目前,很多技術已經接近商業化大規模推廣的臨界點,數字人產業有望進入全真互聯的新階段:將可能作為我們的分身,成為數字世界的交互入口,為我們帶來更智能、更沉浸的“在場”體驗。

報告目錄如下:(一) 發展現狀1. 網紅數字人推動C端直觀認知和概念普及2. 融資事件頻繁及專項政策的出臺進一步加深對產業的認知3. 技術發展是數字人第一推動力4. Z世代用戶崛起,數字人和虛擬空間為互聯網原生一代提供新體驗5. 頭部企業從工具、平臺和應用多維度入局,引領數字人產業發展6. 標準制定引導產業規范發展**(二) 產業趨勢1. 價值定位:**數字人制造和運營服務的B端市場不斷擴大,將面向更廣大的C端用戶提供服務,各類數字人價值定位和商業模式有差異。**2. 技術迭代:**技術集綜合迭代驅動數字人形似人,制作效能將繼續提升。**3. AI賦能:**AI技術驅動數字人多模態交互更神似人,并逐步覆蓋數字人全流程。**4. 融合發展:**數字人技術與SLAM、3D交互、體積視頻、空間音頻等技術深度融合,渲染將從本地到云端。**5. 行業應用:**千行千面的數字人將成為人機交互新入口,但深度上仍需挖掘。**6. C端模式:**UGC數字人將加速出現,成為未來產業的增量空間。**7. 硬件載體:**數字人仍以2D顯示設備為主,3D顯示設備成為特定領域的新解法。**8. 發展路徑:**在場是數字人發展的高級階段,將與應用場景深度耦合。**9. 產業集聚:藝術和技術雙輪驅動,北京有望成為產業新高地。10. 合規前置:數字人版權保護及行業合規體系需同步建設,推動實現可用、可靠、可知、可控。(三) 應用案例1. 典型產品:**數字人播報SaaS工具、數字人UGC制作工具、數字人生產工具、快速數字分身生成工具、C端數字人直播工具、布料實時仿真工具、AI驅動數字人直播工具、視頻實時驅動產品、 AI 驅動業務中臺、虛擬空間產品2. **新型顯示:**AR眼鏡、裸眼3D屏幕、沉浸式裸眼3D交互3. **解決方案:**騰訊云數字人整體解決方案、中之人驅動直播方案、超寫實數字人制作方案、高品質數字人制作和直播方案4. **行業應用:金融、傳媒、文旅、云展廳、科教、泛娛、影視、市場營銷、公益**


付費5元查看完整內容
北京阿比特科技有限公司