欧美丰满大乳屁股流白浆,亚洲国产一区二区精品91,欧美亚洲日本国产黑白配看,国产乱码一卡二卡3卡4卡,亚洲欧美一区二区三区日本

Sora問世，視頻創作領域迎來“iPhone時刻”。2023年2月15日，OpenAI發布視頻生成大模型Sora，通過文本指令，Sora可以直接輸出長達60秒的高清視頻，包含高度寫實的背景、復雜的多角度鏡頭以及富有情感的多角色敘事，更為可貴的是，Sora生成的視頻表現出對于真實世界物理常識的深刻理解。部分媒體報道驚嘆——“Sora之后，現實將不再存在”。從本輪AI應用端發展實踐來看，以文本創作（小說、劇本）、圖像創作（繪畫、平面設計、攝影）、視頻創意（廣告、短視頻、傳統影視、游戲）為代表的創意創作領域因其高容錯率、高投入度，在AI浪潮之初就被市場廣泛認為將會成為最先被AI深刻賦能的產業之一；從本輪AI模型發展演繹來看，以ChatGPT為代表的文本創作以Midjourney、StableDiffusion為代表的圖像創作以Runway、Sora為代表的視頻創作的發展速度無疑是極為驚人的。我們認為，從文字到圖像到視頻，AI內容創作的信息升維越來越考驗模型的創作效率與生成結果的穩定性（早期版本的Midjourney存在生成時間長、生成結果違背物理常識或者“AI感”明顯的問題；RunwayGen-1/2也存在生成視頻時長較短且生成視頻邏輯連貫性較弱等缺陷），但正如MidjourneyV5/6已逐步廣泛實現多行業的商業化落地，我們認為Sora的問世有望推動著視頻創作領域的“iPhone時刻”到來。

　　Sora取法Tokens文本特征標記，是基于Patches視覺特征標記的DiffusionTransformer模型。OpenAI研究團隊從LLM中汲取靈感，認為LLM范式的成功在一定程度上得益于Tokens的使用，故而通過將視頻信息分解為帶有時空特征的Patches訓練了DiffusionTransformer模型。從訓練角度而言，基于Patches視覺特征標記對原生視頻進行采樣擴大了可用樣本的規模且省去了標準化樣本的步驟。從推理角度而言，基于原生視頻訓練的模型在生成新視頻方面改善了構圖和取景。OpenAI目前發布的Sora視頻大模型主要具備文生視頻、視頻編輯、文生圖三類功能，在文生視頻過程中，用戶通過輸入Prompt提示詞DALL·E生成圖像Sora生成視頻。　　　文生圖和文生視頻是當下AI應用端落地焦點，海外相關技術產品迭代迅速。據Discord，按邀請頁面流量排序的十大AI應用程序中，有5個是圖片生成應用程序，2個是音頻生成應用程序，2個是視頻生成應用程序，其中，Midjourney位列第一，Pika位列第二，圖片約占前10名流量的74%，視頻約占前10名流量的8%。文生圖領域，海外有Adobe（老牌創意軟件巨頭，現已發布下一代Firefly支持多種文生圖功能）、Midjourney（文生圖模型新銳，現已廣泛實現商業化落地）。文生視頻領域，海外有Pika（AI初創公司，支持一鍵生成3秒共計72幀視頻）、Runway（擁有最早商業化的T2V模型RunwayGen-2）。　　　國內推薦關注萬興科技和美圖公司等創意軟件龍頭投資機會。萬興于2023年9月宣布即將發布國內首個專注于以視頻創意應用為核心的百億級參數多媒體大模型“天幕”，具備一鍵成片、AI美術設計、文生音樂、音頻增強、音效分析、多語言對話等核心能力。2022年底至2023全年萬興對旗下T2V/I多款拳頭產品進行AI功能更新，AI賦能之下訂閱收入占比及訂閱續約率取得雙增。美圖公司于2023年12更新視覺大模型MiracleVision4.0，具備文生視頻、圖生視頻、視頻生視頻等多模態能力，AI賦能之下訂閱業務收入占比逐年增長。　

付費5元查看完整內容

相關內容

Sora

關注 14

Sora是OpenAI發布的一個AI模型，可以從文本指令中創建現實和想象的視頻。OpenAI發布首個文本生成視頻模型Sora，在生成視頻長度（60秒）和內容上表現突出，為AIGC發展過程中的一大里程碑事件，

AIGC · Sora · 視頻生成 ·

2024 年 3 月 6 日

[付費5元查看完整內容]2024AIGC視頻生成：Sora引領走向AI創生時代—視頻生成的技術演進、范式重塑與商業化路徑探索-甲子光年

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

?? Sora模型的發布標志著視頻生成領域的“GPT-3”時刻，預示著AI創生時代的來臨。?? AIGC技術將視頻制作流程從傳統模式轉變為“提示交互式”新范式，極大簡化了視頻生產。?? 長視頻與短視頻領域將迎來不同的AI應用進程，短視頻有望率先進入AI原生時代。?? AIGC視頻生成技術的發展將推動文娛產業迎來第二輪投資浪潮，特別是在底層技術和內容融合領域。?? 隨著AI技術的進步，視頻信息可能成為更優質的信息載體，推動全球文化與交流的互通互聯。

付費5元查看完整內容

Sora · 視頻生成模型 · Transformer ·

2024 年 2 月 26 日

[付費5元查看完整內容]Sora技術深度解析，21頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

Sora橫空出世引領多模態產業革命。美國時間2月15日，文生視頻大模型Sora橫空出世，能夠根據文本指令或靜態圖像生成1分鐘的視頻。其中，視頻生成包含精細復雜的場景、生動的角色表情以及復雜的鏡頭運動，同時也接受現有視頻擴展或填補缺失的幀。總體而言，不管是在視頻的保真度、長度、穩定性、一致性、分辨率、文字理解等方面，Sora都做到了業內領先水平，引領多模態產業革命。此外，當Sora訓練的數據量足夠大時，它也展現出了一種類似于涌現的能力，從而使得視頻生成模型具備了類似于物理世界通用模擬器的潛力。

　　拆解視頻生成過程，技術博采眾長或奠定了Sora文生視頻領軍地位。從技術報告中，Sora視頻生成過程大致由“視頻編碼+加噪降噪+視頻解碼”三個步驟組成，視頻壓縮網絡、時空patches、transformer架構、視頻數據集等技術與資源在其中發揮了重要作用。　　　視頻壓縮網絡：過往VAE應用于視頻領域通常需插入時間層，Sora從頭訓練了能直接壓縮視頻的自編碼器，可同時實現時間和空間的壓縮，既節省算力資源，又最大程度上保留視頻原始信息，或為Sora生成長視頻的關鍵因素，并為后續處理奠定基礎。　　　時空patches：1）同時考慮視頻中時間和空間關系，能夠捕捉到視頻中細微的動作和變化，在保證視頻內容連貫性和長度的同時，創造出豐富多樣的視覺效果；2）突破視頻分辨率、長寬比等限制的同時顯著提升模型性能，節約訓練與推理算力成本。　　　Transformer架構：1）相比于U-Net架構，transformer突顯Scaling Law下的“暴力美學”，即參數規模越大、訓練時長越長、訓練數據集越大，生成視頻的效果更好；2）此外，在transformer大規模訓練下，逐步顯現出規模效應，迸發了模型的涌現能力。　　　視頻數據集：Sora或采用了更豐富的視頻數據集，在原生視頻的基礎上，將DALL？E3的re-captioning技術應用于視頻領域，同時利用GPT保障文字-視頻數據集質量，使得模型具有強大的語言理解能力。

付費5元查看完整內容

Sora · 視頻生成模型 ·

2024 年 2 月 23 日

[付費5元查看完整內容]Text-to-Video的GPT-3時刻已來：OpenAI的SORA模型引領新技術突破

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

OpenAI發布了最新文生視頻大模型SORA，可以生成1分鐘長視頻，效果顯著，在生成的視頻細節，內容一致性和指令遵循能力獨樹一幟　　2月16日，OpenAI首次對外公布了SORA文生視頻模型，SORA模型可以直接輸出長達60秒的視頻，并且包含高度細致的背景、復雜的多角度鏡頭，以及富有情感的多個角色。相比較而言，Runway Gen2、Pika等AI視頻工具，都還在突破幾秒內的連貫性，而OpenAI，已經達到了史詩級的紀錄。OpenAI目前已經邀請了一支專業的創意人士測試，用于反饋其在專業環境中的實用性。　　SORA模型在訓練中將不同類型視覺素材統一為時空Latent Patch，采用Diffusion-transformer結構并大規模訓練，再次展現“暴力美學” 　　從technical report窺探技術路徑，OpenAI在文生視頻領域再次展現“暴力美學”，SORA在模型結構上使用了Diffusion Transformer結構，采用了大規模的訓練，在數據上將圖片和視頻統一壓縮轉換為時空Latent Patches并作為transformer輸入，而這一步也使得模型能夠在不同分辨率、持續時間和寬高比的視頻/圖像數據上進行訓練，同時為了提高模型的理解能力，SORA使用了DALL-E3模型中的re-captioning技術，訓練了一個caption模型為視頻數據生成文字字幕。　　SORA模型已具備了一定的涌現能力，雖然也存在“幻覺問題”，但我們認為文生視頻的GPT-3時刻已來　　SORA模型現在可用于視頻生成，圖片生成，視頻編輯、視頻鏈接和視頻前后拓展等，我們認為未來有望重塑影視/動畫/自媒體等諸多視頻生產行業，同時SORA還展現出了一定的涌現能力，使其能夠從物理世界模擬人、動物和環境的某些方面，包括3D連續，物體持續和long-range的連貫性，我們預計未來SORA也會逐步進化，如同GPT3到4一樣有更強的能力，或許文生視頻的GPT-3時刻已經到來。　

付費5元查看完整內容

ChatGPT · GPT-4視覺大模型 ·

2023 年 9 月 26 日

[付費5元查看完整內容]ChatGPT升級更新：多模態將上線，能說會看了，GPT-4視覺大模型發布，附論文

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

轉載機器之心報道 編輯：澤南、蛋醬、陳萍打字都不需要了。我們都說大模型會改變所有應用的形態，ChatGPT 現在走完了變革的最后一步。

剛剛，ChatGPT 進行了一次重要更新，不管是 GPT-4 還是 GPT-3.5 模型，現在都可以基于圖像進行分析和對話了。

ChatGPT 中的新圖像識別功能允許用戶使用 GPT-3.5 或 GPT-4 模型上傳一張或多張圖像配合進行對話。OpenAI 在其宣傳博客文章中聲稱該功能可用于各種日常應用：從通過拍攝冰箱和食品儲藏室的照片來讓 AI 決定晚餐吃什么，到排除燒烤爐無法啟動的原因。OpenAI 還表示，你可以使用設備的觸摸屏圈出他們希望 ChatGPT 關注的圖像部分。

就像這個視頻所演示的，用戶能夠詢問如何升起自行車座椅，需要提供的是照片、使用手冊和用戶工具箱的圖片。然后，ChatGPT 會做出反應并建議用戶如何完成這一過程。

OpenAI 還表示，ChatGPT 的移動端 App 還將添加語音合成選項，與現有的語音識別功能配合使用時，我們就能與人工智能助手進行完全直接的口頭對話。

與此同時，在音頻方面，ChatGPT 新的語音合成功能據說由 OpenAI 所稱的「新文本到語音模型」驅動，盡管文本到語音問題已經解決了很長時間。該公司表示，該功能推出后，用戶可以在應用設置中選擇語音對話，然后從「Juniper」、「Sky」、「Cove」、「Ember」和「Breeze」等五種不同的合成聲音中進行選擇。OpenAI 表示，這些聲音都是與專業配音演員合作制作的。

這讓人想起了 OpenAI 2022 年開源的語音識別系統 Whisper，今后這一系統將繼續處理用戶語音輸入的轉錄工作。自 ChatGPT iOS 應用程序今年 5 月推出以來，Whisper 就一直集成在其中。 OpenAI 計劃「在未來兩周內」向 Plus 和 Enterprise 訂閱者推出 ChatGPT 中的這些功能，它還指出，語音合成僅適用于 iOS 和安卓端應用，不過圖像識別功能在網絡界面和移動應用程序上均有提供。鑒于 ChatGPT 的數億用戶們還沒有親自測試過這些功能，所以我們還不能判斷它的效果如何。而且對于它的工作原理，OpenAI 也和以往一樣沒有詳細說明，僅著重強調了大模型的安全性。

參考同類的 AI 研究可以推測，多模態 AI 模型通常會將文本和圖像轉換到一個共享的編碼空間，從而使它們能夠通過相同的神經網絡處理各種類型的數據。OpenAI 可以使用 CLIP 在視覺數據和文本數據之間架起一座橋梁，將圖像和文本表征整合到同一個潛在空間（一種矢量化的數據關系網）中。這種技術可以讓 ChatGPT 跨文本和圖像進行上下文推理。

今年 3 月，OpenAI 上線 GPT-4 ，展示了 AI 模型的多模態功能，在現場演示時，我們見識到了 GPT-4 對文本和圖像的處理能力，但一直以來，這種功能普通用戶都無法使用。相反，OpenAI 在與 Be My Eyes （是一款為盲人和弱視人士提供免費移動應用程序）的合作中創建了一款可以為盲人解讀場景照片的應用程序。

然而，由于隱私問題導致 OpenAI 的多模態功能至今未能發布。

最近幾周，科技巨頭一直在競相推出多模態方面的更新，將更多 AI 驅動的工具直接集成到核心產品中。谷歌上周宣布對其 ChatGPT 競爭對手 Bard 進行一系列更新，同樣在上周，亞馬遜表示將為其語音助手 Alexa 帶來基于生成式 AI 的更新。

在最近 ChatGPT 更新公告中，OpenAI 指出了對 ChatGPT 進行功能擴展的一些限制，并承認存在潛在的視覺混淆（即錯誤識別某些內容）以及視覺模型對非英語語言的不完美識別等問題。OpenAI 表示，他們已經在極端主義和科學能力等領域進行了風險評估，但仍然建議謹慎使用，尤其是在高風險或科學研究等專業環境中。

鑒于在開發上述 Be My Eyes 應用程序時遇到的隱私問題，OpenAI 指出，他們已經采取了技術措施，以限制 ChatGPT 的能力，這些系統應該尊重個人隱私。

盡管存在缺陷，但 OpenAI 仍然賦予了 ChatGPT「看、聽、說」的能力。然而，并不是所有人都對這一更新感到興奮。Hugging Face AI 研究員 Sasha Luccioni 博士表示，「我們應該停止像對待人類一樣對待 AI 模型。ChatGPT 擁有看、聽、說的能力是不被允許的。但它可以與傳感器集成，以不同的方式來提供信息。」

新能力上線之后，人們紛紛表示歡迎，有人表示這是 ChatGPT 迄今為止最大的變革之一，就差套個機器人的物理外殼了。

在 AI 研究領域，人們也開始分析起新版 ChatGPT 背后的技術。從 OpenAI 自己公開的簡短文檔看，是有一個名為 GPT-4V (ision) 的新款大模型。

文檔鏈接：//cdn.openai.com/papers/GPTV_System_Card.pdf 英偉達研究員 Jim Fan 認為 GPT-4V 是一個整體模型。與之對應的是，谷歌的 Bard 是一個二階段模型，首先應用 Google Lens API 進行圖像字幕，然后使用純文本 LLM 進行更多推理。 OpenAI 表示，與 GPT-4 類似，GPT-4V 的訓練是在 2022 年完成的，在 2023 年 3 月開始提供系統的早期訪問。由于 GPT-4 是 GPT-4V 視覺功能背后的技術，因此其訓練過程也是一樣的。目前看來，GPT-4V 于 2022 年完成訓練之后，一直在經歷安全性測試。從 OpenAI 公布的文檔中我們可以總結出：

GPT-4V 仍然是（視覺，文本）到文本模型，使用互聯網圖像和文本數據的混合進行訓練并預測下一個單詞 token，然后再用 RLHF。
今天的 GPT-4V 具有比 3 月份版本更好的 OCR（從像素讀取文本）能力。
安全限制：GPT-4V 在許多類別中的拒絕回答率很高。例如，當被要求回答敏感的人口統計問題、識別名人、從背景中識別地理位置以及解決驗證碼時，它現在會說「抱歉，我無能為力」。
一種簡單的技術是將圖像翻譯成幾個單詞（例如「殺人」的刀的圖片），然后應用純文本 GPT-4 過濾器加以識別。
多模態攻擊：這是一個有趣且新穎的方向。例如，你可以上傳惡意提示的屏幕截圖（例如 Do-Anything-Now，臭名昭著的「DAN」提示）。或者在餐巾紙上畫一些神秘的符號來以某種方式停用過濾器。
在嚴肅的科學文獻（如醫學）中，GPT-4V 仍然會產生幻覺，部分原因是 OCR 不準確。所以再次強調，不要接受任何 GPT 的醫療建議！

不過有人表示，看起來 Bard 對于圖像的識別準確率比 ChatGPT 要高。有關新技術的貢獻者，OpenAI 副總裁 Peter Welinder 本次特別感謝了工程師 Raul Puri。此外，多模態 ChatGPT 的主要貢獻者還包括 Hyeonwoo Noh、Jamie Kiros、Long Ouyang、Daniel Levy、Chong Zhang、Sandhini Agarwal 等人。

參考內容：

付費5元查看完整內容

大模型 · 人工智能 ·

2023 年 7 月 20 日

[付費5元查看完整內容]AI大模型賦能千行百業（附下載，117頁）

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

AI+辦公方面，隨著ChatGPT火爆全球，基于對圖像、視頻、音頻等進行處理的多模態大模型的應用也得到快速推廣。微軟已推出Microsoft 365 Copilot為用戶辦公模式帶了個革命式的變化，國產廠商也奮起直追，其中金山辦公是國內辦公軟件廠商探索AI技術應用的先行者之一，接入多個大模型供應商，可更精準滿足用戶AI創作需求。

AI全方位賦能，掀起內容創新浪潮。在游戲行業中，AI能夠幫助用戶體驗再升級，并助力大眾創作降本增效；在教育行業，智能教育邁向因材施教階段，AI服務在學生、教師兩端均有落地；在影視行業，AI可以助力特效內容生成；在電商行業，從產品上架到售后服務，AIGC將多方位賦能品牌商家；在營銷行業，創意文案能夠通過AI迅速生成，實現千人千面個性化推薦。

付費5元查看完整內容

生成式AI · 大模型 · GPT-4 ·

2023 年 6 月 16 日

[付費5元查看完整內容]生成式AI實踐報告，48頁pdf

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

大模型主導的生成式AI，尤其是GPT-4的發布，讓人類社會看到了通用人工智能時代的曙光。這意味著，經過“大工業化”的高效預訓練后，具備了強大的泛化能力，能夠在眾多領域像人類一樣進行思考、解決問題，并進行持續、快速的自我進化，大模型主導的生成式AI，將擁有極為廣闊的應用前景，有望賦能千行百業。未來，每個行業都將再進行一次智能化改造！

在政策層面，中央首次提到通用人工智能，為AIGC產業的發展提供了積極政策環境。

技術層面，作為AIGC生態的核心，大模型本身可根據可交互對象分成文本、音頻、圖像、視頻等不同模態以及跨模態，更多的模態，則意味著更多的交互和應用場景組合。我國AIGC產業目前尚處于發展初期，各模態技術發展進度不盡相同。目前，以文本生成、音頻生成應用相對廣泛。

當前，在應用層面，縱向看，在垂直應用方向上，傳媒、教育、營銷、客服、數字人等數字化程度更高、容錯率相對較高的領域先行先試；橫向看，在價值鏈角度，主要集中于技術嘗鮮、組織內部的提效降本，下一步將朝著終端用戶側的價值創造及傳遞場景展開。

圖片報告關鍵發現

大模型支撐的生成式AI，讓人類社會有望步入通用人工智能時代，擁有廣闊的應用前景，有望賦能千行百業。當前生成式AI的落地整體處于初級階段，不同模態的落地時間表差異明顯，企業需求主要集中在數字化程度高、容錯率相對較高的領域，以借助中間件調用大模型能力為主要方式。數字內容產業、客戶服務是生成式AI滲透的典型行業和場景。 AIGC+數字內容：數字經濟快速發展，帶來國內數字內容消費需求的持續快速增長，但國內數字內容產業面臨需求變化快、供給側內容整體過剩而優質供給不足的問題。以長音頻數字內容生產為例，AIGC能夠助力內容生產的工程化、高質量、個性化。 AIGC+客戶服務：大模型依托自身強大泛化能力優勢，有望給國內智能客服領域的服務前、服務中、服務后各環節帶來效能提升。但由于存在效果不明、數據安全等問題，短期內大模型很難對現有智能客服體系實現完全替代和顛覆，廠商需要探索如何在融合大模型能力的同時實現模式突破。

付費5元查看完整內容

ChatGPT · 大模型 ·

2023 年 3 月 8 日

[付費5元查看完整內容]【ChatGPT系列報告】國內大模型概覽，42頁ppt

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

自ChatGPT推出以來，國內學術界和科技企業相繼宣布或將推出類似機器人對話模型，有望推動大模型發展。2月7日，百度官宣“文心一言”。2月20日，復旦大學發布了類ChatGPT模型“MOSS”，并面向大眾公開邀請內測，國產大模型有望迎來爆發式增長。　　需求和政策兩方面，合力推動AI產業增長。國內應用層面的需求推動AI產業的加速發展。根據IDC數據預測，2021年中國人工智能軟件及應用市場規模為51億美元，預計2026年將會達到211億美元。數據、算法、算力是AI發展的驅動力，其中數據是AI發展的基石，中國數據規模增速有望排名全球第一。政策方面，“十四五”規劃中提到“瞄準人工智能”，“聚焦人工智能關鍵算法”，加快推進“基礎算法”的“突破與迭代應用”；北京、上海、廣州等城市發布相關規劃。　　頭部企業采取“模型+工具平臺+生態”三層共建模式，有助于業務的良性循環，也更容易借助長期積累形成競爭壁壘。大模型廠商主要包括百度（文心大模型）、騰訊（HunYuan大模型）、阿里（通義大模型）、商湯、華為（盤古大模型）等企業，也有智源研究院、中科院自動化所等研究機構，同時英偉達等芯片廠商也紛紛入局。大模型增強了AI技術的通用性，助力普惠AI的實現。未來，大模型有望于場景深度融合，配合專業工具和平臺支持應用落地，開放的生態來激發創新，形成良性循環。　　技術發展有望促進生產效率提升，并進一步創造新的消費和需求，有利于文娛內容和互聯網行業。在AIGC和ChatGPT方面，我們建議持續關注技術發展和應用情況，把握技術催化和商業化落地帶來的投資機會：1）具備AIGC和ChatGPT的技術探索和應用的公司：百度集團-SW、商湯-W、萬興科技、拓爾思等；2）具有海量內容素材且具有AIGC探索布局的，圖片/文字/音樂/視頻內容及平臺公司騰訊控股，閱文集團、美圖公司、昆侖萬維、湯姆貓、神州泰岳、視覺中國、中文在線、漢儀股份、天娛數科、風語筑等。

付費5元查看完整內容

ChatGPT · 算力 · 報告 ·

2023 年 3 月 1 日

[付費5元查看完整內容]【ChatGPT系列報告】算力、數據與模型綜合分析，46頁Slides

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

ChatGPT帶火AIGC，OpenAI引領技術和生態。2022年11月，由OpenAI開發的聊天機器人ChatGPT推出并席卷了整個行業，其引入人類反饋的強化學習和監督學習訓練方法，具備優秀的聊天對話、文案創作、代碼編寫等功能，且得到了微軟的傾力支持，成為史上用戶增長最快的消費應用。聚焦國內，百度在大模型領域積累深厚，總體水平處于行業前端，其創新性引入大規模知識圖譜，模型性能得到大幅提升，公司近期宣布其“文心一言”產品將于2023年3月完成內測并面向公眾開放，下游關注度極高，目前已經得到新聞傳媒、互聯網、金融等多個行業客戶的廣泛支持。

　　變革：AIGC與人更為神似，模型和數據是主要助力。AIGC實現了從分析內容到創造生成新內容的跨越，而模型、數據集、算力、應用是催生AI技術新范式的重要因素。在模型方面，Transformer預訓練大模型為生成式AI帶來了里程碑式飛躍，其中OPENAI發布的GPT系列大模型掀起AIGC熱潮，尤其是ChatGPT火爆出圈。在數據集方面，數據量、多樣性、數據質量是訓練數據集的關鍵要素。　　市場：大模型需要大算力，推動AI服務器市場增長。大模型的實現需要十分強大的算力來支持訓練過程和推理過程，根據OPENAI數據，訓練GPT-3175B的模型，需要的算力高達3640PF-days。ChatGPT的訓練成本和推理成本高昂。我們認為，隨著模型的迭代和AI芯片廠商產品的迭代，ChatGPT的訓練成本和推理成本未來必將呈現下降趨勢。但一次訓練百萬美元量級的訓練成本和每天百萬美元量級的推理成本，隨著全球和中國人工智能廠商布局大模型，大模型將為全球和中國AI芯片和AI服務器市場的增長提供強勁動力。根據我們的估算，大模型將為全球和中國AI服務器市場帶來約910.44億美元和345.50億美元的市場空間。市場空間巨大，相關芯片和服務器廠商將深度受益此次ChatGPT浪潮。　　應用：行業將逐步回歸理性，能否突破需要看B端。未來2-3年是行業應用落地的關鍵時段，AIGC在經歷了近期的炒作熱潮結束之后，預計將經歷一段下沉期，市場趨向理性。期間，AIGC需要加快教育和融入市場，培育產品和應用。其中，B端是AIGC含金量最大的市場，AIGC需將技術轉化成工具和解決方案，為企業和行業賦能。其中，文本、圖像生成以及類聊天機器人等產品在B端都有較大應用潛力，游戲、金融和快消等市場有望率先取得進展。

付費5元查看完整內容

ChatGPT ·

2023 年 2 月 20 日

[付費5元查看完整內容]【ChatGPT系列報告】為人形機器人注入“靈魂”

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

　ChatGPT憑實力“出圈”。ChatGPT是一款對話式AI聊天機器人，由微軟旗下的人工智能研究實驗室OpenAI于2022年11月30日發布。它能寫論文、編代碼、寫小說，甚至知道繞開人類提問中預設的價值判斷、道德傾向等陷阱。ChatGPT一經推出，就在人工智能生成內容（AIGC）領域引起轟動，被評價聰明得“像人類”。

　　“人形機器人”與“AI”的關系已密不可分。人形機器人離不開機器視覺與神經網絡，前者通過目標追蹤、圖像描述、場景理解等生成數據，后者模仿人腦對生成的數據進行算法處理，從而令人形機器人完成各自任務，而無論是機器視覺或神經網絡都與AI息息相關。AI已成為人形機器人的核心。

　　ChatGPT助力AI快速實現技術平臺化和應用場景化。ChatGPT與以往的AI工具擁有諸多“共性”，但又具備獨特的“個性”。1）ChatGPT的“自然語言處理”采用了一種用于處理序列數據的模型，使其交互能力和學習能力得到加強。這意味著它與人類互動越多，“成長”越快，隨著時間推移對用戶提出的同一問題能做出不同或更靠譜的解答。2）ChatGPT使用大量語料庫作為訓練，它能更好地理解人類語言，避免“人工智障”的詬病。約有40名全職AI訓練師在多年時間內給ChatGPT“投喂”了3000億個單詞的語料。3）一般的對話型AI具備特定用途（例如某一組織的對內對外服務），而ChatGPT則試圖完成“幾乎任何語種“的任務。

　　ChatGPT或帶來人形機器人下一拐點。人形機器人是一個多任務、通用型機器人平臺，未來它在工業生產、社會服務等領域將有非常多的應用場景。ChatGPT基于OpenAI公司開發的一個GPT-3.5架構的大型語言模型，通過強化學習訓練人工智能聊天機器人程序，能夠廣泛應用于業界和客戶服務，基于Transformer架構的強大算力的語言模型，具有深度學習特質，葆有出色的語言理解和文本對話生成能力，ChatGPT的語言理解和生成水平的便捷性或帶來人形機器人下一拐點。　

付費5元查看完整內容

ChatGPT · AIGC ·

2023 年 2 月 9 日

[付費5元查看完整內容]ChatGPT與AIGC深度報告：引領AI新浪潮，AIGC商業化啟程

專知會員服務

專知，提供專業可信的知識分發服務，讓認知協作更快更好！

ChatGPT引領AI技術新一輪熱潮，預示著NLP技術有望迅速進入平民化應用時代。2022年11月30日，OpenAI公司上線了聊天機器人模型ChatGPT，迅速引發了全球的熱潮。ChatGPT是一種預訓練的語言大模型，采用大量的參數和大量的數據進行訓練，基于人類反饋的強化學習算法，將NLP技術和機器學習結合，極大地提升了模型算法的效率和能力。隨著ChatGPT的熱度不斷攀升，多家科技公司都開始布局ChatGPT相關技術領域，NLP技術有望迅速進入平民化應用時代。

　　ChatGPT具有良好的商業價值，未來應用空間廣闊。ChatGPT相關技術不僅對眾多的C端應用帶來革新，同時也將對B端應用產生重大影響，企業數字化轉型有望真正從數字化走向智能化，ChatGPT在企業辦公中的應用，具備很大的想象空間。我們認為，協同辦公類應用作為企業各類應用的入口，同時具備知識管理、流程引擎等功能，具備很強卡位價值，在把ChatGPT技術引入后，可以極大提升產品的功能與應用體驗。員工僅需給出想要辦理的流程，由ChatGPT進行智能化辦理，從而改變過去員工需要自行在OA、ERP及業務系統中完成信息錄入、功能查找、業務辦理的現狀，將極大地提升辦公效率和使用體驗。目前微軟已經將ChatGPT應用到了Dynamics365、Teams等產品線，未來將要應用到Bing搜索中，未來的商業價值空間十分可觀。　　　AIGC有望成為未來人工智能的重要方向，商業化模式仍需摸索。AIGC即人工智能內容生成，ChatGPT就是典型的文本生成式的AIGC，其目前的成功也有望帶動AIGC在圖像、音樂、視頻等其他領域落地。Gartner曾多次將生成式AI列為未來的重要技術趨勢，是當下最引人注目的人工智能技術之一。據Gartner預計，到2025年，生成式人工智能將占所有生成數據的10%，而目前這一比例還不到1%。隨著ChatGPT開啟付費訂閱試點，AIGC的商業化進程正式拉開帷幕。據量子位報告統計，到2030年，AIGC的市場規模將超過萬億人民幣，但由于AIGC目前產業化程度有限，大量業務場景尚未成功變現，商業模式也還處于探索階段。我們認為，在當下時點，AIGC基于其出色的降本增效能力，在企業級市場的應用前景較為明朗和穩定，在C端消費市場的商業模式仍需進一步摸索。