亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

生成式AI和ChatGPT有可能通過提高效率、增強創新力和實現更個性化的體驗,來改變行業和社會。如果你是一個希望在這個快速發展的數字時代保持領先地位,并利用它的潛力的人,那么這本書就是為你準備的。這本書全面介紹了生成性AI和ChatGPT,這些是近期引起廣泛關注的尖端技術。本書旨在對這些技術、架構和訓練方法進行深入理解,包括它們的背景、開發過程和現狀。這本書幫助探索這些技術已經實施以實現可測量益處的創新方式,包括提高效率、客戶滿意度、安全性和收入增長,以及它在不同行業和使用案例中的潛在應用。在接近尾聲時,這本書提供了關于這些技術的重大改進和進步的見解。它還幫助你確定有可能在不久的將來增強ChatGPT能力的進一步研究和開發的多個領域。你將學到什么

● 探索不同行業和領域如何使用ChatGPT。 ● 了解內容創作者和營銷行業如何從使用ChatGPT中受益。 ● 學習如何從ChatGPT的問題解決能力中受益。 ● 了解ChatGPT如何在各種編碼領域中使用。

這本書適合誰這本書適合對AI及其在商業世界中的實際應用感興趣的個人和團體。商業領導者、企業家、研究人員、學者、數據科學家、機器學習工程師以及在AI領域工作的其他專業人士都可以從本書對最新技術進步的深入了解以及如何利用它們實現業務目標的洞察中找到價值。

Table of Contents

  1. Introduction to ChatGPT
  2. History Of Generative Models
  3. Generative AI in Banking and Finance
  4. Regulatory and Legal aspects of Generative AI
  5. Generative AI and ChatGPT for Government Departments
  6. Authenticity AI generated content
  7. ChatGPT Technical Overview: Introduction
  8. Brief of top other NLP models
  9. Historical flow and development of GPT series
  10. API Pricing model and technical limitations of ChatGPT
  11. Customer Journey in ChatGPT free version UI
  12. Use Cases in Modern Era: Introduction
  13. Use case in Content-marketing
  14. Education and e-learning abilities
  15. Use case in Entertainments purposes
  16. Potential of ChatGPT in Coding and Programming
  17. Problem solving abilities (Quantitative)
  18. Problem solving abilities (Qualitative)
  19. Use cases Financial Industry
  20. Use cases in Healthcare Industry
  21. Use cases in E-commerce Industry
  22. Use cases in Hospitality Industry
  23. Problem solving abilities of ChatGPT
  24. How beginner start ChatGPT for problem-solving
  25. ChatGPT for National Cyber Security and TechnoPolicy
  26. Use cases in edtech industry
  27. Potential of ChatGPT in Research work
  28. Potential of ChatGPT in Coding and Programming
  29. Recent advancements that are made in ChatGPT
  30. ChatGPT and the market right now
  31. Generative AI and Chatgpt Help India G20 Summit
  32. GPT- 4
  33. Future scope of ChatGPT
付費5元查看完整內容

相關內容

在日常生活中使用人工智能的基本指南《ChatGPT 革命》是一本深入淺出的指南,旨在幫助您解鎖AI工具ChatGPT的潛力。我們正處于一個AI革命的邊緣...但這對你意味著什么?現在是時候探索最新技術如何幫助您處理日常工作和生活中的瑣事了!無論您是被重復的、耗時的任務壓垮,還是簡單地尋找新的創意注入,ChatGPT 都是那個能助你一臂之力的虛擬助手。通過這本必備手冊,您將了解ChatGPT如何快速而輕松地將您的待辦事項變成已完成的清單。從幫助您撰寫電子郵件和報告,到規劃您的下一頓飯或假期,ChatGPT為簡化您的日常任務和職責提供了一種新方法。《ChatGPT 革命》向您清楚地展示如何使用這項創新技術來節省時間和減少壓力。作者和備受贊譽的生產力專家Donna McGeorge分享實用建議和有趣想法,為您解讀所有您需要了解的內容。了解人工智能如何已經應用于日常生活 - 以及像ChatGPT這樣的工具是如何改變工作和生活管理的未來 理解ChatGPT能夠執行的不同任務,以及何時以及如何最有效地使用它 獲得編寫智能、具體的提示和跟進查詢的分步建議,以獲得更好的結果 通過有趣的示例、建議和活動變得充滿好奇心和高效,掌控局面,激活您的工作流程,并克服拖延和創造力障礙 無論您是一個繁忙的專業人士,還是只是想解決那個令人畏懼的問題“今晚吃什么?”,《ChatGPT 革命》揭示了如何使用ChatGPT作為簡化生活的工具。AI技術的發展勢頭強勁:這是您加入革命的邀請。拿起這本書,學習如何駕馭AI的力量,以便為真正重要的事情騰出更多時間和精力。

付費5元查看完整內容

這本書將展示生成技術如何運作及其驅動力。同時也會探討其應用 - 展示各種創業公司和大公司在這個領域正在做些什么。還將著眼于挑戰和風險因素。在過去的十年中,公司已經在AI上投入了數十億。但是,重點一直放在將這項技術應用于預測上 - 這就是所謂的分析型AI。這可能意味著你會收到你無法抵擋的TikTok視頻。或者,分析型AI可以防范垃圾郵件或欺詐,或預測包裹何時會被送達。盡管這些都有利,但AI的潛能遠不止于此。下一個大趨勢將是利用這項技術來創新。例如,你可以拿一本書,AI模型將以極低的成本將其轉化為電影。這都是生成型AI的一部分。雖然現在還處于起步階段,但進展非常快。生成型AI已經能夠創建吸引人的博客帖子、社交媒體信息、美麗的藝術作品和引人入勝的視頻。這項技術的潛力巨大。它將對銷售、營銷、法律、產品設計、代碼生成,甚至藥物制造等許多類別都有用。你將了解到理解生成型AI的重要性該技術的基礎知識,如基礎和擴散模型生成型AI應用如何運作生成型AI將如何影響各種類別,如法律、營銷/銷售、游戲、產品開發和代碼生成。風險、缺點和挑戰。這本書適合誰這本書主要面向的是沒有技術背景的專業人士。比如,美國的企業界(如經理)以及科技初創公司的人們,他們需要理解生成型AI,以評估解決方案。

付費5元查看完整內容

//www.pearson.com/en-us/subject-catalog/p/the-ai-revolution-in-medicine-gpt-4-and-beyond/P200000011399/9780138200138 人工智能即將改變醫學。這是你現在需要知道的。 “人工智能的發展與個人電腦的發明一樣具有根本性。它將改變人們工作、學習和交流的方式,并改變醫療保健。但必須謹慎管理,以確保其利大于弊。看到人工智能在醫學領域的機會和責任的早期探索,我感到很鼓舞。” ——比爾蓋茨 就在幾個月前,數以百萬計的人被ChatGPT驚人的能力和怪異的幻覺所震驚。但那是在2022年。GPT-4現在就在這里:更智能,更準確,具有更深入的技術知識。GPT-4及其競爭對手和追隨者即將改變醫學。但在生命攸關的情況下,你需要了解這些技術。 他們能做什么?他們還不能做什么?他們有什么不該做的?要做出決定,請親自體驗最前沿的技術。請加入三位提前幾個月接觸過GPT-4的業內人士,因為他們揭示了GPT-4的巨大潛力——改善診斷、總結患者訪問、簡化流程、加速研究等。您將看到真實的GPT-4對話——未經排練和未經過濾,精彩和笨拙都一樣——都配有寶貴的上下文、坦率的評論、真實的風險洞察和最新的收獲。 用真正的人工智能助手預覽醫生的一天生活。 看看人工智能如何增強醫生和病人在床邊或更遠的會面。 了解現代人工智能是如何工作的,為什么它會失敗,以及如何通過測試來贏得信任。 增強患者的權能:改善可及性和公平性,填補護理空白,并支持行為改變。 通過“即時工程”提出更好的問題并得到更好的答案。 利用人工智能來減少浪費、發現欺詐、簡化報銷和降低成本。 與AI作為研究合作者優化臨床試驗并加速治愈。 找到正確的護欄,為監管機構和政策制定者提供關鍵見解。 描繪可能的未來:接下來會有什么夢想? 從未有過這樣的技術。無論你是醫生、病人、醫療保健負責人、支付人、政策制定者還是投資者,人工智能都將深刻影響你,它可能會決定你的生死。通過這本書,你要見多識廣,做好準備,負起責任。

付費5元查看完整內容

關于ChatGPT的一切,讀這篇論文就行了!

OpenAI最近發布了GPT-4(又名ChatGPT plus),這被證明是生成式AI (GAI)的一小步,但卻是通用人工智能(AGI)的一大步。自2022年11月正式發布以來,ChatGPT憑借媒體的廣泛報道迅速吸引了眾多用戶。這種前所未有的關注也促使眾多研究者從各個方面對ChatGPT進行研究。據谷歌scholar統計,有500多篇文章的標題中有ChatGPT或在摘要中提到它。考慮到這一點,迫切需要進行調研,我們的工作填補了這一空白。首先對ChatGPT的底層技術、應用以及面臨的挑戰進行了全面的綜述。對ChatGPT如何演變為實現通用AIGC(即AI生成內容)的前景進行了展望,這將是AGI發展的一個重要里程碑

1. 引言

過去幾年見證了大量生成式AI (AIGC,又稱AI生成內容)工具的出現[73,135,141],這表明AI已經進入了一個創造而不是純粹理解內容的新時代。關于生成式AI (AIGC)的完整調查,讀者可以參考[214]。在這些AIGC工具中,2022年11月發布的ChatGPT引起了前所未有的關注。它吸引了眾多用戶,月活躍用戶在短短兩個月內就突破了1億,打破了其他社交產品的用戶增長記錄[118]。ChatGPT是由OpenAI開發的,它最初是一個非營利性研究實驗室,使命是構建安全有益的人工通用智能(AGI)。OpenAI在2020年宣布GPT-3后,逐漸被公認為世界領先的AI實驗室。最近,它發布了GPT-4,這可以被視為生成AI的一小步,但對于AGI來說是一大步。

由于其令人印象深刻的語言理解能力,許多新聞文章提供了廣泛的報道和介紹,舉幾個例子,BBC Science Focus [69], BBC news [39], CNN Business [79], Bloomberg news[157]。谷歌管理層針對ChatGPT的威脅發布了“紅色警報”,暗示ChatGPT對公司,尤其是其搜索服務構成了重大威脅。在微軟將ChatGPT引入必應(Bing)搜索服務之后,這種危險似乎更難被忽視。股價的變化也反映出微軟相信ChatGPT可能會幫助必應與谷歌搜索競爭。這種對ChatGPT前所未有的關注,也促使眾多研究人員從各個方面對這個有趣的AIGC工具進行研究[149,163]。根據我們在谷歌scholar上的文獻綜述,不少于500篇文章在標題中包含ChatGPT或在摘要中提到這個病毒式的術語。如果沒有一個完整的調查,讀者很難掌握ChatGPT的進展。我們的全面綜述及時提供了對ChatGPT的初步了解

由于本次綜述的主題可以看作是一個商業工具,因此我們首先介紹了開發ChatGPT的公司OpenAI的背景。此外,本綜述還對ChatGPT的功能進行了詳細的討論。在背景介紹之后,本工作總結了ChatGPT背后的技術。具體來說,我們介紹了它的兩個核心技術:Transformer架構和自回歸修飾,在此基礎上,我們給出了大型語言模型GPT從v1到v4的技術路徑[18,122,136,137]。強調了突出的應用和相關的挑戰,如技術限制、濫用、倫理和監管。最后,我們對ChatGPT未來如何演變為通用AIGC以實現AGI的最終目標進行了展望,從而總結了本調查。我們工作的結構化概述如圖1所示。

2 ChatGPT概述

首先,我們提供了ChatGPT的背景和相應的組織,即旨在構建人工通用智能(AGI)的OpenAI。期望AGI能夠解決人類層面的問題以及超越人類層面的問題,前提是建立安全、可信、有益于我們社會的系統。

2.1 OpenAI

OpenAI是一個研究實驗室,由一組致力于構建安全和有益AGI[50]的研究人員和工程師組成。它成立于2015年12月11日,由一群備受矚目的科技高管組成,包括特斯拉CEO Elon Musk, SpaceX總裁Gwynne Shotwell, LinkedIn聯合創始人Reid Hoffman,以及風險投資家Peter Thiel和Sam Altman[78]。在這一小節中,我們將討論OpenAI的早期發展,它是如何成為一個營利性組織的,以及它對AI領域的貢獻。 OpenAI最初是一個非營利組織[24],其研究主要集中在深度學習和強化學習、自然語言處理、機器人等方面。在發表了幾篇有影響力的論文[123]并開發了一些最復雜的人工智能模型后,該公司很快就因其前沿研究而建立了聲譽。然而,為了創造能夠帶來資金的人工智能技術,OpenAI在2019年被重組為營利性公司[31]。盡管如此,該公司在為其技術創建商業應用的同時,繼續開發合乎道德和安全的人工智能。此外,OpenAI還與幾家頂級科技公司合作,包括微軟、亞馬遜和IBM。今年早些時候,微軟透露了與OpenAI的一項為期數年、價值數十億美元的新合資項目[21]。雖然微軟沒有給出確切的投資金額,但Semafor聲稱微軟正在討論花費100億美元[101]。據《華爾街日報》(the Wall Street Journal)報道,OpenAI的市值約為290億美元。

從大型語言模型到開源軟件,OpenAI顯著推動了人工智能領域的發展。首先,OpenAI開發了一些迄今為止最強大的語言模型,包括GPT-3[95],該模型因其在許多上下文中產生連貫和現實的文本的能力而獲得了廣泛的贊譽。OpenAI還開展了強化學習的研究,這是人工智能的一個分支,旨在訓練機器人根據獎懲做出選擇。近端策略優化(PPO)[71]、軟Actor-Critic (SAC)[189]和可信區域策略優化(TRPO)[181]只是OpenAI迄今為止創建的一些強化學習算法。這些算法已被用于訓練智能體執行各種任務,包括玩游戲和控制機器人。到目前為止,OpenAI已經創建了許多軟件工具來協助其研究工作,包括OpenAI Gym[76],這是一個用于創建和對比強化學習算法的工具集。在硬件方面,OpenAI投資了幾個高性能處理系統,包括NVIDIA的DGX-1和DGX-2系統[150]。這些系統是在考慮深度學習的情況下創建的,能夠提供構建復雜AI模型所需的處理能力。除了ChatGPT, OpenAI開發的其他流行工具包括DALL-E[141]和Whisper [135], Codex[25]。圖2顯示了OpenAI產品發展歷程。

ChatGPT使用交互形式對用戶[1]提出的問題提供詳細的、類人的回答。ChatGPT能夠根據提示輸入文本生成高質量的文本輸出。基于GPT-4的ChatGPT plus還可以將圖像作為輸入。除了聊天機器人的基本角色外,ChatGPT還可以成功地處理各種文本到文本的任務,如文本摘要[45]、文本補全、文本分類[86]、情感[221]分析[112]、釋義[104]、翻譯[35]等。

ChatGPT已經成為搜索引擎領域的有力競爭者。正如我們在引言部分提到的,谷歌提供了世界上最優秀的搜索引擎,認為ChatGPT是對其壟斷地位的挑戰[188]。值得注意的是,微軟已經將ChatGPT集成到其Bing搜索引擎中,允許用戶接收更多有創意的回復[174]。我們可以看到搜索引擎和ChatGPT之間的明顯區別。即搜索引擎幫助用戶找到他們想要的信息,而ChatGPT開發雙向對話的回復,為用戶提供更好的體驗。其他公司正在開發類似的聊天機器人產品,如谷歌的LamMDA和Meta的BlenderBot。與ChatGPT不同,谷歌于2021年開發的LaMDA積極參與與用戶的對話,導致輸出文本中出現種族主義、性別歧視和其他形式的偏見[119]。

BlenderBot是Meta的聊天機器人,由于開發人員對其輸出材料設置了更嚴格的限制[130],用戶的反饋相對枯燥。ChatGPT似乎在某種程度上平衡了類人的輸出和偏差,允許更令人興奮的反應。值得注意的是,除了比普通ChatGPT更高效和具有更高的最大token限制外,由GPT-4支持的ChatGPT還可以創建多種方言語言和情感反應,并減少不良結果,從而減少偏差[169]。文獻[96]指出,可以通過使用多任務學習和增強訓練數據質量來進一步提高ChatGPT的建模能力。

3 ChatGPT背后的技術

3.1 兩項核心技術

骨干架構:Transformer。在Transformer出現之前[182],RNN是語言理解的主要骨干架構,而注意力是模型性能的關鍵組成部分。與之前只將注意力作為支持組件的工作相比,谷歌團隊在他們的工作標題中聲稱:“attention is All You Need”[182]聲稱,自從谷歌在2017年發布了一篇論文,即“attention is All You Need”[182]以來,對Transformer骨干結構的研究和使用在深度學習社區中經歷了爆炸性的增長。本文總結了Transformer的工作原理,重點關注其核心組件self-attention。自注意力的基本原理假設,給定輸入文本,該機制能夠為單個單詞分配不同的權重,從而促進捕獲序列中的依賴關系和上下文關系。序列中的每個元素都具有其唯一的表示形式。為了計算序列中每個元素與其他元素的關系,需要計算輸入序列的Q (query)、K (key)和V (value)矩陣。這些矩陣是由輸入序列的線性變換推導出來的。通常,查詢矩陣對應于當前元素,鍵矩陣代表其他元素,值矩陣封裝了要聚合的信息。通過計算查詢與關鍵矩陣之間的相似度,確定當前元素與其他元素之間的關聯權重。這通常通過點積操作來實現。隨后,對相似度進行歸一化,以確保所有關聯的總和等于1,這通常通過softmax函數執行。然后將歸一化的權重應用于相應的值,然后對這些加權值進行聚合。這個過程產生了一種新的表示,包括當前單詞和文本中其他單詞之間的關聯信息。上述過程可以正式表述如下:

Transformer技術已經成為近期大型語言模型發展的重要基礎,如BERT[41]和GPT[18, 122, 136, 137]系列也是基于Transformer技術的模型。還有一系列工作將Transformer從語言擴展到視覺,即計算機視覺[42,63,100],這表明Transformer已經成為NLP和計算機視覺的統一骨干架構。 生成式預訓練:自回歸。對于模型預訓練[64,212,216-218],有多種流行的生成式建模方法,包括基于能量的模型[56,159,160,186],變分自編碼器[5,84,124],GAN[17, 54, 198],擴散模型[20,33,213,215,220]等。在這里,我們主要總結自回歸建模方法[11,90,90,177,178],因為它們是GPT模型的基礎[18,122,136,137]。自回歸模型是統計分析中處理時間序列數據的一種重要方法。這些模型指定輸出變量與前面的值線性相關。在語言建模的上下文中[18,122,136,137],自回歸模型根據前一個單詞預測后一個單詞,或根據下面的單詞預測最后一個可能的單詞。該模型學習序列數據的聯合分布,使用之前的時間步長作為輸入來預測序列中的每個變量。自回歸模型假設聯合分布????(??)可以分解為條件分布的乘積,如下所示:

雖然兩者都依賴于之前的時間步長,但自回歸模型與循環神經網絡(RNN)架構的區別在于,前者使用之前的時間步長作為輸入,而不是RNN中發現的隱藏狀態。本質上,自回歸模型可以被概念為一個前饋網絡,其中包含所有之前的時間步長變量作為輸入。早期的工作使用不同的函數對離散數據進行建模,以估計條件分布,例如全可見Sigmoid置信網絡(FVSBN)[51]中的邏輯回歸和神經自回歸分布估計(NADE)中的一個隱層神經網絡[90]。隨后的研究擴展到對連續變量建模[177,178]。自回歸方法已廣泛應用于其他領域,具有代表性的作品有:PixelCNN[180]和PixelCNN++[153]),音頻生成(WaveNet[179])。

3.2 技術路徑

ChatGPT是在一系列GPT模型的基礎上發展起來的,這是自然語言處理領域的一項重大成就。圖6概述了這一開發過程。在下面,我們總結了GPT的關鍵組成部分以及更新后的GPT的主要變化。

GPT-1。在只有解碼器的情況下,GPT-1采用了12層的Transformer,具有117M的參數[136]。圖4展示了GPT-1的概述以及如何將其用于各種下游任務。在包含獨特未出版書籍的大型BooksCorpus數據集上進行訓練,GPT-1能夠掌握長程依賴關系的上下文。一般任務無關的GPT模型在12個任務中的9個中優于為特定任務訓練的模型,包括自然語言推理、問答、語義相似性和文本分類[136]。觀察到GPT-1在各種零樣本任務上表現良好,表明了高水平的泛化能力。在GPT-2發布之前,GPT-1已經發展成為用于各種NLP任務的強大模型。

GPT-2。作為GPT-1的繼承,GPT-2由OpenAI于2019年推出,專注于在沒有明確監督的情況下學習NLP任務。與GPT-1類似,GPT-2基于僅解碼器的Transformer模型。然而,GPT-2的模型架構和實現已經開發出來,具有15億個參數和800萬個網頁的訓練數據集,這是其前身GPT-1的10倍以上[137]。在零樣本設置下,GPT-2在測試的8個語言建模數據集中的7個上取得了最先進的結果,其中7個數據集的任務包括對不同類別單詞的性能識別、模型捕捉長期依賴關系的能力、常識推理、閱讀理解、摘要和翻譯[137]。然而,GPT-2在問答任務上仍然表現不佳,這表明無監督模型GPT-2的能力有待提高[137]。

GPT-3。GPT-3的基礎是Transformer架構,特別是GPT-2架構。與具有15億個參數的GPT-2相比,GPT-3具有1750億個參數、96個注意力層和3.2 M的批處理大小,大小[18]顯著增加。GPT-3在各種各樣的在線內容上進行訓練,包括小說、論文和網站,使用語言建模,這是一種無監督學習,模型試圖根據前面的單詞猜測短語中的下一個單詞。完成后,GPT-3可以使用監督學習在特定任務上進行微調,其中使用特定任務的較小數據集來訓練模型,如文本補全或語言翻譯。由于OpenAI的API[36],開發人員可以將GPT-3模型用于許多應用程序,包括聊天機器人、語言翻譯和內容生產。API根據任務的規模和復雜程度提供不同的訪問級別。與其他性能高度依賴微調的語言模型相比,GPT-3可以執行許多任務(如語言翻譯),而無需任何此類微調、梯度或參數更新,使該模型與任務無關[105]。

GPT-3.5。GPT-3.5是廣泛流行的GPT-3的變體,ChatGPT是GPT-3.5的微調版本。在GPT-3模型之上,GPT-3.5具有額外的微調程序:有監督的微調和人工反饋的強化學習(RLHF)[203],如圖5所示,其中機器學習算法接收用戶反饋并使用它們來對齊模型。RLHF用于克服傳統無監督和有監督學習只能從無標記或有標記數據中學習的局限性。人工反饋可以采取不同的形式,包括懲罰或獎勵模型的行為,為未標記的數據分配標簽,或更改模型參數。通過將人工反饋納入訓練過程,GPT-3.5的可用性顯著提高。

GPT-4。2023年3月14日,OpenAI發布了GPT-4[122],這是GPT系列的第四部分。GPT-4是一個大型多模態模型,能夠將文本和圖像作為輸入,并生成文本作為輸出。該模型在幾個專業和職業標準上提供了人類水平的性能,但在現實世界中,它仍然比人類的能力弱得多。例如,GPT-4的虛擬律師考試成績位于測試參與者的前10%,而GPT-3.5的分數位于最低的10%[77]。GPT-4遵循人類意圖的能力明顯優于早期版本[125]。在提供給ChatGPT和OpenAI API的樣本中,5214個問題中,GPT-4的答案在70.2%的情況下優于GPT-3.5。在絕大多數預訓練數據于2021年9月結束后,GPT-4通常對發生了什么缺乏意識,也沒有從經驗中學習。它偶爾會表現出基本的邏輯錯誤,這些錯誤似乎與它在各個領域的技能不一致,或者當從用戶那里接受錯誤的聲明時,它可能過度信任用戶[122]。它可能會像人們一樣與復雜的問題作斗爭,例如生成包含安全缺陷的代碼[122]。表2總結了從v1到v4的GPT模型參數和訓練數據集。

4 ChatGPT的應用

4.1 科技寫作

ChatGPT以其強大的內容生成能力而被廣泛認可,對學術領域的寫作產生了重大影響。許多現有的工作已經測試了ChatGPT如何應用于科學寫作,包括頭腦風暴、文獻綜述、數據分析、直接內容生成、語法檢查以及作為學術評審員。

頭腦風暴。頭腦風暴是獲得初始想法的基本方法,是高質量科學研究的先決條件。ChatGPT可以在頭腦風暴中發揮各種作用,從激發創造力[57,139]產生新想法,到提供建議[98,168]擴展現有想法。ChatGPT可以幫助用戶進行發散性和創造性思維[139]。此外,一些研究以問答的形式探討了ChatGPT對未來護理研究的見解,可以分析未來技術發展對護理實踐的影響,并為護士、患者和醫療保健系統[57]提供有價值的見解。此外,ChatGPT還表現出多角度“思考”的能力,它可以從醫療系統、社會經濟、個人健康行為等多個維度分析和反思COVID-19大流行后超額死亡的影響[168]。評估ChatGPT是否能為特定領域的研究人員提供有用的建議。作者在[98]中測試了它在臨床決策支持方面的能力,并評估了它與人工建議的差異。測試結果表明,與人類思維不同,ChatGPT生成的建議具有獨特的視角,其生成的建議具有高度的可理解性和相關性,在科學研究中具有重要價值。

文獻綜述。一篇全面的文獻綜述需要涵蓋所有的相關研究,這會耗費研究者太多的時間和精力。例如,基于人工智能的科學文獻研究工具語義學者搜索引擎(Semantic Scholar search engine)已經索引了2億多份學術出版物。因此,找到相關的研究論文并從中提取關鍵見解幾乎是大海撈針。幸運的是,ChatGPT作為一個人工智能驅動的研究閱讀工具,可以幫助我們瀏覽大量的論文并理解其內容。在實際使用中,我們可以給ChatGPT一個主題,然后它可以幫助我們查找相關文獻。在討論ChatGPT處理文獻綜述的能力之前,我們回顧了一個類似的AI工具SciSpace Copilot,它可以幫助研究人員快速瀏覽和理解論文[152]。具體來說,它可以為科學文本和數學提供解釋,包括后續問題,以多種語言提供更詳細的答案,促進更好的閱讀和理解文本。相比之下,ChatGPT作為一種通用語言模型,不僅具有SciSpace Copilot的所有功能,而且可以廣泛應用于各種自然語言處理場景[152]。為了總結所選領域的相關工作,文獻綜述是必不可少的。作為一項探索性任務,他們選擇了“醫療領域的數字孿生”主題,并使用關鍵詞“醫療領域的數字孿生”匯編了過去三年(2020、2021和2022)從谷歌學者搜索結果中獲得的論文摘要。然后用ChatGPT對這些摘要進行轉述,生成的結果具有良好的[7]性能。然而,ChatGPT在這項任務中的應用還處于起步階段。[59]的作者要求ChatGPT提供10篇醫學領域DOIs的開創性學術文章。不幸的是,在進行了5次測試之后,結果顯示,在提供的50個doi中,只有8個存在,并且已經正確地發布。雖然ChatGPT在文獻綜述方面的能力還比較薄弱,但我們相信在不久的將來,ChatGPT將被廣泛用于文獻綜述,進一步提高研究人員的效率,使他們能夠將時間集中在重點研究上。

數據分析。科學數據需要在分析之前進行清理和組織,這通常需要花費研究人員幾天甚至幾個月的時間,最重要的是,在某些情況下,必須學習使用Python或r等編程語言。使用ChatGPT進行數據處理可以改變研究前景。例如,如[102]所示,ChatGPT完成了對一個模擬數據集的數據分析任務,該數據集包含10萬名年齡和風險分布不同的醫療工作者,以幫助確定疫苗的有效性,這大大加快了研究過程[102]。[152]中討論了另一個類似的用于數據分析的人工智能工具,其中基于人工智能的電子表格機器人可以將自然語言指令轉換為電子表格公式。此外,像Olli這樣的平臺還可以可視化數據,用戶只需要簡單地描述所需的內容,然后他們可以得到人工智能創建的折線圖、柱狀圖和散點圖。考慮到ChatGPT是目前為止最強大的人工智能工具,我們相信這些功能也可以在ChatGPT中以更智能的方式實現。

內容生成。許多工作嘗試使用ChatGPT為他們的文章生成內容[3,146]。例如,[3]利用ChatGPT輔助撰寫兩種疾病的發病機制的醫學報告。具體來說,ChatGPT提供了三方面關于同型半胱氨酸血癥相關骨質疏松的機制,所有這些都被證明是正確的。然而,當涉及到生成信息的參考文獻時,ChatGPT所提到的論文并不存在。[223]描述了一項使用ChatGPT編寫催化綜述文章的研究,主題設置為CO2加氫生成高級醇。chatgpt生成的內容包括論文的必要部分,但缺乏對反應機制的介紹,這對該主題至關重要。這篇文章的內容包含了大量有用的信息,但缺少具體的細節,存在一定的錯誤。此外,ChatGPT可以幫助準備稿件,但生成的結果與實際發表的內容相差較大。一個可能的原因是ChatGPT的關鍵詞與人工生成的文本差異很大,這就需要用戶對生成的內容進行進一步的編輯[88]。ChatGPT還被用于生成特定領域的綜述文章,如健康領域[7],這表明學者可以專注于核心研究,而將創造性較低的部分留給AI工具。然而,考慮到人工生成的內容和ChatGPT生成的內容之間的風格差異,[7,88]建議不要完全依賴ChatGPT。利用ChatGPT作為助手來幫助我們完成寫作,而不是僅僅依賴它。

校對。在ChatGPT出現之前,有很多語法檢查工具。一些工作[82,109,197]對語法和拼寫校對進行了測試,表明ChatGPT提供了比其他AI工具更好的用戶體驗。例如,ChatGPT可以自動修復任何標點和語法錯誤,以提高寫作質量[197]。此外,該研究還研究了ChatGPT如何超越幫助用戶檢查語法的范圍,進一步生成關于文檔統計、詞匯統計等報告,改變作品的語言,使其適合任何年齡的人,甚至將其改編為故事[82]。另一個次要但值得注意的是,到目前為止,Grammarly的高級版本Grammarly Premium需要用戶每月支付30美元的費用,這比ChatGPT Plus每月20美元的費用要貴得多。此外,ChatGPT已經與其他基于人工智能的語法檢查器進行了比較,包括QuillBot、DeepL、DeepL Write和谷歌Docs。實驗結果表明,ChatGPT在錯誤檢測數量方面表現最好。雖然ChatGPT在校對時存在一些可用性問題,例如比DeepL慢10倍以上,并且缺乏突出建議或為特定單詞或短語提供替代選項的能力[109],但應該注意的是,語法檢查只是冰山一角。ChatGPT在改進語言、重構文本和寫作的其他方面也很有價值。

學術評審。研究論文的同行評議是傳播新思想的一個關鍵過程,對科學進步有重大影響。然而,產生的研究論文的數量給人類評審者帶來了挑戰。[161]對ChatGPT用于文獻綜述的潛力進行了研究。具體來說,ChatGPT能夠對輸入的學術論文進行分析,然后從論文的概述、優缺點、清晰度、質量、新穎性、可重復性等方面對論文進行評價。然后,將論文生成的評論輸入ChatGPT進行情感分析。在此之后,可以對接受評審的論文做出決定。

4.2 教育領域

ChatGPT具有產生類似人類的響應的能力,已經被許多研究工作所研究,以探討它給教育領域帶來的影響。在這里,我們從兩個角度對它們進行總結:教/學和學科。

教與學。在典型的課堂環境中,教師是知識的來源,而學生是知識的接受者。在課堂之外,學生經常被要求完成老師設計的作業。ChatGPT可以顯著改變教師和學生之間的交互方式[10,148,209,211]。

各種教育科目的ChatGPT。在現代教育中,有各種各樣的學科,包括經濟學、法學、物理學、數據科學、數學、體育、心理學、工程學和媒體教育等。盡管ChatGPT并不是專門為成為某一特定主題的大師而設計的,但在眾多的作品中已經證明,ChatGPT對某一主題的理解還不錯,有時甚至超越了人類的水平。為了方便討論,我們將主題分為STEM(科學、技術、工程、數學)和非STEM(包括經濟學、法學、心理學等)。

4.3 醫療領域

醫學知識評估。ChatGPT在醫療領域的能力已經在一些工作中得到了評估[43,53,72,205]。疾病診斷和治療。雖然一些機器學習算法已被應用于輔助疾病分析,但大多數情況下主要局限于與單任務相關的圖像判讀。在這一部分,我們討論ChatGPT在臨床決策支持中的能力。

5 挑戰

5.1 技術局限

盡管ChatGPT功能強大,但它也有自己的缺點,這也是OpenAI團隊官方認可的。為了證明其局限性,已經進行了大量的工作[15,16,26,60,96,151,226],總結如下:

不正確。ChatGPT有時會生成看似合理的錯誤或無意義的答案,就像一本正經地胡說八道[16]。也就是說,ChatGPT提供的答案并不總是可靠的[15,16,226]。正如OpenAI所認識到的,這個問題是具有挑戰性的,一個主要原因是目前的模型訓練依賴于監督訓練和強化學習,以使語言模型與指令保持一致。因此,模型模仿人類演示者聽起來很有道理,但往往以正確性為代價。事實錯誤相關的問題在ChatGPT plus版本中得到了緩解,但這個問題仍然存在[122]。

不合邏輯。在[16,60,151]中指出,ChatGPT的邏輯推理能力還有待提高。由于ChatGPT缺乏理性的人類思維,它既不能“思考”,也不能“推理”,因此未能通過圖靈測試[60]。ChatGPT僅僅是一個復雜的統計模型,無法理解自己或對方的話,也無法回答深入的問題[151]。此外,ChatGPT缺乏一個“世界模型”來進行空間、時間或物理推理,或預測和解釋人類的行為和心理過程[16],在數學和算術方面也有局限,無法解決困難的數學問題或謎語,甚至可能在一些簡單的計算任務[16]中得到不準確的結果。

不一致。當用相同的提示輸入給模型喂食時,ChatGPT可以產生兩個不同的輸出,這表明ChatGPT具有不一致的局限性。此外,ChatGPT對輸入提示高度敏感,這激發了一群研究人員對提示工程的研究。一個好的提示可以提高系統綜述性文獻搜索的查詢效率[191]。利用關于軟件開發任務的有效目錄和指導等提示模式,可以進一步提高軟件開發任務自動化的效率[193,194]。盡管在為ChatGPT發現更好的提示方面取得了進展,但簡單地改變提示可以產生顯著不同的輸出這一事實,意味著ChatGPT需要提高其魯棒性。

無意識。ChatGPT不具備自我意識[16],雖然它可以回答各種問題,生成看似相關連貫的文本,但它沒有意識,沒有自我意識,沒有情緒,也沒有任何主觀經驗。比如ChatGPT可以理解和創造幽默,但是它不能體驗情感或者主觀體驗[16]。關于自我意識,目前還沒有一個被廣泛接受的定義,也沒有可靠的測試方法。一些研究者建議從某些行為或活動模式推斷自我意識,而另一些人則認為這是一種主觀體驗,無法客觀地測量[16]。機器究竟是真正擁有自我意識,還是只能模擬自我意識,目前還不清楚。

6. 展望

在這個蓬勃發展的生成AI時代,有大量的AIGC工具用于各種生成任務,包括text-to- text [12, 75, 117, 138, 200], text-to-image[106, 144, 166, 199, 219],圖像描述[68,187,202],text-to-speech[85, 145, 167],語音識別[93,97,126,155,190],視頻生成[66,108,116,201],3D生成[67,114]等。盡管具有令人印象深刻的功能,但在[55]中指出,ChatGPT并不是生成式AI所需要的全部。從輸入輸出的角度來看,ChatGPT主要擅長文本到文本的任務。隨著底層語言模型從GPT-3.5進化到GPT-4,加號版ChatGPT在輸入端增加了模態。具體來說,它可以選擇性地將圖像作為輸入,但是,它仍然不能處理視頻或其他數據模態。在輸出端,GPT-4仍然局限于生成文本,這使得它與通用的AIGC工具相距甚遠。很多人都想知道下一代GPT可能會實現什么[8,19]。一個極有可能的情況是,ChatGPT可能會走向通用型AIGC,這將是實現人工通用智能(AGI)[19]的一個重要里程碑。

實現這樣的通用AIGC的一種天真的方式是,以并行的方式將各種AIGC工具集成到一個共享agent中。這種樸素方法的一個主要缺點是不同的AIGC任務之間沒有交互。在查閱了大量文章后,我們推測可能存在兩種將ChatGPT橋接并推向AGI的路線圖。因此,我們主張一個共同的景觀,實現多元化AIGC模式之間的互聯互通。

付費5元查看完整內容

海外大模型助力用戶活躍度增長,ChatGPT/GPT-4+應用或為最大機會 22 年末以來,海外大模型快速更迭,ChatGPT/GPT-4 向開發者開放 API, 且價格下探,帶動應用層面持續落地,并從單一的文字模態向圖文跨模態拓 展。在技術加持下,應用性能極大提升,助力用戶活躍度增加。我們認為, AI 時代,應用層將擁有巨大發展潛力,其中搜索、電商、社交、游戲、營銷、 教育、辦公、文學創作等領域空間較大。產業鏈相關公司包括:昆侖萬維、 湯姆貓、三七互娛、愷英網絡、藍色光標、易點天下、中文在線、光線傳媒、 捷成股份、風語筑、完美世界、吉比特、巨人網絡、寶通科技、三人行、值 得買、平治信息等。 搜索通過分析總結,直接展示結果; 電商實現個性化推薦 搜索領域代表公司包括微軟 new Bing 等。據微軟官網,自 2023 年 2 月 7 日 new Bing 發布以來,在 GPT-4 的加持下,截至 3 月 8 日,Bing 搜索引 擎日活躍用戶破 1 億;據七麥數據,Bing App 在美國 iOS 效率應用免費榜 排名從 1 月初的 100-140 名提升至 3 月末的 15-20 名。此外,一些海外的 電商平臺也紛紛接入 ChatGPT,形態包括:1)聊天客服:能夠為客戶提供 實時信息,實現降本增效;2)個性化推薦:ChatGPT 能夠根據用戶的興趣 和偏好篩選產品并進行推薦,優化購物體驗提升轉化率。代表公司包括 Shopify、Instacart 等。 龍頭布局社交聊天機器人;游戲賦能 NPC 聊天與代碼生成 社交方面,通過在社交媒體中嵌入聊天機器人,能夠解決用戶的實際問題, 如推薦食譜等;同時部分聊天機器人還具備上下文理解能力,具有聆聽、陪 伴等功能。此外,還有社交軟件將 ChatGPT 用于個性化的簡歷生成,提升 用戶的約會體驗。代表公司包括 Snap、Iris Dating 等。游戲方面, ChatGPT/GPT-4 技術在海外應用包括 NPC 聊天內容、劇情大綱、代碼生成 等,同時我們認為伴隨著多模態技術的發展,相關技術在游戲素材生產等領 域或持續落地。代表公司包括湯姆貓、ElectricNoir、中文在線(Chapters、 My Escape 宣布接入 ChatGPT)等。 **ChatGPT 驅動虛擬人交互與營銷內容生成;教育在學與教方面均快速落地 **

在營銷領域,我們認為 ChatGPT/GPT-4 的主要應用領域包括:1)營銷內 容生成:借助 ChatGPT 進行營銷文本、營銷視頻、音頻廣告、評論區回復、 虛擬物品、虛擬空間等內容生成;2)虛擬人:接入 ChatGPT,使得虛擬人 的回復更加智能,提升交互性能。代表公司包括 Jasper、SOCi、藍色光標、 天娛數科等。教育方面,主要落地方向包括:1)面向學生,作為虛擬導師, 提供一對一、個性化的輔導,營造沉浸化的學習環境,此外還能夠更好地總 結教學內容;2)面向教師,自動編寫教學材料,分析學生課堂表現,及時 了解學生的近況。代表公司包括 Duolingo、可汗學院、Nerdy 等。 辦公領域作為生產力工具,提升工作效率;文學創作不斷探索 辦公方面,3 月 16 日,微軟推出 Microsoft 365 Copilot,一方面將 AI 技術 集合到 Word/Excel/Powerpoint/Outlook/Teams 等日常工具中;另一方面, 推出商務聊天功能,通過將數據匯集,通過簡單的聊天即可隨時獲取工作信 息。此外,一些垂直類生產工具持續涌現,在郵件、新聞內容撰寫等結構化 領域落地。代表公司包括微軟、Salesforce、BlueMail、BuzzFeed 等。文 學創作不斷探索,部分作品已商業化。據韓國經濟新聞,全球首本 ChatGPT 撰寫、AI 翻譯校對插圖的圖書在 2023 年 2 月 22 日上架。

付費5元查看完整內容

3月21日晚,英偉達召開2023年開發者大會。正如英偉達CEO黃仁勛所言,我們正處于AI的“iPhone時刻”。ChatGPT帶給我們的巨大驚喜只是AI能力圈的冰山一隅, 我們基于當下時點,探尋AI的能力圈,發現AI的潛在場景。

**①AI+計算機 =“程序員”。生成式 AI 是一種新型計算機,一種基于人類自然語言編程的計算機。ChatGPT可以根據精確或模糊的自然語言,了解用戶的意圖,并生成本文,寫備忘錄和詩歌,改寫研究論文,解決數學問題,甚至編寫軟件。借助Debuild,用戶只需說明自己想要的內容即可設計和部署Web應用;Tabnine可幫助開發者編寫代碼;AI將整合百萬級程序員的智慧,幫助我們構建虛擬世界。AI可以建立強大的搜索機制,在海量內容中完成精細化的搜索。

②AI+醫療 =“藥物研發”。醫療設備將由軟件定義,由AI賦能。目前醫療行業正轉向利用生成式 AI 來發現疾病靶因,設計新型分子或蛋白質類藥物,以及預測藥物對機體的作用。Medtronic搭建醫療設備AI平臺,覆蓋手術導航到機器人輔助手術的應用場景,今年年底推出的GI Genius系統將利用AI實現早期結腸癌檢測。Insilico利用AI加速藥物設計;Absci使用AI預測治療抗體。

③AI+傳媒=“設計師”。**生成式AI正逐漸轉向多模態,圖像、視頻和3D等生成式AI正在悄然變化。Kore.ai可以實現虛擬客服;Jasper可以生成營銷材料,目前已經完成50萬億字的編寫,將初稿生成時間縮短80%;Omneky可生成定制化廣告和文案;Stable Diffusion 致力于文本轉圖像;Runway借力AI賦能視頻生成和編輯,并已經在奧斯卡提名的好萊塢電影中的得到應用;此外,AI可以通過快照構建3D建模,應用于房屋設計、服裝設計等方面;AI將虛擬形象提升至更高的現實水平。同時,在音樂領域,AI將文字賦予生命力,譜寫旋律。

**④AI+制造=“數字生產”+“工藝突破”。**AI可以成為虛擬世界與物理實體之間的橋梁。 “數字孿生工廠”可以在實體工廠建成之前整合所有資源,實現降本增效。“數字孿生產品”可以將汽車零部件在虛擬環境中完成組裝。“數字場景”可以將駕駛路線、環境場景重構為3D,用于訓練機器人和自動駕駛。

**AI加速技術引領工藝突破,**NVIDIA推出的計算光刻庫——cuLitho,與臺積電、ASML和Synopsys密切合作,將計算光刻加速40倍以上。計算光刻是芯片設計和制造領域中最大的計算工作負載,H100的生產需要89塊掩模版在CPU上處理兩周,如果在GPU上運行cuLitho將時間縮短至8小時。cuLitho將有助于晶圓廠縮短原型周期時間、提高產量、減少碳排放,為2nm及更先進的工藝奠定基礎。

**⑤AI+科研=“科學家”。**將AI應用在大型對撞機中以解釋宇宙等議題;讓人類以全新視角了解太陽,來建立風險預警機制。生成式 AI 將重塑幾乎所有行業。許多公司都可以使用某個即將上市的生成式 AI API,一些專業領域的公司需要使用其專有數據來構建定制模型。繼PC時代的“Macintosh時刻”、移動設備的“iPhone時刻”,AIGC時代的“ChatGPT時刻”已經掀起第三次科技浪潮,看好AIGC下游應用市場、算法和底層算力。轉編機器之心機器之心編輯部

在今年的 GTC 上,NVIDIA 創始人兼首席執行官黃仁勛與 OpenAI 聯合創始人、首席科學家 Ilya Sutskever 進行了一場深度對話,討論了 GPT-4、ChatGPT 背后的故事,也聊了下深度學習的未來。

如今,OpenAI 可以說是整個 AI 領域最火的研究機構。憑借強大的 GPT-4 以及與微軟必應、Office 等產品的融合,這家公司似乎要掀起一場生產力革命。這一成就是由多方面的力量來驅動的,包括聰明的頭腦和強大的基礎設施。在「聰明的頭腦」里,Ilya Sutskever 頗具代表性。2012 年,他和他的導師 Geoffrey Hinton 以及同學 Alex Krizhevsky 一起,用深度神經網絡刷新了 ImageNet 的歷史記錄,拉開了卷積神經網絡統治計算機視覺的序幕,標志著新一波人工智能浪潮的開始。2021 年,這個名為 AlexNet 的論文被引量突破 10 萬。「為了加速訓練,我們用到了非飽和神經元和一個非常高效的 GPU 卷積操作實現。」Ilya Sutskever 等人在 AlexNet 的相關介紹中提到了這樣一條關鍵信息。他們還詳細說明了如何將他們的網絡映射到多個 GPU 上。從這時起,GPU 和神經網絡緊緊地綁定在一起。黃仁勛領導的英偉達自然也成了這波 AI 浪潮中不可或缺的一環。2015 年,Ilya Sutskever 參與創辦了 OpenAI,并帶領這家公司一路向著 AI 大模型的方向前進。但隨著模型變得越來越大,訓練它們所需的算力也急劇增長。「加速計算并非易事,2012 年,計算機視覺模型 AlexNet 動用了 GeForce GTX 580,每秒可處理 262 PetaFLOPS。該模型引發了 AI 技術的爆炸。十年之后,Transformer 出現了,GPT-3 動用了 323 ZettaFLOPS 的算力,是 AlexNet 的 100 萬倍,創造了 ChatGPT 這個震驚全世界的 AI。嶄新的計算平臺出現了,AI 的 iPhone 時代已經來臨。」黃仁勛在 GPT 大會的 Keynote 中說道。在這次大會上,英偉達發布了 ChatGPT 專用的 GPU,推理速度提升了 10 倍。一路走來,Ilya Sutskever 和黃仁勛都是這波 AI 浪潮的見證者和重要推動者。在即將到來的「AI iPhone 時代」,兩人也必將扮演重要的領導者角色。在這場對話中,兩人談到了深度神經網絡的能力、限制和內部工作方式,并勾勒了一些未來的圖景。在打造 GPT-4 的過程中,Ilya Sutskever 堅信「(模型)越大越好,擴大規模是 OpenAI 的目標之一」。這自然是黃仁勛喜聞樂見的。 I had a very strong belief that bigger is better, and a goal at OpenAI was to scale. ——Ilya Sutskever兩人的談話進行了大約 1 個小時,就像老朋友邊喝咖啡邊聊天一樣。以下是這次談話的完整視頻(帶中文字幕),大家可以在其中感受時代的脈搏。

英偉達博客://blogs.nvidia.com/blog/2023/03/22/sutskever-openai-gtc/ 視頻鏈接:

付費5元查看完整內容

事件:美國AI公司OpenAI推出基于大語言模型的對話模型ChatGPT,可提供高質量的回答,并能實現創作、編程等復雜功能,備受市場關注。不到兩個月的時間,ChatGPT全球日活用戶已突破千萬。

  ChatGPT是突破式的創新技術ChatGPT是OpenAI公司推出的全新聊天機器人模型。通過引入人類反饋的強化學習,大幅提升了AI在人機對話時的準確度和可控性,具有強大的語言理解能力和語言表達能力。GPT模型仍在持續迭代,更先進大語言模型GPT-4有望在2023年推出,有望進一步推動AIGC產業發展。     ChatGPT應用及商業化落地加速科技公司紛紛涌入AIGC賽道,優秀的AIGC大模型層出不窮,我們認為基于AI文本生成的模型ChatGPT有望率先應用落地。AIGC賽道相關公司受到資本青睞,AIGC頭部初創公司OpenAI最新估值約為290億美元。作為AIGC領域領先的模型ChatGPT在對話機器人、智能創作等領域應用廣泛,亞馬遜、微軟、Jasper等公司已經開啟商業化之路,商業化前景廣闊。  

付費5元查看完整內容

//nostarch.com/math-deep-learning

深度學習無處不在,這使得AI的強大驅動力成為更多STEM專業人士需要了解的東西。學習使用哪個庫命令是一回事,但要真正理解這一原則,您需要掌握使之正確的數學概念。本書將為您提供概率論、統計學、線性代數和微分學等主題的工作知識,這些是使深度學習易于理解的基本數學知識,也是成功練習深度學習的關鍵。 這四個子領域中的每一個都與Python代碼和實際操作的示例相關聯,這些示例彌合了純數學及其在深度學習中的應用之間的差距。章節建立在彼此的基礎上,基本的主題,如貝葉斯定理,然后是更高級的概念,如使用向量、矩陣和函數的導數訓練神經網絡。在探索和實現深度學習算法時,您將最終使用所有這些數學知識,包括反向傳播和梯度下降——這些基本算法使AI革命成為可能。 你將學習:

  • 概率規則,概率分布,貝葉斯概率
  • 使用統計數據來理解數據集和評估模型
  • 如何操作向量和矩陣,并利用它們在神經網絡中移動數據
  • 如何用線性代數實現主成分分析和奇異值分解
  • 如何應用改進版本的梯度下降,如RMSprop, Adagrad和Adadelta
  • 一旦你通過AI編程的鏡頭理解了本書中呈現的核心數學概念,你就會有基礎的知識來輕松跟隨和使用深度學習。

目錄內容:

Introduction Chapter 1: Setting the Stage Chapter 2: Probability Chapter 3: More Probability Chapter 4: Statistics Chapter 5: Linear Algebra Chapter 6: More Linear Algebra Chapter 7: Differential Calculus Chapter 8: Matrix Calculus Chapter 9: Data Flow in Neural Networks Chapter 10: Backpropagation Chapter 11: Gradient Descent Appendix: Going Further View the Copyright page

View the detailed Table of Contents

View the Index

付費5元查看完整內容

《數據科學與機器學習概論》的創建目標是為尋求了解數據科學的初學者、數據愛好者和經驗豐富的數據專業人士提供從頭到尾對使用開源編程進行數據科學應用開發的深刻理解。這本書分為四個部分: 第一部分包含對這本書的介紹,第二部分涵蓋了數據科學、軟件開發和基于開源嵌入式硬件的領域; 第三部分包括算法,是數據科學應用的決策引擎; 最后一節匯集了前三節中共享的概念,并提供了幾個數據科學應用程序示例。

^

  1. Introductory Chapter: Clustering with Nature-Inspired Optimization Algorithms 在本章中,讀者將學習如何為聚類問題應用優化算法。

By Pakize Erdogmus and Fatih Kayaalp

  1. Best Practices in Accelerating the Data Science Process in Python

By Deanne Larson

數據科學和大數據項目的數量正在增長,當前的軟件開發方法受到了挑戰,以支持和促進這些項目的成功和頻率。關于如何使用數據科學算法以及大數據的好處已經有了很多研究,但是關于可以利用哪些最佳實踐來加速和有效地交付數據科學和大數據項目的研究卻很少。大數據的數量、種類、速度和準確性等特點使這些項目復雜化。數據科學家可利用的開源技術的激增也會使情況變得復雜。隨著數據科學和大數據項目的增加,組織正在努力成功交付。本文討論了數據科學和大數據項目過程,過程中的差距,最佳實踐,以及這些最佳實踐如何在Python中應用,Python是一種常見的數據科學開源編程語言。

  1. Software Design for Success By Laura M. Castro

正如人們所期望的那樣,技術書籍的大部分時間都集中在技術方面。然而,這造成了一種錯覺,即技術在某種程度上是沒有偏見的,總是中性的,因此適合每個人。后來,當產品已經存在時,現實會證明我們不是這樣的。包含和表示在設計和建模階段是至關重要的。在本章中,我們將從架構的角度分析,哪些非功能性需求是最敏感的,以及如何開始討論它們以最大限度地提高我們的軟件產品成功的可能性。

  1. Embedded Systems Based on Open Source Platforms By Zlatko Bundalo and Dusanka Bundalo

  2. The K-Means Algorithm Evolution By Joaquín Pérez-Ortega, Nelva Nely Almanza-Ortega, Andrea Vega-Villalobos, Rodolfo Pazos-Rangel, Crispín Zavala-Díaz and Alicia Martínez-Rebollar

  3. “Set of Strings” Framework for Big Data Modeling By Igor Sheremet

  4. Investigation of Fuzzy Inductive Modeling Method in Forecasting Problems By Yu. Zaychenko and Helen Zaychenko

  5. Segmenting Images Using Hybridization of K-Means and Fuzzy C-Means Algorithms By Raja Kishor Duggirala

  6. The Software to the Soft Target Assessment By Lucia Mrazkova Duricova, Martin Hromada and Jan Mrazek

  7. The Methodological Standard to the Assessment of the Traffic Simulation in Real Time By Jan Mrazek, Martin Hromada and Lucia Duricova Mrazkova

  8. Augmented Post Systems: Syntax, Semantics, and Applications By Igor Sheremet

  9. Serialization in Object-Oriented Programming Languages By Konrad Grochowski, Micha? Breiter and Robert Nowak

本章描述了將對象狀態轉換為一種格式的過程,這種格式可以在當前使用的面向對象編程語言中傳輸或存儲。這個過程稱為序列化(封送處理);相反的稱為反序列化(反編組)進程。它是一種低級技術,應該考慮一些技術問題,如內存表示的大小、數字表示、對象引用、遞歸對象連接等。在本章中,我們將討論這些問題并給出解決辦法。我們還簡要回顧了當前使用的工具,并指出滿足所有需求是不可能的。最后,我們提供了一個新的支持向前兼容性的c++庫。

付費5元查看完整內容

介紹使用spaCy使用Python進行自然語言處理,spaCy是一個領先的Python自然語言處理庫。

使用Python和spaCy進行自然語言處理將向您展示如何快速輕松地創建聊天機器人、文本壓縮腳本和訂單處理工具等NLP應用程序。您將了解如何利用spaCy庫智能地從文本中提取含義;如何確定句子中詞語之間的關系(句法依賴分析);識別名詞、動詞和其他詞類(詞性標注);并將專有名詞分類,如人員、組織和地點(識別命名實體)。你甚至會學到如何將陳述轉換成問題來保持對話的進行。您還將學習如何:

  • 使用單詞向量進行數學運算,找到含義相似的單詞(第5章)
  • 使用spaCy內置的displaCy visualizer識別數據中的模式(第7章)
  • 自動從用戶輸入中提取關鍵字并將其存儲在關系數據庫中(第9章)
  • 部署聊天機器人應用程序,在互聯網上與用戶互動(第11章)

每一章的“嘗試這個”部分鼓勵您通過擴展該書的示例腳本來處理更廣泛的輸入、添加錯誤處理和構建專業質量的應用程序,從而實踐您所學到的知識。在本書的最后,您將使用Python和spaCy創建自己的NLP應用程序。

//nostarch.com/NLPPython

Yuli Vasiliev是一名程序員、自由撰稿人和顧問,專門從事開源開發、Oracle數據庫技術和自然語言處理。

Introduction

Chapter 1: How Natural Language Processing Works Chapter 2: The Text-Processing Pipeline Chapter 3: Working with Container Objects and Customizing spaCy Chapter 4: Extracting and Using Linguistic Features Chapter 5: Working with Word Vectors Chapter 6: Finding Patterns and Walking Dependency Trees Chapter 7: Visualizations Chapter 8: Intent Recognition Chapter 9: Storing User Input in a Database Chapter 10: Training Models Chapter 11: Deploying Your Own Chatbot Chapter 12: Implementing Web Data and Processing Images Linguistic Primer

付費5元查看完整內容
北京阿比特科技有限公司