自然語言處理(NLP)是人工智能最為關鍵的核心技術之一
自然語言處理(NLP)技術是計算機理解和生成自然語言的過程,使計算機具有識別、分析、理解、加工和生成自然語言文本的能力,實現人機間的信息交流
中國NLP市場規模于2021年達到181.3億元;在AI技術不斷融合與迭代升級的背景下,預計中國NLP市場于2026年達到836.6億元
中國NLP行業市場規模2021年達到181.3億元,CAGR為87.4%。隨著人工智能技術的不斷融合與提升以及高度智能化機器人ChatGPT的問世,NLP技術的應用邊界不斷拓寬至營銷、客服、智能問答、虛擬人、人機交互等領域,新興技術將逐漸替代傳統軟件和應用市場,預計未來中國NLP行業市場規模于2026年達到836.6億元
NLP技術在金融領域的功能作用主要包括語言交互和金融分析,分別應用于交互型場景和分析型場景
在交互型場景中NLP產品的核心價值在于快速理解客戶表達的語義信息并進行恰當的回復,多用于流程化和標準化的業務環節中有利于金融機構精簡客服人員并提升客服效率與質量。在分析型場景中NLP產品的核心價值在于對市場的海量金融資訊進行信息處理,提供智能分析結論,為金融機構作出決策行為提供輔助
1、底層技術:AI通過三大能力賦能辦公場景,大模型技術提升辦公生產力
AI通過提升人類的內容生成能力、人機交互能力和非結構數據處理能力,來賦能辦公場景:1)AIGC技術開啟辦公軟件發展新階段,辦公產品從效率工具向生成工具轉變;2)大模型提升人機交互能力,降低辦公軟件使用成本;3)AI提升辦公軟件非結構化數據處理能力,幫助企業更加高效地挖掘數據資源價值。
大模型技術的成熟和商業化推廣,為下游辦公應用向智能化演進提供支撐。1)GPT-4在辦公領域展現出四個極為重要的能力:會話式交互方式、跨語言及多模態交流能力、長文本處理能力、復雜推理能力。四大能力作為支撐,使得大模型在辦公軟件市場應用前景廣闊。2)文心一言強大的中文理解能力展現出廣闊的應用前景,中文場景的內容生成方面具有優勢。3)訊飛星火大模型:辦公是星火模型未來重點應用的領域,依托訊飛在各行業積淀的海量數據,可賦能細分領域的辦公場景。
2、辦公智能化實踐:國內外廠商齊發力,AI+辦公應用百花齊放
AI與辦公應用的融合,國內外廠商已有諸多實踐案例:微軟和谷歌都發布了融合AI的辦公應用Microsoft365 Copilot和Workspace,幫助用戶提高工具生產力;Salesforce通過接入通用大模型+自研小模型的方式,推出GPT程序賦能協作產品,提升溝通效率;Notion AI和印象筆記等筆記類應用,通過接入大語言模型實現文檔自動寫作;飛書推出AI助手“My AI”,以對話形式提供多種功能,包括優化和續寫文字內容、創建日程、自動匯總會議紀要、搜索公司內部知識庫等。
一方面,生成式AI帶來的是生產效率的提升,將大家從重復性勞動解放,生產內容更快,將更多精力放在創意等更重要的事情;同時降低用戶的學習成本,吸引更多的用戶來生產內容或者消費內容,也會改變與商品的交互方式,從而促成交易轉化,以上兩點將同時提升活躍用戶數及提高市場規模,如游戲、電影、有聲書、電商平臺等多領域,建議關注布局大模型的阿里巴巴-SW、騰訊控股、百度集團-SW等。
“從通用到專業?”還是“從專業到通用?”,建議在關注大模型的同時,同時關注NLP領域參數量相對較小的特定領域模型及其應用,有望通過低成本的方式加速落地,如藍色光標、秘塔寫作貓(一級項目)等;CV模型參數量通常較小,且語料庫不存在中英文差異,同樣值得關注,如美圖公司、萬興科技、易點天下等。 從大模型訓練的角度,語料庫及內容安全審查是生成式AI蓬勃發展的基石,建議關注閱文集團、中文在線、人民網、新華網、川網傳媒、中國科傳等。 在語言領域,聊天對話類如電商機器人客服、互聯網內容的生成、文章生成、游戲內容、游戲NPC對話等領域過去幾年AI算法均有應用,大模型算法有望提供新思路,使得對話及內容生成的全局能力、角色定位、文本長度及精品度更為優質,建議關注在相關領域持續探索AI算法的公司,關注阿里巴巴-SW、京東集團-SW、焦點科技、值得買、網易-S、騰訊控股、吉比特、三七互娛、巨人網絡、天娛數科等。 在視覺領域,SAM模型產生了較大的影響力,從以前的基于卷積神經網絡的純圖像特征,進階到了利用Prompt指令去學習理解圖片,大幅提高圖片分割能力并且具備內容多模態理解能力。從工具側而言,新的底層技術為其產品的可用性賦能,會使得用戶使用學習成本更低,吸引更多B或者C的用戶,并提升用戶的留存及復購;應用側,比如電影、動畫片制作則會提高生產效率,從而生產更多優質內容,建議關注兼具IP的上海電影、光線傳媒、華策影視、奧飛娛樂等。
1、國內外大廠發力布局,AI應用生態加速構建,行業應用前景有望打開: (1)硬件端,以NVIDA為代表的國內外廠商布局AI芯片等硬件,有望降低行業內公司AI部署的成本和門檻,為AI商業化應用創造條件; (2)軟件端,國內外大廠相繼發布AI大模型,并展現出出色的實際任務解決能力,應用空間廣闊; (3)商業模式層面,ChatGPT插件大幅提升AI大模型的實用性和準確性,未來“AI大模型+應用插件”有望成為主流模式; 2、AI+行業應用有望加速融合,關注各賽道內具備布局優勢的廠商: (1)隨著AI商用空間的逐步打開,AI結合各行業應用的進程有望加速,建議關注AI與辦公、教育、工業、醫療、安全、遙感、建筑、法律和金融行業的深度融合; (2)對標Microsoft365Copilot,我們認為AI結合工具有望在實際業務場景中大幅提升用戶效率,實現降本增效,重點推薦廣聯達; (3)我們認為AI大模型在文本生成領域技術已經成熟,在具備一定格式的文本生成中可輔助使用者完成任務,推薦AI+法律標的,通達海;
**為什么 ChatGPT 如此重要?AI C 端產品中的第一個爆款,可能代表著商業 化的拐點。**1)從用戶體驗上,比起競品和上一代產品,ChatGPT 的連續對話 能力明顯更強,具備了大范圍商業化的潛力。2)從應用場景的潛力上,語義 文本類產品想象空間較圖片類更大。短期看有望落地的包括更專業的客服機器 人、更垂直更專業化的 AI(如醫療教育領域)、新一代的智能搜索等。3)ChatGPT 的出現或將加快巨頭對于 AI 的發展速度。ChatGPT 的成功或將促進各科技巨 頭加大對于 AI 的研發投入,如谷歌近日宣布投資 OpenAI 的競爭對手 Anthropic。大廠的競爭有助于技術的進步和商業化的加速。
? 為什么是 ChatGPT?比起競品和上一代產品,ChatGPT 在多方面有了明顯改 善。1)道德性的增強,敢于質疑提問者提問前提的正確性和正當性。避免出 現偏見、歧視等毒害信息。2)主動承認錯誤或主動承認無法回答某一問題。3) 可以理解整段對話上下文的語義,而不是孤立的回答其中一個問題。4)對提 問者意圖判斷能力大幅提升,并非單純根據相關性進行答案羅列。因此整體上, ChatGPT 有著比其他 AI 機器人更好的用戶體驗,具備了真正意義上的連續對 話的能力。
**? 如何落地?**短期看是降本增效的新生產力工具,長期看可能帶來新的內容生 產范式。ChatGPT 的成功證明了生成式模型的進化,實現通用人工智能 AGI 的可能性進一步提高。其重要性體現在 AI 對人類傳達信息的載體有了更好 的學習,在此基礎上各個媒介之間的互通成為可能。例如從自然語言生成編程 語言,可以產生新的人機交互方式;從自然語言生成圖片和視頻,可以革新內 容行業的生產范式。短期直接落地的場景可能是在文本端,提高人的效率:搜 索、營銷文案、客服、輔助寫作;更長期的可能在于提高人機互動的智能, 如在游戲、虛擬人方面的應用。
自ChatGPT推出以來,國內學術界和科技企業相繼宣布或將推出類似機器人對話模型,有望推動大模型發展。2月7日,百度官宣“文心一言”。2月20日,復旦大學發布了類ChatGPT模型“MOSS”,并面向大眾公開邀請內測,國產大模型有望迎來爆發式增長。 需求和政策兩方面,合力推動AI產業增長。國內應用層面的需求推動AI產業的加速發展。根據IDC數據預測,2021年中國人工智能軟件及應用市場規模為51億美元,預計2026年將會達到211億美元。數據、算法、算力是AI發展的驅動力,其中數據是AI發展的基石,中國數據規模增速有望排名全球第一。政策方面,“十四五”規劃中提到“瞄準人工智能”,“聚焦人工智能關鍵算法”,加快推進“基礎算法”的“突破與迭代應用”;北京、上海、廣州等城市發布相關規劃。 頭部企業采取“模型+工具平臺+生態”三層共建模式,有助于業務的良性循環,也更容易借助長期積累形成競爭壁壘。大模型廠商主要包括百度(文心大模型)、騰訊(HunYuan大模型)、阿里(通義大模型)、商湯、華為(盤古大模型)等企業,也有智源研究院、中科院自動化所等研究機構,同時英偉達等芯片廠商也紛紛入局。大模型增強了AI技術的通用性,助力普惠AI的實現。未來,大模型有望于場景深度融合,配合專業工具和平臺支持應用落地,開放的生態來激發創新,形成良性循環。 技術發展有望促進生產效率提升,并進一步創造新的消費和需求,有利于文娛內容和互聯網行業。在AIGC和ChatGPT方面,我們建議持續關注技術發展和應用情況,把握技術催化和商業化落地帶來的投資機會:1)具備AIGC和ChatGPT的技術探索和應用的公司:百度集團-SW、商湯-W、萬興科技、拓爾思等;2)具有海量內容素材且具有AIGC探索布局的,圖片/文字/音樂/視頻內容及平臺公司騰訊控股,閱文集團、美圖公司、昆侖萬維、湯姆貓、神州泰岳、視覺中國、中文在線、漢儀股份、天娛數科、風語筑等。
AIGC空間廣闊,商業化落地持續推進
AIGC的落地痛點在于成本高昂的通用大模型與下游垂直應用場景需求的不匹配。ChatGPT熱度持續提升,一方面推動了科技巨頭持續加大AI投入,另一方面也直接帶動下游付費意愿提升,進一步加速AIGC應用落地和商業變現,AIGC產業迎來發展良機。 (1)從內容形態來看,AIGC應用包括文本、音頻、圖像、視頻、代碼、多模態等內容生成形式,根據紅衫資本預測,AIGC將首先在文本和代碼領域落地應用,隨后逐漸拓展至圖像和視頻領域。 (2)從應用價值來看,AIGC應用價值體現在降本增效、提升內容質量、增加內容多樣性、生成個性化內容等方面。在垂直領域,目前國內已有機器寫稿、對話式AI、報告生成等AIGC應用落地,技術價值主要在于替代人工實現降本增效。隨著科技巨頭的持續投入以及技術的迭代升級,AIGC技術應用場景進一步拓寬,技術價值也有望從將本增效向額外價值轉移。 AI賦能價值凸顯,AI應用大有可為 (1)AI+搜索:搜索是互聯網的流量入口,微軟、谷歌、百度均表示將率先將AI技術應用于搜索,未來有望重塑信息生成和呈現方式,成為新的流量入口。 (2)AI寫作:AI寫作可大幅提升效率,在具有較強規律性的結構化寫作方面具有豐富應用場景。目前已在辦公軟件、新聞媒體等專業應用場景商業化落地。 (3)AI對話:AI對話主要用于替代人類完成大量重復性、規則性對話任務,在金融、互聯網、運營商等擁有大量C端用戶的行業擁有廣闊應用前景。ChatGPT在多項測試中已經超過人類,將對話AI提升至新的高度,未來應用空間廣闊。 (4)AI翻譯:在AI技術支持下,機器翻譯效果持續優化,但在廣義理解層面仍面臨挑戰。相比專業搜索工具,ChatGPT具有更強的理解能力,在部分場景的翻譯表現優于谷歌翻譯和DeepL,表現驚艷。 (5)AI作畫:AI作畫可解決視覺內容創作門檻高、耗時長的痛點,對于內容創作的價值凸顯。根據6pen預測,未來五年10%-30%的圖片內容將由AI參與生成,預計2027年市場規模有望超過600億,空間廣闊。 (6)AI視頻:AI已經可以輔助完成視頻生成、替換、剪輯等多項任務,已在短視頻、AI修復等領域廣發應用,下游需求旺盛,未來應用潛力廣闊。
主要觀點: ChatGPT帶來大模型時代變革,數據要素重要性提升 ChatGPT是由OpenAI研發的一種語言AI模型,其特點在于使用海量語料庫來生成與人類相似的反應。初代GPT模型參數1.17億,GPT2模型、GPT3模型參數分別達到15億、1750億。不斷提升的參數量級,使得ChatGPT3當前已經能夠應用在商業、研究和開發活動中。 當前此類參數體量龐大的模型,成為各大科技廠商研發重點。大模型的基礎為高質量大數據。ChatGPT的前身GPT-3就使用了3,000億單詞、超過40T的數據。此類大數據基礎的前提為三部分1)有效場景下的采集數據;2)大數據的存儲、清洗和標注;3)數據質量檢驗。 大模型發展之下,算力與網絡設施建設成為剛需 算力:ChatGPT類人工智能需要更充足的算力支持其處理數據,帶來更多高性能的算力芯片需求。英偉達表示,GPT-3需要512顆V100顯卡訓練7個月,或者1024顆A100芯片訓練一個月。2012年以來,AI訓練任務中的算力增長(所需算力每3.5月翻一倍)已經超越摩爾定律(晶體管數量每18月翻一倍)。 網絡設施:以微軟Azure為例,其AI基礎設施由互聯的英偉達AmpereA100TensorCoreGPU組成,并由QuantuminfiniBand交換機提供橫向擴展能力。服務器節點多、跨服務器通信需求巨大,網絡帶寬性能成為GPU集群系統的瓶頸,解決方式包括增加單節點通信帶寬與降低網絡收斂比,帶來光模塊、交換機等需求。 下游應用場景豐富,多行業落地可期 1)“生成式AI(generativeAI)”在互聯網及元宇宙領域市場化空間較為廣闊。基于現行的NLP算法發展程度及數據集規模。在不久的將來,生成式AI有較大可能在“智能客服”和“搜索引擎”進行增值,并有希望以“插件”的形式賦能現有的“生產力工具鏈(工程軟件/音視頻制作工具等)”。 2)AI在制造業的應用可分為三方面:a)智能裝備:指具有感知、分析、推理、決策、控制功能的制造裝備,典型代表有工業機器人、協作機器人、數控機床等;b)智能工廠:重點在于實現工廠的辦公、管理及生產自動化,典型的代表場景有協作機器人、智能倉儲物流系統等;c)智能服務:指個性化定制、遠程運維及預測性維護等。 3)人工智能在智能汽車領域的應用包括:a)智能駕駛依托AI,將從駕駛輔助發展至自動駕駛;b)智能座艙在AI支持下,從出行工具演變為出行管家。
ChatGPT,有望重新定義搜索”入口”。我們認為ChatGPT是實現“模糊搜索”到“精準推送”的跨時代巔峰之作,復盤Chrome與IE瀏覽器之爭,Chrome獲勝關鍵因素在于1、界面便捷,2、多進程架構,3、運行效率高,4、生態建設,而ChatGPT(AIGC)有望成為下一代搜索引擎的催化劑,原因是其符合以上特征,此外可以幫助用戶實現程序生成、文本生成以及代碼編寫,提高用戶使用效率,因此AIGC有望加速下一代搜索引擎的到來。 AIGC技術有望幫助內容生成跨越新時代。AIGC也被認為是繼UGC、PGC/OGC之后的新型內容生產方式。復盤UGC、PGC、OGC的商業模式,我們認為內容生產平臺的關鍵因素在于內容數量、內容質量、客戶互動上,而AIGC符合以上三點因素1、內容數量,AIGC有望使編輯制作成本大幅下降,內容數量明顯增多;2、內容質量有望大幅提高,例如DALL·E的效果已經接近中等畫師的水平;3、客戶交互,AIGC,客戶的交互效果在疊加平臺交互屬性之上有望大幅提升,此外我們認為AIGC快速商業化發展的根本原因是算法的不斷演進,同時AIGC也具備跨時代的代表意義,AIGC有望幫助內容生成平臺實現AI輔助生成到AI自動生產內容的跨越。 AIGC有望賦能千行百業,目前已有雛形,有望走向SAAS未來。1、搜索引擎,引入AIGC的搜索引擎搜索更便捷、溝通更高效、功能更多元,且可靠性已大幅提升,例如2月8日的新版MicrosoftEDGE,新版BING可以實現長文章歸納總結提煉重點、對比篩選文章內容、創造新內容、協助用戶生成內容包括電子郵件、旅游規劃等功能;2、新聞媒體,AIGC技術可有效代替人類對已有信息進行語言整合、文字輸出,與資訊平臺類的數字媒體高度適配;3、客戶管理,AIGC有望幫助企業實現提高服務質量降本增效;4、數字人,有望打開海量市場,廣泛應用在電商直播、新聞播報、接待指引、展覽展示等場景中,目前已有實際案例。此外AIGC產業鏈雛形初現,正逐步走向SAAS的未來。
來源:艾瑞咨詢
中國知識圖譜行業研究報告為艾瑞咨詢集團自主研究發布的行業報告。本報告知識圖譜技術在通用知識圖譜 與行業知識圖譜的企業訴求,剖析各行業的核心業務痛點,闡明知識圖譜技術與應用對業 務痛點的針對性與價值,對比各行業的知識圖譜發展現狀與潛力,展現知識圖譜技術的建 設重點與未來趨勢。希望通過本報告,為讀者呈現現階段知識圖譜行業發展的要點,提供辨析和判斷知識圖譜行業趨勢的方法啟發。
感知到認知的跨越式發展,須引入發展認知技術,知識圖譜在此形勢下成為了破局的關鍵技術。數字經濟的持續發展將加速知識圖譜產業化進度,推動知識圖譜與傳統產業融合。高性能圖計算可為圖計算輸送更快更準的計算能力,服務于知識圖譜運算,算力規模化部署也為知識圖譜計算的高密度、高功耗要求提供了有利發展條件。深度學習技術、NLP技術、知識圖譜技術協同并進,尤其是NLP技術近幾年的快速發展為知識圖譜產業化提供了機會。
2021年,知識圖譜核心市場規模預計達到107億元,而到2026年,相應規模將超過296億元,2021-2026年CAGR=22.5%。金融與公安兩大行業的知識圖譜占比較高且增長速度較快,其業務與知識圖譜可密切結合,同時具備建設意愿與資金投入,因而成為了市場規模的主要拉力。未來,隨著政務數字化建設的完善,政務對知識圖譜的業務需求會逐漸喚醒,成為未來市場的拉力之一。
知識圖譜建設需面臨的建設難點主要在于數據治理、行業專家儲備、底層圖數據庫存儲、算法生產流程與性能待提升、客戶認知待培養以及產品封裝形式待優化。攻克知識圖譜的建設重難點將有利于從源頭保證知識與智慧真實可靠、可用正確,儲備培養深厚行業專家與技術復合型專家,升級底層圖數據的存儲方式,改善算法性能,為知識圖譜建設減少阻礙。
未來,知識圖譜廠商、大數據廠商、NLP廠商、互聯網大廠與信息化廠商等知識圖譜業內參與者將從強化技術實力與深化行業認知的角度出發,結合自身原有業務優勢,持續深化發展行業知識圖譜業務。知識圖譜業務場景也將不斷迭代,行業應用場景邊界拓寬,垂直應用場景被做深做透。知識圖譜生態也將繼續由監管引導方、供給方、需求方、投資方、高校及科研院所融合共建,匯聚建設合力,促進產業生態成長壯大。
人工智能通過計算機模擬及延展人類智能行為,可分為通用人工智能與專用人工智能.
人工智能是研究、開發用于模擬、眼神和擴展人類智能的理論、方法、技術及應用系統的一門新興技術科學。人工哲能產業鏈可分為基礎層、技術層和應用層。人工智能行業分為四大類:決策類人工智能、視覺人工智能、語音及語義人工智能和人工智能機器人。中國人工智能市場規模2020年已達到1,8582億元。
智能客服是通過語音或文字與用戶就業務需求問題展開自動對話交流的計算機系統,為企業達到將本增效,提升用戶體驗的目的,
客服機器人根據功能可分為文字客服機器人與語音客服機器人。現階段云通訊、客服機器人、傳統客服軟件廠商與大型互聯網公司導紛紛拓展云客服業務,在與AI技術深度融合的背景下。未來智能服務行業規模將達到500-800億左右。智能客服應用場景豐富。已在多領域縱深發展包括但不限于金融、教育、餐飲、政務等行業及場景,智能客服可有效協助企業降低人力成本,提升工作效率及業務轉化率。
電商智能客服可在售前咨詢、下單付款、物流、重復購買、確認收貨、退換等關鍵環節為消費者提供個性化服務.
中國電商行業規模快速擴張,網購用戶數量與滲透率持續增長,網上零售額突破11.8萬億元,占社會消費品零售總額比例逐年提升,2020年占比達30%。在全網交易額快速增長的同時,淘寶與天貓店鋪數量規模也逐漸擴大,大體量的在線對話需求帶動電商智能客服市場發展向好。中國電商智能客服行業市場規模2020年達1,241億元,預計2023年有望達到1.929億元。
//data.eastmoney.com/report/zw_industry.jshtml?infocode=AP2022064