心智計算(Mind Computation)以多學科交叉的方式融合來自人 工智能、認知科學、腦與神經科學、演化生物學、人類學等學科的研 究方法與計算范式,對生物智能與心智活動的計算機制機理進行多視 角、多尺度系統性的探索,在研究動物與人類心智計算理論與模型的 基礎上,發展受腦與心智啟發的通用人工智能。重點研究生物與人工 心智的計算理論體系、心智建模、學習與記憶機制、常識構建與理解、 生物與人工意識、社會認知等的科學原理和計算理論與技術。神經科學、腦科學、認知科學從多視角、多尺度系統地揭示生物 腦的結構、功能和機制,理解生物心智活動的自然智能本質;人工智 能通過計算建模來模擬、延伸和拓展動物與人類智能的方方面面,達 到類生物水平的理解、思考、學習、決策及社會認知能力。盡管人工 智能經過近七十年的發展已經在某些領域取得了顯著進展,但動物與 人類心智涉及到的復雜認知和意識、情感、想象力和創造力等,在當 前的人工智能系統中仍難以模擬和重現。為此,心智計算旨在充分實 現多學科交叉融合,深度借鑒腦與心智的工作機理,通過計算建模模 擬生物心智活動的多尺度結構和功能可塑性,在計算系統中重現動物 與人類的心智。動物與人類的心智是思維和認知能力的總體,包括感知、學習、 記憶、決策、推理、情感、心理揣測、意識等。當前對于心智的計算 建模更多關注感知、學習、記憶、決策等方面,對與自我認知相關的 情感、意識、心理揣測的研究相對較少。為此,本白皮書聚焦于心智 計算的理論模型、心理揣測、情感共情以及意識理論展開詳細的介紹。本白皮書首先回顧心智計算的研究歷史與發展歷程,匯總主要的 科學問題,從哲學視角介紹心智計算的愿景。緊接著,詳細介紹六種 心智計算的理論模型,心智計算的理論體系模型旨在同時集成感知、 記憶、決策、運動,以及意識、共情、心理揣測等社會認知能力到一套通用、系統的框架中。進一步地,本白皮書以心智活動中與自我認 知緊密結合的心理揣測、情感共情、意識理論為切入點,深入介紹經 典的實驗范式、神經機理以及計算理論模型。最后,本白皮書簡要的 總結與展望心智計算的研究。
類腦計算是指受人腦信息處理方式啟發,以更通用的人工智能和高效智能邊緣端/云端為目標構建信息系統的技術。其目標是使機器能夠以大腦啟發的方式實現人類的各種認知能力和協調機制,最終達到或超過人類的智能水平,推動計算機科學的發展,并為下一代通用人工智能的計算提供可能的解決途徑。
我國在類腦計算方面的研究水平處于國際前列,實現基礎技術研究->技術產品落地->與人工智能產品結合的發展歷程,技術與產品融合緊密,促進相關生態發展。為促進傳統計算架構革新與升級,國際相繼發布政策支持人工智能芯片、芯片開發工具、云計算、類腦科學等新興技術在人工智能領域的應用和創新。
自 1956 年提出人工智能(AI)以來,AI 產業與技術不斷發展,AI 大模型成為一訓多能的人工智能算法基礎設施,2019 年以來,大模型泛化求解能力大幅提升,成為產業主流技術路線。AI 大模型是“人工智能預訓練大模型”的簡稱,包含了“預訓練”和“大模型”兩層含義。“大模型+小模型”逐步成為產業主流技術路線,驅動全球 AI 產業的全面加速。 數字藝術是全球公認的具有獨立審美價值的藝術形式,近年來迅速發展,AI 模型技術的成熟無疑將為數字藝術帶來更廣闊的發展空間,其中特別涵蓋于國家文化數字化的戰略構想,尤其是數字藝術產業化的發展理念。黨的二十大報告明確部署建設網絡強國、數字中國,實施國家文化數字化戰略。中共中央辦公廳、國務院辦公廳印發《關于推進實施國家文化數字化戰略的意見》和《數字中國建設整體布局規劃》,說明文化數字化已成為建設社會主義文化強國、實現文化高質量發展的戰略選擇,對我國文化發展、文化產業國際競爭力和文化安全等方面發揮著不可替代的重要作用。此白皮書梳理研究 AI 與視覺藝術結合的應用案例和藝術作品,以及國家數字藝術相關戰略,為全面更新數字藝術發展模式,實現數字藝術產業新格局提供參考。本研究希望助力推動AI 藝術創新和產業應用的成果轉化,以支撐社會美育建設。以AI 藝術的發展過程向世界講好中國故事,傳播中國文化價值,建構中國美術教育的話語體系與評價體系,提升中國新時代新形象和文化軟實力。通過產生一套面向藝術創作者的 AI 大模型的創作方法論,從而完善大模型數字藝術生成的評價標準,為建立數據庫、資源交流平臺、滿足國家戰略提供多維度的建議。同時積極探索運用 AI 大模型將數字藝術延伸到屏幕之外的可能性,為數字藝術形態的迭代提供建議。將 AI 應用于藝術創作,能推動對 AI 算法的改進研究。通過在不同應用場景下對算法的表現進行研究和分析,可以使人們不斷反思AI 算法的極限、原理以及它的未來發展。AI 大模型的應用將促進藝術家和科技研究人員之間的交流與合作,進一步拓寬數字化創作的可能性。藝術創作不僅能夠拓展 AI 應用場景,還能為AI 算法的改進提供實驗數據和實踐基礎。跨界合作能同時推動技術的發展和文化與藝術的數字化轉型,進而推動中國式現代化進程。因此,藝術與AI 的深度融合將成為文化數字化建設的重要方向,這也是研究AI 在國家文化數字化建設中的重要意義所在。 此白皮書旨在強調跨學科和文理貫通的精神,將文化發展和AI 統一在人文精神框架下,反思科技發展對人的精神和社會心理的影響,并持批判性思考。同時強調藝術思維對科技創新的激發,將橫向、發散、逆向等創造性思維融入學科建設,以藝術探索的能量激發雙向創新。
在藝術學科重視 AI 技術發展史,通過了解技術史、科學思維和實驗方法,探索未知領域。AI 使數字藝術創作來到了新的階段,國內外大模型已經具有極高的工具屬性,這項技術變革對文化與藝術的數字化產生方式帶來極大的改變。這種改變滲透在創作生產、內容傳播和文化消費,國際競爭的新賽道已儼然從技術路線和成果的比拼轉向賦能文化數字化的應用場景之爭。技術領域通過國家政策調控正逐漸發力,對于如何將技術成果服務于國家文化數字化亟待研究。AI 是龐大的系統工程,需要技術和文化數字化應用場景的聯動。國際現有 AI 藝術應用廣度較好,但在垂直方向有欠缺,無法匹配中國文化藝術數字化生產的邏輯和需求。需要加強技術、設備、內容、內容生產方法、管理機構、政策導向、產業的多維度結合,為廣大文化和藝術從業者提供多層次支持,打通技術研究者與文化藝術從業者之間的隔閡。
AI 如何成為數字文化藝術創作的工具和合作者,AI 藝術創作工具產品化后如何更好與數字藝術產業結合,藝術工作者如何更高效地利用大模型生成工具,更好地滿足人民群眾的美學體驗,這些問題亟待解決。 AI 技術在全球化的影響下西方文化逐漸進入中國。目前AI 藝術創作的研究成果較多來自西方,這顯示出一定的研究難度,又揭示了該研究的必要性。扎根中國,學習西方的觀點強調了對中國傳統文化的保護和傳承,同時也注重吸收和融合西方文化中有價值的元素,以此來促進中國與世界的文化交流同時提升國際競爭力、文化軟實力。最后,我們衷心地感謝中央美術學院、京東人工智能研究院、亞馬遜云科技、以及匿名的多位師友、單位給予的無微不至的支持,感謝人工智能學會各方的信任和耐心。本白皮書最需要感謝的是,那些在 2023 年酷暑之下,猶如精心雕琢每一件藝術品的雕刻師,傾心打磨、細心塑造的編寫團隊成員,你們是這白皮書中不可或缺的靈魂。正是因為你們無私的奉獻,這份白皮書才得以綻放光彩。考慮到這項工作來的突然,毅然擔下這份責任的同時,編寫組全體成員在沒有額外經費資助的背景下,憑著對 AI 與藝術結合的熱情,以及為社會與學術界貢獻的初衷,僅僅利用自己的業余時間和精力,完善了這份白皮書。在編寫過程中,我們參考了眾多的資料、藝術家網站和以前的研究成果,對于這些資料的原作者和一直在實踐的藝術工作者們,表示最深的敬意和感謝。他們的作品和研究成果為我們提供了寶貴的靈感和支持,幫助我們完成了這個項目。本白皮書由中央美術學院副院長邱志杰主持編寫,陳抱陽主筆。由于時間、資源等實際因素的限制,文中難免存在疏漏和不足之處。我們深感歉意,并熱切期待廣大讀者的反饋和建議,以幫助我們不斷完善和進步。
最近,語義技術和人工智能(AI)的結合為構建能夠識別更精確結果的智能系統提供了新的技術。語義人工智能在知識圖譜中處于這一創新發展的前沿,通過圖形映射或基于語料庫的本體學習,揭示了機器學習在擴展知識圖譜中的作用。通過符號AI和統計AI的結合,如基于機器學習的實體提取、文本挖掘方法、語義知識圖譜和相關推理能力,確保高效的結果。本書是首次探索語義人工智能和知識圖譜的著作。內容涵蓋了從神經符號AI、可解釋AI和深度學習到知識發現與挖掘,以及知識表示與推理等多個主題。作為對人工智能和數據挖掘領域的研究人員和初學者學者的重要貢獻,本書是對語義人工智能在知識圖譜中的開創性探索。
這本書為醫學學生、研究人員和專業人員提供了機器學習和醫學深度學習的基礎介紹,他們不一定在高等數學入門,但渴望更好地理解這種顛覆性技術及其對醫學的影響。人工智能(AI)曾經是計算機科學和工程部門以外的少數人知道的深奧學科,今天是一項廣泛流行的技術,被學術界的所有學者使用。特別是,近年來,醫學和生命科學領域的研究人員對機器學習和深度學習這一人工智能子領域產生了極大的興趣,這可以從過去十年同行評審醫學期刊上發表的關于該主題的文章數量的快速增長中得到證明。這一領域對優質教育資源的需求從來沒有像今天這樣大,而且只會繼續快速增長。
專家作者采用一種敘事風格,強調直覺而不是抽象的數學形式主義,消除了機器學習和深度學習周圍不必要的復雜性的面紗,使他們能夠在實用性和理論的嚴謹性之間取得微妙的平衡,以促進讀者的學習體驗。書中涉及的主題包括:醫學數據的數學編碼,線性回歸和分類,非線性特征工程,深度學習,卷積和循環神經網絡,強化學習。每一章以練習集結束,供讀者練習和測試他們的知識。
對于有興趣了解更多關于機器學習和深度學習的醫學學生、專業人士和研究人員來說,這是一個理想的介紹。在本科階段至少學過一門數學導論課程的讀者(例如,生物統計學或微積分)將能夠很好地使用本書,而不需要任何額外的先決條件。
//link.springer.com/book/10.1007/978-3-031-19502-0
對從過去到現在收集的數據和信息的順序分析稱為時間序列分析。時間序列數據具有高維、大容量、不斷更新的特點。時間序列取決于各種因素,如趨勢、季節性、周期和不規則的數據集,基本上是在時間上組織良好的一系列數據點。時間序列預測是機器學習的一個重要領域。有各種各樣的預測問題是時間相關的,這些問題可以通過時間序列分析來處理。計算智能(CI)是未來幾年發展中的一種計算方法。CI給出了根據給定要求對問題進行建模的可能性。它有助于為眾多學科中出現的問題找到迅速的解決辦法。這些方法模仿人類行為。CI的主要目標是開發智能機器,為現實世界的問題提供解決方案,這些問題無法建模或難以用數學建模。本書旨在涵蓋時間序列的最新進展和CI在時間序列分析中的應用。
自然語言處理 NLP(Natural Language Processing)是人工智能在企業實踐中較成熟和應用廣泛的技術之一,可以解決人與人、人與企業、人與硬件之間的語言交互問題,是各行業實現認知智能轉型升級的關鍵技術,被比爾·蓋茨稱作“AI領域皇冠上的明珠”。
比如:戰略研究、市場營銷和研發部門可以通過德勤研發的“洞察分析系統IAS”將海量的輿情信息條分縷析歸結出一些重要的市場情報和趨勢洞察:包括自家品牌的正負責面影響度(揚長避短、改善客戶體驗)、客戶對產品的關注點(加強差異化競爭優勢)、競爭對手的成功(要借鑒)或失誤(是機遇)、以及未來市場需求的細節趨勢(用于制定研發與營銷)……
除了輔助戰略決策,NLP還能通過智能語音交互用于客服、結合字符識別用于財務及合同等相關業務,顯著增收節支、提升運營效率:
洞察行業趨勢:NLP能夠精準地抓取相關新聞、論壇等文本數據,自動將紛繁息雜的信息統一標準,抽取目標行業、市場、企業、產品等核心話題,通過定制的分析模型洞察競爭與發展趨勢,協助企業做出高瞻遠矚的戰略決策。
智能化交互:NLP能夠打通全流程、無間斷的客戶服務系統,例如德勤研發的“機器人工廠Bot-Alpha”,可以根據企業業務需求、通過圖形界面的方式輕松創建專屬機器人,應用到各類專業業務場景中。
高效運營管理:企業相關文本合同擬定、校驗、審核、歸檔等工作,可能利用NLP技術自動抽取結構化信息、識別合同風險、縮短業務流程、提高工作效率。
替代重復勞動:例如發票報銷等重復、低價值的工作,可以利用光學字符識別OCR+NLP技術,自動識別發票信息和報銷目的,通過RPA(機器人流程自動化系統)填寫報銷內容,提高整個企業的效率,將寶貴的時間用于更高價值的創新、創造上去。
對戰略與運營如此有用的NLP技術,即使是在領先企業里,許多業務部門還并不了解;或者有所布局,但缺乏戰略高度的整體規劃,企業的痛點和挑戰主要集中在數據、算法模型和業務場景理解不足,包括語料匱乏、數據來源不權威、算法模型泛化較弱、技術業務脫節等。
為此,德勤管理咨詢發布《認知智能大門 --- 企業如何構建NLP能力》,就是在于幫助企業規劃NLP戰略,從業務智能需求到基礎數據準備、算法優化,科學應用NLP,快速達成添智、增收、節支:
一直以來,認知科學、神經科學和計算科學分別從不同的路徑探索智能的本質:認知科學通過構建認知框架,預測復雜行為;神經科學通過探索神經機制,解釋大腦功能;而計算科學通過模擬神經活動,實現人工智能。近年來,深度神經網絡的成功,促使三門學科進一步交叉融合,將類腦的深度神經網絡模型和認知神經科學實驗相結合,為人工神經網絡的發展提供新的思路。
智源“人工智能的認知神經基礎”重大研究方向基于此研究目標,以及促進學科間交叉互啟的愿景,編撰該白皮書,以期為相關領域的研究者搭建溝通的平臺和橋梁,共同探索心智的奧秘,促進人工智能的可持續發展。
深度學習在大量領域取得優異成果,但仍然存在著魯棒性和泛化性較差、難以學習和適應未觀測任務、極其依賴大規模數據等問題.近兩年元學習在深度學習上的發展,為解決上述問題提供了新的視野.元學習是一種模仿生物利用先前已有的知識,從而快速學習新的未見事物能力的一種學習定式.元學習的目標是利用已學習的信息,快速適應未學習的新任務.這與實現通用人工智能的目標相契合,對元學習問題的研究也是提高模型的魯棒性和泛化性的關鍵.近年來隨著深度學習的發展,元學習再度成為熱點,目前元學習的研究百家爭鳴、百花齊放. 本文從元學習的起源出發,系統地介紹元學習的發展歷史,包括元學習的由來和原始定義,然后給出當前元學習的通用定義,同時總結當前元學習一些不同方向的研究成果,包括基于度量的元學習方法、基于強泛化新的初始化參數的元學習方法、基于梯度優化器的元學習方法、基于外部記憶單元的元學方法、基于數據增強的元學方法等. 總結其共有的思想和存在的問題,對元學習的研究思想進行分類,并敘述不同方法和其相應的算法.最后論述了元學習研究中常用數據集和評判標準,并從元學習的自適應性、進化性、可解釋性、連續性、可擴展性展望其未來發展趨勢.
引言
隨著計算設備并行計算性能的大幅度 進步,以及近些年深度神經網絡在各個領域 不斷取得重大突破,由深度神經網絡模型衍 生而來的多個機器學習新領域也逐漸成型, 如強化學習、深度強化學習[1] [2] 、深度監督 學習等。在大量訓練數據的加持下,深度神 經網絡技術已經在機器翻譯、機器人控制、 大數據分析、智能推送、模式識別等方面取 得巨大成果[3] [4] [5] 。
實際上在機器學習與其他行業結合的 過程中,并不是所有領域都擁有足夠可以讓 深度神經網絡微調參數至收斂的海量數據, 相當多領域要求快速反應、快速學習,如新 興領域之一的仿人機器人領域,其面臨的現 實環境往往極為復雜且難以預測,若按照傳 統機器學習方法進行訓練則需要模擬所有 可能遇到的環境,工作量極大同時訓練成本 極高,嚴重制約了機器學習在其他領域的擴 展,因此在深度學習取得大量成果后,具有 自我學習能力與強泛化性能的元學習便成 為通用人工智能的關鍵。
元學習(Meta-learning)提出的目的是 針對傳統神經網絡模型泛化性能不足、對新 種類任務適應性較差的特點。在元學習介紹 中往往將元學習的訓練和測試過程類比為 人類在掌握一些基礎技能后可以快速學習并適應新任務,如兒童階段的人類也可以快 速通過一張某動物照片學會認出該動物,即 機 器 學 習 中 的 小 樣 本 學 習 ( Few-shot Learning)[6] [7] ,甚至不需要圖像,僅憑描 述就可學會認識新種類,對應機器學習領域 中的(Zero-shot Learning)[8] ,而不需要大 量該動物的不同照片。人類在幼兒階段掌握 的對世界的大量基礎知識和對行為模式的 認知基礎便對應元學習中的“元”概念,即一 個泛化性能強的初始網絡加上對新任務的 快速適應學習能力,元學習的遠期目標為通 過類似人類的學習能力實現強人工智能,當 前階段體現在對新數據集的快速適應帶來 較好的準確度,因此目前元學習主要表現為 提高泛化性能、獲取好的初始參數、通過少 量計算和新訓練數據即可在模型上實現和 海量訓練數據一樣的識別準確度,近些年基 于元學習,在小樣本學習領域做出了大量研 究[9] [10] [11] [12] [13] [14] [15] [16] [17] ,同時為模擬 人類認知,在 Zero-shot Learning 方向也進行 了大量探索[18] [19] [20] [21] [22] 。
在機器學習盛行之前,就已產生了元學習的相關概念。當時的元學習還停留在認知 教育科學相關領域,用于探討更加合理的教 學方法。Gene V. Glass 在 1976 年首次提出 了“元分析”這一概念[23] ,對大量的分析結 果進行統計分析,這是一種二次分析辦法。G Powell 使用“元分析”的方法對詞匯記憶 進行了研究[24] ,指出“強制”和“誘導”意象有 助于詞匯記憶。Donald B.Maudsley 在 1979 年首次提出了“元學習”這一概念,將其描述 為“學習者意識到并越來越多地控制他們已 經內化的感知、探究、學習和成長習慣的過 程”,Maudsley 將元學習做為在假設、結構、 變化、過程和發展這 5 個方面下的綜合,并 闡述了相關基本原則[25] 。BIGGS J.B 將元學 習描述為“意識到并控制自己的學習的狀 態” [26] ,即學習者對學習環境的感知。P Adey 將元學習的策略用在物理教學上[27] , Vanlehn K 探討了輔導教學中的元學習方法 [28] 。從元分析到元學習,研究人員主要關 注人是如何意識和控制自己學習的。一個具 有高度元學習觀念的學生,能夠從自己采用 的學習方法所產生的結果中獲得反饋信息,進一步評價自己的學習方法,更好地達到學 習目標[29] 。隨后元學習這一概念慢慢滲透 到機器學習領域。P.Chan 提出的元學習是一 種整合多種學習過程的技術,利用元學習的 策略組合多個不同算法設計的分類器,其整 體的準確度優于任何個別的學習算法[30] [31] [32] 。HilanBensusan 提出了基于元學習的決 策樹框架[33] 。Vilalta R 則認為元學習是通 過積累元知識動態地通過經驗來改善偏倚 的一種學習算法[34] 。
Meta-Learning 目前還沒有確切的定義, 一般認為一個元學習系統需結合三個要求:系統必須包含一個學習子系統;利用以前學 習中提取的元知識來獲得經驗,這些元知識 來自單個數據集或不同領域;動態選擇學習偏差。
元學習的目的就是為了設計一種機器學習模型,這種模型有類似上面提到的人的 學習特性,即使用少量樣本數據,快速學習 新的概念或技能。經過不同任務的訓練后, 元學習模型能很好的適應和泛化到一個新任務,也就學會了“Learning to learn”。