亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

城市系統是復雜系統的典型代表,其中基于物理建模與人工智能(AI)的融合為提升預測精度、可解釋性與決策支持能力提供了極具前景的新范式。在這一背景下,人工智能擅長捕捉復雜的非線性關系,而物理模型則確保結果符合現實世界的物理規律,并提供可解釋的見解。 本文系統回顧了物理引導人工智能(Physics-Informed AI)在城市應用中的研究進展。我們提出了一種分類體系,將現有方法劃分為三種主要范式:物理-融合AI(Physics-Integrated AI)、物理與AI混合集成(Physics-AI Hybrid Ensemble)、AI-融合物理模型(AI-Integrated Physics),并進一步詳述了七類具有代表性的方法。這一分類體系厘清了物理與AI融合的不同程度與方向,為基于具體應用需求和數據可用性選擇與發展合適的方法提供指導。 我們系統梳理了物理引導AI在八大關鍵城市領域中的應用:能源、環境、經濟、交通、信息、公共服務、應急管理以及城市系統整體層面。分析表明,這些方法通過結合物理規律與數據驅動模型,有效應對城市挑戰,提升了系統的可靠性、效率與適應性。 通過綜述現有方法及其城市應用,我們識別出當前研究中的關鍵空白,并提出未來的研究方向,為構建新一代智能城市系統建模方法奠定基礎。

附加關鍵詞:城市系統,物理引導人工智能,人工智能,物理理論

1 引言

物理學與人工智能(AI)的融合正推動科學研究范式的重大轉變。2024年諾貝爾物理學獎和化學獎分別授予與人工智能相關的成果和科學家【115】【114】,突顯了這一趨勢。這不僅體現了AI方法的深遠影響,也進一步強調了將物理與數據科學相結合在解決復雜系統問題方面的巨大潛力。

物理學通過嚴謹的數學表達與理論體系為解釋世界提供了堅實基礎,而人工智能則憑借其強大的模式提取與預測建模能力,已成為現代科學研究中的重要工具。這兩種范式在不同領域中各有優勢:例如,牛頓力學通過精確的數學公式表達自然規律【112】,而蛋白質結構預測【114】與天氣預報【15】等領域則高度依賴高效的數據驅動建模【54】。

城市系統具有多維復雜性和動態交互特性,傳統基于物理模型的方法或純粹的數據驅動方法往往難以應對這些挑戰【39, 202】。尤其是在涉及非線性關系的任務中,如交通流動或人口遷移,AI方法展現出強大的能力,能夠從大規模歷史數據中提取復雜模式并實現高精度預測。AI在處理大規模異構數據方面也表現出色,廣泛應用于智能交通、電力系統和應急響應等領域,支持實時決策并增強系統響應能力【138】。

值得注意的是,許多城市問題在本質上受物理機制的主導,例如流體力學【172】、熱傳導【144】、污染物擴散【106】、重力驅動流動【153, 210】等。因此,在城市系統中開發物理引導AI方法具有重要意義。本文提出了一個系統的融合框架,用以梳理和分析物理引導AI在城市系統中的發展。

此外,我們將城市系統劃分為七大核心子系統,涵蓋從能源與環境等基礎層,到公共服務和應急管理等上層服務領域。我們系統性地考察了各子系統中物理機制與數據特征之間的交互關系,并探討相應的融合建模需求。

本文結構安排如下:第二章介紹物理引導AI方法的整體框架,并詳述七類代表性融合方法;第三章闡述七大關鍵城市子系統及其背后的物理原理,突出在復雜城市建模中引入物理知識的必要性;第四章按子系統展開綜述,探討主要研究挑戰并總結現有融合方法的實際應用;第五章討論并展望未來研究方向;第六章為全文結語。

付費5元查看完整內容

相關內容

 是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。 人工智能是計算機科學的一個分支。

摘要 — 基礎模型的迅速出現,特別是大規模語言模型(LLMs)和視覺-語言模型(VLMs),為機器人技術帶來了變革性的范式。這些模型在語義理解、高級推理和跨模態泛化方面提供了強大的能力,推動了感知、規劃、控制和人機交互的重大進展。本綜述文章提供了近期發展的系統性總結,按仿真驅動設計、開放世界執行、模擬到現實遷移和適應性機器人等應用進行分類。與現有的側重于孤立能力的綜述不同,本工作強調了集成化、系統級的策略,并評估了它們在現實環境中的實際可行性。文中討論了諸如過程場景生成、策略泛化和多模態推理等關鍵推動趨勢,同時也分析了核心瓶頸,包括有限的體現性、缺乏多模態數據、安全風險和計算約束。從這一視角出發,本文揭示了基于基礎模型的機器人技術的架構優勢與關鍵局限,突出了實時操作、基礎性推理、魯棒性和信任等方面的開放挑戰。最后,本綜述提出了未來研究的路線圖,旨在通過更加穩健、可解釋和具體現化的模型,彌合語義推理和物理智能之間的鴻溝。 關鍵詞 — 機器人技術、大規模語言模型、視覺-語言模型、基礎模型。

I. 引言

大規模語言模型(LLMs)及一般基礎模型的迅速發展,標志著人工智能(AI)領域的重要里程碑,尤其是在自然語言理解和推理方面。這些模型基于具有數十億參數的變換器架構[1],在海量的互聯網規模語料庫上進行預訓練,使其具備了廣泛的世界知識和超越小型模型的新興能力[2]。特別是,像GPT-3[3]這樣的LLM展示了令人印象深刻的少樣本學習能力,無需微調[4],[5],而更近期的模型如GPT-4[6]則展示了先進的推理能力,并支持多模態功能,在多個基準測試中達到了人類水平的表現。

與此同時,機器人技術的快速進展,特別是在感知、學習、控制和規劃方面,為智能物理系統創造了新的機會[7],[8]。盡管如此,機器人系統仍未達到人類級別的智能,特別是在現實世界應用所需的靈活性、適應性和泛化能力方面[9]。它們通常難以跨任務轉移知識、適應不可預見的場景,或展示人類行為特征的細致決策能力。傳統上,機器人的自主性基于顯式編程或特定任務的狹窄學習[10]。這些方法在受限環境中有效,但在復雜、動態的環境中卻限制了可擴展性,并帶來了顯著的挑戰。

為了應對這些局限,LLM與機器人技術的最近集成引入了一種新范式,利用它們豐富的語義知識和推理能力來改善機器人智能體的溝通、規劃和適應性[2]。LLM能夠解讀高級人類指令、推理目標與行動,甚至生成低級控制代碼[11],[12]。這使得機器人能夠應對更廣泛的任務和環境,借助從語言中學習到的廣泛先驗知識。 然而,LLM本身與物理上下文無關。它們缺乏體現性,無法理解度量、傳感器數據或動態物理[13]。因此,將LLM與機器人系統集成帶來了幾個關鍵挑戰。這些挑戰包括將語言融入感知與行動、實現實時響應性以及確保安全可靠的行為。早期的研究通過將LLM與視覺系統[14]、反饋機制[15]和外部知識源[16]結合,已顯示出有希望的結果。然而,如何在多變和不可預測的場景中可靠地將基于語言的智能與物理系統連接,仍是一個未解的問題。

這些挑戰突顯了對當前LLM驅動機器人技術狀態的全面且廣泛綜述的需求。現有的關鍵綜述[2],[13],[17],[18]集中在感知和規劃等傳統子領域,或強調特定方法,往往忽略了在實際環境中這些組件的集成。需要一個更廣泛的視角,系統地審視高級推理與低級控制之間的關系,考慮語言先驗在塑造行為中的作用,并探索將通用LLM適應領域特定約束的可能性。

為了應對這些挑戰,本綜述提供了關于基礎模型及其多模態擴展如何轉變機器人技術的整體綜合。本文回顧了LLM和視覺-語言模型(VLM)的應用,重點討論它們在語義感知、自適應規劃、目標導向交互和自主控制中的應用。本文強調了集成策略,而非孤立地看待這些能力,聚焦于如何滿足實際環境中如基礎性、實時響應和安全等需求。通過模擬到開放世界等多樣環境中的進展,揭示了LLM驅動機器人技術的潛力與當前的局限。討論了關鍵瓶頸,如語義基礎和實時性能,并提出了有助于彌合語言理解與物理執行之間差距的新興解決方案。最后,本文概述了主要的趨勢和開放的研究問題,旨在將語言建模的進展與復雜、現實世界應用中具體現化智能的實際需求連接起來。

付費5元查看完整內容

可解釋人工智能(XAI)在生物醫學圖像分析中變得越來越重要,以促進透明度、信任和深度學習模型的臨床應用。盡管已有多篇綜述回顧了XAI技術,但它們往往缺乏基于模態的視角,忽視了多模態和視覺-語言范式的最新進展,并且在實踐指導上提供的內容有限。本綜述通過全面且有結構的總結,填補了這一空白,專門針對生物醫學圖像分析的XAI方法進行探討。我們系統地對XAI方法進行了分類,分析了它們在生物醫學背景下的基本原理、優點和局限性。提出了一種以模態為中心的分類法,將XAI方法與特定的影像類型對接,突出了不同模態間的可解釋性挑戰。我們還進一步探討了多模態學習和視覺-語言模型在可解釋生物醫學AI中的新興作用,這是前期研究中較少涉及的話題。我們的貢獻還包括對廣泛使用的評估指標和開源框架的總結,以及對持續存在的挑戰和未來方向的深入討論。本綜述為推動生物醫學圖像分析中的可解釋深度學習提供了及時且深入的基礎。

付費5元查看完整內容

量化投資(Quant)是一種技術驅動的資產管理新興方法,其發展正日益受到人工智能進步的深刻影響。深度學習與大語言模型(LLMs)在量化金融中的最新突破,不僅提升了預測建模能力,更實現了基于智能體的自動化流程,預示著該領域可能的范式變革。本文以阿爾法策略為典型范例,系統闡述AI如何重塑量化投資全流程:早期階段:以人工特征工程與傳統統計模型為核心,建立標準化阿爾法因子生產流程;深度學習革命:實現從數據處理到訂單執行的端到端規模化建模;LLM時代延伸:突破預測邊界,使智能體能處理非結構化數據、自主生成阿爾法因子,并支持自迭代工作流。1 引言資產管理作為金融行業至關重要且持續擴張的領域,**量化投資(Quant)**已成為其核心方法論之一。量化投資策略通過統計分析、優化技術和日益普及的AI算法,系統性地識別并利用市場無效性。得益于數據可用性、計算能力和技術創新的指數級增長,這些方法顯著提升了投資決策能力,為金融市場參與者提供了競爭優勢。在眾多量化投資策略中,阿爾法策略因其捕捉市場無效性的強大能力,以及與AI預測方法天然的適配性而備受關注。"阿爾法"的核心理念在于預測單一資產相對于市場整體表現(如股票指數)的超額收益,這也是投資組合經理的核心目標。阿爾法策略的開發通常包含四個關鍵步驟:數據預處理→模型預測→組合優化→訂單執行(詳見2.2小節)。這些子任務雖各具特點,卻緊密關聯,共同服務于"控制風險下最大化超額收益"的目標。相較于高頻交易、套利等策略,阿爾法策略通過挖掘錯誤定價展現出卓越的效能,因而成為量化投資領域研究最密集、市場份額最高的核心技術。本文即以阿爾法策略為范式,探討AI如何重塑量化投資。近年來,**深度學習(DL)**在阿爾法策略中的應用已展現出顯著成效,能夠識別傳統量化方法難以捕捉的金融數據復雜模式。與此同時,大語言模型(LLMs)(如GPT系列[4]、BERT[38]及其金融衍生模型)在上下文理解、精準解讀和類人推理方面表現突出,為量化投資帶來了無限可能。本文聚焦DL與LLMs在量化投資(尤其是阿爾法策略)中的技術演進、應用場景與協同優勢,系統綜述現有研究,并探討LLMs增強DL方法的潛力、挑戰與局限。 1.1 阿爾法策略的技術演進阿爾法策略的發展可分為三個階段(圖1):人工標注階段:依賴研究者經驗識別交易信號,通過傳統統計模型刻畫市場規律。但受限于金融市場復雜性,模型難以涵蓋全部相關因素,策略效果仍高度依賴人類專家的判斷與執行。深度學習階段:DL突破了傳統方法的瓶頸,在空間關聯性[142]、長期時序依賴[178]、新聞情緒[68]等因子挖掘中表現出色。然而存在過擬合風險和可解釋性不足等挑戰。LLM智能體階段:LLMs憑借多模態數據處理和自主推理能力,正推動量化投資進入AI自動化時代。當前LLMs在阿爾法策略中主要承擔兩類角色:預測器(4.1節)與智能體(4.2節),但其實際部署仍處于早期階段(局限性分析見4.3節)。1.2 研究動機與貢獻盡管DL與LLMs在阿爾法策略中的應用研究激增,但現有工作多聚焦孤立任務,缺乏對量化投資全流程的統一視角。此外,量化投資作為產學研緊密結合的領域,現有綜述尚未充分彌合LLMs與DL模型結合的技術鴻溝,也缺乏從實際應用出發的前瞻框架。為此,本文旨在:首次系統性綜述DL與LLMs在阿爾法策略全流程的研究,建立跨任務關聯的整體視角;從實踐需求反推科學問題,基于真實投資場景的痛點揭示共性研究挑戰;三階段技術對比(傳統統計模型→DL方法→LLM方法),指明迭代發展中的關鍵缺口與未來方向。本文框架如圖2所示,核心貢獻包括:建立首個覆蓋阿爾法策略全流程的DL與LLMs研究圖譜;通過跨學科視角,從實際應用提煉關鍵研究命題;系統對比三階段技術路線的優劣,推動阿爾法策略向下一階段演進。

付費5元查看完整內容

本文提供了對去噪擴散概率模型(DDPMs)的數學嚴謹介紹,DDPMs 有時也被稱為擴散概率模型或擴散模型,主要用于生成式人工智能。我們提供了 DDPMs 的基本數學框架,并解釋了訓練和生成過程背后的主要思想。本文還回顧了文獻中一些選定的擴展和改進,如改進版 DDPMs、去噪擴散隱式模型、無分類器擴散引導模型以及潛在擴散模型。

1 引言

生成模型的目標是基于從未知潛在分布中采樣得到的數據集,生成新的數據樣本。為了實現這一目標,已經提出了許多不同的機器學習方法,例如生成對抗網絡(GANs)[12]、變分自編碼器(VAEs)[22]、自回歸模型[47]、歸一化流[37]和能量基模型[25]。本文將介紹去噪擴散概率模型(DDPMs),這是一類生成方法(有時也被稱為擴散模型或擴散概率模型),其基于重建一個擴散過程的思想,擴散過程從潛在分布開始,逐漸向其狀態添加噪聲,直到最終狀態完全是噪聲,然后反向重建。通過這種反向重建,純噪聲轉變為有意義的數據,因此 DDPMs 提供了一種自然的生成框架。我們旨在提供對 DDPMs 背后動機思想的基本但嚴謹的理解,并對文獻中一些最具影響力的基于 DDPM 的方法進行精確描述。

DDPMs 最初在 [44] 中提出,并在 [15] 中進一步推廣,已經能夠在圖像合成和編輯 [31,35,36,38,40]、視頻生成 [17,53]、自然語言處理 [3,26] 和異常檢測 [50,52] 等許多領域取得最先進的成果。在經典的形式中,DDPM 是一個由兩個隨機過程組成的框架,即正向過程和反向過程。正向過程——擴散過程——從初始時間步驟的(近似)潛在分布開始(例如,它的初始狀態可以是數據集中的隨機樣本),然后逐漸向其狀態添加噪聲,直到其終止時間步驟的狀態(近似)完全是噪聲。反向過程——去噪過程——是一個參數化過程,從(終止時間步驟)完全噪聲的狀態開始。在 DDPM 的背景下,關鍵思想是學習反向過程的參數,使得反向過程每個時間步驟的分布近似與正向過程對應時間步驟的分布相同。如果這一目標得以實現,反向過程可以解釋為逐漸去除噪聲,直到恢復到正向過程的初始分布。從這個意義上講,反向過程逐漸去噪其完全噪聲的初始狀態。一旦找到合適的反向過程參數,生成過程便是從反向過程采樣生成的。 在第2節中,我們將為 DDPMs 構建一個一般的數學框架,并解釋反向過程的訓練和生成樣本的基本思想。接著,在第3節中,我們將考慮該框架的最常見特例,即噪聲為高斯噪聲,反向過程由去噪人工神經網絡(ANN)控制的情況。在第4節,我們將討論文獻中用于評估生成樣本質量的一些指標。最后,在第5節中,我們將討論一些文獻中提出的最流行的基于 DDPM 的方法,如改進版 DDPMs(見 [15])、去噪擴散隱式模型(DDIMs)(見 [45])、無分類器擴散引導模型(見 [16])以及潛在擴散模型(見 [38])。特別是,無分類器擴散引導模型和潛在擴散模型展示了如何引導反向過程生成來自不同類別的數據以及基于給定文本生成數據。 本文的支持代碼可在 //github.com/deeplearningmethods/diffusion_model 獲得。

2 去噪擴散概率模型(DDPMs)

在本節中,我們將介紹去噪擴散概率模型(DDPMs)的主要思想。具體來說,我們將首先介紹并討論DDPMs的一般數學框架,并在2.1小節中詳細闡述其一些基本性質;接著,我們將在2.2小節中討論DDPMs的訓練目標,分析其如何實現生成建模的目標;最后,在2.3小節中,我們將基于這一訓練目標,提出一種簡化的DDPM方法。

3 帶有高斯噪聲的DDPMs

在本節中,我們考慮在轉移核由高斯分布給出時,帶有馬爾可夫假設的DDPMs。本節中考慮的設置和方法基本上與[15]中提出的相對應。直觀而言,在這個設置中,我們認為正向過程逐漸向訓練樣本添加高斯噪聲,反向過程則旨在逐漸去除噪聲,從而恢復原始的訓練樣本。 我們首先在3.1小節中討論高斯分布的一些基本性質。然后,在3.2小節中,我們介紹并描述一個涉及高斯分布作為轉移核的DDPM框架。接著,在3.3小節中,我們討論這種轉移核選擇對正向過程分布的影響,并在3.4小節中探討此選擇對上述引理2.9中訓練目標的上界的影響。受到前述章節啟發,我們在3.5小節中描述了帶有高斯噪聲的DDPM的訓練和生成方案。最后,在3.6小節中,我們指出了一些可能的人工神經網絡(ANNs)架構選擇,這些架構出現在3.5小節方法描述中。

4 生成模型的評估

在生成建模的背景下,特別是在擴散模型中,評估生成數據的質量和性能是至關重要的。因此,找到穩健的評估指標對于確保模型能夠生成期望的結果至關重要。在本節中,我們考慮了用于這一目的的兩類指標:內容變異指標和內容不變指標。這些指標提供了對模型在不同方面能力的理解。在4.1小節中,我們詳細解釋了兩種內容不變指標:生成模型評估指標(Inception Score,IS)和Fréchet生成模型距離(Fréchet Inception Distance,FID);在4.2小節中,我們概述了最常用的內容不變評估指標。

付費5元查看完整內容

當前的人工智能(AI)模型通常通過精細的參數調整和優化技術來提升性能。然而,模型背后的基本設計原則相對較少受到關注,這可能限制我們對其潛力和局限性的理解。本綜述探討了塑造現代AI模型的多樣化設計靈感,即腦啟發的人工智能(BIAI)。我們提出了一個分類框架,將BIAI方法分為物理結構啟發型和人類行為啟發型模型。我們還審視了不同BIAI模型在實際應用中的表現,突出其實際優勢和部署挑戰。通過深入探討這些領域,我們提供了新的見解,并提出了推動創新和解決當前領域內空白的未來研究方向。本綜述為研究人員和從業者提供了BIAI領域的全面概覽,幫助他們利用其潛力,加速AI開發的進步。

1 引言

人工智能(AI)的一個基本目標是創造能夠像人類一樣學習和思考的機器。為了實現這一目標,人工學習器在多個領域中取得了顯著的里程碑,包括目標和語音識別【131, 151】、圖像處理【115】、機器人技術【50】、醫學數據分析【161】、自然語言處理(NLP)【114】等。這些成功加速了AI的發展,使其在某些領域能夠與人類匹敵甚至超越。例如,AI模型現在在某些特定任務中表現優于人類,如語言翻譯【134】、圖像識別【63】甚至戰略游戲如國際象棋和圍棋【155】。最近,許多公司提出了一系列能夠理解圖像、音頻、視頻和文本的多模態模型,其能力類似于人類【3, 7, 169】。這種快速的進步彰顯了AI在各個領域中的變革潛力,推動了技術能實現的邊界。然而,旨在創造具有類似人類思維和推理能力的機器的一般AI方法在可擴展性、魯棒性、能效、可解釋性、學習效率和適應性方面仍然存在局限性【98】。 人類大腦被認為是最復雜的信息處理系統,能夠解決諸如學習、推理和感知等復雜任務。基于對人腦研究的最新進展,研究人員正在將神經科學的見解整合到AI系統中,旨在開發能夠更接近人類行為的感知、推理和行動的腦啟發人工智能(BIAI)系統【128, 163】。這一努力源于對生物智能的基本原理的理解,并希望利用這些原理來構建更智能、適應性更強和更魯棒的AI系統。什么是腦啟發人工智能(BIAI)?BIAI指的是從人類大腦和神經系統的生物結構、功能和原理中獲得靈感的AI系統和算法。它專注于復制或模仿生物體中觀察到的復雜過程和功能,以在人工系統中實現更類似于人類或大腦的行為【197】。與一般AI算法相比,BIAI通常集中于人類行為的特定方面,如從經驗中學習、適應新環境以及關注重要信息。在這篇全面綜述中,BIAI文獻大致分為物理結構(PS)啟發型模型和人類行為(HB)啟發型模型。PS啟發型模型是指模仿生物神經元、突觸和神經回路結構的模型,用于執行諸如學習、推理和決策等任務。代表性模型包括多層感知器(MLP)、人工神經網絡(ANNs)以及最近的脈沖神經網絡(SNNs)。HB啟發型模型被定義為復制人類行為中觀察到的生物機制和過程的模型。這些模型旨在捕捉生物系統的動態,同時提供對人類如何感知、學習、適應和與環境互動的見解。注意力機制、遷移學習和強化學習是常見的人類行為啟發的深度學習方法。BIAI與一般AI的區別在于它們在AI領域中的不同方法和目標【31, 77】。具體而言,一般AI并不一定受到人類大腦具體工作方式的啟發,而是旨在更廣泛的意義上達到或甚至超越人類水平的智能。相反,設計BIAI系統的目的是復制或模仿人類認知背后的生物機制和過程。這些系統通常在圖像識別和機器人控制等任務中表現出色,但它們可能不具備人類智能的全方位能力。BIAI與傳統AI的更全面比較見表1。為什么BIAI重要?BIAI的重要性主要體現在兩個方面。一方面,BIAI在適應性、泛化能力和可解釋性等許多方面有潛力超越傳統的AI方法。另一方面,BIAI模型旨在模仿大腦的結構和功能,從而增加其生物學的合理性。這種與生物學原理的契合不僅加深了我們對智能的科學理解,也為神經科學和AI研究之間的合作創造了新的機會。本質上,通過從人類大腦——最先進的信息處理系統——中汲取靈感,研究人員正在為開發可能達到甚至超越人類能力的智能系統奠定基礎【47, 103, 125】。

**1.1 動機

人類大腦是生物復雜性的頂峰。它不僅調節所有身體功能和過程,還使高級認知能力得以實現,如思維、記憶和情感【16】。將神經科學與AI系統相結合有助于解決許多現實應用中的緊迫問題和某些瓶頸【204】。一方面,人類大腦在處理大量信息時效率極高,同時消耗的能量相對較少。模仿其架構和過程可以使AI系統在操作上同樣高效和優雅。例如,傳統機器人無法在復雜環境中及時獲取環境知識,這限制了其做出準確快速決策的能力。此外,在該領域中,低學習效率、泛化能力差、難以制定目標導向的策略以及對動態環境的慢適應性等問題仍然存在。將BIAI整合到機器人系統中可以顯著提高機器人的運動和操控能力【132】。此外,BIAI還可以應用于解決許多其他現實問題,如醫學診斷、自動駕駛汽車、聊天機器人和虛擬助手、網絡威脅檢測、輔導系統、供應鏈優化、內容創作和個性化推薦。這些應用突顯了BIAI在不同方面的廣泛影響和相關性。另一方面,理解大腦的機制不僅為我們提供了有關智能如何產生的見解,還為解決AI中的復雜問題提供了線索。通過研究生物神經網絡,研究人員可以開發更好地捕捉認知和感知復雜性的算法和架構。例如,神經網絡作為AI的基礎和基本模型之一,汲取了大腦結構和計算過程的靈感。作為現代AI的基石,神經網絡推動了醫療、金融、交通和娛樂等領域的進步。它們從數據中學習并揭示有價值的見解的能力使其成為解決復雜挑戰和推動AI創新的關鍵。此外,人類大腦具有顯著的魯棒性和適應性,能夠從經驗中學習,處理噪聲和不確定數據,并將知識泛化到新情境【41】。通過模仿大腦的彈性和適應性,BIAI旨在創造更為魯棒和多功能的AI系統。這種方法還強調了透明性、可解釋性和責任感,從而優先考慮倫理AI的發展。以生物系統為模型的智能化推動了可信賴且符合人類價值觀的AI的創建。盡管BIAI在推動AI和機器人技術方面具有巨大的潛力【102】,但它也面臨著一些挑戰和局限性。人類大腦是一個極其復雜的器官,擁有數十億的神經元和數萬億的突觸,這些神經元和突觸組織成復雜的網絡,控制著認知、感知和行為。在人工神經網絡(ANNs)中復制這種復雜性帶來了巨大的計算和工程挑戰【160】。由于人腦的復雜性,盡管經過了數十年的研究,我們對大腦的理解仍然不完整。許多大腦功能方面,如學習、記憶和意識,仍然理解不充分【152】。這種理解的缺乏使得將神經科學的見解轉化為BIAI的實際算法和架構的努力變得更加復雜。此外,BIAI模型的復雜性和不透明性妨礙了我們理解其決策過程的能力。這種明顯缺乏可解釋性和透明性的情況在安全關鍵型應用(如醫療保健和自動駕駛車輛)中引發了對責任感、偏見和可信賴性方面的重大擔憂【78, 91】。這些不足促使我們對BIAI進行全面研究。在文獻中,已有幾篇綜述論文從不同的應用場景和不同的視角調查了BIAI的算法。然而,大多數研究僅關注某一特定方面,如算法、應用場景或代價函數,缺乏對當前BIAI研究進展的詳細介紹和討論的全面綜述。在這篇綜述文章中,我們基于算法的靈感來源和學習機制對當前BIAI研究進行了分類和審視。對于每個BIAI算法,在介紹其特點和適用場景后,我們討論了其優缺點。然后,我們討論了當前BIAI模型的開放問題,并列出了幾個未來的研究方向。我們希望這篇全面綜述能為相關領域的研究人員提供有用的見解。

**1.2 相關綜述與新穎性

之前的研究涵蓋了腦啟發/類腦學習或計算范圍內的類似主題【62, 74, 132, 149】,但沒有一篇集中探討神經科學為AI模型帶來的具體知識,也沒有全面詳細地介紹BIAI系統。在【132】中,作者試圖總結腦啟發算法在智能機器人中的進展,深入探討了視覺認知、情感調節決策、肌肉骨骼機器人技術和運動控制等關鍵領域。Ou等人【122】介紹了類腦計算模型和芯片、它們的演變歷史、常見應用場景和未來前景。Hassabis等人【62】探討了AI與神經科學之間的歷史聯系,并研究了受人類和其他動物神經計算研究啟發的AI的最新進展。在【106】中,作者展示了機器學習和神經網絡如何改變動物行為和神經成像研究領域。關于人工神經網絡中的腦啟發學習,可以在【149】中找到生物學基礎和算法介紹。這篇綜述主要集中在如何從人類大腦的物理結構中學習。然而,沒有一篇綜述注意到并審視了受人類行為和學習機制啟發的AI模型。此外,他們也未全面討論AI可以從人類大腦和神經系統中學習哪些部分來設計模型。在本綜述中,我們主要回答以下問題:什么是BIAI?BIAI與一般AI有什么區別?BIAI能為我們帶來哪些優勢?我們可以從人類大腦的哪些角度來設計AI模型?哪些BIAI模型已經在現實世界中使用?引入BIAI可以進一步推動哪些研究領域?當將神經科學與AI模型相結合時,研究人員面臨哪些挑戰?當前BIAI技術中存在哪些差距,未來可以在哪些方面開展工作?通過回答這些問題,我們希望研究人員能夠加深對BIAI系統的理解,并提高他們為不同應用設計更合適的BIAI算法的能力。

**1.3 貢獻

本文的覆蓋范圍如圖1所示。我們的主要貢獻總結如下:

  • 我們引入了神經科學和人類行為研究中的知識和見解,強調了AI如何從神經結構、學習機制、注意力和焦點、記憶與回憶、認知過程以及人類大腦中觀察到的創造力和想象力中學習。
  • 我們將BIAI研究分為兩大類:物理結構啟發型模型和人類行為啟發型模型,為理解該領域的不同方法提供了框架。
  • 我們探討了BIAI模型的多種應用,包括它們在機器人技術、醫療保健、情感感知和創意內容生成中的應用,展示了這些模型在各個領域中的廣泛潛力。
  • 我們討論了BIAI開發和實施過程中面臨的挑戰,例如理解大腦功能、與神經科學的整合以及構建高效、魯棒、倫理、具有意識且可解釋的模型。我們還概述了應對這些挑戰的未來研究方向。 本文的其余部分組織如下。第2節總結了可以為AI系統提供信息的神經科學和人類大腦功能知識。接下來,綜述按照圖1所示的分類結構展開。第3節討論了BIAI的主要類別,即物理結構啟發型模型和人類行為啟發型模型。第4節探討了BIAI在各個領域的實際應用。在第5節中,我們概述了當前BIAI方法面臨的一般挑戰。第6節重點介紹了未來研究的幾個有前途的方向。最后,在第7節中總結了本次綜述。

付費5元查看完整內容

在不斷發展的深度學習領域,數據的數量和質量問題一直是一個長期存在的難題。最近大語言模型(LLMs)的出現為合成數據生成提供了一種以數據為中心的解決方案,緩解了現實世界數據的限制。然而,目前對這一領域的研究缺乏統一的框架,大多停留在表面。因此,本文基于合成數據生成的一般工作流程,整理了相關研究。通過這樣做,我們突出了現有研究中的空白,并概述了未來研究的潛在方向。本研究旨在引導學術界和工業界向更深入、更系統地探究LLMs驅動的合成數據生成的能力和應用。

在深度學習領域不斷演變的背景下,數據數量和質量的問題一直是一個長期存在的困境。大語言模型(LLMs)的革命性出現引發了深度學習領域的顯著范式轉變(Zhang et al., 2023a; Guo et al., 2023; Bang et al., 2023)。盡管有這些進展,大量高質量數據仍然是構建穩健自然語言處理(NLP)模型的基礎(Gandhi et al., 2024)。具體來說,這里的高質量數據通常指的是包含豐富監督信號(通常以標簽形式)并與人類意圖緊密對齊的多樣化數據。然而,由于高成本、數據稀缺、隱私問題等原因,依賴于人類數據來滿足這些需求有時是具有挑戰性甚至是不現實的(Kurakin et al., 2023)。此外,多項研究(Hosking et al., 2023; Singh et al., 2023; Gilardi et al., 2023)表明,人類生成的數據由于其固有的偏見和錯誤,可能并不是模型訓練或評估的最佳選擇。這些考慮促使我們更深入地探討一個問題:是否有其他更有效和可擴展的數據收集方法可以克服當前的限制?

鑒于LLMs的最新進展,它們展示了生成與人類輸出相當的流暢文本的能力(Hartvigsen et al., 2022; Sahu et al., 2022; Ye et al., 2022a; Tang et al., 2023; Gao et al., 2023a),由LLMs生成的合成數據成為了人類生成數據的一種可行替代品或補充。具體來說,合成數據旨在模仿真實世界數據的特征和模式(Liu et al., 2024)。一方面,LLMs通過廣泛的預訓練,積累了豐富的知識庫,并展現出卓越的語言理解能力(Kim et al., 2022; Ding et al., 2023a),這為生成真實的數據奠定了基礎。另一方面,LLMs深厚的指令遵循能力允許在生成過程中實現更好的可控性和適應性,從而能夠為特定應用創建定制的數據集,并設計更靈活的流程(Eldan and Li, 2023)。這兩個優勢使LLMs成為極具前景的合成數據生成器。

作為LLMs的一項關鍵應用,合成數據生成對于深度學習的發展具有重要意義。如圖1所示,LLMs驅動的合成數據生成(Li et al., 2023c; Wang et al., 2021; Seedat et al., 2023)使整個模型訓練和評估過程實現自動化,最小化了人類參與的需求(Huang et al., 2023),從而使深度學習模型的優勢可以應用于更廣泛的領域。除了提供可擴展的訓練和測試數據供應之外,LLMs驅動的合成數據生成還可能為開發下一代LLMs鋪平道路。來自TinyStories(Eldan and Li, 2023)和Phi系列(Gunasekar et al., 2023; Li et al., 2023b)的見解強調了數據質量對于有效模型學習的重要性,而LLMs賦予我們主動“設計”模型學習內容的能力,通過數據操作顯著提高了模型訓練的效率和可控性。截至2024年6月,Hugging Face上已有超過300個被標記為“合成”的數據集,許多主流LLMs利用高質量的合成數據進行訓練,包括Alpaca(Taori et al., 2023)、Vicuna(Zheng et al., 2023)、OpenHermes 2.5和Openchat 3.5(Wang et al., 2023a)。

盡管看似簡單,但生成同時具有高正確性和足夠多樣性的合成數據集需要精心設計過程,并涉及許多技巧(Gandhi et al., 2024),使得LLMs驅動的合成數據生成成為一個非平凡的問題。雖然大多數現有工作通常針對各種任務(如預訓練(Gunasekar et al., 2023; Li et al., 2023b; Eldan and Li, 2023)、微調(Mukherjee et al., 2023; Mitra et al., 2023; Xu et al., 2023a)、評估(Feng et al., 2023; Wei et al., 2024))和不同領域(如數學(Yu et al., 2023a; Luo et al., 2023a)、代碼(Luo et al., 2023b; Wei et al., 2023b)、指令(Honovich et al., 2023a; Wang et al., 2023d))進行數據生成,但它們共享許多共同的理念。為了應對LLMs驅動的合成數據生成這一新興領域中缺乏統一框架的問題,并開發通用工作流程,本綜述調查了最近的研究,并根據生成、策展和評估三個密切相關的主題進行組織,如圖2所示。我們的主要目的是提供該領域的全面概述,確定關鍵關注領域,并突出需要解決的空白。我們希望為學術界和工業界帶來見解,并推動LLMs驅動的合成數據生成的進一步發展。

付費5元查看完整內容

智能規劃又叫自動規劃,主要研究在復雜環境下,如何通過自動化的方式生成可行的行動序列,以實現從初始狀態到達目標狀態。大語言模型是指使用大量文本數據訓練的深度學習生成式模型,可以生成自然語言文本或理解語言文本的含義。當前圍繞如何讓大語言模型在強大的常識性知識基礎上獲得生成式智能規劃能力已然成為當下研究的熱潮。本文從大語言模型的視角入手,首先對智能規劃的定義和發展進行概述、簡要介紹了傳統智能規劃的方法;其次基于大語言智能體與智能規劃的緊密關系,介紹了大語言模型的架構和典型的大模型智能體;再次重點圍繞大模型的智能規劃,梳理了規劃語言學習、思維鏈推理、反饋優化和流程自動化共4類規劃方法;最后結合當前的挑戰與困難,介紹大模型進行智能規劃的前沿研究展望。

付費5元查看完整內容

近期在基礎模型上的發展,如大型語言模型(LLMs)和視覺-語言模型(VLMs),它們基于大量數據訓練,促進了跨不同任務和模態的靈活應用。它們的影響覆蓋了多個領域,包括健康護理、教育和機器人技術。本文提供了基礎模型在現實世界機器人應用中的概覽,主要強調在現有機器人系統中替換特定組件。總結包括了基礎模型中輸入輸出關系的視角,以及它們在機器人技術領域內的感知、運動規劃和控制中的作用。本文最后討論了實際機器人應用面臨的未來挑戰和含義。

近期在人工智能領域的進步顯著擴展了機器人的操作能力,使它們能夠承擔多種多樣的活動【1-5】。雖然最初機器人的部署主要限于大規模生產環境【6-11】,但現在工業機器人的適用性已經擴展到小批量和高多樣性生產領域,包括室內空間和災難現場【12-15】。這種擴散不僅僅限于環境多樣性的增加;它還擴展到了任務范圍的擴大,包括日常活動,如整理【16-18】、洗滌【19,20】、擦拭【21,22】和烹飪【23,24】。機器學習為滿足這些機器人系統的需求提供了一種方式。然而,僅僅在特定領域數據上訓練每個模型對于多樣的機器人、任務和環境來說是不夠的。越來越多地需要開發可以使用單一的、預訓練的系統或模塊應用于各種機體、任務和環境的機器人。 解決這一挑戰的一個方案是引入基礎模型【25】。基礎模型是在大量數據上訓練的模型,可以通過上下文學習、微調或甚至零樣本的方式輕松應用于廣泛的下游任務【26,27】。顯著的例子包括大型語言模型(LLMs)如GPT【27】和視覺-語言模型(VLMs)如CLIP【28】,其中語言是結合各種類型模態的粘合劑。這些基礎模型的影響是顯著的,有幾篇綜述文章討論了它們在不同領域的影響【29-32】。Wang等人【29】和Zeng等人【30】進行了關于大型語言模型在機器人學中應用的綜述,而Firoozi等人【31】和Hu等人【32】進行了更廣泛的綜述,關注于基礎模型在機器人學中的應用。在本文中,我們總結了基礎模型對現實世界機器人的適用性,旨在加速它們在實際機器人應用中的采用。與其他綜述文章相比,我們提供了如何從基礎模型的輸入輸出關系以及機器人學中的感知、運動規劃和控制的角度,用基礎模型替換現有機器人系統中的特定組件的總結。 本研究的結構如圖1所示。在第2節中,我們將描述基礎模型本身。特別地,我們將根據它們使用的模態類型,例如視覺【33,34】、語言【35-41】等,以及它們可以應用的下游任務類型進行分類。在第3節中,我們將基于當前應用【2,3,42】描述如何將基礎模型應用于機器人學。一般來說,機器人需要配備感知模塊、規劃模塊和控制模塊。從這個角度,我們分類了可以將基礎模型應用于現實世界機器人學的方式,包括低級感知、高級感知、高級規劃和低級規劃。此外,我們還將解釋在訓練直接連接低級感知和低級規劃的映射時,對機器人學的數據增強。在第4節中,我們將描述包括機器人實體在內的基礎模型,即機器人基礎模型,包括關于如何就模型架構、數據集和學習目標制作這些機器人基礎模型的討論。在第5節中,我們將描述使用基礎模型的機器人、任務和環境。我們將任務分類為導航、操縱、帶有操縱的導航、運動和交流。最后,我們將討論未來的挑戰并提出我們的結論。

“基礎模型”一詞最初在【25】中被引入。在這項綜述中,我們將簡單描述在機器人應用中使用的基礎模型的類型,以及下游任務,將關于基礎模型本身的討論推遲到【25】。在2012年,深度學習因ILSVRC-2012比賽的獲勝模型而獲得機器學習社區的主流關注【43】。2017年,由【44】介紹的Transformer模型,促進了自然語言處理(NLP)【45】和計算機視覺【46】領域的重大進步。到2021年,一個經過大量數據訓練、能夠輕松應用于廣泛下游任務的模型被稱為“基礎模型”【25】。基礎模型的特點主要有三個:

上下文學習 * 規模定律 * 同質化

上下文學習使得僅用幾個例子就能完成新任務成為可能,無需重新訓練或微調。規模定律允許隨著數據、計算資源和模型大小的增加而持續提升性能。同質化允許某些基礎模型架構以統一的方式處理多種模態。 在這一章中,我們從在機器人學中的適用性的角度對基礎模型進行分類。機器人利用基礎模型的最關鍵標準是選擇使用哪些模態。本章從語言、視覺、音頻、3D表示和各種其他模態的角度討論了基礎模型的類型和它們可以執行的下游任務。在利用每種模態的背景下,我們進一步從網絡輸入和輸出的角度對基礎模型進行分類。概覽顯示在圖2中。請注意,我們的目標不是在這里全面覆蓋基礎模型;我們的重點仍然在于解決模態差異和基礎模型的分類。

通常,機器人的行為由感知、規劃和控制組成。在本研究中,我們將感知分為兩個類別:低級感知和高級感知。同時,我們將規劃和控制分別稱為高級規劃和低級規劃。加上對學習這些組成部分的數據增強,我們將機器人對基礎模型的利用分為以下五個類別。 * 低級感知 * 高級感知 * 高級規劃 * 低級規劃 * 數據增強

這些類別之間的關系如圖3所示。用于低級感知的基礎模型包括在圖像或3D表示中的語義分割和邊界框提取,以及在各種模態中的特征提取。用于高級感知的基礎模型涉及將從低級感知獲得的結果轉換和利用成如地圖、獎勵和運動約束等形式。用于高級規劃的基礎模型執行更高級別的抽象任務規劃,不包括直接控制。用于低級規劃的基礎模型執行較低級別的運動控制,包括關節和末端執行器控制。用于數據增強的基礎模型在執行連接低級感知和低級規劃的學習時,通過數據增強增強魯棒性。 在實踐中,通過組合這五種利用方法創建了各種應用。主要分為四種類型,如圖4所示。 (i) 進行低級感知,然后用高級規劃規劃行為。 (ii) 通過低級感知和高級感知提取獎勵和運動約束,并用于強化學習和軌跡優化。 (iii) 通過低級感知和高級感知生成地圖、場景圖等,并將它們作為任務規劃的基礎。 (iv) 使用數據增強,穩健地進行直接關聯低級感知的特征提取和控制輸入的端到端學習。 值得注意的是,也有一些研究方法不適用于這一框架。 從這些角度出發,我們選取了幾篇具有代表性的論文并在表1中進行了總結。

付費5元查看完整內容
北京阿比特科技有限公司