亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

自文(wen)明(ming)誕(dan)生以(yi)(yi)來,人(ren)類(lei)一(yi)直在(zai)努力理解智(zhi)能(neng)的(de)(de)本質。 隨著計算機的(de)(de)出現,人(ren)們(men)開始嘗(chang)試用計算機算法來模擬(ni)人(ren)類(lei)智(zhi)能(neng)——這(zhe)一(yi)領(ling)域(yu)由計算機科(ke)學家約翰·麥(mai)卡錫(John McCarthy)在(zai) 1956 年命名為“人(ren)工智(zhi)能(neng)”(Artificial Intelligence,AI),并(bing)在(zai)近年來迎來了爆發式的(de)(de)發展。 人(ren)工智(zhi)能(neng)研究的(de)(de)許多努力集中(zhong)在(zai)對人(ren)類(lei)認知(zhi)標志性(xing)能(neng)力的(de)(de)研究與復現,例(li)如下智(zhi)能(neng)棋(qi)類(lei)游戲、語言能(neng)力、視覺(jue)感知(zhi)以(yi)(yi)及創造力。在(zai)撰(zhuan)寫本文(wen)時,我們(men)已經在(zai)上(shang)述(shu)領(ling)域(yu)取得了多項成功嘗(chang)試——如今,計算機在(zai)國際象棋(qi)與圍棋(qi)上(shang)可以(yi)(yi)擊敗任何人(ren)類(lei)棋(qi)手,可以(yi)(yi)在(zai)不借(jie)助詞(ci)典的(de)(de)情況下將英(ying)語翻(fan)譯成中(zhong)文(wen),可以(yi)(yi)在(zai)擁擠城(cheng)市中(zhong)實現自動駕駛,還能(neng)生成在(zai)藝術比賽中(zhong)獲獎(jiang)的(de)(de)詩歌(ge)與繪畫作品。

然而,公平地說,我們依然未能完全理解何謂類人智能或“通用”智能,以及如何復現它。 上述大多數人工智能的典型案例,都是由深度學習(Deep Learning)驅動的。 深度學習是一類算法,其歷史可追溯到 20 世紀早期——當時人們嘗試以一種高度抽象的方式,將生物大腦中神經元的連接與工作機制在計算機中加以復現。這樣的系統被稱為(人工)神經網絡(neural networks),這是類比于生物神經網絡的命名。它由稱為“神經元”(neurons)的計算單元組成,這些單元通常按層次結構組織成多層(深度學習中的“深”即指擁有許多層的神經網絡)。 神經元包含可調節的參數,可以通過一種稱為學習(learning)的優化過程來針對特定任務進行調整。人工智能的一個分支領域——機器學習(Machine Learning, ML),則專注于研究用于設計和優化此類系統的數學方法。 深度學習(Deep Learning)是一個總稱,指依賴人工神經網絡的機器學習算法,而這些神經網絡通常由大量層結構組成。 近年來,各類人工神經網絡架構迅速涌現,它們分別提出了不同的連接模式以及學習系統所需執行的內部計算方式。 幾何深度學習(Geometric Deep Learning)是深度學習的一個分支領域 [5, 6],專注于為具有非歐幾里得結構(如圖、流形)的數據開發人工神經網絡。傳統的深度學習模型通常處理類網格(grid-like)結構的數據(如圖像、時間序列、文本),但許多現實世界問題涉及更復雜、不規則的幾何結構。 該領域尤其關注從幾何先驗(geometric priors)角度分析神經網絡。不同模型通過在具有對稱群(symmetry groups)結構的域上對信號建模,引入歸納偏置(inductive bias),以此對抗維度災難(curse of dimensionality)。幾何深度學習為將物理對稱性等先驗知識融入新型神經網絡架構的設計提供了一種結構化方法,同時還能在統一框架下歸納與理解現有的成功模型。

付費5元查看完整內容

相關內容

在過去十年中,人工智能(AI)取得了顯著突破,尤其是在深度學習和基礎模型(foundation models)領域——這類模型屬于次符號(sub-symbolic)機器學習方法,依賴于擁有數百億參數的深度神經網絡。由于這類模型的可解釋性和可理解性非常有限,它們通常被稱為“黑箱”模型。這項技術在提升交互能力、感知能力以及自然語言處理方面發揮了關鍵作用,有時甚至超越了人類的表現。因此,一些研究者開始將AI等同于深度學習和基礎模型。然而,我認為這是一個重大的誤解。 AI的內涵遠不止于次符號機器學習;它還包括符號化(即人類可理解的)建模、搜索算法和推理技術——這些都是超越機器學習、體現人類智能的重要方面,同時也可以結合機器學習,以提升算法性能與模型準確性。 規劃(planning)與行動(acting)是人類與生俱來的能力。即使是年幼的兒童,也會自然地進行規劃和行動,從環境中學習其行為的后果,并在成長過程中不斷精進這些能力。而機器在規劃與行動方面尚未達到人類水平,尤其是在將其與學習過程相結合方面仍有很大提升空間,這也為自主智能系統的進步留下了廣闊的發展余地。 本書在“規劃、行動與學習”研究領域中是一個重要的里程碑,探討了如何有效地將這些智能特征融合與集成,以提升智能系統的整體性能。作者Malik Ghallab、Dana Nau 和 Paolo Traverso 是三位在國際學術界享有極高聲譽的杰出科學家與研究者。本書是他們在該領域撰寫的第三本著作:第一本聚焦于規劃,第二本則探討了行動與規劃之間的交互,而這第三本則更進一步,系統地涵蓋了行動、規劃與學習三者的結合。 書中討論了諸如確定性狀態轉換(Deterministic State-Transitions)、分層任務網絡(Hierarchical Task Networks)、概率模型、不確定性模型、分層細化模型(Hierarchical-Refinement)以及時間建模(Temporal Models)等內容,同時也涉及機器人運動與操作(Robotic Motion and Manipulation)。此外,書中還探討了大語言模型(Large Language Models)的新興能力及其在該領域的應用,這一主題正處于次符號AI與符號AI交匯的前沿。 本書不僅是該研究領域科學家的重要參考資料,也可作為研究生課程的教科書,清晰、全面且結構嚴謹地梳理了領域建模、計劃生成與執行,以及如何將學習過程融入上述各個環節的技術與算法。我毫不懷疑,這本書將會被我在課程中推薦,并作為個人的重要參考資料使用。 對于一個智能體而言,實現智能行為依賴于三項基本的認知功能:行動(acting)、規劃(planning)和學習(learning)。本書的主題正是如何實現這三種功能的自動化與集成。本書是我們前兩本著作《自動規劃》[409] 以及《規劃與行動的結合》[410] 的延續,涵蓋了自這些書出版以來在該領域取得的一系列研究進展。 本書涵蓋了多種模型、方法與算法——包括確定性、概率性、分層結構、非確定性、時間性與空間性等類型——并探討了如何將這些模型應用于行動、規劃與學習的過程。關于這些主題的已有文獻龐雜且分散于多個相互割裂的研究領域,不可能在一本書中面面俱到。因此,我們在內容選擇上堅持以“行動、規劃與學習的集成為核心目標”這一主線來組織材料。 全書共包含24章。第1章為引言,其余章節分為八個部分。前七個部分聚焦于不同的表示模型,每一部分均包括關于該模型下的行動、規劃與學習的相關章節: * 第一部分 使用“經典的”確定性狀態轉換模型,基于狀態變量進行建模。本章中的若干核心概念貫穿全書始終。 * 第二部分 在第一部分的狀態轉換模型基礎上,引入了分層任務網絡(HTN)。 * 第三、四部分 對第一部分的狀態轉換模型進行擴展,分別引入了概率性非確定性。 * 第五部分 描述了一種分層細化(hierarchical refinement)方法,它結合了第二部分中的HTN概念與第三部分中的概率模型。 * 第六部分 使用chronicle表示法對時間與并發進行建模。 * 第七部分 引入了機器人運動與操作模型(xing),并探討了其與更抽象任(ren)務的(de)結合。

最后,第八部分包含兩章,討論了一些盡管不屬于本書核心關注點但仍非常重要的主題:大語言模型以及感知、監控與目標推理(goal reasoning)

如何使用本書

本書既可作為科學研究與工程實踐中的信息參考來源,也可作為研究生層次的教材使用。大多數章節的參考文獻被集中放在章節末尾的討論部分;多數討論部分后還附有習題。我們將提供配套的幻燈片與其他輔助材料,供讀者在線獲取[^1]。 在書中的偽代碼中,所有變量默認為局部變量,除非明確聲明為全局變量。我們假設讀者已具備本科階段計算機科學課程中算法與數據結構的基本知識。附錄中補充了一些超出該背景范圍的數學與技術內容。 除了對當前技術狀態進行系統性的整合外,本書還包含了大量全新的內容,這些內容大多經過詳盡的闡述,以便于教學使用。其中部分章節提出的新方法尚未被實現或實證評估,旨在激發未來進一步的研究探索。 讀者可以根據自身的需求與背景知識,選擇不同的閱讀路徑來學習本書。圖1給出了各章節之間的依賴關系,希望能幫助讀者與授課教師合理規劃本書的學習路徑,獲得最大收益。

付費5元查看完整內容

隨著人類-智(zhi)能(neng)體(ti)團隊(HAT)研(yan)究的(de)(de)(de)(de)(de)不(bu)斷發(fa)展,模(mo)擬(ni) HAT 行為(wei)和(he)(he)衡量 HAT 效(xiao)果(guo)的(de)(de)(de)(de)(de)計算方(fang)法(fa)也在(zai)不(bu)斷發(fa)展。其(qi)中一(yi)種正在(zai)興(xing)起的(de)(de)(de)(de)(de)方(fang)法(fa)涉及使用(yong)人類數(shu)(shu)字(zi)孿(luan)生(sheng)(sheng)(sheng)(HDT)來(lai)近(jin)似(si)模(mo)擬(ni)人工智(zhi)能(neng)驅動(dong)的(de)(de)(de)(de)(de)智(zhi)能(neng)體(ti)團隊成(cheng)員的(de)(de)(de)(de)(de)人類行為(wei)和(he)(he)社(she)會情(qing)感認知(zhi)反(fan)應(Barricelli & Fogli, 2024)。本文將(jiang)探討(tao)與使用(yong)數(shu)(shu)字(zi)孿(luan)生(sheng)(sheng)(sheng)為(wei) HAT 建立信(xin)任(ren)(ren)(ren)模(mo)型相關(guan)的(de)(de)(de)(de)(de)三個研(yan)究問題。首先,為(wei)了(le)(le)解決如何(he)通(tong)過 HDT HAT 實(shi)驗(yan)對(dui) HAT 信(xin)任(ren)(ren)(ren)進行適當建模(mo)和(he)(he)操作的(de)(de)(de)(de)(de)問題,對(dui)團隊交流數(shu)(shu)據(ju)進行了(le)(le)因(yin)果(guo)分(fen)(fen)析(xi),以了(le)(le)解移情(qing)、社(she)會認知(zhi)和(he)(he)情(qing)感建構(gou)對(dui)信(xin)任(ren)(ren)(ren)形成(cheng)的(de)(de)(de)(de)(de)影響。此外,還(huan)反(fan)思了(le)(le)HAT信(xin)任(ren)(ren)(ren)科學的(de)(de)(de)(de)(de)現(xian)狀,討(tao)論了(le)(le)HAT信(xin)任(ren)(ren)(ren)必(bi)須通(tong)過HDT才能(neng)復(fu)制的(de)(de)(de)(de)(de)特(te)征,如信(xin)任(ren)(ren)(ren)傾(qing)向的(de)(de)(de)(de)(de)個體(ti)差異(如信(xin)任(ren)(ren)(ren)傾(qing)向,Jessup等(deng)人,2019年)、新興(xing)信(xin)任(ren)(ren)(ren)模(mo)式(如信(xin)任(ren)(ren)(ren)侵犯和(he)(he)修復(fu),Wildman等(deng)人,2024年)以及對(dui)這(zhe)些特(te)征的(de)(de)(de)(de)(de)適當測量(如增長建模(mo),Abramov等(deng)人,2020年)。其(qi)次(ci),為(wei)了(le)(le)解決人類發(fa)展工具信(xin)任(ren)(ren)(ren)的(de)(de)(de)(de)(de)測量方(fang)法(fa)在(zai)近(jin)似(si)人類對(dui) HATs 信(xin)任(ren)(ren)(ren)方(fang)面的(de)(de)(de)(de)(de)有效(xiao)性(xing)問題,討(tao)論了(le)(le)人類發(fa)展工具信(xin)任(ren)(ren)(ren)的(de)(de)(de)(de)(de)特(te)性(xing):自我報告測量方(fang)法(fa)、基于互動(dong)的(de)(de)(de)(de)(de)測量方(fang)法(fa)和(he)(he)遵從型行為(wei)測量方(fang)法(fa)。此外,還(huan)分(fen)(fen)享(xiang)了(le)(le)初步模(mo)擬(ni)的(de)(de)(de)(de)(de)結果(guo),其(qi)中比較(jiao)了(le)(le)用(yong)于生(sheng)(sheng)(sheng)成(cheng) HDT 通(tong)信(xin)的(de)(de)(de)(de)(de)不(bu)同 LLM 模(mo)型,并分(fen)(fen)析(xi)了(le)(le)它們復(fu)制類人信(xin)任(ren)(ren)(ren)動(dong)態的(de)(de)(de)(de)(de)能(neng)力(li)。第三,針對(dui) HAT 實(shi)驗(yan)操作將(jiang)如何(he)擴(kuo)展到人類數(shu)(shu)字(zi)孿(luan)生(sheng)(sheng)(sheng)研(yan)究,分(fen)(fen)享(xiang)了(le)(le)實(shi)驗(yan)設計,重點關(guan)注 HDT 的(de)(de)(de)(de)(de)信(xin)任(ren)(ren)(ren)傾(qing)向與人工智(zhi)能(neng)體(ti)的(de)(de)(de)(de)(de)透明度和(he)(he)基于能(neng)力(li)的(de)(de)(de)(de)(de)信(xin)任(ren)(ren)(ren)。

將(jiang)人(ren)工智能(neng)(AI)融入作戰環境在(zai)各個(ge)(ge)領(ling)域(yu)變得(de)越(yue)來(lai)越(yue)重(zhong)要(yao),從根本上改變了(le)人(ren)類與(yu)機(ji)器合(he)(he)作實(shi)現共同(tong)目(mu)標的方(fang)式。在(zai)過去十年中,人(ren)類與(yu)人(ren)工智能(neng)團隊(HAT)研究已成(cheng)為一(yi)個(ge)(ge)重(zhong)要(yao)領(ling)域(yu),學者(zhe)們運用認(ren)知科(ke)學原理來(lai)理解這(zhe)些(xie)新型合(he)(he)作關(guan)系的復(fu)雜性(xing)。這(zhe)一(yi)不斷增長的研究成(cheng)果反映了(le)了(le)解人(ren)類和人(ren)工智能(neng)如何有效(xiao)、安(an)全、高效(xiao)地合(he)(he)作的緊迫性(xing)。

隨(sui)著 HAT 文獻的擴展和人工(gong)智能(neng)能(neng)力的進步,出現(xian)了研究(jiu)這(zhe)些(xie)互動的創新方(fang)法。其(qi)中一(yi)種(zhong)很有前景的方(fang)法是使用(yong)人類數(shu)字(zi)雙胞(bao)胎(HDTs)--旨在(zai)復制(zhi)人類在(zai) HAT 環境中的反(fan)(fan)應(ying)(ying)(ying)和行(xing)為的計算模型。這(zhe)些(xie) HDTs 可以進行(xing)配置,以模擬基(ji)(ji)于狀態(tai)的反(fan)(fan)應(ying)(ying)(ying)(如瞬時認知和情(qing)感反(fan)(fan)應(ying)(ying)(ying))和基(ji)(ji)于特(te)征(zheng)的特(te)性(xing)(xing)(包括性(xing)(xing)格上的個體差異),為傳統的人類受試者研究(jiu)提供了一(yi)個多功能(neng)的替代方(fang)案[1, 2]。

人(ren)類(lei)發展(zhan)工(gong)具在人(ren)類(lei)活動能(neng)力研(yan)究(jiu)中的(de)(de)優勢是(shi)顯著的(de)(de)。除了解決人(ren)類(lei)受試(shi)(shi)者研(yan)究(jiu)的(de)(de)實際限(xian)制(如(ru)成本和(he)招募挑戰)外(wai),HDT 還提供了前(qian)所未(wei)有的(de)(de)實驗變(bian)量(liang)控制和(he)快速測試(shi)(shi)多種情景的(de)(de)能(neng)力。這種能(neng)力對于研(yan)究(jiu)復雜的(de)(de)團隊現象尤(you)為重要,而(er)信(xin)任則是(shi)一個關鍵的(de)(de)重點領域。信(xin)任--愿意對另一個智能(neng)體的(de)(de)行(xing)動處于弱勢--是(shi) HAT 有效(xiao)性和(he)成功的(de)(de)基本決定因(yin)素。

然而,使用人(ren)類(lei)發展(zhan)工(gong)具來研究 HAT 中的信任動態(tai)是否(fou)有效(xiao),還需(xu)要仔細研究。

本文探討了在信任研究中實施 HDT 的三個關鍵問題

  • (1) 如何使用基于 HDT 的方法有效地模擬和測量 HAT 信任?
  • (2) HAT 信任的基本特征是什么,必須在 HDT 信任模型中加以操作化?
  • (3) 傳統 HAT 研究中的實驗操作如何轉化為基于 HDT 的研究?

通過研究這些問題,我(wo)們旨在建立一(yi)個框架(jia),用于在 HAT 信(xin)任研究中(zhong)驗(yan)證(zheng)和實施 HDT,最終(zhong)促進我(wo)們對人(ren)類(lei)與人(ren)工智(zhi)能協作和信(xin)任發展的理解(jie)。

圖 1:移(yi)情建構(gou)如何影響(xiang) HAT 信任度的因果(guo)分析結(jie)果(guo)。

付費5元查看完整內容

人工(gong)智(zhi)能(neng)(AI)被(bei)廣泛(fan)認為是一(yi)種(zhong)通用(yong)技(ji)術(shu)(GPT),有(you)可能(neng)影響人類活(huo)動的(de)(de)(de)(de)(de)各(ge)(ge)個(ge)方面,推動創新(xin)并重(zhong)塑經濟(ji)(ji)和(he)安(an)全格局。全球對(dui)人工(gong)智(zhi)能(neng)戰(zhan)略重(zhong)要(yao)性的(de)(de)(de)(de)(de)認識(shi),引發了一(yi)場經濟(ji)(ji)和(he)軍(jun)事領域(yu)的(de)(de)(de)(de)(de)爭霸賽,各(ge)(ge)國都在(zai)努力(li)利用(yong)人工(gong)智(zhi)能(neng)的(de)(de)(de)(de)(de)潛力(li)在(zai)國際舞臺上增強實力(li)和(he)影響力(li)(Friedman 2022, 2)。除了正在(zai)進(jin)行的(de)(de)(de)(de)(de)研究,將這項新(xin)技(ji)術(shu)融入軍(jun)事領域(yu)的(de)(de)(de)(de)(de)工(gong)作也(ye)已(yi)經開(kai)始。與以往的(de)(de)(de)(de)(de)變革(ge)性技(ji)術(shu)一(yi)樣,戰(zhan)略研究引發了一(yi)場關于(yu)人工(gong)智(zhi)能(neng)潛在(zai)戰(zhan)略影響的(de)(de)(de)(de)(de)辯論,討論的(de)(de)(de)(de)(de)中(zhong)心是人工(gong)智(zhi)能(neng)推動下一(yi)場軍(jun)事革(ge)命(RMA)的(de)(de)(de)(de)(de)前景(Raska 2021, 456)。

技術創新能(neng)力(li)(li)一直與國際影響力(li)(li)和(he)國家實力(li)(li)密切相關,包(bao)括經濟競(jing)爭力(li)(li)、政治合法性、軍(jun)事(shi)(shi)實力(li)(li)和(he)國內安全(quan)(Raska and Bitzinger 2023, 2)。因(yin)此,軍(jun)事(shi)(shi)創新是國際關系研究中(zhong)的(de)(de)一個(ge)重要課題(ti)。對(dui)軍(jun)事(shi)(shi)力(li)(li)量分布感興趣的(de)(de)學者們關注的(de)(de)重點是國家如何通(tong)過開發新的(de)(de)軍(jun)事(shi)(shi)優勢(shi)產生(sheng)方法來獲得對(dui)競(jing)爭對(dui)手的(de)(de)優勢(shi)(Johnson 2022, 478)。尋(xun)找(zhao)施(shi)加暴力(li)(li)和(he)行使權(quan)力(li)(li)的(de)(de)新方法體現在(zai)軍(jun)事(shi)(shi)創新中(zhong),而軍(jun)事(shi)(shi)創新是由傳統國防部(bu)門推(tui)動的(de)(de)(Bitzinger 和(he) Raska,2015 年(nian),129;Horowitz,2010 年(nian),18)。

但(dan)人(ren)工(gong)(gong)智(zhi)(zhi)能(neng)(neng)技(ji)(ji)(ji)術(shu)(shu)的(de)(de)(de)(de)傳播(bo)與以往的(de)(de)(de)(de)經驗有著(zhu)本(ben)質的(de)(de)(de)(de)不(bu)同(tong)(Raska and Bitzinger 2023, 1)。這(zhe)有兩個原因(yin)。首先(xian)(xian),從(cong) 20 世(shi)紀 70 年(nian)(nian)(nian)(nian)代到 2010 年(nian)(nian)(nian)(nian)代,西方(fang)國(guo)家,尤其(qi)(qi)是(shi)美(mei)國(guo),在(zai)尖端軍(jun)事(shi)技(ji)(ji)(ji)術(shu)(shu)的(de)(de)(de)(de)發(fa)展(zhan)方(fang)面一直處于(yu)(yu)領(ling)先(xian)(xian)地(di)位。這(zhe)些先(xian)(xian)進(jin)技(ji)(ji)(ji)術(shu)(shu)以不(bu)同(tong)的(de)(de)(de)(de)路徑和(he)(he)模(mo)式傳播(bo)給盟(meng)國(guo)和(he)(he)戰(zhan)略伙伴,包(bao)括歐洲和(he)(he)東亞(ya)的(de)(de)(de)(de)中(zhong)(zhong)小強國(guo)(拉(la)斯卡,2020 年(nian)(nian)(nian)(nian))。但(dan)是(shi),在(zai)幾(ji)十(shi)年(nian)(nian)(nian)(nian)的(de)(de)(de)(de)軍(jun)事(shi)技(ji)(ji)(ji)術(shu)(shu)霸主地(di)位之后(hou),美(mei)國(guo)現在(zai)發(fa)現自(zi)己面臨著(zhu)戰(zhan)略同(tong)級競爭(zheng)(zheng)(zheng)對手的(de)(de)(de)(de)挑戰(zhan),他們擁有自(zi)己快(kuai)速發(fa)展(zhan)的(de)(de)(de)(de)軍(jun)事(shi)能(neng)(neng)力和(he)(he)新(xin)技(ji)(ji)(ji)術(shu)(shu),其(qi)(qi)中(zhong)(zhong)人(ren)工(gong)(gong)智(zhi)(zhi)能(neng)(neng)處于(yu)(yu)領(ling)先(xian)(xian)地(di)位(Johnson 2021; Mahnken 2012)。其(qi)(qi)次(ci),當前的(de)(de)(de)(de)人(ren)工(gong)(gong)智(zhi)(zhi)能(neng)(neng)技(ji)(ji)(ji)術(shu)(shu)浪潮代表了(le)軍(jun)事(shi)創(chuang)新(xin)本(ben)身的(de)(de)(de)(de)重(zhong)大轉變,商業技(ji)(ji)(ji)術(shu)(shu)進(jin)步在(zai)武器平臺(tai)和(he)(he)系(xi)統的(de)(de)(de)(de)發(fa)展(zhan)中(zhong)(zhong)發(fa)揮了(le)重(zhong)要(yao)作用(拉(la)斯卡,2016 年(nian)(nian)(nian)(nian))。這(zhe)使得小國(guo)和(he)(he)中(zhong)(zhong)等強國(guo)能(neng)(neng)夠開發(fa)利基人(ren)工(gong)(gong)智(zhi)(zhi)能(neng)(neng)技(ji)(ji)(ji)術(shu)(shu),從(cong)而增(zeng)強其(qi)(qi)國(guo)防能(neng)(neng)力,提高其(qi)(qi)經濟競爭(zheng)(zheng)(zheng)力、政治影(ying)響(xiang)力以及在(zai)全球(qiu)舞臺(tai)上的(de)(de)(de)(de)地(di)位(Barsade 和(he)(he) Horowitz,2018 年(nian)(nian)(nian)(nian))。因(yin)此(ci),全世(shi)界的(de)(de)(de)(de)軍(jun)事(shi)力量都在(zai)積極尋(xun)求(qiu)將(jiang)人(ren)工(gong)(gong)智(zhi)(zhi)能(neng)(neng)納入其(qi)(qi)系(xi)統組合,旨(zhi)在(zai)獲得超(chao)越對手的(de)(de)(de)(de)獨特(te)競爭(zheng)(zheng)(zheng)優勢(Raska and Bitzinger 2023, 3)。

人(ren)們普遍認為(wei),人(ren)工(gong)(gong)智(zhi)能將(jiang)引領(ling)下(xia)一階(jie)段(duan)的(de)(de)(de)軍事(shi)裝備改革(Raska and Bitzinger 2023a),但(dan)對(dui)軍事(shi)人(ren)工(gong)(gong)智(zhi)能創(chuang)(chuang)新過程的(de)(de)(de)理(li)論(lun)分析尚屬空白。一方面,關(guan)于軍隊如何創(chuang)(chuang)新和創(chuang)(chuang)新如何擴散的(de)(de)(de)研(yan)究(jiu)已(yi)經產生了幾種不同(tong)的(de)(de)(de)理(li)論(lun),但(dan)都只關(guan)注傳統國防工(gong)(gong)業領(ling)域的(de)(de)(de)創(chuang)(chuang)新。另一方面,關(guan)注軍事(shi)人(ren)工(gong)(gong)智(zhi)能創(chuang)(chuang)新軌(gui)跡的(de)(de)(de)學(xue)者們并沒有(you)利用現(xian)有(you)的(de)(de)(de)理(li)論(lun),沒有(you)將(jiang)人(ren)工(gong)(gong)智(zhi)能視為(wei)像電力一樣的(de)(de)(de)GPT,而是將(jiang)其視為(wei)類似核武(wu)器或航空母(mu)艦的(de)(de)(de)相(xiang)(xiang)對(dui)狹(xia)義的(de)(de)(de)技(ji)術進步(Ding and Dafoe 2023, 1)。鑒于上文所述(shu)的(de)(de)(de)人(ren)工(gong)(gong)智(zhi)能的(de)(de)(de)重(zhong)要性和廣泛(fan)影響,這一發現(xian)相(xiang)(xiang)當(dang)令人(ren)費解(jie)。因此,本論(lun)文旨在通過整合這些(xie)研(yan)究(jiu)流派來(lai)彌補(bu)這些(xie)不足。論(lun)文采用理(li)論(lun)驅動分析法,試(shi)圖解(jie)決以下(xia)問題:

一個國家如何成功開發和整合軍事人工智能

本研究(jiu)將(jiang)從以(yi)下幾個(ge)方面展開。首先,總(zong)結(jie)(jie)(jie)有關軍事創(chuang)新、創(chuang)新擴散和(he)軍事人工(gong)智能的(de)文獻(xian),找(zhao)出(chu)不(bu)足之處。其(qi)次,解釋理論(lun)框架。這部(bu)分包括對 GPT 概念的(de)介紹、對所用理論(lun)的(de)總(zong)結(jie)(jie)(jie)、將(jiang)其(qi)轉化為因果機(ji)制以(yi)及對范圍條件的(de)理論(lun)定義。第三,解釋人工(gong)智能在多大程度上符合 GPT,以(yi)及軍事人工(gong)智能的(de)含義。第四(si),概述(shu)研究(jiu)設計(ji)、方法(理論(lun)測試(shi)過程追蹤)和(he)數(shu)據(ju)選擇(ze)。第五,將(jiang)創(chuang)建一個(ge)案(an)(an)例(li)群體,并從中(zhong)選出(chu)一個(ge)案(an)(an)例(li)。然后(hou)進行(xing)實證分析。最(zui)后(hou),本研究(jiu)通(tong)過討論(lun)研究(jiu)結(jie)(jie)(jie)果及其(qi)局限(xian)性(xing)得出(chu)結(jie)(jie)(jie)論(lun)。

圖1:來自生態系統挑戰的因果理(li)論(lun)

付費5元查看完整內容

人工智能專家杰里·卡普蘭(Jerry Kaplan)解釋了生成型人工智能將如何徹底改變幾乎所有人類活動。弗朗西斯·福山(Francis Fukuyama),政治學家,同時也是《歷史的終結與最后的人》的作者,對此表示極力推薦。 生成型人工智能(GAI)的進步創造了一類新的計算機系統,這些系統在廣泛的任務上展現出驚人的熟練度和超人的表現,它們通過分析龐大的數字化信息集合,產生新穎的文本、圖像、音樂和軟件。不久的將來,這些系統將提供專家級醫療護理;提供法律咨詢;起草文件;編寫計算機程序;輔導我們的孩子;以及創造音樂和藝術。這些進步將加速科學、藝術和人類知識的發展,但它們也會帶來新的危險。 我們是否終于發現了人工智能的圣杯——與人類智能匹敵甚至超越的機器?哪些行業和職業將繁榮,哪些將衰落?它將帶來哪些風險和危險?我們如何確保這些系統遵守我們的倫理原則?收益是否會廣泛分布,還是僅僅積累于少數幸運者手中?GAI將如何改變我們的政治體系和國際沖突?我們僅僅是通往新形式的非生物生命的踏腳石,還是我們只是在變得更擅長制造有用的小玩意兒? 《生成型人工智能:每個人都需要了解的知識》為讀者提供了回答這些緊迫問題的知識。 關于作者 杰里·卡普蘭(Jerry Kaplan),博士,廣為人知的人工智能專家,連續創業者,技術創新者,教育家,暢銷書作家和未來學家。他發明了幾項開創性技術,并創立了眾多科技初創公司。目前,他是斯坦福大學的兼職講師,講授人工智能的社會和經濟影響。

付費5元查看完整內容

多智能體(ti)強化(hua)學習是(shi)AI中的(de)熱點技術之一,來自(zi)愛丁(ding)堡大(da)學Stefano V. Albrecht, Filippos Christianos, Lukas Sch?fer編著的(de)《多智能體(ti)強化(hua)學習:基礎(chu)(chu)與現代方法》詳(xiang)述MARL中的(de)模型、解決方案概念、算法思想(xiang)和技術挑戰提供基礎(chu)(chu)介紹。

多智能體強化學習(Multi-agent Reinforcement Learning,MARL)是一個多樣且極為活躍的研究領域。自2010年代中期將深度學習引入MARL以來,該領域的活動迅猛增長,所有主要的人工智能和機器學習會議上都會定期發布開發新的MARL算法或以某種方式應用MARL的論文。這種快速增長也可以從已發表的綜述論文數量的增加得到證明,附錄A中列出了其中許多論文。在這種增長的背景下,人們意識到該領域需要一本教材,以提供對MARL的系統介紹。本書在某種程度上基于并主要遵循Stefano V. Albrecht和Peter Stone于2017年在澳大利亞墨爾本舉行的國際人工智能聯合會議上所提供的教程《多智能體學習:基礎與最新趨勢》的(de)(de)(de)結(jie)構。本(ben)(ben)書的(de)(de)(de)撰寫目的(de)(de)(de)是為MARL中的(de)(de)(de)模型、解(jie)決方(fang)案概念(nian)、算法思想和(he)技術挑戰提(ti)供(gong)(gong)基礎(chu)介(jie)紹,并描述整合(he)深度學習技術以(yi)產生強大新算法的(de)(de)(de)現代(dai)(dai)MARL方(fang)法。我們認為,本(ben)(ben)書涵蓋的(de)(de)(de)內容應該為每個MARL研究者所(suo)知。此外,本(ben)(ben)書旨在為研究人員(yuan)和(he)實(shi)踐者在使用MARL算法時提(ti)供(gong)(gong)實(shi)用指導。為此,本(ben)(ben)書附帶了(le)用Python編(bian)(bian)程語言編(bian)(bian)寫的(de)(de)(de)代(dai)(dai)碼(ma)庫(ku),其中包含(han)了(le)本(ben)(ben)書討論(lun)的(de)(de)(de)多(duo)個MARL算法的(de)(de)(de)實(shi)現。代(dai)(dai)碼(ma)庫(ku)的(de)(de)(de)主要(yao)目的(de)(de)(de)是提(ti)供(gong)(gong)自包含(han)且易于閱讀的(de)(de)(de)算法代(dai)(dai)碼(ma),以(yi)幫助讀者理解(jie)。

想象一個場景,在這個場景中,一個由自主智能體組成的集體,每個智能體都有能力做出自己的決定,他們必須在一個共享環境中互動,以達成某些目標。這些智能體可能有一個共享的目標,比如一個移動機器人的車隊,其任務是在一個大型倉庫內收集和運送貨物,或者一個負責監控海上石油鉆井平臺的無人機隊伍。智能體也可能有沖突的目標,比如在一個虛擬市場上交易商品的智能體,每個智能體都試圖最大化自己的收益。由于我們可能不知道這些智能體應該如何互動以達成他們的目標,所以我們讓他們自己去解決。因此,這些智能體開始在他們的環境中嘗試行動,并收集關于環境如何隨著他們的行動而變化,以及其他智能體如何行為的經驗。隨著時間的推移,這些智能體開始學習各種概念,如解決任務所需的技能,以及重要的,如何與其他智能體協調他們的行動。他們甚至可能學會發展一種共享的語言,以便智能體之間的通信。最后,這些智能體達到了一定的熟練程度,成為了互動優化以達成他們目標的專家。這個令人興奮的愿景,簡而言之,就是多智能體強化學習(MARL)希望達成的目標。MARL基于強化學習(RL),在這種學習中,智能體通過嘗試行動和接收獎勵來學習最優決策策略,目標是選擇能在時間內最大化累積獎勵的行動。而在單一智能體的RL中,重點是為單一智能體學習最優策略,在MARL中,重點是為多個智能體學習最優策略以及在這個學習過程中出現的獨特挑戰。在這第一章中,我們將開始概述MARL中的一些基礎概念和挑戰。我們首先介紹多智能體系統的概念,這是由環境、環境中的智能體及其目標定義的。然后我們討論了MARL如何在這樣的系統中運作以學習智能體的最優策略,并通過一些潛在應用的例子來說明。接下來我們討論了MARL中的一些關鍵挑戰,如非穩定性和均衡選擇問題,以及幾種描述MARL可以如何使用的不同“議程”。在本章的結尾,我們對這本書的兩部分中涵蓋的主題進行了概述。多智能體強化學習(MARL)算法為多智能體系統中的一組智能體學習最優策略。與單一(yi)(yi)智(zhi)(zhi)(zhi)(zhi)能(neng)體(ti)(ti)(ti)(ti)的情況一(yi)(yi)樣,這些(xie)策略是通過(guo)(guo)(guo)試(shi)錯過(guo)(guo)(guo)程來(lai)學(xue)習的,目(mu)標是最(zui)大(da)化智(zhi)(zhi)(zhi)(zhi)能(neng)體(ti)(ti)(ti)(ti)的累積獎勵,或者說回報。圖(tu)1.3顯示了MARL訓練(lian)循(xun)環(huan)(huan)的基本示意圖(tu)。一(yi)(yi)組n個(ge)智(zhi)(zhi)(zhi)(zhi)能(neng)體(ti)(ti)(ti)(ti)選擇個(ge)體(ti)(ti)(ti)(ti)行動,這些(xie)行動一(yi)(yi)起被稱為聯(lian)(lian)合(he)行動。聯(lian)(lian)合(he)行動按照環(huan)(huan)境(jing)動態(tai)(tai)改變(bian)了環(huan)(huan)境(jing)的狀(zhuang)(zhuang)態(tai)(tai),并且智(zhi)(zhi)(zhi)(zhi)能(neng)體(ti)(ti)(ti)(ti)由(you)于(yu)這種(zhong)變(bian)化收到(dao)個(ge)體(ti)(ti)(ti)(ti)獎勵,同(tong)時(shi)也對新(xin)環(huan)(huan)境(jing)狀(zhuang)(zhuang)態(tai)(tai)有(you)個(ge)體(ti)(ti)(ti)(ti)觀察。這個(ge)循(xun)環(huan)(huan)持續進行,直到(dao)滿足終(zhong)止條(tiao)件(比如一(yi)(yi)位智(zhi)(zhi)(zhi)(zhi)能(neng)體(ti)(ti)(ti)(ti)贏得了一(yi)(yi)場(chang)象棋比賽)或無限期地進行。這個(ge)循(xun)環(huan)(huan)從初(chu)始狀(zhuang)(zhuang)態(tai)(tai)到(dao)終(zhong)止狀(zhuang)(zhuang)態(tai)(tai)的完整運行被稱為一(yi)(yi)個(ge)情節。通過(guo)(guo)(guo)多個(ge)獨立情節產生(sheng)的數(shu)據,即每(mei)個(ge)情節中經歷(li)的觀察、行動和(he)獎勵,被用來(lai)持續改進智(zhi)(zhi)(zhi)(zhi)能(neng)體(ti)(ti)(ti)(ti)的策略。

這本書為大學生、研究者和從業者提供了關于多智能體強化學習理論和實踐的介紹。在這個引言章節之后,本書的剩余部分分為兩部分。本書的(de)(de)(de)(de)(de)第(di)(di)(di)一(yi)部(bu)(bu)分(fen)提(ti)(ti)供(gong)了(le)(le)關于(yu)MARL中(zhong)使用(yong)(yong)的(de)(de)(de)(de)(de)基(ji)本模型和(he)概(gai)念(nian)的(de)(de)(de)(de)(de)基(ji)礎(chu)知識。具體(ti)來說,第(di)(di)(di)二(er)章(zhang)(zhang)(zhang)(zhang)對單一(yi)智(zhi)能(neng)體(ti)RL的(de)(de)(de)(de)(de)理論和(he)表格算(suan)法(fa)(fa)進行(xing)了(le)(le)介(jie)紹。第(di)(di)(di)三章(zhang)(zhang)(zhang)(zhang)介(jie)紹了(le)(le)基(ji)本的(de)(de)(de)(de)(de)游戲模型,以定義(yi)多(duo)(duo)智(zhi)能(neng)體(ti)環(huan)境(jing)中(zhong)的(de)(de)(de)(de)(de)狀(zhuang)態、行(xing)動(dong)、觀察和(he)獎勵等(deng)概(gai)念(nian)。然后(hou),第(di)(di)(di)四(si)章(zhang)(zhang)(zhang)(zhang)介(jie)紹了(le)(le)一(yi)系列解(jie)(jie)(jie)決概(gai)念(nian),這些(xie)概(gai)念(nian)定義(yi)了(le)(le)解(jie)(jie)(jie)決這些(xie)游戲模型意味(wei)著什(shen)么;也就是說,智(zhi)能(neng)體(ti)如(ru)何最優地行(xing)動(dong)意味(wei)著什(shen)么。最后(hou),第(di)(di)(di)五章(zhang)(zhang)(zhang)(zhang)介(jie)紹了(le)(le)在游戲中(zhong)應用(yong)(yong)MARL來計算(suan)解(jie)(jie)(jie)決方(fang)案(an)時的(de)(de)(de)(de)(de)一(yi)些(xie)基(ji)礎(chu)算(suan)法(fa)(fa)思想和(he)挑戰。本書的(de)(de)(de)(de)(de)第(di)(di)(di)二(er)部(bu)(bu)分(fen)側重(zhong)于(yu)當(dang)代利用(yong)(yong)深(shen)度學(xue)習技術(shu)創(chuang)建(jian)新的(de)(de)(de)(de)(de)強(qiang)大MARL算(suan)法(fa)(fa)的(de)(de)(de)(de)(de)MARL研(yan)究。我們(men)首(shou)先在第(di)(di)(di)六章(zhang)(zhang)(zhang)(zhang)和(he)第(di)(di)(di)七章(zhang)(zhang)(zhang)(zhang)分(fen)別(bie)對深(shen)度學(xue)習和(he)深(shen)度強(qiang)化(hua)學(xue)習進行(xing)了(le)(le)介(jie)紹。基(ji)于(yu)前兩章(zhang)(zhang)(zhang)(zhang),第(di)(di)(di)八章(zhang)(zhang)(zhang)(zhang)介(jie)紹了(le)(le)近年來開發的(de)(de)(de)(de)(de)一(yi)些(xie)最重(zhong)要的(de)(de)(de)(de)(de)MARL算(suan)法(fa)(fa),包括集中(zhong)化(hua)訓(xun)練與分(fen)散化(hua)執行(xing)、價(jia)值(zhi)分(fen)解(jie)(jie)(jie)和(he)參數共享等(deng)思想。第(di)(di)(di)九章(zhang)(zhang)(zhang)(zhang)在實(shi)施和(he)使用(yong)(yong)MARL算(suan)法(fa)(fa)以及如(ru)何評(ping)估學(xue)習到的(de)(de)(de)(de)(de)策略(lve)時提(ti)(ti)供(gong)了(le)(le)實(shi)用(yong)(yong)指(zhi)導。最后(hou),第(di)(di)(di)十(shi)章(zhang)(zhang)(zhang)(zhang)描述了(le)(le)在MARL研(yan)究中(zhong)開發的(de)(de)(de)(de)(de)一(yi)些(xie)多(duo)(duo)智(zhi)能(neng)體(ti)環(huan)境(jing)的(de)(de)(de)(de)(de)例(li)子。

這本書的一個目標是為想在實踐中使用本書中討論的MARL算法,以及開發他們自己的算法的讀者提供一個起點。因(yin)此,這(zhe)本書配(pei)有(you)自己的MARL代(dai)碼(ma)庫(可從書籍網站(zhan)下載),該(gai)代(dai)碼(ma)庫使用Python編程語言開發,提(ti)供了許多現(xian)有(you)的MARL算法(fa)的實(shi)現(xian),這(zhe)些實(shi)現(xian)是自包(bao)含的,易于閱讀。第九章使用代(dai)碼(ma)庫中(zhong)的代(dai)碼(ma)片段來解(jie)釋(shi)早些章節中(zhong)提(ti)出的算法(fa)背后的重(zhong)要概(gai)念(nian)的實(shi)現(xian)細(xi)節。我們(men)希望所(suo)提(ti)供的代(dai)碼(ma)能夠(gou)幫助讀者理解(jie)MARL算法(fa),并開始(shi)在實(shi)踐中(zhong)使用它(ta)們(men)。

付費5元查看完整內容

多(duo)智能(neng)體(ti)強(qiang)化(hua)學(xue)習(xi)(xi)(MARL)是一個種類繁多(duo)、高度活(huo)躍的(de)研究領域。隨著深度學(xue)習(xi)(xi)在(zai) 2015年引入多(duo)智能(neng)體(ti)強(qiang)化(hua)學(xue)習(xi)(xi),該領域的(de)研究活(huo)動出現(xian)了(le)爆炸(zha)式(shi)增(zeng)長,現(xian)在(zai)所有主(zhu)要的(de)人工(gong)智能(neng)和機器學(xue)習(xi)(xi)會議都會例行討論(lun)開發新的(de)多(duo)智能(neng)體(ti)強(qiang)化(hua)學(xue)習(xi)(xi)算法或以某種方式(shi)應用多(duo)智能(neng)體(ti)強(qiang)化(hua)學(xue)習(xi)(xi)的(de)論(lun)文(wen)(wen)。此后發表的(de)調查論(lun)文(wen)(wen)數(shu)量不斷(duan)增(zeng)加(jia),也證明了(le)這一急劇增(zeng)長,我(wo)們(men)在(zai)附錄(lu) A 中(zhong)列(lie)出了(le)其(qi)中(zhong)的(de)許多(duo)論(lun)文(wen)(wen)。

隨著這一(yi)增(zeng)長(chang),該領域(yu)顯(xian)然(ran)需要一(yi)本(ben)教科(ke)書(shu)來對 MARL 進行(xing)原則性介紹。本(ben)書(shu)部分基于 "多智能體學(xue)習(xi):基礎與(yu)最新(xin)(xin)趨勢 "教程(cheng),并在很大程(cheng)度(du)上沿用了(le)該教程(cheng)的(de)結構: Stefano V. Albrecht 和 Peter Stone 在澳(ao)大利亞墨爾本(ben)舉行(xing)的(de) 2017 年國際(ji)人工智能聯合會議(yi)上所做的(de)題為(wei)(wei) "多智能體學(xue)習(xi):基礎與(yu)最新(xin)(xin)趨勢 "的(de)教程(cheng)。編(bian)寫本(ben)書(shu)的(de)目的(de)是對MARL中(zhong)的(de)模型、求(qiu)解概念、算(suan)(suan)法(fa)(fa)(fa)思想和技術(shu)挑戰進行(xing)基本(ben)介紹,并描述(shu)MARL中(zhong)融(rong)合深度(du)學(xue)習(xi)技術(shu)以(yi)產生強大新(xin)(xin)算(suan)(suan)法(fa)(fa)(fa)的(de)現(xian)代(dai)(dai)方法(fa)(fa)(fa)。從(cong)本(ben)質上講,我們認為(wei)(wei)本(ben)書(shu)所涉及的(de)材(cai)料應該為(wei)(wei)每一(yi)位 MARL 研究人員所了(le)解。此外,本(ben)書(shu)還旨在為(wei)(wei)研究人員和從(cong)業人員在使用 MARL 算(suan)(suan)法(fa)(fa)(fa)時提供實用指導。為(wei)(wei)此,本(ben)書(shu)附帶(dai)了(le)用 Python 編(bian)程(cheng)語言編(bian)寫的(de)代(dai)(dai)碼(ma)(ma)庫,其中(zhong)包含本(ben)書(shu)討論的(de)幾種 MARL 算(suan)(suan)法(fa)(fa)(fa)的(de)實現(xian)。代(dai)(dai)碼(ma)(ma)庫的(de)主要目的(de)是提供自成一(yi)體、易于閱讀的(de)算(suan)(suan)法(fa)(fa)(fa)代(dai)(dai)碼(ma)(ma),以(yi)幫助讀者理解。

本(ben)書假定(ding)讀(du)(du)者具有本(ben)科水平的(de)基(ji)礎數學(xue)(xue)(xue)背(bei)景,包括(kuo)統(tong)計學(xue)(xue)(xue)、概(gai)率論、線性代數和微積分(fen)。要(yao)理(li)解和使用代碼庫,需(xu)要(yao)熟悉基(ji)本(ben)的(de)編程(cheng)概(gai)念。一般來說(shuo),我(wo)(wo)們建議按照給定(ding)的(de)順序閱讀(du)(du)本(ben)書的(de)各個章(zhang)(zhang)(zhang)節。對于不(bu)熟悉強化學(xue)(xue)(xue)習(xi)和深(shen)度學(xue)(xue)(xue)習(xi)的(de)讀(du)(du)者,我(wo)(wo)們分(fen)別在第(di)2章(zhang)(zhang)(zhang)、第(di)7章(zhang)(zhang)(zhang)和第(di)8章(zhang)(zhang)(zhang)提(ti)供了(le)(le)基(ji)礎知識。已經熟悉強化學(xue)(xue)(xue)習(xi)和深(shen)度學(xue)(xue)(xue)習(xi)的(de)讀(du)(du)者,如(ru)果想快(kuai)速掌握基(ji)于深(shen)度學(xue)(xue)(xue)習(xi)的(de)最新 MARL 算法,可(ke)以(yi)先閱讀(du)(du)第(di) 3 章(zhang)(zhang)(zhang),然后跳到第(di) 9 章(zhang)(zhang)(zhang)及以(yi)后的(de)章(zhang)(zhang)(zhang)節。為了(le)(le)幫助講(jiang)師采(cai)用本(ben)書,我(wo)(wo)們制作了(le)(le)講(jiang)義幻燈(deng)(deng)片(可(ke)從本(ben)書網站獲取),講(jiang)義幻燈(deng)(deng)片可(ke)根據課程(cheng)需(xu)要(yao)進行修(xiu)改(gai)。

MARL 已成(cheng)為一個(ge)龐大的(de)(de)(de)(de)(de)(de)(de)研(yan)(yan)究(jiu)(jiu)領(ling)域,本書并(bing)未涵蓋 MARL 的(de)(de)(de)(de)(de)(de)(de)所有方(fang)(fang)(fang)面。例如,關(guan)于在(zai) MARL 中使用(yong)通(tong)信(xin)的(de)(de)(de)(de)(de)(de)(de)研(yan)(yan)究(jiu)(jiu)成(cheng)果越(yue)來越(yue)多(duo),但本書并(bing)未涉(she)及(ji)(ji)。這包(bao)括(kuo)的(de)(de)(de)(de)(de)(de)(de)問(wen)題有:當通(tong)信(xin)渠道嘈雜、不可靠時,智(zhi)(zhi)能(neng)(neng)體(ti)如何(he)學會穩健地(di)進(jin)行通(tong)信(xin);以(yi)及(ji)(ji)智(zhi)(zhi)能(neng)(neng)體(ti)如何(he)利(li)用(yong) MARL 學習特定任務的(de)(de)(de)(de)(de)(de)(de)專用(yong)通(tong)信(xin)協議或語言。雖然本書的(de)(de)(de)(de)(de)(de)(de)重(zhong)點不是 MARL 中的(de)(de)(de)(de)(de)(de)(de)通(tong)信(xin),但本書介紹的(de)(de)(de)(de)(de)(de)(de)模型具(ju)有足(zu)夠的(de)(de)(de)(de)(de)(de)(de)通(tong)用(yong)性,也可以(yi)表示(shi)智(zhi)(zhi)能(neng)(neng)體(ti)可以(yi)觀察到(dao)但不影(ying)響環境狀態的(de)(de)(de)(de)(de)(de)(de)通(tong)信(xin)行為。此外,還有關(guan)于使用(yong)進(jin)化(hua)方(fang)(fang)(fang)法(fa)進(jin)行多(duo)智(zhi)(zhi)能(neng)(neng)體(ti)學習的(de)(de)(de)(de)(de)(de)(de)研(yan)(yan)究(jiu)(jiu),即智(zhi)(zhi)能(neng)(neng)體(ti)種群中的(de)(de)(de)(de)(de)(de)(de)突變(bian)和交叉,本書不涉(she)及(ji)(ji)這方(fang)(fang)(fang)面的(de)(de)(de)(de)(de)(de)(de)內(nei)容。最后,近年來,MARL 領(ling)域的(de)(de)(de)(de)(de)(de)(de)研(yan)(yan)究(jiu)(jiu)活動急劇增加,試圖寫(xie)一本書來跟上新算(suan)法(fa)的(de)(de)(de)(de)(de)(de)(de)步伐是徒勞的(de)(de)(de)(de)(de)(de)(de)。我們將重(zhong)點放在(zai) MARL 的(de)(de)(de)(de)(de)(de)(de)基本概念和思想上,并(bing)參考(kao)調(diao)查(cha)論(lun)文(wen)(包(bao)括(kuo)附(fu)錄 A 中列出的(de)(de)(de)(de)(de)(de)(de)論(lun)文(wen)),以(yi)獲得更完整(zheng)的(de)(de)(de)(de)(de)(de)(de)算(suan)法(fa)發展列表。

付費5元查看完整內容

永不停止學習(NEL)系統是一種非常高級的計算機系統,它隨著時間的推移不斷學習,從而更好地解決一個或多個特定任務。在過去的幾十年里,人們提出了不同的無窮學習方法,并在人工智能、機器學習、自然語言處理(NLP)和自然語言理解(NLU)等領域得到了應用。NEL方法的結果越來越頻繁地成功,從而鼓勵我們解決如何構建可以利用NEL原理的計算機系統的問題。此外,在大型預訓練語言模型中,用于描述可以持續學習的系統和模型的各種不同的名稱(永不停止學習,持續學習,終身學習等),以及在自監督學習和多任務學習(與NEL原則密切相關)方面的新成就,使有關NEL的教程變得相關。//megagon.ai/nel_tutorial/在本教程中,我們將探索永不停止學習(NEL)的思想和原則,在文獻中可以找到的不同方法(和變體),與傳統機器學習方法(如半監督學習,強化學習等)的異同和應用。要探討的另一個有趣方面是如何遵循NEL方法制定問題。因此,我們還將展示如何以NEL的方式對問題進行建模,并幫助觀眾熟悉這些方法。

付費5元查看完整內容

PyTorch是Facebook于2017年初在機器(qi)學習(xi)和(he)科學計算工具(ju)Torch的(de)基礎(chu)上,針對Python語(yu)言發(fa)布的(de)一個全新的(de)機器(qi)學習(xi)工具(ju)包,一經推出便受(shou)到(dao)了(le)業(ye)界的(de)廣(guang)泛關(guan)注和(he)討論,目前已經成(cheng)為機器(qi)學習(xi)從業(ye)人員的(de)研發(fa)工具(ju)。

《PyTorch深(shen)度學習(xi)》是使用(yong)(yong)(yong)PyTorch構建神(shen)經(jing)網(wang)絡模(mo)型的(de)(de)實用(yong)(yong)(yong)指南,內容分(fen)為9章,包括PyTorch與(yu)(yu)深(shen)度學習(xi)的(de)(de)基礎知識、神(shen)經(jing)網(wang)絡的(de)(de)構成、神(shen)經(jing)網(wang)絡的(de)(de)知識、機器學習(xi)基礎知識、深(shen)度學習(xi)在電腦(nao)視覺中的(de)(de)應用(yong)(yong)(yong)、深(shen)度學習(xi)在序列數據和文(wen)本(ben)中的(de)(de)應用(yong)(yong)(yong)、生成網(wang)絡、現代網(wang)絡架構,以及PyTorch與(yu)(yu)深(shen)度學習(xi)的(de)(de)未來走向。

《PyTorch深度(du)學習》適合(he)對深度(du)學習領域感(gan)興趣且(qie)希望一探(tan)PyTorch的(de)業內人員閱(yue)讀(du);具備其他深度(du)學習框架使用(yong)經驗(yan)的(de)讀(du)者,也可以通過本書掌握PyTorch的(de)用(yong)法。

Vishnu Subramanian在領導、設(she)計和實施大數據分析(xi)項目(人(ren)工智(zhi)能(neng)、機器學(xue)習和深度學(xue)習)方面富有經驗。

擅長機器學(xue)習、深度(du)學(xue)習、分(fen)布(bu)式機器學(xue)習和(he)可(ke)視(shi)化等(deng)。 在零售、金(jin)融和(he)旅行等(deng)行業頗具經驗,還善(shan)于(yu)理解和(he)協調企業、人工智能和(he)工程團(tuan)隊之間的關系。

付費5元查看完整內容

終身機(ji)器學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)(LL)是一種(zhong)先進(jin)的(de)(de)(de)(de)(de)機(ji)器學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)(ML)范(fan)式(shi)(shi),它(ta)不(bu)斷(duan)學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi),積累過去學(xue)(xue)(xue)(xue)(xue)(xue)到(dao)的(de)(de)(de)(de)(de)知(zhi)識(shi),并(bing)使(shi)用/適應它(ta)來(lai)幫(bang)助未來(lai)的(de)(de)(de)(de)(de)學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)和(he)(he)(he)問題解決。在(zai)(zai)這(zhe)個(ge)(ge)過程中,學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)者變得越(yue)來(lai)越(yue)有(you)知(zhi)識(shi),學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)能(neng)(neng)力(li)也越(yue)來(lai)越(yue)強。這(zhe)種(zhong)持續(xu)不(bu)斷(duan)的(de)(de)(de)(de)(de)學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)能(neng)(neng)力(li)是人(ren)(ren)類智力(li)的(de)(de)(de)(de)(de)特征之一。然而,目前占主導(dao)地(di)位的(de)(de)(de)(de)(de)ML范(fan)式(shi)(shi)是孤(gu)立(li)學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)的(de)(de)(de)(de)(de):給定一個(ge)(ge)訓練數據集,它(ta)只(zhi)(zhi)在(zai)(zai)數據集上運行(xing)ML算法來(lai)生成模型。它(ta)不(bu)試(shi)圖保留所(suo)學(xue)(xue)(xue)(xue)(xue)(xue)的(de)(de)(de)(de)(de)知(zhi)識(shi),并(bing)在(zai)(zai)以(yi)后的(de)(de)(de)(de)(de)學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)中使(shi)用。雖然這(zhe)種(zhong)主要(yao)基(ji)于(yu)數據驅動優化(hua)的(de)(de)(de)(de)(de)孤(gu)立(li)ML范(fan)式(shi)(shi)已(yi)經非(fei)常成功(gong),但它(ta)需(xu)要(yao)大量(liang)的(de)(de)(de)(de)(de)訓練示(shi)例,并(bing)且只(zhi)(zhi)適用于(yu)封閉環(huan)境(jing)中定義明確的(de)(de)(de)(de)(de)狹窄任務。相比之下(xia),我(wo)們人(ren)(ren)類學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)有(you)效地(di)與幾個(ge)(ge)例子,在(zai)(zai)動態(tai)和(he)(he)(he)開放的(de)(de)(de)(de)(de)世界self-supervised方式(shi)(shi)或(huo)(huo)(huo)環(huan)境(jing)因為我(wo)們的(de)(de)(de)(de)(de)學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)也非(fei)常知(zhi)識(shi):知(zhi)識(shi)學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)在(zai)(zai)過去幫(bang)助我(wo)們學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)新事物沒(mei)有(you)數據或(huo)(huo)(huo)努力(li)和(he)(he)(he)適應新的(de)(de)(de)(de)(de)/看不(bu)見(jian)的(de)(de)(de)(de)(de)情(qing)況下(xia)。這(zhe)種(zhong)自我(wo)至上(或(huo)(huo)(huo)自我(wo)意(yi)識(shi))的(de)(de)(de)(de)(de)學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)也使(shi)我(wo)們能(neng)(neng)夠在(zai)(zai)工(gong)作中,在(zai)(zai)與他(ta)人(ren)(ren)的(de)(de)(de)(de)(de)互動中,在(zai)(zai)沒(mei)有(you)外部監(jian)督的(de)(de)(de)(de)(de)情(qing)況下(xia),與現(xian)實世界的(de)(de)(de)(de)(de)環(huan)境(jing)進(jin)行(xing)學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)。LL的(de)(de)(de)(de)(de)目標是實現(xian)所(suo)有(you)這(zhe)些(xie)能(neng)(neng)力(li)。諸(zhu)如(ru)聊(liao)天機(ji)器人(ren)(ren)、無(wu)人(ren)(ren)駕駛汽車或(huo)(huo)(huo)任何與人(ren)(ren)類/物理環(huan)境(jing)交互的(de)(de)(de)(de)(de)人(ren)(ren)工(gong)智能(neng)(neng)系統都(dou)需(xu)要(yao)這(zhe)些(xie)功(gong)能(neng)(neng),因為它(ta)們需(xu)要(yao)應對動態(tai)和(he)(he)(he)開放的(de)(de)(de)(de)(de)環(huan)境(jing),這(zhe)讓(rang)它(ta)們別無(wu)選(xuan)擇,只(zhi)(zhi)能(neng)(neng)不(bu)斷(duan)學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)新東西,以(yi)便(bian)更好地(di)工(gong)作。如(ru)果沒(mei)有(you)LL能(neng)(neng)力(li),AI系統就(jiu)(jiu)不(bu)能(neng)(neng)被認為是真(zhen)正智能(neng)(neng)的(de)(de)(de)(de)(de),也就(jiu)(jiu)是說,LL是智能(neng)(neng)或(huo)(huo)(huo)AGI(人(ren)(ren)工(gong)一般智能(neng)(neng))所(suo)必需(xu)的(de)(de)(de)(de)(de)。(見(jian)我(wo)的(de)(de)(de)(de)(de)終身學(xue)(xue)(xue)(xue)(xue)(xue)習(xi)(xi)研究頁面)。

//www.cs.uic.edu/~liub/lifelong-machine-learning.html

付費5元查看完整內容

可(ke)(ke)(ke)解釋性是當前AI研究的熱點之一(yi)。倫敦(dun)大學學院Pasquale Minervini博士在可(ke)(ke)(ke)解釋AI研討會做了關(guan)于可(ke)(ke)(ke)解釋高效可(ke)(ke)(ke)驗證表示的報(bao)告《Back to Seminars Explainable, Verifiable, Relational Representation Learning from Knowledge Graphs》,共62頁PPT,

可解釋、數據有(you)效、可驗(yan)證的表(biao)示學習

知識(shi)圖譜(pu)是圖結(jie)構化的(de)知識(shi)庫,其中關于世界(jie)的(de)知識(shi)以(yi)實體(ti)之(zhi)間(jian)關系的(de)形式(shi)進行編碼。我(wo)們將(jiang)討論(lun)(lun)在大規模知識(shi)圖譜(pu)使用神(shen)經鏈(lian)(lian)接(jie)預測缺失鏈(lian)(lian)接(jie)的(de)工作(zuo),以(yi)及如何(he)結(jie)合(he)背景知識(shi)——形式(shi)的(de)一(yi)階邏(luo)輯(ji)規則(ze)或約束——神(shen)經鏈(lian)(lian)接(jie)預測,從更少的(de)數(shu)據歸納和整合(he)。最后(hou),我(wo)們將(jiang)討論(lun)(lun)如何(he)通過端到(dao)端可微推理器共(gong)同學(xue)習表示和規則(ze)。

付費5元查看完整內容
北京阿比特科技有限公司