數量和數字塑造了人類歷史的整體進程,支配著貿易、科學、數學和戰爭。我們對比較兩個數量或識別一個數字與另一個數字的認知機制還不甚了解。在這篇論文中,研究了支配數字認知的過程。通過一系列的研究,確定我們是如何將兩個大數量和兩個小數量的信息結合起來的。具體來說,確定了這些認知處理系統的處理架構(并行與串行)和工作量(效率)。然后,通過模擬研究擴展了這項工作,開發出一套新的分布特征,可用于識別并行和串行處理架構的混合物。最后,對數字的心理表征進行了跨文化研究。通過使用混淆分數,對講英語和講漢語的人群中的阿拉伯數字、泰語、漢語和圓點數字的心理表征進行了建模。這項調查顯示了心理表征是如何隨著專業知識水平的提高而變化的。本論文開發了新的方法和分析技術,并對支配數字認知的基本過程提供了新的見解。
異構多智能體系統為解決農業、軍事、裝配和倉庫自動化等不同領域的復雜問題提供了可能,否則單個智能體是無法解決這些問題的。要有效部署異構多機器人團隊,研究必須解決不同抽象程度的四個問題:任務規劃(是什么)、運動規劃(如何)、任務分配(誰)和調度(何時)。這些問題高度相互依存,先前的工作已經證明,利用這些問題的單個解決方案之間的協同作用的系統可以提高多機器人協調的效率和效益。
本文研究了在多智能體組隊應用中使用基于特質的模型來表示單個智能體,以及如何利用基于特質的建模來實現更穩健、更高效的多智能體聯盟組建解決方案。具體來說,我們研究了如何在聯盟組建算法中使用這些技術來回答任務分配、調度、運動規劃和任務規劃這四個問題。
我們的研究表明,利用基于機器人和任務特質建模的算法可以在異構多機器人團隊中實現高效的協調,并且在時間進度、分配質量和計算效率方面優于現有方法。本論文的貢獻如下:
創建一個建模框架,使現代任務分配算法能夠推理動態特征。通過使用基于轉換的建模框架,我們創建了對以往基于特質的建模技術的擴展,以更好地推理智能體的特質如何隨時間變化。
為異構多機器人系統開發基于時間擴展特質的任務分配和路徑規劃統一框架。我們引入了一種基于搜索的方法,用于基于特質的時間擴展任務分配和運動規劃,命名為增量任務分配圖搜索(ITAGS)。
整合任務規劃、任務分配、調度和運動規劃的新型多機器人協調問題的形式化和解決方案。我們形式化了一類新的多機器人協調問題,該問題融合了這些問題中的每一個,并提出了一種解決方案(圖形遞歸同步任務分配、規劃和調度(GRSTAPS))。
為 ITAGS 的動態變體創建框架,該變體能夠進行基于特征的任務分配修復: 我們對 ITAGS 進行了擴展,使用基于特質的動態時間擴展任務分配算法,如果智能體的特質或任務要求在執行過程中發生變化,該算法可以修復任務分配。
創建一個主動學習框架,用于學習多智能體任務分配問題的特質要求: 由于理解一個聯盟的特質與該聯盟在特定任務中的表現之間的關系可能具有挑戰性,因此我們提出了一種主動學習框架來學習任務與特質之間的關系。此外,我們還提供了一種新的時間擴展任務分配算法,該算法能夠優化學習到的質量模型。
圖 2.1: 顯示各種多機器人協調問題交叉點的維恩圖。
現有的決策計算模型往往局限于特定的實驗設置。造成這種限制的主要原因是無法捕捉決策者對情況的不確定性。本文提出了一個計算框架,用于研究神經科學和心理學中不確定情況下的決策制定。框架主要側重于決策者對世界狀況的概率評估,即他們的 “信念”。具體來說,它基于部分可觀測馬爾可夫決策過程(POMDPs),結合貝葉斯推理和獎勵最大化來選擇行動。利用感知決策和社會決策方面的各種實驗數據,證明了基于信念的決策框架的可行性。框架解釋了感知決策實驗中決策者的實際表現與他們對實際表現的信念(即決策信心)之間的關系。它還說明了為什么在許多情況下這種評估會偏離現實。這種偏差通常被解釋為次優決策的證據,或選擇和信心的不同過程。我們的框架對這些解釋提出了挑戰,它表明,一個優化收益的規范貝葉斯決策者也會產生同樣的偏差。此外,在定量預測人類在社會決策任務中的行為方面,方法優于現有模型,并提供了對潛在過程的洞察。結果表明,在涉及大型群體的決策任務中,人類采用貝葉斯推理來模擬 “群體心理”,并對他人的決策做出預測。最后,將方法擴展到關于他人的多個推理層次(心智理論層次),并將服從作為群體決策的一種策略聯系起來。這個擴展框架可以解釋人類在各種集體群體決策任務中的行為,為大型群體中的合作與協調提供了新的理論。
圖 1.1: 基于信念的決策框架。智能體通過行動、觀察和獎勵與世界互動。智能體無法完全觀測到世界的狀態,只能根據觀測結果和智能體的內部世界模型,以概率方式表示世界的狀態。智能體的目標是根據當前狀態的概率分布來制定策略,即所謂的信念
與決策相關的活動,如自下而上和自上而下的策略制定、分析和規劃,都將受益于基于計算機的模型的開發和應用,這些模型能夠在當地環境中表現人類的時空社會行為。在努力了解和尋找減緩氣候變化特定影響的方法時尤其如此,在這種情況下,此類模型需要包括相互影響的社會和生態要素。此類模型的開發和應用一直受到以下挑戰的嚴重阻礙:設計行為以經驗證據和理論為基礎的智能體,以及測試智能體代表現實世界決策者行為的能力。本論文通過以下方法克服了這些挑戰,從而提高了開發此類模型的能力: (a) 三個新框架,(b) 兩種新方法,以及 (c) 兩種新的開源建模工具。這三個新框架包括 (a) SOSIEL 框架,它為開發新一代認知、多智能體和基于知識的模型提供了一個有理論基礎的藍圖,這些模型由具有認知架構的智能體組成; (b) 一個分析決策者有界理性的新框架,它為分析決策情境與決策者決策之間的關系提供了洞察力和便利;以及 (c) 一個分析人工智能體雙重有界理性(DBR)的新框架,它對決策情境與人工智能體決策之間的關系做了同樣的分析。這兩種新方法包括 (a) 用于獲取和操作決策知識的 SOSIEL 方法,它提高了我們為認知模型、多智能體模型和基于知識的模型獲取、處理和表示決策知識的能力;以及 (b) 用于測試人工智能體表示人類決策能力的 DBR 方法。這兩個開源建模工具包括 (a) SOSIEL 平臺,這是一個基于認知、多智能體和知識的平臺,用于模擬人類決策;以及 (b) 將該平臺作為 SOSIEL 人類擴展(SHE)應用于現有的森林氣候變化模型,即 LANDIS-II,以便分析人類與森林氣候之間的共同進化互動。為了提供示例背景和知識獲取指南,論文包括烏克蘭喀爾巴阡山地區社會生態互動的案例研究,該地區目前正在應用 LANDIS-II 和 SHE。因此,本論文通過以下方式推動科學發展 (a) 為下一代基于認知、多智能體和知識的模型提供理論基礎并展示其實施;(b) 為理解、分析和測試人工智能體代表人類決策的能力提供植根于心理學的新視角。
社會技術系統是人類和算法的集合,它們在分散控制器的部分監督下進行交互。這些系統通常顯示出復雜的動態變化,并以其獨特的突發行為為特征。在這項工作中,我們描述、分析和模擬了三類不同的社會技術系統:金融市場、社交媒體平臺和選舉。雖然我們的工作在主題內容上多種多樣,但通過研究社會系統中由進化和適應驅動的變化以及開發用于推斷這種變化的方法,我們的工作是統一的。
首先在基于智能體的模型(ABM)中分析了金融市場微觀結構的進化動態。ABM 的匹配引擎實現了頻繁的批量拍賣,這是最近開發的一種價格發現機制。我們使用各種選擇機制讓智能體承受進化壓力,證明基于量化的選擇機制與較低的全市場波動性相關。然后,我們在 ABM 中進化深度神經網絡,并證明精英個體在真實外匯數據的回溯測試中是有利可圖的,盡管在進化過程中它們的適應性從未在任何真實金融數據上進行過評估。
然后,轉向從社會技術系統生成的大型時間序列面板中提取多時間尺度的功能信號。我們引入了離散小震子變換(DST)和相關的相似性搜索算法--小震子變換和排序算法(STAR)來完成這項任務。我們通過經驗證明了 STAR 算法對定量功能參數化的不變性,并提供了使用案例。在特征提取任務中,STAR 算法與 Twitter 的異常檢測算法進行了比較。最后,我們使用 STAR 算法,利用 Twitter 詞語使用時間序列面板,自動構建了社會重大事件的敘事時間軸。
最后,模擬了試圖干涉他國選舉的外國情報機構(紅隊)與選舉所在國國內情報機構(藍隊)之間的戰略互動。我們推導出紅方和藍方的亞博弈完全納什均衡策略,并展示了當任何一方對干涉事件的結果持 "全有或全無 "態度時,軍備競賽干涉動態的出現。然后,將 2016 年美國總統大選的數據與本文模型進行了對比,在這次大選中,俄羅斯軍事情報機構進行了干預。本文了證明,在研究的大部分時間里,本文了模型捕捉到了這種干預的定性動態。
本文的主要重點是開發一種低成本、魯棒性和高效的合作定位解決方案,以幫助無人自主飛行器在全球定位系統缺失或性能下降的條件下進行導航。
首先,推導出固定翼無人機(UAV)和多旋翼無人機的完全可觀測性條件。創建了一個相對位置測量圖(RPMG),圖中的節點是車輛或已知特征(地標),它們之間的邊代表測量結果。利用圖論和線性代數概念,得出了可觀測矩陣最大秩的條件,并建立了可觀測矩陣秩與系統中可用測量值之間的關系。該分析條件的缺點之一是必須在所有時間時刻保持一個連通的 RPMG。因此,我們提出了一種離散時間可觀測性條件,即一個時間間隔內的 RPMG 的聯合必須是相連的。
接下來,將討論無人飛行器 (UV) 緊密協調和控制的一個基本問題。在各種應用中,飛行器的慣性位置并不重要。在這種情況下,車輛之間的相對姿態和方位對開發控制器非常有用。眾所周知,擴展卡爾曼濾波器(EKF)的性能非常出色,前提是它的初始化接近真實位置并能接收到測量結果。對于沒有任何全球定位系統(GPS)測量數據或網絡延遲嚴重(需要重新初始化濾波器)的長距離行駛車輛,已知先驗信息的假設是無效的。為了規避這些問題,我們開發了一種多假設卡爾曼濾波器(MHEKF),該濾波器在初始化過程中沒有先驗信息,這意味著相關的不確定性非常大。
最后,解決了地面車輛的分布式合作定位問題。集中式合作定位需要大量計算。我們開發了一種分布式合作定位算法,使組內的每輛車都能估計自己的慣性狀態。該算法是為自主地面車輛開發的,在仿真中僅使用測距數據。
圖 1.1:合作定位的相對位置測量圖,其中塔作為地標(已知興趣點),不同的 UV 相互合作。
不變性對于神經網絡至關重要,它使得神經網絡能夠有效地泛化處理輸入數據的變化,通過聚焦于關鍵屬性同時過濾掉不相關的細節。在這篇論文中,我們通過具結構不變性的視角來研究神經網絡中的表示學習。我們首先研究神經網絡可以從數據中學習到的不變性的屬性和限制。接下來,我們開發了一種方法來提取神經網絡學習到的不變性結構,為學習到的不變性的質量提供了更為細致的分析。在下一章中,我們專注于對比學習,演示了如何通過更加結構化的監督來獲得更好質量的學習表示。接下來的最后兩章關注于具結構不變性表示學習在計算機視覺中的實際應用方面。
雖然在國際象棋中獲勝、學習一種語言或作曲一首奏鳴曲所需的技能集看似截然不同,但我們以類似的概念方式處理所有這些任務。依賴先前的知識,我們尋求在一個能夠高效導航至解決方案的路徑的空間中表示任務。通過戰略布局的兵結構和中心控制來表示一場象棋游戲,使人能夠迅速看出一個位置的強弱,從而做出強勢移動。通過語法規則表示語言,將詞語的混亂轉變為一個結構化系統,在這里即使遇到不熟悉的詞匯,也能理解句子的含義。通過音樂理論表示音樂,將一堆音符轉變為一個結構化的組合,其中音樂家可以輕松導航以選擇下一個要演奏的和弦。在所有這些例子中,找到適當的表示是高效解決任務的關鍵步驟。我們將尋找高效表示的過程稱為表示學習。
當我們處理日常任務、工作和例程時,涉及某種形式的表示學習。駕駛汽車時,我們學習交通規則的心理表示以安全導航,并使用城市布局的地圖表示以高效導航。在我們的工作中,我們學會使用信息圖表的形式,如圖表、流程圖或電子表格,來表示復雜的過程或數據,以便于交流。在社交互動中,我們學會解讀身體語言和面部表情作為人們情感和意圖的表示,以更好地理解他人。在這些例子中,我們轉向表示學習,以結構化信息并簡化手頭任務的解決方案。
自然地,在人工智能(AI)時代,自動化表示學習正成為一個極具興趣和重要性的任務。AI 驅動的表示學習不僅是 AI 驅動問題解決的關鍵組成部分,而且還可以作為一個工具,幫助解釋和解讀 AI 代理的預測。因此,研究 AI 驅動的表示學習對于構建值得信賴的智能系統至關重要。
本論文聚焦于神經網絡中表示學習的過程。
這本書描述了如何創建能夠自主執行任務的行為和認知技的機器人,而他們與環境互動,通過進化和/或學習過程。本書專注于無模型的方法,以最少的人為干預,機器人使用的行為解決了它的任務,這種行為產生的方式是由自適應過程自動發現的,即它不是由實驗者指定的。
這本書的第一個目標是介紹自主機器人和自適應方法:進化機器人,強化學習,和通過演示學習。在這方面,本書不能也不打算詳盡無遺。它側重于當前最有效的方法,以及那些密切相關但通常在獨立的研究團體中獨立研究的方法之間的關系。
第二個目標是通過對自適應機器人在具體實驗中發現的行為和認知解決方案的分析來說明具身智能的基本方面:機器人的身體和“大腦”之間的關系,感覺運動協調的作用,欠驅動的后果,行為的動力和多層次的含義,魯棒性的重要性,出現和自組織的作用,學習經驗對適應過程的影響,預測和世界模型的作用,機器人之間的合作和競爭的作用,能夠促進持續和開放學習的因素。
最后,第三個目標是讓讀者通過實驗自適應機器人來獲得實際知識。這個最終目標是通過向讀者介紹易于使用和強大的軟件工具來實現的,允許創建自適應機器人,復制代表性的最先進的實驗,并獲得在這個領域進行高質量研究所需的實踐技能。
Preface
注意力是一種在廣泛的神經結構中使用的越來越流行的機制。由于這一領域的快速發展,仍然缺乏對注意力的系統概述。在本文中,我們定義了用于自然語言處理的注意力體系結構的統一模型,重點介紹了用于文本數據的向量表示的體系結構。我們討論了以往工作的不同方面,注意力機制的可能用途,并描述了該領域的主要研究工作和公開挑戰。
//web.eecs.umich.edu/~justincj/slides/eecs498/FA2020/598_FA2020_lecture13.pdf
近年來,神經網絡已成為分析復雜和抽象數據模型的有力工具。然而,它們的引入本質上增加了我們的不確定性,即分析的哪些特征是與模型相關的,哪些是由神經網絡造成的。這意味著,神經網絡的預測存在偏差,無法與數據的創建和觀察的真實本質區分開來。為了嘗試解決這些問題,我們討論了貝葉斯神經網絡:可以描述由網絡引起的不確定性的神經網絡。特別地,我們提出了貝葉斯統計框架,它允許我們根據觀察某些數據的根深蒂固的隨機性和我們缺乏關于如何創建和觀察數據的知識的不確定性來對不確定性進行分類。在介紹這些技術時,我們展示了如何從原理上獲得神經網絡預測中的誤差,并提供了描述這些誤差的兩種常用方法。我們還將描述這兩種方法在實際應用時如何存在重大缺陷,并強調在使用神經網絡時需要其他統計技術來真正進行推理。