在過去的幾個世紀里,由于科學和工業的重大突破,社會發生了巨大的變化。新的機械和電子技術使自動化機器取代人類勞動成為可能。機器人技術的標準化旨在將這一發展推向新的高度,取代人類對物質世界的干預,甚至在我們生活中曾經被認為是微不足道的領域,如駕駛、清潔和美化環境。機器人已被用于執行瑣碎、體力消耗大、重復和單調的任務。此外,它們還可以在危險或難以接近的環境中工作,從而超越人類的能力。從經濟角度看,使用機器人勞動很有吸引力,因為機器可以連續作業。
隨著機器人在我們的工業和日常生活中越來越普遍,它們有可能從根本上改變我們與工作的關系。然而,機器人技術在社會中的全部潛力尚未實現,需要進一步的研究、工程和創新,以更好地了解和擴大其應用。
自動化系統面臨的主要挑戰之一是需要在真實的、因此也是不確定的條件下運行。由于機器人的決策是基于描述自身及其環境的模型,因此后者的數學完美性在描述現實時不可避免地受到限制。一個典型的問題就是參數不確定性,這可能會在執行運動任務時出現,例如當移動機器人必須到達一個特定位置以執行抓取物體等任務時。如果采用的模型是有效的,但輸入的參數有誤,則任務執行情況可能與預期的名義行為不同。
為了克服機器人技術中固有的這一基本問題,主要的解決方案是設計專門解決這一問題的控制器,同時確保即使在參數偏差的情況下也能保持穩定的行為。第一種經典方法是開發魯棒控制器,即針對有限范圍的參數不確定性保證一定程度不敏感的靜態控制法則。不過,這些控制法則必須專門針對當前系統進行調整。基于被動性的方法也可包含在魯棒控制中,它們利用系統的結構能量特性,對系統參數的變化保持不變。
另一種方法是在執行控制操作的同時進行在線參數估計。這種方法包括向控制器發送最新的測量結果,控制器會根據變化情況加入額外的動態參數。不過,在線參數估計并非易事,因為它需要充分激發機器人的動力,這可能會與主要導航任務發生沖突。此外,估算的動態可能會產生不良瞬態,從而增加損害耦合系統/估算穩定性的風險。
在上述情況下,實現穩健性往往要以犧牲任務的精度或性能為代價。事實上,權衡利弊是不可避免的:要么選擇一個完美的控制器,確保跟蹤任務的高精度,但它依賴于對模型參數的充分了解(因此非常容易受到干擾);要么選擇一個控制器,確保一定程度的抗干擾魯棒性,但往往只能實現所謂的實用穩定。
另一種觀點則顛倒了應對參數不確定性的主要設計理念:與其將重點放在設計復雜的控制器上,不如保持系統/控制器的原樣,保留其優缺點,并將重點放在優化軌跡上,以提高參數不確定系統的性能。從這一角度出發,近期的工作重點是生成所謂的前饋軌跡,這種軌跡可以適當地將系統的 “開環 ”狀態敏感性降至最低。
最近,這些工作已擴展到規劃 “閉環 ”狀態靈敏度最小的軌跡。這項新研究被稱為 “控制感知”(control-aware),它將系統/控制器耦合直接整合到優化中。這樣,即使在參數不確定的情況下,對運動設定點形狀的適當選擇也能確保導航任務的穩健性。這種方法可能對未來的許多應用都有好處,我們認為值得進一步開發。
在這方面,本論文的主要目標是探索魯棒、控制感知軌跡規劃在參數不確定性方面提供的可能性和局限性。研究問題更明確地表述為四旋翼飛行器新型軌跡規劃框架的設計(和實施)。所介紹軟件方法的有效性始終通過廣泛的統計模擬活動進行實證評估。
異構多智能體系統為解決農業、軍事、裝配和倉庫自動化等不同領域的復雜問題提供了可能,否則單個智能體是無法解決這些問題的。要有效部署異構多機器人團隊,研究必須解決不同抽象程度的四個問題:任務規劃(是什么)、運動規劃(如何)、任務分配(誰)和調度(何時)。這些問題高度相互依存,先前的工作已經證明,利用這些問題的單個解決方案之間的協同作用的系統可以提高多機器人協調的效率和效益。
本文研究了在多智能體組隊應用中使用基于特質的模型來表示單個智能體,以及如何利用基于特質的建模來實現更穩健、更高效的多智能體聯盟組建解決方案。具體來說,我們研究了如何在聯盟組建算法中使用這些技術來回答任務分配、調度、運動規劃和任務規劃這四個問題。
我們的研究表明,利用基于機器人和任務特質建模的算法可以在異構多機器人團隊中實現高效的協調,并且在時間進度、分配質量和計算效率方面優于現有方法。本論文的貢獻如下:
創建一個建模框架,使現代任務分配算法能夠推理動態特征。通過使用基于轉換的建模框架,我們創建了對以往基于特質的建模技術的擴展,以更好地推理智能體的特質如何隨時間變化。
為異構多機器人系統開發基于時間擴展特質的任務分配和路徑規劃統一框架。我們引入了一種基于搜索的方法,用于基于特質的時間擴展任務分配和運動規劃,命名為增量任務分配圖搜索(ITAGS)。
整合任務規劃、任務分配、調度和運動規劃的新型多機器人協調問題的形式化和解決方案。我們形式化了一類新的多機器人協調問題,該問題融合了這些問題中的每一個,并提出了一種解決方案(圖形遞歸同步任務分配、規劃和調度(GRSTAPS))。
為 ITAGS 的動態變體創建框架,該變體能夠進行基于特征的任務分配修復: 我們對 ITAGS 進行了擴展,使用基于特質的動態時間擴展任務分配算法,如果智能體的特質或任務要求在執行過程中發生變化,該算法可以修復任務分配。
創建一個主動學習框架,用于學習多智能體任務分配問題的特質要求: 由于理解一個聯盟的特質與該聯盟在特定任務中的表現之間的關系可能具有挑戰性,因此我們提出了一種主動學習框架來學習任務與特質之間的關系。此外,我們還提供了一種新的時間擴展任務分配算法,該算法能夠優化學習到的質量模型。
圖 2.1: 顯示各種多機器人協調問題交叉點的維恩圖。
自動化已成為現代經濟的重要組成部分。在眾多業務、任務和項目中,通過增加有限的人力,可以提高生產率。隨著自動化流程越來越多地融入日常生活,了解人類操作員與自動化之間的關系變得至關重要。過去,自動化開發依賴于操作員的反饋,而操作員對類似系統的熟悉程度和對現代技術的接受程度可能會有所不同。這一事實凸顯出缺乏一種標準化的衡量標準,可以量化個人對自動化系統的信任程度。本研究就建立了這樣一種衡量標準。自動化信任度指標是通過一個多步驟流程創建的,首先由主題專家進行 Q 排序,以確定數據集的相關項目。然后,將得到的項目發送給 145 名受訪者進行探索性因子分析 (EFA),將項目歸類為因子,并剔除表現不如預期的項目。在實施 EFA 分析結果后,又對 168 名受訪者進行了確認性因子分析 (CFA),以證實 EFA 分析結果,并找出影響個人對自動化信任程度的重要問題。這一研究過程產生了一個可應用于各種系統的八問調查,它能可靠地測量人類對機器信任的四個方面。
圖 3.1 影響對自動化信任的因素及其與性能的關系。
過去幾十年來,在安全、監視、情報收集和偵察等許多領域,對目標跟蹤(OT)應用的需求一直在增加。最近,對無人駕駛車輛新定義的要求提高了人們對 OT 的興趣。機器學習、數據分析和深度學習的進步為識別和跟蹤感興趣的目標提供了便利;然而,持續跟蹤目前是許多研究項目感興趣的問題。本文提出了一個系統,實現了一種持續跟蹤目標并根據其先前路徑預測其軌跡的方法,即使目標在一段時間內部分或完全被隱藏。該系統分為兩個階段:第一階段利用單個固定攝像機系統,第二階段由多個固定攝像機組成的網狀系統。第一階段系統由六個主要子系統組成:圖像處理、檢測算法、圖像減法器、圖像跟蹤、跟蹤預測器和反饋分析器。系統的第二階段增加了兩個主要子系統: 協調管理器和相機控制器管理器。這些系統結合在一起,可以在目標隱藏的情況下實現合理的物體連續性。
現在,模擬被更頻繁地用于對現實世界或擬議系統進行實驗,以了解系統行為或評估改進策略。隨著時間的推移,大型企業越來越需要開發精密復雜的系統來與同行業競爭。而且,這些企業之間的聯系越來越緊密,就像一個網絡化的企業。這就進一步提高了開發能與其他企業互聯的越來越復雜的模擬的要求。在這方面,分布式仿真已廣泛應用于軍事領域,但在其他領域并沒有得到普及。這背后的原因是,在分布式仿真之間建立通信協議需要專業技術知識。科研行業一直在努力縮小這一差距,其中最重要的工作是制定高級架構(HLA)標準,為分布式仿真模型之間提供通用通信協議。
建模與仿真(M&S)行業也為開發人員提供了大量有關獨立仿真建模的文獻。在這種情況下,概念建模的重點是模型的準確性和效率,而不是互操作性。本研究也對此進行了詳細討論。直到最近,從業人員也一直在努力尋找對底層技術的支持。但隨著標準運行時基礎設施(RTI)和仿真開發平臺支持的引入,這一差距已經縮小。
HLA 標準承諾解決分布式仿真模型之間的互操作性問題,但只能提供語法層面的標準指南。因此,仿真互操作性標準組織(SISO)繼續開展研究,確定了從業人員在語義層面面臨的互操作性問題,并起草了一份互操作性問題清單。然而,已發布的 SISO-STD-006-2010 標準只指出了問題,卻沒有提供語義解決方案。
本研究的主要貢獻是提出了分布式仿真互操作性(DSI)框架,為《商用現成仿真包互操作性參考模型》(SISO-STD-006-2010)中列出的互操作性問題確定了語義解決方案。本研究建議將這些互操作性語義解決方案納入 HLA 對象建模模板規范。這樣做將有助于行業從業人員實現 HLA 的互操作性承諾,并使分布式仿真模型更具可重用性和可組合性。
多智能體機器人技術有望塑造工業的未來,有可能改變日常生活的許多方面。在未來十年中,它們預計將對運輸系統、軍事應用(如偵察和監視、搜救行動或太空任務)產生影響,并為急救人員提供支持。
在機器人領域最新發展的推動下,隨著新一代多智能體機器人系統變得更加智能、精確,應用領域也更加多樣化,本論文將為這些系統的發展做出貢獻。但是,為了實現這些目標,組成合作機器人系統的各個智能體需要在確保準確性和保留執行多樣化任務能力的同時,對它們所能完成的任務進行專業化。
本論文在考慮單個智能體專業化能力的特定背景下,探討了蜂群機器人技術中的任務分配問題。基于每個智能體都擁有專門的功能能力,以及分布在周圍環境中的預期任務提出了特定要求的假設,提出的任務分配機制在兩個不同的空間中制定。首先,團隊成員專業化的初級形式被表述為嵌入智能體動力學控制空間的合作控制問題。其次,定義了智能體專業化的高級表述,在專用的專業化空間中估計單個智能體的任務分配概率,這是本論文對蜂群機器人領域的進步和實踐的核心貢獻。
在專業化空間中制定的原始任務分配過程經歷了四個發展階段。首先,從概念上引入了任務特征識別階段,利用嵌入在智能體中的傳感層的輸出來驅動所提出的任務分配方案。其次,制定匹配方案,將每個智能體的專業能力與相應的檢測任務進行最佳匹配。在這一階段,智能體專業化的一般二進制定義是任務-智能體關聯的基礎。第三,將任務-智能體匹配方案擴展為創新的基于概率專業的任務-智能體分配框架,以推廣這一概念并挖掘智能體專業化考慮的潛力。第四,根據智能體的機械、物理結構和嵌入式資源對其專業化進行調制定義,進一步完善了總體框架。此外,還對原有框架進行了擴展,并引入了優先級層,以提高系統對復雜任務的響應能力,這些復雜任務的特點是基于對多個類別的識別。
在模擬和實際實驗中對所提出的基于專長的任務分配方法進行了實驗驗證,并結合潛在應用對結果進行了介紹和討論,以證明所提框架的有效性和效率。
這項工作旨在填補以往解決機器人群個體專業化問題的工作中的技術空白。本論文的成果通過開發一個創新框架,利用傳感能力來支持智能體之間專業化的概念化和實施,從而推動了蜂群機器人領域的發展。重點在于定義單個智能體的專長,并根據每個任務的特定約束條件,將其與這些單個智能體所要掌握的任務相匹配。為此,本研究打算回答以下研究問題:
問題 1:一群智能水平相對較低的機器人如何完成復雜的任務,這些任務需要單個機器人代理的專業化?
過去二十年來,多智能體系統的合作編隊控制受到了研究人員的極大關注。本論文以文獻綜述(第 2 章)中提到的方法為基礎,提出了一種解決方案,以填補機器人團隊中單個成員專業化方面的研究空白。本論文的重點是通過利用智能體的非同質性來增強蜂群的能力。為此,本論文擴展了合作蜂群的概念,并提出了一個嚴格的流程來利用單個智能體之間的專業異質性。
為了回答問題 1,我們首先進行了一項早期調查,以驗證這一概念。這一過程將機器人團隊工作空間的不同區域定義為分配給不同任務的獨立區域。所開發的解決方案可讓機器人順利安全地切換位置,并根據每個訪問區域要執行的特定任務動態調整整體隊形。它定義了如何在每個區域管理機器人群的編隊。作為一種初級的專業化形式,當智能體從一個區域轉移到另一個區域時,該框架會將智能體的領導角色從一個智能體切換到另一個智能體。在第一階段的研究中,假定一個特定的智能體(即蜂群中的一個成員)是每個區域中唯一專門執行領導任務的智能體。在任務完成之前,該智能體被指定為相關區域的專門領導者。第一部分研究的詳細情況將在第 3.4 節中報告。
問題 2:能否對最初的方法進行升級,讓專業化個體從環境中的自動目標識別中獲益,能否讓智能體之間的合作變得足夠穩健和靈活,以便在發現目標后自動將適當的專業化智能體分配到相應的任務中?
為了回答這個問題,我們進一步擴展了原有的協調系統,用于在專用機器人之間分配基于任務的領導權。通過對分布在機器人群工作空間中的專業化影響區域的定義進行演化,對問題進行了重新表述。受早期編隊方法的啟發,出現了一種有趣的解決方案。從使用機載傳感器自動識別工作區目標的假設出發,選擇有資格執行識別任務的智能體的過程應逐步經歷三個基本狀態,分別稱為搜索狀態、任務狀態和執行狀態。這種方法還可擴展到目標移動時的動態影響區域,以及多個任務共享同一區域時的動態影響區域。這更好地反映了移動機器人的實際干預場景。這方面的工作將在第 3.5 節中報告。
問題 3:為了改進蜂群的管理,能否根據智能體的專業化程度,在一定程度上適合響應給定任務的概率匹配機制中,適當定義和制定每個智能體的專業化功能?
為了解決這個問題,可以利用基于概率的建模來完善用于實現單個智能體角色專業化的框架設計。建立這樣一種智能體行為的概率表征,可以形成一種可擴展的機制。后者支持自動化流程,能夠處理任務和專業化定義中的不確定性,并應對任務約束和智能體能力之間的不完美匹配。所提出的智能體選擇方案是根據任務識別的置信度和特定智能體滿足任務特定要求的概率來制定的。所提出的基于專業的任務分配方案旨在根據所識別的任務約束條件,計算蜂群中各個智能體的匹配適合度,即任務-智能體專業匹配概率。本框架的開發過程詳見第 4.3 和 4.4 節。
問題 4:提議的框架能否應用于實際系統?
為了證明所提方法的有效性及其在現實世界中的應用潛力,我們從兩個方面對其進行了測試。首先,在仿真中對所提出的框架進行驗證,以證明其有效性。第 5 章介紹了大量的模擬實驗。然后,作為案例研究介紹了擬議方法的潛在應用,同時詳細介紹了擬議框架在真實機器人平臺上的實施情況,以驗證和檢驗基于專業的任務分配方案在實現預期協調水平方面的性能。這項工作將在第 6 章中介紹。
圖 3.12 任務執行的先后順序:(a-c)影響區重疊,操作員選擇任務 1(紅色)為優先任務,這促使紅色機器人繼續擔任領導者,直到紅色任務完成;(d-f)第二優先任務(藍色)正在執行,藍色機器人轉為領導者位置;(g-h)蜂群恢復到影響區重疊外的搜索狀態,然后搜索其他任務(綠色,然后是紅色),由相應的領導者機器人執行。
機器學習是一門相對年輕的科學學科,其目標是通過從過去的經驗中學習來達到實現人類決策能力。它是一個跨學科領域,需要統計學、優化學、工程學和計算創新等多方面的知識。在過去的幾十年里,我們見證了機器學習算法的快速發展,這些算法在實踐中取得了顯著的成功,以至于機器學習已經成為解決現代社會中許多具有挑戰性問題的不可或缺的技術。與此同時,計算機科學、統計學、優化學和工程學的研究人員已經開發了機器學習的數學理論,他們致力于建立嚴格的數學基礎,不僅可以解釋當前的算法,還可以激勵未來基于原則的方法。然而,許多現有的理論成果散布在文獻中。雖然有一些入門書籍和綜述文章試圖涵蓋這些理論成果的一部分,但還沒有任何深入的教科書能夠提供對文獻中開發的標準數學工具的全面介紹。
這本書的目標是系統地介紹當前文獻中常用于分析機器學習算法的主要數學技術。由于空間限制,這本書本身并未詳細解釋各種機器學習算法及其應用背景。因此,假定讀者已經熟悉標準的機器學習算法,如支持向量機、決策樹、提升法、神經網絡等。讀者還應具備微積分、線性代數和概率的基本數學知識,以及足夠的數學成熟度來理解嚴格的理論證明。對于這樣的讀者,本書的主要目的是介紹現代數學技術,這些技術常用于分析這些機器學習算法。所選材料的水平足以為讀者提供充足的技術背景和知識,使他們能夠毫不費力地閱讀理論機器學習的研究論文。
這本書中選擇的主題旨在涵蓋當前研究水平上最有用和常見的數學工具和結果。一些更專業的主題(例如主動學習、半監督學習、損失函數一致性、差分隱私等)沒有包括在內,但是掌握了本書所介紹的技術工具的讀者應該能夠毫無困難地緊跟這些主題的當前研究。這本書可用于研究生級別的理論機器學習課程,并可作為從事理論機器學習研究的研究人員的參考資料。雖然最基本的概念以足夠的深度進行了說明,但一些其他當前感興趣的主題則以較少的細節進行介紹。由于主題眾多,一些介紹相對簡潔,而另一些主題則以一種抽象的方式呈現,目的是統一文獻中出現的不同特例。這種抽象和簡潔的表述可能在初次閱讀時導致一些困難。為了減輕這種困難,包含了許多示例,以提供理論結果的具體解釋和適當的背景。還包括了歷史性的評論,以給出本書所涵蓋主題的原始來源,以及對深入理解感興趣的讀者的額外閱讀材料。每章末尾提供的練習可以幫助讀者檢查他們對主要概念的掌握。大多數練習需要對材料有良好的了解,但不難。此外,一些練習旨在為與主文相關但沒有直接涵蓋的主題提供額外信息。
這本書包含兩個主要部分。第一部分,從第1章到第12章,涵蓋了在獨立同分布(iid)設置中監督學習算法的分析。它從獨立變量之和的標準指數尾部不等式開始,然后用幾章的篇幅發展了均勻收斂的技術工具,這是分析機器學習算法的主要數學機制。使用覆蓋數、VC維和Rademacher復雜度等經典概念建立了關鍵結果。這本書的第一部分還涵蓋了最近出現的穩定性分析技術,它可以處理諸如隨機梯度下降等特定的學習過程。作為這些基本數學工具的應用,也以不同程度的細節展示了對包括核方法、加性模型和神經網絡在內的幾種常用機器學習模型的分析。最后,第一部分以第12章的標準下界分析結束,涵蓋了常用的技術,如Fano的不等式和Assouad的引理。還提供了關于最小二乘回歸和密度估計的示例。這本書的第二部分,從第13章開始,涵蓋了順序統計估計問題的分析,包括在線學習、多臂老虎機問題和強化學習。它從將指數尾部不等式和獨立同分布隨機變量的均勻收斂分析推廣到順序設置中的鞅開始。然后在后續章節中描述在線學習、多臂老虎機和強化學習的特定算法及其分析。提供了上界和下界。這本書包含足夠的材料,可用于為期兩個學期的研究生級課程。
這本書包含足夠的材料,可用于為期兩個學期的研究生級課程,每個部分的內容可以作為一個學期的課程。它也可以用于一個學期的課程,涵蓋書中的部分內容。作者已經根據這本書的內容在香港科技大學教授研究生課程。參加這些課程的學生已經學習了基本的機器學習算法,并希望進一步學習分析這些算法的數學工具。
近年來,機器人領域發展迅速,機器人被用于越來越多的應用中,從制造業到醫療健康再到家務勞動。機器人技術的關鍵挑戰之一是使機器人能夠在非結構化和動態環境中執行復雜的操作任務。雖然機器人學習和控制已經取得了重大進展,但許多現有方法受到限制,因為它們依賴于預定義的運動基元或通用模型,而這些模型沒有考慮到個人用戶、其他合作智能體或交互對象的特定特征。為了在這些不同的環境中有效地工作,機器人需要能夠適應不同的任務和環境,并與不同類型的智能體進行交互,如人類和其他機器人。本論文研究學習方法,使機器人能夠適應他們的行為,以實現智能機器人行為。
在本文的第一部分中,我們專注于使機器人更好地適應人類。我們首先探索如何利用不同的數據源為人類用戶實現個性化。研究了人類如何喜歡用低維控制器(如操縱桿)遙控輔助機器人手臂。本文提出一種算法,可以有效地開發輔助機器人的個性化控制。這里的數據是通過最初演示機器人的行為,然后詢問用戶以從操縱桿收集他們相應的首選遙操作控制輸入來獲得的。探索了利用較弱的信號來推斷智能體的信息,如物理修正。實驗結果表明,人工修正是相互關聯的,共同推理這些修正可以提高精度。最后,研究了機器人如何通過推理和利用團隊結構更有效地與人類團隊合作和影響人類團隊,而不是只適應單個人類用戶。將該框架應用于兩種類型的群體動力學,即領導-跟隨和捕食者-被捕食者,并證明機器人可以首先開發一種群體表示,并利用這種表示成功地影響一個群體以實現各種目標。
在本文的第二部分,我們將研究范圍從人類用戶擴展到機器人智能體。本文解決了分散的機器人團隊如何通過只觀察其他智能體的行動來相互適應的問題。本文發現了團隊中存在無限推理循環的問題,并通過為機器人智能體分配不同的角色,如"發言人"和"聽眾",提出了解決方案。這種方法使我們能夠將觀察到的行動視為一個溝通渠道,從而實現分散團隊內的有效協作。在本文的第三部分,我們探討了如何通過開發定制的工具來適應不同的任務。強調了工具在確定機器人如何與物體交互方面的關鍵作用,使它們在為特定任務定制機器人方面變得重要。為解決這個問題,本文提出一個端到端的框架,通過利用可微物理模擬器來自動學習富接觸操作任務的工具形態學。最后,對全文進行了總結,并對未來的研究方向進行了展望。
近年來,關于單智能體和多智能體自主決策的研究工作層出不窮。現在,許多IT專家正在打造自動駕駛汽車和醫療機器人,開發先進的自主決策系統已經是一個數十億美元的產業。這些新技術提供了監督、先進的自動化和自動儀器,能夠適應不斷變化的情況、知識和約束。然而,將新技術引入我們的技術和社會基礎設施具有深遠的影響,需要建立對其行為的信心,以避免潛在的風險和傷害。因此,自主決策系統的有效性和更廣泛的可接受性依賴于他們做出“風險規避”決策的能力,這也被稱為“風險規避”。人工智能(AI)系統的風險規避能力是人機交互的關鍵要求,也是實現人工智能的全范圍社會和工業效益的關鍵。這一行業有廣泛的實際失敗-昂貴的應用,如控制、機器人、電子商務、自動駕駛和醫療。
本教程圍繞以下問題介紹了自主系統最先進的風險規避方法 (1) 風險到底是什么,風險規避的數學公式是什么? (2) 如何設計規避風險的方法?我們需要從頭開始嗎?或者,我們能否通過一些簡單的調整,將現有的風險無關算法轉變為風險規避算法?
本教程將介紹近年來開發的各種風險規避技術和算法。強化學習和數學規劃(優化)的介紹性材料將包括在教程中,因此對參與者沒有必要的知識。在介紹了基本的數學框架之后,我們將描述用于計算對偶性、塊坐標上升和信息論下界的新穎優化方法。最后,我們將強調在這一領域未來工作的許多機會,包括令人興奮的新領域和基本的理論和算法挑戰。
人工智能的空間是巨大的,復雜的,并不斷發展的。隨著計算能力的進步和越來越大的數據集,人工智能算法正在被探索和開發,以用于各種各樣的應用空間,人工智能算法有各種各樣的潛在用戶和相關風險。人工智能界正在追求可解釋性,作為可信人工智能系統的許多理想特征之一。通過與人工智能界的合作,美國國家標準與技術研究院(NIST)已經確定了其他的技術特征來培養人工智能的信任。除了可解釋性(explainability)和可詮釋性(interpretability)之外,為支持系統的可信賴性(trustworthiness)而提出的其他人工智能系統特征包括準確性、隱私性、可靠性、穩健性、安全性、保障性(彈性)、減少有害偏見、透明度、公平性和問責制。可解釋性和其他人工智能系統特征在人工智能生命周期的各個階段相互作用。雖然所有這些都是極其重要的,但這項工作只關注可解釋的人工智能系統的原則。
在本文中,我們介紹了四項原則,我們認為這些原則構成了可解釋人工智能系統的基本屬性。這些可解釋人工智能的原則是通過NIST的公共研討會和公眾評論期與更大的人工智能社區接觸后得出的。我們認識到,并非所有的人工智能系統都需要解釋。然而,對于那些打算或要求可解釋的人工智能系統,我們建議這些系統遵守以下四個原則:
解釋性:一個系統為產出和/或過程提供或包含附帶的證據或理由。
有意義:一個系統所提供的解釋對目標消費者來說是可以理解的。
解釋準確性:解釋正確地反映產生輸出的原因或準確地反映系統的過程。
知識局限性:系統僅在其設計條件下以及對其輸出達到足夠置信度時才能運行。
在這項工作中,我們認識到基于過程和基于結果的解釋的重要性,以及解釋目的和風格的重要性。例如,人工智能開發者和設計者的解釋需求可能與政策制定者和終端用戶的解釋需求截然不同。因此,為什么要求解釋以及如何提供解釋可能會因人工智能用戶的不同而不同。考慮到人工智能系統與信息的人類接收者的互動,這四項原則受到很大影響。給定情況的要求、手頭的任務和消費者都會影響被認為適合該情況的解釋的類型。這些情況可以包括,但不限于,監管機構和法律要求,人工智能系統的質量控制,以及客戶關系。我們的可解釋人工智能系統的四項原則旨在捕捉一系列廣泛的動機、理由和觀點。這些原則允許定義解釋所要考慮的背景因素,并為衡量解釋質量鋪平道路。
我們設想,鑒于人工智能領域的復雜性,這些原則將隨著時間的推移從更多的細化和社區投入中受益。我們充分認識到,除了可解釋性之外,還有許多其他社會技術因素影響著人工智能的可信度。這項關于可解釋人工智能系統原則的工作是NIST人工智能組合的一部分,該組合圍繞可信賴的人工智能數據、標準、評估、驗證和核實--所有這些都是人工智能測量所必需的。NIST是一個計量機構,因此,定義可解釋人工智能系統的初始原則是未來測量和評估活動的路線圖。該機構的人工智能目標和活動是根據其法定任務、白宮的指示以及美國工業界、其他聯邦機構和全球人工智能研究界的需求來確定優先次序的。目前的工作只是這個更大空間中的一步,我們認為這項工作將隨著時間的推移繼續發展和進步,就像更大的人工智能領域。
最近機器學習或人工智能的視覺和自然語言處理方面的進展使個人助理或自動駕駛汽車等新技術的發展成為可能,這將機器學習和人工智能帶到了流行文化的前沿。這些算法進步的積累,以及大量數據集和隨時可用的高性能計算的增加,在將機器學習應用到如此廣泛的學科中發揮了重要作用。鑒于化學科學強調結構和功能之間的關系,無論是在生物化學還是在材料化學中,化學家采用機器學習。《化學中的機器學習》關注以下內容,以啟動您對這一高度相關主題的理解:
//axial.acs.org/2021/06/21/machine-learning-in-chemistry-now-and-in-the-future/
與化學科學最相關的主題是重點。
關注概念而不是技術細節。綜合引用為更多的技術細節提供了資源。
機器學習方法的關鍵細節(不容易,但重要的是理解這些方法的優點和局限性,并確定領域知識最容易應用的地方。
熟悉基本的單變量微積分和線性代數將會很有幫助,盡管我們已經提供了重要的一步一步的推導