亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

機器學習的最新發展以及公眾對數字個人助理態度的普遍轉變,為對話系統開辟了新的領域。然而,建立數據驅動的多領域會話智能體,使其在對話環境中發揮最佳作用,仍是一個有待解決的難題。實現這一目標的第一步是開發一種在新領域學習對話策略的有效方法。其次,必須有能力收集和利用人與人之間的對話數據來引導智能體的知識。本論文中介紹的工作展示了神經對話管理器如何通過強化學習進行微調,從而為在多個領域高效學習對話策略提供可行的方法。

論文首先介紹了一個對話管理模塊,該模塊通過互動學習,根據對話的當前上下文采取最佳行動。目前向神經、參數豐富系統的轉變并不能完全解決來自語音識別或自然語言理解組件的錯誤噪聲問題。因此,我們提出了一種貝葉斯方法,以便在沒有任何先驗數據的情況下,在直接互動中學習更穩健、更有效的策略管理。通過對模型權重進行分布,學習智能體不易過度適應特定的對話實現,因此可以采用更有效的探索策略。研究結果表明,即使在數據量較少的情況下,深度強化學習的性能也能與非參數模型相媲美,同時與之前的技術水平相比,計算復雜度大大降低。

從行業角度來看,在不對人類對話進行任何預培訓的情況下部署對話管理器并不可行。然而,可用數據的規模阻礙了統計系統(尤其是對話管理器)建設的進展。為了解決這一根本性障礙,我們引入了一種完全基于眾包的新型數據收集管道,無需聘請專業注釋員。該方法的驗證結果是收集到了多領域 Wizard-of-Oz 數據集(MultiWOZ),這是一個跨越多個領域和主題的完全標記的人與人書面對話集。擬議的數據集創建了一套新的基準(信念跟蹤、策略優化和響應生成),大大提高了分析對話的復雜性。

所收集的數據集為基于強化學習(RL)的新方法訓練多領域對話管理器奠定了基礎。我們提出了一種多行動和插槽對話智能體(MASDA)來解決一些局限性: 1) 處理復雜的多領域對話,在一個回合中同時出現多個行動;以及 2) 缺乏可解釋性,因此,如果有中間信號(如對話回合注釋),就會妨礙這些信號的使用。MASDA 利用中間信號對系統行為和插槽進行了明確建模,從而改進了基于任務的端到端框架。該模型還可以選擇單個回合中的并發行為,從而豐富生成的響應的表示形式。在處理并發行動時,所提出的框架允許對對話任務完成指標進行 RL 訓練。結果表明了 1)處理并發行動和 2)利用中間信號這兩個方面的優勢: MASDA 優于之前的端到端框架,同時還提高了可擴展性。

圖 2.1 口語對話系統的結構由六個主要部分組成。在典型的模塊化方法中,各組成部分分別進行訓練。端到端方法則將內部模塊結合在一起(灰色部分)。

付費5元查看完整內容

相關內容

博士論文是由攻讀博士學位的研究生所撰寫的學術論文。它要求作者在博士生導師的指導下,選擇自己能夠把握和駕馭的潛在的研究方向,開辟新的研究領域。由此可見,這就對作者提出了較高要求,它要求作者必須在本學科的專業領域具備大量的理論知識,并對所學專業的理論知識有相當深入的理解和思考,同時還要具有相當水平的獨立科學研究能力,能夠為在學科領域提出獨創性的見解和有價值的科研成果。因而,較之學士論文、碩士論文,博士論文具有更高的學術價值,對學科的發展具有重要的推動作用。

異構多智能體系統為解決農業、軍事、裝配和倉庫自動化等不同領域的復雜問題提供了可能,否則單個智能體是無法解決這些問題的。要有效部署異構多機器人團隊,研究必須解決不同抽象程度的四個問題:任務規劃(是什么)、運動規劃(如何)、任務分配(誰)和調度(何時)。這些問題高度相互依存,先前的工作已經證明,利用這些問題的單個解決方案之間的協同作用的系統可以提高多機器人協調的效率和效益。

本文研究了在多智能體組隊應用中使用基于特質的模型來表示單個智能體,以及如何利用基于特質的建模來實現更穩健、更高效的多智能體聯盟組建解決方案。具體來說,我們研究了如何在聯盟組建算法中使用這些技術來回答任務分配、調度、運動規劃和任務規劃這四個問題。

我們的研究表明,利用基于機器人和任務特質建模的算法可以在異構多機器人團隊中實現高效的協調,并且在時間進度、分配質量和計算效率方面優于現有方法。本論文的貢獻如下:

  • 創建一個建模框架,使現代任務分配算法能夠推理動態特征。通過使用基于轉換的建模框架,我們創建了對以往基于特質的建模技術的擴展,以更好地推理智能體的特質如何隨時間變化。

  • 為異構多機器人系統開發基于時間擴展特質的任務分配和路徑規劃統一框架。我們引入了一種基于搜索的方法,用于基于特質的時間擴展任務分配和運動規劃,命名為增量任務分配圖搜索(ITAGS)。

  • 整合任務規劃、任務分配、調度和運動規劃的新型多機器人協調問題的形式化和解決方案。我們形式化了一類新的多機器人協調問題,該問題融合了這些問題中的每一個,并提出了一種解決方案(圖形遞歸同步任務分配、規劃和調度(GRSTAPS))。

  • 為 ITAGS 的動態變體創建框架,該變體能夠進行基于特征的任務分配修復: 我們對 ITAGS 進行了擴展,使用基于特質的動態時間擴展任務分配算法,如果智能體的特質或任務要求在執行過程中發生變化,該算法可以修復任務分配。

  • 創建一個主動學習框架,用于學習多智能體任務分配問題的特質要求: 由于理解一個聯盟的特質與該聯盟在特定任務中的表現之間的關系可能具有挑戰性,因此我們提出了一種主動學習框架來學習任務與特質之間的關系。此外,我們還提供了一種新的時間擴展任務分配算法,該算法能夠優化學習到的質量模型。

圖 2.1: 顯示各種多機器人協調問題交叉點的維恩圖。

付費5元查看完整內容

現有的決策計算模型往往局限于特定的實驗設置。造成這種限制的主要原因是無法捕捉決策者對情況的不確定性。本文提出了一個計算框架,用于研究神經科學和心理學中不確定情況下的決策制定。框架主要側重于決策者對世界狀況的概率評估,即他們的 “信念”。具體來說,它基于部分可觀測馬爾可夫決策過程(POMDPs),結合貝葉斯推理和獎勵最大化來選擇行動。利用感知決策和社會決策方面的各種實驗數據,證明了基于信念的決策框架的可行性。框架解釋了感知決策實驗中決策者的實際表現與他們對實際表現的信念(即決策信心)之間的關系。它還說明了為什么在許多情況下這種評估會偏離現實。這種偏差通常被解釋為次優決策的證據,或選擇和信心的不同過程。我們的框架對這些解釋提出了挑戰,它表明,一個優化收益的規范貝葉斯決策者也會產生同樣的偏差。此外,在定量預測人類在社會決策任務中的行為方面,方法優于現有模型,并提供了對潛在過程的洞察。結果表明,在涉及大型群體的決策任務中,人類采用貝葉斯推理來模擬 “群體心理”,并對他人的決策做出預測。最后,將方法擴展到關于他人的多個推理層次(心智理論層次),并將服從作為群體決策的一種策略聯系起來。這個擴展框架可以解釋人類在各種集體群體決策任務中的行為,為大型群體中的合作與協調提供了新的理論。

圖 1.1: 基于信念的決策框架。智能體通過行動、觀察和獎勵與世界互動。智能體無法完全觀測到世界的狀態,只能根據觀測結果和智能體的內部世界模型,以概率方式表示世界的狀態。智能體的目標是根據當前狀態的概率分布來制定策略,即所謂的信念

付費5元查看完整內容

生成式人工智能模型能夠執行一系列傳統上需要創造力和人類理解力的任務。在訓練過程中,它們可以從現有數據中學習模式,然后根據這些模式生成文本、圖像和音樂等新內容。一方面,由于它們的多功能性和普遍的高質量結果,它們代表了數字化的機遇。另一方面,人工智能生成模型的使用也帶來了新的 IT 安全風險,在全面分析與 IT 安全相關的威脅時需要考慮這些風險。

針對這種潛在風險,使用生成式人工智能的公司或機構在將生成式人工智能集成到工作流程之前,應進行單獨的風險分析。這同樣適用于開發人員和運營商,因為生成式人工智能的許多風險必須在開發時就考慮到,或者只能由運營公司來影響。在此基礎上,可以調整現有的安全措施,并采取額外的措施。

付費5元查看完整內容

在當前人工智能的發展浪潮中,基于大模型構建的人工智能體(AI Agent)已成為一項領先的技術,引起全球學術界和工業界的高度關注。與此同時,人工智能正從學術領域跨越到實際應用的新階段,大模型驅動的群體智能技術正成為推動革新的核心動力。 目前大模型已能夠構建出更具通用性和適應性的智能體,這些智能體不僅能獨立執行復雜任務,還能在群體中協同作業,展示出遠超單體智能體的集體智慧。 可以說,隨著新一代AI技術的發展,我們正步入一個由大模型驅動的“Internet of Agents (IoA)”智聯網時代,這個時代將由智能體的群體協作和互動定義,它們不僅服務于人類,更將與人類共創更加智慧和可持續的未來。 在汽車行業,群體智能的應用不僅能夠大幅提升生產效率,優化用戶體驗,更能孕育新的商業模式。這在近期發布的《大模型驅動的汽車行業群體智能技術白皮書》(以下簡稱白皮書)可窺詳貌。 4月12日,易慧智能聯合清華自然語言處理實驗室、面壁智能召開發布會,正式發布《大模型驅動的汽車行業群體智能技術白皮書》,這是國內首個關于大模型驅動的群體智能全面的研究報告和汽車行業應用探索。

此次白皮書發布會吸引了包括汽車行業專家、人工智能領域專家、咨詢行業專家、大數據/算力專家以及權威媒體在內的眾多嘉賓參與。 清華大學計算機科學與技術系助理研究員從鑫,面壁智能CEO李大海,易慧智能總裁李偉發表專業演講,論述大模型驅動的群體智能技術發展現狀及前景,探索AI賦能人類生產生活的最優解,為汽車行業的智能化發展提供關鍵的理論支撐與實踐引導。

白皮書:汽車行業將加速迎來一個更加智慧、高效、用戶至上的新時代****

白皮書分《戰略態勢:??智能時代的汽??業發展》、《科技突破:邁向通???智能的?模型群體智能技術體系》、《融創賦能:?模型群體智能在汽??業的融合創新與價值創造》、《?態矩陣:汽??業?模型群體智能?態矩陣建設》、《總結展望》五個章節系統性介紹了大模型驅動的智能體技術,特別是面向汽車行業提出了體系化的解決方案,對于未來通用人工智能賦能汽車行業提供了有益參考。 其中,白皮書全面回溯了AI技術的發展歷程和關鍵里程碑,對“大語言模型”“單體智能”“群體智能”等關鍵技術專題進行了深入、系統的總結和梳理,同時結合技術能力和汽車行業應用場景找到了技術在汽車行業中的場景應用價值:通過大模型驅動的群體智能協同工作臺和組織孿生技術路線,可以為行業客戶定義/開發/部署企業級的數字員工和數字團隊,在適合的場景下實現任務的智能化與自動化替代,為用戶提供及時、豐富、個性化的服務,為行業客戶帶來高性價比的智能化解決方案,提升整個行業的運營效率和效能。 白皮書還展望大模型驅動的群體智能技術將為汽車行業預見一個更加智慧、高效能、用戶至上的汽車新時代: 首先是智能化助力——汽車企業突破降本增效天花板。其認為在當前的經濟環境下,車企需要不斷檢索突破口來提高生產效率、降低運營成本。 通過使用群體智能和組織孿生技術,車企可以率先將明確標準作業程序(SOP)和專家知識的場景實現智能化與自動化落地應用,重塑效率之巔。這不僅有助于車企提升自身的競爭力,更能推動整個汽車行業的持續發展。 這也是汽車行業的群體智能和組織孿生技術的核心價值——為汽車行業帶來了前所未有的降本增效可能性。 其次是智能化賦能——開啟用戶運營新篇章。在以往用戶運營旅程中,與日俱增的紛繁觸媒環境下投入大量人力和財力成本也難以精準捕捉用戶多樣化需求。 群體智能不僅將極大地提高信息傳遞和決策的效率,更通過對海量用戶數據的深度挖掘和分析,令車企能夠為用戶提供更加貼心、個性化的產品和服務,從而構建起更加緊密的用戶關系,提升品牌影響力和市場競爭力。 最后是創新與合作——共建智慧汽車新生態。隨著技術的持續演化和應用場景的拓展,我們可以預見大模型驅動的群體智能和組織孿生技術,將在汽車行業得到更廣泛的應用與深度融合,釋放出巨大的數據價值,顯著增強車企在不確定環境下的競爭力和韌性。 作為白皮書發布方的清華大學自然語言處理實驗室、易慧智能和面壁智能共同認為,大模型和群體智能技術的應用將推動汽車行業從傳統生產方式向智能化生產方式的轉變,為汽車行業發展注入新活力。 專家重磅解讀:從技術前瞻、通用技術實踐到行業技術應用

清華大學計算機科學與技術系助理研究員從鑫從技術前瞻的角度發表了主題為《大模型驅動的群體智能技術正成為推動革新的核心動力》的演講。 他介紹道,大模型是人工智能的前沿制高點,將成為智能時代的基礎設施。同時大模型也存在諸如專業技能欠缺、協作意識薄弱等局限,需進行專業教育實現智能體化,并通過AI Agent(人工智能體)賦能行業應用。 清華大學計算機科學與技術系助理研究員 從鑫

清華大學計算機科學與技術系副教授劉知遠表示,大模型驅動的AI Agent 具備包括智商、情商、成長性、價值觀、感知、人設等六大特性,隨著 AI Agent 數量的增加和智能體間的協作能力提升,能夠呈現出超越單個智能體能力的集體智慧——群體智能,實現對更加復雜任務處理和場景建模,其被認為是邁向通用人工智能的重要途徑。 從單一大模型到多智能體群體智能的重要轉變為 AI 的未來應用打開了新的可能性,預示著更加智能和自適應的技術解決方案的出現。 據劉知遠介紹,組織孿生是大模型驅動的群體智能在業務場景下的應用框架,目前其團隊提出了崗位孿生、架構孿生和業務孿生的概念和技術框架,旨在綜合運用大模型的通用能力和智能體技術的靈活適配特性,實現智能科技服務人類。

面壁智能CEO李大海從通用技術實踐的角度發表了主題為《智周萬物,讓AI智能體釋放大模型無限潛能》的演講。

他表示,面壁智能持續引領“高效大模型”路線。除了大模型的高效訓練,在大模型高效落地方面,AI Agent是大模型落地應用的最后一公里,面壁智能引領AI 智能體(Agent)技術潮流, 持續推動建設大模型的高效建設、快步應用。

付費5元查看完整內容

近年來,計算機視覺和機器學習系統有了顯著改善,這主要是基于深度學習系統的發展,從而在目標檢測任務上取得了令人印象深刻的性能。理解圖像內容則要困難得多。即使是簡單的情況,如 "握手"、"遛狗"、"打乒乓球 "或 "人們在等公交車",也會帶來巨大的挑戰。每種情況都由共同的目標組成,但既不能作為單一實體進行可靠的檢測,也不能通過其各部分的簡單共同出現進行檢測。

這篇論文將描述一個用于進行視覺情境識別的新型系統,其目標是開發能夠展示與理解相關特性的機器學習系統。該系統被稱為 Situate,它能在給出情況描述和少量標注訓練集的情況下,學習目標外觀模型以及捕捉情況預期空間關系的概率模型。給定一張新圖片后,Situate 會利用其學習到的模型和一系列智能體對輸入內容進行主動搜索,以找到情況模型與圖片內容之間最一致的對應關系。每個智能體都會開發模型與輸入內容之間可能存在的對應關系,而 Situate 會為智能體分配計算資源,以便盡早開發出有希望的解決方案,但也不會忽略其他對應關系。

將把 Situate 與更傳統的計算機視覺方法(該方法依賴于檢測情境中的組成目標)以及基于 "場景圖 "的相關圖像檢索系統進行比較。將在情境識別任務和圖像檢索中對每種方法進行評估。結果表明了圖像內容和該內容模型之間的反饋系統的價值。

付費5元查看完整內容

現在,模擬被更頻繁地用于對現實世界或擬議系統進行實驗,以了解系統行為或評估改進策略。隨著時間的推移,大型企業越來越需要開發精密復雜的系統來與同行業競爭。而且,這些企業之間的聯系越來越緊密,就像一個網絡化的企業。這就進一步提高了開發能與其他企業互聯的越來越復雜的模擬的要求。在這方面,分布式仿真已廣泛應用于軍事領域,但在其他領域并沒有得到普及。這背后的原因是,在分布式仿真之間建立通信協議需要專業技術知識。科研行業一直在努力縮小這一差距,其中最重要的工作是制定高級架構(HLA)標準,為分布式仿真模型之間提供通用通信協議。

建模與仿真(M&S)行業也為開發人員提供了大量有關獨立仿真建模的文獻。在這種情況下,概念建模的重點是模型的準確性和效率,而不是互操作性。本研究也對此進行了詳細討論。直到最近,從業人員也一直在努力尋找對底層技術的支持。但隨著標準運行時基礎設施(RTI)和仿真開發平臺支持的引入,這一差距已經縮小。

HLA 標準承諾解決分布式仿真模型之間的互操作性問題,但只能提供語法層面的標準指南。因此,仿真互操作性標準組織(SISO)繼續開展研究,確定了從業人員在語義層面面臨的互操作性問題,并起草了一份互操作性問題清單。然而,已發布的 SISO-STD-006-2010 標準只指出了問題,卻沒有提供語義解決方案。

本研究的主要貢獻是提出了分布式仿真互操作性(DSI)框架,為《商用現成仿真包互操作性參考模型》(SISO-STD-006-2010)中列出的互操作性問題確定了語義解決方案。本研究建議將這些互操作性語義解決方案納入 HLA 對象建模模板規范。這樣做將有助于行業從業人員實現 HLA 的互操作性承諾,并使分布式仿真模型更具可重用性和可組合性。

付費5元查看完整內容

機器人正逐漸從工業和實驗室進入我們的日常生活。無論是作為伴侶、教師、接待員、清潔工,還是滿足其他需求,這些機器人都旨在提高我們的生活質量。然而,機器人的自主決策能力仍然是機器人技術面臨的主要挑戰。為了提高機器人的自主性,一方面,研究人員傾向于根據不同的標準對協作進行分類,以收集人機協作之間的共性。這樣做的目的是檢測機器人在執行各種任務時必須能夠完成的相似步驟。另一方面,其他作品則側重于增強建立人機協作所需的一個或多個領域。要實現人機協作,機器人必須完成四個標準步驟:感知、決策、運動執行和評估。

本論文旨在通過改進機器人的決策過程來優化人機協作性能。我們根據不同的可變性能指標來評估協作性能。因此,優化協作的目的是使人類受益,例如更快地完成任務或減少人類智能體的工作量。然而,未優化的協作將不會給人類帶來任何益處,或者相反,即使最終完成了任務,也會給人類帶來麻煩,如減慢人類的速度或使人類負擔過重。

我們首先開發了一個優化機器人決策過程的全局框架。我們將這一框架應用于非直觀的裝配任務,即需要進行復雜的認知處理,以找到擬議裝配游戲中每個部件的正確位置。我們希望提高人機協作團隊完成任務的時間,而無需提高其物理能力(即感知、軌跡規劃或低級控制)。我們提出的框架可在考慮不同性能指標的同時改善人機協作。這些指標的考慮與人類智能體的行為無關。

然后,我們將這一框架應用于第二個更復雜的應用(即軟物體變形),該應用需要通過改進低級控制來提高機器人的操縱靈活性。事實上,我們將考慮第二種應用,這種應用要求提高機器人的操縱靈活性,以最大限度地優化協作性能。人機協作團隊必須共同操縱軟物體,使其達到所需的形狀。協作團隊可以使用深度強化學習方法來實現這一應用。我們的想法是在仿真中訓練智能體(單臂機器人或雙臂機器人),并通過用人類智能體替換第二機械臂進行實際測試。

關鍵詞 人機協作 決策 博弈論 強化學習

通過改變性能指標優化人機協作決策過程的總體框架

前面內容介紹了人機協作(HRC)中使用的決策(DM)方法、DM策略和獎勵函數(或效用函數)。在本章中,我們將介紹在人機協作背景下的新DM框架。最先進的技術將人機交互視為一個優化問題,其中的效用函數(博弈論中使用的名稱),也稱為強化學習中的獎勵函數,被定義為無論交互執行得如何,都要完成任務。當考慮性能指標時,它們不能在同一框架內輕易改變。

相比之下,我們的DM框架可以很容易地處理從一個案例場景到另一個案例場景的性能指標變化。我們的方法將HRC視為一個約束優化問題,其中效用函數(或獎勵函數)分為三個主要部分:

  • 一組評估協作績效的獎勵。這是改變性能指標時唯一需要修改的部分。它提供了對交互方式的控制,同時也保證了機器人的行動能夠實時適應人類的行動。

  • 一組定義如何完成任務的約束條件。

  • 重新組合機器人物理能力的集合。

因此,可以設計效用函數(或獎勵函數)來改善機器人的操縱靈活性。在本章開始,我們將介紹建立這樣一個框架的動機和優勢。然后,我們將我們的工作與最先進的技術進行比較。最后,我們將詳細解釋我們的形式化方法。

動機

如今,HRC已成為機器人領域中一個快速增長的領域。HRC旨在使人類的日常任務變得更加容易。它基于人類和機器人之間的信息交流,共享一個共同的環境,以隊友的身份完成一項任務,實現共同的目標[28]。HRC應用可為人類帶來社會和/或物理益處[11]。

如第2章所述,機器人能夠在不同情況下適應人類,這要歸功于其DM過程,計算機科學中通常使用帶有策略和效用函數的DM方法對該過程進行建模[42]。DM方法對整個情境(包括環境、行動、智能體、任務限制等)進行建模。策略定義了根據獎勵值選擇行動的政策。效用函數(即獎賞函數)通過賦予每個行動以獎賞來評估每個行動。如第2.3節所示,通過考慮性能指標(參見表1.1)來實現獎勵函數,是提高HRC性能的一種可能性。

在本章中,我們將根據一些可改變的性能指標對人類智能體的影響,對機器人與人類之間的協作進行優化和定量評估。因此,優化的協作旨在為人類帶來益處,例如更快地完成任務或減少人類智能體的工作量。然而,未優化的協作將不會給人類帶來任何好處,或者相反,即使最終完成了任務,也會給人類帶來麻煩,如減慢人類的速度或使其負擔過重。本章的主要貢獻在于,所提出的框架可根據一些可變指標,優化一個或多個人類與一個或多個機器人之間的協作性能。與以往的工作不同,我們的框架允許我們輕松地改變性能指標,而無需改變整個任務的形式化方式,因為我們在效用函數中隔離了指標的影響。

這一貢獻的益處在于提高了協作性能,并有可能改善或不改善機器人的操縱靈活性。這在相關的實際案例中非常重要,例如,在使用社交機器人時,這些機器人有很大的局限性(例如,動作遲緩和/或靈巧性降低)[27],而大幅提高其能力并不容易,甚至不可能。因此,我們的工作提供了一個有趣的解決方案,以提高此類受限機器人的協作性能。

我們的框架采用最先進的DM流程,由DM方法、策略和效用函數組成。我們將效用函數(或獎勵函數)分為三個主要部分:根據一個或多個性能指標,通過獎勵來評估協作性能;任務完成度,由于我們只處理可實現的任務,因此將其視為約束條件;以及重新組合機器人物理能力的集合。在下面兩節中,我們將簡要回顧文獻中如何使用效用函數,并提及我們在這方面的貢獻。

效用函數或獎勵函數

正如第二章中提到的,效用是由效用函數(或報酬函數)計算出來的報酬,用來表示一個行動的價值。通過這些效用,DM策略可以選擇正確的行動。之前的一些文獻只考慮了效用函數中的任務完成情況(而沒有考慮性能指標),因為他們的重點是復雜任務的完成情況。例如,在文獻[17]中,一個人機協作團隊抬著一張桌子從一個房間移動到另一個房間。目標是通過讓人類也適應機器人來確保代理之間的相互適應。在這類工作中,沒有考慮表1.1中的任何性能指標。

較近期的作品包含了性能指標(見表1.1)。不過,他們認為,如果不對框架進行重大修改,這些指標是無法改變的。一個相關的例子是[156],通過改變任務分配,作者使機器人遵守裝配過程的實時持續時間,同時按照必要的順序裝配零件。在這種情況下,他們只考慮了一個指標(完成時間),因為遵守零件裝配順序是完成任務的一個約束條件。然而,使用該框架,該時間指標不能被其他指標(如努力或速度)取代。

貢獻

與目前工作中使用的效用函數不同,我們考慮的是可變的、不受限制的性能指標(見表1.1),這些性能指標通常無論人類行為如何都會被優化。總結我們的貢獻,我們提出的框架允許我們

  • 從一個場景到另一個場景,輕松地改變性能指標,而不需要改變我們形式化中的任何東西,除了效用函數中與指標相關的部分,以及

  • 由于我們將獎勵函數中的這一部分分離出來,因此可以在提高或不提高機器人操縱靈活性的情況下提高協作性能。

在下一節中,我們將定義問題的形式化并提出效用函數,該函數優化了性能指標,并以完成任務為目標作為約束條件。

性能指標

只要某項指標可以用數學方法表述,或者至少可以在任務執行過程中進行測量,并作為計算任務獎勵的條件,就可以通過性能指標{M}在選擇行動時加以考慮。表 3.1 列出了我們可以考慮的一些性能指標。表3.1是第一章中表1.1的簡化版。

付費5元查看完整內容

在信息時代,對大型復雜數據集進行適當的融合是必要的。僅僅處理幾條記錄就已經迫使人腦在數據中尋找模式,并形成其整體圖景,而不是把現實想象成一組單獨的實體,這對處理和分析來說要困難得多。同樣,使用適當的方法來減少計算機上的信息過載,不僅可以提高結果的質量,還可以大大減少算法的運行時間。

眾所周知,依賴于單一信息源的信息系統(例如,從一個傳感器收集的測量數據、單一權威決策者的意見、一個且僅有一個機器學習算法的輸出、單個社會調查者的回答)往往既不準確也不可靠。

聚合理論是一個相對較新的研究領域,盡管古代數學家已經知道并使用各種特定的數據融合方法。自20世紀80年代以來,對聚合函數的研究往往集中在構建和正式的數學分析上,即用不同的方法來總結元素在某個實數區間I=[a, b]的數字列表。這包括不同種類的廣義手段、模糊邏輯連接詞(t-norms,模糊含義)以及協同學。最近,我們觀察到人們對部分有序集合的聚集越來越感興趣,特別是在序數(語言)尺度上。

在面向應用數學的經典聚合理論的開創性專著中,有《聚合函數》: A Guide for Practitioners [49],作者Beliakov, Pradera, and Calvo,以及Grabisch, Marichal, Mesiar, and Pap的聚合函數[230]。我們注意到,聚合理論家所使用的典型數學武器由代數、微積分、秩序和度量理論等已知方法的非常有創意的組合組成(事實上,聚合理論的結果對這些子領域也有很大貢獻)。更重要的是,在以下教科書中,對聚集函數的特定子類進行了深入研究: Klement, Mesiar和Pap撰寫的《三角形規范》[277],Baczyński和Jayaram的《模糊含義》[18],Bullen的《均值及其不等式手冊》[87],以及最近由Beliakov, Bustince和Calvo撰寫的《平均函數實用指南》[39]。我們還將提到Torra和Narukawa的書(《建模決策:信息融合和聚合操作符》[449]),這也許是所列作品中最面向計算機科學的作品。然而,在[49]和[39]中也討論了許多有趣的算法和計算問題。

在2013年西班牙潘普洛納舉行的AGOP--聚合算子國際暑期學校會議上,Bernard De Baets教授在他的全體演講[137]中指出,需要傳達關于所謂聚合2.0的研究。當然,聚合2.0的目的不是要取代或在任何方面貶低非常成功和重要的經典聚合領域,而是要吸引研究者關注新的、更復雜的領域,其中大多數領域不使用計算方法是無法正確處理的。從這個角度來看,數據融合工具可以被嵌入到更大、更復雜的信息處理系統中,從而作為其關鍵組成部分來研究。

適當的復雜數據融合已經引起了不同領域的許多研究人員的興趣,包括計算統計、計算幾何、生物信息學、機器學習、模式識別、質量管理、工程、統計、金融、經濟等。讓我們注意到,它在以下方面起著至關重要的作用:

  • 對數據過程或整個領域的合成描述、

  • 為近似推理任務創建規則庫,

  • 在決策支持系統中達成共識并選擇最佳策略、

  • 缺失值的歸納、

  • 重復數據刪除和合并、

  • 異質數據庫之間的記錄聯系、

  • 自動數據分割算法的構建(例如,比較K-means和分層聚類算法)。

我們觀察到,許多有用的機器學習方法是基于信息實體的適當聚合。特別是,用于分類的一類集合方法在實踐中非常成功,因為假設沒有一個 "弱 "的分類器能像它們整個組一樣表現出色。有趣的是,在Kaggle和類似平臺上的數據挖掘競賽中,許多獲勝的解決方案都是以隨機森林和類似算法為基礎的。更重要的是,例如,神經網絡--通用逼近器--和其他深度學習工具可以被理解為單個融合函數的層次結構。因此,它們也可以被認為是一種聚合技術。我們還應該提到,適當的數據融合對商業企業至關重要。由于許多原因,公司很少急于將他們所擁有的大部分數據集出售給客戶。相反,只有經過仔細預處理和聚合的數據模型才能交付給客戶。

本專著首次嘗試使用成熟的經典聚合框架的方法來整合不同領域的分散結果,向研究人員和從業人員介紹聚合2.0,并指出進一步研究的挑戰和有趣的方向。本報告的結構如下。

  • 在第1章中,我們回顧了經典的聚合結果,這些結果處理的是數字圖元的聚合,這些圖元的元素在某個實數區間I=[a, b]或]a, b[。我們列出了這樣一個領域中融合函數的一些有趣的屬性,這些屬性在各種實際應用中可能是至關重要的。盡管所描述的數據模型乍一看很簡單,但它將為我們提供對更復雜的數據融合過程的本質的深刻見解。特別是,我們特別關注單調性的概念。

然后,我們討論了一般的構造方法,這些方法可以用來從較簡單的函數中導出新的融合函數。此外,我們還介紹了聚合函數與單調性(模糊)度量和積分之間的聯系,并介紹了基于懲罰的和擴展的融合函數的概念。

接著,我們提出了不同的方法,這些方法可以幫助為不同的任務選擇適當的工具。這包括特征化定理、合成數字特征以及從經驗數據中學習融合函數的算法。

此外,我們還介紹了在序數尺度和--更普遍的--有界部分有序集以及名義尺度上的數據聚合的主題。

  • 第2章討論了d維數據的聚合,這次是d>1。我們的出發點是數據融合工具,這些工具在計算統計和計算幾何等領域被研究。在它們的重要屬性中,我們發現,例如,對特定幾何變換的等價性,以及前一章所研究的一些屬性的概括。我們注意到,最簡單的融合函數可以通過一維映射的分量擴展來構造。其他的則是基于數據深度或懲罰最小化的概念。

我們還對積網和字符序列上的聚合感興趣,特別是與漢明距離有關的聚合。

  • 在第3章中,我們重點討論了字符串的聚合問題,即長度不一定一致的圖元。在這種情況下,可以定義各種排序關系,例如,詞法排序。我們感興趣的數據類型包括代表計量信息數據的數字字符串,以及字符字符串,如DNA和蛋白質序列。事實證明,在這樣的領域中最有影響力的數據融合方法可以表示為各種基于字符串距離的懲罰措施的最小化。正因為如此,我們包括了對字符串度量的全面概述。這包括通用編輯、Q-gram和Dinu等級距離的概念。

  • 第4章涉及更復雜的數據類型的聚合:方向性數據、實數區間、模糊數、隨機變量、圖和關系,以及異質數據集。我們將觀察到,數據融合中的一些關鍵思想可以推導出這些類型的數據模型。

  • 最后,在第5章中,我們將討論不同對象的各種數字特征。這個話題不可避免地與數據聚合有關。特別是,我們對概率分布的合成描述、數字列表的傳播、決策者的共識、經濟上的不公平、信息化數據、模糊數字和融合函數本身感興趣。在本章的最后,我們討論了所謂的校驗和,正如它將被證明的那樣,它需要一個與其他措施完全不同的處理。

  • 在附錄中,按照[49]的優秀方法,我們提供了最有趣的算法的實現。為此,我們使用R[397]和C++11編程語言。在后一種情況下,Rcpp包類[177]被用來作為這兩種語言之間的聯系。

除了提供一個關于不同領域的融合函數的全局性簡明觀點("聚合2.0"),本專著的原創性貢獻(在撰寫時尚未發表)包括但不限于

  • 第1章:增量融合函數作為遞歸聚合工具的概括的想法(定義1.121);從經驗數據中學習聚合算子的新方法,包括第1.6.1節中的最小切比雪夫度量擬合任務,第1.6.2.B節中保留輸出排名的最小二乘誤差擬合,應用權重正則化防止模型過擬合,用準算術平均值擬合權重(沒有變量線性化);第1.8節中關于名義尺度上元素聚合的一些說明。

  • 第2章:擴展在[208]中發表的關于d維實數圖元聚合的結果,包括命題2.13、2.14、2.19、2.24、2.32和2.30;在第2節中構建了基于SVD的相似性變換等值融合函數。 2.3;在第2.5.5節中提出了基于懲罰的多維融合函數的框架及其一般性質(特別是命題2.54);一種新的進化算法,用于逼近基于漢明距離的1中心字符序列。

  • 第3章:關于信息計量數據聚合的新結果(命題3.8和3.14),關于此類數據融合工具應滿足的理想屬性清單的建議,第3.2節中數字字符串的新聚合方法。 3,包括假設I=[0, ∞]下的計量信息數據的1-median;計算兩個字符串的中心點的精確算法,以及關于列文斯坦距離的任意數字或字符串的1-median的進化算法,第3.3節中關于字符序列和字符串的融合函數的理想屬性列表。

  • 第4章:第4.6節中的任意有限半計量空間中的快速近似集典范搜索算法。

  • 第5章:第5.2.3節中對多維數字列表的傳播關系[209]的概括,以及新的傳播度量的構造方法列表。

付費5元查看完整內容

來源:阿里巴巴與中國通信院

當前,人工智能技術蓬勃發展,廣泛賦能千行百業,給人類生產生活帶來了深刻變化。人工智能在促進社會發展的同時,也存在著風險和挑戰。習近平總書記曾多次強調,”要確保人工智能安全、可靠、可控"。開展人工智能治理,發展負責任和 可信的人工智能,助力可持續發展愿景實現,正在成為共識。

全球已經形成了大量的人工智能治理與發展原則,下一步的工作重點,是將抽象的原則落實到實踐中。企業作為人工智能技術研發和應用的重要力量,亟需探索一套適合自身業務發展的人工智能治理實踐體系,將各項治理要求貫徹到人工智能的全生命周期,以有效治理為人工智能紅利的釋放奠定基礎,從而加速推動可持續發展 愿景的實現。

本白皮書全面總結了阿里巴巴在人工智能治理與可持續發展領域的實踐,重點針對當前人工智能應用中的熱點問題,從數據、技術、管理及多元協同等方面系統性介 紹了我們的實踐思路和方法,同時輔以若干專題進行闡釋,期待為社會各界提供有益參考。

付費5元查看完整內容
北京阿比特科技有限公司