亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

因果性和推理因果關系的能力是決策的核心。本論文通過提出可用于支持、理解和改進決策的新機器學習方法,為因果推理領域做出了貢獻,重點關注醫療保健領域。

首先,介紹了幾種因果推理工具,通過從觀察數據(如電子健康記錄)中估計干預(治療)的因果效應來支持決策。首先,要解決的是對連續值干預措施的反事實結果進行估計這一尚未充分探索的問題,并提出了一種基于生成對抗網絡的方法,該方法性能一流,可幫助我們為每位患者選擇正確的治療方法和劑量。然后,我們將注意力轉移到時間設置上,開發了一個序列到序列模型,該模型使用域對抗訓練來處理隨時間變化的混雜因素,可以幫助我們為每位患者確定最佳治療序列。此外,我們還介紹了第一種可以處理時間數據中存在的多病因隱藏混雜因素的方法。通過利用隨時間變化的治療分配中的依賴性,我們的方法可以學習到可用于替代隱藏混雜因素的潛在變量。

其次,將反事實推理整合到批量反強化學習中,開發出一種方法,通過對 "假設"(反事實)結果的偏好來模擬專家的獎勵函數,從而更好地理解專家的決策行為。我們的研究表明,這使我們能夠獲得專家決策過程的可解釋參數化,進而揭示與專家行為相關的權衡和偏好。

第三,提出了一種新的批量模仿學習模型,將因果結構納入所學的模仿政策,從而提高了決策的穩健性。通過確保模仿策略只依賴于行動的因果關系,我們學習到的決策準則能夠抵御虛假的相關性,并能很好地泛化到新的環境中。

總之,本論文介紹了能夠推理因果關系的機器學習在方法論上的進步,這些進步能讓我們改善為患者提供的個性化醫療服務,支持臨床決策,并建立更透明的臨床實踐報告。我們在討論中強調了將此類方法應用于實踐所面臨的挑戰,并對未來在這方面的工作提出了建議。

付費5元查看完整內容

相關內容

本文將對當前的朝鮮導彈危機進行博弈論分析。首先,本文將從現有文獻中找出參與博弈的各方可供選擇的方案,并為各方可能的方案組合確定一個排序(從最佳到最差)。將利用移動理論(ToM)來預測危機的最終結果。此外,這還需要談判開始時的初始 "博弈狀態",以及博弈中的先行者,兩者均由危機歷史給出。ToM 允許各方嚴格輪流從初始狀態出發。每輪移動時,棋手可以選擇移動(回到之前的狀態或前進到另一個狀態),也可以選擇放棄(保持當前狀態)。當棋手選擇連續幾輪都不移動,即接受當前狀態為最終結果時,就達到了均衡。

每個棋手的偏好排序都很難確定,因此考慮了各種可能性。通過閱讀有關危機歷史的現有文獻以及相關國家所表達的利益,發現了一系列貌似合理的可能性,值得在本分析中加以考慮。使用 ToM 方法將這一系列可能性分為三個子集,每個子集都會產生不同的最終結果。將 ToM 的預測結果與流行的博弈論方法納什均衡(NE)進行比較。因此,分析將危機的可能結果從九種縮減為三種,并指出兩國的偏好排序如何影響這三種結果中的哪一種。

表 1:共享納什均衡和最終結果的博弈

付費5元查看完整內容

在結構良好、信息完備的環境中,決策制定是無法保證的。研究中的任務通常側重于在無限時間框架內利用完整信息做出決策,而在信息缺失或不確定的情況下,當前的研究并未涉及缺失信息在環境中的分布所產生的影響。本文旨在具體了解這些信息分布如何影響時間壓力下的決策者,以及如何在一系列決策策略中為不完美環境下的決策提供最佳支持。這項工作有三方面的貢獻。首先,研究結果表明,在六項以不同信息復雜性和決策策略偏差為特征的獨立人體研究中,所研究的三個信息分布因素(即總信息、完整屬性對和信息不平衡)對決策準確性具有顯著的預測作用。其次,本論文通過信息估計和決策前信息搜索的視角,強調了專家和新手行為的關鍵差異,這進一步解釋了不確定性下的個體差異,并為這些環境下的決策支持系統(DSS)提供了新穎的設計考慮。最后,在啟發式和分析式偏差環境中,信息修正和選項預測決策支持系統的應用表明,各成績組的準確性顯著提高,響應時間顯著縮短。

圖 3.2:參照兩個示例目標(危險程度高的導彈和危險程度低的運輸工具)的可視化決策任務。

決策環境與人體實驗任務

要回答所有研究問題,就必須能夠在信息不完整的情況下,在人體實驗中將這些問題具體化。為此,下文將簡要介紹本論文中使用的兩種決策環境,并在后續章節中對其設計和實施進行詳細說明。

  • 防空作戰協調

第一個環境要求參與者扮演一艘軍艦上的防空作戰協調員(AAWC),其領空內有目標。決定目標敵意的決策標準基于四個二元線索:高度、速度、與中立空中走廊的距離和大小。標準分數由每個選項的提示分數的線性加權組合計算得出,提示按提示加權的等級順序顯示。參與者只需從兩個目標中選擇一個最危險的目標,并與飛機交戰。每個決定都必須在 20-30 秒內做出,參與者可使用彩色計時器進行時間管理。

  • 車道防御游戲

第二個環境是由 Unity 游戲引擎構建和托管的車道防御游戲。游戲的每一輪都有一組獨特的三個選項,它們從屏幕左側沿著三條車道中的一條向屏幕右側移動。參與者有 60 秒的時間來判斷這三個選項中哪個最危險。為了做出決定,參與者可以訪問詳細的情報菜單,該菜單顯示了描述每個敵人敵意程度的五個提示值(武器、體型、裝甲、盾牌、頭盔),這些提示值按提示權重排序顯示。在以前的 AAWC 環境中,參與者需要根據閾值臨界值對每個可用線索值做出敵意/非敵意判斷。在這個環境中,參與者的這一過程被簡化了,非敵意提示值用綠色向下箭頭表示,敵意提示值用紅色向上箭頭表示。新環境的特點包括幾乎雙倍的可能信息總量、信息訪問跟蹤以及更靈活的用戶界面設計,所有這些都有助于對所有三個研究問題進行更詳細的探討。

技術貢獻

在信息缺失或不確定的環境中,信息的分布如何影響決策結果,文獻尚未對此有全面的認識。本論文在一系列決策環境的人類受試者研究中考察了信息結構的三種測量方法(TI、CAP、II),并證明信息不平衡最小化和完整屬性對最大化最有利于提高決策準確性(第 4、5、8 章)。研究發現,總信息量的增加總體上有助于提高準確性,但如果不包含 CAP 和 II,則不足以解釋準確性的提高。此外,生態合理決策策略(由環境結構定義)對這些結果也有影響(第 8 章)。經測試發現,補償生態學(WADD、高分散和低分散)對信息結構的變化更為敏感,而非補償生態學(TTB)則不太敏感,尤其是對信息不平衡的變化。

此外,本論文還研究了對缺失信息進行估計的作用,并首次對決策者的估計策略進行了直接征詢。這項在 AAWC 環境中完成的研究(第 5 章)表明,新手傾向于估計幾乎所有缺失信息,而任務專家則能夠忽略信息,主要根據第一個可用的(也是最重要的)線索來估計信息。這與 Lane Defense 研究(第 8、9、10 章)中的策略選擇數據相吻合,這些數據表明,無論環境結構如何,新手都傾向于補償性決策行為,這違反了非補償偏置環境中的生態合理性。

最后,決策支持在被拒止和退化的環境中所能發揮的作用在這里得到了更充分的證實。第 6 章測試了獲取和限制信息的概率方法和基于規則的方法,結果表明基于規則和基于概率的修改技術都能帶來更大的決策結果。第 9 章將支持系統的設計向前推進了一步,對比了基于圖形用戶界面的隊友與基于獲取的隊友,前者可以卸載信息估算,而后者則采用第 6 章中基于規則的方法為參與者收集缺失的信息。結果發現,這兩種方法都能顯著提高新手和專家的成績。

付費5元查看完整內容

現有的決策計算模型往往局限于特定的實驗設置。造成這種限制的主要原因是無法捕捉決策者對情況的不確定性。本文提出了一個計算框架,用于研究神經科學和心理學中不確定情況下的決策制定。框架主要側重于決策者對世界狀況的概率評估,即他們的 “信念”。具體來說,它基于部分可觀測馬爾可夫決策過程(POMDPs),結合貝葉斯推理和獎勵最大化來選擇行動。利用感知決策和社會決策方面的各種實驗數據,證明了基于信念的決策框架的可行性。框架解釋了感知決策實驗中決策者的實際表現與他們對實際表現的信念(即決策信心)之間的關系。它還說明了為什么在許多情況下這種評估會偏離現實。這種偏差通常被解釋為次優決策的證據,或選擇和信心的不同過程。我們的框架對這些解釋提出了挑戰,它表明,一個優化收益的規范貝葉斯決策者也會產生同樣的偏差。此外,在定量預測人類在社會決策任務中的行為方面,方法優于現有模型,并提供了對潛在過程的洞察。結果表明,在涉及大型群體的決策任務中,人類采用貝葉斯推理來模擬 “群體心理”,并對他人的決策做出預測。最后,將方法擴展到關于他人的多個推理層次(心智理論層次),并將服從作為群體決策的一種策略聯系起來。這個擴展框架可以解釋人類在各種集體群體決策任務中的行為,為大型群體中的合作與協調提供了新的理論。

圖 1.1: 基于信念的決策框架。智能體通過行動、觀察和獎勵與世界互動。智能體無法完全觀測到世界的狀態,只能根據觀測結果和智能體的內部世界模型,以概率方式表示世界的狀態。智能體的目標是根據當前狀態的概率分布來制定策略,即所謂的信念

付費5元查看完整內容

控制動態系統是一個具有廣泛應用的基本問題,從機器人技術到生物工程等領域都有涉及。最近,博弈論中的遺憾最小化原始概念被應用于控制領域,為更具挑戰性的非隨機控制設置提供了新穎的實例最優性能保證。本論文進一步探索了從多智能體視角看控制的好處。具體而言,我們首先提出了一種用于控制器驗證的生成干擾的新算法,該算法依賴于在非隨機控制游戲中重新定義玩家的角色。接下來,我們提供了非隨機控制設置的合作多智能體擴展,涉及從我們的多智能體游戲到單一智能體遺憾最小化的簡化。此外,我們展示了通過這種視角,即使在單一智能體設置中,也可以實現對失敗的新的魯棒性概念。雖然控制是一個強大的工具,但它在很大程度上依賴于對動力學的了解。最后幾章提供了兩種非常不同的方法來實現在沒有這種模型的情況下的魯棒性。第一種方法將非隨機控制方法擴展到無模型強化學習。作為另一種方法,我們考慮使用經典控制理論工具的未知系統,這些系統的動力學大致是線性的。

控制理論領域長期以來一直是塑造眾多技術和科學進步的關鍵。其應用范圍非常廣泛,從庫存規劃到機器人系統的精確操控。經典控制的本質在于其為本質上易于變化和不確定的動態系統帶來可預測性和穩定性的能力。這種能力不僅在傳統工程學科中具有基礎性作用,而且還在新興領域中發揮作用,從而不斷重新定義通過技術創新可實現的界限。

多年來,控制理論的發展受到了追求最優性和魯棒性的指導。例如,最優L2控制框架一直是這一旅程的基石,為線性系統提供了一種系統的方法,這些系統由具有二次成本的iid噪聲驅動。同樣,魯棒控制范式在確保系統穩定性和面對最壞情況的不確定性和干擾時的性能中發揮了作用。這些工具雖然強大,但并沒有完全捕捉到真實世界的復雜性。一方面,這兩者對成本都有強烈的結構假設,但或許更重要的是,真實世界既不是良性的,也不是最壞情況的。要解決真實問題,我們需要為中間地帶設計的工具。 因此,控制理論的景觀正在演變。認識到許多真實世界的系統在非隨機或對抗性條件下運行,導致了范式的轉變。這一轉變開啟了新的可能性領域,在這個領域中,特別是遺憾最小化的博弈論概念被用來重新定義控制策略。遺憾最小化是一種評估策略相對于后見之明中最佳可能策略的性能的概念,為控制提供了新的視角。它揭示了實例最優性能的概念,其中的焦點不僅僅是平均性能,而是在特定實例中,特別是在具有挑戰性的非隨機設置中表現出色。

這篇論文的探索從經典控制和博弈論見解的交匯處開始。它深入探討了從多智能體視角出發的控制系統的復雜動態,不僅重新想象了控制器和干擾的角色,而且還轉變了理解和緩解不確定性的方法。通過整合這些多樣化但相互關聯的思想線索,這項工作旨在為控制理論領域規劃一條新的道路,一條更適合現代系統的復雜性和不確定性的道路。

付費5元查看完整內容

本文是研究指揮與控制(C2)未來表現形式的四篇系列論文中的第一篇。第一篇論文通過探討未來指揮與控制(C2)系統需要在其中運行的未來作戰環境,為后續研究設定了基線。具體來說,本文探討了復雜性的驅動因素、表現形式和影響,而此前的研究表明,復雜性很可能是這一環境的特征。為此,它討論了 C2 和復雜性等關鍵術語的定義;介紹了未來運行環境中復雜性的一些驅動因素,并討論了這些因素如何對 C2 系統和組織造成新的壓力;研究了分析和理解復雜性的可能方法;并概述了 2030 年代及以后可能產生的一些實際考慮因素。由于本文旨在為本系列的后續三篇論文提供資料,因此沒有全面涵蓋未來 C2 思考的所有方面,包括提出具體建議。

研究問題

  • 根據當前的全球社會和技術趨勢進行預測,國防和合作伙伴可能面臨的持續競爭和多領域作戰的作戰環境的性質是什么?
  • 基于這種對未來的預測,未來的 C2 系統和組織將面臨怎樣的復雜性;即復雜性的可能來源是什么?
  • 考慮到未來作戰環境的這一特點,未來的 C2 系統和組織需要具備哪些條件?
  • 未來的 C2 系統和組織需要什么樣的新能力和特性才能有效應對這些需求?

有爭議的定義

C2 沒有直截了當的定義,對于該術語在當代作戰環境中的范圍和相關性也存在爭議。對 C2 傳統定義的批判來自于對 21 世紀有效領導力構成要素的更廣泛質疑。在英國、美國和北約,最近出現了大量與 C2 相關的新術語,并將重點從聯合思維轉向多領域思維。我們的研究將 C2 定義為一個動態的、適應性強的社會技術系統,因此有必要考慮組織、技術和人力要素。

同樣,復雜性也沒有一個公認的定義。學術界對復雜性的研究日益增多,涉及多個科學學科,但缺乏統一的方法或理論框架。一個有用的出發點是區分簡單系統、復雜系統、復雜系統和復雜適應系統。文獻還描述了在這些條件下可能出現的所謂 "棘手"或 "超級棘手問題"。還可以對有限博弈和無限博弈進行重要區分--這是考慮作為復雜適應系統的國家間競爭時的一個有用視角。鑒于這些爭論,我們的研究避開了對復雜性的僵化定義,而是從其關鍵屬性的角度對這一現象進行了 DCDC 式的描述。

復雜性的預計驅動因素

未來作戰環境的特征--以及國防 C2 系統和組織預計將執行的任務類型--具有很大的不確定性,因此任何預測都必須謹慎。盡管如此,文獻指出了各種政治、經濟、社會、技術、法律、環境和軍事(PESTLE-M)趨勢,預計這些趨勢將影響國際體系的演變,進而影響 2030 年及以后的國防行動。這些趨勢包括以下宏觀趨勢

  • 日益增強的互聯性、多極化和全球競爭
  • 不斷變化的氣候的影響
  • 技術變革和數字化的影響
  • 傳統和新穎領域的模糊化
  • 國際準則和價值觀的轉變。

最重要的是,沒有一個單一或主要的趨勢推動著變化或復雜性;相反,最令人擔憂的是多種因素的融合及其不可預測的相互作用。這種認識為進一步研究這些趨勢影響國際體系復雜性水平和特征的具體機制提供了基礎,從而為在這一領域開展工作的 C2 帶來了新的挑戰。

復雜性的表現

上述 PESTLE-M 趨勢為未來組織應對 C2 帶來了一系列困境和壓力,包括但不限于

  • 不確定性
  • 模糊性
  • 多義性
  • 信息超載
  • 認知偏差
  • 面對瞬息萬變的事件,決策癱瘓或節奏不足
  • 難以確保決策(包括人工智能)或信任決策所依據的數據、邏輯和假設
  • 難以調動所有必要的權力杠桿,或協調參與制定和執行特定戰略或行動計劃的大量不同參與者(如跨政府合作伙伴、行業、國際盟友、公民)。

此外,無論是理論家還是實踐者,在處理包含非線性動態的問題時,都缺乏有力的措施來衡量所做決定或采取的行動的有效性。因此,很難確切地說未來作戰環境中的復雜性是否在客觀上不斷增加(而不是以不同的形式出現),但對軍隊應處理的復雜任務的政治期望與當前 C2 方法的執行能力之間顯然存在巨大差距。當前的學術理論為決定如何在復雜環境中配置 C2 提供了一個方法工具包的初步輪廓和一些指導原則,但并沒有提供靈丹妙藥。該理論強調審議分析方法,即讓不同利益相關者參與共同設計、借鑒多學科和知識體系的見解,并在分析和決策過程中建立靈活性,以便根據反饋意見不斷迭代和改進的方法。

未來 C2 的實際考慮因素

要應對復雜的自適應系統,就必須摒棄當前的線性 C2 流程和等級結構,盡管在處理非復雜任務和問題時,更傳統的方法可能仍然有用。在競爭激烈的世界中,英國既需要培養能夠對他人施加建設性影響的特性和能力(例如,將復雜性強加給對手的 C2),也需要培養能夠增強自身駕馭復雜性能力的特性和能力。

要影響敵對行動者的觀念、決策和行為,首先要深入了解其 C2 結構、流程和文化。根據這種了解,英國國防需要一套動能和非動能杠桿,對敵方的 C2 施加建設性影響,包括施加復雜性。除了敵對行動者,英國國防部還需要進一步了解如何對 PAG、盟友、合作伙伴、工業界、學術界、公民和對 C2 采取截然不同方法的其他人施加建設性影響。

在增強英國自身應對復雜性的能力方面,未來的 C2 系統和組織必須促進靈活性、復原力以及學習和適應能力等特性。整個決策周期都需要變革。例如,傳感器和通信技術的進步為獲取更多深度和廣度的數據提供了機會,包括有關復雜問題的數據。因此,提高認知能力對于理解所有這些數據至關重要,既要利用人類和機器的優勢,又要減少各自的缺點。要改變決策方法,還需要改變領導風格,以培養更善于駕馭復雜適應系統的決策者。在做出決策或計劃后,提高跨部門或跨層級的能力,在實施階段更好地整合活動或匯聚效應,對于抵消英國的局限性(如在質量方面)至關重要。

同樣,整合也不是萬全的;如果國防缺乏足夠深度的力量和能力,無法在充滿敵意的威脅環境中采取可信行動或維持高節奏行動,那么即使是最高效的指揮控制系統也無法在未來取得成功。此外,還需要采取防御措施以及恢復和失效模式,以阻止或減輕敵方破壞 C2 系統和組織的努力所造成的影響。鑒于所面臨的威脅,以及英國國防可能需要解決的不同形式的復雜問題,很可能會同時出現多種并行的 C2 模式,而不是單一的方法。應對復雜性意味著不斷學習、適應、創新和開放求變。因此,必須從一開始就將效果衡量標準、信號和變革機制納入計劃以及 C2 系統和組織,使其能夠隨著時間的推移不斷學習和調整,以應對各種情況。至關重要的是,未來 C2 系統和組織的設計只是挑戰的一部分--它們還必須得到更廣泛的國防企業緊急改革的支持,以確保獲得所需的使能因素(人員、技術等)。從 C2 的角度來看,這本身就是一個挑戰,因為改變這個企業--一個復雜的適應性系統--本身就是一個棘手的問題。

結論和下一步行動

學術理論家和政府、軍事或工業從業人員對復雜性或復雜適應系統的理解并不全面,而這正是未來 C2 運行環境的特點。雖然文獻提供了處理復雜性的有用方法和工具,以及未來 C2 的一些初步設計考慮,但英國 C2(本身就是一個社會技術系統)的現代化和轉型將是一項高度復雜的工作。這意味著要與不斷發展的作戰環境、不斷變化的威脅和技術環境共同適應,從而進行迭代和不斷學習。因此,最緊迫的挑戰或許是,考慮到 C2 系統在未來面對復雜性時取得成功所需的轉型(技術、結構、流程、文化、教育等)的程度和性質,了解如何在一段時間內最好地引導這一過程。

自相矛盾的是,要克服實現以應對復雜性為目標的 C2 系統所面臨的障礙,可能需要英國國防部已經表現出其所尋求建立的系統的許多特征。面對這樣的循環邏輯,英國國防部可能需要某種外部沖擊來迫使其進行創造性的破壞,或者利用(或不顧)更傳統、線性的 C2 方法來啟動自身的激進改革努力,并隨著時間的推移,隨著變化的到來而進行調整。

付費5元查看完整內容

生成式數據增強(GDA)已成為緩解機器學習應用中數據稀缺問題的有前景技術。本論文提供了GDA領域的全面綜述和統一框架。首先,我們簡要介紹GDA,討論其動機、分類法和與合成數據生成的主要區別。接下來,我們系統地分析了GDA的關鍵方面 - 選擇生成模型、使用它們的技術、數據選擇方法、驗證方法以及各種應用。我們提議的統一框架對廣泛的GDA文獻進行了分類,揭示了例如缺乏通用基準的缺口。這篇論文總結了有前景的研究方向,包括有效的數據選擇、大規模模型在GDA中的應用的理論發展和為GDA建立基準。通過建立一個結構化的基礎,本論文旨在促進生成式數據增強這一重要領域的更有凝聚力的發展和加快進展。

在當代機器學習領域中,深度學習算法已經成為眾多任務的強大工具,展示了前所未有的準確性和能力[1; 2; 3]。然而,它們效能的關鍵基石在于它們能夠訪問大量的數據[4; 5; 6]。在當今的數字環境中,收集如此廣泛和原始的數據集,矛盾地,證明是復雜的,并可能昂貴得令人望而卻步。這種數據收集的復雜性源于多方面的挑戰,包括但不限于隱私關注[7; 8],多樣化的數據來源,以及需要費勁標注的需求[9]。 因此,科學界已經轉向數據增強技術,作為一個務實的解決方案,以抵消可用數據的匱乏。數據增強是指一套用于人為擴大數據集的容量和多樣性的技術,通過對其現有條目進行控制修改,而不改變它們的固有語義解釋[11; 12]。傳統的數據增強方法[10],雖然很好,但主要圍繞線性變換或初級的非線性修改。盡管這些方法有益,但它們已經顯示出了局限性,尤其是在它們顯著提高模型性能的能力方面,特別是當底層數據多樣化時。

認識到這些局限性,研究人員越來越感興趣于探索更為復雜的數據增強途徑。在這一追求中的一個顯著方向是集成生成模型進行數據增強,即生成式數據增強(GDA)。生成模型的吸引力在于它們固有的模擬數據復雜概率分布的能力[13; 14; 15],從而提供了更為細致和廣泛的增強景觀。通過挖掘這種潛力,生成式數據增強為改進深度學習模型性能提供了一個有前景的視野,特別是在數據有限的情境中。 本文提供了關于生成式數據增強(GDA)的全面綜述。雖然該領域已經見證了眾多的方法和方法論,但這些技術的結構化和統一的理解通常是難以捉摸的。許多作品將GDA應用于某個數據集,但在GDA的發展上鮮有創新和貢獻。統一的框架可以通過提供清晰的結構和分類來解決這個問題,使研究人員更容易識別缺口并基于現有方法進行構建。

為了解決這個缺口,我們提出了一個統一框架,系統地對GDA的廣泛景觀進行了分類。這個框架作為一個路線圖,指導讀者了解GDA的多方面:從選擇生成模型,到利用它們的技術,選擇高質量合成數據的策略,驗證這些數據的方法,以及GDA被證明是關鍵的各種應用。

總數組織

第2節:初步 - 本節提供了關于生成式數據增強(GDA)的基礎知識。本文中使用的核心概念、關鍵術語、符號和概念都將在此處呈現。第3節:選擇生成模型 - 在此,我們深入探討了我們可用的各種生成結構。從傳統的VAEs[16; 17; 18; 19; 20; 21]和GANs[22; 23; 24; 25; 26; 27; 28; 29; 30],到新興的基于GPT[31; 32; 33; 34; 35; 36; 37; 38; 39; 40]和基于擴散的創新[41; 42; 43; 44; 45; 46; 47],我們闡明了它們的機制、優點、缺點和使用場景。第4節:利用技術 - 本段專門探討如何有效利用選定的生成模型。我們探索了潛在空間操作和提示工程,評估它們對數據質量和相關性的影響。第5節:合成數據的選擇策略 - 考慮到生成的大量合成數據,我們如何篩選最好的數據?本節深入探討了幫助提高合成數據質量的技術,無論是既定的還是新興的。第6節:合成數據的驗證 - GDA的一個關鍵方面是驗證生成樣本的可靠性。在此,我們涵蓋了確定合成數據集的質量和相關性的理論和實證方法。第7節:GDA的應用 - 在這一部分,GDA的多功能性是首要的。我們概述了其在多個領域的變革潛力,從醫療保健的醫學成像到農業等領域的應用。第8節:生成式數據增強的統一框架 - 基于前幾節的見解,我們介紹并詳細描述了我們提議的統一框架。本節闡明了框架結構背后的理念以及如何簡化從模型選擇到應用的GDA過程。第9節:當前挑戰和未來方向 - 當我們接近綜述的結束時,本節對GDA的持續挑戰進行了反思,并設想了潛在的突破。它為希望進一步拓展GDA邊界的研究者提供了指導。統一框架也可以視為本文的流程,在圖1中可以直觀地看到。本綜述的主要貢獻如下

廣泛且最新的編譯:從過去三年中的230多部開創性工作中摘錄,本綜述提供了關于生成式數據增強(GDA)的最全面的評論,有效地捕捉了該領域的快速進展。

統一框架提案:我們引入了一個結構化和有凝聚力的GDA框架,包括模型選擇、利用技術、合成數據選擇、驗證和應用。這為研究者和實踐者提供了一個系統的指南,用于改進GDA并在各種背景下實施GDA。

深入選擇和驗證:我們的綜述深入探討了合成數據選擇和驗證的細微差別,這在以前的研究中很少受到關注,強調了GDA技術的有效部署中它們的重要性。

未來路線圖:從廣泛的文獻綜述中受益,我們辨別并討論了現有的挑戰和潛在的突破途徑,為GDA的未來研究提供了一個有遠見的路線圖。

付費5元查看完整內容

本文主要研究不確定性和數據限制下的現代因果推理,并將其應用于新輔助臨床試驗、分布式數據網絡和魯棒的個性化決策。在第一個項目中,我們在主要分層框架下提出了一種方法,以治療后中間反應的反事實狀態為條件,來識別和估計治療對二元結果的平均影響。在溫和的假設下,可以確定感興趣的治療效果。將該方法擴展到審查結果數據。將所提方法應用于新輔助臨床試驗,并通過仿真研究對其性能進行評估。在第二個項目中,我們提出了一種基于樹的模型平均方法,通過利用來自其他潛在異構站點的模型,在不共享主題級數據的情況下,提高目標站點條件平均處理效果的估計精度。據我們所知,目前還沒有建立分布式數據的模型平均方法,專注于改善治療效果的估計。通過對氧療對醫院生存率的因果影響的研究,證明了這種方法的性能,并得到了綜合模擬的支持。

在第三個項目中,提出了一個具有敏感變量的魯棒個性化決策學習框架,以改善決策時不可用的敏感變量造成的個人最壞結果。與大多數使用均值最優目標的現有工作不同,本文通過找到一個新定義的分位數或最小最優決策規則,提出了一個魯棒的學習框架。從因果角度出發,將(平均)公平的經典概念泛化到個體主體的條件公平。通過合成實驗和3個真實數據應用驗證了所提方法的可靠性能。

本論文涉及以下幾個方面的因果推斷:1)確定主要階層的治療效應;2)通過異構數據集成增強對治療效果的估計;3)考慮最壞情況下的個性化決策規則。它有可能從根本上改善目前在藥物開發和精準醫療方面的實踐。

付費5元查看完整內容

序列決策,通常形式化為馬爾可夫決策過程(MDP)優化,是人工智能的一個重要挑戰。解決這個問題的兩種關鍵方法是強化學習(RL)和規劃。這項綜述是這兩個領域的集成,更廣為人知的是基于模型的強化學習。基于模型的RL有兩個主要步驟。首先,我們系統地介紹了動力學模型學習的方法,包括處理隨機性、不確定性、部分可觀察性和時間抽象等挑戰。其次,我們提出了規劃-學習集成的系統分類,包括:從哪里開始規劃,為規劃和實際數據收集分配哪些預算,如何規劃,以及如何在學習和行動循環中集成規劃。在這兩個部分之后,我們還討論了隱式基于模型的RL作為模型學習和規劃的端到端替代方案,并討論了基于模型的RL的潛在好處。在此過程中,調研還與幾個相關的RL領域建立了聯系,如分層RL和傳輸。

付費5元查看完整內容

本文介紹了在一系列背景下進行因果參數推理的程序,包括觀察性研究、完全隨機化設計、配對實驗和協變量自適應設計。首先,我們討論了凸優化在匹配觀測研究中進行方向推斷和靈敏度分析的應用。我們設計了一種算法,使信噪比最大化,同時考慮了未觀察到的混雜。我們分析算法輸出的漸近分布行為,以發展因果效應的漸近有效假設檢驗。由此產生的程序在廣泛的程序類上達到最大的設計靈敏度。其次,我們研究了特征信息在完全隨機實驗中對效應進行高精度推斷的作用。本文構建了一種基于線性回歸的校正技術,該技術構造了估計量的漸近方差的上界。該校準程序適用于任何可能是半參數有效的填補估計器,并自動證明所產生的非線性回歸調整估計器至少與均值之差一樣漸近精確;在模型錯誤規范下,非線性回歸調整估計器先前沒有保證的一個特性。第三,我們引入了高斯預軸:一種構建檢驗統計量的算法技術,即使在零中違反隨機化假設的對稱性時,隨機化推理仍保持漸近有效。我們證明了基于預軸統計量的隨機化檢驗在銳利的零值下是有限樣本精確的,而在弱零值下它們漸近地控制了錯誤拒絕的概率。這允許形成具有同聲傳譯的處理效應的置信區域,作為齊次相加處理效應的精確置信區域和異質相加處理效應的漸近置信區域;從而統一費雪和內曼推理的許多實驗設計,包括重隨機實驗。第四,我們構建了重采樣算法的嵌套層次結構,該算法利用了超總體、固定協變量和有限總體模型中的概率結構,以促進完全隨機設計中各種統計數據的非參數推斷。重采樣算法通過利用回歸調整和最優傳輸的現代結果擴展了經典的自舉范例,在固定協變量和有限人口模型下實現了顯著的增益。

付費5元查看完整內容

回答大規模知識圖譜上的復雜邏輯查詢是一項基本而又具有挑戰性的任務。在本文中,我將概述如何使用向量空間嵌入在知識圖譜中執行邏輯推理。首先,我將討論預測一對實體之間關系的知識圖譜補全方法:通過捕獲與實體相鄰的關系類型來考慮每個實體的關系上下文,并通過一種新的基于邊的消息傳遞方案進行建模;考慮關系路徑捕獲兩個實體之間的所有路徑;通過一種可學習的注意力機制,自適應地整合關系上下文和關系路徑。其次,我們還將討論QUERY2BOX,這是一個基于嵌入的框架,用于推理使用and、or和存在操作符進行的大量且不完整的KGs中的任意查詢。

付費5元查看完整內容
北京阿比特科技有限公司