亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

在過去幾年中,大型語言模型(LLM)的能力迅速提高,OpenAI 的 GPT-4 就是最突出的例子。本案例研究探討了 GPT-4 用于協助研究任務的兩種方式:數據分析和撰寫執行摘要。我們之所以選擇這些任務,是因為它們在國防分析研究所(IDA)的項目中很常見,而且經常被作為適合大型語言模型的任務提出。首先,使用 GPT-4 完成了數據清理、探索、建模和可視化等任務。將其質量和速度與人類完成相同任務進行了比較。發現單獨使用人工智能時,分析質量不夠高,但有了人類伙伴后,分析質量大大提高。使用 GPT-4 節省了約 60% 的數據分析任務時間,并為該領域節省大量成本提供了機會。然后,使用 GPT-4 為三份公開的 IDA 出版物生成了執行摘要(EXSUM),并將其與人工生成的執行摘要進行了比較。發現大型語言模型生成的內容提要往往無法為技術性較強的論文提供適當的背景,但考慮到其生成速度和詳盡程度,大型語言模型仍然提供了節省時間和成本的機會。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

生成式人工智能工具,如大型語言模型(LLMs),提供了多種方法來提高效率,改進從需求生成和管理到設計分析和正式測試的系統工程流程。大型采購項目可能尤其適合利用大型語言模型來幫助管理復雜的系統和系統的采購。然而,生成式人工智能工具容易出現各種錯誤。

我們的研究探索了當前大型語言模型生成、修改和查詢系統建模語言(SysML)v2 模型的能力。我們利用檢索增強生成(RAG)等技術為大型語言模型添加特定領域的知識,提高模型的準確性。我們介紹了一個初步案例研究,在該案例研究中,生成模型的提示次數降到了最低。還討論了大型語言模型的局限性以及未來與大型語言模型相關的系統工程研究。

基于模型的系統工程

國際系統工程理事會(INCOSE)將 MBSE 定義為 "正式應用建模來支持系統需求、設計、分析、驗證和確認活動,從概念設計階段開始,貫穿整個開發和后期生命周期階段"(INCOSE,2007 年)。傳統上,系統工程采用基于文檔的方法。然而,隨著系統和系統之系統的復雜性不斷增加,需要 "捕獲、分析、共享和管理與產品完整規范相關的信息"(Friedenthal 等人,2009 年)。在模型中捕獲這些信息可以讓多個利益相關者從各自的視角來看待系統,簡化系統工程師和特定領域工程師之間的協作,通過設計和驗證/確認活動來跟蹤需求,并在解決方案開發過程中提供一種正式的方法來識別、分析和跟蹤系統變化/缺陷(Carroll & Malins,2016)。

系統建模語言(SysML)

為實施 MBSE 方法,2006 年開發并采用了系統建模語言(SysML)v1.0 版,2007 年由對象管理集團(OMG)正式發布。SysML v1.6 于 2019 年正式發布,是 SysML v1.x 標準的最新版本。SysML v1.x是統一建模語言(UML)2標準的擴展,包含UML 2的部分(但不是全部)元素和一些新的SysML特定元素(OMG,n.d.)。SysML v1.x 是一種圖形語言,由九種圖表類型組成,其中每種圖表都代表了底層模型元素的一種視圖。

提高大型語言模型的響應速度

大型語言模型的好壞取決于它們所訓練的數據集。為了改進對特定領域請求的響應,通常需要通過以下方法之一為模型提供額外的背景:

  • RAG 利用外部數據來增強大型語言模型的知識,而不改變基礎大型語言模型的參數(權重;Nucci,2024 年)。對于經常產生新知識的領域,或者當信息屬于專有/私有信息,用戶不希望將其作為大型語言模型訓練集的永久組成部分時,RAG 尤其有用(Nucci,2024 年)。

  • 微調通過傳授大型語言模型的專業知識,對其內部參數進行微調(Nucci,2024 年)。Nucci 強調,只需調整少量參數,就能大大節省微調時間,而無需重新訓練整個模型。

  • 快速工程

    • 零鏡頭提示是要求大型語言模型在第一次嘗試時就正確執行任務,即使該模型尚未針對特定任務接受過直接訓練(Oleszak,2024 年)。它們通常用于只需要一般知識的簡單任務,或者當特定領域的知識已包含在訓練集中或通過 RAG 或微調提供時。

    • 對于需要多步驟推理的更復雜任務,或者大型語言模型不了解特定領域知識時,可使用少量提示通過實例來教授大型語言模型(Oleszak,2024 年)。通過提供代碼語法示例,少量提示學習可用于正確格式化代碼。

還可以將上述方法結合起來。OpenAI 允許用戶創建自定義 GPT,在其中可以提供具體的說明,并提供一個上傳包含特定領域知識的文件的區域(OpenAI,2023)。這種將 RAG 與提示工程相結合的方法可使用戶減少完成復雜任務所需的提示次數,而這些任務模型并未經過專門訓練。

付費5元查看完整內容

在飛速發展的人工智能(AI)領域,大型語言模型(LLM)在理解和生成自然語言方面展現出了前所未有的能力。然而,它們在專業領域的能力,尤其是在復雜和跨學科的系統工程領域的能力,仍然較少被探索。本文介紹了 SysEngBench,這是一個新穎的基準,專門用于在系統工程概念和應用的背景下評估大型語言模型。SysEngBench 將包含一整套源自核心系統工程流程的任務,包括需求分析、系統架構設計、風險管理和利益相關者溝通。SysEngBench 利用各種真實世界和合成生成的場景,旨在評估大型語言模型解釋復雜工程問題和生成創新解決方案的能力。

利用 SysEngBench 對大型語言模型進行的評估揭示了他們在系統工程背景下的現有能力和局限性。這些發現為今后的研究和開發提出了建議,旨在提高大型語言模型在系統工程學科中的實用性。SysEngBench 有助于理解人工智能對系統工程的潛在影響。

SysEngBench框架

為 SysEngBench 選擇的框架是一個簡單的多選題基準。該基準目前涵蓋系統工程入門,但將擴展到未來工作中討論的系統工程子領域。

所使用的數據來源包括海軍研究生院 SE 3100 課程的幻燈片。該課程的教學大綱包括學習該課程后獲得的以下知識:

  • 定義系統工程,包括其目的和范圍以及系統工程師的角色。

  • 定義系統架構,包括其目的和范圍以及系統架構師的角色。

  • 在系統的整個生命周期中恰當地應用系統工程流程的基本要素。

  • 根據用戶需求和操作目標,提出、闡述和記錄系統要求;將其轉化為技術要求。

  • 創建反映利益相關者目標的系統價值層次。

  • 使用 IDEF0、FFBD 等建模工具和其他技術完成系統功能分析,以支持需求工程。

  • 開發、評估和記錄備選系統架構。整個課程中的一項補充性共同努力將是獲得對國防部(DoD)系統工程應用的共同理解。

多選題是在一些人工智能輔助下創建的,但每道題都由人類系統工程師對半合成數據集的正確性進行審查。更復雜的問題將考察大型語言模型在系統工程的 "灰色 "范圍內進行推理的能力,特別是在有多種配置可以滿足要求的高維交易空間。

付費5元查看完整內容

本報告介紹了 "情景多模態對話知識圖譜構建 "項目的成果。該項目旨在為從整體上理解以計算為媒介的對話奠定基礎。在協調、規劃和行動方面,這種對話是團隊績效的基本組成部分[12, 1]。在這樣的環境中(如共享聊天或電子郵件),重要的不僅是要了解對話本身的來龍去脈,還要了解對話是如何置身于一個更大的背景中的,無論是共同的文檔還是共享的背景信息。本項目假設,知識圖譜是一種強大的方法,不僅可以捕捉此類對話的結構,還可以捕捉提供對話所處情境的信息。知識圖譜--圖式結構的知識庫,可捕捉有關實體、實體屬性和實體間關系的信息[8, 15],是一種常用的整合信息、促進下游分析和支持其他人工智能任務的方法[11, 9]。這個問題可以用研究問題來概括: 我們能否學會從基于對話的情景多語言對話中檢測出個人、個人類型、他們是如何互動的以及他們互動的內容。為奠定這一基礎,該項目有三個目標:

1.為這一問題定義基準任務;

2.確定和構建基準語料庫;

3.開發基準系統。

除這些目標外,該項目還旨在與美國空軍后勤研究所的系統分析研究領域建立合作關系。本報告以中期報告為基礎,因為大部分成果都是在此期間完成的。

付費5元查看完整內容

本研究探討了無人駕駛飛行器(UAV)與有人駕駛飛機合作進行集中任務規劃的發展情況。我們采用經過近端策略優化(PPO)訓練的單一智能體來模擬敵方防空壓制(SEAD)場景。我們的目標是掌握最佳任務策略。我們的模型在各種環境條件下進行了測試,在 100 次測試中,消除敵方防御的成功率達到 78%。我們的模型所取得的巨大成功強調了它在未來戰爭場景中的應用潛力,代表了空戰和強化學習應用領域的重大進展。

方法

集中式任務規劃架構

集中式任務規劃架構是指一種先進的技術架構,能夠在復雜多變的作戰場景中高效協調和管理無人機。該架構從各種信息來源收集數據,實時評估局勢,并規劃和執行最佳戰略,以最大限度地提高整個任務的成功潛力。

該架構的主要組成部分如下:

  1. 戰斗信息管理: 該組件持續監控當前的戰斗態勢并跟蹤信息,以提供實時戰場情報。信息來源多種多樣,包括各種傳感器、傳感器網絡和人工觀察,從而能夠深入了解動態復雜的作戰環境。這相當于強化學習中收集環境信息的過程,為有效的學習過程提供了第一步。

  2. 戰斗狀態(觀察): 在這一階段,戰場信息被提供給智能體。在戰場上收集到的各種信息會被實時處理,并傳遞給強化學習智能體。這樣,智能體就能通過綜合戰場態勢感知了解當前形勢,預測未來的可能性,并決定下一步行動。

3)任務規劃器(智能體): 作為中心的核心要素,這個基于強化學習的智能體根據傳入的實時作戰態勢數據做出最優行動。這一決策過程由一個預訓練的強化學習模型執行,該模型學習如何在復雜環境中實現任務目標。

  1. 指揮官: 最后,智能體的決策將交由指揮官執行。智能體決定的行動將作為指令傳遞給實際的無人機,從而實現移動、目標探測和攻擊等具體任務。

因此,集中任務規劃架構實現了從各種信息源收集和處理數據、規劃和調整無人機行動以適應實時戰場條件的戰略。這就實現了實時戰略決策和快速反應,提高了整體作戰效率和生存能力。

強化學習環境的構建

我們為 MUM-T 問題開發了一個量身定制的強化學習環境。在這個環境中,我們部署了一架戰斗機無人機、一個干擾器和一個防空導彈系統,每個系統都有預定義的攻擊范圍和干擾距離。任務的主要目標是協同參與干擾行動,使目標防空導彈系統失效,隨后通過操縱戰斗機無人機將其消滅。任務的成功完成取決于是否到達指定的目標點。

在無人機任務規劃的背景下,我們為 MUM-T 構建了一個定制的強化學習環境。在 MUM-T 環境中,我們部署了一架戰斗機無人機、一個干擾器和防空導彈系統,每個系統都有明確的攻擊范圍和干擾距離。任務的最終目標是與干擾機進行合作干擾,使防空導彈無法攻擊,隨后通過操縱戰斗機無人機摧毀防空導彈。當無人機到達最終目的地(稱為 "目標點")時,即成功完成任務。

為了開發環境,我們使用了 Gym 庫,這是一個用于強化學習環境的開源框架。無人飛行器可以移動的空間用二維網格表示。由于無人機的航向和速度等低層次控制方面的問題假定由 AFRL ACL 5 級自主處理,因此集中式任務規劃框架側重于負責規劃任務相關值(即航點和任務點)的高層次控制,這些值基于多架無人機的信息和戰場狀態。為促進學習過程,我們將任務空間離散化為 30x30 的網格,共由 900 個單元組成。

每個無人機的行動空間被定義為離散的多行動空間,使每個智能體能夠獨立選擇行動。戰斗機無人機和干擾機有五種可能的行動:向左、向右、向上、向下和攻擊。行動空間的離散化簡化了學習和控制[圖 5、6]。

在每個時間步長內,智能體根據其選擇的行動在網格環境中移動。我們施加了邊界條件(懲罰),以防止無人機在網格邊界外移動。此外,我們還通過檢測碰撞并分配相應的懲罰來處理戰斗機和干擾機之間的潛在碰撞。為了解決無人飛行器之間的協作問題,我們為智能體之間的特定功能和互動建立了模型。當干擾機進行干擾時,如果薩母不在攻擊范圍內,則會產生懲罰。但是,如果防空導彈在攻擊范圍內,干擾成功則會獲得獎勵,使防空導彈無法使用。戰斗機總共有五次攻擊機會,攻擊失敗(當防空導彈不在攻擊范圍內時)會導致失去一次攻擊機會并受到懲罰。另一方面,如果防空導彈在規定的攻擊范圍內,防空導彈就會失效,并獲得獎勵。重要的是,如果戰斗機沒有進行干擾,則無法攻擊,因為戰斗機的攻擊范圍小于干擾距離。

付費5元查看完整內容

該項目是為了支持美國國防部高級研究計劃局(DARPA)的 "開放世界新奇事物的人工智能與學習科學"(SAIL-ON)計劃。在第二階段基期工作中,我們推進了第一階段 TALONS 框架的理論和實施,并收集了智能體在新奇事物生成器生成的新奇事物上的基線性能的初步實證結果。在第二階段的選擇階段,我們將基礎階段的工作擴展到更廣泛的新奇事物生成和實施形式。

這項工作的主要成果包括:完成了新奇事物生成器的開發;對來自 3 個不同 SAIL-ON TA1 團隊的新奇事物進行了性能分析;開發了自動且可最大程度減少人為偏差的新奇事物生成與實施流程;將我們的新奇事物生成流程應用于 Monopoly、Vizdoom 和 Blocksworld 領域,從而證明我們的新奇事物生成器與領域無關;以及為 SAIL-ON 計劃提供支持。下面的項目總結和后續報告將更詳細地介紹這些成就。

項目總結

目前最先進的人工智能可以在已知已知甚至未知的情況下穩健運行。然而,人工智能仍無法可靠地檢測、描述和適應開放世界中的新奇事物。隨著研究界不斷努力實現先進的自主性,我們需要有科學依據的方法來評估人工智能體在開放世界環境中的表現。

PacMar Technologies(PMT)和 Parallax 高級研究公司開發了一套獨立于領域的理論、原則性技術和軟件工具,用于生成、描述和評估新穎性。這些理論和技術涵蓋了與領域無關的新穎性。在合同基期內,我們開發了一個測試平臺,用于評估智能體在自動駕駛汽車領域對新奇事物的反應性能,我們還在南加州大學 SAIL-ON 團隊提供的大富翁領域中實施了由我們的軟件工具自動生成的新奇事物。

我們的新奇事物生成器方法使用原則性技術自動生成新奇場景。這些場景被加載到模擬環境中,與給定的第三方人工智能體對接,以收集該智能體的性能數據。然后評估智能體在各種不同情況下處理各類新奇事物的能力。

我們將新奇定義為環境中的變化。簡而言之,變化可以是過渡函數的變化,也可以是狀態空間的變化。我們的方法有能力在過渡函數(包括行動和事件)、狀態空間定義和觀察函數中生成新穎性。精確生成新穎性的計算方法可分為兩種類型的轉換,其方式與創造性系統框架(Wiggins,2006 年)一致。我們方法的關鍵在于從八個維度對新穎性進行表征,從而支持將情景生成的重點放在可能挑戰智能體魯棒性的情況上。

我們的方法目標如下
 1.為新奇性的特征描述奠定科學基礎。 2.開發生成可用于評估智能體的新情景的技術。 3.確定這些技術的可行性及其在各領域的適用性。

本報告旨在清晰地描述我們的方法,包括新穎性生成、模擬和評估的方法。將我們的方法應用于 CARLA 的自動駕駛汽車領域、Monopoly、VizDoom 和海洋領域,有助于進一步發展理論和測試平臺軟件。最后,我們對本報告進行了總結,并提出了進一步研究的思考和啟示。

在第一階段的工作中,我們開發了一個基于新穎性多維表征的新穎情景生成框架。我們正式規定了這一多維表征、收集受測智能體數據的指標,以及評估智能體對不同類型新穎性的魯棒性的方法。在使用轉換生成新穎性的過程中,我們定義了 24 個函數簽名,并計算了應用這些簽名生成新穎性的上限復雜度。我們的研究表明,根據我們對新穎性的多維表征,使用這兩種類型的變換來改變場景生成,我們能夠顯著減少新穎場景的空間。為了支持新穎性的精確生成,我們構思了 TALONS 模擬器抽象語言(T-SAL)來描述環境和這些環境中的各個場景。我們利用這些概念來支持第三方智能體對新奇事物的魯棒性評估。

在第二階段基期工作中,我們推進了 TALONS 框架的理論和實施,并收集了智能體在新奇事物生成器生成的新奇事物上的基線性能的初步實證結果。我們制作了三個源代碼庫,詳見基礎階段最終報告,其中包含以下內容的實現:(1) TSAL 語言;(2) 新穎性生成器(實現 R 變換);(3) 使用 CARLA 自動駕駛汽車模擬器的評估框架。從理論角度來看,我們利用第一階段工作中開發的新穎性維度理論對新穎性進行了初步分析研究,并正式定義了 R 變換,然后利用這些定義正式定義了新穎性層次結構級別。

我們在第二階段選擇期內做出的獨特貢獻包括以下內容:

  • 提供更新的 TSAL 解釋器 - 基于 python 的庫,可將 TSAL 語言文檔轉換為 python 類實例。其功能包括讀取、寫入和修改 TSAL 語言文檔。在選擇期內,我們為 TSAL 問題文件文檔解析組件添加了目標表示。
  • 修訂了 T-SAL 規范定義。
  • 完成了新穎性生成器的開發--這是一個基于 python 的庫,使用 R 變換和 T 變換生成新的 TSAL 領域和問題文件。功能包括
    • 用戶可以選擇要考慮的 R 變換,從而集中搜索特定類型的新穎性。
    • 初始 T 變換包括生成隨機情景和從種子情景生成情景,種子情景具有可選規格,可防止某些謂詞類型在新情景中發生變化。
    • 我們實現了與領域無關的過濾功能,以確定新穎性是否相關--如果不處理新穎性,智能體將會看到性能降低。
  • R 變換的正式定義
  • T 變換的正式定義
  • 更新了大富翁領域的 TSAL 領域文件,并為 Vizdoom 領域、Blocksworld 領域和一個海事領域創建了 TSAL 領域文件。
  • 在 Monopoly、Vizdoom 和 Blocksworld 域中進行了評估,以完善新穎性生成器的操作,并證明它可用于多個域。
  • 為 Blocksworld 領域添加了 T 變換情景生成器示例
  • 使用我們的新穎性維度對來自 SAIL-ON TA1 團隊(WSU、UTD 和 ISI)的新穎性進行了分析。
  • 我們提供了嚴格定義的 SAIL-ON 創新水平邏輯定義。這些定義可用于檢驗新穎性是否屬于某一特定級別。
  • 正式定義了發現有價值新奇事物的三個條件,我們將這些條件稱為 "可學性條件",因為它們反映了智能體是否有望 "學會 "一個新奇事物:相關性、可注意性、可控性。
  • 我們創建了一個 "人在回路中 "的流程,開發人員可以使用我們的新奇事物生成器在其他模擬器中創建新奇事物,這些模擬器是在 TSAL 之外定義的,例如 Monopoly 和 Vizdoom。
  • 在整個執行期間出版了 4 份討論我們工作的出版物
  • 支持第 36 個月和第 42 個月的 SAIL-On 會議,包括在這兩次會議上介紹我們的工作。

付費5元查看完整內容

本項目的研究目標是通過研究游戲化培訓方法能否/如何改善培訓,來改善采購人員的培訓,特別是有關新采購概念和方法的培訓。采購成果在很大程度上取決于國防部(DoD)員工在不斷變化的采購生態系統中的學習和適應能力。鑒于學習時間的限制和勞動力的流動,需要新的方法來提高培訓速度、保持率和興趣。

美海軍研究生院(NPS)和北卡羅來納州立大學(NCSU)的研究團隊制作了一套談判場景,并將其納入一個交互式玩家平臺,允許團隊在談判團隊中扮演政府或行業方面的各種角色。玩家們相互競爭,并努力在各自的任務、限制和目標下為自己的團隊找到最佳解決方案。研究人員評估了團隊在各種復雜的談判交易、各種制約因素和信息不對稱的情況下是如何互動的。

對參與者反饋意見的分析表明,這項練習促進了創造性地解決問題,對采購專業人員具有潛在的益處。然而,參與者希望有更多的時間、結構、明確的預期和可及性。積極的反饋顯示了學習導向,而消極的反饋則反映了對績效的關注。總之,游戲化方法有望提高對收購專業人員至關重要的談判技能。這項研究為游戲化談判培訓提供了初步方法和原型。需要進一步完善和測試,以優化游戲設計、玩家體驗和學習成果。游戲化方法可以提高參與度和實際技能,但要取得成功,還需要認真實施。

付費5元查看完整內容

圖2. 用于SIENNA的技術途徑和方法的高級表示。

本報告詳細介紹了一種使用聊天機器人技術與對話者接觸的新方法,同時通過使用軟件代理中實現的獨特虛擬角色積極征求信息。這項研究名為 "調查和獲取攻擊者信息的策略"(SIENNA),是在國防高級研究計劃管理局(DARPA)主動社會工程防御(ASED)項目的技術領域(TA)2下進行的。

我們研究的產品包括兩個主要技術:

  • SIENNA-Bot:一個旨在使用特定領域內容與對話者交談的聊天機器人。
  • Cervantes: 一個用于特定領域對話開發的圖形用戶界面(GUI),它圍繞著任務的概念發展,即一系列復雜度不斷增加的問題,旨在從對話者那里獲得信息。

TA2成功的關鍵是產生符合邏輯和連貫的對話。這種對話應能有效地吸引對話者并與之互動,就像他們與另一個人交流一樣。為了生成內容,我們采用了一種新穎的自然語言生成作者方案,該方案由屬性語法驅動。SIENNA-Bot遵循的是一種管道設計方法:

  • 自然語言理解(NLU)。確定傳入信息的意圖并分配屬性。
  • 對話生成。確定的內容屬性與對話狀態進行評估,以確定下一步行動。
  • 自然語言生成(NLG)。生成對信息的可行的回應。

在投入時間設計和開發語言理解和生成組件之前,為了證明這種設計的有效性,我們開發了一個帶有簡單對話生成器的初步概念驗證聊天機器人。這個機器人的目標是確認通過簡單的話語技術使對話者參與對話的功效,而不需要開發必要的組件來解析和理解信息內容。由此產生的機器人能夠通過扮演兩個不同的角色之一來反擊冒名頂替的攻擊:

  • 有需求的自戀者。喜歡八卦同事和目標領域的同事,對最近同事的成功表示厭惡,喜歡講關于自己的漫無邊際的故事。
  • 唾棄的同事。利用敘事的隱蔽性,介紹虛構的背景故事作為談話的手段。因為對話者只是假裝認識這個對象:
    • 一個虛構的故事讓機器人迅速控制了對話
    • 不需要理解信息的內容

在這個基礎機器人的基礎上,我們接下來研究了通過納入NLU和NLG將現實主義引入對話的技術。SIENNA中的NLU模塊的目標是:

  • 理解對話者所說的語用學內容
  • 從對話者的信息中提取關鍵信息片段

這一目標是通過使用預先訓練好的Transformer模型來實現的,該模型增加了理解對話者信息的語用學的層次,同時提取關鍵的信息,稱為標志。由此產生的NLU能夠對各種類型的話語行為進行分類,其主要優勢在于提供:

  • 對話狀態信息
  • 為內容編寫提供便利條件

例如,通過檢測對話者在回答任務時的爭論,SIENNA可以利用這一信息來改變任務的方向,或者分配一個新的、可能更容易的任務。信任跟蹤的概念也被納入SIENNA的NLU中,其指導原則是::

  • 困難的請求需要高水平的信任
  • 當任務完成后,信任度會上升

從這些公理出發,我們設計了NLU功能,將任務的成功完成與每個信息內容的確定合規性相結合。如果一個任務沒有完成,或者NLU模塊在信息中檢測到憤怒、沮喪或不耐煩等情緒,那么整體的信任度就會下降。相反,如果對話者順從并愿意回答問題,信任程度就會上升。

我們通過納入兩種技術進一步發展了對話生成功能:

  • 對話狀態。保持并使用先前的對話內容,如
    • 前提條件,確定是否應該使用對話內容。
    • 建立和保持未來持續對話狀態的效果
  • 定制對話生成器。這些對話生成器提供專門的內容生成,旨在處理對話的具體細節

這項工作產生了一個NLG模塊,它能夠通過與對話者爭吵、爭論和對一件小事提出異議的過程,根據輸入信息的語義產生對話。

隨著這些新技術的加入,SIENNA機器人納入的對話理解和一致性水平遠遠超出了項目開始時計劃的最初 "啞巴 "機器人戰略。

SIENNA采取的程序性內容生成方法需要有創造對話領域的能力。具體來說,要有讓非開發人員和非SIENNA專家構建新任務的功能。SIENNA使用一種策略,向對話者提出越來越復雜的問題,以消耗對話者的時間,同時從他們那里獲得信息。這些問題被稱為任務。為了使內容創作者能夠為一個領域編寫一系列的任務,我們開發了一個用戶友好的編輯器,叫做Cervantes。

創建Cervantes編輯器的第一步是設計和開發一種特定領域的語言(DSL)。通過使用DSL,我們建立了一個正式的結構,促進了對Cervantes設計的快速迭代。DSL的語義包括:

  • 定義區塊。這些塊設置了可重復使用的動作、反應和行為,貫穿整個任務集。
  • 任務塊。一個特定的 "任務",機器人試圖讓對話者在執行時浪費時間和/或透露信息。
  • 條件和效果。為作者提供連接一系列任務的能力,并允許SIENNA任務管理器隨著對話的發展在任務之間動態過渡。

由此產生的Cervantes的功能集包括:

  • 詳細的任務編輯器: 能夠創建令牌、變量和對話的能力
  • 嵌入式幫助: 用戶界面(UI)有一個超鏈接的嵌入式幫助系統
  • 任務模擬器: 一個模擬器,用于在開發期間測試和調試任務
  • 多用戶界面: 支持多用戶的功能
  • 權利和角色: 權利和角色:以常見的開源平臺為模型,如GitHub,其中用戶是項目的成員,每個項目都有特定的權利和角色
  • 版本管理: 在用戶界面中創建項目版本的能力。

在該項目過程中,我們開發了一個由50個任務組成的任務庫。此外,我們將塞萬提斯部署在一個共享服務器上,所有表演者都可以訪問,有多個非雷神BBN技術公司(BBN)的合作者團隊創建了任務庫,如科羅納病毒病(COVID)任務庫和法院傳票庫。

總之,SIENNA使用富有表現力的聊天機器人與對話者接觸的方法表現出了有效和驗證的結果。在該項目過程中,SIENNA捕捉到的真正的正面標志的數量從71%增加到89%。多個非SIENNA團隊組織成功地使用塞萬提斯創建了他們自己的特定領域追求庫。

我們對SIENNA的進一步發展的主要建議是:

  • 多語言支持。
  • 人在回路中。
  • 團體機器人互動。
  • 在可用時利用外部信息。
  • 改進跨平臺切換。
付費5元查看完整內容

美國空軍轉型能力辦公室 (TCO) 的一個關鍵目標是在各種舉措中培養轉型能力。若要提出、開發和選擇要推進到轉換功能管道中的概念,TCO 必須從許多數據源中提取信息。機器學習和自然語言處理可用于從文本源中提取信息;但是,還必須有效地應用和利用主題專業知識,以提供創造性的見解并充分利用提取的信息。

為了了解如何使用以人為本的數據增強(HCDE)決策流程來確定哪些概念要進入管道,作者使用了一種多方法定性方法,其中包括對發展規劃相關文獻的回顧以及對高級領導人的采訪,技術專家,以及來自空軍和國防界的主題專家。他們的分析綜合揭示了TCO使用數據科學工具從能力差距,能力需求和技術解決方案的龐大數據庫中提取信息的機會,并使用更多樣化的面向未來的決策方法(稱為預見方法)來利用人類的專業知識和創造力。他們開發并實施了概念驗證語義聚類分析和主題探索工具,以從能力差距和技術的自由文本描述中提取信息,并將數據提取與前瞻性方法相結合,作為HCDE決策過程的一部分。作者在三個案例研究中展示了數據科學工具和遠見方法。

研究問題

  • 可以使用哪些方法來決定將哪些概念推進到空軍轉型能力管道中?

  • 數據科學工具能否用于從龐大的數據庫中提取有關能力差距、能力需求和技術解決方案的信息?

  • 在這些工作中,可以使用哪些方法來利用人類的專業知識和創造力?

主要發現

  • TCO的異常廣泛的任務要求使用不同于空軍其他部(DAF)和國防部組織使用的工具和方法。

  • 能力差距的一些數據源被廣泛引用,但它們沒有得到集中管理;科學和技術解決方案的數據源更加多樣化和多樣化,這些來源中包含的數據量非常龐大。

  • 沒有軟件工具系統地用于解析、提取和總結能力差距和技術解決方案來源的內容。

  • 現代數據科學技術可用于從這些源中包含的自由文本描述中提取信息。

  • 發展規劃是一項以人為本的工作,取決于領域知識、創造力和社交網絡。

  • 預見方法可用于利用人類的專業知識和創造力。

  • 數據科學技術和預見方法可以集成在一起,形成HCDE決策過程。

建議

  • 空軍研究實驗室(AFRL)和TCO應使用本報告中描述的概念開發和選擇過程。

  • AFRL和TCO應該使用軟件工具,如本報告中所述,從自然語言數據源中提取信息。當他們這樣做時,他們應該進行用戶測試和驗證研究,以改進軟件工具。

  • AFRL應探索替代的自然語言處理方法,以最大限度地提高從自由文本來源提取信息的效用。

  • DAF 應整理和標準化關鍵的運營能力差距數據源。

  • AFRL、DAF 和 TCO 應通過購買或開發清理記錄并將其與元數據合并的功能來豐富關鍵的科學和技術數據源。

  • TCO應擴大創造性、互動性、專家驅動和循證預測方法的使用。

  • 作為實現HCDE能力發展規劃全面管理和標準化的墊腳石,AFRL和TCO應記錄人為生成的技術配對,以彌補能力差距。

付費5元查看完整內容

本報告收集了為支持將固有曲面地球模型引入下一代巡航導彈(NGCM)高保真建模與仿真(M&S)工具而進行的分析結果。這些結果用于記錄已實施的算法,預計與其他電子戰應用有關。

我們引入固有曲面地球模型的技術方法的關鍵原則是:1)確定代碼庫中與地球表面有關的計算的位置;2)重構代碼庫,將這些計算遷移到一個新的地球表面軟件對象。在其他方面,這涉及到引入一個關鍵的概念區別:以前,基座標框架和地球表面是混在一起的(地球表面和基座標系統的X-Y平面是一樣的);我們的改變要求把基座標框架和地球表面作為不同的角色分開。

不同的地球表面對象的實現可以模擬不同的地球表面形狀。對于開發和測試,我們的計劃是按照以下策略推出這些對象:首先是平面地球,以保留傳統的行為;然后是球面地球,最簡單的曲面,以支持暴露和消除整個代碼庫中隱含的平地假設,同時受益于盡可能簡單的幾何算法;最后是扁球體,該類包括WGS84,但其許多算法明顯比球體的算法更復雜。

付費5元查看完整內容
北京阿比特科技有限公司