亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

這項研究是一個更大的項目的一部分,該項目專注于自然語言理解(NLU),開發搜索和導航領域的雙向人機對話系統。我們利用抽象意義表示(AMR)來捕捉和結構自然語言指令的語義內容,使其成為一個機器可讀的、有向的、a-循環的圖。在這項任務中,NLU面臨兩個關鍵的挑戰:1)如何有效地將AMR映射到特定領域內受限的機器人行動規范中;2)如何保留人類語言的一般理解的必要元素,以便我們的機器人可以將其能力擴展到單一領域之外。為了應對這些挑戰,我們建立了一個兩步的NLU方法,其中自動獲得的輸入語言的AMR圖被轉換成 "對話-AMR "圖,這是一個新版本的AMR,其中增加了時態、方面和語言行為信息。在這里,我們詳細介紹了基于規則和分類器的方法,將AMR圖轉化為Dialogue-AMR圖,從而彌合了從無約束的自然語言輸入到固定的機器人動作集的差距。

這個轉換系統是人類與機器人對話的兩步自然語言理解(NLU)管道的一部分。如圖1所示,第一步是以AMR圖的形式從無約束的語言輸入中捕捉核心語義,我們將其稱為 "標準-AMR"。第二步,特別是圖到圖(G2G)的轉換過程,將標準AMR圖轉換為對話AMR。對話-AMR包含對人與機器人交流和機器人執行至關重要的信息。

這個轉換系統旨在有效地自動產生用于人與機器人對話的對話-AMR,并擴展到也能從對話-AMR中受益的新領域,如Minecraft積木世界領域,其中對話的重點是在虛擬環境中用積木建造結構。

付費5元查看完整內容

相關內容

人工智能在軍事中可用于多項任務,例如目標識別、大數據處理、作戰系統、網絡安全、后勤運輸、戰爭醫療、威脅和安全監測以及戰斗模擬和訓練。

本文探討了德懷特-艾森豪威爾的盟軍司令部(AFHQ)在1942年夏季和秋季的創建情況,并尋求對任何聯合、整合、戰區級司令部在大規模戰爭早期階段所面臨困難的洞察力。雖然80年來,技術和實踐已經提高了迅速建立戰區司令部的能力,但AFHQ所面臨的關鍵挑戰仍然適用。一般來說,新的聯合特遣部隊(JTFs)將面臨與AFHQ必須克服的同樣的五個一般挑戰。

首先,AFHQ快速組建,使用了來自廣泛的現有組織人力。第二,該司令部同時為行動進行規劃和準備,并試圖填補其人員和建立管理其業務的程序。第三,它被嵌入一個已經運作的國家和雙邊協調結構中,該結構幾個月來一直在協調戰略和全球后勤。這個新的美英聯合參謀人員引發了對系統中每個機構的作用和責任的復雜重新評估。第四,AFHQ 繼承了現有計劃的廣度和深度,以及支持人員對與入侵西北非洲相關的作戰和后勤問題的分析,這些分析為指揮部提供了優勢和劣勢。最后,AFHQ需要為戰役建立并傳達一個分階段的指揮和控制(C2)概念,同時為參謀部的作戰和行政部分以及在每個領域內負責行動的部分指揮部確定內部責任和協調程序。無論美國和英國在戰區一級行使C2的模式有多好或多不完善,真正的挑戰是將它們合并成一個在大規模范圍內被理解和運作的系統。根據對2015年至2018年美國印太司令部(USINDOPACOM)內主要指揮所演習的觀察,本文得出結論,這五個因素仍然與未來的沖突有關,并可能適用于其他作戰司令部。

建立AFHQ

盡管美國和英國自1941年8月以來一直在討論對維希法國在非洲或大西洋島嶼的屬地進行聯合行動,但AFHQ發現自己正處于沖刺階段,要為司令部配備人員,敲定入侵北非(稱為火炬行動)所需的計劃細節,并在1942年7月至11月間組建入侵部隊。AFHQ的第一個關鍵部分,即英國第一軍,于1942年6月底成立。7月24-25日,英國和美國就火炬行動的一般條款達成一致。聯合參謀長會議(CCS)任命德懷特-艾森豪威爾(Dwight D. Eisenhower)為總指揮官,并指派他一個新的聯合參謀部來計劃和控制這次行動,計劃工作主要在倫敦進行。由美國陸軍參謀長喬治-C-馬歇爾(George C. Marshall)將軍提出的火炬計劃的最初條件性,幾乎立即被富蘭克林-D-羅斯福總統否決了,這使得為一個大型司令部配備人員的努力變得緊迫起來。8月4日,執行規劃小組首次在倫敦市中心的諾福克宮召開會議。美國準將阿爾弗雷德-格倫特(Alfred Gruenther)是這個小組的第一任主任,該小組由來自聯合行動司令部、英國第一軍和美國陸軍歐洲戰區(ETUSA)的12名規劃師組成。司令部于8月11日正式啟動,不到兩周后就召開了最早的計劃會議;英國首席行政官漢弗萊-蓋爾少將于1942年8月22日召開了他的第一次后勤協調會議。在接下來的幾周里,關鍵的美國人員不斷涌入指揮部,包括美國G4準將阿切勞斯-漢布倫和參謀長沃爾特-貝德爾-史密斯準將。在歐洲戰爭期間,史密斯一直是艾森豪威爾的參謀協調人。直到8月18日才被任命,AFHQ司令部美國部分的史密斯準將發現自己正處在一場競賽中,要在9月15日之前組建他的單位核心。

在第一年,AFHQ仍然是一個相對較小的組織。1942年11月中旬,它被授權擁有507名軍官、71名準尉和1,068名入伍士兵。如果這看起來是一個很大的數字,那么請記住,在11月24日之前,司令部分布在倫敦、直布羅陀和阿爾及爾,并且在戰爭期間幾乎一直保持著后方、主力和前線人員的足跡。為了了解每個地點的人員密度,11月5日公布的直布羅陀空軍總部工作人員名錄列出了大約140名個人和協調中心,其中有來自皇家海軍和皇家空軍的大型特遣隊,還有一個強大的聯合政治部門。很難確定在實地行動開始時有多少比例的授權職位被填補,但AFHQ在11月中旬至少有80%的官員和50%的人員總數。到12月中旬,AFHQ的整個G-3部門由31名軍官組成,主要集中在阿爾及爾。雖然在戰役開始時被認為是足夠的,但AFHQ的人員規模在整個1943年繼續擴大。此外,它還獲得了一些新的下屬組織,包括美國第五軍第18集團軍和美國陸軍北非戰區,它們的啟動部分是為了幫助AFHQ更好地處理其多樣化的任務和單位。

盡管接近滿員,但其人口的多語言性質和其美國成員的缺乏經驗阻礙了指揮部的效率。英國人員來自聯合行動總部、國民警衛隊、戰爭部、海軍部和空軍部。美國人員圍繞著ETUSA提供的核心凝聚在一起,ETUSA的血統可以追溯到特別觀察員小組,然后是美軍英倫三島部隊。(這些經驗豐富的人員得到了來自美國戰爭部作戰處、陸軍航空局和供應處(SOS)的增援。其他官員來自分散在美國各地的軍事單位和分配給空軍總部的人員。美國人中的關鍵人物幾乎互不相識(除非他們曾是同學),而且每個人都必須第一次就如何管理一個聯合總部達成一致。在諾福克總部常見的瘋狂的節奏和漫長的工作時間加速了將這群人凝聚成一個職能團隊的過程。

“有很多廚師的廚房”

盡管需要在壓縮的時間內從頭開始組建一個司令部,但AFHQ確實受益于為規劃火炬行動的前身所做的所有艱苦工作。但是,大量的預先存在的計劃和密切參與制定這些計劃的機構的數量也帶來了不利因素。首先,空軍總部的計劃人員必須掌握他們最高層的同行自1942年初以來一直在使用的一系列事實(在某些情況下發現錯誤)。其次,他們最終不僅要像其原始創造者一樣理解這些材料,而且還要超越他們,贏得對這一過程的所有權,并發展到詳細的機動和后勤支持計劃,并以精確的車隊時間表和包裝清單為支撐。

AFHQ最早面臨的挑戰之一是需要與已經存在的負責確定戰略和指導行動的國家機構建立工作關系。英國最高司令部比美國人有一個主要優勢:它已經建立了一個功能性的國家級聯合司令部。到1942年初,英國軍方有一個功能性的執行規劃機構,向參謀長委員會主席(1942年3月后為艾倫-弗朗西斯-布魯克將軍)負責,然后向作為國防部長的溫斯頓-丘吉爾負責。美國人在一個更松散的結構下運作,戰爭部和海軍部幾乎作為獨立機構運作。聯合參謀部的規劃人員--來自陸軍(包括陸軍航空隊)和海軍的五名軍官,他們監督著由六名規劃人員組成的聯合戰略委員會,指導著華盛頓發生的少量非正式協調和同步。這兩個組織成立于1942年3月,并很快加入了一個小型秘書處以及情報、軍事運輸、通信和其他專業委員會。退役海軍上將威廉-萊希(William Leahy)于7月加入團隊,擔任總統的參謀長,擔任陸軍和海軍總司令的角色。也許正如預期的那樣,在1942年下半年,負責充實和協調美國整體戰略的美國軍事組織規模小、新,而且相互之間有分歧。

與任何大型官僚機構一樣,美國陸軍部也不是一個統一的整體。作戰部成立于1942年3月,使用了從舊的作戰部和計劃部抽調的核心官員,由曾經制定過西半球駐軍和立即支持英國的人組成,并發表了"體操運動員行動 "及其在非洲和周邊地區的相關考察的初稿。他們仍然是華盛頓的聯合委員會和中央情報局輔助人員最合理的陸軍規劃對口單位,并且可以很容易地接觸到馬歇爾,從而對未來的行動保持堅定的控制。布雷洪-薩默維爾(Brehon Somervell)將軍的SOS負責海上運輸和海外美軍部隊的補給。它還負責決定向每個海外戰區司令部提供多大比例的服務部隊。如果艾森豪威爾認為ETOUSA和AFQH沒有得到他們公平的部隊或物資份額,他將不得不通過馬歇爾向薩默維爾提出。最后,西部和中部特遣部隊(這兩支部隊將直接從美國出發)的指揮官與倫敦和華盛頓的規劃人員不斷聯系,調整他們的登陸計劃、裝載計劃、增援和補給計劃--這些任務需要AFHQ、SOS、陸軍地面部隊和戰爭部工作人員之間的協調。

正如空軍總部必須努力與東海岸的半打獨立實體保持聯系一樣,它需要與東部特遣部隊的英國和美國部分及其相關的空軍和海軍部隊,以及將在戰區維持英國部隊的工業和供應機構進行類似的合作。相對較近的距離使協調更加容易,但也可能加強了英國對空軍總部的影響。雖然英國聯合規劃參謀部促進了AFHQ和英國中東司令部之間的初步接觸,但真正的整合可能要等到這兩個司令部在突尼斯或利比亞相互接近的時候。最后,ETUSA、AFHQ的美國后勤參謀和每個特遣部隊的部隊之間的關系必須得到理順。理論上,ETUSA在第三或第四支增援船隊離開英國(由美國陸軍北非戰區取代)后,很快就會解決自己的工作問題。然而,并不是每一個專業的后勤人員都同意這個概念,它幾乎沒有澄清誰在準備、安裝和立即補給從英國出發的入侵部隊的美國元素時負責什么。

前面的討論并不是說盟軍的C2有獨特的缺陷,也不是說對組織結構圖和報告計劃進行某種神奇的重新安排就能解決AFHQ所面臨的大部分問題。盡管人們幾乎都希望得到簡單的線路圖,但在歷史記錄中似乎從來沒有這樣的動物,特別是在聯合和聯合行動的情況下。AFHQ的例子說明的是,需要一個龐大的、良好的網絡化的工作人員,在一系列令人困惑的上級、同級和下級組織和工作人員之間同步進行活動。AFHQ不需要,也不可能將所有的計劃集中在自己的組織內。但它確實需要像所有這些其他實體一樣了解該計劃,并在確定優先事項、評估風險和確定如何實現其總體目標時擁有強有力的、甚至是決定性的聲音。作為圍繞 "體操 "和 "火炬 "行動的計劃工作的相對新成員,空軍總部發現這幾乎是不可能的,直到1943年1月下旬,艾森豪威爾的指揮部才開始取得這種主導地位。

計劃

1942年1月至4月,美國戰爭部的戰爭計劃司和當時的作戰司一直在與英國同行合作,為最終被命名為火炬的北非行動制定一個可接受的計劃。這份題為 "西北非洲戰場"、日期為1942年2月20日的陸軍部計劃似乎已經被廣泛分發,并且相對來說被在歐洲戰場工作的官員所熟知。該計劃包括一個龐大而詳細的基本命令和幾十個附件,用于每個協調和特別參謀部;整個文件有幾百頁長。這個早期版本的火炬計劃假定幾乎沒有來自法國人的抵抗,美國人在大西洋沿岸和英國人在阿爾及爾的半自主罷工,投入6個師(而不是最終版本中預計的13個師),以及足夠的當地平民勞動力來處理歐洲大陸的物資分配。中央情報局批準了盟軍的最終版本,其中包括4月6日的護航計劃草案,但似乎并沒有深入到美國的記錄中。如果一個美國參謀想掌握整體情況,每個部門將如何發揮其作用,以及對每個參謀和技術部門的詳細分析,這是最徹底和最容易獲得的資料。

第二套參考資料是AFHQ在8月9日和9月5日之間制定的三個計劃大綱。主要的癥結在于入侵的日期,各種登陸的數量和范圍,以及戰役的主要目標。英國人愿意接受更多的風險,優先考慮快速推進到突尼斯和在地中海的后續行動。馬歇爾優先考慮的是一種低風險的方法,重點是建立一支安全的阻擊部隊,以孤立西班牙摩洛哥。雙方都意識到,在這些幾乎相互排斥的優先事項之間需要有一些妥協,但在程度上無法達成一致。各種立場的相對優點在這里并不重要,重要的是艾森豪威爾和他的主要下屬在強迫達成解決方案方面是多么無能為力。即使到了8月下旬,艾森豪威爾、馬克-克拉克和喬治-S-巴頓基本上同意英國人的概念,他們也無法讓馬歇爾改變主意。羅斯福總統和丘吉爾首相不得不進行干預--只有羅斯福能迫使馬歇爾對英國人提出的關鍵性問題屈服。

最后,艾森豪威爾說服中央情報局將入侵行動推遲一個月,以便為三次全面進攻創造更多資源。盟國同意悄悄地達成一致意見,或者說忽略了迅速清除突尼斯與遏制任何可能到達西班牙摩洛哥的軸心國部隊的相對重要性這一未解決的問題。美國陸軍將使英國第一軍在阿爾及爾上岸,但隨后他們就得靠自己了。美國第五軍和第12航空隊將在西班牙摩洛哥的邊界集結,將任何投射到該地區的軸心國部隊裝入瓶中,也許還能保留在1943年春天執行圍獵行動的可能性。在整個8月,空軍總部的工作人員發現自己工作不足,而各種爭論在華盛頓和倫敦之間來回跳動。

一旦艾森豪威爾的C計劃大綱在9月5日公布,它就被發現只是一個大綱而已。但至少工作人員現在可以開始為這個框架添加細節。席卷參謀部的第一批危機之一是埃弗雷特-休斯準將宣布該計劃在后勤上是不可行的。這個消息讓陸軍部和薩默維爾的SOS陷入了困境;9月下旬,休斯一度向克拉克建議將火炬計劃的D日推遲一個多月至12月15日--克拉克拒絕對此建議采取行動。盡管薩默維爾和C.H.李少將在英國的SOS進行了瘋狂的努力,但大部分丟失和替換的裝備和儲備物資從未進入突擊部隊的手中。事后看來,這些問題與火炬計劃早期階段的失敗或成功無關,但從9月中旬到12月,這些問題卻讓負責該問題的后勤人員大為分心。

大約在艾森豪威爾向戰爭部提交他的綜合短缺清單的同時,他的工作人員開始意識到,整個護航船隊的裝載時間表是不現實的。在9月17日之前,規劃者們一直認為卸船和分散物資的泊位和人力的數量會限制部隊的集結。但到了月底,陸軍開始意識到真正的限制因素將是美國海軍要求的護衛隊與商船的比例。海軍愿意提供足夠的護衛隊來護送每個護航隊中的45艘慢船或20艘快船。物流人員認為有可能停泊和卸載55艘或25艘船,并相應地規劃了每個護航船隊的容量。沒有人能夠讓海軍提供更多的護衛或放松其護衛比例,所以計劃人員被派回重新制定每個護航隊的組成。

一貫的買單者是后勤能力--物資、運輸資產和服務部隊。規劃人員決定從作戰部隊中剝離幾乎所有的2.5噸卡車和吉普車,同時還削減了一般物資和彈藥的儲備量。美國人面臨更沉重的賬單,但英國第一軍也削減了服務部隊和貨運卡車。由于來自英國的慢速船隊需要大約2周的時間來航行和卸貨,而來自美國的船隊則需要25天,因此工作人員必須在部隊和物資的預期交付日期前3到5周就開始工作。面對緩慢演變的決策和關鍵規劃因素的重大變化,這樣一項任務的復雜性令人匪夷所思。光是跟上所有的變化就已經夠難的了,再去預測因此而需要做哪些不同的事情幾乎是不可能的。在許多情況下,從美國來的每個運輸隊到底裝了什么,然后運送到戰區,對空軍總部和美國陸軍部來說基本上是個謎。在這種情況下,設計和執行一個戰役計劃是極具挑戰性的。

如何操控戰區

對于1942年中期的美國陸軍來說,弄清楚如何在廣闊的距離上開展聯合行動是一種新的體驗。將部隊部署到海外是一回事,但美軍中沒有人有過將戰略和作戰后勤與戰區一級的海陸空交戰相結合的經驗。在《戰地手冊》(FM)100-15《戰地服務條例,較大的單位》和FM100-10《戰地服務條例,行政》中模糊地概述了這種努力的一般準則,但這些文件缺乏細節,而且內部充滿了不一致。英國人在中東司令部內慢慢破解了地中海地區的密碼,并在《運動手冊》中對遠征作戰的行為和后勤支持有一個很好的理論參考,但美國人似乎對從他們的經驗中學習同樣無知和抗拒。在北非的最初幾個月,利用陸軍航空隊的巨大潛力似乎特別困難。艾森豪威爾和空軍總部似乎有能力充分規劃三次孤立的兩棲攻擊,但對于如何最大限度地發揮空中和海上優勢以支持英國第一軍從阿爾及爾到突尼斯的行動,卻缺乏一個令人信服的概念。

萊曼-萊姆尼澤準將和空軍總部的工作人員清楚地了解1942年秋季司令部所面臨的問題的性質。G-3于9月22日分發了一份 "北非戰區組織 "的協調草案,旨在解釋AFHQ必須要做的事情,并就開展這項工作的最佳方式征求意見。核心要求是將AFHQ從一個計劃機構轉變為一個能夠在戰場上運作的組織。勒姆尼澤首先談到了行政狀況的復雜性--美國和英國管理后勤的人員安排根本不同,美國的海上交通線(SLOC)將回到紐約港,而對英國肯尼斯-安德森將軍的第一軍的補給將來自英國。讓勒姆尼策擔心的第二個主要問題是如何實現聯合部隊之間的協同作用:盟軍如何利用海軍力量和空軍力量來實現火炬的目標?

每個特遣部隊在突擊登陸期間都得到了自己的分散的空中支援,但一旦上岸,空軍總部需要更好的東西。萊姆尼澤設想了一個與空軍總部合署辦公的總體空軍指揮官和參謀部,可以指導集中的戰區空中戰役,這個概念對當時來說過于前衛,直到1943年2月中旬才被頒布。海軍將通過確保SLOC和沿其北翼向第一集團軍提供支持來作出貢獻。與阿爾及爾空軍總部合署辦公的空軍參謀部將為海軍部隊提供同步的地面空中支援。剩下的問題集中在協調的責任上--與非洲的維希政府,與華盛頓和倫敦的國家指揮和支持系統,以及與開羅的中東司令部。AFHQ將這樣做的責任留給了自己和所述的潛在方法。

AFHQ同時開始充實它對在倫敦、直布羅陀和阿爾及爾需要建立和調整其足跡的地點和時間的理解。到10月18日,萊姆尼澤制定了一個四階段的C2計劃,其中包括一個新的概念,即所謂的后方聯系,以及一個事情如何進行的總綱。該計劃不僅解決了現有通信方法的局限性,而且還增加了參謀部的規模和進入戰區的復雜性。只有少數領導人會坐飛機,其余的人在乘船前往直布羅陀或阿爾及爾的過程中會有長達14天的時間沒有時間。陸軍和海軍特遣部隊以及兩個空軍司令部面臨著類似的要求,為了幫助抵消控制權的喪失,空軍總部計劃在諾福克宮建立并維持一個綜合后方梯隊,在D-12之前從三個地面特遣部隊、兩個空軍司令部和海軍司令部抽調協調小組。艾森豪威爾將首先從直布羅陀,然后從阿爾及爾指揮當前的行動,而史密斯和蓋爾則利用在倫敦的龐大和關系良好的工作人員來處理計劃、協調和行政支持。隨著局勢的穩定和交通的暢通,大部分工作人員將轉移到阿爾及爾,只留下一小部分聯絡人員,與ETUSA和各部門、部門和部委就狹隘的后勤問題進行合作。雖然他盡量說得具體,但勒姆尼策承認,時間將取決于戰術發展。

AFHQ就這一主題發表的最后文件不僅澄清了早期文件的薄弱環節,而且還對倫尼策設想的一些更進步的想法進行了退步。一旦這三次進攻鞏固了他們的陣地,AFHQ就可以過渡到它的最終配置--一支美國部隊沿著西班牙摩洛哥的南部邊境列隊,以及一些在突尼斯為英國工作的混合部隊。每支部隊都將有自己的軍隊、支持性空中指揮部和后方維持組織。AFHQ將作為兩個地區司令部和支持性海軍部隊之間的行政裁判,為分配給第12航空隊的轟炸機發布目標優先級,并與維希政府的殘余勢力合作,以維持民事控制并確保對盟軍努力的勞工和運輸支持。似乎空軍總部已經放棄了對海軍資產進行任何直接控制的嘗試,而屈從于兩個自主的地區分司令部,每個分司令部都有自己獨特的目標和目的。該戰役的概念除了決定將哪些美軍置于安德森的控制之下之外,幾乎沒有讓空軍總部在行動領域做什么;《第30號行動備忘錄》描述了一個指揮部,該指揮部將裁決區域司令部和海軍之間的物資分配,而其他方面則很少。這是一份淡化了的文件,幾乎沒有兌現一個月前萊姆尼澤關于如何通過決定性地控制聯軍的陸、海、空要素來實現協同作用的思考所暗示的承諾。

過去就是現在(和未來)

人們可能會問,這種對空軍總部早期困境的總結在今天有什么意義。美國軍隊有常設作戰司令部、軍種部門以及與每個責任區有正式和非正式聯系的戰術和行動單位。當然,圍繞著AFHQ的組建所發生的混亂并不能與USINDOPACOM或美國歐洲司令部在未來的危機中所面臨的情況進行有效的比較。我在2015年至2018年期間在原美國太平洋司令部的個人經歷表明了這一點。

細節可能值得商榷,但有經驗的人都會承認,USINDOPACOM沒有足夠的工作人員來處理重大危機期間的行動速度和范圍。它需要時間和大量的增援人員和文職人員來按照職能重新配置各部門。最終,指揮部將考慮建立一個聯合特遣部隊來承擔部分增加的工作量。在這樣一個緊張的時期,如何整合新的人員和組織是演習中涉及到的問題,但沒有掌握。USINDOPACOM究竟如何與華盛頓的所有適用機構及其同行指揮部互動,也在一些演習中進行了練習,但可以說這些活動從來沒有讓參與者全神貫注超過幾天的時間。另一個復雜的因素是增加關鍵盟友和合作伙伴的指揮節點--僅出于分類的原因,在訓練中從未完全復制過。

在沖突的頭幾周,美國國防部作戰司令部所面臨的時間緊縮會使空軍總部的情況看起來很平常。一場小風波,或者一些看起來只是年度重大演習的另一次常規迭代的事情,可能會在幾周內,甚至幾天內演變成一場重大的戰區戰爭。這一現實的好處是,人們明白他們必須準備好用他們已有的團隊和結構戰斗幾個星期,直到援軍到來和建立一個聯合特遣隊的選擇出現。但是,執行建立一個新的聯合特遣部隊的方案,需要有一本厚厚的指導手冊,說明新的總部如何運作以及它與現有組織的關系。

與空軍總部一樣,在太平洋地區工作的參謀可以接觸到大量預先存在的計劃--也許比任何一個組織能夠完全消化的都多。一方面,有太多的適用文件;另一方面,這些文件似乎很少能達到人們希望的詳細程度。同樣,練習有助于充實這些概念,并形成產品歸檔以備將來使用,但確切的條件總是與預期略有不同。在許多情況下,歷史上結盟的組織、新加入的團隊以及眾多的盟友和伙伴將如何為現有的戰斗節奏和C2流程做出貢獻,以理解、完善和執行這些計劃,這一點仍然是模糊的。

本文沒有猜測太平洋或東歐的現代危機中的指揮和控制,而是著手比較詳細地描述艾森豪威爾的盟軍總部在1942年秋天所面臨問題的性質。這種方法的好處是能夠比較詳細地研究發生了什么,而不是推測可能發生什么。它還表明,歷史案例研究可以幫助我們比我們最初想象的更徹底地解決未來的問題集。AFHQ所面臨的一些關鍵挑戰在今天同樣適用,甚至更適用,而其他的挑戰則無關緊要或相對容易,除非自愿決定成立一個新的指揮部。將急于在壓縮的時間內整合一個新的團隊,同時計劃和開展行動。沒有一個新的組織在開始時是一塵不染的--概念、計劃和行動偏好在其創建之前就已存在。新的團隊必須掌握這一背景,同時試圖改變其中的一些。這些任務的難度由于需要界定因引入新的行為者而中斷的內部和外部關系和職責而變得更加復雜。本文列舉了AFHQ所面臨的一系列歷史挑戰,以擴大我們思考如何最好地指揮和控制一場聯合戰役的能力,而不是暗示一種解決方案將適合所有問題。

付費5元查看完整內容

本報告是在 FA9453-19-1-0078 資助下編寫的。首先,提出了兩種數值方法來解決通信和導航中產生的非線性優化問題。其次,開發了兩個關于機器學習模型的解決方案質量和安全性的結果。

該研究項目的目標是開發高效的大規模非線性優化算法,以解決通信和導航方面的數據分析問題。這些問題被公認為在數學上具有挑戰性,并與空軍的利益直接相關。

在資助期間,我們成功研究了兩個研究方向。首先,我們設計了大規模非線性優化問題的最佳一階方法。在這個方向上,我們提出了兩個一階方法,可以對決策變量進行近似梯度更新。這兩種方法都可以解決分散通信的多Agent優化所產生的非線性優化問題。通過將多代理優化重新表述為約束性問題,我們開發的方法可以以最佳梯度/操作者評估復雜度來解決問題。我們開發的方法也可用于解決圖像重建問題。

第二,我們分析了機器學習模型中的解決方案質量和安全問題。在這個方向上,我們完成了兩個研究結果。我們的第一個成果是關于在多集群環境下,從二元結果的條件邏輯回歸模型中計算出來的估計值的屬性。我們表明,當每個單獨的數據點被無限次復制時,來自該模型的條件最大似然估計值漸進地接近最大似然估計值。我們的第二個結果是關于安全的矩陣乘法問題,我們設計了一種準確和安全地進行分布式矩陣乘法的方法。我們的安全協議可以確保在進行這種矩陣乘法的通信過程中沒有任何信息被泄露。

付費5元查看完整內容

內聚力是團隊的一個重要屬性,它可以影響個人隊友和團隊成果。然而,在包括自主系統作為隊友的團隊中,內聚力是一個未被充分探索的話題。我們研究了關于人類團隊內聚力的現有文獻,然后在此基礎上推進對人類-自主系統團隊的內聚力的理解,包括相似性和差異性。我們描述了團隊的內聚力,各種定義、因素、維度以及相關的好處和壞處。我們討論了當團隊包括一個自主性的隊友時,該元素可能會受到怎樣的影響,并進行了逐一描述。最后,我們確定了可能與內聚力有關的人類-自主性互動的具體因素,然后闡述了對推進有效的人類-自主性團隊的科學至關重要的未來研究問題。

付費5元查看完整內容

美陸軍的現代化優先事項包括開發增強現實和虛擬現實(AR/VR)模擬,以增加兵團和士兵的準備。美國陸軍工程研究與發展中心(ERDC)對AR/VR技術的使用在軍事和民用工程項目任務領域也在增長。ERDC海岸和水力實驗室(CHL)已經開發了一個艦船模擬器,用于評估世界各地的海灣渠道;然而,目前的模擬器在近岸海岸地區幾乎沒有物理真實性(圖1)。因此,ERDC團隊正在研究推進艦船模擬的機會,以提供未來的艦船模擬器(SSoF)。SSoF將配備一個VR模式,并將通過攝取Boussinesq型波浪模型的預計算輸出來更準確地解決近岸波浪現象。SSoF應用的最初原型是用于研究和開發目的;然而,所采用的技術將適用于其他學科和項目范圍,包括合成訓練環境(STE)和未來版本的船舶和海岸結構設計。

付費5元查看完整內容

在DARPA終身學習機器(L2M)計劃下,Teledyne著手研究、實施和展示算法方法,以解決兩個關鍵問題。首先,使智能體能夠自我監督,以便在沒有外部干預的情況下適應和學習復雜環境。為了解決這個問題,Teledyne開發并驗證了不確定性跟蹤和調制的作用,使智能體能夠監測自己的性能,并在適當的條件下自信地進行調整。這是一個重大的突破,因為它展示了具身智能體的自我監督學習和任務表現。第二個問題是實現強大的知識表示,盡管不斷地學習和適應,但仍能保持準確,并能適應學習多種任務的復雜性,對知識的粒度和組成可能有不同的要求。Teledyne開發并實施了一個分層學習系統,能夠將任務信息分解到多個層次,以最大限度地提高魯棒性和重復使用。這是一個重大突破,因為它使一類新的學習系統能夠保持一致的知識庫,并對其進行更新以適應多個任務,而不要求它們共享一個統一的表述。由此產生的算法被證明在最先進的機器學習系統中具有提升性能的作用,因此可以被納入許多現今的人工智能解決方案中,使其具備終身的能力。一個關鍵的建議是尋找機會將這些能力過渡到現有的人工智能系統中,從而促進它們向下一波人工智能過渡。另一個建議是將這些成就視為闡明終身學習機制的第一步,并參與持續研究,以更充分地了解如何在高度復雜的環境和條件下實現學習。 這些可能會迫使我們更仔細地研究建立、維護和利用分層知識表示的更完整的解決方案。

圖 1. 分層機器學習系統中選擇可塑性架構

報告總結

1.1 項目計劃概述

在DARPA終身學習機(L2M)計劃下,Teledyne進行了兩個階段的努力,開發能夠選擇性可塑性的機器學習系統。我們的努力解決了終身學習系統所面臨的兩個關鍵挑戰:(1)對其參數進行持續而穩定的學習,以及(2)如何實現最佳能力分配,以便在任務和條件發生變化時獲得有效的學習和性能。我們的核心前提是,大腦通過神經調節來解決這兩個問題:持續調節神經活動和可塑性的化學信號。具體來說,我們研究了神經調節劑乙酰膽堿(ACh)調節長期突觸可塑性和短期突觸活動的機制,特別是在進行物體識別和鑒定的視覺通路(腹側)。我們的目標是ACh作為編碼信號處理和推理中不確定性水平的反饋信號的作用;我們探討了這一信號如何調節低層次感覺特征的計算和選擇,同時也推動了高層次推理的學習。

這些調節原則構成了我們新穎的、可塑結點網絡(PNN)架構的核心。我們的PNN有一個層次結構,反映了大腦腹側通路的兩階段組織,這也是其他感覺通路所共有的,如聽覺和視覺定位(背側)通路。圖1提供了分層機器學習系統中選擇性可塑性的架構的高層次概述,其中異質層被引入以實現連續的動態,以支持早期層的最佳特征提取和容量分配,同時在后期層實現穩定和連續的學習。以下括號中的數字是指圖1中的橙色數字。調控是由不確定性的措施驅動的(1)。通過分析信號(自下而上)和任務要求/獎勵(自上而下)得出的不確定性被用來(2)影響早期層的特征提取/選擇和后期層的推理。早期各層調制的結果是快速招募網絡能力的特定部分(3),而在后期各層,學習被更強烈地調制,以確保穩定性,同時為新的或更新的任務保持適當的可塑性(4):網絡的早期各層進行特征提取(反映枕葉皮層),而后期各層計算推斷(匹配前額葉和顳葉皮層過程)。一個類似ACH的信號(測量不確定性)動態地調節著網絡的計算和學習。我們的網絡是異質的:不同層次和類型的節點對調制信號的反應不同。

1.2 普遍方法

終身學習需要不斷地適應;無論多少訓練都不能使一個網絡,無論是生物還是人工的,為它在其一生中可能收到的所有輸入做好準備。特別是,持續的學習需要有能力改變網絡的參數而不忘記先前的信息(即穩定的學習,也被稱為穩定性-可塑性困境[1])。此外,終身學習系統還面臨著第二個困境:持續編碼新信息的能力需要大量的計算資源,但由于自由參數的數量巨大,非常大的網絡是難以優化的。圖2說明了深度學習架構情況下的擴展限制。正在進行的研究[2]表明,無論用多少數據來訓練深度學習網絡,都無法擴展到任意大小。特別是,我們在DARPA的TRACE項目下進行的內部實驗表明,一旦一個深度網絡超過了最佳規模(圖2中的[a]),其學習能力就會隨著規模的擴大而急劇下降(圖2中的[b])。這意味著,僅僅建立更大的深度網絡并向其提供更多的數據,并不足以實現人類水平的學習。相比之下,我們的調制網絡只招募其節點的一小部分來優化容量(a),同時攜帶大的整體容量(b),使其能夠克服這個擴展限制。相比之下,終身學習系統必須以更智能的方式管理其計算資源,以實現最佳的容量分配和緩解性能下降。

圖 2. 深度學習擴展限制

1.2.1 理論工作

我們的基本前提是,大腦通過神經調節來實現這兩種能力:利用化學信號不斷調節突觸活動和可塑性。在神經系統中的許多神經調節劑中,乙酰膽堿是哺乳動物大腦中研究最廣泛的一種;它被認為與調節幾種高水平的認知功能有關,包括注意力、學習和記憶。更重要的是,ACh調節長期突觸可塑性和短期神經活動水平,特別是在腹側視覺通路(進行物體識別和鑒定)[2]。乙酰膽堿已被證明可以編碼不確定性,特別是預期的不確定性[3](以及相關的意外獎勵信號[4]),這是觸發和調節學習的一個關鍵反饋信號。特別是在腹腔通路中,乙酰膽堿調節著低層次感覺特征的計算,并驅動著更高層次推理的學習。

作為我們努力的一部分,我們開發了一個分層的、異質的、可塑性結點網絡(PNN)算法,稱為不確定性調節學習(UML),其中基于神經調節的計算特性使網絡的能力得到優化,以允許適應性和穩定性學習(圖3)。UML是根據大腦皮層的分層感覺信號分解和推理機制、反饋注意以及對不匹配的期望進行的神經調控來建模的。在UML中,一個類似ACh的信號(由測量的不確定性觸發)動態地調節著計算和學習。UML在機器學習方面實現了幾個突破性的能力,具體而言:

  • 穩定的學習,允許最大限度的更新,而不干擾現有的學習行為(即解決穩定-可塑性的困境)。

    • 與自上而下的反饋相結合,使輸入和任務的連續和少量的學習與以前學到的信息完全不同
  • 最佳的能力分配,只選擇和加強那些最大限度地提高信息含量和與當前任務相關的特征。

    • 當網絡被配置為分層學習時,導致多種計算動機的共存(即UML可以在不同的任務或行為之間復用)。

    • 以及每次有選擇地招募網絡的不同子集,允許它擴展到任意數量的節點(即幾乎沒有學習新信息的能力)。

UML代表了本地異質結構、反饋信號和神經調節作用的一個引人注目的新計算模型。

圖 3. Teledyne 在 L2M 階段 1 期間開發的 UML 算法

1.2.2 實驗和示范工作

我們的工作展示了算法和一個具有學習機制的集成系統,能夠在復雜的學習任務中進行終身學習。此外,我們證明了我們的UML算法能夠賦予其他機器學習算法以適應能力,在沒有災難性遺忘的情況下進行學習,并在非正常情況下恢復性能。這些結果的總結將在第1.3節介紹。

在該計劃的第二階段,Teledyne領導了一個系統組(SG),目標是整合一整套終身學習能力。為實現這一目標,Teledyne定義了一套最低限度的相關能力,并與我們的不確定性調制的持續學習范式保持一致(圖4,也見第2.2.1節)。該計劃第一階段的兩名L2M執行者被邀請加入我們的SG,他們是加州大學歐文分校,與加州大學圣地亞哥分校(UCI/UCSD)和密蘇里科技大學(S&T)的研究人員合作。在整個第一階段,Teledyne開發并演示了感官信號處理算法,該算法采用自下而上的信號分解架構來推斷與目標和決策有關的假設(圖4中的橙色和藍色塊)。此外,Teledyne開始展示使用注意力機制來調節學習和適應。S&T被招募來利用他們在這個算法系列中的經驗,共同實現一個受大腦自上而下注意力機制啟發的系統組件(圖4中綠色/黃色塊)。在與UCI/UCSD的合作中,我們著手研究睡眠啟發算法在任務執行后優化記憶和跨任務鞏固記憶(即知識)的作用(圖4中分別為洋紅色和青色塊)。

圖 4. 基于 SG 成員開發的類腦機制集成的關鍵 L2M 功能

1.3 成果概述

我們提出的方法的關鍵前提是,智能生物體測量和識別其環境、輸入、約束或目標的關鍵變化,以使它們能夠適應和學習而不需要外部指導(如教師、監督等)。正是通過這種自我監督的監測和評估,一個終身學習的智能體可以在復雜和變化的條件下具備可靠的功能。

通過我們的研究和實驗工作,我們確定了在生物智能系統中,測量和跟蹤不確定性是觸發適應和學習的關鍵機制。我們的L2M智能體被證明可以適應他們所學的技能或將新的技能納入他們的劇目,而不會出現災難性的遺忘。我們還證明了智能體有能力利用以前的技能來提高學習效率(前向和后向轉移),在存在干擾任務或條件變化的情況下快速恢復性能,利用樣本來適應或獲得技能,其效率與單一任務專家相同或更好(見4.1-4.4節)。

最后,Teledyne通過在整個項目第二階段進行的一系列里程碑式的實驗,證明了其綜合系統的有效性。這些結果將在第4.5節中介紹,并強調了在計劃定義的場景中L2M指標的性能。這些實驗有助于在所有L2M SG團隊之間建立穩定的節奏和協調的結果,并記錄性能方面的進展。此外,我們還利用這些實驗來確定我們的系統和/或算法的成功和缺點。對后者的分析被用來優化我們的工作,并適當地關注系統和算法的發展。結果是我們的系統在四個里程碑事件的過程中不斷改進,從第一次事件中只達到一個指標,到第四次事件中達到所有五個指標。這些結果也在第5.0節中進行了總結。

1.4 主要結論與建議

我們在整個項目中的工作完成了其主要目標:

  • 從神經調節的生物機制中得到啟發,得出一個有效的算法

  • 實現一種對現有機器學習系統具有廣泛適用性的算法

  • 使得智能體能夠自我監督,不斷適應和學習

  • 整合一個表現出注意力、基于不確定性的調節、分層學習和睡眠啟發的記憶優化機制的系統,以展示終身學習能力

我們工作的一個重要成就是開發了UML,一個新穎的終身學習算法,能夠自我監督以適應新的條件,從少數樣本中學習,并得出穩健的分層知識表示。最近一個令人振奮的認識是,我們著手研究并在最初提案中提出的關鍵能力(見表1)不僅完全實現,而且在整個計劃的所有實驗和演示中得到了徹底的證明。

表 1. Teledyne 方法的特點和優勢

特點 優勢
不確定性調控學習:我們認為,神經調控可以上調對解決兩個或多個類別之間的區別至關重要的神經元的學習。 證明新任務的學習表示不會覆蓋以前學習的任務。
不確定性調控容量分配:我們建議研究神經調控在上調網絡部分的激活和學習中的作用,這些部分可以最佳地解決特定任務并抑制那些無助于減少不確定性的部分。 構建具有非常大容量的網絡來支持終身學習,同時不會因為只激活網絡中最能支持任務性能的部分而導致準確性下降。
不確定性觸發新學習:通過跟蹤預期,新算法可以隨著時間的推移調整和改進其性能,尤其是在引入新任務或條件時。 展示了當響應確定性低于所需閾值時如何觸發學習,從而導致系統能夠自主檢測需要學習的新任務或條件。
不確定性調控特征提取:跨特征層的信號不確定性測量驅動早期層(特征提取器)中傳遞函數的調控。 實施的算法能夠適應特征提取處理以補償任務、條件或信號屬性的變化。

在第18個月(M18)的評估中,Teledyne SG顯示的結果表明,我們的終身學習者在五個項目指標中達到或超過了終身學習的門檻,在五個指標中的兩個指標超過了目標。這在第4.5.1節表11中顯示,淺綠色表示某項指標超過了終身學習門檻,深綠色表示某項指標超過了DARPA計劃目標。

我們從努力中得到的一個重要啟示是,不確定性已經被證明是一個有效的措施,它支持在線學習和創建強大的知識表征,而不需要監督或強化信號。我們還確定,我們開發的L2組件可以有效地集成到現有的ML系統中,以支持提高性能(例如,魯棒性、適應性等)。因此,存在大量的過渡機會(例子在第2.4節中討論)。Teledyne將繼續通過政府資助的工作、商業努力和內部資助的研究活動來尋求此類機會。Teledyne 也歡迎任何政府機構或個人要求進行討論,以促進對過渡機會的深入了解或識別。

我們的UML算法被證明是一個有效的組件(第2.3節),不僅適用于一個綜合的L2系統,而且可以作為現有機器學習系統的插件。其中包括為決策支持而設計的端到端系統,UML可以監測超出常規的條件或標記需要額外樣本或學習的條件。UML還被證明可以支持像基于強化學習的智能體那樣復雜的系統在新條件下的性能恢復。由于其輕量級的處理要求,UML可以在一個商品處理器(CPU)上以2000Hz的速度執行,因此適合在許多平臺上部署。

付費5元查看完整內容

美國陸軍最近制定了一項關于未來陸軍如何作戰的戰略以及實現這些軍事能力的相關現代化和研究重點。以高超音速飛行為基礎的遠程精確射擊對于確保美國能夠對任何競爭對手實施其意志至關重要。要實現一個有效的未來美國軍隊,必須克服許多障礙。其中一些差距是對高超音速飛行器空氣熱力學的理解,從而促使對基礎研究的需求。本報告的目標是定義一個經典的、與陸軍相關的配置,適合于基礎研究,以允許與適當的主題專家的關鍵數量的集中合作。從這種開放的幾何構型研究中獲得的數據和知識可能會受到更多的限制性分配

美國陸軍最近制定了一項關于未來陸軍如何作戰的戰略以及實現這些軍事能力的相關現代化和研究重點。以高超音速飛行為基礎的遠程精確射擊對于確保美國能夠對任何競爭對手實施其意志至關重要。

要實現一個有效的未來美國軍隊,必須克服許多障礙。其中一些差距是對高超音速飛行器空氣熱力學的理解,從而促使對基礎性研究的需求。缺乏對高超音速飛行器周圍發生的復雜物理和化學的預測性知識,抑制了及時的、優化的多部件設計。對邊界層過渡和沖擊-邊界層相互作用等具體現象了解不多。不能正確地對現象進行建模,會產生一些不確定的特征,如表面壓力分布和熱通量,這對飛行器技術,包括穩定性、控制和熱負荷管理,都有負面影響。

幸運的是,有一個先例,即通過定義政府基準飛行器來促進全社會的科學討論,這些飛行器包含功能相關的工件,但對具體的發展計劃不敏感(見陸軍-海軍基本芬納導彈、空軍改良基本芬納導彈、陸軍-海軍旋轉火箭、國家航空航天飛機和NASA研究)。本報告的目標是定義一個典型的、與軍隊相關的配置,適合于基礎研究,以便與足夠數量的適當的主題專家進行重點合作。從這個開放的幾何構型的研究中獲得的數據和知識可能會受到更多的限制性分配。

付費5元查看完整內容

1. 簡介

機器學習(ML),從廣義上講,是一類自動優化參數以處理給定輸入并產生所需輸出的計算機算法。ML的一個經典例子是線性回歸,據此找到一條最適合(通過)一組點的線。最近的一個例子是分類任務,如用 "貓 "這樣的單字來標記一張百萬像素的圖像。

對于許多應用,ML完成了人類可以做得同樣好的任務。然而,ML在兩種情況下大放異彩:1)任務的數量巨大,例如數百萬;2)問題的維度超出了人類思維的理解。一個簡單的例子是同時實時監控成千上萬的安全攝像頭,尋找可疑的行為。也許一個ML方法可以發現異常事件,并只與人類觀察者分享這些視頻片段。更好的是,異常圖像可以被暫時貼上諸如 "1號入口處的蒙面入侵者 "之類的標簽,以幫助保安人員只關注相關的信息。

除了減少人類的負擔外,ML還可以將人類可能無法識別的復雜的相互聯系拼湊起來。例如,一個ML算法可以發現,在一百萬個銀行賬戶中,有五個賬戶的交易似乎是同步的,盡管它們沒有相互發送或接收資金,也沒有向共同的第三方發送或接收資金。

鑒于手持和固定設備的計算資源不斷增加,我們有必要想象一下,ML可以在哪些方面改變戰爭的打法。當然,ML已經對美國陸軍的科學研究產生了影響,但我們也可以很容易地想象到自主車輛和改進的監視等作戰應用。

本文件的主要目標是激勵美國陸軍和美國防部的人員思考ML可能帶來的結果,以及為實現這些結果,哪些研究投資可能是有成效的

5. 使用機器學習的ARL研究

在ARL的許多研究項目中,機器學習目前正在被使用,或者可以被使用。我們列出了一些使用ML或可能從ML中受益的研究項目。我們列出的與ML相關的ARL研究工作絕非完整。

6. 軍隊作戰應用

雖然從技術上講,機器學習自19世紀初高斯發明線性回歸以來就一直存在,但我們相信,ML的最新進展將以我們目前無法想象的方式影響軍隊。在本節中,我們概述了我們認為將得到加強的軍隊行動的許多領域,以及可能采用的ML方法的種類。

6.1 軍事情報

軍事情報包括信息收集和分析,因為它涉及到指揮官做出最佳決策所需的信息。由于收集的數據量越來越大,處理必須自動化。需要考慮的主要問題是數據的數量、速度、真實性和多樣性。大量的數據(又稱大數據)需要在許多計算節點上對數據進行智能分配。速度要求快速計算和網絡連接到數據流。真實性是對信息來源和異常檢測的信任問題。多樣性相當于使用許多不同的ML算法的不同訓練模型的應用。我們在本小節中概述了不同類型的數據和分析要求。

6.1.1 自然語言處理

讓計算機從從各種媒體來源收集到的大型文本數據庫中提煉出重要的概念和文本部分,有很大的好處。最近報道的另一個ML突破是不同語言之間的精確文本翻譯。 軍隊的一個獨特挑戰是翻譯不常見的語言,因此專業翻譯人員較少。在人工通用智能(AGI)領域,一些團體聲稱,自然語言處理將是類似人類認知的基礎。

6.1.2 數據挖掘

鑒于人類、傳感器和代理產生的數據的激增,一個很大的問題是,除了證明其收集的直接用途之外,這些數據還包含什么剩余價值。數據挖掘可以是統計學和機器學習的努力,以發現數據中的模式,否則人類操作者就會錯過。

6.1.3 異常檢測

傳統上,異常檢測是通過首先識別已知數據的群組和描述數據的分布來進行的。然后,當新的輸入被處理時,它們被識別為屬于或不屬于原始分布。如果它們在已知分布之外,就被認為是異常的。以下許多類型的異常檢測系統可能對軍隊有用。

  • 網絡入侵檢測:超出常規的網絡流量。McPAD和PAYL是目前使用的軟件中的2個這樣的例子,它們使用了異常檢測。

  • 生活模式異常:人們的視覺和生物統計學上的行為方式與常人不同,表明他們可能正在進行一些對抗性行動。

  • 基于條件的維護:在當前生命周期中,材料/系統在其年齡段不典型的信號。

  • 士兵異常:有理由相信士兵的生物識別技術不正常。

  • 異物檢測:在已知物資數據庫中無法識別的物體的視覺效果。

6.2 自主性

6.2.1 自動目標識別

自動目標識別(ATR)是一個非常成熟的領域,已經使用機器學習幾十年了。

1)目前深度學習的進展將在多大程度上增強ATR?

2)更復雜的算法是否需要更復雜/更耗電的機載計算?

  1. ML是否能對目標的各種欺騙性的混淆行為具有魯棒性?

  2. 強化學習在多大程度上可以用來進行實時軌跡調整?

6.2.2 機器人學

機器學習在機器人學中的應用也是一個巨大的領域。ML應用領域包括傳感、導航、運動和決策。目前,傳感將從計算機視覺的所有進展中受益。導航,除了使用標準的GPS之外,還可以從自我運動中受益,也就是基于自身感知的運動估計。運動可以被學習,而不是規劃,這不僅會導致更快的開發時間,而且還能在新的環境或受損的模式下重新適應(例如,失去四條腿中的一條)。最后,隨著機器人的數量超過人類操作員的數量,機器人將有必要自行決定如何執行其規定的任務。它將不得不做出這樣的決定:"由于電池電量不足,我是否要回到大本營?"或者 "我是否繼續前進一點,然后自我毀滅?"

6.2.3 自愈性

除了機器人技術,人們最終希望任何系統在損壞或不能滿負荷工作時能夠自我糾正。這需要在某種程度上的智能,以自主診斷缺陷和問題,并利用其可用的資源糾正這些問題。

6.2.4 倫理

在通過機器學習來學習自主權的情況下,問題將是:"自主系統將如何應對X情況?" 這里的問題是,對于一個擁有潛在致命武力的系統,我們怎么能確定它只會正確合法地使用武力?我們推測,在機器學習的算法擁有使用致命武力的實際能力之前,必須對其進行廣泛的測試,即使它與人類的環形決策相聯系。

6.3 通過玩游戲來訓練智能代理

近年來,大量的研究都在研究使用機器學習來自主地玩各種視頻游戲。在某些情況下,報告的算法現在已經超過了人類玩游戲的水平。在其他情況下,仍然存在著處理長期記憶的挑戰。對于美國空軍來說,智能代理已經成功地在以戰斗為中心的飛行模擬器上進行了訓練,這些模擬器密切模仿現實生活。陸軍的問題包括以下內容。

  • 智能代理能否附加到機器人平臺上?

  • 智能在多大程度上可以通用于處理現實生活與視頻游戲中遇到的各種情況?

  • 當我們可能不理解一個訓練有素的代理的邏輯時,我們能相信它的行動嗎?

  • 代理在多大程度上能夠與人類合作?

6.4 網絡安全

在過去的十年里,機器學習在網絡安全方面發揮了不可或缺的作用。具體來說,ML可以用于異常檢測,檢測已知威脅的特定模式,并辨別網絡行為是否可能由惡意代理產生。隨著該領域的不斷加強,問題是ML是否能使安全比對手領先一步,因為對手可能利用ML來混淆檢測。

6.5 預測和結構健康監測

一個長期的設想是,軍隊使用的每一個機械系統都有一些關于系統當前和預測健康的內部感應。相關問題如下。

  • 我們能從有限的傳感器中辨別出一個系統或系統組件的當前健康狀況嗎?

  • 機載ML能否預測一個系統或系統部件在暴露于特定環境或彈道侮辱之后的健康狀況?

6.6 健康/生物信息學

6.6.1 序列挖掘

隨著基因組序列的數量繼續呈指數級增長,比較在現場獲得的序列所需的計算工作可能變得無法管理。機器學習可以通過對序列進行不同層次的分類來減少必要的比較。

6.6.2 醫學診斷

93 近年來,機器學習已經在檢測各種組織中的惡性腫瘤方面取得了長足的進步。94 它同樣可以被用來描述創傷或創傷后應激障礙(PTSD)95,并制定治療計劃。

6.7 分析

陸軍的一個重要組成部分集中在對行動、系統、研究和測試的分析上。傳統上,分析人員使用大量的工具,包括機器學習,以多維回歸、聚類和降維的形式。隨著深度學習的出現,一套新的工具應該是可能的,可以更有效地處理需要更復雜模型的大型數據集。例如,應該有可能從測試期間拍攝的視頻流中提取特征和物理屬性,這可能超過目前的標準做法。

6.8 機器學習的其他用途

  • 自適應用戶界面(AUI)和情感計算。ML可以用來確定用戶的心理和/或情緒狀態,并提供適合這種狀態的界面。此外,可變的AUI可以服務于用戶的變化。例如,一些用戶可能喜歡音頻反饋而不是視覺反饋。

  • 推薦系統。最流行的推薦系統之一是根據以前看過的電影的評分來選擇用戶想看的下一部電影(例如,所謂的 "Netflix問題")。對于軍隊來說,可以根據以前的使用情況和庫存核算的反饋來推薦后勤補給的情況。

  • 搜索引擎/信息檢索。傳統上,搜索引擎返回文件的 "點擊率"。新的范式是以簡明的形式回答用戶的問題,而不是簡單的模式匹配。

  • 情感分析。社交媒體上的流量和對環境進行訓練的各種傳感器不僅可以檢測關鍵的關鍵詞或特定物體的存在,還可以推斷出可能的攻擊的可能性。

  • 有針對性的宣傳。傳統上,宣傳是通過散發傳單來完成的,如今,宣傳可以通過社交媒體來傳播。ML的角度是如何以最有說服力的信息向正確的人口群體進行宣傳。此外,重要的是快速檢測和顛覆來自對手針對我們自己的人員/人民的宣傳。

7. 機器學習的研究差距

本研究的目標之一是確定當前研究中的差距,這些差距可能會限制ML在軍隊研究和行動中的全部潛力。本節借用了ARL運動科學家Brian Henz博士和Tien Pham博士(未發表)的戰略規劃工作。

7.1 如何將軍隊的數據/問題納入當前的方法中

傳統上,在一個特定領域采用ML的一半戰斗是弄清楚如何適應現有的工具和算法。對于陸軍所面臨的許多問題來說,這一點更為突出,與其他學術、商業或政府用途相比,這些問題可能是獨一無二的。任何數據分析員面臨的第一個問題是使數據適應他們想要使用的統計或ML模型。并非所有的數據都使用連續變量或者是一個時間序列。離散/標簽數據的管理可能非常棘手,因為標簽可能不容易被轉換成數學上的東西。在自然語言處理中的一個例子是,單詞經常被轉換為高維的單熱向量。另一個例子可能是如何將大量的維修報告轉換為對某一特定車輛在一段時間內的表現的預測。

此外,陸軍的要求超出了典型的商業部門的使用范圍,不僅需要檢測物體和人,還需要檢測他們的意圖和姿態。這將需要開發新的模型。另一個大的要求是可解釋性,正如DARPA最近的一個項目所概述的那樣:是什么因素導致ML算法做出一個特定的決定?在一個真實的事件中,如果一個ML算法在沒有人類驗證的情況下宣布一個重要目標的存在,我們能相信這一決定嗎?

7.2 高性能計算

隨著對計算要求高的ML任務的設想,開發人員正在使用多線程、并行和異構架構(GPU、多核)來加快計算速度。ML的分布式實現遠不如GPU版本常見,因為分布式計算中的節點間通信存在固有的網絡瓶頸,而且在單精度浮點性能方面,GPU相對于CPU有很大優勢。除了目前對GPU的強烈依賴,生物啟發式神經計算旨在尋找非馮-諾伊曼架構來更有效地執行ML,并可能更快。這方面的一個例子是IBM的神經形態芯片。97 未來的研究應該關注如何分配ML處理,使節點之間的網絡通信最小化。另外,像聚類這樣的無監督學習算法在多大程度上可以被映射到神經網絡中?

其他需要考慮的事情。

  • 目前的ML軟件(特定的神經網絡)在一個小型的GPU集群中表現最好。

  • 大多數基于非神經網絡的ML算法的并行性不高,或者根本就沒有并行。

  • 另一個軍隊的具體挑戰是分析基本上沒有標記的數據集(例如,用無監督學習)。手動標注集群將是一種半監督學習的形式。

7.3 獨特的尺寸、重量、功率、時間和網絡限制因素

隨著進入偏遠地區或任何遠離基地的地區,軍隊必須限制系統的尺寸、重量和功率。此外,在 "激烈的戰斗 "中,時間是關鍵。例如,人們不能在遭到槍擊時等待作戰模擬的完成。最后,在其他商業發射器占主導地位的地區,或者在限制無線電通信以提高隱蔽性的情況下,網絡帶寬可能會受到很大限制。

在這種倍受限制的環境中,機器學習將需要有效地進行,而且往往是以一種孤立的方式進行。截然相反的條件是使用大型數據庫訓練大型神經網絡,這往往是最先進的機器學習功力的情況。商業部門正在開發自動駕駛汽車,據推測將使用低功耗的計算設備(如現場可編程門陣列、移動GPU)進行自主駕駛、道路/障礙物檢測和導航。然而,陸軍將有更多的要求,包括自主傳感器和執行器、態勢感知/理解、與人類的通信/合作,以及廣泛的戰場設備。這將需要多幾個因素的計算能力和特定算法的硬件,以實現最佳的小型化和低功耗。

7.4 用雜亂的或欺騙性的數據訓練/評估模型

在混亂的環境中,操作環境預計會有比通常密度更高的靜態和動態物體。此外,人們完全期待主動欺騙以避免被發現。我們也希望能夠開發出足夠強大的算法,至少能夠意識到欺騙,并相應地調低其確定性估計。

7.5 用小的和稀疏的數據訓練一個模型

基于CNN的目標分類的突破可以部分歸功于每個物體類別的成千上萬個例子的可用性。在軍隊場景中,某些人和物體的數據可能是有限的。人們最終將需要one-hot99或multishot分類器,其中幾個有代表性的數據條目就足以學習一個新的類別。到目前為止,最好的選擇是 "知識轉移",通過調整以前訓練的模型的所有參數的子集來學習新的類別。我們的想法是,由于需要優化的參數較少,修改這些參數所需的數據也較少。

7.6 專門針對軍隊相關目標的訓練模型

即使對于我們可以產生大量圖像的目標類別(例如,友好物體),我們也需要訓練自己的模型,以便從每個類別的潛在的數千張圖像中識別軍隊相關類別。軍隊還使用商業車輛中通常不存在的其他傳感模式(例如,熱能和雷達)。因此,需要為這些非典型的傳感設備訓練模型。從根本上說,非典型傳感設備可能需要新的神經網絡拓撲結構以達到最佳的準確性和緊湊性。

7.7 將物理學納入推理中

一個值得研究的有趣領域是將模型和模擬與機器學習相結合。有很多方法可以做到這一點。例如,ML可以用來推導出模擬的起始參數。此外,ML還可以用來處理模擬的輸出。一個耐人尋味的新領域是開發基于物理學或類似物理學的模擬,使用類似ML的模型/方程。一個這樣的應用是預測 "如果?"的情景。例如,"如果我跑過這棵樹呢?接下來會發生什么?"

7.8 軟人工智能

機器學習在傳統上被認為是人工智能的硬性(即數學)表現形式。有可能最終,所有的人工智能任務都會被簡化為數學。然而,就目前而言,一些智能任務似乎更多的是基于推理或情感。對于之前描述的方法中的任務,ML并不能充分解決以下軟性人工智能的特點。

7.8.1 類似人類的推理

人類并不總是完全按邏輯推理,但他們也有能力將不完整的信息拼湊起來,做出 "最佳猜測 "的決定。幾十年來,對這種行為進行編碼一直是一個挑戰。

7.8.2 情感

情緒似乎是驅動人類達到某些目的的動機/目標功能。例如,快樂可能會導致不活動或追求生產性的創造力。另一方面,恐懼則可能會導致忍氣吞聲。計算機是否需要情感來更有效地運作,還是說它們最好擁有100%的客觀性?這既是一個哲學問題,也是一個未來的研究方向。不過現在,毫無疑問的是,在人與代理人的團隊合作中,計算機需要準確地解釋人類的情感,以實現最佳的團體結果。

7.8.3 社會交流

與人類的互動性是陸軍研究未來的首要關注點。一個類似的問題是,不同的計算機系統之間如何進行交流,而這些系統不一定是由同一個實驗室設計的。研究的一個領域是用計算機來教那些在這方面有困難的人進行社會交流。 再一次,對于人與代理的合作,代理將需要能夠參與社會互動,并在人類的陪伴下遵守社會規范。

7.8.4 創造性

創造力通常被認為是隨機合并的想法,與新的元素相結合,由一個鑒別功能決定新創造的項目的功能和/或美學。在某些方面,創造力已經被某些計算機實驗室所證明。例如,為了設計的目的,計算機可以被賦予某些方面的創造力。

7.8.5 通用智能

人工智能的最終目標是將許多狹義的智能算法合并成一個統一的智能,就像人類的頭腦一樣。75鑒于許多狹義的人工智能任務已經比人類的某些任務要好,即使是早期的所謂人工通用智能(AGI)也可能具有一些超人的能力。AGI的一個主要目標是將目前由人類執行的某些任務自動化。

7.8.6 人工超級智能

如果不提及許多哲學家的猜測,機器學習將最終能夠改進自己的編程,導致能力的指數級提高,也許會遠遠超過人類智能,那么機器學習的研究就不完整了。這些設想既是烏托邦式的104,也是烏托邦式的105。希望超級智能能夠解決世界上的許多問題。

8.結論

在這項工作中,我們回顧了機器學習的不同類別,并描述了一些更常用的方法。然后,我們指出了一小部分關于ML在ARL中的應用的例子。最后,我們預測了ML在未來可以應用于軍隊的各個領域,并概述了為實現這一結果需要解決的一些挑戰。我們希望這份文件能夠激勵未來的研究人員和決策者繼續投資于研究和開發,以充分利用ML來幫助推動美國陸軍的發展。

付費5元查看完整內容

這項工作的目的是開發能夠成功處理復雜動態環境中順序決策的深度終身學習方法,重點是多Agent情報、監視和偵察(ISR)場景。我們為深度卷積神經網絡開發了一個新的架構,支持通過去卷積因子化的終身學習(DF-CNN),探索了通過Distral和Sobolev訓練的策略提煉的組合,并開發了一個混合控制器,將深度學習應用于ISR智能體。我們的方法在標準基準深度學習數據集、DOOM環境和ATE3模擬環境中的ISR場景中進行了評估。

我們的主要貢獻是反卷積因子卷積神經網絡(DFCNN)。DF-CNN框架調整了標準卷積神經網絡(CNN)框架,以實現任務之間的轉移。它在每個CNN層維護一個共享知識庫,并通過這個共享知識促進不同任務的CNN之間的轉移。每個具體任務的CNN模型的各個過濾層都是由這個共享知識庫重建的,隨著網絡在多個任務中的訓練,這個知識庫會隨著時間的推移而調整。DF-CNN代表了ELLA終身學習框架對深度網絡的概括。

實驗表明,DF-CNN在終身中的基準識別任務上的表現優于其他方法(包括單任務學習、低層的硬參數共享和漸進式神經網絡)。此外,該框架能夠抵抗災難性遺忘,同時仍然允許從未來的學習中反向轉移到以前學習的模型。

對于深度強化學習,我們研究了將Sobolev訓練整合到Distral多任務框架中,以努力改善轉移和訓練,探索了DF-CNN在深度RL中的應用,并開發了一個混合控制器,將本地學習的深度RL策略結合在一起,在ATE3仿真環境中完成ISR場景。

付費5元查看完整內容
北京阿比特科技有限公司