亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

摘要

近年來,得益于神經網絡技術特別是注意力深度學習模型的突破,自然語言處理取得了許多令人矚目的成就。然而,自動化的法律文字處理仍然是自然語言處理的一個困難分支。法律句子通常很長并且包含復雜的法律術語。因此,適用于一般文件的模型在處理法律文件時仍然面臨挑戰。我們已經通過我們在這項工作中的實驗驗證了這個問題的存在。在本論文中,我們選擇性地介紹了在自動法律文件處理中改進注意力神經網絡的主要成果。語言模型往往會變得越來越大,但是,如果沒有專家知識,這些模型仍然可能無法適應領域,尤其是對于法律等專業領域。

本論文的三個主要任務是實現改進法律文件處理中注意力模型。首先,我們調查并驗證了在法律等特定領域運行時影響模型性能的因素。這項調查旨在為改進該領域的模型提供更清晰的見解。其次,由于預訓練語言模型是最近自然語言處理中最眾所周知的專注方法,我們提供了創建特定于法律領域的語言模型方法,從而在可靠的數據集上產生最先進的結果。這些模型建立在法律文件數據的特征之上,旨在克服我們之前調查中發現的挑戰。第三,除了讓模型完全從原始數據中學習的方法外,我們提出并證明了使用不同的知識源以不同的方式注入模型以調整其輸出的有效性。這種方法不僅增加了可解釋性,還允許人類控制預訓練的語言模型,并利用該領域發展過程中可用的知識資源,如詞匯、語法、邏輯和法律。

關鍵詞:法律文本處理、注意力神經網絡、深度法律、預訓練語言模型、知識注入

第1章 引言

1.1 引言

法律文件的自動化處理是當今信息社會的迫切需求。除了社交媒體的便利性,我們在這些平臺上的行為可能涉及或導致許多法律效力。Twitter禁止美國前總統唐納德·特朗普在其平臺[57]上發表言論,以及特斯拉不得不雇傭員工來控制其董事長埃隆·馬斯克言論的法律風險,這些都是證明這一現象的典型例子。然而,由于社會和技術原因,自動法律處理系統的質量尚未滿足社會需求。

就社會原因而言,計算機科學是近幾年才取得顯著成果,而法律是國家建國以來數百年來一直依附于人們的領域。規律與人類的發展并存,是長期存在的,對技術沒有任何關聯。此外,法律和計算機科學都是沒有太多共同點的專業學科。因此,計算機科學在法律上的應用可能需要很長時間才能取得突破。

由于技術原因,句子通常很長并且具有復雜的語義結構。人類甚至很難在一讀時理解法律句子的確切含義。在英國、美國、加拿大等國家,法院必須在普通法體系中發揮解釋作用;德國、日本、越南等國民法系需要的指導性文件。此外,法律文件是用自然語言編寫的,這種交流方式并非旨在確保正確性。自然語言中的歧義可能成為任何智能系統的障礙,甚至對人類也是如此。尤其是在具有多層含義的語言中(如漢語、日語、越南語),通過句子理解確切的含義是一個更困難的問題。此外,法律領域使用的詞匯與人們日常交流的詞匯并不完全一致。因此,它可以被認為是我們語言中的一種特殊子語言。

隨著硬件計算能力的增長,深度學習,尤其是注意力模型已經在自然語言處理的許多不同任務中證明了它們的能力。使用這種方法的系統可以很好地執行諸如語音識別、問答和語言生成等精細任務。鑒于這些成就,我們可以期待使用深度學習模型來處理法律領域中更復雜的語言任務。在本論文中,我們選擇性地報告了我們在提高深度學習的性能和可解釋性方面的研究成果,特別是在處理法律文本中的注意力模型(我們簡稱為深度法律處理)。由于法律語言不同于日常語言,因此我們需要對此類數據采取適當的方法。除了性能的提高,論文還為讀者提供了深度法律處理的信息特征。

遷移學習和預訓練的注意力模型是領域適應的魯棒方法。然而,在法律等專業領域,如果不了解領域和數據,這些模型很難產生好的結果。因此,詳細研究將深度學習應用于法律文本處理的可能性和方法對于該領域自動化的發展是有用的信息。本論文將回答的三個主要研究問題包括:

1.哪些因素會影響僅使用提供數據訓練的端到端深度學習模型執行法律文件處理任務的性能?

2.預訓練語言模型已成為深度學習的強大方法之一。法律文本中的哪些特征可用于實施這些模式的成功實例?

3.如何利用現有的知識源注入深度學習模型以獲得更好的性能?可以獲得哪些知識?

為了回答這些問題,我們做出假設并在特定問題中進行測試。對于每個問題,我們提出方法、進行實驗、觀察、分析實驗結果并得出結論。

1.2 動機

1.2.1 深層法律制度的因素分析

本研究的第一個動機是了解影響深層法律制度的因素,并在這些理解的基礎上提出適當的改進。開展本論文中介紹的工作,我們專注于提高深度法律模型的性能和顯性。深度學習模型通常被認為是黑箱,只要有足夠的數據,它們就會達到預期的效果。即便如此,在日常生活的所有領域都很難滿足足夠數據的假設。因此,分析深度法律的特征有助于我們更有效地使用數據。本論文還傳達了有關深度學習模型在法律領域可以執行哪些任務以及在什么條件下表現良好的信息。這項工作也可以被視為提高深度法律模型的可解釋性的努力,這對于將這些模型帶入現實生活中的應用至關重要。

了解可能影響域中系統的因素是良好設計的重要要求。法律領域的數據特征是數據碎片化、法律句子長、專業術語多。因此,我們選擇詳細研究數據量、數據表示方式以及處理數據的模型架構等因素。對于數據量因素,我們在數據有限的問題上進行實驗,提出增加數據的解決方案,并在新環境中比較結果。為了理解數據表示的影響,我們提出了一種方法來評估一般和法律領域中的不同嵌入方法。關于模型架構,我們比較了不同架構在同一個問題上的表現。實驗結果表明,與具有普通架構的預訓練繁瑣語言模型相比,注意力CNN 網絡具有明顯的優勢。

1.2.2 用于深度法律處理的預訓練語言模型

我們的第二個動機是驗證預訓練語言模型在法律領域的能力。近年來,預訓練語言模型得到了普及,并在自然語言處理的各種問題上取得了許多突破。順應這一趨勢,我們為深度法律任務設計了預訓練的語言模型。除了性能(評估模型的重要因素)之外,我們在設計模型時還關注哲學。引入的模型是從影響我們調查的深度法律模型的因素中得出的觀察結果。預訓練的語言模型通常包含訓練數據中存在的偏差,因此通常在非常不同的領域表現不佳。幸運的是,對于法律領域,我們可以利用該領域的數據屬性來訓練或調整這些模型的權重。

從觀察數據表示在法律領域的重要性出發,我們提出了一種名為 BERTLaw 的預訓練語言模型,該模型使用大量法律數據從頭開始訓練。除了在我們的實驗中取得了很好的結果外,這個模型還幫助我們確認了數據表示的重要性。擁有良好的數據表示是強大的深層法律體系的先決條件。除了 BERTLaw 之外,我們還引入了 Paralaw 和 Paraformer,這些模型基于預訓練的語言模型,克服了數據量和模型架構限制的問題。

1.2.3 深度法律模型的知識注入

我們的第三個動機是執行和利用法律和語言知識資源來提高深度法律模型的性能。深度學習模型可以從數據中學習并在廣泛的任務中展示其有效性。但是,僅依靠數據具有三個缺點。首先,模型的質量取決于數據的質量。當非專業用戶過于依賴數據時,這可能很危險。其次,人類將不太可能參與決策過程。這可能導致智能系統濫用權力。第三,這些系統被認為是黑盒,調試它們非常困難。因此,我們研究并提出將知識注入深度學習模型的方法,以指導這些模型的學習和生成過程。

對于語言知識,我們介紹了 HYDRA,這是一種架構,允許單獨訓練 Transformer 模型的注意力頭,然后將它們移植到原始身體上。這種方法可以提高培訓和存儲的成本效益。對于法律知識,我們嘗試了解法律句子的邏輯部分。我們使用一種特殊的機制將這些知識注入到 Transformer 模型的不同層中。最后,利用法律領域的語言生成模型,我們提出了一種利用公平知識來規范該系統輸出的方法。這些發現是使用其他類型的知識資源來改進未來的深度法律模型的基礎。

1.3 貢獻

論文主要有三個價值:性能改進、方法論、理論。首先,本論文中提出的系統都比現有成果具有更好的性能。其中一些在可靠的數據集上取得了最先進的結果。其次,系統的性能改進都是基于對實驗結果的觀察而設計的方法。我們不僅解釋了每章中提出的方法,還概述了構建它們的過程。第三,本論文各部分的結論和討論對于深度法律模型的設計具有理論基礎價值。

圖1.1:論文中提到、分析和解決的主要問題。

論文的主要貢獻包括發現和解決了法律領域深度學習系統的4個常見問題,即數據缺失、領域差異、內容冗長和學習不受控制,如圖1.1所示。除了非架構解決方案外,本文提出的模型都利用了注意力機制。論文還表明,如果沒有適當的方法,注意力模型的力量可能會被浪費。這在注意力CNN、預訓練語言模型和 Paraformer 部分中得到了特別證明。

為此,我們提供了有關法律文本處理中注意力神經網絡的定性和定量信息。我們提出了不同的方法來利用法律文本和補充知識的特征,不僅可以提高這些模型的性能,還可以提高它們的可解釋性。此外,我們提出了定制神經網絡中注意力架構的方法,以實現更好的設計。通過對注意力網絡不同程度的干預以注入專家知識的詳細解釋,本論文也可以作為一個很好的技術參考文檔,供可能關注的人參考。

這項研究可能有助于科學和實踐意義。論文在其內容中提供了深度學習在法律文本處理和相關方面的全貌。此外,本文還將介紹每個深度學習模型中最重要的嵌入方法、訓練任務和架構設計。從實踐的角度來看,這項研究的結果可能有助于將深度學習中最先進的技術引入法律領域。本文檔對于在法律領域尋求深度學習模型的可解釋性但不僅將其用作黑盒的研究人員非常有用。可解釋性是深層法律制度被批準在現實生活中運作的先決條件。

1.4 論文大綱

本論文的目的是分析和改進當前使用深度學習模型處理法律文件的最新技術。首先,我們分析了將端到端深度學習模型應用于法律處理問題的不同方面。通過這樣做,我們獲得了清晰的洞察力,可以為每個特定條件設計有效的模型。其次,我們提出了在法律領域預訓練語言模型以提高其性能的新方法。第三,我們設計了使用專家知識來支持模型在法律領域進行更好的學習和預測的方法。

圖 1.2:論文大綱

論文的大綱如圖 1.2 所示。首先,我們要確認深度學習模型執行法律任務的能力,這通常需要專業知識。我們分析了數據表示、數據量和深度學習模型架構的影響。這一確認是探索深度法律處理知識的第一步。之后,我們進一步發現法律數據的哪些特征可用于預訓練強法律語言模型,這是最近在自然語言處理中取得許多良好成果的多頭注意力網絡家族。在回答這個問題時,會涉及到法律嵌入、法律多語言能力和法律結構表示。最后,我們研究了將知識注入神經網絡以獲得該領域模型的性能和可解釋性的可能性。研究語言知識、法律知識和自學知識來回答這個問題。

在回答研究問題之前,我們在第 1 章專門介紹了研究目標、挑戰以及我們進行這項研究的動機,第 2 章介紹了深度學習、注意力機制和多頭注意力模型的基本知識[62]。在撰寫本文時,這些技術具有很大的影響力。這些知識不僅為讀者閱讀下一章提供了基礎,而且有助于闡明研究的背景。這些技術將來可能會過時并被取代。但是,論文的哲學和方法論仍然具有參考價值。此外,我們還介紹了法律文件的特點、法律文件與日常文本的區別、挑戰和深度學習處理法律文件的優勢。

第 3 章回答了第一個研究問題。我們詳細研究了影響深度學習模型的因素,例如數據表示、數據量和模型架構。在我們對深度學習架構的研究中,我們發現了非常簡單的架構,例如 SCNN [44],它的參數數量很少,仍然可以勝過其他模型。有趣的是,我們還發現 CNN [35] 架構和注意力機制 [33] 的簡單組合在某些特定情況下可以提供比龐大模型更好的結果。本章將回答端到端模型在什么條件下可以在法律文本處理任務中表現良好的問題。

下一個研究問題將在第 4 章中回答。近年來,語言模型已成為深度學習中的一種強大方法。這些模型經過大量數據的預訓練,能夠理解語言并在基準數據中的任務上表現出色。與傳統的 NLP 方法相比,BERT [23]、GPT-3 [13] 和 BART [37] 等模型在 NLP 方面取得了突破。這些模型利用了遷移學習的思想,學習一項任務可以改善另一項任務的結果。許多研究表明,組合和交織任務可以提高模型的效率。在我們的研究中,我們提出了預訓練語言模型的新方法。在法律領域,我們提出的模型(如 BERTLaw [48]、ParaLaw [46])利用組織者提供的標準數據集證明了它們在 COLIEE 2020 和 COLIEE 2021 比賽中的有效性。使用端到端模型(如果垃圾輸入,則垃圾輸出),因此擁有適當的訓練方法對于構建高質量的深度學習模型非常重要。

第 5 章回答了最終的研究問題。除了傳統的訓練和預訓練-微調范式之外,還有第三種方法,知識注入 [47]。這種方法是利用專家知識來支持學習模型和決策。我們可以直接將專家知識以信號的形式輸入模型,而不是向模型提供數據以便它自己學習關系。該方法有助于解決稀疏、含噪的數據問題,并利用專家知識訓練深度學習模型。這種專業知識可以是語言特征或語義特征的形式。通過我們的實驗,我們證明將這種專家知識注入神經網絡將提高模型的性能。此外,這種方法還有助于提高深度學習模型的可問責性和可調試性。

論文的最終目標是展示我們在改進法律文本處理中注意力神經網絡的道路上的工作。第 3 章和第 4 章的內容是我們參與 COLIEE 的結果和觀察。第 5 章介紹了初步研究,試圖增強注意力神經網絡的可解釋性,注意力神經網絡被認為是黑盒子。盡管這項工作做得很細致,但實驗中可能存在盲點,對結果的解釋可能存在偏差。因此,在每項工作中,我們不僅將性能量化為數字,而且對實驗結果進行了更深入的分析。在每一章的最后,我們總結了該章的要點和相關的討論。我們的最終討論和結論將在第 6 章中介紹。本章使讀者能夠理解我們的貢獻,將其視為改進法律文本處理中注意力模型的連貫工作。最后但同樣重要的是,我們概述了可以擴大范圍并將這項研究提升到實際應用的未來方向。

付費5元查看完整內容

相關內容

人工智能還用于法律研究、案例預測、法律分析、訴訟策略、提供法律咨詢、采購、合規和合同審查。

移動設備的迅速普及以及移動應用和服務的日益普及,對移動和無線網絡基礎設施提出了前所未有的要求。即將到來的5G系統正在不斷發展,以支持爆炸式的移動流量、實時提取細粒度分析和敏捷管理網絡資源,從而最大限度地提高用戶體驗。隨著移動環境日益復雜、異構和演進,完成這些任務是具有挑戰性的。一個潛在的解決方案是求助于先進的機器學習技術,以幫助管理數據量和算法驅動的應用的增長。最近深度學習的成功為解決這一領域的問題提供了強大的新工具。在本文中,我們通過對這兩個領域的交叉研究的全面調研,彌合了深度學習和移動和無線網絡研究之間的差距。我們首先簡要介紹深度學習技術的基本背景和最新進展,以及在網絡中的潛在應用。然后,我們討論了幾種有助于在移動系統上高效部署深度學習的技術和平臺。隨后,我們對基于深度學習的移動和無線網絡研究進行了百科全書式的回顧,并將其劃分為不同的領域。根據我們的經驗,我們討論了如何根據移動環境定制深度學習。我們通過明確當前的挑戰和打開未來的研究方向來完成這項調研。

與互聯網連接的移動設備正滲透到個人生活、工作和娛樂的方方面面。越來越多的智能手機和越來越多樣化的應用程序的出現引發了移動數據流量的激增。事實上,最新的行業預測表明,到2021年,全球每年的IP流量消耗將達到3.3 zettabytes (1015 MB),同年智能手機流量將超過PC流量[1]。鑒于用戶偏好向無線連接的轉變,當前的移動基礎設施面臨著巨大的容量需求。為了應對這一日益增長的需求,早期的努力建議靈活地提供資源[2],并分配地解決移動性管理[3]。但從長遠來看,互聯網服務提供商(isp)必須開發智能的異構架構和工具,以衍生第5代移動系統(5G),并逐步滿足更嚴格的終端用戶應用需求[4],[5]。

移動網絡結構的日益多樣化和復雜性使得對眾多網絡要素的監控和管理變得非常困難。因此,在未來的移動網絡中嵌入多用途的機器智能正引起空前的研究興趣。這一趨勢反映在基于機器學習(ML)的問題解決方案中,從無線電訪問技術(RAT)選擇[8]到惡意軟件檢測[9],以及支持機器學習實踐的網絡系統的開發(如[10],[11])。ML允許系統地從交通數據中挖掘有價值的信息,并自動發現相關關系,否則人類專家將無法提取這些相關關系。深度學習作為機器學習的旗艦,在計算機視覺[13]和自然語言處理(NLP)[14]等領域取得了令人矚目的成績。網絡研究人員也開始認識到深度學習的力量和重要性,并正在探索其解決特定于移動網絡領域[15]、[16]問題的潛力。

將深度學習嵌入5G移動和無線網絡是有充分理由的。特別是,移動環境產生的數據越來越異構,因為這些數據通常從不同的來源收集,具有不同的格式,并表現出復雜的相關性[17]。因此,對于傳統的機器學習工具(如淺神經網絡)來說,一系列特定的問題變得過于困難或不切實際。這是因為(i)如果提供更多的數據[18],它們的性能不會提高;(ii)它們無法處理控制問題[19]中的高維度狀態/操作空間。相比之下,大數據促進了深度學習的性能,因為它消除了領域專業知識,而使用層次特征提取。本質上,這意味著可以高效地提取信息,并且可以從數據中獲得越來越抽象的相關性,同時減少預處理工作。基于圖形處理單元(GPU)的并行計算進一步使深度學習在毫秒內做出推斷。這有助于提高網絡分析和管理的準確性和及時性,克服了傳統數學技術(如凸優化、博弈論、元啟發式)的運行時間限制。

盡管移動網絡領域對深度學習的興趣日益增長,但現有的貢獻分散在不同的研究領域,缺乏全面的綜述。這篇文章填補了深度學習和移動和無線網絡之間的空白,通過呈現位于這兩個領域之間的交叉點的最新研究調研。除了回顧最相關的文獻,我們還討論了各種深度學習架構的關鍵利弊,并概述了深度學習模型選擇策略,以解決移動網絡問題。我們進一步研究了針對單個移動網絡任務定制深度學習的方法,以在復雜環境中獲得最佳性能。我們總結了這篇論文,指出了未來的研究方向和重要的問題,仍然沒有解決和值得追求的深度神經網絡。我們的最終目標是為打算使用深度學習來解決感興趣的問題的網絡研究者和實踐者提供一個明確的指南。

本綜述的目的是在移動網絡領域提供最先進的深度學習實踐的全面觀點。通過這一點,我們旨在回答以下關鍵問題:

  1. 為什么深度學習在解決移動網絡問題上很有前景?
  2. 與移動和無線網絡相關的前沿深度學習模型有哪些?
  3. 深度學習在移動網絡領域最新的成功應用有哪些?
  4. 研究人員如何針對特定的移動網絡問題定制深度學習?
  5. 哪些是最重要且最有前景的值得進一步研究的方向?

我們之前提到的研究論文和書籍只能部分回答這些問題。這篇文章超越了之前的這些工作,特別關注深度學習和移動網絡之間的交叉。我們涵蓋了一系列神經網絡(NN)結構,這些結構越來越重要,在早期教程中沒有明確討論,例如[77]。這包括自動編碼器和生成式對抗網絡。與這些現有的教程不同,我們還回顧了用于部署和訓練神經網絡的開源庫,一系列優化算法,以及在大量移動設備上并行化神經網絡模型和訓練。我們還會調研其他相關綜述中沒有涉及的應用,包括流量/用戶分析、安全和隱私、移動健康等。雖然我們的主要范圍仍然是移動網絡領域,但為了完整起見,我們也討論了深度學習在無線網絡中的應用,并確定了與這些領域密切相關的新興應用領域。我們區分了移動網絡和無線網絡,移動網絡指的是設備是便攜式的、電池供電的、潛在的可穿戴的,并且經常連接到蜂窩基礎設施;無線網絡指的是設備大多是固定的,是分布式基礎設施(包括wlan和WSNs)的一部分,并服務于單個應用。總的來說,我們的論文從以下幾個方面區別于之前的綜述:

(i) 我們特別關注深度學習在移動網絡分析和管理中的應用,而不是廣泛討論深度學習方法(如[20]、[21])或圍繞單個應用領域,如特定平臺[17]的移動大數據分析

(ii) 我們從移動網絡的角度討論前沿的深度學習技術(如[78],[79]),重點關注它們在該領域的適用性,而較少關注可能過時的傳統深度學習模型

(iii) 我們分析現有的非聯網問題與移動網絡特有問題之間的相似性;基于此分析,我們提出了最佳深度學習架構選擇策略和適應方法,從而利用移動網絡的特點進行分析和管理任務

據我們所知,這是第一次從深度學習的角度共同回顧移動網絡分析和管理。我們還首次提供了深度學習如何針對移動網絡問題的見解。

深度學習驅動的移動和無線網絡

付費5元查看完整內容

摘要

雖然人工智能應用于法律領域是一個起源于上個世紀的話題,但人工智能最近的進展使其發生了革命性的變化。本工作概述和背景介紹了自然語言處理領域的主要進展,以及這些進展如何被用于進一步發展法律文本分析的現狀。

1. 引言

世界上每個國家的內部運作都建立在一個復雜的司法系統之上。例如,在葡萄牙,《葡萄牙官方公報》(Di′ario da Rep′ublica)是公布葡萄牙共和國所有法律和規范的場所。目前有150多萬項法律法規在實施,每個月有1000多項新的法律法規在DRE上發表。這個在線資源提供了訪問葡萄牙所有立法的途徑,以及讓公民找到他們所需要的法律和規范的服務。

鑒于公民擁有的權利和必須遵守的義務,這類信息對所有公民來說都很容易獲得,這一點顯然很重要。在訪問立法搜索時,由于使用的語言級別,一些公民可能很難找到搜索結果。普通市民通常使用自然語言(NL)來引入搜索查詢。問題在于,法律和法律規范包含的語言——盡管在技術上屬于非母語——使用了專門的術語和句子結構。即使是簡單的搜索也會遇到雙重障礙。一方面,系統必須理解用戶的查詢,并將其與正確的法規聯系起來。另一方面,由于格式的原因,返回的文本不容易被普通用戶理解。

法律文本、規范、程序和論證的邏輯特征表明,形式邏輯可以作為代表法律規則和情境事實的模型。因此,根據規則對事實的應用,可以幫助公民進行推理。但是,要使這個系統發揮作用,我們前面提到的“自然語言障礙”必須克服。首先,有必要將法律規范從NL翻譯成某種與機器兼容的語義或邏輯表示形式。由于NL和法律語言的一些特性,這個困難成為了一個真正的障礙。然后,還必須將用戶查詢從NL轉換為語義或邏輯表示。最后,在系統完成邏輯推理后,“自然語言障礙”必須進行第三次換位,為外行人生成用戶友好的解釋或程序描述。自然語言處理的革命性進展最近改變了這一局面,創造了可擴展的方法來分析大型文本語料庫。它們也已開始應用于法律領域,為跨越上述障礙開辟了新的途徑。許多困難和未決問題仍然存在,但似乎在未來幾年內,我們將能夠創造新的工具,開發創新的應用,以幫助公民與法律互動。

本文對人工智能和法律領域、自然語言處理(NLP)及其在法律領域的應用現狀進行了概述、情境化和分析,目的是確定如何最好地利用最近的進展來改善由DRE提供給用戶的搜索服務。本文檔組織如下。在下一節中,我們將簡要概述人工智能應用于法律領域的子領域。在第三部分,NLP的深度學習進展,我們將介紹NLP的深度學習的最新進展。語義表示部分概述了語義表示語言和自然語言處理中的語義信息提取。之后,我們將討論NLP(探索新的進展和語義表示語言的使用)在與法律領域相關的任務中的新應用,如法律信息檢索和規范提取。

2. 人工智能和法律

應用于法律領域的兩種傳統人工智能方法,要么是以邏輯為基礎,要么以數據為中心。基于邏輯的方法植根于像[3]這樣的先驅的工作,但是第一次將其應用于真正的法律,像英國國家法案[52]的規則的形式化,是在80年代制定的。以數據為中心的方法在法律領域的應用也始于20世紀80年代,以基于案例的推理HYPO系統[4]為例。該制度的目標是在先例的基礎上建立推理模式,引用過去的案例作為法律結論的理由。

2.1基于邏輯的方法

圖1顯示了基于會話邏輯的法律推理系統的體系結構。原則上,可以從有關法律和案件事實的形式化版本中推斷出法律結論。但是,“自然語言障礙”造成了兩個主要障礙:以邏輯表達形式表示法律文本的挑戰,以及從自然語言[15]表達的事實評估法律謂詞的困難。

基于會話邏輯的法律推理系統結構

2.2 以數據為中心的方法

以數據為中心或數據驅動的方法具有自動化和可伸縮性的優點,大大減少了以邏輯形式對法律文本進行人工編碼的繁瑣工作。它可以用來替代法律推理系統或整個系統的特定組件。如圖3所示,主要的前提是通過構建一個數據集的例子,例如一組與法律文本翻譯成一個邏輯表示的例子,一個可以使用機器學習技術——如深度神經網絡——歸納學習如何自動執行相同的任務在新的例子。但是,這里有一個權衡,因為以數據為中心的方法通常透明度和解釋性較低[15]。例如,在深度神經網絡的情況下,學習的模型將是一個非常復雜的模型,通常有數百萬甚至數十億個參數被組合起來——通常以非線性的方式——來確定一個特定的輸出。對于人類觀察者來說,理解模型產生特定翻譯、預測或決策的原因或方式并不容易。出于這個原因,我們認為,與其取代整個系統,不如將數據為中心的方法用作改進法律推理系統某些組件的工具——例如將法律文本翻譯成相應邏輯形式的組件。

在基于會話邏輯的法律推理系統的體系結構中增加一個以數據為中心的組件。

3. 深度學習自然語言處理

近年來,由于基于Transformer的模型的出現,研究人員看到了深度學習模型和技術在自然語言處理領域的應用取得了重大突破。本節將通過描述NLP中使用的編碼器-解碼器模型的演變來概述這些進展,從基于LSTM的序列到序列模型,最后介紹最新的基于transformer的方法。

Transformer架構

Multi2OIE的體系結構。利用BERT的隱藏狀態提取謂詞,然后將隱藏序列、謂詞的平均向量和位置嵌入連接起來,作為多頭注意力塊的輸入進行參數提取。

4. 深度學習自然語言處理在法律領域應用

研究人員已經開始探索利用深度學習模型對一系列下游任務實現的自然語言處理的最新進展。在本節中,我們將介紹一些系統的示例,這些系統將說明如何使用自然語言處理來改進一組對法律領域有用的任務,例如信息檢索或規范提取。我們將描述直接應用于法律文本的系統的例子,但也將描述其技術可以容易地應用和轉移到法律領域的系統。

法律信息檢索的語義NLP方法

NLP領域已經顯示出在創造解釋和代表法律文本的新方式方面非常相關,以便不了解基本法律概念的普通公民能夠理解和查詢該系統。對于這個復雜的任務,有幾個因素會影響基于NL的法律查詢系統的良性運行。在一個句子中,單詞的順序是決定其語義價值的一個非常重要的因素。發布的前幾個句子編碼器——有些實際上是改頭換面的單詞編碼器——也陷入了同樣的困境。缺少詞序編碼。兩個單詞完全相同,但順序不同的句子,可能有完全不同的意思。由這個順序定義的語境會影響特定單詞的意思。例如,當一個人說“我去跑步了”時,我們就會認為“跑”這個詞與這項運動有關聯。當另一個人說,你必須在你的電腦上運行這個,意思完全不同于另一個句子。它不僅被用作動詞,而且它的意思也不再與體育有關,而是與計算任務有關。而且,即使在run這個詞被用作與這項運動相關的動詞的情況下,在大多數情況下,由于相關的單詞,它仍然可以與計算意義區分開來。

評價兩篇文本之間的語義文本相似度(STS)非常重要,它是指兩篇文本之間的意義相似度。這項任務對于確定搜索系統如何能夠捕獲查詢的含義并將其作為選擇搜索結果的一個因素非常有用。在STS任務中度量模型性能的一個重要基準是GLUE基準。它使用指標和STS數據集,專門用于評估模型將意義編碼到生成的令牌嵌入中的能力。

句子BERT的相似性計算

自動合規檢查的語義NLP方法

SNACC(基于語義自然語言處理的自動合規檢查)系統[63]能夠自動從國際建筑規范的法規文件中提取法規信息。提取的法規信息用一階邏輯(FOL)表示。通過使用FOL形式主義表示這些信息,SNACC能夠自動檢查特定的建筑模型是否與法規一致。SNACC的另一個有趣的方面是,作者探索了基于樹的可視化表示的法規陳述(基于樹的表示形式是由符合表示),并認為基于樹的表示讓用戶更容易理解。圖21顯示了一個基于樹的表示的示例。

利用SRL從法律文本中提取規范

Humphreys和他的同事[36]最近研究了如何從法律文本中自動提取知識,并使用這些知識填充法律本體的問題。為了解決這個問題,他們創建了一個基于自然語言處理和基于領域知識的后處理規則的系統。作者聲稱他們是第一個使用PropBank語義角色標簽從法律文本中提取定義和規范的人。該系統主要由兩部分組成。第一個組件是Mate Tools語義角色標記器[10],它從法律文本中提取抽象語義表示以及依賴解析樹。第二個組件由一組規則組成,這些規則標識可能的規范和定義,對它們的類型進行分類,并將語義角色樹中的參數映射到法律本體中特定領域的位置。使用SRL的優勢在于,它用相關的語義信息豐富了句子解析樹,這將簡化為提取規范和定義而必須創建的規則。

結論

在本文中,我們簡要分析了人工智能應用于法律領域的研究領域的歷史和現狀,以及它的前景和挑戰。我們還發現了一些可用的產品。然后,我們回顧了深度學習應用于自然語言處理、信息檢索和語義表示的最新趨勢,這些可用于構建更好的系統,幫助公民訪問和理解法律。這些技術,有些是最近才發表的論文,就在這些結論發表前的幾周,可以用來幫助解決我們上面描述的法律信息搜索系統的非專業用戶面臨的三重自然語言障礙。特別有趣的是,最近關注的系統能夠探索使用自動提取的語法和語義信息來完成需要自然語言理解的任務。語義信息——即使只是在較淺的層次上提供——提供了對法律語料庫中的文本的更深入的理解,使我們能夠超越單詞匹配技術。另一個相關趨勢是使用弱監督技術(具有低注釋成本和易于擴展到大領域)自動生成問題和答案的數據集,并使用它們在信息檢索或問題回答等下游任務中訓練模型。我們相信,以其中一些技術為基礎,將有可能建立一個“主動法律信息檢索和過濾系統”,允許以簡化程序并使檢索數據更相關和及時的方式訪問法律文本。

參考文獻

[1] Ajani, G., Boella, G., Caro, L.D., Robaldo, L., Humphreys, L., Praduroux, S., Rossi, P., Violato, A.: The european taxonomy syllabus: A multilingual, multi-level ontology framework to untangle the web of european legal terminology. Appl. Ontology 11(4), 325–375 (2016)

[2] Aletras, N., Tsarapatsanis, D., Preot?iuc-Pietro, D., Lampos, V.: Predicting judicial decisions of the european court of human rights: A natural language processing perspective. PeerJ Computer Science 2, e93 (2016)

[3] Allen, L.E.: Symbolic logic: A razor-edged tool for drafting and interpreting legal documents. Yale Law Journal 66, 833—-879 (1957)

[4] Ashley, K.D.: Reasoning with cases and hypotheticals in HYPO. International Journal of Man-Machine Studies 34, 753–796 (1991)

[5] Ashley, K.D.: Case-based models of legal reasoning in a civil law context. In: International congress of comparative cultures and legal systems of the instituto de investigaciones jur′?dicas (2004)

[6] Athan, T., Governatori, G., Palmirani, M., Paschke, A., Wyner, A.: LegalRuleML: Design Principles and Foundations, pp. 151–188. Springer International Publishing (2015)

[7] Banarescu, L., Bonial, C., Cai, S., Georgescu, M., Griffitt, K., Hermjakob, U., Knight, K., Koehn, P., Palmer, M., Schneider, N.: Abstract Meaning Representation for sembanking. In: Proceedings of the 7th Linguistic Annotation Workshop and Interoperability with Discourse. pp. 178–186. Association for Computational Linguistics, Sofia, Bulgaria (Aug 2013), //www.aclweb.org/anthology/W13-2322

[8] Barros, R., Peres, A., Lorenzi, F., Wives, L.K., da Silva Jaccottet, E.H.: Case law analysis with machine learning in brazilian court. In: International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems. pp. 857–868. Springer (2018)

付費5元查看完整內容

結構化數據在網絡應用中很好地存在,如社交媒體中的社交網絡、學術網站中的引文網絡、在線論壇中的線程數據。由于拓撲結構的復雜性,這些數據中的豐富信息難以處理和利用。圖神經網絡(GNN)在結構化數據的學習表示方面顯示出極大的優勢。然而,深度學習模型的不透明性使得解釋GNN的預測變得非常重要。同時,GNN解釋的評價也是一個巨大的挑戰,因為在很多情況下,基準真相解釋是不可用的。在本文中,我們從因果推理理論中借鑒反事實和事實推理(CF^2)的觀點,來解決可解釋GNN中的學習和評價問題。為了生成解釋,我們提出了一個模型無關的框架,通過建立一個優化問題的基礎上,這兩個隨意的觀點。這將CF^2與之前只考慮其中一個的可解釋GNN區分開來。這項工作的另一個貢獻是對GNN解釋的評價。為了在不要求基本事實的情況下定量地評估生成的解釋,我們設計了基于反事實和事實推理的度量標準,以評估解釋的必要性和充分性。實驗表明,無論基準真相解釋是否可用,CF^2在真實數據集上都比以前的最先進的方法產生了更好的解釋。此外,統計分析證明了基準真相評估和我們提出的指標之間的相關性。

//www.zhuanzhi.ai/paper/3b2867aa0d96b5b6a4993c1affa0e534

付費5元查看完整內容

隨著互聯網的興起,每天都有不同形式的大量的文本數據產生:新聞、研究文獻、 博客、論壇文字以及社交媒體評論等。很多重要有用的信息隱藏在其中,如何從這些自 由文本中自動抽取所需要的信息是一個關鍵并且重要的一步。信息抽取任務就是為此目 標而誕生。本文主要研究信息抽取子任務之一的實體關系抽取任務。該任務旨在識別文 本中出現的實體,并判斷出實體之間存在的關系。

傳統的有監督實體關系抽取通常采用基于流水線的方法,即實體模型和關系模型 分開訓練。在測試階段,先用實體模型識別出實體,然后關系模型找出這些實體之間的 關系。這種流水線的方法存在著錯誤傳播的缺點,前一個任務的錯誤會累積到后一個任 務。為了緩解這一問題,研究人員提出了聯合模型。聯合模型將兩個子模型統一建模, 可以進一步利用兩個任務之間的潛在信息,以緩解錯誤傳播的缺點。聯合模型的難點是 如何加強實體模型和關系模型之間的交互,比如實體模型和關系模型的輸出之間存在著 一定的約束,在建模的時候考慮到此類約束將有助于聯合模型的性能。

另一方面,為了解決實體關系抽取數據集難以獲得的問題,遠程監督的方法也被提 出來。其主要思想是利用知識庫和大規模文本數據對齊,自動構建大規模的訓練集。然 而,遠程監督方法的缺點是自動構建的訓練集中存在著很多的噪音數據,這些噪音數據 的存在對遠程監督實體關系抽取有著很大的負面影響。此外,在有些應用場景中可能沒 有現成的知識庫可以用來進行遠程監督,如何解決類似的數據噪音和數據缺失問題也是 一大挑戰。

根據實體關系抽取方法的研究現狀,本文從數據和聯合模型兩個角度探索了幾種實 體關系抽取聯合模型,并且探究了所提出模型的優勢和不足。具體來說,本文的主要貢 獻有

    1. 為了緩解遠程監督中的噪音樣本問題,本文提出利用少量高質量異構的人工標注 數據集幫助遠程監督實體關系抽取任務。本文設計了一個基于多任務學習的融合 框架,并且在融合過程中考慮到子模型之間的一致性約束,從而實現知識的遷移。本文提出的系統在標準遠程監督數據集能夠顯著的提高聯合抽取的性能(數據角 度)。
    1. 為了解決某些領域沒有現成知識庫無法進行遠程監督的問題,本文提出利用語言 學規則進行遠程監督。首先應用領域無關的語言學規則自動構建訓練集,然后使用 分類器在得到的訓練集上進行訓練,最后利用分類器進一步抽取語言學規則無法 覆蓋的新的實體關系。本文提出的算法很快并且適用于大規模數據。在 Amazon 在 i 線評論數據集上的實驗表明了本文提出的算法明顯優于多個基準模型(數據角度)。
    1. 為了加強實體模型和關系模型之間的交互,本文提出基于風險最小化訓練方法的 聯合實體關系抽取模型,通過優化全局的損失函數以達到加強實體模型和關系模 型之間聯系的目的。在 ACE05 數據集上的實驗證明了提出模型的有效性(聯合模 型角度)。
    1. 為了同時考慮到實體類型和關系類型的信息,本文提出一個基于圖卷積網絡的聯 合模型用于實體關系抽取。我們構造了實體-關系二分圖,并在圖上運行圖卷積網 絡,從而捕獲多個實體和多個關系之間的信息。在 ACE05 數據集上的實驗證明了 提出模型的有效性(聯合模型角度)。

//www.czsun.site/

付費5元查看完整內容

深度學習的進步使自然語言生成(NLG)變得更加流暢和靈活。雖然這些神經生成系統在機器翻譯方面取得了早期的成功,但當它們被應用到抽象總結、故事生成和閑談對話等更開放的任務時,它們會遇到重復、不連貫和不可控等問題。此外,開放式神經生成模型往往由人工在精心控制的環境中進行評估;它們在現實環境中如何與現實用戶互動,這一點還不太清楚。

本文分析和改進了執行開放性任務的神經生成系統; 在對話的情況下,系統是在其整個社會背景下評估的。首先,對于抽象摘要,我提出了一個指針生成器模型來提高復制的準確性,以及一個覆蓋機制來減少生成摘要的重復。接下來,對于聊天對話,我提出了一個大規模的詳細的人的評價,揭示了機器人行為(如重復、特異性、話題停留和提問)和人的質量判斷之間的關系,并表明通過控制這些機器人行為,我們可以改善用戶體驗。第三,關于故事生成,我描述了大規模預訓練和解碼算法對生成文本的句法、語義、結構和文體方面的影響。最后,作為Alexa獎項的一部分,我展示了一個神經生成聊天模型的部署研究,與真實的、內在動機的用戶交談。通過分析機器人與用戶的交互,我確定了機器人的主要錯誤類型,以及它們與用戶不滿的關系。

此外,我展示了一種半監督的方法,從不佳中學習,從而改善對話系統。

//purl.stanford.edu/hw190jq4736

付費5元查看完整內容

近年來,機器學習取得了顯著進展,提供了一些新功能,比如創建復雜的、可計算的文本和圖像表示。這些功能催生了新產品,如基于圖像內容的圖像搜索、多種語言之間的自動翻譯,甚至是真實圖像和聲音的合成。同時,機器學習已經在企業中被廣泛采用,用于經典的用例(例如,預測客戶流失、貸款違約和制造設備故障)。

在機器學習取得成功的地方,它是非常成功的。

在許多情況下,這種成功可以歸因于對大量訓練數據的監督學習(結合大量計算)。總的來說,有監督的學習系統擅長于一項任務:預測。當目標是預測一個結果,并且我們有很多這個結果的例子,以及與它相關的特征時,我們可能會轉向監督學習。

隨著機器學習的普及,它在業務流程中的影響范圍已經從狹窄的預測擴展到決策制定。機器學習系統的結果經常被用來設定信用限額,預測制造設備故障,以及管理我們的各種新聞推送。當個人和企業試圖從這些復雜和非線性系統提供的信息中學習時,更多(和更好)的可解釋性方法已經被開發出來,這是非常重要的。

然而,僅僅基于預測的推理有一些基本的限制。例如,如果銀行提高客戶的信用額度會發生什么?這些問題不能用建立在先前觀察到的數據上的相關模型來回答,因為它們涉及到客戶選擇的可能變化,作為對信用限額變化的反應。在很多情況下,我們的決策過程的結果是一種干預——一種改變世界的行動。正如我們將在本報告中展示的,純粹相關的預測系統不具備在這種干預下進行推理的能力,因此容易產生偏差。對于干預下的數據決策,我們需要因果關系。

即使對于純粹的預測系統(這是監督學習的強項),應用一些因果思維也會帶來好處。根據因果關系的定義,它們是不變的,這意味著它們在不同的情況和環境中都是正確的。對于機器學習系統來說,這是一個非常理想的特性,在機器學習系統中,我們經常根據我們在訓練中沒有看到的數據進行預測;我們需要這些系統具有適應性和健壯性。

因果推理和機器學習的交集是一個迅速擴展的研究領域。它已經產生了可供主流采用的功能——這些功能可以幫助我們構建更健壯、可靠和公平的機器學習系統。

本書介紹了因果推理,因為它涉及很多數據科學和機器學習工作。我們引入因果圖,著重于消除理解的概念障礙。然后我們利用這個理解來探索關于不變預測的最新想法,它給高維問題帶來了因果圖的一些好處。通過附帶的原型,我們展示了即使是經典的機器學習問題,如圖像分類,也可以從因果推理工具中受益。

付費5元查看完整內容

【導讀】牛津大學的博士生Oana-Maria Camburu撰寫了畢業論文《解釋神經網絡 (Explaining Deep Neural Networks)》,系統性介紹了深度神經網絡可解釋性方面的工作,值得關注。

作者介紹:

Oana-Maria Camburu,來自羅馬尼亞,目前是牛津大學的博士生,主修機器學習、人工智能等方向。

Explaining Deep Neural Networks

深度神經網絡在計算機視覺、自然語言處理和語音識別等不同領域取得了革命性的成功,因此越來越受歡迎。然而,這些模型的決策過程通常是無法向用戶解釋的。在各種領域,如醫療保健、金融或法律,了解人工智能系統所做決策背后的原因至關重要。因此,最近研究了幾個解釋神經模型的方向。

在這篇論文中,我研究了解釋深層神經網絡的兩個主要方向。第一個方向由基于特征的事后解釋方法組成,也就是說,這些方法旨在解釋一個已經訓練過的固定模型(事后解釋),并提供輸入特征方面的解釋,例如文本標記和圖像的超級像素(基于特征的)。第二個方向由生成自然語言解釋的自解釋神經模型組成,也就是說,模型有一個內置模塊,為模型的預測生成解釋。在這些方面的貢獻如下:

  • 首先,我揭示了僅使用輸入特征來解釋即使是微不足道的模型也存在一定的困難。我表明,盡管有明顯的隱含假設,即解釋方法應該尋找一種特定的基于真實值特征的解釋,但對于預測通常有不止一種這樣的解釋。我還展示了兩類流行的解釋方法,它們針對的是不同類型的事實基礎解釋,但沒有明確地提及它。此外,我還指出,有時這兩種解釋都不足以提供一個實例上決策過程的完整視圖。

  • 其次,我還介紹了一個框架,用于自動驗證基于特征的事后解釋方法對模型的決策過程的準確性。這個框架依賴于一種特定類型的模型的使用,這種模型有望提供對其決策過程的洞察。我分析了這種方法的潛在局限性,并介紹了減輕這些局限性的方法。引入的驗證框架是通用的,可以在不同的任務和域上實例化,以提供現成的完整性測試,這些測試可用于測試基于特性的后特殊解釋方法。我在一個情緒分析任務上實例化了這個框架,并提供了完備性測試s1,在此基礎上我展示了三種流行的解釋方法的性能。

  • 第三,為了探索為預測生成自然語言解釋的自解釋神經模型的發展方向,我在有影響力的斯坦福自然語言推斷(SNLI)數據集之上收集了一個巨大的數據集,數據集約為570K人類編寫的自然語言解釋。我把這個解釋擴充數據集稱為e-SNLI。我做了一系列的實驗來研究神經模型在測試時產生正確的自然語言解釋的能力,以及在訓練時提供自然語言解釋的好處。

  • 第四,我指出,目前那些為自己的預測生成自然語言解釋的自解釋模型,可能會產生不一致的解釋,比如“圖像中有一只狗。”以及“同一幅圖片中沒有狗”。不一致的解釋要么表明解釋沒有忠實地描述模型的決策過程,要么表明模型學習了一個有缺陷的決策過程。我將介紹一個簡單而有效的對抗性框架,用于在生成不一致的自然語言解釋時檢查模型的完整性。此外,作為框架的一部分,我解決了使用精確目標序列的對抗性攻擊的問題,這是一個以前在序列到序列攻擊中沒有解決的場景,它對于自然語言處理中的其他任務很有用。我將這個框架應用到e-SNLI上的一個最新的神經模型上,并表明這個模型會產生大量的不一致性。

這項工作為獲得更穩健的神經模型以及對預測的可靠解釋鋪平了道路。

地址: //arxiv.org/abs/2010.01496

付費5元查看完整內容

本文是慕尼黑大學數學、信息學及統計學院的博士生Pankaj Gupta的博士學位論文,主要研究兩個NLP任務:關系提取和主題建模。本文將神經網絡和主題模型兩種互補的學習范式結合在一個神經復合模型中,使我們能夠通過主題模型在文檔集合中共同學習主題結構,并通過語言模型在句子中共同學習單詞關系。

慕尼黑大學自19世紀以來便是德國和歐洲最具聲望大學之一,也是德國精英大學、U15大學聯盟和歐洲研究型大學聯盟成員,其社會科學、人文科學、物理,化學,生命科學,醫學,數學等領域均在國際上享有盛名。本文是慕尼黑大學數學、信息學及統計學院的博士生Pankaj Gupta的博士學位論文。

自然語言處理(Natural language processing,NLP)涉及構建計算技術,允許計算機自動分析和有意義地表示人類語言。隨著數字時代數據的指數增長,基于NLP的系統的出現使我們能夠通過廣泛的應用程序,如網絡搜索引擎、語音助理等,輕松地訪問相關信息。為了實現這一目標,幾十年來的一項長期研究一直集中在NLP和機器學習交叉的技術上。

近年來,深度學習技術利用了人工神經網絡(ANNs)的表現力,在廣泛的NLP任務中取得了最先進的性能。深度神經網絡(DNNs)可以從輸入數據中自動提取復雜的特征,從而為手工特征工程提供了一種替代方法。除了ANN之外,概率圖形模型(PGMs)、圖論和概率方法的耦合還具有描述系統隨機變量之間因果結構的能力,并捕捉到不確定性的原則概念。考慮到DNNs和PGMs的特點,它們被有利地結合起來建立強大的神經模型,以了解數據的潛在復雜性。

傳統的基于機器學習的NLP系統采用了淺層計算方法(如SVM或Logistic回歸),并依賴于手工特征,這類方法耗時、復雜且往往是不夠完整的。基于深度學習和神經網絡的方法最近在機器翻譯、文本分類、命名識別、關系提取、文本相似性等NLP任務上取得了較好的效果。這些神經模型可以從訓練數據中自動提取有效的特征表示。

本文主要研究兩個NLP任務:關系提取和主題建模。前者的目的是識別句子或文檔中實體或名詞之間的語義關系。成功地提取語義關系有助于構建結構化知識庫,在網絡搜索、問答、推薦引擎等下游NLP應用領域很有用。另一方面,主題建模的任務旨在理解文檔集合中的主題結構。主題建模是一種流行的文本挖掘工具,它可以自動分析大量的文檔集合,并在不實際閱讀的情況下理解主題語義。主題建模分別生成用于文檔理解和信息檢索的Word集群(即主題)和文檔表示。

本質上,關系提取和主題建模主要基于從文本中學習到的表示的質量。在本文中,我們提出了特定于任務的學習表示神經模型,并分別在監督和非監督機器學習范式領域進行關系提取和主題建模任務。更具體地說,我們在開發NLP任務的神經模型方面做出了以下貢獻:

神經關系提取:首先,我們提出了一種新的基于遞歸神經網絡的table-filling體系結構,以便在句子中聯合執行實體和關系提取。然后,我們進一步擴展了跨句子邊界實體之間關系的提取范圍,并提出了一種新的基于依賴關系的神經網絡體系結構。這兩個貢獻在于機器學習的監督范式。此外,我們還在構建一個受缺乏標記數據約束的魯棒關系提取器方面做出了貢獻,其中我們提出了一種新的弱監督引導技術。考慮到這些貢獻,我們進一步探索了遞歸神經網絡的可解釋性,以解釋它們對關系提取的預測。

神經主題建模:除了有監督神經體系結構外,我們還開發了無監督神經模型,以學習主題建模框架中有意義的文檔表示。首先,我們提出了一種新的動態主題模型,它捕獲了隨著時間的推移的主題。接下來,我們在不考慮時間依賴性的情況下建立了靜態主題模型,其中我們提出了神經主題建模體系結構,這些體系結構也利用外部知識,即Word嵌入來解決數據稀疏性。此外,我們還開發了神經主題模型,其中包含了使用單詞嵌入和來自許多來源的潛在主題的知識遷移。最后,我們通過引入語言結構(如語序、局部句法和語義信息等)來改進神經主題建模。它處理傳統主題模型中的詞袋問題。本節中提出的神經NLP模型是基于PGMs、深度學習和ANN交叉技術。

在這里,神經關系提取的任務使用神經網絡來學習通常在句子級別上的表示,而不訪問更廣泛的文檔上下文。然而,主題模型可以訪問跨文檔的統計信息。因此,我們將兩種互補的學習范式結合在一個神經復合模型中是有利的,它由一個神經主題和一個神經語言模型組成,使我們能夠通過主題模型在文檔集合中共同學習主題結構,并通過語言模型在句子中共同學習單詞關系。

總的來說,我們在本論文中的研究貢獻擴展了基于NLP的系統,用于關系提取和主題建模任務,同時具有最先進的性能。

付費5元查看完整內容
北京阿比特科技有限公司