亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

對話管理器是任務型對話系統的核心模塊,它有兩個重要的任務:對話狀態跟蹤和對話策略優化。對話狀態跟蹤的作用是用來估計用戶 的目標,對話策略決定著系統應該給用戶回復什么動作。部分可觀測 馬爾科夫決策過程為基于數據驅動的對話管理方法提供了良好的理論 支撐,各種基于數據驅動的對話管理方法被提出,但是在實際應用中 這些方法還面臨著兩個重要的挑戰:訓練數據極度稀疏和對話領域擴 展及遷移。訓練數據的稀疏原因主要來自四個方面:任務型對話數據 收集困難、數據標注復雜、對話數據變化多樣和強化學習的反饋信號 稀疏;對話領域擴展和遷移是對話系統認知邊界擴展的重要體現。

本論文的第一部分圍繞對話狀態跟蹤任務中訓練數據稀疏和對話 領域擴展兩個核心挑戰,基于 知識與數據雙驅動的思想提出了兩種新 型的對話狀態跟蹤方法。

針對訓練數據稀疏的問題,本論文提出了一種基于規則和數據相 結合的混合對話狀態跟蹤方法:有約束的馬爾科夫貝葉斯多項式模型。在該方法中,對話狀態跟蹤模型被定義為一組滿足一定約束條件的多 項式函數,人類的先驗知識和領域知識被編碼在這些約束中。在合理 的假設下,對話狀態跟蹤模型的優化問題可以轉化為整數線性規劃問 題。求解該整數線性規劃問題,就可以得到一組符合人類先驗知識和 領域知識的對話狀態跟蹤模型,然后可以利用有標注的數據挑選性能 最好的模型。在對話狀態跟蹤標準測試集上的實驗表明,在訓練數據 稀疏和比較充足的兩種情況下,該方法相對于已有的規則模型和統計 模型,都取得了顯著的性能提升。

針對對話領域擴展的問題,本論文提出了一種通用的端到端對話 狀態跟蹤模型。解決對話領域擴展問題的關鍵在于使模型能夠自適應語義槽的動態擴展,并且可以實現語義槽之間知識的遷移。本論文提 出了基于結構化深度學習的通用對話狀態跟蹤模型,利用圖神經網絡 基于領域本體知識來自動構建語義關系圖,有效地支持對話領域的擴 展,目前在多個標準測試數據集上均取得最優的性能。

本論文的第二部分圍繞對話策略優化任務中訓練數據稀疏和對話 領域遷移兩個挑戰,同樣基于 知識與數據雙驅動的思路分別提出了兩 種新型的對話策略優化方法。

針對訓練數據稀疏特別是反饋信號稀疏的問題,本論文提出了基 于伴隨學習的對話策略在線優化方法。傳統的基于規則的策略通常在 預定義的范圍內比較可靠,但是不具有自適應能力,而基于強化學習 的方法雖然可以根據用戶的反饋自動優化,但是其初始性能往往很差, 并且學習效率低下。本文提出的伴隨學習框架將兩種策略結合起來, 其中基于規則的策略充當“老師”,并通過提供示例動作和額外收益兩 種方式來指導數據驅動的強化學習策略。實驗結果表明,該方法顯著 地提高了在線策略優化的初始性能以及學習效率。

針對對話領域遷移的問題,本論文提出了基于結構化深度強化學 習的通用策略優化模型。整個模型由一些子網絡組成,每個子網絡對 應一個有向圖中的節點,此圖的結構是根據領域本體中的語義槽及它 們的關系來定義。每個節點都可以被視為一個子智能體,在對話策略 做決策時,每個子智能體都可以與其在圖中的鄰居通信,從而交換有 用信息。當對話領域發生變化時,只是模型的圖結構發生了變化,而 智能體的參數不會發生變化,所以仍然能夠正常進行決策。在劍橋大 學對話策略測試基準上的評估結果表明,該模型在多數任務上取得目 前最優的性能,并實現了比較高效的對話策略領域遷移。

總而言之,針對訓練數據稀疏的問題,本論文基于知識和數據雙 驅動的思路提出了系列融入規則的統計學習方法,顯著降低了模型對 大規模訓練數據的依賴;針對對話領域擴展和遷移的問題,本論文同 樣基于知識和數據雙驅動的思路提出了系列知識引導的結構化深度學 習模型,能夠有效支持語義槽的擴展和知識的遷移。

付費5元查看完整內容

相關內容

推薦系統在信息大爆炸時代扮演著重要角色,其核心是以人為中心的“人 -內容-算法平臺” 的生態圈:人與內容的交互行為所積累的數據為算法平臺 所收集,以此為基礎進行內容過濾,用戶隨后在社交網絡中的傳播行為對內 容進行擴散。因此,準確把握“人與內容”、“人與人”、“人與算法平臺” 之間 的關系至關重要,包括交互行為建模、社交行為建模與行為數據收集帶來的 用戶隱私保護問題。然而,這些研究問題存在諸多挑戰,如交互行為多元稀 疏、社交行為間接、隱私泄漏環節眾多等。針對這些挑戰,本文基于多類型 交互行為建模、社交行為精細化建模,以及通用保護隱私的推薦框架三個關 鍵問題展開研究,主要貢獻與創新點如下:

首先,在人與內容之間的多類型交互行為建模方面,本文從交互行為的 異質性入手,系統研究了有無強度偏序先驗下的建模問題,提出基于多任務 學習與圖神經網絡的方法,解決了對多類型交互行為難以刻畫行為強度與語 義的難題。在真實數據集上的實驗表明,相對于已有方法推薦精準度提升 6%-25%。

第二,在人與人之間的精細化社交行為建模方面,針對已有方法對于社 交行為影響的粗獷的“社交近似”假設,本文提出細粒度刻畫用戶在決策時 來自社交行為的復雜影響,提出一種通用的正則化方法,并設計對抗訓練方 法以提升優化魯棒性。在真實數據集上的測試表明,本文提出的方法相對于 現有方法推薦精準度平均提升近 10%。進一步地考慮社交行為的影響受平臺 限制,研究了有無社交影響的跨平臺遷移推薦問題,提出基于跨平臺用戶興 趣遷移的推薦模型,在真實數據集上的實驗表明,相比于已有方法推薦精準 度可以提升 5%以上。

第三,在人與算法平臺之間的用戶行為隱私保護方面,本文分析了在單 平臺數據收集與跨平臺數據共享兩類推薦場景下的隱私泄露風險,針對這兩 類場景的隱私泄露風險,分別提出了在保護行為隱私前提下的高效推薦模型。在真實數據集上的實驗表明,本文提出的模型在保護隱私的前提下實現了精 準的個性化推薦。

付費5元查看完整內容

眾包數據庫關鍵技術研究

眾包通過整合計算機和互聯??眾來完成機器難以單獨處理的任務,其主要 包含三部分,任務發布者、眾包平臺和眾包??。傳統眾包技術中,三者的交互流 程過于復雜,導致任務發布者?法很好地管理任務。因此,眾包數據庫應運??, 其從系統層?出發整合三者之間復雜的交互流程,使得任務發布者可以通過描述 性語?輕松利???操作數據,降低了眾包的使?門檻。本?主要的內容如下:

  1. 眾包數據庫 CDB:為解決眾包平臺難使?、眾包任務難優化、眾包?? 質量難控制等問題,需要通過數據庫的思想來封裝眾包任務處理的流程。與傳統 數據庫不同的是,眾包數據庫的難點不僅在于解決單??標優化問題 (僅優化代 價),更重要的是建?細粒度的查詢優化模型,實現代價、質量和延遲的多?標優 化。因此,本?提出了?種新型的眾包數據庫系統 CDB 。不同于傳統的樹優化模 型,CDB ?次提出利?圖模型來進?細粒度查詢優化。其次,CDB 在該模型上建 ?統?的框架來進?多?標優化。該系統致?于幫助用戶高效率、高質量、低成 本地利用眾包來處理數據, 構建了一個中文眾包平臺 ChinaCrowd, 在華為公司落地 應用,取得了較好的經濟收益。另外,為?持較復雜的連接操作(基于記錄或者? 連接)與收集操作,本?分別提出了以下兩種算法框架對它們進?步優化。

  2. 基于眾包的連接操作:為解決現實世界中臟數據的復雜連接問題,需要引 ?基于眾包的連接操作。其難點在于代價較?,?尋求低代價?案時往往帶來質 量的降低。為此,本?提出?種低代價的眾包實體匹配框架 Power,在保持?質量 的同時??降低代價。本??先在待連接的記錄對上定義了?種偏序關系,然后 基于該關系對眾包??的回答進?推理,接下來循環提問直到所有記錄對的答案 都被推理出來。該方法致力于從理論和實踐兩方面優化眾包成本,實驗表明相比 于其他方法,Power 可在節省高達 100 倍的成本下進行高質量的數據連接。

  3. 基于眾包的收集操作:為解決傳統數據庫不能處理數據庫以外數據的特點, 眾包數據庫需要引?收集操作,其旨在通過眾包收集數據庫中缺失的實體。其難 點在于如何保證收集實體的正確性;如何盡可能收集相關領域的全部實體;如何 減少重復實體的數量以減少代價。為此,本?提出了基于激勵機制的眾包實體收 集框架 CrowdEC,其采?激勵的?式?勵??提供不重復的實體以降低代價。該 方法致力于建立收集操作的質量評價體系,從理論上給出了收集代價的競爭比保 證,使得用戶可實現低成本、高質量、高覆蓋的收集。

付費5元查看完整內容
北京阿比特科技有限公司