知識圖譜是人工智能的重要基石,因其包含豐富的圖結構和屬性信息而受到廣泛關注.知識圖譜可以精確語義描述 現實世界中的各種實體及其聯系,其中頂點表示實體,邊表示實體間的聯系.知識圖譜劃分是大規模知識圖譜分布式處理的 首要工作,對知識圖譜分布式存儲、查詢、推理和挖掘起基礎支撐作用.隨著知識圖譜數據規模及分布式處理需求的不斷增 長,如何對其進行劃分已成為目前知識圖譜研究熱點問題.從知識圖譜和圖劃分的定義出發,系統性地介紹當前知識圖譜數 據劃分的各類算法,包括基本、多級、流式、分布式和其他類型圖劃分算法.首先,介紹 4 種基本圖劃分算法:譜劃分算法、 幾何劃分算法、分支定界算法、KL 及其衍生算法,這類算法通常用于小規模圖數據或作為其他劃分算法的一部分;然后, 介紹多級圖劃分算法,這類算法對圖粗糙化后進行劃分再投射回原始圖,根據粗糙化過程分為基于匹配的算法和基于聚合的 算法;其次,描述 3 種流式圖劃分算法,這類算法將頂點或邊加載為序列后進行劃分,包括哈希算法、貪心算法、Fennel 算法,以及這 3 種算法的衍生算法;再次,介紹以 KaPPa、JA-BE-JA 和輕量級重劃分為代表的分布式圖劃分算法及它們的 衍生算法;同時,在其他類型圖劃分算法中,介紹近年來新興的 2 種圖劃分算法:標簽傳播算法和基于查詢負載的算法。通 過在合成與真實知識圖譜數據集上的豐富實驗,比較了 5 類知識圖譜代表性劃分算法在劃分效果、查詢處理與圖數據挖掘方 面的性能差異,分析實驗結果并推廣到推理層面,獲得了基于實驗的知識圖譜劃分算法性能評價結論。最后,在對已有方法 分析和比較的基礎上,總結目前知識圖譜數據劃分面臨的主要挑戰,提出相應的研究問題,并展望未來的研究方向.
現實網絡由多種相互作用、不斷進化的實體組成,而現有的研究大多將其簡單地描述為特定的靜態網絡,而沒有考慮動態網絡的演化趨勢。近年來,動態網絡的特性跟蹤研究取得了重大進展,利用網絡中實體和鏈接的變化來設計網絡嵌入技術。與被廣泛提出的靜態網絡嵌入方法相比,動態網絡嵌入努力將節點編碼為低維密集表示,有效地保持了網絡結構和時間動態,有利于處理各種下游機器學習任務。本文對動態網絡嵌入問題進行了系統的研究,重點介紹了動態網絡嵌入的基本概念,首次對現有的動態網絡嵌入技術進行了分類,包括基于矩陣分解的、基于躍格的、基于自動編碼器的、基于神經網絡的等嵌入方法。此外,我們仔細總結了常用的數據集和各種各樣的后續任務,動態網絡嵌入可以受益。在此基礎上,提出了動態嵌入模型、大規模動態網絡、異構動態網絡、動態屬性網絡、面向任務的動態網絡嵌入以及更多的嵌入空間等現有算法面臨的挑戰,并提出了未來可能的研究方向。
摘要: 線條畫作為一種簡單而有效的視覺傳達手段,通過突出主要的細節特征,使得人們可以快速地獲得主要信息;同時,風格線條畫作為一種藝術形式,讓人們能夠快速欣賞和理解其藝術特征。文中對線條畫的生成方法進行了綜述與分析。線條畫生成技術可以分為基于2D圖像的方法與基于3D模型的方法。其中,基于2D圖像的線條畫生成技術包括樣本學習方法、非樣本學習的數據驅動方法與非數據驅動方法;基于3D模型的線條畫生成技術包括圖像空間方法、對象空間方法以及兩者的混合方法。通過介紹與分析各種方法并對比分析其優缺點,總結了線條畫生成技術現階段存在的問題及其可能的解決方案,并在此基礎上對線條畫生成的未來發展趨勢進行了展望。
摘要: 目標檢測算法應用廣泛,一直是計算機視覺領域備受關注的研究熱點。近年來,隨著深度學習的發展,3D圖像的目標檢測研究取得了巨大的突破。與2D目標檢測相比,3D目標檢測結合了深度信息,能夠提供目標的位置、方向和大小等空間場景信息,在自動駕駛和機器人領域發展迅速。文中首先對基于深度學習的2D目標檢測算法進行概述;其次根據圖像、激光雷達、多傳感器等不同數據采集方式,分析目前具有代表性和開創性的3D目標檢測算法;結合自動駕駛的應用場景,對比分析不同 3D 目標檢測算法的性能、優勢和局限性;最后總結了3D目標檢測的應用意義以及待解決的問題,并對 3D 目標檢測的發展方向和新的挑戰進行了討論和展望。
題目: 機器學習的隱私保護研究綜述
簡介:
大規模數據收集大幅提升了機器學習算法的性能,實現了經濟效益和社會效益的共贏,但也令個人隱私保護面臨更大的風險與挑戰.機器學習的訓練模式主要分為集中學習和聯邦學習2類,前者在模型訓練前需統一收集各方數據,盡管易于部署,卻存在極大數據隱私與安全隱患;后者實現了將各方數據保留在本地的同時進行模型訓練,但該方式目前正處于研究的起步階段,無論在技術還是部署中仍面臨諸多問題與挑戰.現有的隱私保護技術研究大致分為2條主線,即以同態加密和安全多方計算為代表的加密方法和以差分隱私為代表的擾動方法,二者各有利弊.為綜述當前機器學習的隱私問題,并對現有隱私保護研究工作進行梳理和總結,首先分別針對傳統機器學習和深度學習2類情況,探討集中學習下差分隱私保護的算法設計;之后概述聯邦學習中存的隱私問題及保護方法;最后總結目前隱私保護中面臨的主要挑戰,并著重指出隱私保護與模型可解釋性研究、數據透明之間的問題與聯系.
題目: 數據標注研究綜述
摘 要: 數據標注是大部分人工智能算法得以有效運行的關鍵環節.數據標注越準確、標注的數據量越大,算法的性能就越好.數據標注行業的發展帶動了中國許多城市和城鎮的就業,促使中國逐漸成為世界數據標注的中心.闡述 了數據標注的發展概況,包括起源、應用場景、分類和任務;列舉了目前常用的標注數據集、開源的數據標注工具 和商業數據標注平臺;提出了標注中的角色、標準和流程等數據標注規范;給出了一個情感分析場景中的數據標注 實例;描述各類主流的標注質量評估算法及其特點,并對比它們優缺點;最后,從任務、工具、數據標注質量和安全性 這 4 個方面對數據標注的研究方向和發展趨勢進行了展望.
關鍵詞: 數據標注;人工智能;眾包;大數據
知識圖譜一直是研究的熱點,東南大學漆桂林老師等發表了一篇關于中文知識圖譜構建的綜述論文,詳細講述了當前中文知識圖譜的研究進展,是非常好的學習資料。
隨著智能技術的不斷發展,作為人工智能支柱的知識圖譜以其強大的知識表示和推理能力受到了學術界和產業界的廣泛關注。近年來,知識圖譜在語義搜索、問答、知識管理等領域得到了廣泛的應用。構建中文知識圖譜的技術也在迅速發展,不同的中文知識圖譜以支持不同的應用。同時,我國在知識圖譜開發方面積累的經驗對非英語知識圖譜的開發也有很好的借鑒意義。本文旨在介紹中文知識圖譜的構建技術及其應用,然后介紹了典型的中文知識圖譜,此外我們介紹了構建中文知識圖譜的技術細節,并介紹了了中文知識圖譜的幾種應用。
密歇根大學Zhengxia Zou博士等人近期發布了《Object Detection in 20 Years: A Survey》,這篇綜述論文對近四分之一世紀(20世紀90年代至2019年)的400余篇論文進行了廣泛的回顧,涵蓋了許多主題,包括歷史上的里程碑檢測器、檢測數據集、度量、檢測系統的基本構建模塊、加速技術以及最新的檢測方法。本文還綜述了行人檢測、人臉檢測、文本檢測等重要的檢測應用,并對其面臨的挑戰以及近年來的技術進步進行了深入分析。
目標檢測作為計算機視覺中最基本、最具挑戰性的問題之一,近年來受到了廣泛的關注。它在過去二十年的發展可以說是計算機視覺歷史的縮影。如果我們把今天的目標檢測看作是深度學習力量下的一種技術美學,那么讓時光倒流20年,我們將見證冷兵器時代的智慧。本文從目標檢測技術發展的角度,對近四分之一世紀(20世紀90年代至2019年)的400余篇論文進行了廣泛的回顧。本文涵蓋了許多主題,包括歷史上的里程碑檢測器、檢測數據集、度量、檢測系統的基本構建模塊、加速技術以及最新的檢測方法。本文還綜述了行人檢測、人臉檢測、文本檢測等重要的檢測應用,并對其面臨的挑戰以及近年來的技術進步進行了深入分析。