亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

近年來,網絡邊緣的計算設施迅猛增長,推動了邊緣計算網絡成為支持各種智能服務的基礎設施,如個人語音助手、視頻安全監控和自動駕駛車輛。同時,人工智能(AI)的前沿技術已將機器學習(ML)擴展到圖領域,并推動了圖智能(GI)的發展,這解鎖了處理、抽象和學習圖結構中海量數據的前所未有的能力。鑒于圖與網絡之間的內在關系,圖表示學習與邊緣網絡的交叉領域,即邊緣圖智能(Edge GI或EGI),揭示了它們之間的新型互動——GI模型為建模、理解和優化邊緣網絡開辟了新途徑,反過來,邊緣網絡作為訓練、部署和加速GI模型的物理支持。受此精妙閉(bi)環驅動(dong),EGI被廣泛(fan)認為是充分釋放邊(bian)緣(yuan)計(ji)算(suan)潛力的(de)(de)有(you)力解決(jue)方(fang)案,正引(yin)起(qi)廣泛(fan)關注。然(ran)而(er),EGI的(de)(de)研究尚處于(yu)起(qi)步階段(duan),通信和(he)AI社(she)區內對一個專門的(de)(de)場所分享最新(xin)進展(zhan)的(de)(de)需求日益高(gao)漲。為此,本(ben)文(wen)提倡EGI的(de)(de)概念,探討(tao)其范圍和(he)核心原(yuan)則(ze),并(bing)對這一新(xin)興領域的(de)(de)最新(xin)研究工作(zuo)進行全(quan)面綜述,具(ju)體介紹和(he)討(tao)論了:1)邊(bian)緣(yuan)計(ji)算(suan)和(he)圖表示(shi)學習的(de)(de)基(ji)本(ben)原(yuan)理(li),2)圍繞圖智能(neng)與邊(bian)緣(yuan)網(wang)絡(luo)閉(bi)環的(de)(de)新(xin)興技術,即“邊(bian)緣(yuan)服(fu)務于(yu)GI”和(he)“GI服(fu)務于(yu)邊(bian)緣(yuan)”,以及3)未來EGI的(de)(de)開放挑戰和(he)研究機會。通過跨越(yue)通信、網(wang)絡(luo)和(he)圖學習領域的(de)(de)鴻溝,我(wo)們相信這篇綜述能(neng)引(yin)起(qi)更多(duo)關注,促進有(you)意義的(de)(de)討(tao)論,并(bing)激發對EGI進一步研究的(de)(de)想法(fa)。

近(jin)(jin)(jin)年來,邊(bian)緣(yuan)網(wang)絡(luo)(luo)迅(xun)速(su)發展,通(tong)過逐步擴展的(de)(de)(de)(de)(de)計算(suan)設(she)施在(zai)網(wang)絡(luo)(luo)邊(bian)緣(yuan)連接起來,邊(bian)緣(yuan)網(wang)絡(luo)(luo)承(cheng)載的(de)(de)(de)(de)(de)數據、存儲和(he)計算(suan)資(zi)(zi)源數量不(bu)(bu)斷(duan)增(zeng)加。它(ta)們已成為(wei)(wei)支(zhi)持(chi)各種(zhong)應(ying)(ying)用(yong)的(de)(de)(de)(de)(de)基礎設(she)施,如(ru)智能工業制造、流媒體視(shi)頻分(fen)析(xi)、機(ji)器人和(he)車(che)輛互(hu)(hu)聯網(wang)等。作為(wei)(wei)集(ji)中(zhong)(zhong)核心(xin)(xin)網(wang)絡(luo)(luo)的(de)(de)(de)(de)(de)補(bu)充對(dui)稱性(xing),邊(bian)緣(yuan)網(wang)絡(luo)(luo)位于互(hu)(hu)聯網(wang)的(de)(de)(de)(de)(de)末端(duan),覆蓋物(wu)理(li)附近(jin)(jin)(jin)的(de)(de)(de)(de)(de)用(yong)戶,提(ti)供了(le)用(yong)戶中(zhong)(zhong)心(xin)(xin)的(de)(de)(de)(de)(de)服務(wu),減少了(le)響應(ying)(ying)延遲(chi),提(ti)高了(le)資(zi)(zi)源效(xiao)率,并(bing)增(zeng)強了(le)隱(yin)私(si)和(he)安全性(xing)。由于這(zhe)些獨特(te)的(de)(de)(de)(de)(de)架構優(you)勢(shi),邊(bian)緣(yuan)網(wang)絡(luo)(luo)已成為(wei)(wei)先進(jin)(jin)通(tong)信(xin)技術的(de)(de)(de)(de)(de)重要(yao)實驗(yan)場。它(ta)們在(zai)延遲(chi)敏(min)感(gan)、資(zi)(zi)源需求高和(he)隱(yin)私(si)保護(hu)的(de)(de)(de)(de)(de)要(yao)求下,特(te)別適合(he)(he)新興智能服務(wu),并(bing)被廣(guang)泛認為(wei)(wei)是(shi)彌(mi)合(he)(he)人工智能(AI)與(yu)人類之(zhi)間(jian)“最(zui)后(hou)一英(ying)里”的(de)(de)(de)(de)(de)有前(qian)途的(de)(de)(de)(de)(de)解(jie)決方案。 與(yu)此同(tong)時,AI也在(zai)快(kuai)速(su)發展。為(wei)(wei)了(le)充分(fen)釋放(fang)大(da)數據在(zai)各種(zhong)形式中(zhong)(zhong)的(de)(de)(de)(de)(de)潛力,最(zui)近(jin)(jin)(jin)的(de)(de)(de)(de)(de)AI進(jin)(jin)展將(jiang)表(biao)示學(xue)(xue)習(xi)(xi)(xi)從(cong)歐幾里得結構擴展到圖(tu)(tu)拓撲,推動了(le)深(shen)度學(xue)(xue)習(xi)(xi)(xi)(DL)的(de)(de)(de)(de)(de)前(qian)沿,形成了(le)新的(de)(de)(de)(de)(de)模型流派(pai),即圖(tu)(tu)神經網(wang)絡(luo)(luo)(GNN)。與(yu)傳統(tong)的(de)(de)(de)(de)(de)DNN(如(ru)CNN、RNN)通(tong)常(chang)應(ying)(ying)用(yong)1D/2D卷積不(bu)(bu)同(tong),GNN引(yin)入了(le)圖(tu)(tu)嵌入技術,以從(cong)圖(tu)(tu)關系中(zhong)(zhong)消化(hua)信(xin)息。具體來說,它(ta)在(zai)輸入圖(tu)(tu)上迭代地應(ying)(ying)用(yong)鄰域聚合(he)(he),并(bing)通(tong)過神經網(wang)絡(luo)(luo)運算(suan)符從(cong)不(bu)(bu)同(tong)大(da)小的(de)(de)(de)(de)(de)子圖(tu)(tu)中(zhong)(zhong)捕(bu)捉層次(ci)模式。這(zhe)使(shi)得GNN能夠(gou)抽象和(he)學(xue)(xue)習(xi)(xi)(xi)特(te)定頂點、鏈(lian)接或整個圖(tu)(tu)的(de)(de)(de)(de)(de)屬性(xing),從(cong)而推廣(guang)到未觀察到的(de)(de)(de)(de)(de)圖(tu)(tu)。利用(yong)這(zhe)種(zhong)強大(da)的(de)(de)(de)(de)(de)表(biao)達能力,使(shi)用(yong)GNN進(jin)(jin)行學(xue)(xue)習(xi)(xi)(xi),即圖(tu)(tu)學(xue)(xue)習(xi)(xi)(xi)(GL),在(zai)圖(tu)(tu)分(fen)析(xi)性(xing)能方面表(biao)現出色,并(bing)支(zhi)持(chi)各種(zhong)與(yu)圖(tu)(tu)相關的(de)(de)(de)(de)(de)任務(wu),從(cong)節(jie)點分(fen)類和(he)鏈(lian)接預(yu)測(ce)到圖(tu)(tu)同(tong)構和(he)分(fen)類。

動機與邊緣圖智能的好處

鑒于(yu)圖(tu)(tu)(tu)智(zhi)能(neng)(GI)和(he)邊(bian)緣網(wang)絡在各(ge)自領域的(de)顯著成功(gong),圖(tu)(tu)(tu)與網(wang)絡之間(jian)的(de)內(nei)在聯系促使它們走(zou)向融合。GI提供(gong)了大(da)量的(de)經驗學習模型(如卷積和(he)遞歸GNN,圖(tu)(tu)(tu)自動編碼(ma)器)以及各(ge)種(zhong)學習范(fan)式,如遷移學習(TL)和(he)強化學習(RL),從圖(tu)(tu)(tu)數(shu)據中進行高級學習。相(xiang)應(ying)地,邊(bian)緣網(wang)絡通(tong)(tong)常包(bao)含豐富的(de)平臺集,包(bao)括(kuo)移動設備(bei)、機器人、車輛(liang)和(he)邊(bian)緣節點(dian),這些平臺承載了各(ge)種(zhong)基(ji)于(yu)圖(tu)(tu)(tu)的(de)應(ying)用,如交通(tong)(tong)預測和(he)網(wang)絡資源管理。它們的(de)雙向互(hu)動,GI增強和(he)優化邊(bian)緣網(wang)絡,而邊(bian)緣網(wang)絡支持和(he)加(jia)速(su)GI計算,形(xing)成了互(hu)相(xiang)賦(fu)能(neng)的(de)閉環,催生了它們的(de)整合互(hu)動,即“邊(bian)緣圖(tu)(tu)(tu)智(zhi)能(neng)”或簡稱“EGI”。具體來說(shuo),通(tong)(tong)過融合GI和(he)邊(bian)緣計算,EGI在以下三個方面提供(gong)了互(hu)惠的(de)好處:

互惠性能提升:隨著移動和(he)(he)物(wu)聯網設(she)備(bei)的快(kuai)速普及(ji),邊(bian)緣(yuan)網絡中生(sheng)成的數(shu)(shu)據(ju)(ju)在數(shu)(shu)量(liang)和(he)(he)模態(tai)上急劇(ju)增加(如(ru)(ru)物(wu)理信(xin)號、數(shu)(shu)字音(yin)頻和(he)(he)視覺內容)。據(ju)(ju)IDC預測,邊(bian)緣(yuan)網絡中的數(shu)(shu)十億物(wu)聯網設(she)備(bei)在2025年將產(chan)生(sheng)超過90 ZB的數(shu)(shu)據(ju)(ju)。這自(zi)然為修改(gai)、訓練和(he)(he)微調(diao)GI模型提供了數(shu)(shu)據(ju)(ju)溫床,從而(er)推動GI模型邁向更高程度的智能。反(fan)之,鑒于在邊(bian)緣(yuan)網絡中收集的豐富(fu)關系數(shu)(shu)據(ju)(ju),GI使現代圖分(fen)析能夠(gou)理解、診斷和(he)(he)優化邊(bian)緣(yuan)網絡,從而(er)提高網絡性能,如(ru)(ru)魯棒性和(he)(he)服務質量(liang)(QoS)。

互惠能力擴展:作為(wei)互(hu)聯(lian)網(wang)的(de)最后(hou)一英里,邊(bian)緣網(wang)絡(luo)(luo)不斷孵(fu)化(hua)圍繞終端用(yong)戶的(de)開(kai)創(chuang)性用(yong)戶中(zhong)心場景(jing),其中(zhong)許(xu)多(duo)場景(jing)可(ke)以抽象為(wei)圖(tu)(tu)(tu)(如(ru)無線傳(chuan)感器(qi)網(wang)絡(luo)(luo)、車(che)輛互(hu)聯(lian)網(wang))。這(zhe)些場景(jing)作為(wei)需(xu)求(qiu)側的(de)強大動力(li),推(tui)動GI的(de)發(fa)展和部署,擴大GI模型(xing)的(de)應用(yong)范圍。反過來(lai),將GI應用(yong)于(yu)邊(bian)緣網(wang)絡(luo)(luo)解(jie)鎖了(le)其在確保邊(bian)緣網(wang)絡(luo)(luo)免受異常影響、開(kai)發(fa)新的(de)基(ji)于(yu)圖(tu)(tu)(tu)的(de)應用(yong)以及智能服務圖(tu)(tu)(tu)相關(guan)任務方(fang)面的(de)擴展能力(li)。這(zhe)歸功(gong)于(yu)GI模型(xing)結合圖(tu)(tu)(tu)嵌入和卷積(ji)的(de)創(chuang)新機制,使GI能夠在圖(tu)(tu)(tu)中(zhong)進(jin)行學習和推(tui)理,例(li)如(ru)高(gao)精度節點識別和鏈接(jie)預測。

互惠技術民主化:技(ji)術(shu)民主化(hua)的(de)(de)(de)愿(yuan)景是(shi)使(shi)(shi)(shi)GI和(he)(he)邊(bian)緣(yuan)(yuan)計(ji)(ji)算更易于使(shi)(shi)(shi)用、理解(jie)和(he)(he)友好,惠及更多(duo)人,并已(yi)成為(wei)社會公(gong)益(yi)的(de)(de)(de)重要(yao)議程(cheng)。為(wei)此(ci),GI和(he)(he)邊(bian)緣(yuan)(yuan)網絡通(tong)(tong)過互相賦(fu)能來改進彼此(ci)。一方面(mian),邊(bian)緣(yuan)(yuan)網絡通(tong)(tong)過將智能計(ji)(ji)算拉近終(zhong)端用戶(hu),使(shi)(shi)(shi)其(qi)(qi)更易獲取和(he)(he)負擔得(de)(de)起(qi),從而民主化(hua)GI,使(shi)(shi)(shi)其(qi)(qi)在各種(zhong)場景中可用且(qie)個(ge)性化(hua)。另一方面(mian),通(tong)(tong)過廣(guang)泛應用GI于邊(bian)緣(yuan)(yuan)網絡,邊(bian)緣(yuan)(yuan)網絡也得(de)(de)以推(tui)廣(guang)。特(te)別是(shi),鑒(jian)于許多(duo)GI模型計(ji)(ji)算密集和(he)(he)數據依賴(lai)的(de)(de)(de)特(te)點,邊(bian)緣(yuan)(yuan)計(ji)(ji)算通(tong)(tong)過提供低延(yan)遲(chi)和(he)(he)減(jian)少帶寬預算的(de)(de)(de)計(ji)(ji)算資源,展示了其(qi)(qi)相對于云(yun)計(ji)(ji)算的(de)(de)(de)明(ming)顯(xian)優勢(shi),并與GI高(gao)度(du)契合。隨著圍繞終(zhong)端用戶(hu)的(de)(de)(de)GI的(de)(de)(de)普及,邊(bian)緣(yuan)(yuan)網絡也因而受到關注和(he)(he)部署,以實現推(tui)廣(guang)。

邊緣圖智能的范圍和分級

雖然EGI這(zhe)個術語較新,但研究和(he)實(shi)踐已早有開展(zhan)(zhan)(zhan)。自2015年GCN發展(zhan)(zhan)(zhan)以來,GI在(zai)AI社(she)區中日益流(liu)行,并引(yin)發了(le)在(zai)各種現實(shi)世界(jie)圖上(shang)構建(jian)GNN的(de)(de)浪潮。同時,邊(bian)緣(yuan)(yuan)(yuan)網絡(luo)和(he)邊(bian)緣(yuan)(yuan)(yuan)計算也從2019年開始迅速發展(zhan)(zhan)(zhan),并積極(ji)擁抱(bao)AI,催生(sheng)了(le)邊(bian)緣(yuan)(yuan)(yuan)AI或(huo)邊(bian)緣(yuan)(yuan)(yuan)智能的(de)(de)概念(nian)。目前,EGI的(de)(de)互(hu)動已引(yin)起業界(jie)和(he)學(xue)術界(jie)的(de)(de)廣泛關注(zhu),推動了(le)許(xu)多創新優化(hua)、技(ji)術和(he)應(ying)用(yong)在(zai)網絡(luo)邊(bian)緣(yuan)(yuan)(yuan)的(de)(de)發展(zhan)(zhan)(zhan),例如交通流(liu)量預測、基于位置的(de)(de)推薦和(he)車(che)輛軌跡預測。作為邊(bian)緣(yuan)(yuan)(yuan)AI的(de)(de)實(shi)質(zhi)性擴展(zhan)(zhan)(zhan),EGI揭示了(le)其(qi)(qi)基本問題(ti)——邊(bian)緣(yuan)(yuan)(yuan)網絡(luo)和(he)AI技(ji)術可(ke)以融(rong)合到(dao)多深,以及它們的(de)(de)融(rong)合可(ke)以帶來多少潛力(li)——并通過豐(feng)富的(de)(de)現實(shi)應(ying)用(yong)展(zhan)(zhan)(zhan)示了(le)其(qi)(qi)強大(da)的(de)(de)能力(li)。

盡管如此,對EGI的討論仍然局限于單方面的維度。現有(you)文獻要(yao)么(me)回顧(gu)了(le)圖學習的現狀,但對(dui)其在(zai)邊(bian)緣(yuan)網絡中的應用討(tao)論(lun)有(you)限,要(yao)么(me)特別關注將GI技術應用于某(mou)些特定的邊(bian)緣(yuan)場(chang)景(如交通領域(yu)、電網),卻(que)忽(hu)視了(le)一(yi)般邊(bian)緣(yuan)網絡的整體(ti)視野。最近的一(yi)些文獻也回顧(gu)了(le)GI在(zai)物聯(lian)網和(he)無線網絡背景下(xia)的進展(zhan),但主(zhu)要(yao)關注在(zai)其討(tao)論(lun)范圍內的GI應用,缺乏(fa)對(dui)“邊(bian)緣(yuan)服務(wu)于GI”方面的系統(tong)分類,這是EGI閉環的基本支(zhi)柱(zhu)之一(yi)。雖(sui)然(ran)邊(bian)緣(yuan)計(ji)(ji)算(suan)和(he)通信社區已廣泛研(yan)究邊(bian)緣(yuan)智能系統(tong),但大多數集中于一(yi)般AI計(ji)(ji)算(suan)系統(tong)或致力于傳統(tong)DL工作負載(如CNN或RNN),對(dui)具(ju)有(you)獨特能力和(he)特點(dian)的GI模型理解甚(shen)少。

本文主張EGI不應僅限于在邊緣數據上應用GI或在邊緣平臺上運行GI。相反(fan),GI和邊緣網絡(luo)正在(zai)融合,EGI應作為(wei)一個整體來看待,以反(fan)映GI和邊緣網絡(luo)之間的(de)(de)內在(zai)互動。這(zhe)表明它們(men)的(de)(de)雙向賦能需要全面探索,以便確定和衡量EGI的(de)(de)程度。具體來說,根據(ju)GI和邊緣網絡(luo)的(de)(de)融合程度,我們(men)可以將EGI分為(wei)六(liu)個級別,如(ru)圖2所(suo)示:

Level 0:在邊緣(yuan)網絡(luo)基礎設施中隱含的圖(tu)(tu)數據(ju),分析模型對圖(tu)(tu)結(jie)構一(yi)無所(suo)知。邊緣(yuan)計算(suan)系統也以(yi)無圖(tu)(tu)方式處理數據(ju)。換句(ju)話(hua)說(shuo),無論是模型側(ce)還是基礎設施側(ce),都(dou)沒有明確處理“圖(tu)(tu)”,因此它(ta)們被歸類為(wei)初(chu)始級別(bie)。

Level 1:從邊緣網絡(luo)收集的數據(ju)被建模為圖(tu)(tu)。1級系統(tong)比0級更進一步,賦(fu)予邊緣數據(ju)圖(tu)(tu)語義(使用一般計(ji)算方(fang)法)。

Level 2:以圖形式表示的邊(bian)緣數據(ju)通(tong)過(guo)傳(chuan)統圖計(ji)算算法(如(ru)PageRank和單源最短路(lu)徑(jing)算法)處理(li)。2級(ji)系統通(tong)過(guo)啟用圖導向計(ji)算能力優于1級(ji)。

Level 3:邊(bian)緣網絡(luo)(luo)利用圖(tu)數據進行GI模(mo)型(xing)推(tui)理,模(mo)型(xing)可以在(zai)云上訓練。與較低(di)級別相比,3級系統在(zai)邊(bian)緣網絡(luo)(luo)中(zhong)引入了AI,并擁抱GI模(mo)型(xing)。

Level 4:邊(bian)緣網絡利用(yong)圖(tu)數(shu)據進行GI模型(xing)訓(xun)練。4級(ji)和3級(ji)的關鍵區別在于(yu)能夠學習邊(bian)緣原生GI模型(xing),例如通過邊(bian)緣數(shu)據微調模型(xing)參數(shu)。

Level 5:交(jiao)互式EGI,GI和(he)(he)邊(bian)緣(yuan)網(wang)(wang)絡(luo)(luo)可以(yi)在運行時(shi)動態調整其配置(zhi),以(yi)實現最佳EGI性(xing)能。5級系統優于所有其他級別(bie),因為(wei)它們可以(yi)動態調整GI和(he)(he)邊(bian)緣(yuan)網(wang)(wang)絡(luo)(luo),而(er)較(jiao)低級別(bie)的都是靜(jing)態設置(zhi)。GI和(he)(he)邊(bian)緣(yuan)網(wang)(wang)絡(luo)(luo)的兩個視角達到(dao)融(rong)合,因為(wei)它們完(wan)全(quan)和(he)(he)諧。

EGI的(de)(de)評級(ji)主要分為三(san)個(ge)區(qu)(qu)間。第一個(ge)區(qu)(qu)間涵蓋0級(ji)到2級(ji),其(qi)中EGI與AI關系較小(xiao),甚至處理非圖數(shu)據。第二個(ge)區(qu)(qu)間包(bao)括3級(ji)和(he)4級(ji),其(qi)中EGI通過在邊(bian)緣網絡上進行推理或訓練,結(jie)合了(le)GI模型。第三(san)個(ge)區(qu)(qu)間是5級(ji),位于最高(gao)級(ji)別,因為其(qi)GI和(he)邊(bian)緣網絡深度融合,并(bing)且能(neng)夠動態適應(ying)不(bu)同(tong)的(de)(de)場景(jing)。隨著EGI系統(tong)達到更高(gao)的(de)(de)級(ji)別,其(qi)GI和(he)邊(bian)緣網絡的(de)(de)融合更深入。因此,GI的(de)(de)智能(neng)資源(yuan)和(he)邊(bian)緣網絡的(de)(de)基礎設(she)施資源(yuan)逐步被開發,以提高(gao)EGI性(xing)能(neng)。然而(er),這也可能(neng)帶來額外的(de)(de)開發努力(li)和(he)系統(tong)開銷。這種矛(mao)盾(dun)意味著在所有情況下沒有“銀彈(dan)”。相(xiang)反(fan),實(shi)際中的(de)(de)EGI應(ying)與用(yong)(yong)(yong)戶需求(qiu)保持一致,并(bing)考慮特(te)定應(ying)用(yong)(yong)(yong)場景(jing)和(he)可用(yong)(yong)(yong)資源(yuan)預算的(de)(de)聯合考慮。

摘要和貢獻

在本(ben)文(wen)中,我(wo)們(men)深入討論(lun)了(le)(le)GI和邊(bian)緣網(wang)絡(luo)(luo)如何(he)互(hu)惠,并對EGI的(de)(de)最新研究(jiu)工作進行了(le)(le)全面而具體的(de)(de)綜述。特別是,圍(wei)繞(rao)圖和網(wang)絡(luo)(luo)之間(jian)的(de)(de)內在聯系,本(ben)文(wen)首次揭(jie)示了(le)(le)GI和邊(bian)緣網(wang)絡(luo)(luo)之間(jian)的(de)(de)雙向互(hu)動(dong),并根據它們(men)的(de)(de)互(hu)惠互(hu)動(dong)提供了(le)(le)簡潔的(de)(de)評級。根據評級,我(wo)們(men)的(de)(de)綜述確定了(le)(le)EGI的(de)(de)四個主要推動(dong)因素,如圖3所示:

邊緣GI應(ying)用(第(di)四節):在(zai)邊緣網絡中(zhong)應(ying)用GI的典型(xing)應(ying)用場景和(he)用例(li);

邊緣網絡支(zhi)持GI(第五節):GI模(mo)型計(ji)算的范式,包括(kuo)在邊緣網絡上的模(mo)型訓練(lian)和推理;

GI優(you)化邊(bian)緣網(wang)絡(第六節):用于優(you)化邊(bian)緣網(wang)絡的實際GI方法,針對其具體功(gong)能;

EGI生態(tai)系統(第(di)七節):在硬件(jian)、軟件(jian)和基(ji)準測試方(fang)面(mian),為高性能EGI計算提供的(de)全棧基(ji)礎(chu)設(she)施(shi)支持。

總(zong)體而(er)言,這些關鍵推(tui)(tui)動(dong)因素可以(yi)很(hen)好地(di)適應(ying)閉環,即(ji)“邊(bian)(bian)緣(yuan)服(fu)務(wu)于(yu)GI”和(he)(he)“GI服(fu)務(wu)于(yu)邊(bian)(bian)緣(yuan)”,如圖1所述(shu)。在(zai)(zai)“邊(bian)(bian)緣(yuan)服(fu)務(wu)于(yu)GI”的(de)(de)(de)(de)過程(cheng)中,邊(bian)(bian)緣(yuan)網(wang)絡為圖智能提供物理平臺和(he)(he)軟(ruan)件堆棧,作為支持GI模(mo)型訓練和(he)(he)推(tui)(tui)理過程(cheng)的(de)(de)(de)(de)基礎(chu)設施。更具(ju)體地(di)說,GI模(mo)型的(de)(de)(de)(de)密集訓練工(gong)作負載可以(yi)通(tong)過邊(bian)(bian)緣(yuan)資源(yuan)(yuan)池(chi)(如聯邦(bang)邊(bian)(bian)緣(yuan)學習(xi))來(lai)解決(jue),并開發邊(bian)(bian)緣(yuan)推(tui)(tui)理技術以(yi)在(zai)(zai)資源(yuan)(yuan)受(shou)限和(he)(he)服(fu)務(wu)水平目標(SLO)要(yao)求下部署和(he)(he)加速GI模(mo)型。另一方面,在(zai)(zai)“GI服(fu)務(wu)于(yu)邊(bian)(bian)緣(yuan)”的(de)(de)(de)(de)過程(cheng)中,帶有這些推(tui)(tui)理解決(jue)方案的(de)(de)(de)(de)GI模(mo)型可以(yi)高效地(di)在(zai)(zai)邊(bian)(bian)緣(yuan)平臺上(shang)執行,從而(er)啟用(yong)各(ge)種基于(yu)圖的(de)(de)(de)(de)應(ying)用(yong)并優化邊(bian)(bian)緣(yuan)網(wang)絡的(de)(de)(de)(de)各(ge)個方面。除了(le)回(hui)顧這些關鍵推(tui)(tui)動(dong)因素,我們的(de)(de)(de)(de)綜(zong)述(shu)還提供了(le)GI和(he)(he)邊(bian)(bian)緣(yuan)網(wang)絡的(de)(de)(de)(de)基本而(er)友好的(de)(de)(de)(de)介紹,不(bu)需(xu)要(yao)GI或(huo)邊(bian)(bian)緣(yuan)計算的(de)(de)(de)(de)先驗知識。我們還討論(lun)了(le)未(wei)來(lai)EGI的(de)(de)(de)(de)各(ge)種開放挑戰(zhan)和(he)(he)研究方向,鼓(gu)勵(li)AI和(he)(he)通(tong)信社區共同推(tui)(tui)動(dong)EGI的(de)(de)(de)(de)發展,以(yi)惠(hui)及更廣泛的(de)(de)(de)(de)人群。

本文(wen)的其余部分(fen)組織如下:首先,第二節(jie)和(he)(he)第三節(jie)分(fen)別簡要回顧了圖智能和(he)(he)邊(bian)緣計(ji)算網(wang)絡的基(ji)礎知識(shi)。接下來,后(hou)續章節(jie)介紹了與四個推(tui)動因素相關的研(yan)究(jiu)(jiu)工作:邊(bian)緣GI應用(yong)(第四節(jie)),邊(bian)緣網(wang)絡支持(chi)GI(第五節(jie)),GI優化邊(bian)緣網(wang)絡(第六節(jie)),以及(ji)EGI生態(tai)系統(第七節(jie))。最后(hou),第八節(jie)討論(lun)了EGI的開放(fang)挑戰和(he)(he)未來研(yan)究(jiu)(jiu)機會,第九(jiu)節(jie)作出結(jie)論(lun)。表1列出了本文(wen)中使(shi)用(yong)的主(zhu)要縮寫。

付費5元查看完整內容

相關內容

機器視覺通過使機器能夠解讀和處理視覺數據,增強了工業應用中的自動化、質量控制和運營效率。盡管傳統的計算機視覺算法和方法仍被廣泛使用,但機器學習在當前的研究活動中已變得至關重要。特別是,生成式人工智能(AI)展示了通過數據增強、提高圖像分辨率以及識別質量控制中的異常,從而改善模式識別能力的潛力。然而,由于數據多樣性、計算需求以及對穩健驗證方法的必要性等挑戰,生成式AI在機器視覺中的應用仍處于早期階段。為全面了解生成式AI在工業機器視覺中的現狀,特別是最近的進展、應用和研究趨勢,進行了一次基于PRISMA指南的文獻綜述,分析了超過1200篇關于工業機器視覺中生成式AI的論文。我(wo)們的研(yan)(yan)究(jiu)發現揭示(shi)了當前研(yan)(yan)究(jiu)中的各種模式(shi),生成式(shi)AI的主(zhu)要(yao)用途是(shi)數據(ju)增強,用于分類和(he)目(mu)標檢測等機器視(shi)覺(jue)任務。此外,我(wo)們收(shou)集了一系列應(ying)用挑戰(zhan)及數據(ju)需(xu)求(qiu),以(yi)促進(jin)(jin)生成式(shi)AI在工業機器視(shi)覺(jue)中的成功(gong)應(ying)用。本綜述(shu)旨在為研(yan)(yan)究(jiu)人員提供對當前研(yan)(yan)究(jiu)中不(bu)同領域和(he)應(ying)用的深入見(jian)解,突出重要(yao)進(jin)(jin)展并識別未來工作的機會(hui)。

關鍵詞:機器視覺,生成式人工智能,深度學習,機器學習,制造業 1 引言

視覺檢查由受過培訓的檢查員執行,仍在工業中廣泛使用,但自20世紀70年代以來,自動化機器視覺已被系統地引入[1]。工業機器視覺是現代制造過程中的關鍵組成部分,涉及圖像的處理和分析,以自動化任務,包括質量檢查、物體或缺陷檢測以及過程控制[2]。傳統的計算機視覺系統依賴于需要手工設計特征的經典算法和技術,雖然這些方法在實踐中很有效,但在處理具有顯著變化性和不可預見情況的復雜場景時存在局限性[2, 3]。在20世紀80年代和90年代,隨著數字圖像處理、紋理和顏色分析等技術的進步,并有更好的硬件和軟件支持,機器視覺技術得到了發展[4]。當時,任務如質量檢測和物體識別主要依賴于預定義的算法[3, 5]。 20世紀90年代末和2000年代初,機器學習逐漸興起,支持向量機(SVM)[6]、隨機森林[7]和人工神經網絡(ANN)等模型使系統能夠以數據驅動的方式進行學習,提高了它們應對現實世界中變化和復雜性的能力[2]。機器視覺領域的真正革命出現在2010年代,隨著深度學習(DL)的發展。卷積神經網絡(CNN)在圖像處理任務中表現出極強的能力。CNN使機器能夠從原始圖像數據中自動學習層次特征,大大提高了在圖像分類、圖像分割、目標檢測、缺陷檢測和姿態估計等任務中的性能[4, 9-11]。像AlexNet、VGG和ResNet這樣的里程碑模型展示了深度學習的潛力,迅速在學術研究和工業界得到了廣泛應用[2]。 生成式人工智能(GenAI)代表了機器視覺演變中的最新前沿。與傳統的區分性模型用于分類或識別模式不同,GenAI模型能夠創建新的數據實例。雖然大多數流行的GenAI模型和創新設計是為了與人類互動,但探索GenAI如何改變工業制造領域具有重要的機會。類似于數據生成的替代方法如模擬需要專家領域知識和手動執行,因此在工業制造應用中,它們的使用僅限于預處理和后處理步驟。而GenAI方法一旦訓練完成,具有在制造過程中自動化當前手動處理步驟的潛力。由于其前景廣闊,GenAI已被應用于不同的機器視覺用例,其中每個提出的解決方案都是在特定用例約束下開發的。這些在機器視覺研究領域中積累的發現和經驗為其他從業者提供了寶貴的見解,幫助他們在自己的研究中使用GenAI。盡管已有關于將GenAI應用于各種機器視覺用例的知識,但據我們所知,目前尚無專門針對工業機器視覺中GenAI的綜述,匯總已有的應用經驗。現有的文獻綜述中提及GenAI在工業機器視覺中的應用時,主要關注的是AI在特定制造領域(如印刷電路板[12]、硅片[13]、一般缺陷識別[14]或表面缺陷識別[15])中的應用。 本綜述的貢獻包括:(i)概述了工業機器視覺應用中使用的GenAI方法,(ii)提供了應用GenAI時的工具、潛力和挑戰的概述,以及(iii)展示了GenAI在典型機器視覺應用中的益處,為從業者提供參考。 基于這些目標,我們提出了以下在本綜述中探討的研究問題

  1. 在工業機器視覺應用中使用了哪些GenAI模型架構?
  2. GenAI方法需要滿足哪些要求和特性才能適用于工業機器視覺領域?
  3. GenAI已成功應用于哪些工業機器視覺任務?

本文結構如下:第2節(jie)首先(xian)概述了(le)(le)(le)GenAI領域及其方法(fa)。第3節(jie)介紹(shao)了(le)(le)(le)文獻(xian)綜述的(de)(de)(de)方法(fa),包括對排(pai)除標準(zhun)的(de)(de)(de)推導(dao)和選擇信息提(ti)(ti)取的(de)(de)(de)詳細(xi)理(li)由。第4節(jie)展示(shi)了(le)(le)(le)搜索結(jie)果及其特征(zheng),并(bing)對提(ti)(ti)取的(de)(de)(de)數據進(jin)行了(le)(le)(le)廣(guang)泛分析。第5節(jie)討(tao)論了(le)(le)(le)文獻(xian)綜述的(de)(de)(de)結(jie)果,并(bing)結(jie)合研究問題進(jin)行探(tan)討(tao)。討(tao)論還包括對所用(yong)文獻(xian)綜述方法(fa)中的(de)(de)(de)偏見和局限性的(de)(de)(de)反思。最后,本文總(zong)結(jie)了(le)(le)(le)本綜述的(de)(de)(de)主(zhu)要結(jie)果,并(bing)提(ti)(ti)出(chu)了(le)(le)(le)在(zai)工業機(ji)器(qi)視覺任務中應用(yong)GenAI的(de)(de)(de)指導(dao)原(yuan)則。

2 生成式人工智能

生成式人工智能(GenAI)領域代表了旨在學習給定數據集 x∈Xx \in Xx∈X 的概率分布 p(x)p(x)p(x) 的半監督和無監督深度學習技術。在深度學習的背景下,GenAI方法使用參數化的人工神經網絡(ANNs)來近似概率分布 p(x)p(x)p(x),這些網絡通過權重 Θ\ThetaΘ 進行參數化,從而得到一個參數化模型 pΘ(x)p_\Theta(x)pΘ(x)。與判別式深度學習技術相比,判別式技術近似的是在給定輸入 xxx 的情況下,屬性(或標簽) yyy 上的概率分布 p(y∣x)p(y|x)p(y∣x),而生成模型 GGG 可以用于從訓練數據分布中抽取類似樣本 x~~pΘ(x~)\tilde{x} \sim p_\Theta(\tilde{x})x~~pΘ(x~) [16]。 對 p(x)p(x)p(x) 的估計可以分為顯式和隱式兩種方法。顯式估計模型嘗試提供概率密度 pΘ(x)p_\Theta(x)pΘ(x) 的參數化,而隱式估計模型則構建一個合成數據的隨機過程[17]。生成式人工智能的分類概述(參見圖1)總結了現有估計 pΘ(x)p_\Theta(x)pΘ(x) 的方法。不論模型類型如何,它們生成逼真高分辨率圖像的能力使得它們在解決諸如圖像修復、圖像去噪、圖像到圖像翻譯以及其他圖像編輯問題等經典計算機視覺任務中得到了廣泛應用。它們在學術基準測試中的出色表現,使其在機器視覺領域中具有重要意義。每種模型架構的進一步描述及其優缺點將在以下小節中進行探討。 3 研究方法

如引言(yan)中所述(shu),本篇文獻綜(zong)(zong)述(shu)旨(zhi)在(zai)概述(shu)生(sheng)成式(shi)人(ren)工智能(GenAI)在(zai)工業機(ji)器視覺(jue)領域中的(de)方法(fa)(fa)(fa)和(he)應用(yong),特別是針對制造(zao)業應用(yong)。該綜(zong)(zong)述(shu)采用(yong)了系統評價和(he)薈萃分析的(de)首(shou)選(xuan)報告項目(mu)(PRISMA)方法(fa)(fa)(fa)進行,PRISMA方法(fa)(fa)(fa)旨(zhi)在(zai)以透明、完整(zheng)和(he)準(zhun)(zhun)確的(de)方式(shi)呈現(xian)和(he)生(sheng)成系統性綜(zong)(zong)述(shu)[36]。基于該方法(fa)(fa)(fa),以下(xia)各節將介紹系統性綜(zong)(zong)述(shu)的(de)實施方法(fa)(fa)(fa)。首(shou)先,介紹了以排(pai)除標準(zhun)(zhun)形(xing)式(shi)出(chu)現(xian)的(de)適(shi)用(yong)性衡量標準(zhun)(zhun),以及搜索(suo)策略和(he)所使用(yong)的(de)文獻數(shu)據(ju)庫(參(can)見(jian)(jian)第3.1節)。接(jie)下(xia)來是研究(jiu)選(xuan)擇過程(參(can)見(jian)(jian)第3.2節)和(he)數(shu)據(ju)提取(參(can)見(jian)(jian)第3.3節)。

付費5元查看完整內容

圖(tu)(tu)(tu)(tu)機(ji)(ji)器(qi)學(xue)習(xi)(xi)(xi)(xi)(Graph ML)近年來(lai)(lai)(lai)取得了(le)(le)重(zhong)(zhong)(zhong)大(da)進展(zhan)。由于其在處理(li)圖(tu)(tu)(tu)(tu)結(jie)構(gou)數(shu)據(ju)(ju)方(fang)(fang)面的(de)(de)(de)(de)顯著(zhu)能(neng)(neng)(neng)(neng)力(li),圖(tu)(tu)(tu)(tu)機(ji)(ji)器(qi)學(xue)習(xi)(xi)(xi)(xi)技術已被廣(guang)(guang)泛應用(yong)(yong)于各種領(ling)域,包(bao)括金融(rong)、醫(yi)療和(he)交(jiao)(jiao)通等關鍵(jian)領(ling)域。盡管這(zhe)(zhe)些(xie)技術帶(dai)來(lai)(lai)(lai)了(le)(le)社會(hui)(hui)效益,但(dan)近期研究突顯了(le)(le)廣(guang)(guang)泛使用(yong)(yong)圖(tu)(tu)(tu)(tu)機(ji)(ji)器(qi)學(xue)習(xi)(xi)(xi)(xi)模(mo)型所帶(dai)來(lai)(lai)(lai)的(de)(de)(de)(de)重(zhong)(zhong)(zhong)大(da)安(an)(an)(an)全隱患。這(zhe)(zhe)些(xie)模(mo)型缺乏以(yi)安(an)(an)(an)全為(wei)(wei)中(zhong)(zhong)心的(de)(de)(de)(de)設計(ji),可(ke)(ke)能(neng)(neng)(neng)(neng)會(hui)(hui)產(chan)生不可(ke)(ke)靠的(de)(de)(de)(de)預測(ce)、表(biao)(biao)(biao)現出較差(cha)的(de)(de)(de)(de)泛化(hua)能(neng)(neng)(neng)(neng)力(li),并危(wei)及(ji)(ji)數(shu)據(ju)(ju)機(ji)(ji)密(mi)性。在金融(rong)欺詐檢測(ce)等高風險場景(jing)中(zhong)(zhong),這(zhe)(zhe)些(xie)漏洞(dong)可(ke)(ke)能(neng)(neng)(neng)(neng)會(hui)(hui)危(wei)及(ji)(ji)個人(ren)和(he)社會(hui)(hui)。因此(ci),優先開發安(an)(an)(an)全導向的(de)(de)(de)(de)圖(tu)(tu)(tu)(tu)機(ji)(ji)器(qi)學(xue)習(xi)(xi)(xi)(xi)模(mo)型以(yi)減輕(qing)這(zhe)(zhe)些(xie)風險并增強公眾對(dui)(dui)其應用(yong)(yong)的(de)(de)(de)(de)信心是至關重(zhong)(zhong)(zhong)要的(de)(de)(de)(de)。在這(zhe)(zhe)篇綜述論(lun)文(wen)中(zhong)(zhong),我(wo)們(men)探討了(le)(le)增強圖(tu)(tu)(tu)(tu)機(ji)(ji)器(qi)學(xue)習(xi)(xi)(xi)(xi)安(an)(an)(an)全性的(de)(de)(de)(de)三個關鍵(jian)方(fang)(fang)面:可(ke)(ke)靠性、泛化(hua)能(neng)(neng)(neng)(neng)力(li)和(he)機(ji)(ji)密(mi)性。我(wo)們(men)將(jiang)對(dui)(dui)每個方(fang)(fang)面的(de)(de)(de)(de)威(wei)脅進行(xing)分類(lei)(lei)(lei)和(he)分析(xi),分為(wei)(wei)模(mo)型威(wei)脅、數(shu)據(ju)(ju)威(wei)脅和(he)攻擊威(wei)脅三個類(lei)(lei)(lei)別。這(zhe)(zhe)一(yi)新(xin)穎的(de)(de)(de)(de)分類(lei)(lei)(lei)法指導了(le)(le)我(wo)們(men)對(dui)(dui)有效保護策(ce)略的(de)(de)(de)(de)審(shen)查(cha)。我(wo)們(men)的(de)(de)(de)(de)系統(tong)審(shen)查(cha)為(wei)(wei)未來(lai)(lai)(lai)開發實(shi)用(yong)(yong)的(de)(de)(de)(de)、安(an)(an)(an)全導向的(de)(de)(de)(de)圖(tu)(tu)(tu)(tu)機(ji)(ji)器(qi)學(xue)習(xi)(xi)(xi)(xi)模(mo)型奠定了(le)(le)基礎。此(ci)外,我(wo)們(men)強調了(le)(le)安(an)(an)(an)全圖(tu)(tu)(tu)(tu)機(ji)(ji)器(qi)學(xue)習(xi)(xi)(xi)(xi)實(shi)踐的(de)(de)(de)(de)重(zhong)(zhong)(zhong)要性,并提出了(le)(le)進一(yi)步研究這(zhe)(zhe)一(yi)關鍵(jian)領(ling)域的(de)(de)(de)(de)有前景(jing)方(fang)(fang)向。 近年來(lai)(lai)(lai),圖(tu)(tu)(tu)(tu)結(jie)構(gou)數(shu)據(ju)(ju)在包(bao)括藥物發現[15]、交(jiao)(jiao)通預測(ce)[76]和(he)疾病(bing)診斷[96]等廣(guang)(guang)泛的(de)(de)(de)(de)現實(shi)應用(yong)(yong)中(zhong)(zhong)變得越(yue)來(lai)(lai)(lai)越(yue)普(pu)遍。在這(zhe)(zhe)些(xie)領(ling)域中(zhong)(zhong),圖(tu)(tu)(tu)(tu)機(ji)(ji)器(qi)學(xue)習(xi)(xi)(xi)(xi)(Graph ML)在建(jian)模(mo)這(zhe)(zhe)些(xie)數(shu)據(ju)(ju)和(he)執行(xing)基于圖(tu)(tu)(tu)(tu)的(de)(de)(de)(de)預測(ce)任務中(zhong)(zhong)起著(zhu)關鍵(jian)作用(yong)(yong)[83],[187]。然而,隨著(zhu)圖(tu)(tu)(tu)(tu)機(ji)(ji)器(qi)學(xue)習(xi)(xi)(xi)(xi)應用(yong)(yong)范圍的(de)(de)(de)(de)擴大(da),人(ren)們(men)對(dui)(dui)其潛在安(an)(an)(an)全問(wen)題的(de)(de)(de)(de)擔(dan)憂也在加劇[37]。如(ru)果這(zhe)(zhe)些(xie)問(wen)題得不到充(chong)分解決,可(ke)(ke)能(neng)(neng)(neng)(neng)會(hui)(hui)產(chan)生嚴重(zhong)(zhong)(zhong)影響(xiang),尤其是在關鍵(jian)決策(ce)場景(jing)中(zhong)(zhong)[203]。例如(ru),在金融(rong)欺詐檢測(ce)中(zhong)(zhong),圖(tu)(tu)(tu)(tu)機(ji)(ji)器(qi)學(xue)習(xi)(xi)(xi)(xi)模(mo)型會(hui)(hui)分析(xi)交(jiao)(jiao)易網絡,其中(zhong)(zhong)節(jie)點(dian)代表(biao)(biao)(biao)用(yong)(yong)戶,邊表(biao)(biao)(biao)示(shi)交(jiao)(jiao)易[151]。數(shu)據(ju)(ju)分布的(de)(de)(de)(de)變化(hua)可(ke)(ke)能(neng)(neng)(neng)(neng)會(hui)(hui)錯誤地將(jiang)合法交(jiao)(jiao)易標記為(wei)(wei)欺詐[37]。此(ci)外,這(zhe)(zhe)些(xie)模(mo)型還可(ke)(ke)能(neng)(neng)(neng)(neng)對(dui)(dui)用(yong)(yong)戶隱私(si)構(gou)成風險[124]。這(zhe)(zhe)些(xie)安(an)(an)(an)全問(wen)題都(dou)會(hui)(hui)嚴重(zhong)(zhong)(zhong)削弱人(ren)們(men)對(dui)(dui)金融(rong)系統(tong)的(de)(de)(de)(de)信任。

盡管(guan)社會關注日益增加[147],[183],但(dan)對(dui)圖(tu)機(ji)(ji)器(qi)學習(Graph ML)安(an)全(quan)(quan)性的(de)全(quan)(quan)面理(li)解仍在形(xing)成中。這種缺(que)乏理(li)解阻礙了研究人員(yuan)和從(cong)業者系統地識別(bie)和解決(jue)(jue)與圖(tu)機(ji)(ji)器(qi)學習方法(fa)相關的(de)基本安(an)全(quan)(quan)問題(ti)。為了縮小這一(yi)差距,我(wo)們(men)的(de)綜述旨(zhi)在解決(jue)(jue)兩個關鍵問題(ti):(1) 圖(tu)機(ji)(ji)器(qi)學習安(an)全(quan)(quan)問題(ti)涉(she)及的(de)主要方面是(shi)什么(me)?(2) 在每個方面可能出(chu)現哪些具體(ti)威(wei)脅,以及如何有效應(ying)對(dui)這些威(wei)脅?為了解決(jue)(jue)第一(yi)個問題(ti),我(wo)們(men)引入了一(yi)種新(xin)穎(ying)的(de)分(fen)(fen)類(lei)法(fa),有助于(yu)對(dui)圖(tu)機(ji)(ji)器(qi)學習中的(de)安(an)全(quan)(quan)問題(ti)進行(xing)全(quan)(quan)面分(fen)(fen)類(lei)。為了解答第二個問題(ti),我(wo)們(men)對(dui)在我(wo)們(men)分(fen)(fen)類(lei)法(fa)中確定的(de)每個方面的(de)潛在威(wei)脅及其(qi)相應(ying)的(de)防護(hu)措施(shi)進行(xing)了系統回顧。

我們現在深(shen)入探討第(di)一個(ge)問(wen)題,確定圖機器學習(Graph ML)安全問(wen)題的三個(ge)關鍵(jian)方面(mian):可靠性(xing)、泛化能力和機密性(xing)。我們分(fen)別討論每個(ge)方面(mian)如下:

(1) 可(ke)(ke)(ke)靠(kao)性(xing)(xing)(xing):圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)模(mo)(mo)型(xing)(xing)(xing)經常(chang)面(mian)臨(lin)低質(zhi)(zhi)(zhi)量(liang)訓(xun)(xun)練數(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)(de)(de)(de)(de)挑戰,這(zhe)(zhe)(zhe)可(ke)(ke)(ke)能(neng)(neng)(neng)源(yuan)(yuan)于(yu)(yu)數(shu)(shu)(shu)據(ju)(ju)(ju)噪聲(sheng)[47], [188]或惡意攻擊(ji)[13], [49]。在(zai)(zai)(zai)此(ci),我(wo)們(men)將可(ke)(ke)(ke)靠(kao)性(xing)(xing)(xing)定義(yi)為模(mo)(mo)型(xing)(xing)(xing)即(ji)使(shi)在(zai)(zai)(zai)面(mian)對(dui)劣質(zhi)(zhi)(zhi)輸入時也(ye)能(neng)(neng)(neng)始終產生(sheng)高質(zhi)(zhi)(zhi)量(liang)輸出的(de)(de)(de)(de)(de)(de)能(neng)(neng)(neng)力。可(ke)(ke)(ke)靠(kao)性(xing)(xing)(xing)在(zai)(zai)(zai)圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)任務(wu)中(zhong)(zhong)高質(zhi)(zhi)(zhi)量(liang)訓(xun)(xun)練數(shu)(shu)(shu)據(ju)(ju)(ju)稀(xi)缺時尤為關鍵[6], [11]。例(li)(li)如(ru),在(zai)(zai)(zai)藥物(wu)發(fa)現(xian)中(zhong)(zhong),圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)模(mo)(mo)型(xing)(xing)(xing)預(yu)(yu)測(ce)(ce)新(xin)化(hua)合物(wu)的(de)(de)(de)(de)(de)(de)化(hua)學(xue)(xue)(xue)(xue)性(xing)(xing)(xing)質(zhi)(zhi)(zhi),并(bing)以分(fen)子圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)的(de)(de)(de)(de)(de)(de)形式建(jian)模(mo)(mo)[91]。這(zhe)(zhe)(zhe)包括評估毒性(xing)(xing)(xing)以排(pai)除有(you)嚴重(zhong)(zhong)副作(zuo)用(yong)(yong)的(de)(de)(de)(de)(de)(de)藥物(wu)[115]。由于(yu)(yu)實(shi)驗驗證成(cheng)本(ben)(ben)高昂,高質(zhi)(zhi)(zhi)量(liang)的(de)(de)(de)(de)(de)(de)訓(xun)(xun)練數(shu)(shu)(shu)據(ju)(ju)(ju)標簽難以獲得。因此(ci),在(zai)(zai)(zai)面(mian)對(dui)低質(zhi)(zhi)(zhi)量(liang)數(shu)(shu)(shu)據(ju)(ju)(ju)時保持模(mo)(mo)型(xing)(xing)(xing)的(de)(de)(de)(de)(de)(de)可(ke)(ke)(ke)靠(kao)性(xing)(xing)(xing)對(dui)于(yu)(yu)確(que)(que)保準確(que)(que)預(yu)(yu)測(ce)(ce)至關重(zhong)(zhong)要[75]。 (2) 泛(fan)(fan)化(hua)能(neng)(neng)(neng)力:泛(fan)(fan)化(hua)能(neng)(neng)(neng)力指圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)模(mo)(mo)型(xing)(xing)(xing)在(zai)(zai)(zai)各種場景(jing)中(zhong)(zhong),尤其是(shi)在(zai)(zai)(zai)基礎數(shu)(shu)(shu)據(ju)(ju)(ju)分(fen)布(bu)發(fa)生(sheng)變化(hua)時,仍能(neng)(neng)(neng)表現(xian)良(liang)好的(de)(de)(de)(de)(de)(de)能(neng)(neng)(neng)力[91]。這(zhe)(zhe)(zhe)在(zai)(zai)(zai)新(xin)出現(xian)的(de)(de)(de)(de)(de)(de)未見過的(de)(de)(de)(de)(de)(de)圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)數(shu)(shu)(shu)據(ju)(ju)(ju)頻繁出現(xian)的(de)(de)(de)(de)(de)(de)環境中(zhong)(zhong)特別重(zhong)(zhong)要[175]。例(li)(li)如(ru),在(zai)(zai)(zai)疫(yi)情預(yu)(yu)防(fang)中(zhong)(zhong),準確(que)(que)預(yu)(yu)測(ce)(ce)未來感(gan)染(ran)病例(li)(li)對(dui)于(yu)(yu)有(you)效(xiao)分(fen)配(pei)(pei)醫(yi)療資源(yuan)(yuan)至關重(zhong)(zhong)要[198]。圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)廣泛(fan)(fan)用(yong)(yong)于(yu)(yu)利(li)用(yong)(yong)不(bu)同地(di)理(li)區(qu)(qu)(qu)域(如(ru)縣、市、州(zhou)或國家)之(zhi)間的(de)(de)(de)(de)(de)(de)遷移路徑(jing)連接的(de)(de)(de)(de)(de)(de)拓撲數(shu)(shu)(shu)據(ju)(ju)(ju)來預(yu)(yu)測(ce)(ce)確(que)(que)診(zhen)病例(li)(li)[145]。然而,疫(yi)情通(tong)常(chang)會(hui)在(zai)(zai)(zai)不(bu)同地(di)區(qu)(qu)(qu)同步爆(bao)發(fa),導(dao)致(zhi)圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)模(mo)(mo)型(xing)(xing)(xing)的(de)(de)(de)(de)(de)(de)訓(xun)(xun)練和(he)推(tui)理(li)數(shu)(shu)(shu)據(ju)(ju)(ju)來自不(bu)同區(qu)(qu)(qu)域[128]。這(zhe)(zhe)(zhe)些模(mo)(mo)型(xing)(xing)(xing)缺乏泛(fan)(fan)化(hua)能(neng)(neng)(neng)力可(ke)(ke)(ke)能(neng)(neng)(neng)導(dao)致(zhi)預(yu)(yu)測(ce)(ce)的(de)(de)(de)(de)(de)(de)感(gan)染(ran)率(lv)與實(shi)際(ji)情況顯著偏離,可(ke)(ke)(ke)能(neng)(neng)(neng)導(dao)致(zhi)醫(yi)療資源(yuan)(yuan)的(de)(de)(de)(de)(de)(de)錯誤分(fen)配(pei)(pei)。 (3) 機(ji)(ji)(ji)密(mi)性(xing)(xing)(xing):這(zhe)(zhe)(zhe)一(yi)方面(mian)側重(zhong)(zhong)于(yu)(yu)保護圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)模(mo)(mo)型(xing)(xing)(xing)的(de)(de)(de)(de)(de)(de)完整性(xing)(xing)(xing)和(he)其處(chu)理(li)的(de)(de)(de)(de)(de)(de)敏感(gan)數(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)(de)(de)(de)(de)隱(yin)私[35], [43]。機(ji)(ji)(ji)密(mi)性(xing)(xing)(xing)在(zai)(zai)(zai)處(chu)理(li)個人數(shu)(shu)(shu)據(ju)(ju)(ju)的(de)(de)(de)(de)(de)(de)圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)應(ying)用(yong)(yong)中(zhong)(zhong)特別重(zhong)(zhong)要[203]。例(li)(li)如(ru),圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)廣泛(fan)(fan)用(yong)(yong)于(yu)(yu)管(guan)理(li)電子健康記錄(lu)(EHR),用(yong)(yong)于(yu)(yu)疾病診(zhen)斷和(he)治療預(yu)(yu)測(ce)(ce)等任務(wu)[107]。在(zai)(zai)(zai)這(zhe)(zhe)(zhe)些應(ying)用(yong)(yong)中(zhong)(zhong),各種信(xin)息(xi)(如(ru)患者(zhe)姓名和(he)診(zhen)斷結果(guo))被互(hu)相連接形成(cheng)異構圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)[103]。然而,圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)中(zhong)(zhong)的(de)(de)(de)(de)(de)(de)機(ji)(ji)(ji)密(mi)性(xing)(xing)(xing)面(mian)臨(lin)的(de)(de)(de)(de)(de)(de)一(yi)個重(zhong)(zhong)大(da)挑戰是(shi)消(xiao)息(xi)傳(chuan)遞(di)機(ji)(ji)(ji)制的(de)(de)(de)(de)(de)(de)廣泛(fan)(fan)使(shi)用(yong)(yong),這(zhe)(zhe)(zhe)促進了(le)(le)節(jie)點之(zhi)間的(de)(de)(de)(de)(de)(de)信(xin)息(xi)流動[9], [37], [140]。這(zhe)(zhe)(zhe)個過程可(ke)(ke)(ke)能(neng)(neng)(neng)會(hui)無意中(zhong)(zhong)讓敏感(gan)數(shu)(shu)(shu)據(ju)(ju)(ju)到達惡意節(jie)點,導(dao)致(zhi)未經授(shou)權實(shi)體(ti)可(ke)(ke)(ke)能(neng)(neng)(neng)泄露(lu)私人信(xin)息(xi),從(cong)而危及患者(zhe)隱(yin)私[54]。 我(wo)們(men)接著通(tong)過識別三(san)(san)種類型(xing)(xing)(xing)的(de)(de)(de)(de)(de)(de)威脅(xie)(xie)來解(jie)(jie)決(jue)第二個問(wen)題(ti),這(zhe)(zhe)(zhe)些威脅(xie)(xie)會(hui)損害圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)的(de)(de)(de)(de)(de)(de)安全性(xing)(xing)(xing),適用(yong)(yong)于(yu)(yu)之(zhi)前(qian)討論的(de)(de)(de)(de)(de)(de)所(suo)有(you)方面(mian)。具體(ti)來說,威脅(xie)(xie)包括:(1) 模(mo)(mo)型(xing)(xing)(xing)威脅(xie)(xie),源(yuan)(yuan)于(yu)(yu)為圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)結構設計(ji)的(de)(de)(de)(de)(de)(de)固有(you)學(xue)(xue)(xue)(xue)習(xi)(xi)機(ji)(ji)(ji)制,如(ru)大(da)多數(shu)(shu)(shu)圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)模(mo)(mo)型(xing)(xing)(xing)中(zhong)(zhong)普(pu)遍存在(zai)(zai)(zai)的(de)(de)(de)(de)(de)(de)消(xiao)息(xi)傳(chuan)遞(di);(2) 數(shu)(shu)(shu)據(ju)(ju)(ju)威脅(xie)(xie),源(yuan)(yuan)于(yu)(yu)圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)拓撲中(zhong)(zhong)節(jie)點之(zhi)間的(de)(de)(de)(de)(de)(de)復雜相互(hu)關系;(3) 攻擊(ji)威脅(xie)(xie),因圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)模(mo)(mo)型(xing)(xing)(xing)在(zai)(zai)(zai)面(mian)對(dui)對(dui)抗性(xing)(xing)(xing)攻擊(ji)時的(de)(de)(de)(de)(de)(de)脆弱性(xing)(xing)(xing)而發(fa)生(sheng)。在(zai)(zai)(zai)本(ben)(ben)綜述(shu)(shu)中(zhong)(zhong),我(wo)們(men)旨在(zai)(zai)(zai)全面(mian)理(li)解(jie)(jie)每(mei)種威脅(xie)(xie)類型(xing)(xing)(xing)的(de)(de)(de)(de)(de)(de)起源(yuan)(yuan),并(bing)系統(tong)概(gai)述(shu)(shu)當前(qian)的(de)(de)(de)(de)(de)(de)防(fang)護技(ji)術以減(jian)輕這(zhe)(zhe)(zhe)些風(feng)險。 貢獻(xian):在(zai)(zai)(zai)本(ben)(ben)綜述(shu)(shu)中(zhong)(zhong),我(wo)們(men)對(dui)圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)中(zhong)(zhong)的(de)(de)(de)(de)(de)(de)安全問(wen)題(ti)進行了(le)(le)全面(mian)調查(cha),并(bing)以結構化(hua)框架組織了(le)(le)圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)安全的(de)(de)(de)(de)(de)(de)關鍵方面(mian)(如(ru)圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)1所(suo)示)。此(ci)外,我(wo)們(men)概(gai)述(shu)(shu)了(le)(le)每(mei)個方面(mian)的(de)(de)(de)(de)(de)(de)三(san)(san)種安全威脅(xie)(xie),并(bing)深(shen)入探討了(le)(le)在(zai)(zai)(zai)圖(tu)(tu)(tu)(tu)(tu)(tu)(tu)(tu)機(ji)(ji)(ji)器(qi)(qi)(qi)學(xue)(xue)(xue)(xue)習(xi)(xi)背景(jing)下解(jie)(jie)決(jue)這(zhe)(zhe)(zhe)些問(wen)題(ti)的(de)(de)(de)(de)(de)(de)具體(ti)防(fang)護技(ji)術。總之(zhi),我(wo)們(men)的(de)(de)(de)(de)(de)(de)工作(zuo)對(dui)研究社區(qu)(qu)(qu)做出了(le)(le)三(san)(san)項重(zhong)(zhong)要貢獻(xian)。

圖(tu)機(ji)器學習(xi)安(an)全(quan)性的新(xin)分(fen)(fen)類法:我們引入了一種新(xin)的分(fen)(fen)類法來分(fen)(fen)類圖(tu)機(ji)器學習(xi)中的安(an)全(quan)問題,詳細說明了三(san)個(ge)核心方面:可靠(kao)性、泛化能力和機(ji)密性。

威(wei)(wei)脅(xie)與防護措施的(de)全面(mian)概述:我們識別(bie)了所有(you)安全方面(mian)共有(you)的(de)三(san)種不同類型的(de)威(wei)(wei)脅(xie)。在(zai)此基礎上,我們進一步探(tan)討了針對每種特(te)定威(wei)(wei)脅(xie)的(de)防護技術。

圖機(ji)器學(xue)習安(an)全性的未(wei)(wei)來研究(jiu)(jiu)潛(qian)力:我們(men)探(tan)討了在圖機(ji)器學(xue)習領(ling)域提升(sheng)安(an)全性方面的未(wei)(wei)解決挑戰和新興機(ji)會(hui),旨在激發未(wei)(wei)來的研究(jiu)(jiu)項目(mu)。

與其(qi)他綜述(shu)的(de)比較:已有一些(xie)綜述(shu)調查了圖(tu)機器學(xue)習(xi)的(de)不同類(lei)型(xing)的(de)安(an)全問(wen)題及(ji)其(qi)對策[61], [80], [91], [147], [167], [182], [210]。然而(er),這些(xie)綜述(shu)通常缺乏對圖(tu)機器學(xue)習(xi)安(an)全性的(de)全面理解。其(qi)他相關綜述(shu)則側重于(yu)一個不同但相關的(de)話題:可信度[37], [203]。大多數這些(xie)研究主要(yao)關注對抗性攻擊,而(er)通常忽視了專門針對圖(tu)機器學(xue)習(xi)和圖(tu)數據的(de)安(an)全問(wen)題。與上(shang)述(shu)工作不同,在本(ben)綜述(shu)中(zhong),我們(men)不僅(jin)借助新提出的(de)分類(lei)法系(xi)統回顧了圖(tu)機器學(xue)習(xi)的(de)更(geng)廣(guang)泛的(de)安(an)全概念,還詳細闡述(shu)了不同類(lei)型(xing)的(de)威脅及(ji)其(qi)適當的(de)防護(hu)技術。我們(men)在表1中(zhong)提供了詳細的(de)差(cha)異(yi)比較。

由于圖(tu)數據(ju)的(de)(de)(de)復雜性(xing)(xing),獲取(qu)高質(zhi)量(liang)的(de)(de)(de)訓練(lian)數據(ju)是一個重大挑戰[47], [49]。當模(mo)型(xing)在(zai)質(zhi)量(liang)較差的(de)(de)(de)數據(ju)上(shang)訓練(lian)時,其性(xing)(xing)能(neng)(neng)可能(neng)(neng)會受到嚴重影響[188]。我們將可靠(kao)性(xing)(xing)定義為(wei)模(mo)型(xing)即使在(zai)低質(zhi)量(liang)數據(ju)上(shang)訓練(lian)時也能(neng)(neng)保持一致性(xing)(xing)能(neng)(neng)的(de)(de)(de)能(neng)(neng)力(li)。缺乏可靠(kao)性(xing)(xing)會使模(mo)型(xing)面臨噪聲或被篡改數據(ju)帶(dai)來的(de)(de)(de)風險,可能(neng)(neng)導致錯誤預測(ce)(ce)。在(zai)決策過(guo)程中,這個問題尤為(wei)關(guan)(guan)鍵,因(yin)為(wei)這種不(bu)準確可能(neng)(neng)導致不(bu)可接受的(de)(de)(de)結果[42], [67]。例如(ru),在(zai)金融欺(qi)詐(zha)檢(jian)測(ce)(ce)中,準確識別(bie)欺(qi)詐(zha)交易(yi)至關(guan)(guan)重要(yao)。缺乏可靠(kao)性(xing)(xing)的(de)(de)(de)模(mo)型(xing)可能(neng)(neng)無法檢(jian)測(ce)(ce)到欺(qi)詐(zha)活動,或錯誤地將合法交易(yi)標記為(wei)欺(qi)詐(zha),從(cong)而導致財務損失。因(yin)此,增(zeng)強圖(tu)機器學習(xi)模(mo)型(xing)的(de)(de)(de)可靠(kao)性(xing)(xing)對于確保其在(zai)關(guan)(guan)鍵應用(yong)中的(de)(de)(de)安全(quan)性(xing)(xing)和可信賴性(xing)(xing)至關(guan)(guan)重要(yao),最終(zhong)減少錯誤結果的(de)(de)(de)風險[120], [126]。

圖(tu)(tu)機(ji)器學(xue)習(xi)的(de)(de)(de)可(ke)(ke)(ke)靠(kao)性(xing)可(ke)(ke)(ke)能從(cong)多個(ge)角度受到(dao)影響(xiang)。首先,模(mo)型(xing)(xing)在處理不(bu)確定數據(ju)方(fang)面(mian)的(de)(de)(de)固(gu)有限制可(ke)(ke)(ke)能導致在不(bu)熟(shu)悉情況下的(de)(de)(de)過度自信(xin)預測[65]。與(yu)圖(tu)(tu)像或文本(ben)數據(ju)不(bu)同,圖(tu)(tu)數據(ju)涉(she)(she)及(ji)節(jie)點(dian)之(zhi)間的(de)(de)(de)復雜交互,這些連(lian)接中(zhong)的(de)(de)(de)不(bu)確定性(xing)會影響(xiang)模(mo)型(xing)(xing)預測[226]。其次,訓(xun)練(lian)數據(ju)中(zhong)的(de)(de)(de)異常情況,例如(ru)顯(xian)著(zhu)偏離典型(xing)(xing)分(fen)布(bu)的(de)(de)(de)節(jie)點(dian)和圖(tu)(tu),對模(mo)型(xing)(xing)性(xing)能和可(ke)(ke)(ke)靠(kao)性(xing)構(gou)(gou)成重大(da)威脅(xie)[6], [47]。由于(yu)圖(tu)(tu)機(ji)器學(xue)習(xi)模(mo)型(xing)(xing)從(cong)相鄰節(jie)點(dian)聚合(he)信(xin)息,異常節(jie)點(dian)可(ke)(ke)(ke)能影響(xiang)整(zheng)個(ge)圖(tu)(tu)中(zhong)學(xue)習(xi)到(dao)的(de)(de)(de)表示,進(jin)而影響(xiang)整(zheng)體模(mo)型(xing)(xing)可(ke)(ke)(ke)靠(kao)性(xing)。第三,毒化攻(gong)擊(ji)涉(she)(she)及(ji)將惡意構(gou)(gou)造(zao)的(de)(de)(de)數據(ju)插(cha)入(ru)訓(xun)練(lian)集以(yi)(yi)破壞(huai)模(mo)型(xing)(xing)的(de)(de)(de)可(ke)(ke)(ke)靠(kao)性(xing)[93]。在圖(tu)(tu)拓撲中(zhong),攻(gong)擊(ji)者可(ke)(ke)(ke)以(yi)(yi)操縱少(shao)數節(jie)點(dian)以(yi)(yi)不(bu)利(li)地影響(xiang)其他(ta)遠處節(jie)點(dian),使這些攻(gong)擊(ji)特別(bie)難以(yi)(yi)檢測[80]。

大多數(shu)現有的(de)(de)(de)(de)圖機器(qi)(qi)學(xue)習模(mo)(mo)型是基于推理時的(de)(de)(de)(de)數(shu)據(ju)(ju)分(fen)(fen)布與(yu)訓(xun)(xun)練時相同的(de)(de)(de)(de)假設而(er)開(kai)(kai)發(fa)的(de)(de)(de)(de)[91]。然而(er),由于圖數(shu)據(ju)(ju)結(jie)構的(de)(de)(de)(de)復雜性,這(zhe)一假設在實踐中(zhong)常常不(bu)(bu)成立。因此,泛化(hua)能(neng)力(li)——即在不(bu)(bu)同數(shu)據(ju)(ju)分(fen)(fen)布中(zhong)保(bao)持(chi)模(mo)(mo)型性能(neng)一致的(de)(de)(de)(de)能(neng)力(li)——對于圖機器(qi)(qi)學(xue)習模(mo)(mo)型的(de)(de)(de)(de)安全(quan)部署(shu)至(zhi)關(guan)重要(yao)。例(li)如(ru),在藥物發(fa)現中(zhong),圖機器(qi)(qi)學(xue)習模(mo)(mo)型通常負責(ze)預測新(xin)藥的(de)(de)(de)(de)毒性,這(zhe)些(xie)新(xin)藥可(ke)能(neng)與(yu)訓(xun)(xun)練數(shu)據(ju)(ju)分(fen)(fen)布顯著不(bu)(bu)同。未能(neng)有效地泛化(hua)到這(zhe)些(xie)新(xin)藥會導致不(bu)(bu)可(ke)靠的(de)(de)(de)(de)預測,從而(er)可(ke)能(neng)危(wei)及醫療治(zhi)療的(de)(de)(de)(de)開(kai)(kai)發(fa)[30], [63]。

盡管泛(fan)(fan)(fan)(fan)化能(neng)(neng)(neng)力(li)(li)(li)對(dui)于(yu)確保圖機器(qi)(qi)學(xue)習(xi)(xi)(xi)模(mo)型(xing)(xing)(xing)的(de)(de)(de)(de)安(an)全性至關(guan)重(zhong)要(yao),但實現一致(zhi)模(mo)型(xing)(xing)(xing)泛(fan)(fan)(fan)(fan)化能(neng)(neng)(neng)力(li)(li)(li)的(de)(de)(de)(de)過程(cheng)中存在(zai)各種威(wei)(wei)脅。首先,模(mo)型(xing)(xing)(xing)本(ben)身的(de)(de)(de)(de)威(wei)(wei)脅源于(yu)其設(she)(she)計中的(de)(de)(de)(de)固有(you)限制(zhi),導致(zhi)模(mo)型(xing)(xing)(xing)可能(neng)(neng)(neng)無法有(you)效適應訓練(lian)過程(cheng)中遇到的(de)(de)(de)(de)目(mu)標(biao)(未標(biao)記)分布(bu)[111], [222]。當訓練(lian)涉及來自不同分布(bu)的(de)(de)(de)(de)數(shu)據(ju)時,設(she)(she)計增強泛(fan)(fan)(fan)(fan)化能(neng)(neng)(neng)力(li)(li)(li)的(de)(de)(de)(de)模(mo)型(xing)(xing)(xing)對(dui)于(yu)圖機器(qi)(qi)學(xue)習(xi)(xi)(xi)模(mo)型(xing)(xing)(xing)的(de)(de)(de)(de)廣泛(fan)(fan)(fan)(fan)應用(yong)至關(guan)重(zhong)要(yao)[110]。其次(ci),數(shu)據(ju)威(wei)(wei)脅源于(yu)在(zai)訓練(lian)過程(cheng)中未曾見過的(de)(de)(de)(de)數(shu)據(ju)分布(bu),可能(neng)(neng)(neng)會削弱圖機器(qi)(qi)學(xue)習(xi)(xi)(xi)模(mo)型(xing)(xing)(xing)在(zai)新場景中的(de)(de)(de)(de)表現[92]。由(you)于(yu)在(zai)訓練(lian)過程(cheng)中無法觀測到目(mu)標(biao)分布(bu),圖機器(qi)(qi)學(xue)習(xi)(xi)(xi)模(mo)型(xing)(xing)(xing)在(zai)有(you)限數(shu)據(ju)的(de)(de)(de)(de)情況下(xia)提升(sheng)泛(fan)(fan)(fan)(fan)化能(neng)(neng)(neng)力(li)(li)(li)變得具有(you)挑(tiao)戰性。第三,規避攻擊(ji)對(dui)圖機器(qi)(qi)學(xue)習(xi)(xi)(xi)模(mo)型(xing)(xing)(xing)的(de)(de)(de)(de)泛(fan)(fan)(fan)(fan)化能(neng)(neng)(neng)力(li)(li)(li)構成重(zhong)大威(wei)(wei)脅。這些(xie)(xie)攻擊(ji)在(zai)推(tui)理過程(cheng)中故意(yi)操縱輸(shu)入數(shu)據(ju)以引發(fa)預測錯誤并損害模(mo)型(xing)(xing)(xing)安(an)全性[52], [98]。這些(xie)(xie)威(wei)(wei)脅從多個(ge)角度損害模(mo)型(xing)(xing)(xing)的(de)(de)(de)(de)泛(fan)(fan)(fan)(fan)化能(neng)(neng)(neng)力(li)(li)(li),因此需要(yao)量身定制(zhi)的(de)(de)(de)(de)防護技術來解決(jue)這些(xie)(xie)問題。下(xia)文中,我們介紹了一些(xie)(xie)增強圖機器(qi)(qi)學(xue)習(xi)(xi)(xi)模(mo)型(xing)(xing)(xing)泛(fan)(fan)(fan)(fan)化能(neng)(neng)(neng)力(li)(li)(li)的(de)(de)(de)(de)策略(lve)。

在(zai)圖機器學(xue)習(Graph ML)中,保密性包括對數據(ju)、模(mo)型(xing)預測和模(mo)型(xing)本(ben)身的敏感信(xin)(xin)息(xi)的保護【122】。這(zhe)種保護對于確保用(yong)戶隱私和滿足法律合規性要求(qiu)至(zhi)關重要【183】。例(li)如,在(zai)使用(yong)圖機器學(xue)習模(mo)型(xing)進行(xing)社(she)交網絡用(yong)戶分類時,必須防止在(zai)訓練和推理階段(duan)無意泄露用(yong)戶信(xin)(xin)息(xi)【22】。

在(zai)這(zhe)里,我們介紹(shao)如(ru)圖4所示的(de)(de)(de)(de)三種保密(mi)性(xing)(xing)威(wei)脅。首先,模(mo)(mo)型(xing)(xing)威(wei)脅來源(yuan)(yuan)于模(mo)(mo)型(xing)(xing)固有的(de)(de)(de)(de)設(she)計缺(que)陷,這(zhe)些(xie)缺(que)陷可(ke)能通(tong)過(guo)模(mo)(mo)型(xing)(xing)的(de)(de)(de)(de)預測或(huo)架構(gou)泄露敏(min)感(gan)信息,從而引發(fa)隱(yin)私問題【169】。這(zhe)一問題在(zai)基于圖的(de)(de)(de)(de)模(mo)(mo)型(xing)(xing)中特別(bie)明顯(xian),因(yin)為消息傳(chuan)遞機制(zhi)可(ke)能無(wu)意中暴(bao)露來自鄰近節點的(de)(de)(de)(de)敏(min)感(gan)信息【22】【41】【141】。其次,當(dang)訓練(lian)數(shu)據分(fen)布在(zai)多個源(yuan)(yuan)時,數(shu)據威(wei)脅會出現(xian),可(ke)能導致敏(min)感(gan)信息的(de)(de)(de)(de)無(wu)意曝光【70】。鑒于圖數(shu)據的(de)(de)(de)(de)結(jie)構(gou)性(xing)(xing),確(que)保每(mei)個數(shu)據源(yuan)(yuan)的(de)(de)(de)(de)保密(mi)性(xing)(xing)是一項重大挑戰【5】【87】。第三,攻擊威(wei)脅直(zhi)接通(tong)過(guo)未經授權(quan)的(de)(de)(de)(de)模(mo)(mo)型(xing)(xing)克隆(long)或(huo)功能克隆(long)危害模(mo)(mo)型(xing)(xing)的(de)(de)(de)(de)保密(mi)性(xing)(xing)【185】。這(zhe)不僅侵犯了隱(yin)私,還違(wei)反了知識(shi)產權(quan),因(yin)為被復制(zhi)的(de)(de)(de)(de)模(mo)(mo)型(xing)(xing)可(ke)能會在(zai)未經許可(ke)的(de)(de)(de)(de)情況下被使用或(huo)出售【43】【166】。

結論

在(zai)這篇(pian)綜(zong)述中(zhong),我(wo)們(men)對(dui)快速發展的(de)(de)(de)圖(tu)機器學(xue)習(Graph ML)領域(yu)的(de)(de)(de)安(an)全(quan)性(xing)進行了(le)全(quan)面回顧。由于安(an)全(quan)問題(ti)日益加(jia)劇,這一(yi)主題(ti)正受到越來越多的(de)(de)(de)關注。我(wo)們(men)對(dui)Graph ML應用中(zhong)的(de)(de)(de)三個(ge)關鍵安(an)全(quan)方面進行了(le)結構化(hua)分(fen)析(xi):可(ke)靠性(xing)、可(ke)推廣(guang)性(xing)和(he)(he)保(bao)(bao)密性(xing)。為了(le)增強安(an)全(quan)性(xing),我(wo)們(men)將每(mei)(mei)個(ge)方面的(de)(de)(de)威脅(xie)(xie)(xie)分(fen)類為三種主要(yao)類型(xing):數據威脅(xie)(xie)(xie)、模型(xing)威脅(xie)(xie)(xie)和(he)(he)攻(gong)擊威脅(xie)(xie)(xie),每(mei)(mei)種威脅(xie)(xie)(xie)都對(dui)Graph ML模型(xing)的(de)(de)(de)安(an)全(quan)性(xing)提出(chu)(chu)了(le)獨特的(de)(de)(de)挑戰(zhan)。對(dui)于每(mei)(mei)個(ge)識(shi)別出(chu)(chu)的(de)(de)(de)威脅(xie)(xie)(xie),我(wo)們(men)詳細介紹了(le)具體的(de)(de)(de)解決方案,提供了(le)應對(dui)這些安(an)全(quan)挑戰(zhan)的(de)(de)(de)研(yan)究努力(li)的(de)(de)(de)詳盡(jin)匯編。我(wo)們(men)的(de)(de)(de)討(tao)論(lun)將這些見(jian)解綜(zong)合(he)成一(yi)個(ge)統一(yi)的(de)(de)(de)框(kuang)架,旨(zhi)在(zai)加(jia)深對(dui)Graph ML安(an)全(quan)性(xing)考慮的(de)(de)(de)理解,并引(yin)導未來在(zai)這一(yi)重要(yao)領域(yu)的(de)(de)(de)研(yan)究。此外,我(wo)們(men)還強調(diao)了(le)實際應用并提出(chu)(chu)了(le)未來研(yan)究的(de)(de)(de)方向。通(tong)過這篇(pian)綜(zong)述,我(wo)們(men)的(de)(de)(de)目標不僅(jin)是總結現有的(de)(de)(de)Graph ML安(an)全(quan)研(yan)究,還希望鼓勵進一(yi)步(bu)的(de)(de)(de)研(yan)究,以確保(bao)(bao)Graph ML技(ji)術能夠安(an)全(quan)地開(kai)發和(he)(he)實施。

付費5元查看完整內容

時間序列數據在各個領域中無處不在,使得時間序列分析至關重要。傳統的時間序列模型是針對特定任務的,具有單一的功能和有限的泛化能力。最近,大型語言基礎模型顯示出了其在跨任務轉移、零次/少次學習和決策解釋性方面的顯著能力。這一成功激發了探索基礎模型以同時解決多個時間序列挑戰的興趣。主要有兩個研究方向,即從頭開始預訓練時間序列的基礎模型和將大型語言基礎模型適配到時間序列。這兩者都有助于開發一個高度泛化、多功能且易于理解的統一模型用于時間序列分析。本綜述提供了一個3E分析框架,用于全面檢查相關研究。具體來說,我們從三個維度——有效性、效率和解釋性——檢查現有工作。在每個維度中,我們專注于討論相關工作如何通過考慮時間序列領域的獨特挑戰來設計定制解決方案。此外,我們提供了一個領域分類法,以幫助后來者跟進領域特定的進展。此外,我們還介紹了促進該領域發展的廣泛資源,包括數據集、開源時間序列庫。同時維護一個GitHub倉庫以更新資源(//github.com/start2020/Awesome-TimeSeries-LLM-FM)。

1 引言

時(shi)(shi)間(jian)(jian)(jian)(jian)序(xu)(xu)列(lie)(lie)(lie)數(shu)(shu)據(ju)指的(de)(de)(de)(de)是在連續時(shi)(shi)間(jian)(jian)(jian)(jian)間(jian)(jian)(jian)(jian)隔記(ji)錄的(de)(de)(de)(de)數(shu)(shu)據(ju)點序(xu)(xu)列(lie)(lie)(lie)。時(shi)(shi)間(jian)(jian)(jian)(jian)序(xu)(xu)列(lie)(lie)(lie)分(fen)(fen)析有著(zhu)悠久的(de)(de)(de)(de)研究歷史(shi),與(yu)現實世界(jie)的(de)(de)(de)(de)應(ying)(ying)用密切相(xiang)(xiang)關[51]。最(zui)早的(de)(de)(de)(de)時(shi)(shi)間(jian)(jian)(jian)(jian)序(xu)(xu)列(lie)(lie)(lie)挖掘可以(yi)追溯到古埃(ai)及時(shi)(shi)期(qi),當時(shi)(shi)人們分(fen)(fen)析尼羅河(he)的(de)(de)(de)(de)波動(dong)來指導農業(ye)生(sheng)(sheng)產[35]。早期(qi),時(shi)(shi)間(jian)(jian)(jian)(jian)序(xu)(xu)列(lie)(lie)(lie)研究主(zhu)要集(ji)中在商業(ye)和(he)(he)(he)經(jing)濟活(huo)動(dong)[57]、氣象和(he)(he)(he)人口統(tong)(tong)計(ji)(ji)等(deng)領域,當時(shi)(shi)收集(ji)的(de)(de)(de)(de)數(shu)(shu)據(ju)相(xiang)(xiang)對(dui)較(jiao)小(xiao),結(jie)構(gou)簡單(dan)(例如(ru),單(dan)變量序(xu)(xu)列(lie)(lie)(lie))。那時(shi)(shi),統(tong)(tong)計(ji)(ji)學是主(zhu)導方(fang)法論,促成了(le)(le)(le)(le)各(ge)(ge)種經(jing)典模型(xing)(xing)的(de)(de)(de)(de)發展(zhan),包(bao)括ARIMA、ARCH[50]和(he)(he)(he)馬爾可夫(fu)轉換模型(xing)(xing)[64]。然(ran)而(er),大規模工業(ye)系統(tong)(tong)的(de)(de)(de)(de)出(chu)現,涵蓋了(le)(le)(le)(le)交通[216]、醫療保健(jian)[101]、物聯(lian)網(IoT)[59]和(he)(he)(he)電子商務[8]等(deng)行(xing)業(ye),導致了(le)(le)(le)(le)龐(pang)大而(er)復(fu)雜的(de)(de)(de)(de)時(shi)(shi)間(jian)(jian)(jian)(jian)序(xu)(xu)列(lie)(lie)(lie)數(shu)(shu)據(ju)的(de)(de)(de)(de)產生(sheng)(sheng)。除了(le)(le)(le)(le)時(shi)(shi)間(jian)(jian)(jian)(jian)序(xu)(xu)列(lie)(lie)(lie)數(shu)(shu)據(ju),一些系統(tong)(tong)還生(sheng)(sheng)成包(bao)括文(wen)本[82]、圖像[150]和(he)(he)(he)圖表[98]在內的(de)(de)(de)(de)不同模態的(de)(de)(de)(de)數(shu)(shu)據(ju)。數(shu)(shu)據(ju)爆(bao)炸(zha)推動(dong)了(le)(le)(le)(le)具有日益(yi)復(fu)雜模式的(de)(de)(de)(de)新型(xing)(xing)時(shi)(shi)間(jian)(jian)(jian)(jian)序(xu)(xu)列(lie)(lie)(lie)應(ying)(ying)用的(de)(de)(de)(de)出(chu)現。例如(ru),交通擁堵檢測[7]、心(xin)電圖(ECGs)分(fen)(fen)類[74]、電子商務銷售需求(qiu)預測[17]。統(tong)(tong)計(ji)(ji)方(fang)法難(nan)以(yi)管(guan)理(li)(li)如(ru)此龐(pang)大和(he)(he)(he)異質的(de)(de)(de)(de)數(shu)(shu)據(ju)集(ji),且(qie)依賴于預定(ding)義模式假設,限制了(le)(le)(le)(le)它們在處理(li)(li)動(dong)態和(he)(he)(he)復(fu)雜模式的(de)(de)(de)(de)應(ying)(ying)用中的(de)(de)(de)(de)實用性。 在過去幾十年中,機(ji)器(qi)學習和(he)(he)(he)深度學習在各(ge)(ge)個領域取(qu)得(de)了(le)(le)(le)(le)顯(xian)著(zhu)進(jin)展(zhan),特別是在計(ji)(ji)算機(ji)視覺(jue)(CV)和(he)(he)(he)自(zi)然(ran)語言處理(li)(li)(NLP)[196]。與(yu)統(tong)(tong)計(ji)(ji)方(fang)法不同,這(zhe)些方(fang)法可以(yi)以(yi)更(geng)自(zi)動(dong)化(hua)的(de)(de)(de)(de)方(fang)式處理(li)(li)更(geng)大、更(geng)多(duo)樣化(hua)的(de)(de)(de)(de)數(shu)(shu)據(ju)集(ji),減少了(le)(le)(le)(le)人力和(he)(he)(he)專業(ye)知識(shi)的(de)(de)(de)(de)需求(qiu)。這(zhe)些技術(shu)引入了(le)(le)(le)(le)能(neng)夠檢測更(geng)復(fu)雜模式的(de)(de)(de)(de)先(xian)進(jin)架構(gou),激發了(le)(le)(le)(le)時(shi)(shi)間(jian)(jian)(jian)(jian)序(xu)(xu)列(lie)(lie)(lie)社區(qu)的(de)(de)(de)(de)極大興趣[79, 106, 125, 160]。因此,出(chu)現了(le)(le)(le)(le)多(duo)種針(zhen)對(dui)時(shi)(shi)間(jian)(jian)(jian)(jian)序(xu)(xu)列(lie)(lie)(lie)建模的(de)(de)(de)(de)有效架構(gou),包(bao)括不同基礎架構(gou)的(de)(de)(de)(de)RNNs[108]、CNNs[29, 109, 207]、GNNs[28, 32]、Transformers[182]、擴散模型(xing)(xing)[107]。

盡管這些強大的架構將時間序列分析推向了一個新的水平,但在這一領域仍然存在未解決的挑戰。 第一個挑戰是關于知識的可遷移性[149]。時間序列通常表現出季節性(在特定間隔的規律波動)[56]和趨勢(數據的長期方向)[132]。除了這些可識別的模式外,時間序列數據還表現出一定程度的隨機性或噪聲,這通常歸因于未知的因素或模式。這些特征在不同領域之間甚至在同一領域隨時間的變化可能差異很大,由于分布的變化[88],使得將從一個特定任務中學到的模型或時間序列表示遷移到其他任務變得具有挑戰性。例如,對股市數據訓練的時間序列模型[188]學習到的模式受到經濟指標、投資者情緒等高度不穩定因素的影響。而氣候模型[131]則關注長期模式、季節循環,這些循環受物理定律而非人類行為的約束。由于數據性質的根本不同,不同領域間的知識可遷移性依然是一個挑戰。 ? 第二個挑戰與數據稀疏性有關。在許多傳統時間序列場景中[49, 157],數據的收集可能是每日、每月或每年進行的(例如,經濟指標[18]),這導致數據本質上的稀疏性。另外,獲取和標注數據可能存在隱私限制。例如,對心電圖(ECGs)[136]的分類需要臨床診斷,但這些診斷成本高昂,且數據可用性受到患者隱私的限制。這種數據稀缺性阻礙了深度學習模型的有效訓練。實際上,在大多數情況下,可用的數據集仍然不足以學習高質量的模型[110]。 ? 第三個挑戰是關于多模態學習[16]。在多模(mo)(mo)(mo)(mo)(mo)態時(shi)間(jian)(jian)(jian)序(xu)列分(fen)析(xi)的(de)(de)(de)(de)(de)(de)背景下,利(li)用(yong)不同(tong)模(mo)(mo)(mo)(mo)(mo)態間(jian)(jian)(jian)的(de)(de)(de)(de)(de)(de)互補(bu)見解可(ke)(ke)以增(zeng)強(qiang)解釋性(xing)并提升模(mo)(mo)(mo)(mo)(mo)型(xing)(xing)(xing)性(xing)能(neng)。例(li)如,在股票行(xing)情(qing)預(yu)測中(zhong),社交媒體上(shang)的(de)(de)(de)(de)(de)(de)新聞和(he)評論可(ke)(ke)以直接(jie)影(ying)響(xiang)交易活動,將它們整(zheng)合(he)到模(mo)(mo)(mo)(mo)(mo)型(xing)(xing)(xing)中(zhong)可(ke)(ke)以實(shi)現(xian)(xian)更精確(que)的(de)(de)(de)(de)(de)(de)預(yu)測[170, 189]。然(ran)而,對各種(zhong)頻率或間(jian)(jian)(jian)隔收集的(de)(de)(de)(de)(de)(de)多模(mo)(mo)(mo)(mo)(mo)態數據進行(xing)對齊,以準確(que)反映不同(tong)模(mo)(mo)(mo)(mo)(mo)態之間(jian)(jian)(jian)的(de)(de)(de)(de)(de)(de)時(shi)間(jian)(jian)(jian)關系,是(shi)具有挑戰(zhan)性(xing)的(de)(de)(de)(de)(de)(de)。此(ci)外,不同(tong)模(mo)(mo)(mo)(mo)(mo)態可(ke)(ke)能(neng)需(xu)(xu)要(yao)不同(tong)的(de)(de)(de)(de)(de)(de)技術來(lai)有效捕捉信(xin)息,將這些信(xin)息無縫整(zheng)合(he)成(cheng)一(yi)個(ge)統一(yi)的(de)(de)(de)(de)(de)(de)模(mo)(mo)(mo)(mo)(mo)型(xing)(xing)(xing)可(ke)(ke)能(neng)很復(fu)雜。 ?** 最(zui)后(hou),解釋性(xing)也是(shi)非常需(xu)(xu)要(yao)的(de)(de)(de)(de)(de)(de)[210]**。詳細解釋模(mo)(mo)(mo)(mo)(mo)型(xing)(xing)(xing)如何生(sheng)成(cheng)預(yu)測或識(shi)別模(mo)(mo)(mo)(mo)(mo)式可(ke)(ke)以顯著增(zeng)強(qiang)時(shi)間(jian)(jian)(jian)序(xu)列的(de)(de)(de)(de)(de)(de)實(shi)用(yong)性(xing)和(he)可(ke)(ke)接(jie)受性(xing)。一(yi)個(ge)案例(li)是(shi),如果一(yi)個(ge)公用(yong)事業公司使用(yong)一(yi)個(ge)能(neng)源需(xu)(xu)求預(yu)測模(mo)(mo)(mo)(mo)(mo)型(xing)(xing)(xing)[77]來(lai)計劃電力生(sheng)成(cheng)或設定(ding)價格,它需(xu)(xu)要(yao)向監管機構和(he)消費(fei)者(zhe)證明(ming)這些決策是(shi)基于(yu)合(he)理且(qie)可(ke)(ke)理解的(de)(de)(de)(de)(de)(de)因素。然(ran)而,大多數現(xian)(xian)有的(de)(de)(de)(de)(de)(de)時(shi)間(jian)(jian)(jian)序(xu)列模(mo)(mo)(mo)(mo)(mo)型(xing)(xing)(xing)本質上(shang)是(shi)黑盒,缺乏對模(mo)(mo)(mo)(mo)(mo)型(xing)(xing)(xing)行(xing)為或預(yu)測的(de)(de)(de)(de)(de)(de)解釋。

為了應對上述挑戰,已經有一些努力,如時間序列的遷移學習[78, 120, 177, 193]、時間序列數據增強[181]、多模態時間序列分析[26, 42]以及時間序列的可解釋人工智能[143]。然而,這些工作大多集中在單一挑戰上。時間序列社區期待一個能同時解決多個挑戰的多方面模型。理想的模型應具有強大的泛化能力,能在訓練期間處理未見過的時間序列任務和數據稀缺的任務。此外,它還應該能夠無縫整合來自不同模態的數據,并為其決策過程提供可理解的解釋。 在過去幾年中,為了促進知識遷移,出現了一種結合遷移學習和自監督學習的新學習范式,即預訓練和微調范式[65]。它首先在一個數據豐富的源域上預訓練模型,然后在與源域相關的目標任務上進行微調[39]。BERT[41]是一個在大規模語料庫上預訓練的語言模型。研究人員發現,它可以適應廣泛的下游NLP任務,并大幅提升它們的性能水平。這項研究激發了NLP[97, 138, 212]和CV[14, 137]領域中大量的后續工作。這類模型被稱為基礎模型(FM)[22]。它們在各種下游任務上展示出強大的泛化能力。當NLP研究者通過增加數據或模型規模來擴展基礎模型時,他們觀察到這些更大的基礎模型獲得了一些在較小模型中不存在的令人驚訝的能力。這些意外的能力被稱為突現能力[179],包括上下文學習[24]、指令跟隨[69]、思維鏈(CoT)[128]。它們將語言基礎模型從一個可遷移的NLP任務解決者轉變為跨領域的通用任務解決者,現在廣泛被稱為大型語言模型(LLM)。LLM的發展迅速而強勁,催生了許多強大的LLM,如GPT系列[24, 138]。 受到大型語言基礎模型在NLP中顯著成功的啟發,時間序列社區越來越關注基礎模型在時間序列分析中的潛力[25, 82, 112]。一(yi)(yi)個(ge)研(yan)究(jiu)方(fang)向是從零開(kai)始用時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)數據預訓(xun)練(lian)一(yi)(yi)個(ge)基(ji)(ji)(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)型,仿(fang)照語(yu)(yu)言基(ji)(ji)(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)型。如TimesFM[36]和(he)(he)TimeGPT[58]等開(kai)創性(xing)的(de)(de)努(nu)力(li)(li)(li)(li)(li)已經啟動了(le)在(zai)時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)領域(yu)內(nei)基(ji)(ji)(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)型的(de)(de)預訓(xun)練(lian)。然(ran)而,與NLP領域(yu)可(ke)(ke)用的(de)(de)龐大(da)(da)語(yu)(yu)料(liao)相比,時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)領域(yu)的(de)(de)數據規(gui)模(mo)(mo)(mo)相對(dui)較小,使(shi)得難以(yi)產生(sheng)具有LLM那樣突現能力(li)(li)(li)(li)(li)的(de)(de)基(ji)(ji)(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)型。此(ci)外,基(ji)(ji)(ji)(ji)于(yu)(yu)(yu)時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)數據預訓(xun)練(lian)的(de)(de)基(ji)(ji)(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)型缺乏語(yu)(yu)言生(sheng)成(cheng)能力(li)(li)(li)(li)(li),限制了(le)它(ta)(ta)(ta)們生(sheng)成(cheng)人類可(ke)(ke)讀解(jie)釋的(de)(de)能力(li)(li)(li)(li)(li)。受到大(da)(da)型語(yu)(yu)言基(ji)(ji)(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)型在(zai)各種(zhong)下游任(ren)(ren)務中(zhong)強大(da)(da)的(de)(de)泛化(hua)(hua)能力(li)(li)(li)(li)(li)的(de)(de)吸引,另一(yi)(yi)個(ge)研(yan)究(jiu)方(fang)向集中(zhong)于(yu)(yu)(yu)將大(da)(da)型語(yu)(yu)言基(ji)(ji)(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)型(即(ji)LLM)適(shi)配(pei)于(yu)(yu)(yu)時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)任(ren)(ren)務。大(da)(da)型語(yu)(yu)言基(ji)(ji)(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)型在(zai)跨任(ren)(ren)務泛化(hua)(hua)、零次(ci)(ci)/少次(ci)(ci)學習和(he)(he)推理方(fang)面(mian)的(de)(de)優勢可(ke)(ke)以(yi)解(jie)決(jue)知識遷移、數據稀缺性(xing)和(he)(he)可(ke)(ke)解(jie)釋性(xing)等時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)分析中(zhong)的(de)(de)挑戰。廣義上,有兩種(zhong)將LLM適(shi)配(pei)于(yu)(yu)(yu)時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)任(ren)(ren)務的(de)(de)范(fan)式(shi)(shi),即(ji)嵌(qian)入(ru)可(ke)(ke)見的(de)(de)LLM適(shi)配(pei)和(he)(he)文本(ben)可(ke)(ke)見的(de)(de)LLM適(shi)配(pei)[113, 190, 192]。它(ta)(ta)(ta)們在(zai)LLM的(de)(de)使(shi)用上有所不(bu)同(tong),使(shi)用微調的(de)(de)提示策略來適(shi)配(pei)LLM于(yu)(yu)(yu)時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)任(ren)(ren)務。它(ta)(ta)(ta)們都面(mian)臨(lin)著時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)與LLM空間(jian)(jian)對(dui)齊、時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)屬性(xing)和(he)(he)模(mo)(mo)(mo)式(shi)(shi)識別、多(duo)模(mo)(mo)(mo)態數據融合(he)的(de)(de)挑戰。盡(jin)管這兩條研(yan)究(jiu)線探索了(le)基(ji)(ji)(ji)(ji)于(yu)(yu)(yu)不(bu)同(tong)結構數據集(即(ji)時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)或文本(ben)語(yu)(yu)料(liao))預訓(xun)練(lian)的(de)(de)基(ji)(ji)(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)型,但它(ta)(ta)(ta)們都致力(li)(li)(li)(li)(li)于(yu)(yu)(yu)實現一(yi)(yi)個(ge)統一(yi)(yi)且易于(yu)(yu)(yu)理解(jie)的(de)(de)架構,以(yi)解(jie)決(jue)多(duo)個(ge)時(shi)(shi)(shi)(shi)(shi)間(jian)(jian)序(xu)(xu)列(lie)挑戰,并具有強大(da)(da)的(de)(de)泛化(hua)(hua)能力(li)(li)(li)(li)(li)。

本綜述對時間序列的基礎模型的發展進行了深入分析。該評審以(yi)圖2中(zhong)的(de)(de)(de)(de)(de)(de)四個研(yan)究(jiu)(jiu)(jiu)問題為指導,涵蓋三個分(fen)析維(wei)度(即(ji)有效(xiao)(xiao)性(xing)、效(xiao)(xiao)率、可(ke)解釋性(xing))和一(yi)個分(fen)類法(fa)(fa)(即(ji)領(ling)(ling)域(yu)分(fen)類法(fa)(fa))。(1) 如(ru)何在時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)分(fen)析的(de)(de)(de)(de)(de)(de)背景(jing)(jing)下有效(xiao)(xiao)地適應基(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)(mo)型(xing)?我(wo)(wo)們(men)(men)將(jiang)相(xiang)關工(gong)作分(fen)為兩條(tiao)研(yan)究(jiu)(jiu)(jiu)線(xian):從(cong)(cong)頭開(kai)始為時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)預訓(xun)練(lian)基(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)(mo)型(xing)和將(jiang)大型(xing)語(yu)言基(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)(mo)型(xing)(即(ji)LLMs)適用(yong)于(yu)時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)。對(dui)于(yu)第一(yi)條(tiao)線(xian),我(wo)(wo)們(men)(men)通過兩個關鍵階段討論(lun)(lun)有效(xiao)(xiao)性(xing):數據(ju)收集與對(dui)齊、架構(gou)設計。對(dui)于(yu)第二(er)條(tiao)線(xian),我(wo)(wo)們(men)(men)識別了(le)兩種適配范(fan)式,即(ji)嵌入(ru)可(ke)見的(de)(de)(de)(de)(de)(de)LLM適配和文本可(ke)見的(de)(de)(de)(de)(de)(de)LLM適配。在每種適配范(fan)式下,我(wo)(wo)們(men)(men)討論(lun)(lun)了(le)LLM的(de)(de)(de)(de)(de)(de)利用(yong)、時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)提(ti)取和多(duo)(duo)模(mo)(mo)(mo)(mo)態數據(ju)融合。時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)提(ti)取包括(kuo)獲取適當的(de)(de)(de)(de)(de)(de)時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)表示、對(dui)齊時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)空間(jian)(jian)(jian)(jian)(jian)和LLM空間(jian)(jian)(jian)(jian)(jian)、識別時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)屬性(xing)和模(mo)(mo)(mo)(mo)式等(deng)挑戰。此(ci)外,我(wo)(wo)們(men)(men)還研(yan)究(jiu)(jiu)(jiu)了(le)LLM的(de)(de)(de)(de)(de)(de)多(duo)(duo)樣(yang)化角色(se),這進一(yi)步增加(jia)了(le)LLM適配的(de)(de)(de)(de)(de)(de)有效(xiao)(xiao)性(xing)。(2) 如(ru)何高效(xiao)(xiao)地為時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)任務預訓(xun)練(lian)或微調基(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)(mo)型(xing)?鑒于(yu)這一(yi)領(ling)(ling)域(yu)正在興起,當前的(de)(de)(de)(de)(de)(de)高效(xiao)(xiao)技術是從(cong)(cong)NLP領(ling)(ling)域(yu)借鑒的(de)(de)(de)(de)(de)(de)。因此(ci),我(wo)(wo)們(men)(men)首先(xian)提(ti)供(gong)了(le)一(yi)份可(ke)轉(zhuan)移(yi)至此(ci)背景(jing)(jing)的(de)(de)(de)(de)(de)(de)NLP領(ling)(ling)域(yu)尖端高效(xiao)(xiao)方法(fa)(fa)的(de)(de)(de)(de)(de)(de)簡要概(gai)覽。然后,我(wo)(wo)們(men)(men)討論(lun)(lun)了(le)不同(tong)調整范(fan)式下的(de)(de)(de)(de)(de)(de)效(xiao)(xiao)率,并(bing)總(zong)結(jie)了(le)已經(jing)使用(yong)的(de)(de)(de)(de)(de)(de)高效(xiao)(xiao)方法(fa)(fa)。(3) 如(ru)何獲得時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)應用(yong)中(zhong)基(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)(mo)型(xing)行為或決(jue)策的(de)(de)(de)(de)(de)(de)可(ke)解釋性(xing)?模(mo)(mo)(mo)(mo)型(xing)的(de)(de)(de)(de)(de)(de)實際部署需要可(ke)解釋性(xing)。我(wo)(wo)們(men)(men)從(cong)(cong)探索AI中(zhong)的(de)(de)(de)(de)(de)(de)可(ke)解釋性(xing)概(gai)念開(kai)始,強(qiang)調全局和局部解釋。然后,我(wo)(wo)們(men)(men)繼續回顧和提(ti)煉現(xian)有研(yan)究(jiu)(jiu)(jiu)中(zhong)的(de)(de)(de)(de)(de)(de)可(ke)解釋性(xing)進展。(4) 每個時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)應用(yong)領(ling)(ling)域(yu)中(zhong)基(ji)(ji)礎(chu)(chu)模(mo)(mo)(mo)(mo)型(xing)的(de)(de)(de)(de)(de)(de)發(fa)展情況如(ru)何?為回答(da)這個問題,我(wo)(wo)們(men)(men)引(yin)入(ru)了(le)一(yi)個領(ling)(ling)域(yu)分(fen)類法(fa)(fa)。這個分(fen)類法(fa)(fa)使我(wo)(wo)們(men)(men)能夠比(bi)較每個領(ling)(ling)域(yu)內現(xian)有研(yan)究(jiu)(jiu)(jiu)的(de)(de)(de)(de)(de)(de)目標、貢獻和局限。此(ci)外,我(wo)(wo)們(men)(men)還提(ti)供(gong)了(le)豐富的(de)(de)(de)(de)(de)(de)資源(yuan),如(ru)代碼、基(ji)(ji)準數據(ju)集、時(shi)(shi)(shi)間(jian)(jian)(jian)(jian)(jian)序(xu)(xu)(xu)(xu)列(lie)(lie)(lie)(lie)(lie)庫和加(jia)速LLM的(de)(de)(de)(de)(de)(de)工(gong)具,以(yi)支持未來的(de)(de)(de)(de)(de)(de)研(yan)究(jiu)(jiu)(jiu)工(gong)作。圖4提(ti)供(gong)了(le)基(ji)(ji)于(yu)四個研(yan)究(jiu)(jiu)(jiu)問題的(de)(de)(de)(de)(de)(de)作品的(de)(de)(de)(de)(de)(de)綜合概(gai)覽。

論文組織 本綜述的(de)(de)(de)(de)(de)其(qi)余部(bu)分(fen)安排如下(xia):第(di)(di)2節介紹(shao)與基礎模(mo)(mo)型(xing)和(he)時(shi)(shi)間(jian)序(xu)(xu)列(lie)(lie)分(fen)析相關的(de)(de)(de)(de)(de)綜述,指導讀者(zhe)(zhe)了解(jie)每個(ge)領域的(de)(de)(de)(de)(de)更多研究。第(di)(di)3節為讀者(zhe)(zhe)提供(gong)關于基礎模(mo)(mo)型(xing)和(he)時(shi)(shi)間(jian)序(xu)(xu)列(lie)(lie)任務(wu)的(de)(de)(de)(de)(de)基本知識。第(di)(di)4節深入探討(tao)了時(shi)(shi)間(jian)序(xu)(xu)列(lie)(lie)的(de)(de)(de)(de)(de)基礎模(mo)(mo)型(xing)預訓練的(de)(de)(de)(de)(de)關鍵(jian)階段。第(di)(di)5節檢查了LLM向(xiang)時(shi)(shi)間(jian)序(xu)(xu)列(lie)(lie)任務(wu)的(de)(de)(de)(de)(de)適配。第(di)(di)6節討(tao)論了模(mo)(mo)型(xing)微調和(he)推(tui)理的(de)(de)(de)(de)(de)效率。第(di)(di)7節總結了關于解(jie)釋(shi)模(mo)(mo)型(xing)行為或決策的(de)(de)(de)(de)(de)研究。第(di)(di)8節介紹(shao)了各個(ge)領域內(nei)的(de)(de)(de)(de)(de)進展。最后,第(di)(di)9節提供(gong)了包括基準數據集(ji)、代碼(ma)和(he)時(shi)(shi)間(jian)序(xu)(xu)列(lie)(lie)庫(ku)以(yi)及LLM工具在內(nei)的(de)(de)(de)(de)(de)資源(yuan)。

付費5元查看完整內容

時間序列數據的研究對于理解隨時間變化的趨勢和異常至關重要,使得在各個領域內能夠實現預測性洞察。另一方面,時空數據對于分析空間和時間中的現象至關重要,為復雜系統交互提供動態視角。近期,擴散模型在時間序列和時空數據挖掘中得到了廣泛應用。這些模型不僅增強了序列和時間數據的生成和推理能力,而且還擴展到其他下游任務。在本綜述中,我們全面而深入地回顧了擴散模型在時間序列和時空數據中的使用,按模型類別、任務類型、數據形態和實際應用領域進行分類。具體而言,我們將擴散模型分為無條件和有條件兩種類型,并分別討論時間序列數據和時空數據。無條件模型,即無監督運行的模型,被進一步細分為基于概率和基于分數的模型,服務于預測和生成任務,如預測、異常檢測、分類和填補。有條件模型則利用額外信息以增強性能,同樣也針對預測和生成任務進行劃分。我們的綜述廣泛涵蓋了它們在包括醫療保健、推薦系統、氣候、能源、音頻和交通等多個領域的應用,為這些模型如何分析和生成數據提供了基礎理解。通過這一結構化概覽,我們旨在為研究人員和實踐者提供關于時間序列和時空數據分析中擴散模型的全面理解,旨在通過解決傳統挑戰和探索擴散模型框架內的創新解決方案,引導未來的創新和應用。 //www.zhuanzhi.ai/paper/38a12a5bf6945d011c3aa4827f0df55a

擴散模型代表了一類概率生成模型,這些模型通過一個包括在一組訓練樣本中注入噪聲及其后續移除的兩步過程進行優化。這個過程包括一個前向階段,稱為擴散,以及一個反向階段,稱為去噪。通過訓練模型去除在擴散過程中加入的噪聲,模型在推斷過程中學會生成與訓練數據分布緊密對齊的有效數據樣本。 近年來,擴散模型在各個領域中獲得了顯著的關注并產生了重大影響,包括計算機視覺(CV)、自然語言處理(NLP)和一般的多模態學習。這挑戰了生成(cheng)(cheng)對(dui)抗網絡(luo)(GANs)長(chang)期的(de)主(zhu)導(dao)地位。在(zai)這些領(ling)域(yu)中(zhong),擴(kuo)散(san)模型在(zai)如(ru)文本到圖像轉換、實例分割、3D形(xing)狀生成(cheng)(cheng)、分子設計和音頻生成(cheng)(cheng)等應(ying)用中(zhong)展示(shi)了卓越的(de)能力。值得(de)注意的(de)是,擴(kuo)散(san)模型也作為一種非自回歸的(de)替代方(fang)案,開始在(zai)傳統由自回歸方(fang)法(fa)主(zhu)導(dao)的(de)任務中(zhong)獲得(de)人氣(qi)。最(zui)近,OpenAI Sora的(de)推出(chu)標(biao)志(zhi)著(zhu)擴(kuo)散(san)模型在(zai)模擬(ni)嵌入時空連續(xu)體(ti)的(de)物理世(shi)界(jie)中(zhong)的(de)新進展,突顯(xian)了它們的(de)關鍵(jian)重(zhong)要性。

時間數據主要包括時間序列和時空數據,封裝了絕大多數現實世界系統的動態。這些時間數據形式已被廣泛研究,并被認為對眾多應用至關重要。然而,從各種數據形態中導出物理世界的普適動態法則仍然是該領域內的一個重大挑戰。最近,時間序列和時空建模領域經歷了從感知智能向通用智能的顯著轉變。這一轉變由具有廣泛時間數據分析能力的統一基礎模型(FMs)的出現所特征化,挑戰了特定領域模型的優勢。擴散模型在許多模態上實現了最先進的成果,包括圖像、語音和視頻。由于這些領域中廣泛且多樣的可用數據,擴散模型常作為生成型基礎模型與大型語言模型(LLMs)或其他基礎模型一同促進了這些領域的快速發展。 近年來,也出現了越來越多專為模擬時間序列和時空數據而設計的擴散模型。同時,我們(men)也注意到(dao)越來(lai)越多的(de)(de)嘗試使用擴散模(mo)(mo)型(xing)進行時間建模(mo)(mo)。觀(guan)察擴散模(mo)(mo)型(xing)的(de)(de)成(cheng)功,引(yin)發了一個引(yin)人入勝的(de)(de)問題:時間序列(lie)/時空數據(ju)分(fen)析與擴散模(mo)(mo)型(xing)的(de)(de)交叉會(hui)擦出什么樣的(de)(de)火花?

時間序列和時空數據分析基本上依賴于對它們固有的時間動態的深刻理解,其主要任務主要集中在骨干模型的生成能力上,例如預測、填補和生成。這些分析聚焦于(yu)為(wei)(wei)(wei)特定(ding)(ding)目(mu)的(de)(de)(de)生(sheng)(sheng)成(cheng)(cheng)時(shi)間(jian)(jian)數據樣(yang)本,無論是(shi)有(you)條(tiao)件的(de)(de)(de)還(huan)是(shi)無條(tiao)件的(de)(de)(de)。目(mu)睹(du)了時(shi)間(jian)(jian)序(xu)列和(he)時(shi)空基礎模(mo)型(xing)的(de)(de)(de)最近發(fa)展(zhan),無論是(shi)基于(yu)LLMs構建還(huan)是(shi)從(cong)零開(kai)始訓練,它(ta)們的(de)(de)(de)成(cheng)(cheng)功可以歸功于(yu)估計訓練樣(yang)本分布(bu)的(de)(de)(de)能力,從(cong)中可以提取有(you)效的(de)(de)(de)數據表(biao)示。在這方面,擴(kuo)散(san)模(mo)型(xing)作為(wei)(wei)(wei)一個強大的(de)(de)(de)生(sheng)(sheng)成(cheng)(cheng)框架(jia)出現,使得(de)(1)模(mo)擬時(shi)間(jian)(jian)數據中的(de)(de)(de)復雜(za)模(mo)式(shi)成(cheng)(cheng)為(wei)(wei)(wei)可能,以及(2)支持廣(guang)泛(fan)的(de)(de)(de)下游任(ren)務。為(wei)(wei)(wei)特定(ding)(ding)任(ren)務生(sheng)(sheng)成(cheng)(cheng)有(you)效的(de)(de)(de)數據樣(yang)本時(shi),時(shi)間(jian)(jian)序(xu)列和(he)時(shi)空擴(kuo)散(san)模(mo)型(xing)通常以無條(tiao)件方式(shi)操作,無需監(jian)督信(xin)號(hao)。鑒于(yu)實際應用(yong)的(de)(de)(de)部分觀察(cha)性質(zhi),有(you)條(tiao)件的(de)(de)(de)擴(kuo)散(san)模(mo)型(xing)已經出現。它(ta)們利用(yong)數據標(biao)簽(例如指(zhi)令、元數據或外來變量)來調控生(sheng)(sheng)成(cheng)(cheng)過程(cheng),從(cong)而使得(de)有(you)效的(de)(de)(de)跨模(mo)態提示成(cheng)(cheng)為(wei)(wei)(wei)可能,導致(zhi)更定(ding)(ding)制化和(he)改進(jin)的(de)(de)(de)結(jie)果(guo)。

我們在圖3中提出了一個發展路線圖。通過在大規模時間數據上訓練,擴散模型有效地填補了時間序列/時空數據生成的空白,并展示了在解決下一代以LLM為中心的時間數據代理的難題中的重大潛力。

盡管擴散模型在處理時間序列和時空數據方面展示了充滿希望的前景和迅速的進步,現有文獻中對這一模型家族的系統分析卻明顯不足。本文旨在通過提(ti)(ti)供一份(fen)前(qian)瞻性(xing)的(de)(de)(de)綜(zong)(zong)述來彌補這(zhe)(zhe)一差距,闡明擴散(san)模型(xing)適用于這(zhe)(zhe)些(xie)數(shu)據形態的(de)(de)(de)原因(“為什么”)以及它們(men)(men)如(ru)何提(ti)(ti)供優勢(shi)的(de)(de)(de)機制(zhi)(“如(ru)何”)。在這(zhe)(zhe)份(fen)綜(zong)(zong)述中(zhong),我(wo)們(men)(men)提(ti)(ti)供了(le)細的(de)(de)(de)分類,進行了(le)徹底的(de)(de)(de)評審,并識別(bie)了(le)這(zhe)(zhe)一迅速(su)發展領(ling)域內的(de)(de)(de)新興趨勢(shi)。我(wo)們(men)(men)的(de)(de)(de)主(zhu)要貢獻總結如(ru)下:

全面且最新的綜述。我們(men)呈(cheng)現了(le)一個全面、最新且前瞻性的(de)(de)擴(kuo)散(san)模型在(zai)時(shi)間序列和(he)時(shi)空數據應用的(de)(de)綜述(shu)。我們(men)的(de)(de)調(diao)查強調(diao)了(le)擴(kuo)散(san)模型適(shi)用于這(zhe)些數據形(xing)態的(de)(de)適(shi)宜(yi)性,并(bing)討(tao)論了(le)它們(men)提供(gong)(gong)的(de)(de)益處。通過覆蓋領(ling)域的(de)(de)廣泛(fan)譜系和(he)各個方法的(de)(de)細節,我們(men)為(wei)讀(du)者提供(gong)(gong)了(le)對(dui)這(zhe)一主題(ti)領(ling)域的(de)(de)深入洞見。

統一和結構化的分類。我們引入了一個清晰(xi)且有組織的(de)框架,用于(yu)將現有文獻分類(lei)為兩(liang)種主(zhu)要類(lei)型:無條件和(he)有條件的(de)擴散(san)模型,重(zhong)點關(guan)注時(shi)間序列(lie)和(he)時(shi)空數據(ju),這些數據(ju)涵蓋了預測(ce)性(xing)和(he)生(sheng)成(cheng)性(xing)任務。這種分類(lei)為讀者提供了從多個角度對該主(zhu)題(ti)的(de)連貫路線圖。

洞察新興進展。我們(men)(men)討論了(le)無(wu)條(tiao)件和有(you)條(tiao)件擴散模型中的前沿技術,關注時間序列和時空數(shu)據。我們(men)(men)的覆蓋范圍包括(kuo)最新(xin)技術和新(xin)興趨勢,如多模態有(you)條(tiao)件生(sheng)成。

挑戰和未來方向的總結。我們確(que)定了當前(qian)研究環境中(zhong)面臨的關(guan)鍵挑戰,并突出了幾個未來探索的有(you)希望(wang)方(fang)向。

本文的其余部分結構如下:第2節(jie)(jie)提供了(le)關于擴散(san)(san)模(mo)(mo)(mo)(mo)型(xing)(xing)(xing)的(de)(de)(de)全面背(bei)景(jing),詳細(xi)介紹(shao)了(le)它們的(de)(de)(de)發展(zhan)、理(li)論基礎和(he)(he)(he)各(ge)種(zhong)實現。第3節(jie)(jie)呈現了(le)對時(shi)間(jian)序(xu)列和(he)(he)(he)時(shi)空(kong)數(shu)據(ju)(ju)(ju)應(ying)(ying)用(yong)擴散(san)(san)模(mo)(mo)(mo)(mo)型(xing)(xing)(xing)的(de)(de)(de)結(jie)構化概覽和(he)(he)(he)分類,為在(zai)第4節(jie)(jie)中更深入探(tan)討模(mo)(mo)(mo)(mo)型(xing)(xing)(xing)視(shi)(shi)角奠定(ding)了(le)基礎,該節(jie)(jie)將討論標準和(he)(he)(he)先進的(de)(de)(de)擴散(san)(san)模(mo)(mo)(mo)(mo)型(xing)(xing)(xing)。第5節(jie)(jie)關注于任務視(shi)(shi)角,檢查擴散(san)(san)模(mo)(mo)(mo)(mo)型(xing)(xing)(xing)如何(he)處理(li)預測、生成、填補、異(yi)常檢測等任務。第6節(jie)(jie)討論數(shu)據(ju)(ju)(ju)視(shi)(shi)角,強調針對時(shi)間(jian)序(xu)列和(he)(he)(he)時(shi)空(kong)數(shu)據(ju)(ju)(ju)的(de)(de)(de)特定(ding)挑(tiao)戰和(he)(he)(he)解決方(fang)案。第7節(jie)(jie)探(tan)索(suo)擴散(san)(san)模(mo)(mo)(mo)(mo)型(xing)(xing)(xing)在(zai)各(ge)種(zhong)領域的(de)(de)(de)應(ying)(ying)用(yong),如醫療(liao)、交(jiao)通和(he)(he)(he)能源,展(zhan)示了(le)它們的(de)(de)(de)廣泛實用(yong)性(xing)。最后,第8節(jie)(jie)以對未來機會的(de)(de)(de)展(zhan)望和(he)(he)(he)總結(jie)性(xing)評論結(jie)束本(ben)文。

本節提供了針對時間序列和時空數據分析挑戰的擴散模型的概述和分類。我(wo)們的調(diao)查沿四(si)個(ge)主(zhu)要維度(du)組織討論:擴散模(mo)型的類別、任務(wu)類型、數據(ju)形態(tai)和實際(ji)應(ying)用(yong)。圖(tu)7中展(zhan)示了相關(guan)工作(zuo)的全(quan)面(mian)總結。現有(you)文獻被分類為兩個(ge)主(zhu)要組別:無(wu)條(tiao)(tiao)件和有(you)條(tiao)(tiao)件的擴散模(mo)型,重(zhong)點關(guan)注時間序列和時空數據(ju)。

在無條件類別中,擴散模型以無監督方式操作,生成數據樣本無需監督信號。這(zhe)(zhe)一設置代表了分析時(shi)間序(xu)(xu)列(lie)和(he)(he)時(shi)空數據(ju)的(de)(de)(de)基礎(chu)方法(fa)。在此類別(bie)(bie)中(zhong),文獻可以(yi)進(jin)一步分為(wei)(wei)基于概率(lv)(lv)的(de)(de)(de)和(he)(he)基于評(ping)分的(de)(de)(de)擴散模(mo)型(xing)。例(li)如,去(qu)噪擴散概率(lv)(lv)模(mo)型(xing)(DDPMs)[2]和(he)(he)基于評(ping)分的(de)(de)(de)隨機(ji)微分方程(Score SDEs)[4],[6],如第2節所介紹。這(zhe)(zhe)一類別(bie)(bie)的(de)(de)(de)研究廣泛地組織為(wei)(wei)兩個(ge)任務(wu)組:預(yu)測任務(wu)和(he)(he)生(sheng)成(cheng)任務(wu)。預(yu)測任務(wu)通(tong)常涉(she)及預(yu)測和(he)(he)異常檢測,利用(yong)歷史數據(ju)和(he)(he)模(mo)式(shi)來預(yu)測當前和(he)(he)/或未(wei)來事件。相反,生(sheng)成(cheng)任務(wu)則專注于識(shi)別(bie)(bie)大型(xing)數據(ju)集中(zhong)的(de)(de)(de)模(mo)式(shi)以(yi)生(sheng)成(cheng)新內(nei)容,如時(shi)間序(xu)(xu)列(lie)的(de)(de)(de)插值和(he)(he)增強。這(zhe)(zhe)些(xie)方法(fa)被開發用(yong)于兩種主要數據(ju)形態:時(shi)間序(xu)(xu)列(lie)和(he)(he)時(shi)空數據(ju),以(yi)滿足包括醫(yi)療(liao)保健、能(neng)源、氣候、交通(tong)等多(duo)個(ge)領域的(de)(de)(de)廣泛應用(yong)。

在有條件類別中,擴散模型被定制用于時間序列和時空數據的條件分析。實證研究表明,使用數(shu)據(ju)標(biao)簽的條件(jian)生成(cheng)(cheng)模型(xing)比(bi)它(ta)們的無條件(jian)對應(ying)(ying)(ying)物更(geng)易于(yu)訓練(lian)且性能更(geng)優[75]。在(zai)這(zhe)一上下(xia)文中,標(biao)簽(也稱為(wei)條件(jian))通常來自各種來源,例如提(ti)取的短期趨勢[34]和(he)(he)城(cheng)市(shi)流量圖[35],以增強(qiang)模型(xing)推斷。這(zhe)一類別采用基(ji)于(yu)概率(lv)和(he)(he)基(ji)于(yu)評分的擴(kuo)(kuo)散(san)模型(xing)來應(ying)(ying)(ying)對預測和(he)(he)生成(cheng)(cheng)任務,提(ti)供了在(zai)特(te)定約束下(xia)利用擴(kuo)(kuo)散(san)模型(xing)應(ying)(ying)(ying)對時間序列和(he)(he)時空數(shu)據(ju)分析實際挑戰的新視角。

在對模型類別、任務類型、數據形態和應用領域的基礎理解的基礎上,我們更深入地探索了時間序列和時空數據分析中的擴散模型。每個部分都旨在解開(kai)擴散(san)模(mo)型(xing)(xing)應用(yong)中固有的(de)復雜(za)性(xing)和(he)細微差(cha)別,從多(duo)個視角(jiao)提供全面(mian)概述。在第(di)(di)4節(jie)中,我們探討(tao)擴散(san)模(mo)型(xing)(xing)的(de)景(jing)觀,突(tu)出無(wu)條(tiao)(tiao)件(jian)和(he)有條(tiao)(tiao)件(jian)方法之間(jian)(jian)的(de)區別及(ji)其含義。第(di)(di)5節(jie)從預測(ce)和(he)生成的(de)視角(jiao)分析(xi)任(ren)務,詳細說明了預測(ce)、生成、異常檢(jian)測(ce)和(he)數(shu)據(ju)插值(zhi)等具體功能(neng)。第(di)(di)6節(jie)檢(jian)查數(shu)據(ju)形態,區分時間(jian)(jian)序(xu)列和(he)時空數(shu)據(ju),概述模(mo)型(xing)(xing)挑戰(zhan)和(he)適用(yong)性(xing)。最后,第(di)(di)7節(jie)將討(tao)論擴展到應用(yong)領域(yu),展示擴散(san)模(mo)型(xing)(xing)在醫療、交通、序(xu)列推薦(jian)、氣(qi)候、能(neng)源和(he)音頻等領域(yu)的(de)廣泛(fan)實(shi)用(yong)性(xing)。這種結構(gou)化的(de)探索(suo)旨在裝(zhuang)備讀者(zhe)深入理解擴散(san)模(mo)型(xing)(xing)處理復雜(za)時間(jian)(jian)序(xu)列和(he)時空數(shu)據(ju)挑戰(zhan)的(de)潛(qian)力和(he)當前(qian)狀態。

付費5元查看完整內容

圖神經網絡(GNNs)越來越多地應用于許多高風險任務中,因此,近來人們對它們的公平性越來越關注。研究表明,GNNs往往會對某些由敏感屬性如性別和種族劃分的人群做出歧視性決策。盡管近期的工作致力于提高它們的公平性能,但這通常需要可以獲取的人口統計信息。由于法律限制,這在現實世界場景中極大地限制了它們的適用性。為解決這個問題,我們提出了一種不依賴人口統計信息的方法,通過知識蒸餾來學習公平的GNNs,即FairGKD。我們的工作是由這樣一個實證觀察所激發的:在部分數據(即,只有節點屬性或拓撲數據)上訓練GNNs可以提高它們的公平性,盡管這犧牲了一定的效用。為了在公平性和效用性能之間做出平衡的權衡,我們采用了一組公平專家(即,在不同部分數據上訓練的GNNs)來構建合成教師,該教師蒸餾出更公平且富有信息的知識以指導GNN學生的學習。在幾個基準數據集上的實驗表明,FairGKD不需要訪問人口統計信息,顯著提高了GNNs的公平性,同時保持了它們的效用。

付費5元查看完整內容

由于(yu)涉及人(ren)(ren)(ren)(ren)類(lei)對人(ren)(ren)(ren)(ren)工(gong)(gong)智(zhi)能(neng)的(de)(de)(de)信任、正(zheng)確性(xing)、審計、知識(shi)轉移和監管等原(yuan)因,可解(jie)釋(shi)人(ren)(ren)(ren)(ren)工(gong)(gong)智(zhi)能(neng)目前是(shi)該(gai)領域的(de)(de)(de)前沿課題。利用強(qiang)化(hua)(hua)學習(RL)開發(fa)的(de)(de)(de)人(ren)(ren)(ren)(ren)工(gong)(gong)智(zhi)能(neng)尤其(qi)引人(ren)(ren)(ren)(ren)關注(zhu),因為(wei)(wei)從環(huan)境中學到的(de)(de)(de)東(dong)西并不透明。強(qiang)化(hua)(hua)學習人(ren)(ren)(ren)(ren)工(gong)(gong)智(zhi)能(neng)系(xi)統(tong)(tong)已被證(zheng)明是(shi) "脆性(xing)"的(de)(de)(de),無法(fa)(fa)(fa)在(zai)安全的(de)(de)(de)條件(jian)下運行(xing)(xing),因此,無論輸(shu)入值如何,顯(xian)示(shi)正(zheng)確性(xing)的(de)(de)(de)方(fang)(fang)法(fa)(fa)(fa)都是(shi)人(ren)(ren)(ren)(ren)們(men)關注(zhu)的(de)(de)(de)焦點。顯(xian)示(shi)正(zheng)確性(xing)的(de)(de)(de)一種方(fang)(fang)法(fa)(fa)(fa)是(shi)使用形(xing)(xing)式化(hua)(hua)方(fang)(fang)法(fa)(fa)(fa)(即形(xing)(xing)式化(hua)(hua)驗證(zheng))驗證(zheng)系(xi)統(tong)(tong)。這(zhe)些(xie)(xie)方(fang)(fang)法(fa)(fa)(fa)很有價(jia)值,但成(cheng)本高(gao)昂(ang)且(qie)難以實(shi)現,因此大多數人(ren)(ren)(ren)(ren)傾向(xiang)于(yu)采用其(qi)他方(fang)(fang)法(fa)(fa)(fa)進(jin)行(xing)(xing)驗證(zheng),這(zhe)些(xie)(xie)方(fang)(fang)法(fa)(fa)(fa)可能(neng)不那么嚴格,但更(geng)容易實(shi)現。在(zai)這(zhe)項工(gong)(gong)作中,我(wo)們(men)展示(shi)了(le)針對戰略(lve)戰斗游戲(xi)《星際(ji)爭霸(ba) 2》的(de)(de)(de)各方(fang)(fang)面(mian)開發(fa) RL 人(ren)(ren)(ren)(ren)工(gong)(gong)智(zhi)能(neng)系(xi)統(tong)(tong)的(de)(de)(de)方(fang)(fang)法(fa)(fa)(fa),該(gai)系(xi)統(tong)(tong)性(xing)能(neng)良好、可解(jie)釋(shi)并可進(jin)行(xing)(xing)形(xing)(xing)式驗證(zheng)。該(gai)系(xi)統(tong)(tong)在(zai)示(shi)例(li)場景(jing)中表(biao)現出色,同(tong)時還能(neng)向(xiang)人(ren)(ren)(ren)(ren)類(lei)操作員或(huo)設計者解(jie)釋(shi)其(qi)行(xing)(xing)為(wei)(wei)。此外,該(gai)系(xi)統(tong)(tong)還符合(he)有關其(qi)行(xing)(xing)為(wei)(wei)的(de)(de)(de)正(zheng)式安全規范。

引言

近(jin)年來,強(qiang)化學習(xi)(xi)(RL)中(zhong)的(de)(de)(de)(de)(de)人(ren)工智(zhi)(zhi)能(neng)(neng)(neng)(AI)應用(yong)因其對以往棘手問題的(de)(de)(de)(de)(de)廣(guang)泛(fan)適用(yong)性(xing)(xing)(xing)(xing)(xing)而(er)備受關注[1,2]。其中(zhong),DeepMind 的(de)(de)(de)(de)(de) AlphaGo 系(xi)統[3] 的(de)(de)(de)(de)(de)成功點(dian)燃(ran)了該(gai)領域(yu)(yu)研(yan)究和(he)(he)關注的(de)(de)(de)(de)(de)熱情(qing),特(te)別是引入了將 RL 與(yu)深度(du)(du)(du)神經網絡 (DNN) 相結合(he)的(de)(de)(de)(de)(de)新(xin)技(ji)術(shu),即(ji)深度(du)(du)(du)強(qiang)化學習(xi)(xi) (DRL)。然(ran)而(er),盡管在(zai)(zai) RL 和(he)(he) DRL 的(de)(de)(de)(de)(de)總(zong)體(ti)領域(yu)(yu)內取(qu)得(de)的(de)(de)(de)(de)(de)進步不(bu)斷提高(gao)了這些(xie)方法的(de)(de)(de)(de)(de)可擴展性(xing)(xing)(xing)(xing)(xing)和(he)(he)性(xing)(xing)(xing)(xing)(xing)能(neng)(neng)(neng),但(dan)驗證(zheng)(zheng)和(he)(he)可解(jie)釋性(xing)(xing)(xing)(xing)(xing)工作卻沒有(you)得(de)到同(tong)等(deng)的(de)(de)(de)(de)(de)關注。人(ren)們一直(zhi)在(zai)(zai)努力采用(yong)性(xing)(xing)(xing)(xing)(xing)能(neng)(neng)(neng)卓越的(de)(de)(de)(de)(de) DRL 解(jie)決方案,并在(zai)(zai)事后提高(gao)可解(jie)釋性(xing)(xing)(xing)(xing)(xing)和(he)(he)可信度(du)(du)(du)。這方面(mian)的(de)(de)(de)(de)(de)一個例(li)子是 DARPA 的(de)(de)(de)(de)(de) XAI 計劃,該(gai)計劃旨(zhi)在(zai)(zai)研(yan)究和(he)(he)確定人(ren)工智(zhi)(zhi)能(neng)(neng)(neng)中(zhong)可解(jie)釋性(xing)(xing)(xing)(xing)(xing)的(de)(de)(de)(de)(de)重要性(xing)(xing)(xing)(xing)(xing)和(he)(he)使(shi)用(yong)情(qing)況[4]。他們得(de)出的(de)(de)(de)(de)(de)結論是,許(xu)多 DRL 解(jie)決方案都(dou)很脆弱、無法驗證(zheng)(zheng),而(er)且(qie)對人(ren)類設計者/操作者來說也(ye)不(bu)透(tou)明,而(er)人(ren)類設計者/操作者可能(neng)(neng)(neng)想要審(shen)核、驗證(zheng)(zheng)或(huo)從智(zhi)(zhi)能(neng)(neng)(neng)體(ti)學到的(de)(de)(de)(de)(de)知(zhi)識中(zhong)提取(qu)知(zhi)識。

模糊(hu)(hu)推(tui)理系統(tong)(FIS)是一種利(li)用(yong)(yong)(yong)模糊(hu)(hu)邏(luo)輯(ji)和(he)推(tui)理規則將輸(shu)(shu)入(ru)映射到輸(shu)(shu)出的(de)函數近似器[5],它具有一些適合(he) XAI 的(de)特性(xing)(xing)(xing)(xing),但與(yu)(yu) DNN 相(xiang)比還有其他潛(qian)在的(de)缺(que)點,即可(ke)(ke)(ke)擴(kuo)(kuo)展(zhan)性(xing)(xing)(xing)(xing)。基于模糊(hu)(hu)邏(luo)輯(ji)的(de)系統(tong)因(yin)其近似能力(li)(li)[6]、易于利(li)用(yong)(yong)(yong)專家知識實現(xian)[7]、對(dui)輸(shu)(shu)入(ru)噪聲的(de)魯棒性(xing)(xing)(xing)(xing)[8]、對(dui)人類的(de)可(ke)(ke)(ke)解(jie)釋性(xing)(xing)(xing)(xing)和(he)透明度[9]以及可(ke)(ke)(ke)正式驗證的(de)能力(li)(li)[10],長期(qi)以來一直被用(yong)(yong)(yong)于控制系統(tong)開發。然(ran)而(er),與(yu)(yu)輸(shu)(shu)入(ru)數量(liang)相(xiang)關的(de)可(ke)(ke)(ke)擴(kuo)(kuo)展(zhan)性(xing)(xing)(xing)(xing)問題限(xian)制了其潛(qian)在應用(yong)(yong)(yong)。為(wei)了緩解(jie)可(ke)(ke)(ke)擴(kuo)(kuo)展(zhan)性(xing)(xing)(xing)(xing)問題,同時保(bao)留可(ke)(ke)(ke)解(jie)釋性(xing)(xing)(xing)(xing)和(he)近似能力(li)(li),2015 年(nian)提出了模糊(hu)(hu)樹(shu)[11],將多個 FIS 組合(he)成網絡或(huo)樹(shu)狀結構。

遺傳算(suan)法是一(yi)類無(wu)梯(ti)度(du)搜索算(suan)法,它(ta)通過(guo)變(bian)異和重組在(zai)(zai)若干代(dai)內進(jin)化(hua)解決方案(an),并(bing)根據適應(ying)(ying)度(du)函數中的(de)(de)(de)(de)一(yi)個(ge)(ge)或多個(ge)(ge)指(zhi)標評估其(qi)適應(ying)(ying)度(du)。長期以(yi)來,GA 在(zai)(zai)許多領域(yu)都發揮(hui)了(le)巨大(da)作(zuo)用,在(zai)(zai)與 FIS 參數優(you)(you)化(hua)相(xiang)關的(de)(de)(de)(de)大(da)量工(gong)作(zuo)中也是如此[12]。將(jiang)模糊(hu)樹與遺傳算(suan)法相(xiang)結合(he),產生了(le)遺傳模糊(hu)樹(GFTs)[11],這是一(yi)種(zhong)強大(da)的(de)(de)(de)(de)組合(he),使用了(le)一(yi)種(zhong)可(ke)解釋(shi)、可(ke)正(zheng)式驗(yan)證的(de)(de)(de)(de)函數近似器和無(wu)梯(ti)度(du)優(you)(you)化(hua)器,并(bing)已應(ying)(ying)用于監督[13]和強化(hua)學(xue)習領域(yu)[14]的(de)(de)(de)(de)多個(ge)(ge)復雜案(an)例。Thales 的(de)(de)(de)(de) GFT 軟件工(gong)具(ju)(ju)包包括一(yi)個(ge)(ge)模糊(hu)邏輯引擎(qing) Psion 和一(yi)個(ge)(ge)最先進(jin)的(de)(de)(de)(de)基于遺傳算(suan)法的(de)(de)(de)(de)優(you)(you)化(hua)工(gong)具(ju)(ju) EVE[15] 。它(ta)的(de)(de)(de)(de)優(you)(you)勢在(zai)(zai)于易于使用,可(ke)以(yi)找到壁(bi)時間較短的(de)(de)(de)(de)解決方案(an),而且由于無(wu)梯(ti)度(du)優(you)(you)化(hua)的(de)(de)(de)(de)特(te)性(xing),適用范圍很(hen)廣。阿爾法系統[14]可(ke)能是之前最著(zhu)名的(de)(de)(de)(de)應(ying)(ying)用案(an)例,它(ta)是一(yi)種(zhong)超人類人工(gong)智能,可(ke)在(zai)(zai)高(gao)保真模擬中與人類飛行員專家進(jin)行超視(shi)距空(kong)(kong)對空(kong)(kong)交(jiao)戰[14]。

GFT 的(de)另一(yi)個優點是可以(yi)使用形(xing)(xing)式化(hua)(hua)方(fang)法(fa)(fa)(fa)進行驗(yan)證(zheng)(zheng)。形(xing)(xing)式化(hua)(hua)方(fang)法(fa)(fa)(fa)通(tong)常被(bei)定(ding)義(yi)為 "用于系(xi)統(tong)(tong)開發、規(gui)范和驗(yan)證(zheng)(zheng)的(de)數學(xue)上嚴格(ge)的(de)技(ji)(ji)術(shu)"。許多方(fang)法(fa)(fa)(fa)和技(ji)(ji)術(shu)都屬于形(xing)(xing)式方(fang)法(fa)(fa)(fa)的(de)范疇,包括(kuo)布爾可滿(man)足(zu)性問題(SAT)[16]、可滿(man)足(zu)性模態(tai)理論(SMT)、模型檢查、定(ding)理證(zheng)(zheng)明、可達性分析等。形(xing)(xing)式化(hua)(hua)驗(yan)證(zheng)(zheng)是利用形(xing)(xing)式化(hua)(hua)方(fang)法(fa)(fa)(fa)來驗(yan)證(zheng)(zheng)系(xi)統(tong)(tong)的(de)正確性。一(yi)般來說,驗(yan)證(zheng)(zheng)涉及對系(xi)統(tong)(tong)正確性的(de)信心(xin),而形(xing)(xing)式驗(yan)證(zheng)(zheng)則(ze)將傳(chuan)統(tong)(tong)驗(yan)證(zheng)(zheng)方(fang)法(fa)(fa)(fa)(如蒙特卡洛(luo)評估)擴(kuo)展到(dao)正確性的(de)最終(zhong)證(zheng)(zheng)明。在人工(gong)智(zhi)(zhi)能和人工(gong)智(zhi)(zhi)能領域,形(xing)(xing)式驗(yan)證(zheng)(zheng)的(de)應用一(yi)直進展緩慢,這主要是由于隨著 DNN 規(gui)模的(de)不斷擴(kuo)大,證(zheng)(zheng)明 DNN 屬性的(de)難度也在不斷增加。

在(zai)這(zhe)(zhe)項工(gong)作(zuo)中,我們創(chuang)建(jian)了一個(ge)使用 GFT 結構的(de)(de)智能(neng)(neng)體,然后使用強化學(xue)習(xi)對其(qi)進行(xing)訓練,使其(qi)能(neng)(neng)夠游玩《星(xing)際爭霸 2》中的(de)(de)特定(ding)場景。請注(zhu)意,本研(yan)(yan)究(jiu)(jiu)并(bing)不分析整場標(biao)(biao)準的(de)(de)《星(xing)際爭霸 2》比賽。相反(fan),本研(yan)(yan)究(jiu)(jiu)的(de)(de)重點將放在(zai)具體的(de)(de)控制(zhi)應(ying)(ying)用上(shang),同(tong)時關(guan)注(zhu)可(ke)解釋(shi)(shi)性(xing)(xing)和形式(shi)可(ke)驗證(zheng)性(xing)(xing),當然也(ye)可(ke)以(yi)通(tong)過使用 GFT 方(fang)法來(lai)研(yan)(yan)究(jiu)(jiu)整個(ge)標(biao)(biao)準的(de)(de)《星(xing)際爭霸 2》游戲。這(zhe)(zhe)項研(yan)(yan)究(jiu)(jiu)的(de)(de)目的(de)(de)并(bing)不是要證(zheng)明(ming)基于模(mo)糊邏輯的(de)(de)人工(gong)智能(neng)(neng)方(fang)法與其(qi)他(ta)任(ren)何方(fang)法之間的(de)(de)性(xing)(xing)能(neng)(neng)差距,而是要證(zheng)明(ming)如(ru)何以(yi)保(bao)持可(ke)解釋(shi)(shi)性(xing)(xing)和形式(shi)可(ke)驗證(zheng)性(xing)(xing)的(de)(de)方(fang)式(shi)創(chuang)建(jian)這(zhe)(zhe)些系(xi)統。這(zhe)(zhe)些能(neng)(neng)力是任(ren)務(wu)/安全關(guan)鍵(jian)型應(ying)(ying)用非常需要的(de)(de),而且往(wang)往(wang)是必需的(de)(de)。之所(suo)以(yi)使用星(xing)際爭霸 2,是因為它是現代 RL 研(yan)(yan)究(jiu)(jiu)中常用的(de)(de)環境,允許(xu)創(chuang)建(jian)可(ke)公(gong)開(kai)共享(xiang)的(de)(de)任(ren)務(wu)/安全關(guan)鍵(jian)用例(li),并(bing)允許(xu)擴展(zhan)這(zhe)(zhe)項工(gong)作(zuo),以(yi)便與其(qi)他(ta)高性(xing)(xing)能(neng)(neng) RL 方(fang)法進行(xing)比較。

GFT 采用(yong)(yong)結構(gou)初始化,在(zai)適(shi)當(dang)情況下給定(ding)初始參數值(zhi),然后(hou)通過(guo)(guo)游戲中的(de)互動在(zai)訓(xun)(xun)練集中進行(xing)(xing)訓(xun)(xun)練。GFT 的(de)結構(gou)可以(yi)通過(guo)(guo)提取激活(huo)的(de)規(gui)(gui)(gui)則和(he)成員函數來解(jie)釋輸出(chu)動作。然后(hou)創建(jian)系統行(xing)(xing)為(wei)規(gui)(gui)(gui)范(fan),并使用(yong)(yong)形式化方法[17] 對系統進行(xing)(xing)驗(yan)證。在(zai)違(wei)(wei)(wei)反(fan)規(gui)(gui)(gui)范(fan)的(de)情況下,會返回反(fan)例,顯(xian)(xian)示(shi)違(wei)(wei)(wei)反(fan)規(gui)(gui)(gui)范(fan)的(de)地方,然后(hou)進行(xing)(xing)修(xiu)正(zheng)(zheng)。然后(hou)對修(xiu)正(zheng)(zheng)后(hou)的(de)系統進行(xing)(xing)驗(yan)證,以(yi)確保其不(bu)違(wei)(wei)(wei)反(fan)規(gui)(gui)(gui)范(fan),從而顯(xian)(xian)示(shi)出(chu)所制定(ding)的(de)行(xing)(xing)為(wei)規(gui)(gui)(gui)范(fan)的(de)明(ming)確正(zheng)(zheng)確性。

本(ben)研究開發(fa)了(le)(le)四(si)種規(gui)范,這絕不(bu)是一(yi)(yi)個詳盡的(de)潛(qian)在集合。這項工作將展示學習能力,以解(jie)決(jue)一(yi)(yi)類特(te)別困(kun)難(nan)的(de)問題,展示潛(qian)在的(de)可(ke)(ke)解(jie)釋性可(ke)(ke)能性,并(bing)證(zheng)明(ming)遵守了(le)(le)一(yi)(yi)系列相關規(gui)范。本(ben)研究的(de)主要目的(de)是展示一(yi)(yi)個基于模糊邏(luo)輯(ji)的(de)人工智能系統實例,該系統可(ke)(ke)以在任(ren)務/安全關鍵場(chang)景中正式驗(yan)證(zheng)是否(fou)符合安全規(gui)范。

本文(wen)其余部分的(de)結(jie)構如(ru)下。第 2 節(jie)(jie)詳細介紹了(le)針對(dui) SC2 中的(de)特定場景創建(jian)、訓練(lian)和(he)(he)驗證 GFT 的(de)方法(fa)。第 3 節(jie)(jie)展示了(le)結(jie)果,包括 RL 訓練(lian)、根據規范(和(he)(he)生成(cheng)的(de)反(fan)例)進(jin)行(xing)的(de)驗證,以及(ji)為確保符合(he)規范而進(jin)行(xing)修改(gai)后(hou)的(de)結(jie)果。第 4 節(jie)(jie)深入討(tao)論(lun)了(le)這些(xie)結(jie)果,并就擴展和(he)(he)未(wei)來工作(zuo)提出(chu)了(le)想法(fa)。最后(hou),第 5 節(jie)(jie)簡要總結(jie)了(le)本研究的(de)工作(zuo)、結(jie)果和(he)(he)影響。

圖 3. 研究(jiu)模型(xing)中使用(yong)的三個獨立的模糊推理系統(FIS),分(fen)別用(yong)于 Marine Movement Control、Marine Firing Control 和 Medivac Healing Control。藍色為標準(zhun)(zhun)化輸入,紅色為 FIS,綠色為標準(zhun)(zhun)化輸出(chu)。

付費5元查看完整內容

來(lai)自傳感(gan)器網(wang)(wang)(wang)絡(luo)(luo)、可(ke)穿(chuan)戴(dai)設(she)備(bei)和物聯網(wang)(wang)(wang)(IoT)設(she)備(bei)的(de)(de)(de)(de)大量數據(ju)(ju)凸顯了對利用(yong)去(qu)中心化數據(ju)(ju)的(de)(de)(de)(de)時(shi)空(kong)結構(gou)(gou)的(de)(de)(de)(de)高級建(jian)模(mo)技術的(de)(de)(de)(de)需求(qiu),因為需要邊緣(yuan)計(ji)算(suan)和許(xu)可(ke)(數據(ju)(ju)訪(fang)問(wen)(wen))問(wen)(wen)題。雖(sui)然聯邦(bang)學(xue)(xue)(xue)習(FL)已經成(cheng)(cheng)為一(yi)種無需直接數據(ju)(ju)共(gong)(gong)享和交換(huan)的(de)(de)(de)(de)模(mo)型(xing)訓(xun)練框架(jia),但有(you)效地建(jian)模(mo)復雜的(de)(de)(de)(de)時(shi)空(kong)依賴關(guan)系以提高預測(ce)能(neng)力(li)仍(reng)然是一(yi)個懸(xuan)而未決的(de)(de)(de)(de)問(wen)(wen)題。另一(yi)方(fang)面,最先進的(de)(de)(de)(de)時(shi)空(kong)預測(ce)模(mo)型(xing)假(jia)定對數據(ju)(ju)的(de)(de)(de)(de)訪(fang)問(wen)(wen)不受(shou)限(xian)制,而忽略了數據(ju)(ju)共(gong)(gong)享的(de)(de)(de)(de)約(yue)束(shu)(shu)。在(zai)跨節點(dian)聯合(he)學(xue)(xue)(xue)習的(de)(de)(de)(de)約(yue)束(shu)(shu)下,我們(men)提出了跨節點(dian)聯合(he)圖(tu)(tu)神(shen)經網(wang)(wang)(wang)絡(luo)(luo)(CNFGNN)的(de)(de)(de)(de)聯邦(bang)時(shi)空(kong)模(mo)型(xing),該模(mo)型(xing)使用(yong)基于(yu)圖(tu)(tu)神(shen)經網(wang)(wang)(wang)絡(luo)(luo)(GNN)的(de)(de)(de)(de)體(ti)系結構(gou)(gou)對底層(ceng)圖(tu)(tu)結構(gou)(gou)進行(xing)顯式編(bian)碼(ma),這要求(qiu)節點(dian)網(wang)(wang)(wang)絡(luo)(luo)中的(de)(de)(de)(de)數據(ju)(ju)在(zai)每個節點(dian)上(shang)本地生成(cheng)(cheng),并且保持(chi)分散。CNFGNN通(tong)過分離設(she)備(bei)上(shang)的(de)(de)(de)(de)時(shi)間動態(tai)建(jian)模(mo)和服(fu)務器上(shang)的(de)(de)(de)(de)空(kong)間動態(tai),利用(yong)交替優化來(lai)降(jiang)低通(tong)信成(cheng)(cheng)本,促進邊緣(yuan)設(she)備(bei)上(shang)的(de)(de)(de)(de)計(ji)算(suan)。交通(tong)流預測(ce)任(ren)務的(de)(de)(de)(de)計(ji)算(suan)結果表明,CNFGNN在(zai)不增加邊緣(yuan)設(she)備(bei)的(de)(de)(de)(de)計(ji)算(suan)成(cheng)(cheng)本的(de)(de)(de)(de)情況下,在(zai)傳感(gan)和歸納學(xue)(xue)(xue)習環境下均取得了最佳的(de)(de)(de)(de)預測(ce)性能(neng),同時(shi)通(tong)信成(cheng)(cheng)本較低。

付費5元查看完整內容

異構圖(tu)(tu)神經(jing)網絡(luo)(HGNN)作(zuo)為一(yi)種新興的(de)(de)技(ji)術,在(zai)處理(li)異構信息(xi)網絡(luo)(HIN)方(fang)(fang)(fang)面(mian)表現(xian)出(chu)(chu)(chu)(chu)優越的(de)(de)能力(li)。然(ran)而,大(da)多數HGNN遵循半監督(du)學(xue)習(xi)(xi)方(fang)(fang)(fang)式,這(zhe)明(ming)顯(xian)限制了(le)它們在(zai)現(xian)實中(zhong)的(de)(de)廣(guang)泛使用(yong)(yong),因為標簽在(zai)實際應用(yong)(yong)中(zhong)通常很(hen)少。近年(nian)來(lai),對比(bi)(bi)(bi)學(xue)習(xi)(xi),一(yi)種自(zi)監督(du)的(de)(de)學(xue)習(xi)(xi)方(fang)(fang)(fang)法(fa),成為最(zui)令(ling)人(ren)興奮(fen)的(de)(de)學(xue)習(xi)(xi)模式之一(yi),在(zai)沒有標簽的(de)(de)情況下顯(xian)示出(chu)(chu)(chu)(chu)巨大(da)的(de)(de)潛力(li)。在(zai)本(ben)(ben)文中(zhong),我們研究了(le)自(zi)監督(du)HGNN的(de)(de)問題,并提(ti)(ti)出(chu)(chu)(chu)(chu)了(le)一(yi)種新的(de)(de)HGNN的(de)(de)共同(tong)對比(bi)(bi)(bi)學(xue)習(xi)(xi)機制,名為HeCo。不同(tong)于傳統的(de)(de)對比(bi)(bi)(bi)學(xue)習(xi)(xi)只關注(zhu)于對正樣(yang)本(ben)(ben)和(he)負(fu)樣(yang)本(ben)(ben)的(de)(de)對比(bi)(bi)(bi),HeCo采(cai)用(yong)(yong)了(le)跨視(shi)角對比(bi)(bi)(bi)機制。具體(ti)來(lai)說,我們提(ti)(ti)出(chu)(chu)(chu)(chu)了(le)HIN的(de)(de)兩(liang)種視(shi)圖(tu)(tu)(網絡(luo)模式視(shi)圖(tu)(tu)和(he)元路徑視(shi)圖(tu)(tu))來(lai)學(xue)習(xi)(xi)節(jie)點嵌(qian)(qian)入(ru),從而同(tong)時捕獲局部(bu)和(he)高(gao)(gao)階結構。在(zai)此(ci)基礎上,提(ti)(ti)出(chu)(chu)(chu)(chu)了(le)一(yi)種跨視(shi)圖(tu)(tu)對比(bi)(bi)(bi)學(xue)習(xi)(xi)方(fang)(fang)(fang)法(fa),并提(ti)(ti)出(chu)(chu)(chu)(chu)了(le)一(yi)種視(shi)圖(tu)(tu)掩(yan)碼機制,能夠從兩(liang)個(ge)視(shi)圖(tu)(tu)中(zhong)提(ti)(ti)取正面(mian)和(he)負(fu)面(mian)的(de)(de)嵌(qian)(qian)入(ru)信息(xi)。這(zhe)使得(de)兩(liang)個(ge)視(shi)圖(tu)(tu)能夠相互協作(zuo)監督(du),并最(zui)終學(xue)習(xi)(xi)高(gao)(gao)級節(jie)點嵌(qian)(qian)入(ru)。此(ci)外,設計(ji)了(le)兩(liang)個(ge)擴展的(de)(de)HeCo,以產生高(gao)(gao)質量(liang)的(de)(de)硬(ying)負(fu)樣(yang)本(ben)(ben),進一(yi)步提(ti)(ti)高(gao)(gao)了(le)HeCo的(de)(de)性能。在(zai)各種真實網絡(luo)上進行的(de)(de)大(da)量(liang)實驗(yan)表明(ming),所提(ti)(ti)出(chu)(chu)(chu)(chu)的(de)(de)方(fang)(fang)(fang)法(fa)的(de)(de)性能優于最(zui)新的(de)(de)技(ji)術。

//www.zhuanzhi.ai/paper/9af678b0d09538b9cc18ef07a10d9560

付費5元查看完整內容

圖(tu)神(shen)經(jing)網絡(GNNs)最近在(zai)圖(tu)學習(xi)方面取得了(le)(le)(le)重大進(jin)展。盡(jin)管GNN具(ju)有(you)豐(feng)富(fu)的(de)(de)(de)表(biao)示能(neng)力,但對于大規(gui)模(mo)的(de)(de)(de)社會建(jian)模(mo)應(ying)(ying)用(yong)(yong)(yong)(yong)(yong)來(lai)說,GNN的(de)(de)(de)開(kai)發仍然相(xiang)(xiang)對不足。在(zai)線(xian)社交(jiao)(jiao)平(ping)臺(tai)中(zhong)普遍存在(zai)的(de)(de)(de)一(yi)(yi)種應(ying)(ying)用(yong)(yong)(yong)(yong)(yong)是(shi)好(hao)友推薦(jian)(jian):平(ping)臺(tai)向用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)推薦(jian)(jian)其(qi)他(ta)候選用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu),以提(ti)高(gao)用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)的(de)(de)(de)聯系性、留存率和(he)(he)(he)參與(yu)度。然而(er),在(zai)大型社交(jiao)(jiao)平(ping)臺(tai)上(shang)(shang)建(jian)模(mo)這樣的(de)(de)(de)用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)-用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)互(hu)動帶來(lai)了(le)(le)(le)獨特的(de)(de)(de)挑戰: 這些圖(tu)表(biao)通常有(you)重尾(wei)度分布,其(qi)中(zhong)很大一(yi)(yi)部分用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)是(shi)不活(huo)躍的(de)(de)(de),并(bing)且結構和(he)(he)(he)參與(yu)信息有(you)限(xian)。此外,用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)與(yu)不同(tong)的(de)(de)(de)功能(neng)進(jin)行(xing)交(jiao)(jiao)互(hu),與(yu)不同(tong)的(de)(de)(de)組進(jin)行(xing)交(jiao)(jiao)流,并(bing)具(ju)有(you)多方面的(de)(de)(de)交(jiao)(jiao)互(hu)模(mo)式。我(wo)(wo)們研究了(le)(le)(le)用(yong)(yong)(yong)(yong)(yong)于好(hao)友推薦(jian)(jian)的(de)(de)(de)GNN應(ying)(ying)用(yong)(yong)(yong)(yong)(yong),就我(wo)(wo)們所知(zhi),為(wei)(wei)這項任務(wu)提(ti)供了(le)(le)(le)GNN設(she)計的(de)(de)(de)首次(ci)研究。為(wei)(wei)了(le)(le)(le)充分利用(yong)(yong)(yong)(yong)(yong)平(ping)臺(tai)內異(yi)構用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)行(xing)為(wei)(wei)的(de)(de)(de)豐(feng)富(fu)知(zhi)識,我(wo)(wo)們將好(hao)友推薦(jian)(jian)設(she)計為(wei)(wei)具(ju)有(you)多模(mo)式用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)特征和(he)(he)(he)鏈接傳播特征的(de)(de)(de)多層面好(hao)友排名。我(wo)(wo)們提(ti)出了(le)(le)(le)一(yi)(yi)個神(shen)經(jing)結構,GraFRank,它是(shi)精心設(she)計的(de)(de)(de),從多種用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)特征形態(tai)和(he)(he)(he)用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)-用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)交(jiao)(jiao)互(hu)中(zhong)學習(xi)表(biao)達用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)表(biao)示。具(ju)體而(er)言,GraFRank通過模(mo)態(tai)特定(ding)的(de)(de)(de)鄰居(ju)聚(ju)合器處理模(mo)態(tai)同(tong)質性的(de)(de)(de)異(yi)質性,并(bing)通過交(jiao)(jiao)叉模(mo)態(tai)關(guan)注學習(xi)非線(xian)性模(mo)態(tai)相(xiang)(xiang)關(guan)性。我(wo)(wo)們在(zai)兩個數百萬用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)的(de)(de)(de)社交(jiao)(jiao)網絡數據集(ji)(ji)上(shang)(shang)進(jin)行(xing)了(le)(le)(le)實驗,這些數據集(ji)(ji)來(lai)自領(ling)先和(he)(he)(he)廣泛流行(xing)的(de)(de)(de)移動社交(jiao)(jiao)平(ping)臺(tai)Snapchat,在(zai)候選檢索(30%的(de)(de)(de)MRR)和(he)(he)(he)排名(20%的(de)(de)(de)MRR)任務(wu)上(shang)(shang),GraFRank的(de)(de)(de)表(biao)現優于一(yi)(yi)些最先進(jin)的(de)(de)(de)方法。此外,我(wo)(wo)們的(de)(de)(de)定(ding)性分析表(biao)明,低(di)(di)活(huo)躍度和(he)(he)(he)低(di)(di)級(ji)別用(yong)(yong)(yong)(yong)(yong)戶(hu)(hu)(hu)(hu)(hu)的(de)(de)(de)關(guan)鍵人群獲得了(le)(le)(le)顯著(zhu)收益。

付費5元查看完整內容
北京阿比特科技有限公司