亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

作者 | 李政毅審核 | 黃 鋒

今天給大家介紹的是特拉維夫大學發表在IJCAI-2022上的一篇文章:"Geometric Transformer for End-to-End Molecule Properties Prediction"。由于Transformer能夠表征元素之間復雜的相互作用,已經成為許多應用中的首選方法。然而,將Transformer架構擴展到非序列數據如分子數據,并使其在小數據集上進行訓練仍然是一個挑戰。在這項工作中,作者為分子屬性預測引入了一個基于Transformer的架構,通過對分子幾何形狀的初始編碼以及學習到的門控自我注意機制來修改經典的位置編碼器,能夠捕獲分子的幾何形狀。同時,作者進一步提出了一個分子數據的增強方案,能夠避免過度參數化引起的過擬合。所提出的框架優于最先進的方法,同時完全基于純機器學習,即該方法不包含量子化學領域的知識,也不使用除成對原子距離之外的擴展幾何輸入。

1 研究背景

化合物的性質通常可以使用密度泛函理論或從頭計算量子化學等方法來估計。但是這些方法的計算成本很高,因此其適用性有限。近年來,許多方法已經開始利用機器學習來降低有效預測分子性質所需的計算復雜性。在這方面,許多貢獻集中在創建原子或分子水平的手工表示,作為各種機器學習方法的輸入。薛定諤方程表明,給定分子的基態性質僅是原子間距離和核電荷的函數。基于這一發現,最近的幾種方法以端到端的方式預測分子性質,其中輸入由原子的類型和空間位置定義。這些方法通常包含量子化學知識,并依賴于廣泛的超參數調整。 作者的模型不使用擴展的領域知識,僅基于簡單的距離相關性假設,即原子元素之間的距離越大,相互作用越小。與其他工作相反,該框架沒有假定任何擴展的輸入,例如量子力學性質,復雜的幾何信息,如彎曲或扭轉角度等。作者設計的Transformer被賦予了一個適應的位置編碼器,并在模型的不同級別上學習了原子間的幾何嵌入,允許增加表征能力,同時可以保持分子對剛性變換和排列的不變性。

2 模型介紹

模型的整體架構

Geometric Positional Encoding

分子預測必須滿足基本對稱性和物理定律的不變性,例如對剛性空間變換(旋轉和平移)和相同類型原子的置換不變性。因此,模型中的位置輸入被變換為原子間的歐氏距離,以保持剛性變換的不變性,而置換不變性是通過相同類型原子的相同的初始原子特征來實現。 由于原子的初始嵌入完全基于原子的類型,無法區分相同的的原子,且省略了分子的幾何結構。原始Transformer的位置編碼模塊旨在將序列元素的接近程度傳入到初始嵌入。在分子預測任務中,由于輸入被定義為集合而不是序列,因此需要調整位置編碼器以提供幾何感知的初始嵌入。在這里,作者使用原子間距離矩陣來為每個原子嵌入傳入位置信息,如下所示:

和分別表示原子i的初始嵌入以及原子i和其他原子之間的歐氏距離,位置編碼可以提原子的初始幾何感知嵌入

Geometric Self-Attention

自注意機制使得能夠準確地學習分子幾何結構信息以及分子復雜的幾何相互作用。作者提出將原子的成對距離信息加入到自注意力層的計算中,自注意力層將會被擴展為如下的形式:

從上圖可以看出,如果兩個原子的歐式距離超過給定的截止距離,那么ψω將趨近于0,同時二者通過注意力層計算的分數應該是趨近于0。在這之前,已經提出了幾種方法來擴展自注意機制,如下公式(4)和(5)所示:

 但是這兩種方法要么難以學習,要么不滿足原子互作的物理定律。作者建議直接設計為相乘的形式,如下所示:

通過這種方式,原子間的距離將會對注意力層計算的原子間的分數產生直接的影響。

Learning the Graph Geometry

現有的很多方法都很難對交互功能ψω建模。從力場方法到最近的基于學習的方法,需要經驗地重新定義歐幾里得成對距離,以便滿足物理定律。通常情況下,這些方法中存在的最關鍵的超參數之一是截止距離。 在這里,作者建議學習在transformer的每個級別的成對距離ψω。通過ψω對距離進行變換與自注意力機制相結合,使得能夠根據預測目標直接優化原子間的距離表示以及截止距離,消除了繁瑣的超參數,允許以自適應方式進行學習。 作者將ψω參數化為一個淺層、全連通的神經網絡,并通過距離平方來進一步增強相似性的映射強度。并且變換距離為,從而加快了訓練速度。下圖展示了在transformer的不同的塊中通過ψω得到的變換的原子間距離。有趣的是,一些獲得的截止距離位于其他工作(2?6?)中的經驗值附近。

Regularization via Molecule Augmentation

transformer一般都是非常大的、過度參數化的模型。減少過擬合的最有效技術之一是數據增強。然而,增加分子數據并不簡單,特別是對于回歸任務,因為修改一種原子類型或其空間位置會對分子性質產生不可預測的影響。混合策略從成對(或更多)的數據中創建新的樣本。在這里,根據最初的距離相關性假設,作者建議將混合策略思想擴展到分子,通過創建由兩個相距較遠的分子組成的系統來獲得新的樣本。作者將新系統的性質定義為兩個分子的性質之和。模型計算得到的原子之間的注意力分數使得模型能夠學習如何將兩個相距較遠的子系統分開,并減少過擬合。如下圖所示,新系統定義為兩個分子經過旋轉平移之后的組合:

目標是使得模型在新系統數據下可以實現下面的目標,即新系統的分子屬性=兩個原分子屬性值的加和:

3 實驗

Dataset

在table 1(左)中,顯示了模型在QM9數據集上的平均絕對誤差(MAE);在table 2(右)中使用MD17來測試分子動力學模擬中的模型性能:

Comparison and Ablation Studies

比較了不同自注意模塊的影響。給出了方法的收斂曲線,如Figure 7(左)所示。同時給出了訓練過程中數據增強對模型泛化的影響。Figure 7(右)顯示了對于屬性U0和μ,數據增強對模型收斂的影響。可以看出,在這兩種情況下,當應用數據增強時,訓練集和驗證集之間的泛化差距被極大地減小:

4 文章地址

//arxiv.org/abs/2110.13721

付費5元查看完整內容

相關內容

醫學領域的人工智能是使用機器學習模型搜索醫療數據,發現洞察,從而幫助改善健康狀況和患者體驗。 得益于近年來計算機科學和信息技術的發展,人工智能 (AI) 正迅速成為現代醫學中不可或缺的一部分。 由人工智能支持的人工智能算法和其他應用程序正在為臨床和研究領域的醫學專業人員提供支持。

編譯 | 洪越今天給大家介紹由廈門大學劉向榮教授團隊發表在Bioinformatics上的文章,文章提出一個用于DDI預測的鏈接感知圖注意網絡,稱為LaGAT。該模型能夠基于不同的藥物對在知識圖譜中為藥物實體產生不同的注意途徑;作者在兩個公開的DDI數據集上進行了實驗,并可視化了模型生成的注意力路徑。結果證明,LaGAT能夠更好地捕捉語義關系,并能夠基于知識圖譜做出更具有可解釋性的DDI預測。

1 研究背景 藥物相互作用(DDI)是指當患者同時服用兩種或多種藥物時,藥物的療效可能增強或減弱,甚至可能出現副作用。DDI預測是藥理學和臨床應用中的一個極具挑戰性的問題。隨著大型生物醫學數據庫的日益可用,藥物相關的大規模生物知識圖譜與深度學習技術已被廣泛用于DDI預測,比如圖神經網絡(GNN)和翻譯嵌入(TransE)。然而,大型知識圖譜不可避免地存在數據噪聲問題,這限制了基于知識圖譜模型的泛化性能和可解釋性。最近的研究試圖通過圖注意力網絡(GAT)來解決這個問題。然而,GAT只依賴于藥物節點的拓撲結構為其鄰居節點分配固定的注意力權重,而沒有考慮不同藥物對中藥物節點所關注的鄰居節點會發生變化。所以基于GAT的模型做出的預測依然在可解釋性上存在不足,同時限制了自身的泛化性能。因此,該論文提出了一種鏈路感知的圖注意力網絡LaGAT,能夠根據不同的藥物對為藥物實體生成動態的注意力權重,對不同類型的DDI進行端到端的預測,并且模型生成的注意力權重具有良好的可解釋性。

2 模型與方法 作者提出的模型框架可以分解為三個部分: 子圖采樣模塊、鏈路感知圖注意層和分層聚合層,如圖1所示。首先,子圖采樣模塊從數據集中提取藥物對,形成 DDI 矩陣。同時得到每種藥物的 H-hop 鄰居節點,并隨機對每一Hop的鄰居節點進行采樣構成藥物的子圖。然后,鏈路感知注意層嵌入藥物u,v子圖中包含的所有節點并計算子圖中每個節點的鄰居節點的注意權重,使每個節點根據注意權重聚合其鄰居節點的嵌入表示來對自身的嵌入表示進行更新。最后,分層聚集層連接藥物節點每次更新的嵌入表示,得到藥物節點的最終特征向量,并預測 DDI 的標簽。

圖1 LaGAT框架圖

作者比較了GAT 層和LaGAT層的區別,來體現LaGAT層的優勢。傳統的GAT層使用節點本身的嵌入表示作為查詢向量,結合相鄰節點的嵌入表示來學習注意力權重。作者認為,這種策略雖然成功地使每個節點對其鄰居分配不同的權值,但是它的局限性在于,只要節點的拓撲結構是確定的,它最終學習到的注意力權重就是確定的;而鏈路預測任務使用藥物對作為監督信號,在不同的藥物對中,每個節點需要注意的節點并不固定,藥物子圖中的注意路徑應根據藥物對而變化。LaGAT層則根據不同的藥物對選擇不同的藥物節點的嵌入表示作為查詢向量,來學習注意力權重。比如圖1中,LaGAT 使用藥物 v 作為查詢向量來計算藥物 u 子圖中每個節點的注意力重量(淺紅框) ,并使用藥物 u 作為查詢向量來計算藥物 v 子圖中每個節點的注意力重量(綠框)。文中以偽代碼的形式展示了LaGAT層具體的計算方式,如圖2所示。

圖2 LaGAT層的計算實現

3 實驗 作者使用兩個廣泛使用的數據集 (1)二分類 DDI: 使用KEGG -drug的數據構建 KG和DDI 矩陣,其中包含1,925個批準的藥物和56,983個批準的相互作用。(2)多分類DDI: 使用 DrugBank提供的數據構建 KG 和DDI,其中包含映射到 DrugBank 標識符(ID)的1709種藥物和涉及86種藥理學關系的136351種藥物對藥物之間的關系。評估指標結果如表2所示。可以看出,即使沒有使用最后的分層聚合層,作者的方法LaGAT-base依然優于基準方法。

為了進一步驗證模型性能,作者在各個參數下比較了自己的方法與基準方法在都使用分層聚合層后的效果,如圖3所示。可以看出,在不同超參數下,作者提出的方法都優于基準方法,并且和GAT以及GAT-const相比,LaGAT在鏈路預測任務上存在優勢,側面支持了作者的假設。

圖3 消融實驗

最后作者從測試集中挑選了一組典型案例,對模型生成的注意力權重進行了可視化,如圖4所示。

對于每個藥物節點,作者用粗體連接邊來突出注意力權重排名前3的路徑,用粉色節點表示兩個藥物的共同鄰居節點,然后用節點大小來表示每個節點的注意力權重。對于Midazolam和Cyclosporine,LaGAT 分配的概率最高的 DDI 類型是“藥物一的血清濃度會增加,當它與藥物二結合時”。可以看到,模型將高注意力權重分配給兩種藥物共有的實體節點:酶節點“CYP 3A4”。研究表明,Cyclosporine在腸道和肝臟中由 CYP450 酶代謝,主要由 CYP 3A4 和 CYP 3A5 貢獻,它會競爭性抑制人肝微粒體中的 CYP3A4 ,而Midazolam的生物轉化是由具有高度可變活性 的 CYP 3A4 介導的,這支持了模型的預測。對于Midazolam和Amobarbital,LaGAT 分配的概率最高的 DDI 類型是“可能會增加不良反應的風險或嚴重程度”。可以看到,模型將高注意力權重分配給兩種藥物共有的實體節點:藥物類別節點”精神疾病相關“和藥物類別“GABA(A) 受體亞基 alpha-1”節點。研究表明,阿莫巴比妥(與所有巴比妥類藥物一樣)通過與 α 位點的 GABAA 受體結合起作用,且巴比妥酸鹽能增強 GABA 對這種受體的作用,這支持了模型的預測。

值得注意的是, LaGAT為藥物Midazolam在不同的DDI預測中生成了具有可解釋性的不同的注意力路徑,并且作者指出,如果沒有使用LaGAT,模型雖然能正確預測Midazolam和Amobarbital的DDI類型,但無法正確預測Midazolam和Cyclosporine的DDI類型。這從側面說明,LaGAT不僅有助于生成具有可解釋性的注意力路徑,還能提高模型的預測性能。

圖4 LaGAT 產生的注意力路徑。

5 總結 文章提出了一種基于鏈路感知的圖注意網絡,用于藥物相互作用預測任務。它能夠在不同的DDI中為同一藥物實體產生不同的注意途徑,為 KG 模型預測的結果提供可解釋性。此外,案例研究的可視化結果表明,該注意力方法可以學習更準確的語義,這有利于模型預測不同類型的 DDI。同時文章作者也表示,今后將嘗試利用藥物的分子特征生成生成更好的初始嵌入表示進行特征融合,來解決冷啟動問題。 參考資料 Yue Hong, Pengyu Luo, Shuting Jin, Xiangrong Liu, LaGAT: Link-aware Graph Attention Network for Drug-Drug Interaction Prediction, Bioinformatics, 2022;, btac682, //doi.org/10.1093/bioinformatics/btac682
代碼

付費5元查看完整內容

作者 | 夏宇航 審核 | 劉 旋今天給大家介紹的是來蘭州大學張瑞生教授團隊發表在Bioinformatics 2022上的文章"MultiGran-SMILES: multi-granularity SMILES learning for molecular property prediction".原子水平表示是分子的一種常見表示,在一定程度上忽略了分子的子結構或支鏈信息;而子串水平表示則相反。原子級別和子串級別的表示都可能丟失分子的鄰域或空間信息。而聚集分子鄰域信息的分子圖表示法在表示手性分子或對稱結構方面能力較弱。在這篇文章中,作者利用不同粒度表示法的優勢同時用于分子性質預測,提出了一種融合模型MultiGran-SMILES,與分子的單一粒度表示相比,作者的方法同時利用了各種粒度表示的優點,并自適應地調整每種表示對分子性質預測的貢獻。

1.摘要

分子性質預測是物理、化學和材料科學領域的熱點問題。提取有用的分子特征對于分子性質預測至關重要。原子級表示通過原子級標記化,根據SMILES串給出了分子的細節。與原子級別的表示相比,子串級別的表示詳細地提供了分子的一些子結構信息或片段。原子級別和子串級別的表示都可能丟失分子的鄰域或空間信息。而聚集分子鄰域信息的分子圖表示法在表示手性分子或對稱結構方面能力較弱。圖1為分子的三種粒度表示。為了充分利用不同分子表示的優勢,本文提出了一種多粒度融合學習模型,該模型同時利用了不同粒度表示的優勢,并自適應地調整每種粒度對分子性質預測的貢獻。作者的方法在廣泛使用的數據集上得到了驗證。此外,作者還與單粒度表示(即原子級別、子串級別或分子圖)以及分子圖和SMILES串的融合方法進行了比較。

2.模型介紹

模型由五個組件組成,包括輸入數據的預處理(a)、輸入層(b)、編碼器(c)、特征融合(d)和最后一層預測(e)。將分子序列送入前處理部分。輸入層由三種粒度表示(即原子級、子串級和分子圖)組成。該模型的編碼器由兩種類型的子編碼器組成。BiGRU編碼器利用共享參數對原子級和子級信息進行編碼。GraphSAGE用于對分子圖進行編碼。融合層結合了原子級表示(記為AE)、子串表示(記為BE)和分子圖表示(記為GE)的輸出,便于同時融合不同粒度的優勢。

2.2 Bi-GRU雙向編碼器

作者使用GRU作為RNN單元,每個循環單元可以通過GRU自適應捕獲不同時間尺度的依賴性。重置門和更新門是兩種類型的門,和的計算方法如下:

新的隱藏單位ht的計算方法如下:

2.3 分子圖編碼器

本文使用GraphSAGE作為分子圖的編碼器,它可以通過采樣和聚合節點的鄰居嵌入來有效地捕捉圖的結構信息。SMILES字符串可以表示為, 被送入GraphSAGE編碼器,輸出,具有相同的長度。 2.4 多粒度SMILES特征表示融合

作者融合了三種類型的編碼器的輸出,并自適應地調整每種粒度對分子性質預測的貢獻,稱為。是來自原子級Ha、子串級Hb和分子圖Hg的表示的融合。融合層如圖2d所示。融合表示的計算如下:

表示三個隱藏狀態的權重,門的大小與H的隱藏態相同。是提出的多粒度分子表示。作者借鑒前人的工作也對樣本進行了填充,以統一它們的長度。因此,可以將不同長度的三種不同粒度的表示直接相加,得到用于預測的融合表示。在這項工作中,作者將定義為向量,計算方法如下:

3.實驗

作者廣泛使用的MoleculeNet中選擇數據集,即BACE、BBBP、HIV、Tox21和ClinTox。另一類數據集如LogP和FDA來自ZINC數據集。 BACE、BBBP、LogP和FDA數據集的ROC-AUC評估指標結果表2所示。可以看出作者的三種粒度融合的表示學習方法優于基準方法。

為了進一步驗證模型性能,作者將Tox21和ClinTox上的每個任務視為單個屬性,然后在每個任務中相互比較ROC-AUC。圖3顯示了使用不同粒度的不同模型對Tox21上12種屬性的ROC-AUC進行比較,作者的模型在12個任務中的6個任務上達到了最先進的性能。圖4顯示了兩種屬性在ClinTox上的ROC-AUC比較****

作者還比較了一些有關LogP、FDA和HIV的最先進模型的準確性。實驗結果如表3所示,說明了FDA和HIV的準確性。表4顯示了在LogP上的比較結果。

上述實驗結果表明,通過融合不同分子粒度的表示可以捕獲分子特征,對于具有明顯官能團或分支的分子,該方法的增益更大。因此,作者的方法能夠自適應地調整和選擇分子屬性預測的有利特征,并對不同的數據集具有較好的泛化能力。 4.總結

本文通過充分利用各種粒度表示法的優勢,并自適應地調整每種粒度表示法的貢獻度,從而為分子性質預測提供了一種綜合的方法,大大緩解了單一粒度表示法的不足。與現有的融合方法相比,該方法通過引入子串級別的表示或分子片段,具有更好的泛化能力。 參考文獻****

文章地址//doi.org/10.1093/bioinformatics/btac550

代碼地址

付費5元查看完整內容

本文介紹由蘭州大學黎育權和騰訊量子實驗室謝昌諭博士等人發表在Nature Machine Intelligence期刊上的研究成果,論文通訊作者為姚小軍教授。文章中報道了一種自動圖學習方法,能夠在人工不參與的情況下,在多種不同任務上取得先進的預測性能,超越過去的主流模型。作者還提出一種新的分子魯棒性實驗方法,并發現模型集成能夠大幅提升魯棒性。

1 研究背景

藥物發現是一個耗時、昂貴和復雜的過程,在人類健康和福祉中發揮著至關重要的作用。機器學習方法,尤其是圖學習方法有可能顯著提高藥物發現效率。它們能從現有藥物相關數據集中進行學習,從而來預測分子相互作用和性質。同時,這也是機器學習能夠從廣闊的化學空間中以極快的速度和低成本尋找潛在候選藥物的關鍵所在。

然而,在少部分數據集上追求高預測性能已經固化了它們的架構和超參數,這使得它們在新數據的利用上不在有優勢。這種固化限制了他們在新數據上的學習能力和應用,使得他們的性能變得平庸。此外,大多數圖學習方法嚴重依賴深度學習的專家知識來實現其聲稱的最先進結果。當作者不給出這些具體的神經網絡架構和參數的時候,后來的研究人員甚至無法復現他們的模型性能。

這項工作提出了基于圖學習的自適應機器(Graph learning based adaptive machine, GLAM),它可以適應數據集并在無需人工干預的情況下做出準確的預測。

2主要貢獻

(1)提出一種自動機器學習方法,可以同時應用于分子屬性預測、藥物-蛋白相關關系預測、藥物-藥物相互作用預測。

(2)在相對公平比較的情況下(相同數據集分割),對比目前主流模型并取得最佳性能,包括分子屬性預測任務,藥物-靶標相關關系預測任務。 (3)提出一種合理的圖模型魯棒性測試方法,并發現集成模型比單模型的魯棒性好。

3 方法

本文的方法跟過去的設計一個圖網絡不同,本文利用自動化的流程從數據集中學習并逐步建立一個預測器,如圖 1 和圖2所示。以前的圖學習方法嚴重依賴人類專家來設計架構、調整模型超參數、選擇優化器和選擇損失函數。本文將這四個項目組合成一個配置,并將潛在的配置放入一個配置空間。從這個配置空間開始,GLAM 執行一系列步驟來構建預測器,如圖 2 所示。GLAM首先從配置空間中采樣了很多配置。然后將數據集喂給到這些配置以進行低保真訓練,從而得到驗證集分數以便于選擇性能高的配置。低保真訓練是指少量輪次的快速訓練,從而得到所有配置的驗證分數以快速估計他們的預測性能。高保真訓練是指使用巨量的輪次(帶早停)來精準地估計所選配置的預測性能。最后,將所有選定的預測器集成并建立一個最終預測器。

圖1. GLAM和傳統方法的對比.

圖 2. GLAM 具體流程圖.

本文設計了兩種通用架構,一種用于分子相互作用,另一種用于分子性質,如圖 3 所示。通用架構中的每個模塊都有自己的設計空間,如圖 4 所示。這些神經網絡架構接受的輸入都為圖,包括分子圖和蛋白圖。本文以原子為節點,以鍵為邊建立分子圖。對于蛋白圖,本文首先使用RaptorX計算得到接觸圖(contact map),然后以氨基酸殘基為節點,以接觸圖提供的信息作為邊建立蛋白圖。DTI任務同時考慮分子圖和蛋白圖作為輸入。DDI任務考慮兩個分子圖同時作為輸入。分子性質預測則接受單分子圖作為輸入。

圖 3. 應用于DTI和分子性質預測的神經網絡架構.

3 結果和討論 3.1適應數據集并取得高性能 GLAM是為了適應數據集以獲得高預測性能而設計的。為了考察該方法的適應性和性能,本文在14個數據集上與一系列具有代表性的傳統方法進行了性能比較。測試數據集的類型包括藥物-蛋白質相互作用、藥物-藥物相互作用、物理化學性質、生物活性、藥代動力學和毒性。考慮到不同的數據集分割會導致不同的性能,本文讓所有的方法共享相同的數據集分割,以獲得公平的評價。為了體現GCN,GAT,MPNN在不同架構和參數的差異,本文還盡量使用人工的方式優化架構并調整參數,以達到在某個數據集上達到最佳性能,以便于對比其適應性。最后,本文在這些數據集上運行基準測試。

與所有傳統方法相比,本文提出的方法能夠很好地適應數據集,并取得了良好的預測性能,如表1、表2和表3所示。傳統方法在不同數據集上固化下來的架構和參數表現出乘次不齊的性能,而GLAM可以在沒有人為干預的情況下始終如一地獲得最好的分數。因此,GLAM準備成為一種靈活、可靠和值得信賴的方法,在藥物設計的廣泛應用中都能很好地發揮作用。

表1. DTI任務上的性能對比

注:以上所有方法測試基于相同數據集分割。

表2. 分子性質預測任務上的性能對比

注:以上所有方法測試基于相同數據集分割,分割方式為基于scaffold的隨機分割。

3.2面對分子結構擾動表現出高魯棒性 本文認為魯棒性也是衡量一種方法是否優秀的重要指標。本文假設,當施加對分子性質影響很小的結構擾動時,一個魯棒的預測器不應顯著改變其輸出。機器學習方法可能受到各種自然干擾的影響,如果這樣的干擾發生在一些安全敏感型行業(如醫療),后果可能是災難性的。如圖4所示,本文跟多個主流模型進行了對比。GLAM 的魯棒性很可能是由于在流程末端的模型集成。集成的主要思想是訓練幾個模型,通過平均得到最終的預測。擾動分子結構可能會影響單個預測器,但不太可能會顯著影響混合模型。更多關于魯棒性實驗的細節見論文原文。

表4. 魯棒性實驗

4 總結 本文提出了一種靈活的方法,可以適應任何數據集并做出準確的預測。所提出的方法采用自適應的自動機器學習流程從數據集中學習并得到一個高性能,高魯棒的預測器。在沒有任何人工干預的情況下,該方法在所有測試數據集上實現了比基于手工設計的的傳統方法更好的預測性能。此外,本文發現所提出的方法比傳統方法更魯棒。這是第一個為分子數據設計的自動圖學習方法。它的出現能夠為新出現的全新數據賦能,即使充分利用好這些新數據。

參考資料 Li, Y., Hsieh, CY., Lu, R. et al. An adaptive graph learning method for automated molecular interactions and properties predictions. Nat Mach Intell (2022). //doi.org/10.1038/s42256-022-00501-8

付費5元查看完整內容
北京阿比特科技有限公司