亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

本文介紹一篇來自浙江大學侯廷軍教授課題組、中南大學曹東升教授課題組、華東理工大學李洪林教授課題組聯合發表的論文。該論文提出了一種能夠在分子生成過程中考慮到蛋白-配體相互作用的深度學習生成模型RELATION,該模型適用于基于靶標結構的全新藥物設計。RELATION模型同時使用百萬量級的分子庫以及蛋白-配體集合數據對變分自編碼器進行訓練,在引入雙向遷移學習后,隱藏層的采樣能夠同時兼顧生成分子的骨架片段的新穎性以及對靶標蛋白的親和性。RELATION模型還提供了藥效團約束生成以及貝葉斯優化(BO)采樣等模塊,可供用戶定制化生成藥效團匹配度更高以及對靶標的對接打分表現更好的分子。

1 研究背景 先導化合物的發現與優化在新藥研發過程中至關重要,高質量的先導化合物能夠大大縮短藥物探索的時間,提高成藥的可能性。在先導化合物的設計過程中,要充分考慮候選分子的結構新穎性、生物活性、靶標選擇性、化學可合成性、成藥性和安全性等,這些性質直接影響藥物開發的成敗,因此先導化合物的發現一直是創新藥物研發的主要瓶頸。隨著計算機硬件、軟件和算法的飛速發展,高通量篩選虛擬篩選和藥物從頭設計等計算機輔助藥物設計技術開始取代傳統方法,并大大縮短了先導物發現的時間和成本。

全新藥物設計與虛擬篩選技術不同,不依賴已有的化學數據庫,可以通過不同的生成算法對類藥空間進行更加深入的探索和發掘。傳統的全新藥物設計方法通常將遺傳算法結合到藥物從頭設計中,嘗試通過進化策略來優化生成的化合物結構。然而,傳統的藥物從頭設計方法無法兼顧生成分子的新穎性與理想屬性。深度學習(Deep learning, DL)的引入為全新藥物設計注入了新的活力。作為近期發展最快的人工智能技術,DL能夠更高效地處理數據,對化合物屬性深度特征的提取能力更強。鑒于深度學習對分子屬性的深度特征出色的提取能力,目前已經有近百種基于深度學習的框架的全新藥物設計模型被開發出來,旨在解決傳統方法中生成分子的新穎性與理想屬性之間的沖突。這些方法大致可以被分為四類:編碼-解碼器(Encoder-Decoder,Enc-Dec)、循環神經網絡(Recurrent Neural Network, RNN)、生成對抗網絡(Generative Adversarial Networks,GAN)和強化學習(Reinforcement Learning,RL)。

目前大部分基于DL的全新藥物設計模型是以配體為中心,配體分子被表示為SMILES字符串或2D分子圖。這些基于配體分子的全新藥物設計的模型,在經過訓練后確實能夠生成大量有效且新穎的化合物,但是這些基于配體二維信息的表征會忽略分子在藥物設計任務中一些非常重要的屬性,比如藥物分子的三維立體構象以及與蛋白之間的結合構象。本文介紹的RELATION模型是一個使用了變分自編碼器框架的生成模型,在雙向遷移學習的作用下,模型能夠生成大量結構有效、結構新穎并且對蛋白具有一定親和力的化合物。在藥效團約束和BO采樣的作用下,RELATION將會更加適用于基于靶點結構的全新藥物設計任務。

2 RELATION方法 數據集 RELATION模型的訓練使用了源域和目標域兩種數據集。源域的百萬數量級的小分子化合物來源于ZINC數據庫。目標域則使用AKT1以及CDK2兩個靶點的數據集,407個AKT1抑制劑和1017個CDK2抑制劑搜集于BindingDB和ChEMBL數據庫,然后將兩個靶點的抑制劑對接到靶標蛋白,只保留配體周圍5 ?的原子作為蛋白配體復合物數據集。隨后將源域數據集和目標域數據集放入7.57.57.5 ?3的網格中,并將源域數據集和目標域數據集的質心與立方體框的質心對齊,重原子的位置以1 ?作為分辨率,每個原子由19個物理化學性質描述。最后,源域數據集和目標域數據集中的每個分子都由一個由其坐標特征向量定義的四維張量表示。

模型框架 RELATION框架由兩個部分組成:(1)3D編碼器,使用了3D-CNN的結構,包括私有編碼器和共享編碼器。附帶SMILES標簽的訓練源域數據以及目標域數據轉換成4D張量后,分別作為私有編碼器和共享編碼器的輸入。所有的編碼器具有相同的架構,均具有8層,第一層包含64個過濾器,然后在奇數層上加倍,最后一層學習512個過濾器。每一個偶數層后面都有一個額外的池化層,核數、步長和填充為2,用于執行下采樣。利用ReLU激活函數對3D-CNN模型進行訓練,并使用兩個輸出為512維的全連接層得到μ和σ,對其重參數化后,生成一個的1024維嵌入向量;(2)解碼器,解碼器的結構是caption-LSTM,可以將隱藏層內的高維向量轉化為SMILE分子式,caption-LSTM由三層組成,其詞匯量輸入大小為39,隱藏大小為1024。

圖1 RELATION方法的模型框架

訓練方式

3 RELATION計算結果 RELATION生成分子的屬性 表1中的計算結果顯示,RELATION模型生成的分子的有效性、獨一性、新穎性以及生成的分子的多樣性均優于其他3D生成模型。隨著雙向遷移學習的引入,可以發現雙向遷移學習的RELATION (AAE)和RELATION (VAE)模型的有效度、獨一性以及多樣性均高于其他模型。圖1的結果顯示非遷移學習框架生成的分子的分布與抑制劑完全不同,當使用單向遷移學習框架對模型進行再訓練時,生成的分子分布與現有抑制劑分布的重疊明顯增加。而使用雙向遷移學習RELATION框架后,模型產生的分子的化學空間分布與抑制劑完全重合,表明所生成的分子和現有抑制劑涵蓋了類似的化學空間,并且具有相似的屬性。圖2則展示了不同模型生成的分子與AKT1和CDK2抑制劑的化學空間分布。圖2的結果也與表1中數FCD數據一致。這些結果均表明,RELATION模型生成的分子不僅能夠保證有效性、新穎性以及多樣性,也能夠保證和已有抑制劑的屬性相似性。

圖2 不同模型生成的分子與抑制劑的T-SNE分析

藥效團約束和BO采樣模塊的效果 RELATION模型的藥效團約束是通過CVAE框架實現,將藥效團特征匹配度作為CVAE的特征引入到RELATION的訓練中。不同模型生成分子的藥效團分數分布如圖3所示。對于AKT1和CDK2,基于藥效團的RELATION模型產生的分子比原始RELATION模型產生的分子有更高的藥效團分數。這表明,通過將藥效團特征引入RELATION,生成的分子可以增強與預設藥效團模型間的匹配性。

作者還在RELATION框架中引入了BO的采樣。如圖3所示,在RELATION框架中引入BO采樣后生成的分子的藥效團分數都得到了提高,其中基于對接打分的BO的采樣性能略好于基于QSAR打分的BO。此外,基于對接打分的BO采樣產生分子的對接分數較原始RELATION模型生成分子的對接分數有明顯提高,但基于QSAR打分生成的分子的對接打分變化不大。

圖3 不同模型生成分子的藥效團和對接打分分布

為了進一步研究基于BO采樣的RELATION模型的性能,作者將不同模型生成的有效分子與AKT1抑制劑再次進行了T-SNE分析。如圖4所示,RELATION和RELATIONpha模型不能有效地探索AKT1抑制劑的化學空間(紅圈中標記的點)。隨著通BO-采樣方式的引入,生成的分子在化學空間中的分布比原始RELATION更加分散,說明生成的分子與AKT1抑制劑的化學空間更為相似。此外,根據點的顏色梯度,使用BO采樣的RELATION模型生成的分子比原始RELATION模型生成的分子的對接得分更優。

圖4 RELATION模型使用不同的采樣方式生成分子的化學空間分布

作者在圖5中展示了不同RELATION模型生成的一些分子的示例。如圖5所示,引入BO采樣后,RELATION和RELATIONpha均能生成對接分數較好的分子,但基于BO采樣的RELATION模型生成的分子藥效團匹配分數較高,并產生了更理想的藥效團特征。

圖5 使用RELATION模型的設計AKT1抑制劑實例

4 總結 在AKT1與CDK2的抑制劑全新設計的任務中,RELATION模型既能生成結構新穎且多樣性高的分子,并且能夠保證生成的分子對靶標具有一定的親和性。隨著基于對接打分的BO采樣以及藥效團約束模塊用于RELATION模型,RELATION模型能夠使得生成的分子同時具有更好的藥效團匹配和對接表現。這些結果表明,RELATION模型是一種極具競爭力的深度學習全新藥物設計模型。 參考資料 RELATION: A Deep Generative Model for Structure-based De Novo Drug Design, Journal of Medicinal Chemistry, 2022. //doi.org/10.1021/acs.jmedchem.2c00732

付費5元查看完整內容

相關內容

醫學領域的人工智能是使用機器學習模型搜索醫療數據,發現洞察,從而幫助改善健康狀況和患者體驗。 得益于近年來計算機科學和信息技術的發展,人工智能 (AI) 正迅速成為現代醫學中不可或缺的一部分。 由人工智能支持的人工智能算法和其他應用程序正在為臨床和研究領域的醫學專業人員提供支持。

作者構建了一個蛋白質-蛋白質相互作用(PPI)靶向藥物相似性數據集,并提出了一個首次用于PPI抑制劑設計的深度分子生成框架,從種子化合物的特征生成新的類藥性分子。該框架使用與PPI抑制劑相關的關鍵特征作為輸入,并為PPI抑制劑的從頭分子設計開發深度分子生成模型。首次將針對PPI的抑制劑的定量類藥性指標QEPPI用于PPI靶向化合物的分子生成模型的評估。結果表明生成的分子具有較好的PPI靶向藥物的類藥性。此外,通過化學空間分析,生成的分子與iPPI-DB抑制劑共享化學空間。

QEPPI

quantitative estimate of protein-protein interaction targeting drug-likeness //github.com/ohuelab/QEPPI

1 背景 新藥研發是一個成本高、風險大、周期長的漫長過程。新藥開發涉及先導化合物的發現、優化和臨床研究等多個階段,其中早期先導化合物的發現仍是亟待解決的重要問題。傳統的基于定量構效關系或基于對接的虛擬篩選通常傾向于從現有的化學庫中搜索具有所需特性的分子。相比之下,從頭藥物設計(分子生成)旨在通過從頭開始生成具有所需特性的新分子來探索類藥分子的化學空間,以拓寬現有的化學庫。

蛋白質-蛋白質相互作用(PPIs))在各種生物過程中發揮著至關重要的作用,因此對人類健康和疾病狀態的發展至關重要。研究表明,異常 PPI 與多種疾病有關,包括癌癥、傳染病和神經退行性疾病。由于它們的關鍵影響,PPI 被認為是具有治療意義的有希望的藥物靶點。然而,以前針對 PPI 的嘗試由于其一般特性而面臨嚴峻挑戰,例如平坦的表面、無特征的構象、復雜的拓撲結構和淺口袋。傳統計算機引導 PPI 抑制劑的設計已取得重大進展,并且分子生成模型近年來得到了迅速發展。不幸的是,迄今為止,尚未將基于深度生成模型的方法應用于 PPI 抑制劑的設計。此外,類藥性 (QED) 的定量估計通常用于評估定量藥物相似性,但不適用于評估靶向 PPI 的化合物。Kosugi 和 Ohue 開發了一種針對 PPI 抑制劑的定量估計的指標 QEPPI ,專門用于評估 PPI 靶向化合物。QEPPI 是針對 PPI 靶向藥物的 QED 方法的擴展,使用 QED 概念開發,涉及基于已批準藥物可用信息的物理化學性質建模。研究結果表明,QEPPI 比 QED 更適合量化早期 PPI 藥物發現的藥物相似性。PPI 抑制劑具有兩個基本的分子特征:分子形狀和芳香鍵,因此研究人員想使用分子形狀等 3D 特征作為模型的輸入。

這項研究中,研究人員構建了一個 PPI 靶向藥物相似性數據集,并提出了一個深度分子生成框架,以從種子化合物的特征中生成新的 PPI 靶向藥物相似性分子。該研究首次探索了PPI 抑制劑分子生成模型的從頭分子設計。研究人員的模型表現出與各種最先進的分子生成模型相當的性能。該模型首次將QEPPI應用于分子生成模型中生成分子的PPI藥物相似性評估。結果表明,生成的分子具有更好的PPI靶向藥物相似性和藥物相似性。生成的分子與 iPPI-DB 共享化學空間。探索了 PPI 抑制劑的基于肽和基于配體的分子生成。

2 材料和方法 數據準備 研究人員建了一個靶向PPI的ChEMBL 的藥物相似子集,用于模型訓練。所有分子的拓撲數據均從 ChEMBL29 下載,并使用一系列規則清洗過濾。

模型架構 PPI 抑制劑的深度分子生成模型包括兩個主要步驟:(i) GAN 使用 3D 卷積神經網絡 (CNN) 來捕獲分子表示,(ii) 組合CNN 和LSTM網絡從分子表示中解析 SMILES。分子形狀和藥效團表示用作 GAN 的輸入,然后是字幕網絡將分子形狀和藥效團表示解析為 SMILES 字符串,生成與配體表示匹配的分子。

評估指標 為了深入了解模型性能并確定與其他生成模型相比的潛在優勢和劣勢,該方法在 MOSES 平臺上進行了基準測試。

3 結果與討論 模型性能 所有模型在來自訓練數據集的 300000 個預處理的分子上進行了訓練,并在 10 000 個測試和骨架拆分測試集上進行了測試。研究人員使用了 MOSES 平臺中可用的模型和超參數,通過在五次獨立運行中,每次采樣 30000 個 SMILES 來評估該模型。

所提出的 iPPIGAN 模型優于其他具有相似或高百分比的有效、獨特和新穎的 SMILES 字符串的生成模型。在 FCD 方面,研究人員開發的模型優于大多數其他方法。

性質分布 藥物設計和藥物篩選領域中,LogP、合成可及性評分 SAscore、天然產物相似性 NP-likeness和 定量藥物相似性QED起著基礎性的作用。但 QEPPI 比 QED 更適合定量估計 PPI 靶向化合物。iPPI-DB抑制劑的QED和QEPPI平均值分別為0.43和0.61。

研究人員比較了六種分子性質的分布,即 iPPI-DB 抑制劑以及AAE、CharRNN、VAE、LatentGAN 和 iPPIGAN 生成的分子集。如圖2所示,iPPIGAN生成的分子的性質分布與測試集的性質分布接近。iPPIGAN 模型生成的分子的性質分布與 iPPI-DB 抑制劑的不同,主要是因為訓練數據集的性質分布與 iPPI-DB 抑制劑的不同。此外,與其他模型相比,iPPIGAN 生成的分子具有更高的 QED 值、更高的 QEPPI 值和更低的 SA 分數。結果表明,iPPIGAN生成的分子易于合成,具有更好的藥物相似性和PPI靶向藥物相似性。由于構建的訓練集具有較高的藥物相似性,該模型可以更好地學習藥物相似性分布并擴展到新的藥物相似性空間。

化學空間分析 為了更好地理解生成分子的化學空間,通過計算MACCS 分子指紋用作嵌入和UMAP圖來評估化學空間覆蓋率。如圖所示,UMAP 圖中,生成的分子不僅與 iPPI-DB 抑制劑共享化學空間,而且通過用新分子彌合間隙來擴展它。

基于肽的生成分子案例 為了評估基于肽生成的化合物是否可以成為有效的候選分子,研究人員選擇了基于p53(肽)生成 MDM2-p53 靶標的潛在候選抑制劑。p53 是一種有效的腫瘤抑制因子,是癌癥治療的一個有吸引力的靶標,因為它可以在功能上被激活以根除腫瘤。編碼 p53 蛋白的基因在一半的人類癌癥中發生突變或缺失,從而使腫瘤抑制因子的活性失活。阻斷 MDM2-p53 相互作用以重新激活 p53 的功能是一種很有前景的癌癥治療策略。研究人員收集針對 MDM2-p53 的生物活性數據開發了一種用于活性預測的LightGBM回歸模型,然后使用 LightGBM 回歸模型來預測生成的分子是否對 MDM2-p53 PPI 靶標具有生物活性。此外,通過 QEPPI 值 > 0.5 和 SAscore值 <4 過濾化合物后,有 243 種化合物被命中。為了進一步確定優先考慮用于生物測定的分子,研究人員使用DOCK6進行分子對接來預測結合親和力。分子對接結果顯示,研究人員找到了 10 種具有比參考化合物更高的對接分數和 QEPPI 值的化合物。

基于配體的生成分子案例 為了評估基于配體生成的化合物是否可以成為良好的候選分子,研究人員選擇了基于 obatoclax 的生成 Bcl2 靶標的潛在候選抑制劑。BCL-2 蛋白家族通過控制線粒體外膜的完整性在調節細胞死亡中起關鍵作用。促凋亡 BCL-2 家族蛋白,如 BAK 和 BAX,在細胞凋亡中具有重要作用。當這些蛋白質被抗凋亡結合伙伴(如 BCL-2 和 BCL-XL)隔離時,它們的作用就會被阻斷。通過與抗凋亡 BCL-2 家族蛋白結合來破壞這種相互作用的小分子已被設計用于誘導癌細胞的凋亡。相關的 PPI 專門針對 Bcl-2 家族蛋白,因為 Bcl-2 家族成員之間的所有相互作用都是通過 PPI。目前正在臨床試驗中測試三種 Bcl-2 家族 PPI 干擾物(即 navitoclax、obatoclax 和 Venetoclax)。研究人員收集針對 Bcl2 的生物活性數建立LightGBM回歸模型用于針對 Bcl2 靶標的活性預測。分子指紋和分子描述符作為特征輸入,IC50(nM)的自然對數作為標簽,IC 50小于 100 000 nM 的值被定義為活性分子。然后使用 LightGBM 回歸模型來估計生成的分子是否對 Bcl2 具有生物活性。此外,通過 QEPPI 值 > 0.5 和 SA 得分值 <4 過濾化合物后,有 44 種化合物被命中。為了進一步優先考慮用于生物測定的分子,選擇性 Bcl-2 抑制劑 obatoclax 作為參考化合物,并通過對接預測結合親和力。結果表面,其中15 種具有比參考化合物更高的對接分數和 QEPPI值。

4 結論和未來工作 這項工作中,研究人員構建了一個 PPI 靶向藥物相似性數據集,并開發了一種新的基于形狀的分子生成框架,用于生成針對 PPI 的新型有效藥物相似性分子。研究人員的策略利用 GAN 和字幕網絡從種子分子的 3D 特征生成針對 PPI 的潛在抑制劑。該方法依賴于分子或肽作為種子分子生成多樣性的PPI類藥性化合物庫。目前是第一次將深度分子生成模型應用于 PPI 抑制劑的從頭設計。此外,首次應用 QEPPI 作為分子生成模型的評估指標用于PPI靶向化合物的分子設計。研究人員的模型顯示出與其他幾種最先進的分子生成模型相當的性能。化學空間分析表明,生成的分子與 iPPI-DB 抑制劑具有相似的化學空間。研究人員探索了基于肽的 PPI 抑制劑設計和基于配體的 PPI 抑制劑設計。結果表明,生成的分子具有更好的 PPI 靶向藥物相似性和藥物相似性。PPI 在生活中無處不在,它們的研究和理解對于藥物發現和生物工程的努力至關重要。PPI抑制劑的分子生成模型仍然只是向前邁出了一小步。

參考資料 Jianmin Wang, Yanyi Chu, Jiashun Mao, Hyeon-Nae Jeon, Haiyan Jin, Amir Zeb, Yuil Jang, Kwang-Hwi Cho, Tao Song, Kyoung Tai No, De novo molecular design with deep molecular generative models for PPI inhibitors, Briefings in Bioinformatics, Volume 23, Issue 4, July 2022, bbac285

數據和代碼

付費5元查看完整內容

新藥物設計是產生具有理想藥理和理化性質的新型先導化合物的過程。深度學習(deep learning, DL)在藥物從頭設計中的應用已成為一個熱門話題,許多基于深度學習的方法已被開發用于分子生成任務。一般來說,這些方法按照四個框架開發:循環神經網絡;編碼器-解碼器;強化學習;以及生成式對抗網絡。在這篇綜述中,我們首先介紹了基于深度學習的新藥從頭設計中使用的分子表征和評估指標。然后,我們總結了每種架構的特點。最后,對基于深度學習的分子生成技術的潛在挑戰和未來發展方向進行了展望。

//www.sciencedirect.com/science/article/pii/S0959440X21001433?via%3Dihub

據估計,化學空間中類藥物化合物的數量可能高達1023-1060[1],因此完全探索這一巨大的化學空間在計算上是非常困難的。在這種情況下,如何有效地從如此大的化學空間中挖掘新的先導化合物成為藥物發現的一個真正的挑戰。隨著計算能力和實驗技術的顯著提高,高通量篩選[2]和虛擬篩選(VS)[3]已成功應用于多種過濾器對大型化學庫進行評價。此外,隨著機器學習(ML)技術的快速發展,建立了基于ML的定量構效關系(QSAR)方法,作為VS不可缺少的過濾器,有助于高效、可靠地評估各種理化和藥理特性[4]。然而,傳統的基于QSAR或基于對接的VS通常傾向于從現有的化學庫中尋找具有理想性質的分子。相比之下,新藥發現(de novo drug design,分子生成)旨在通過從頭生成具有理想性質的新分子來補充現有的化學庫,從而探索化學空間。

盡管許多基于計算生長算法和進化算法的傳統從頭藥物設計方法已被開發出來,以從構建模塊[5]生成新的分子結構,但在許多方法中,優化各種目標和生成新的化合物[5]之間存在折衷。深度學習(DL)的發展為創新藥物的設計和發現提供了新的機遇。近年來,開發了各種基于DL的從頭藥物設計算法,DL在藥物發現中的成功應用被麻省理工學院(MIT) Technology Review評選為2020[6]十大突破性技術之一。

在VS中實現的基于深度學習的方法通常用于預測輸入分子的物理化學或生物性質,這實際上是QSAR判別建模的應用。與DL在VS中的區別作用相比,基于DL的生成模型本質上可以被認為是在巨大的化學空間中檢測具有理想性質的化合物的探索者。基于dl的生成模型可以實現對化學空間中現有分子的性質和/或結構特征進行總結和提取,然后將其轉化為新的支架的過程,也稱為反向QSAR過程[7]。生成模型的目的是有點類似于它與優化策略適用于接近理想的分子性質(如右所示圖1)上角,而與通常方法實現各種過濾器來縮小篩選化合物的化學空間,直到達到一個容易處理的范圍(如右所示低的圖1)。不過,相信,通過探索的連續空間的屬性,生成模型可以生成具有新穎支架和理想性質的分子。

圖1 通過虛擬篩選和分子生成來探索化學空間的過程。虛擬篩選通過給定的化學庫的性質來篩選化合物,而新藥設計通過聚焦于定向性質來生成新的化合物。

ML算法用于構建生成模型可以分為四類:遞歸神經網絡(RNN) encoder-decoder (Enc-Dec),強化學習(RL)和生成對抗網絡(GAN)(8、9)(圖2)。盡管傳統的生成模型已經開發的各種變異,其中大部分集中在兩個基本問題:分子表征;優化策略[8]。不同表示的應用旨在使DL算法更容易理解分子的不同特征。報道的算法除了常用的簡化分子輸入線輸入系統(SMILES)[10,11]外,還使用了分子圖[12,13]、指紋[14]和三維(3D)幾何[15]。生成過程中對分子性質的優化是為了使生成的分子在化學空間中產生高梯度和聚集區域,具有較高的有效性、新穎性和可合成性。例如,GENTRL[10]應用張量分解和自組織映射技術優化分子在化學空間的性質,快速設計針對Discoidin Domain Receptor Tyrosine Kinase 1 (DDR1)激酶的新型活性化合物。

通過這些改進的算法,大量基于深度學習的模型已成功用于目標導向的分子設計,并通過有機合成和活性評價成功識別了新的活性分子[10,16,17],凸顯了基于深度學習的生成模型在從頭藥物設計中的潛力。本文重點介紹了用于新藥設計的各種最新DL架構的特點。

付費5元查看完整內容

基于藥物相關數據進行分子的生成與評估是新藥設計的關鍵任務。在藥物設計早期,藥物研發通常依靠藥物化學家的經驗進行藥物分子的設計與驗證。藥物化學家會合成一組化合物并對其進行生物活性測試,查看測試產生的數據,并利用對基礎學科的理解來決定下一步要合成哪些分子。他們將以上步驟進行迭代,最終得到所需的目標分子。

20世紀30年代,定量結構-活性關系(Quantitative Structure-Activity Relationship,QSAR)的發展,為化學結構與各種理化性質之間建立了一個數學模型。這些用于性質預測的QSAR模型奠定了許多虛擬篩選策略的基礎。虛擬篩選使用大量候選分子數據集得到更小的數據集用于后續的合成或者購買。

之后許多研究團隊產生了新的想法。他們編寫了計算機程序來進行從頭分子設計進而生成新分子。這些程序通常在蛋白質結合位點上添加原子或官能團來“生長”現有的分子,然后使用各種打分函數來評估這些分子,并將更優分子用于合成。雖然這些全新的設計方法取得了一些成功,但它們并沒有被廣泛采用。

在近幾年深度學習發展的推動下,分子生成和分子性質預測領域開始復蘇。深度學習應用于分子性質預測,包括預測生物活性、ADME(Absorption, Distribution, Metabolism, and Excretion)和與毒性靶標(eg: hERG——thehumanEther-à-go-go-RelatedGene)的相互作用等。其不依賴于專家定義的分子特征集,而是使用可調整到特定任務的學習特征。相關性質預測模型的性能優于更傳統的QSAR方法。當應用于分子生成領域時,深度學習并不是隨機擴展現有的分子,也不是使用一套規則來連接現有的分子片段,而是從現有的分子訓練集中學習規則生成分子。通過將這些生成方法與預測模型相結合,研究人員能夠設計出滿足特定生物活性的分子。

付費5元查看完整內容
北京阿比特科技有限公司