亚洲男人的天堂2018av,欧美草比,久久久久久免费视频精选,国色天香在线看免费,久久久久亚洲av成人片仓井空

2022年4月27日,DeepMind科學工程師Tunyasuvunakool在Nat Rev Mol Cell Bio雜志發表評論文章,討論和分析了AI預測蛋白質結構的前景、機遇和挑戰。

2020年的CASP大賽標志著一項重大進展。機器學習方法AlphaFold預測了大多數目標蛋白的結構,評估人員稱其具有"與實驗相媲美"的準確性。本文討論了蛋白質結構預測方法的影響,強調了令人興奮的研究領域和剩余的挑戰。

背景

機器學習是人工智能的一個領域,它涉及到在不明確編程的情況下使計算機執行復雜任務。這通常涉及收集大量的輸入實例數據集,并在每種情況下指定正確的輸出。在訓練期間,機器學習模型的參數被逐漸調整,以使其在訓練集上的輸出更加正確。在蛋白質結構預測的情況下,輸入將包括目標氨基酸序列,加上任何進化相關的序列和模板結構,而期望的輸出是折疊蛋白質的原子坐標。一個模型的確切細節和它的訓練程序會極大地影響性能,所以直到最近才開發出可以解決這個問題的高精確度的方法。

實驗的伙伴

好的計算方法應該使我們有能力做更好的實驗,這是其重要性的核心。我們在蛋白質結構預測對實驗生物學的影響中看到了這一點。對于X射線晶體學家來說,良好模型的常規可用性使得更多的結構可以通過分子置換來解決,減少了花在實驗階段的時間。同時,在低溫冷凍電鏡中,將一個高精度的模型對接到密度圖中,可以加速模型的建立,并有可能提高其保真度。事實上,到目前為止,一些最令人印象深刻的應用是在綜合建模領域,其中低溫電鏡、X射線晶體學和結構預測被結合起來,以建立大型分子機器的模型。在這種情況下,預測和實驗相互促進,實驗數據也有助于驗證結構模型。

更廣泛地說,蛋白質結構預測可以支持對于表達和功能研究的有效規劃,為構建對象 (construct) 的設計和標簽的最佳位置提供建議。一個特別有用的應用可能是識別要突變以調節蛋白質功能的殘基。與蛋白質復合物預測相結合 (將在后面討論),這為更容易地破壞蛋白質功能和相互作用提供了可能。現在,良好的結構預測的普及,以及對這些方法認識的提高,使得結構指導的實驗計劃成為常規。

豐富的結構

實驗測定和預測之間的一個主要區別是,后者可以大規模地進行,從而使需要大量結構數據的一系列不同的應用成為可能。例如,現在有了涵蓋整個蛋白質組的預測結構,就有可能將其他大規模的生物數據映射到預測上,允許在適當的背景下研究突變和翻譯后修飾。預測數據庫也可以用結構感知算法進行搜索,可能會導致更敏感的蛋白質分類。一般來說,大型數據集的可用性支持生物信息學方法的發展。一個很好的例子是將AlphaFold的置信度量納入蛋白質失調預測的工具中。 可以說,大規模的預測也為我們提供了一個更清晰的蛋白質組結構的知識圖景。在AlphaFold蛋白質結構數據庫中,除了任何結構良好的結構域外,我們還選擇顯示對帶狀低置信區域的預測。雖然這種觀點與實驗提供的觀點有很大不同,但它直接承認了這些區域在重要蛋白質中的普遍存在,其中一些可能對應于內在的無序。

相互作用的預測

生物學主要關注的是具有許多相互作用成分的復雜系統的行為。解決這類系統的一個自然的下一步是預測蛋白質復合物的結構。為此,最近開發的單鏈方法很快就被社會各界用來支持蛋白質復合物的預測,現在已經有了像AlphaFold Multimer這樣專門為這項任務訓練的模型。結構預測已經被大規模地應用于識別新的真核生物復合物和對已知復合物進行結構描述。 鑒于蛋白質相互作用的生物學重要性,這必將是未來研究的一個令人興奮的領域。我們可能很快就能獲得一幅顯示這些相互作用如何發生的分子細節的圖片,而不是把蛋白質-蛋白質相互作用網絡看作是二維圖。已經預測的復合物可以成為一個有用的工具,盡管像任何預測一樣,它們應該被謹慎地解釋。復雜的預測仍然是一個具有挑戰性的問題,而且目前的模型不如單一多肽可靠。特別是要考慮到假陰性的可能性,即對于一對確實有相互作用的蛋白質,沒有預測到可靠的界面。

評估新方法

隨著該領域的快速發展,預測方法被用來解決其他與蛋白質有關的問題,保持對方法性能的基準評估的謹慎態度非常重要。為一個新的計算方法設計一個適當的評估并不簡單。需要小心翼翼地確保任務與生物學家在實踐中使用該方法的方式相一致,并且與他們相關的數量也是衡量標準。為了進行嚴格的評估,測試案例必須與模型在訓練中看到的案例有足夠的區別,否則它可能會通過鸚鵡學舌來欺騙訓練數據。在生物學中,進化關系使得測試/訓練集的分割更加困難,即使一個特定的蛋白質沒有出現在模型的訓練集中,也許一個接近的同源物會出現。考慮負面例子也可能是有幫助的:如果一個模型的目的是預測復合物的結構,那么對于兩個沒有相互作用的蛋白質,它應該輸出什么,以清楚地傳達這一點? 最后,在結構預測領域,事實證明在模型輸出中加入置信度是非常有用的,可以為生物學家提供一些指導,讓他們知道應該相信預測的哪些部分。類似的置信度指標在其他領域可能會有所幫助。

仍然存在的挑戰

看到成功應用蛋白質結構預測模型的方式多種多樣,這是非常了不起的。然而,最新方法所能解決的問題是有限的。特別是,它們并不具備回答從根本上講屬于蛋白質能量學的問題的能力,例如預測一個蛋白質可能采取的所有構象,或者確定一個突變對穩定性或與其相互作用伙伴的結合親和力的影響。 最先進的結構預測還缺少在實驗結構中發現的非蛋白質成分--核苷酸、離子、翻譯后修飾和配體。有時可以根據預測的蛋白質的局部幾何形狀推斷出離子等成分的存在。然而,預測是在不知道其他分子存在的情況下進行的,這使得模型無法根據生物環境進行調整。這些挑戰可能需要大量的進一步創新來解決。 生物學中的機器學習數據是什么使最近在蛋白質結構預測方面的進展成為可能?一個因素是對問題的具體化和對進展的評估,這一點必須歸功于CASP社區。然而,第二個值得注意的因素是蛋白質數據庫 (PDB) 的形式提供了一個優秀的數據集。PDB的幾個特點使其非常適合于機器學習:整個數據集很容易下載,文件具有一致的格式,每個條目都提供了高維數據而不是單一的測量,并且涵蓋了蛋白質空間的廣泛區域。PDB也很全面,基本上所有發表的結構都存放在那里。計算結構生物學極大地受益于PDB創始人的遠見卓識,以及對該項目的持續有力支持。如果其他領域也能實現類似的有利態勢,那么結構預測將成為生物學中機器學習的眾多成功案例之一。 參考資料 Tunyasuvunakool, K. The prospects and opportunities of protein structure prediction with AI. Nat Rev Mol Cell Biol (2022). //doi.org/10.1038/s41580-022-00488-5

付費5元查看完整內容

相關內容

 是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。 人工智能是計算機科學的一個分支。

AlphaFold是DeepMind開發的一個人工智能系統,可以根據蛋白質的氨基酸序列預測蛋白質的3D結構。AlphaFold軟件和“AlphaFold蛋白質結構數據庫”(AlphaFold Protein Structure Database)向公眾開放已經一年了,用戶可以探索和研究他們感興趣的蛋白質。

機器學習模型有潛力成為生物學的核心工具,正如最近在蛋白質結構預測方面的進展所表明的那樣。在這次網絡研討會中,我將概述AlphaFold:該系統如何工作,如何獲得蛋白質結構預測,以及如何分析它們。然后,我將回顧構建系統的一些方法,并將討論如何為新應用程序評估AlphaFold。

近年來,蛋白質結構的計算模型的能力和準確性顯著提高,結構生物學的一些領域沒有受到影響。這些變化已經在當前版本的AlphaFold中實現,RoseTTAFold也不遠了。實驗結構生物學仍然需要解決預測結構中的歧異,并驗證細節,但高質量模型的可用性正在消除實驗中的許多瓶頸。即使沒有實驗結構,新的模型也足以產生有趣的假設,可以通過實驗來驗證,比如評估與遺傳疾病相關的變異是如何導致疾病的。通過在當前算法中使用的模式識別中添加明確的物理和化學,以及積極利用有限的實驗觀察,可以解決模型的局限性。我將討論AlphaFold對結構生物信息學的影響,通過強調一些大規模的努力和開發的結構搜索工具來描述AlphaFold模型。

探索AlphaFold的應用程序

討論目前AlphaFold在結構生物學中的優勢和局限性

識別結構預測對結構、計算生物學研究的影響

付費5元查看完整內容
北京阿比特科技有限公司