近日,來(lái)自瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)的科學(xué)家們建立了一個(gè)名為ShiftML的機器學(xué)習程序,用來(lái)預測分子中的原子在磁場(chǎng)中的移動(dòng)狀況。這項研究發(fā)表在了《Nature Communications》上,表明AI可以幫助化學(xué)家們用比傳統建模方法更快的方式,來(lái)破解晶體的分子結構。
如今的許多藥物都是以粉末狀固體的形式生產(chǎn)出來(lái)的。但是,要想充分了解藥物中的活性成分進(jìn)入體內之后會(huì )如何表現,科學(xué)家們需要知道它們的確切原子結構,通常會(huì )采用核磁共振和密度泛函理論相結合的技術(shù)。
核磁共振技術(shù)通常用于探測原子之間的磁場(chǎng),并確定相鄰原子之間是如何相互作用的。然而,通過(guò)核磁共振測定完整的晶體結構,需要極其復雜且非常耗時(shí)的量子化學(xué)計算,這對于結構非常復雜的分子而言難度非常大,同時(shí)需要配合密度泛函理論(DFT)技術(shù)來(lái)進(jìn)行計算工作。DFT技術(shù)使用復雜的量子化學(xué)計算來(lái)映射特定區域內的電子密度,這個(gè)過(guò)程中需要進(jìn)行非常大量的計算。
為了優(yōu)化這個(gè)過(guò)程,研究人員開(kāi)發(fā)出了一個(gè)名為ShiftML的機器學(xué)習工具,可以用更快的速度來(lái)完成計算工作,并且在某些情況下可以像DFT程序一樣準確地執行。研究人員利用來(lái)自Cambridge Structural Database的數據對ShiftML進(jìn)行了訓練,其中2000個(gè)化合物結構用于對ShiftML的訓練和驗證,另外500個(gè)用于對其進(jìn)行測試。該數據庫包含數千種化合物計算得出的DFT化學(xué)位移,其中每一個(gè)化合物都由不到200個(gè)原子組成。研究人員表示,即使對于相對簡(jiǎn)單的分子,ShiftML的計算速度也比現有的方法快了將近1萬(wàn)倍。
對于更加復雜的化合物,這一優(yōu)勢將會(huì )更加明顯。舉例來(lái)說(shuō),ShiftML對一個(gè)分子的化學(xué)位移進(jìn)行計算,這個(gè)分子由86個(gè)原子構成,其化學(xué)元素和可 卡 因相同,但排列成了不同的晶體結構。整個(gè)計算過(guò)程花費的CPU時(shí)間不到一分鐘。相比之下,使用DFT技術(shù)計算同樣一個(gè)分子的化學(xué)位移,需要的CPU時(shí)間大約為62至150小時(shí)。
研究小組希望未來(lái)的ShiftML可以用來(lái)輔助藥物設計工作。“這項研究是非常令人興奮的,因為大幅度加速計算時(shí)間可以讓我們能夠覆蓋更大的構象空間,并準確界定那些以前無(wú)法確定的結構,”研究論文的共同作者之一、EPFL的化學(xué)教授Lyndon Emsley博士表示:“ShiftML可以讓現代的大多數復雜藥物分子觸手可及。”
如今,ShiftML已經(jīng)可以開(kāi)源使用,任何人都可以在平臺上上傳分子,并獲得其核磁共振特征。
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com