高效的分子設計方法對加速早期藥物研發(fā)至關重要,有望節(jié)省數(shù)年的開發(fā)時間與數(shù)十億美元的研發(fā)成本。
當前的分子設計方法主要依賴基于序列或圖結構的表現(xiàn)形式,雖然能精準描述化學鍵、原子等局部特征,但缺乏對分子整體拓撲結構的全面表征。
2025 年 2 月 18 日,湖南大學信息科學與工程學院曾湘祥教授團隊在 Nature 子刊 Nature Machine Intelligence 上發(fā)表了題為:Image-based generation for molecule design with SketchMol 的研究論文。
該研究開發(fā)了一種基于圖像的分子設計生成系統(tǒng)——SketchMol,并通過實驗驗證了 SketchMol 能高效完成多類分子設計任務,其圖像驅動的設計范式為藥物發(fā)現(xiàn)提供了創(chuàng)新性技術路徑。
該研究提出的 SketchMol,融合了視覺理解與分子設計的圖像生成框架,其技術突破包括:
1、跨模態(tài)生成架構
● 采用擴散模型(diffusion model)生成分子圖像;
● 創(chuàng)新性應用基于分子專家知識的強化學習(reinforcement learning)來優(yōu)化技術優(yōu)化可行性分子的生成。
2、繪畫式分子構建
● 同步描繪分子局部結構與全局空間布局;
● 支持通過"分子畫布"實現(xiàn)原子/官能團的可視化編輯。
3、任務統(tǒng)一框架
● 從頭設計任務轉化為分子草圖繪制;
● 將分子編輯任務轉變?yōu)榫植繄D像補全。
EP4 是前列腺素 E2 受體的一種亞型,常作為炎癥和癌癥的藥物靶點。在藥物化學實踐中,藥理學家通常從已知活性片段出發(fā)(如下圖A左側原始結構),通過逐步結構擴展策略進行分子優(yōu)化。該研究應用 SketchMol 平臺模擬了這一經典研發(fā)流程:
1、計算機輔助生長模擬,基于 EP4 受體活性片段(灰色骨架部分)啟動設計,再通過迭代式圖像編輯實現(xiàn)官能團延伸(淺藍色標注為新增結構域)。
2、先導化合物復現(xiàn)驗證,成功生成專利文獻中記載的EP4活性先導化合物(結構B),經分子對接驗證,優(yōu)化后分子與受體結合模式與報道數(shù)據(jù)一致。
淺藍色高亮區(qū)域顯示 SketchMol 在片段生長過程中添加的關鍵藥效基團,該可視化方案直觀展示了基于圖像驅動的結構優(yōu)化路徑。
通過大量實驗驗證,研究團隊證明了 SketchMol 能高效完成多類分子設計任務,其圖像驅動的設計范式為藥物發(fā)現(xiàn)提供了創(chuàng)新性技術路徑。
相關閱讀:
2024 年 11 月,曾湘祥團隊在 Nature 子刊 Nature Computational Science 上發(fā)表了題為:A deep learning approach for rational ligand generation with toxicity control via reactive building blocks 的研究論文。
受 DNA 編碼化合物庫技術的啟發(fā),該研究提出了一種基于結構塊的配體生成深度學習方法——DeepBlock,該方法針對靶標蛋白序列進行定制,同時實現(xiàn)精確的性質調控。DeepBlock 將生成過程清晰地劃分為兩個步驟:結構塊生成和分子重構,分別由神經網(wǎng)絡和提出的基于規(guī)則的重構算法完成。此外,DeepBlock 協(xié)同整合優(yōu)化算法與深度學習技術,以調控生成分子的性質。實驗表明,DeepBlock 在生成具有結合親和力、合成可及性及類藥性的配體方面優(yōu)于現(xiàn)有方法。此外,當與以毒性為優(yōu)化目標的模擬退火或貝葉斯優(yōu)化相結合時,DeepBlock 能成功生成低毒性配體,同時保持與靶標的親和力。
2022 年 11 月,曾湘祥團隊在 Nature 子刊 Nature Machine Intelligence 上發(fā)表了題為:Accurate prediction of molecular properties and drug targets using a self-supervised image representation learning framework 的研究論文。
該研究提出了一種無監(jiān)督預訓練深度學習框架——ImageMol,該框架基于 1000 萬未標記的類藥生物活性分子進行預訓練,用于預測候選化合物的分子靶點。ImageMol 框架旨在通過分子像素級信息,基于分子的局部和全局結構特征從未標記分子圖像中預訓練化學特征表示。
研究團隊在 51 個基準數(shù)據(jù)集上證明了 ImageMol 在評估分子特性(即藥物代謝、腦部滲透性和毒性)和分子靶點譜(即β-分泌酶和激酶)方面的高性能。ImageMol 在美國國家轉化科學促進中心的 13 個高通量實驗數(shù)據(jù)集中顯示出識別抗 SARS-CoV-2 分子的高準確性。通過 ImageMol,鑒定出可用于 COVID-19 潛在治療的臨床候選 3CL 蛋白酶抑制劑。
論文鏈接:
https://www.nature.com/articles/s42256-025-00982-3
https://www.nature.com/articles/s43588-024-00718-0
https://www.nature.com/articles/s42256-022-00557-6
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com