高效的分子設計方法對加速早期藥物研發(fā)至關(guān)重要,有望節省數年的開(kāi)發(fā)時(shí)間與數十億美元的研發(fā)成本。
當前的分子設計方法主要依賴(lài)基于序列或圖結構的表現形式,雖然能精準描述化學(xué)鍵、原子等局部特征,但缺乏對分子整體拓撲結構的全面表征。
2025 年 2 月 18 日,湖南大學(xué)信息科學(xué)與工程學(xué)院曾湘祥教授團隊在 Nature 子刊 Nature Machine Intelligence 上發(fā)表了題為:Image-based generation for molecule design with SketchMol 的研究論文。
該研究開(kāi)發(fā)了一種基于圖像的分子設計生成系統——SketchMol,并通過(guò)實(shí)驗驗證了 SketchMol 能高效完成多類(lèi)分子設計任務(wù),其圖像驅動(dòng)的設計范式為藥物發(fā)現提供了創(chuàng )新性技術(shù)路徑。
該研究提出的 SketchMol,融合了視覺(jué)理解與分子設計的圖像生成框架,其技術(shù)突破包括:
1、跨模態(tài)生成架構
● 采用擴散模型(diffusion model)生成分子圖像;
● 創(chuàng )新性應用基于分子專(zhuān)家知識的強化學(xué)習(reinforcement learning)來(lái)優(yōu)化技術(shù)優(yōu)化可行性分子的生成。
2、繪畫(huà)式分子構建
● 同步描繪分子局部結構與全局空間布局;
● 支持通過(guò)"分子畫(huà)布"實(shí)現原子/官能團的可視化編輯。
3、任務(wù)統一框架
● 從頭設計任務(wù)轉化為分子草圖繪制;
● 將分子編輯任務(wù)轉變?yōu)榫植繄D像補全。
EP4 是前列腺素 E2 受體的一種亞型,常作為炎癥和癌癥的藥物靶點(diǎn)。在藥物化學(xué)實(shí)踐中,藥理學(xué)家通常從已知活性片段出發(fā)(如下圖A左側原始結構),通過(guò)逐步結構擴展策略進(jìn)行分子優(yōu)化。該研究應用 SketchMol 平臺模擬了這一經(jīng)典研發(fā)流程:
1、計算機輔助生長(cháng)模擬,基于 EP4 受體活性片段(灰色骨架部分)啟動(dòng)設計,再通過(guò)迭代式圖像編輯實(shí)現官能團延伸(淺藍色標注為新增結構域)。
2、先導化合物復現驗證,成功生成專(zhuān)利文獻中記載的EP4活性先導化合物(結構B),經(jīng)分子對接驗證,優(yōu)化后分子與受體結合模式與報道數據一致。
淺藍色高亮區域顯示 SketchMol 在片段生長(cháng)過(guò)程中添加的關(guān)鍵藥效基團,該可視化方案直觀(guān)展示了基于圖像驅動(dòng)的結構優(yōu)化路徑。
通過(guò)大量實(shí)驗驗證,研究團隊證明了 SketchMol 能高效完成多類(lèi)分子設計任務(wù),其圖像驅動(dòng)的設計范式為藥物發(fā)現提供了創(chuàng )新性技術(shù)路徑。
相關(guān)閱讀:
2024 年 11 月,曾湘祥團隊在 Nature 子刊 Nature Computational Science 上發(fā)表了題為:A deep learning approach for rational ligand generation with toxicity control via reactive building blocks 的研究論文。
受 DNA 編碼化合物庫技術(shù)的啟發(fā),該研究提出了一種基于結構塊的配體生成深度學(xué)習方法——DeepBlock,該方法針對靶標蛋白序列進(jìn)行定制,同時(shí)實(shí)現精確的性質(zhì)調控。DeepBlock 將生成過(guò)程清晰地劃分為兩個(gè)步驟:結構塊生成和分子重構,分別由神經(jīng)網(wǎng)絡(luò )和提出的基于規則的重構算法完成。此外,DeepBlock 協(xié)同整合優(yōu)化算法與深度學(xué)習技術(shù),以調控生成分子的性質(zhì)。實(shí)驗表明,DeepBlock 在生成具有結合親和力、合成可及性及類(lèi)藥性的配體方面優(yōu)于現有方法。此外,當與以毒性為優(yōu)化目標的模擬退火或貝葉斯優(yōu)化相結合時(shí),DeepBlock 能成功生成低毒性配體,同時(shí)保持與靶標的親和力。
2022 年 11 月,曾湘祥團隊在 Nature 子刊 Nature Machine Intelligence 上發(fā)表了題為:Accurate prediction of molecular properties and drug targets using a self-supervised image representation learning framework 的研究論文。
該研究提出了一種無(wú)監督預訓練深度學(xué)習框架——ImageMol,該框架基于 1000 萬(wàn)未標記的類(lèi)藥生物活性分子進(jìn)行預訓練,用于預測候選化合物的分子靶點(diǎn)。ImageMol 框架旨在通過(guò)分子像素級信息,基于分子的局部和全局結構特征從未標記分子圖像中預訓練化學(xué)特征表示。
研究團隊在 51 個(gè)基準數據集上證明了 ImageMol 在評估分子特性(即藥物代謝、腦部滲透性和毒性)和分子靶點(diǎn)譜(即β-分泌酶和激酶)方面的高性能。ImageMol 在美國國家轉化科學(xué)促進(jìn)中心的 13 個(gè)高通量實(shí)驗數據集中顯示出識別抗 SARS-CoV-2 分子的高準確性。通過(guò) ImageMol,鑒定出可用于 COVID-19 潛在治療的臨床候選 3CL 蛋白酶抑制劑。
論文鏈接:
https://www.nature.com/articles/s42256-025-00982-3
https://www.nature.com/articles/s43588-024-00718-0
https://www.nature.com/articles/s42256-022-00557-6
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com