1
新藥研發(fā),九死一生
新藥研發(fā)速度慢,失敗率高一直都是全世界的藥物研發(fā)企業(yè)所面臨的問(wèn)題,俗話(huà)說(shuō):“新藥研發(fā),九死一生”,研究十個(gè)能成一個(gè)就不錯了,還得靠運氣。新藥研發(fā)時(shí)間長(cháng),成功率低已變成醫藥研發(fā)界的代名詞。藥物從無(wú)到有,要經(jīng)歷一個(gè)漫長(cháng)的時(shí)間過(guò)程,我們誰(shuí)也不知道在這條曲折的路上還有多少坑要邁過(guò)去,因為新藥研發(fā)的不確定性太多了,從實(shí)驗室研究到新藥上市要經(jīng)過(guò)合成提取、生物篩選、藥理、毒理等臨床前試驗等一系列過(guò)程,每一步驟都可能需要若干次的失敗來(lái)總結經(jīng)驗。
如此復雜的研發(fā)過(guò)程再加上過(guò)程中無(wú)法預料的情況,使得在研發(fā)的每一個(gè)階段都有可能失敗,一旦研發(fā)失敗,巨額投入血本無(wú)歸也非罕見(jiàn)。藥物從研發(fā)到注冊,研發(fā)時(shí)間周期長(cháng)平均要經(jīng)歷10年,體系復雜,總的資金投入至少要10億美元。并且不是說(shuō)投入了就能夠做出來(lái),因為一個(gè)藥物研發(fā)的成功率也只有10%,所以說(shuō)新藥研發(fā)是一個(gè)高風(fēng)險的行動(dòng)。
2
人工智能加入醫藥研發(fā)領(lǐng)域,
頭部藥企入局
近年來(lái),人工智能(英語(yǔ):Artificial Intelligence,縮寫(xiě)為AI)參與藥物的研發(fā)過(guò)程,被提及的越來(lái)越多,網(wǎng)上不時(shí)曝出某某制藥巨頭與某互聯(lián)網(wǎng)公司達成強強合作。醫藥研發(fā)或告別“十年磨一劍”的舊時(shí)代,去年下半年以來(lái),AI藥物研發(fā)迎來(lái)投資密集期。
醫藥界大佬輝瑞(Pfizer )更是于2016年就與IBM Watson合作,以加速免疫腫瘤學(xué)領(lǐng)域的藥物發(fā)現。葛蘭素史克一直是利用人工智能的主要制藥公司之一——葛蘭素史克(GlaxoSmithKline)是“加速醫療機會(huì )療法”聯(lián)盟(ATOM)的創(chuàng )始成員之一。其它入局的還有強生與Benevolent AI、默沙東與Atomwise、武田制藥與Numerate、賽諾菲與Exscientia。
與此同時(shí),非醫藥出身領(lǐng)域的百度、騰訊、華為、字節跳動(dòng)等科技巨頭也紛紛布局AI醫藥領(lǐng)域。今年年初,百度創(chuàng )始人李彥宏牽頭發(fā)起的百圖生科發(fā)起“百萬(wàn)領(lǐng)軍計劃”及“百萬(wàn)青年領(lǐng)軍”計劃,將分別用100萬(wàn)美元年薪、100萬(wàn)元人民幣年薪以及其他技術(shù)平臺支持,吸引生物技術(shù)+AI技術(shù)跨界融合人才。
李彥宏預測,未來(lái)人工智能在公共衛生監測、新藥研發(fā)和疾病診斷等方面大有可為。此前,字節跳動(dòng)、華為均開(kāi)始招聘生物醫藥相關(guān)崗位,騰訊則發(fā)布了由其自主研發(fā)的首 個(gè)AI驅動(dòng)的藥物發(fā)現平臺云深智藥。在今年人工智能藥物研發(fā)公司英矽智能宣布,以人工智能貫穿藥物發(fā)現環(huán)節(包括機制發(fā)現、靶點(diǎn)發(fā)現及找到新化合物),成功發(fā)現了全新機制藥物,這在全球尚屬首例。
“研發(fā)中僅用時(shí)18個(gè)月、研發(fā)經(jīng)費約合200萬(wàn)美元。相較于傳統藥物研發(fā)10年耗資幾十億美元,AI賦能藥物研發(fā)極大縮短了藥物研發(fā)時(shí)間,又大大降低了成本。”無(wú)疑讓新藥研發(fā)看到了希望。
3
AI介入醫藥研發(fā),
有望改變未來(lái)研發(fā)格局
藥這種東西有一個(gè)非常明顯的個(gè)體屬性。目前已知的化合物結構空間,數量相當龐大,我們能找到的藥物的分子數或達到1060,AI就是幫我們在所研究的化學(xué)空間中找出有用的分子,這也是我們在研究中一直關(guān)注的問(wèn)題,面對1060的空間,我們怎樣用一個(gè)更好的數學(xué)方法把它們表示出來(lái)。
一個(gè)分子能夠成為藥,它在多方面是優(yōu)秀的——它既要有很好的藥效,同時(shí)也可以被很好的吸收,同時(shí)不應該有毒 性等等,我們的研發(fā)過(guò)程中就是要找到這些孤立的小島。通過(guò)計算機,我們可以輕易的從化學(xué)結構庫中找到幾十萬(wàn)個(gè)或者幾百萬(wàn)個(gè)相似的分子,讓它具有相似的成藥的可能性,相對于讓人去在紙上去畫(huà)出結構再去對比研究(可能你畫(huà)一萬(wàn)個(gè)分子就已經(jīng)累夠嗆了),AI可以代替我們去搜索更大的化合物空間,從而為發(fā)現新藥提供更多的可能性。
新藥研發(fā)面臨的第二個(gè)難題就是:通常很微觀(guān)的東西我們就很難去判斷它。對于化合物本身,它有自己的語(yǔ)言,AI可以學(xué)習到這種化學(xué)結構的語(yǔ)言。AI可以作曲,可以畫(huà)畫(huà),因此AI也可以畫(huà)化學(xué)分子,通過(guò)去學(xué)習了大量的分子結構數據以后,它學(xué)到了一些化學(xué)知識,然后它開(kāi)始去產(chǎn)生這些分子結構,它可能會(huì )畫(huà)出化學(xué)家所想象不到的化合物結構,這些結構也可能是非常不合理的,這種AI在學(xué)習了化學(xué)知識以后隨機的產(chǎn)生分布,其中有許多并不是我們想要的。
我們想找到的是那些真正高質(zhì)量的結構,就需要通過(guò)一定的規則去告訴它,我們到底需要什么樣的分子結構,AI通過(guò)實(shí)踐學(xué)習,能夠真正的去找到那些可以成藥的結構,在虛擬的空間中去發(fā)現一個(gè)真正的藥物,從這個(gè)角度來(lái)看我們其實(shí)是利用了化學(xué)知識來(lái)嘗試和人自身進(jìn)行一場(chǎng)對話(huà),嘗試讓AI在分子層面上去理解。
我們知道通過(guò)堿基可以形成DNA序列,然后DNA通過(guò)生物學(xué)的過(guò)程可以去指導蛋白質(zhì)的合成,我們告訴AI蛋白質(zhì)是由20種氨基酸按照一定的規律排列起來(lái)的,不同的排列會(huì )有不同的功能,當AI知道可以用計算的方法去計算蛋白質(zhì)的序列,通過(guò)學(xué)習這些知識讓AI可以知道這些結構是怎么影響生物的功能的,不同的蛋白質(zhì)之間,通過(guò)三維結構如何產(chǎn)生對話(huà),從而影響到彼此,我們需要AI做的事情就是把我們對生物學(xué)語(yǔ)言的理解,對化學(xué)語(yǔ)言的理解,讓它把這些語(yǔ)言組合到一起,從而能夠找到與疾病相關(guān)的蛋白質(zhì)最匹配的化學(xué)分子,最后發(fā)展成治愈我們疾病藥物。
4
AI研發(fā)還有不確定性
未來(lái)還需更深入探索
當然AI制藥目前也有一定的局限性,在人工智能參與新藥研發(fā)的路上還是會(huì )面臨很多的挑戰,比如說(shuō)如何把各個(gè)藥企的數據結合到一起,利用更多高質(zhì)量的數據去做好的分子模型。當然還有跨學(xué)科合作的問(wèn)題,我們要匯聚化學(xué)、生物學(xué)、計算機、數學(xué)、統計等等多學(xué)科的人才,這些不同的技術(shù)人員之間怎樣有效的溝通理解,也是一個(gè)需要解決的困難。
目前AI制藥研發(fā)中的現狀是,靶點(diǎn)發(fā)現和藥物設計最熱,AI賦能的靶點(diǎn)發(fā)現和藥物設計是極具價(jià)值的應用方向,也是藥物研發(fā)最大的痛點(diǎn)之一,同樣也是最多公司目前開(kāi)始布局的環(huán)節。
AI介入后,更大化學(xué)空間探索的實(shí)現和更多分子生成方式的產(chǎn)生,使更新穎分子的獲取成為可能,能快速識別處理繁多的數據,并找出邏輯關(guān)系從而實(shí)現智能推薦更少更優(yōu)的分子,縮減任務(wù)量,使研發(fā)更高效。所以說(shuō)在任何一個(gè)新興科技領(lǐng)域,挑戰和阻礙都將是持續存在的。
從技術(shù)的視角看,目前在A(yíng)I醫藥研發(fā)方向上比較明確的挑戰和阻礙有兩方面:一是認知層面,AI+醫藥橫跨了多個(gè)學(xué)科,如何提出具有正確的目標導向的問(wèn)題、用多學(xué)科融合的視角思考解決問(wèn)題的路徑本身就是最大的挑戰。
另外,數據也是當下該領(lǐng)域面臨的一大挑戰,比如數據的量、質(zhì)、標準以及孤島效應等。但AI制藥的前景必然是光明的,AI制藥技術(shù)的進(jìn)一步突破和創(chuàng )新定會(huì )對整個(gè)醫藥研發(fā)產(chǎn)生重大意義。
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com