細菌耐藥已成為影響全人類(lèi)健康的重大問(wèn)題,引起了全世界廣泛的關(guān)注。世界衛生組織提出的解決耐藥措施之一是研發(fā)耐藥快速準確的新型診斷技術(shù)和相關(guān)試劑。傳統的檢測方法基于細菌培養,周期長(cháng),易導致漏診、誤診,延誤治療時(shí)機。而基于基因的檢測技術(shù),如具有靈敏、高效、快捷特點(diǎn)的基因芯片、數字 PCR等技術(shù),是公認的快速檢測技術(shù)。然而,到目前為止,由于耐藥基因型與表型結果的不一致,使得基因檢測只能作為培養法的輔助手段用于耐藥的檢測。
中國科學(xué)院微生物研究所馮婕研究組等針對肺炎鏈球菌β-內酰胺耐藥這一重要臨床問(wèn)題,采用機器學(xué)習的方法挖掘耐藥相關(guān)數據的規律,建立了基因型和表型之間的聯(lián)系,使得基因檢測不再是一個(gè)輔助手段,而有望成為一種主要的耐藥快速檢測技術(shù)。
肺炎鏈球菌β-內酰胺耐藥的主要機制是三種青霉素結合蛋白(PBP1a,PBP2b和PBP2x)的轉肽酶結構域(TPD)的改變。由于不同臨床肺炎鏈球菌分離株P(guān)BPs的高度變異性,以及鏈球菌間重組導致的嵌合結構,使得PBPs極具多樣化,導致了很難將PBPs的突變與臨床耐藥性聯(lián)系起來(lái)。馮婕組研究人員首先將NCBI數據庫已公布的PBPs序列通過(guò)類(lèi)別方差法計算,得到了139個(gè)與耐藥高度相關(guān)的HVLs (highly variant amino acid)。再以4300株肺炎鏈球菌的轉肽酶結構域(TPD)序列以及對應頭孢呋辛、阿莫西林的耐藥表型作為數據庫,將其中80%的數據作為訓練集,20%的數據作為檢驗集,用HVLs去預測頭孢呋辛和阿莫西林的耐藥水平,結果發(fā)現與用PBPs蛋白的TPD序列預測效果一樣好。進(jìn)一步分析發(fā)現,HVLs與PBPs的某些區域的序列有很強的相關(guān)性。因此,分別使用來(lái)自pbp2x (2253 bp)的750 bp片段和來(lái)自pbp2b (2058 bp)的750 bp片段可以很好地預測頭孢呋辛和阿莫西林的耐藥性。這種長(cháng)度只需要一個(gè)Sanger測序反應即可,不僅使檢測操作更加簡(jiǎn)單,也降低了成本。此外,通過(guò)對人工構建的突變體和來(lái)自更多臨床分離的菌株的耐藥表型的檢測,進(jìn)一步確認了機器學(xué)習法能精確預測耐藥表型。應用該預測方法,研究人員分析了NCBI數據庫中已測序的8138株肺炎鏈球菌,進(jìn)而建立了耐藥表型、血清型以及ST型之間的關(guān)聯(lián),促進(jìn)了對肺炎鏈球菌的流行病學(xué)的認識。
該研究成果在線(xiàn)發(fā)表于Briefings in Bioinformatics雜志,馮婕與南方科技大學(xué)教授楊亮為共同通訊作者。該研究得到國家自然科學(xué)基金和北京市科學(xué)技術(shù)委員會(huì )的資助。
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com