傳統(tǒng)診斷技術(shù)依賴于患者病史、體格檢查和實(shí)驗(yàn)室檢查,通常需要多次檢查才能診斷出一些復(fù)雜疾病。
近年來(lái),人工智能(AI)的發(fā)展日新月異,并在通用領(lǐng)域、生命科學(xué)和醫(yī)學(xué)等得到了廣泛應(yīng)用。通過大數(shù)據(jù)集訓(xùn)練出來(lái)的 AI 算法模型,其龐大的數(shù)據(jù)庫(kù)和越來(lái)越精準(zhǔn)的識(shí)別能力,使得“AI+醫(yī)療”成為現(xiàn)實(shí)。
2025 年 2 月 21 日,斯坦福大學(xué)的研究人員在國(guó)際頂尖學(xué)術(shù)期刊 Science 上發(fā)表了題為:Disease diagnostics using machine learning of B cell and T cell receptor sequences 的研究論文。
該研究開發(fā)了一種人工智能(AI)診斷工具——Machine Learning for Immunological Diagnosis(Mal-ID)。該 AI 工具可以通過篩選血液樣本中的免疫細(xì)胞(B 細(xì)胞和 T 細(xì)胞)基因序列,一次性診斷一系列感染和健康狀況。
通過一項(xiàng)對(duì)近 600 名參與者的研究,該 AI 工具確定了參與者是否健康或患有 COVID-19、1 型糖尿病、艾滋病或自身免疫病,以及他們最近是否接種了流感疫苗。
免疫系統(tǒng)通過兩種主要的免疫細(xì)胞類型——B 細(xì)胞和 T 細(xì)胞,保存著對(duì)過去和現(xiàn)在所接觸的病原體的免疫記憶。其中,B 細(xì)胞產(chǎn)生附著在病毒和有害分子上的抗體,而 T 細(xì)胞則激活其他免疫反應(yīng)或直接殺死被感染的細(xì)胞。
值得注意的是,當(dāng)一個(gè)人受到感染或自身免疫性疾病時(shí),免疫系統(tǒng)會(huì)被激活,B 細(xì)胞和 T 細(xì)胞的數(shù)量也會(huì)增加,并開始產(chǎn)生特定的表面受體。因此,通過對(duì)編碼這些受體的基因進(jìn)行測(cè)序,就可以解鎖這個(gè)人關(guān)于疾病和感染的獨(dú)特記錄。
在這項(xiàng)最新研究中,研究團(tuán)隊(duì)基于人工智能(AI)構(gòu)建了一種分子診斷工具,其針對(duì) B 細(xì)胞受體(BCR)和 T 細(xì)胞受體(TCR)各訓(xùn)練了三個(gè)模型——受體庫(kù)組成分析模型、CDR3 序列聚類模型、蛋白質(zhì)語(yǔ)言模型嵌入模型,以分析編碼 B 細(xì)胞受體和 T 細(xì)胞受體關(guān)鍵區(qū)域的基因序列,并挑選出與特定疾病相關(guān)的模式。
Mal-ID的框架構(gòu)建
研究團(tuán)隊(duì)使用該工具在 593 人的血液樣本中篩選了 1620 萬(wàn)個(gè) B 細(xì)胞受體序列和 2350 萬(wàn)個(gè) T 細(xì)胞受體序列。這一 AI 診斷工具從這些參與者中檢測(cè)到 63 人曾患COVID-19,95 人 HIV 陽(yáng)性,86 人患系統(tǒng)性紅斑狼瘡,92 人患 1 型糖尿病,37 人最近接種過流感疫苗,剩余 220 名參與者為健康對(duì)照者。
在對(duì) 542 名同時(shí)擁有 B 細(xì)胞和 T 細(xì)胞數(shù)據(jù)的參與者的樣本進(jìn)行的分析中,該 AI 診斷工具在一個(gè)指標(biāo)中得分高達(dá) 0.986(滿分為 1 分),該指標(biāo)衡量的是它將參與者與他們的疾病正確匹配的程度。
Mal-ID使用IgH和TRB序列對(duì)疾病進(jìn)行分類
此外,當(dāng)比較 AI 工具單獨(dú)使用 B 細(xì)胞受體、單獨(dú)使用 T 細(xì)胞受體或同時(shí)使用這兩種受體對(duì)疾病的區(qū)分能力時(shí),研究團(tuán)隊(duì)發(fā)現(xiàn),將兩種細(xì)胞類型的數(shù)據(jù)結(jié)合起來(lái)效果最好。例如,1 型糖尿病和系統(tǒng)性紅斑狼瘡在 T 細(xì)胞受體中有更清晰的標(biāo)記,而 COVID-19、HIV 和流感在 B 細(xì)胞受體中較易識(shí)別。
Mal-ID可以區(qū)分已知的SARS-CoV-2特異性抗體序列和健康供體序列
研究團(tuán)隊(duì)表示,AI 工具可以調(diào)整到只篩查一種或多種疾病,但它的預(yù)測(cè)并不是完全沒有錯(cuò)誤的,距離臨床應(yīng)用還有很長(zhǎng)的路要走。事實(shí)上,從另一種角度來(lái)說(shuō),AI 作為基于大數(shù)據(jù)的預(yù)測(cè)模型,其錯(cuò)誤預(yù)測(cè)也可能源于傳統(tǒng)檢測(cè)方法所遺漏的人群之間的細(xì)微差異。因此,這些 AI 的錯(cuò)誤案例可能有助于梳理出免疫相關(guān)疾病的全新子類別,并有助于定制個(gè)性化治療方案。
研究模式圖:從血液到疾病的免疫受體測(cè)序分類
總的來(lái)說(shuō),這項(xiàng)發(fā)表于 Science 的研究開發(fā)了一款 AI 診斷工具——Mal-ID,該 AI 工具可以自動(dòng)識(shí)別免疫受體測(cè)序數(shù)據(jù)以區(qū)分一系列疾病狀態(tài),包括 COVID-19、糖尿病、艾滋以及自身免疫疾病等。隨著進(jìn)一步的驗(yàn)證和擴(kuò)展,Mal-ID 有望開發(fā)出利用免疫受體群體中包含的大量信息進(jìn)行醫(yī)學(xué)診斷的臨床工具,還可能用于預(yù)測(cè)診斷疾病的具體進(jìn)程。
免疫細(xì)胞(第一圖)通過重組DNA片段(第二圖)產(chǎn)生高度可變的受體,以識(shí)別細(xì)菌、病毒等威脅(第三圖),識(shí)別這些受體(第四圖)可以幫助診斷復(fù)雜疾病
論文鏈接:
https://www.science.org/doi/10.1126/science.adp2407
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com