哺乳動(dòng)物著床前胚胎發(fā)育是生命起始的關(guān)鍵階段。在這一過程中,具有全能性的受精卵會(huì)經(jīng)歷全基因組范圍的表觀遺傳重編程,通過精細(xì)的時(shí)空調(diào)控,逐步發(fā)育成完整胚胎以及多種胚外組織。這一過程涉及一系列關(guān)鍵發(fā)育事件:母代-子代轉(zhuǎn)換(Maternal-to-zygotic transition,MZT)、合子基因組激活(Zygotic genome activation,ZGA)、第一次細(xì)胞命運(yùn)決定分化形成滋養(yǎng)外胚層(Trophectoderm,TE)和多能性的內(nèi)細(xì)胞團(tuán) (Inner cell mass,ICM),以及第二次細(xì)胞命運(yùn)決定由內(nèi)細(xì)胞團(tuán)進(jìn)一步分化為原始內(nèi)胚層(Primitive endoderm,PE)和多能性的上胚層(Epiblast,EPI)等。此外,在雌性小鼠胚胎中,還需通過父本X染色體的印記失活(imprinted X chromosome inactivation,iXCI)維持X染色體基因劑量的平衡。這些精密的發(fā)育過程依賴于數(shù)十萬個(gè)復(fù)雜的順式調(diào)控元件和數(shù)百個(gè)轉(zhuǎn)錄因子構(gòu)成的協(xié)同調(diào)控網(wǎng)絡(luò)。
然而,由于技術(shù)限制,目前對(duì)哺乳動(dòng)物早期胚胎發(fā)育的染色質(zhì)可及性研究仍然停留在群體細(xì)胞水平。著床前胚胎中細(xì)胞數(shù)量稀少且難以獲得,同時(shí)在囊胚期已經(jīng)完成兩次細(xì)胞譜系分化,其染色質(zhì)狀態(tài)具有瞬時(shí)性和快速時(shí)空動(dòng)態(tài)變化等特征。群體細(xì)胞水平(bulk-level)的組學(xué)研究難以精確解析不同譜系細(xì)胞的染色質(zhì)狀態(tài)、胚胎內(nèi)部異質(zhì)性等染色質(zhì)時(shí)空動(dòng)態(tài)變化。因此,以單細(xì)胞分辨率對(duì)哺乳動(dòng)物著床前胚胎染色質(zhì)狀態(tài)進(jìn)行深入研究是一個(gè)亟待解決的問題。
ATAC-seq(Assay for Transposase accessible chromatin with high-throughput sequencing)是研究染色質(zhì)可及性和順式調(diào)控元件的核心工具之一?,F(xiàn)有的單細(xì)胞 ATAC-seq 方法雖然最后實(shí)現(xiàn)的是單個(gè)細(xì)胞的染色質(zhì)可及性測序,但是需要至少數(shù)千個(gè)細(xì)胞作為起始材料,因而難以對(duì)哺乳動(dòng)物著床前胚胎進(jìn)行單細(xì)胞水平的解析。此外,傳統(tǒng)的短讀段 ATAC-seq 技術(shù)對(duì)于檢測著床前胚胎發(fā)育過程中激活且發(fā)生動(dòng)態(tài)變化的重復(fù)元件存在局限性。來自重復(fù)元件的短讀段可能比對(duì)到多個(gè)基因組位點(diǎn),從而因?yàn)槠缌x比對(duì)而在序列比對(duì)后被質(zhì)控過濾掉,導(dǎo)致這些基因組區(qū)域的表觀遺傳景觀一直處于未知狀態(tài)。此外,短讀段 ATAC-seq 技術(shù)覆蓋的遺傳變異有限,區(qū)分父母本等位基因的效率低下,限制了對(duì)基因組印記的研究。
2023年,湯富酬課題組開發(fā)了首個(gè)基于單分子長讀段測序平臺(tái)的單細(xì)胞 scNanoATAC-seq 技術(shù),大大提高了 ATAC-seq 技術(shù)檢測重復(fù)元件染色質(zhì)可及性和等位基因特異性染色質(zhì)可及性方面的分析能力。雖然該技術(shù)最后實(shí)現(xiàn)的是單個(gè)細(xì)胞的染色質(zhì)可及性測序,但是仍需要數(shù)萬個(gè)細(xì)胞作為起始材料,這嚴(yán)重限制了其在哺乳動(dòng)物著床前胚胎發(fā)育中的應(yīng)用。
2025年3月28日,北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC)湯富酬課題組與清華大學(xué)基礎(chǔ)醫(yī)學(xué)院紀(jì)家葵課題組合作,在國際頂尖學(xué)術(shù)期刊 Science 上發(fā)表了題為:Chromatin Accessibility Landscape of Mouse Early Embryos Revealed by Single-cell NanoATAC-seq2 的研究論文。
該研究首次報(bào)道了適用于單細(xì)胞樣本起始的 ATAC-seq 技術(shù)——scNanoATAC-seq2。
該技術(shù)開發(fā)了創(chuàng)新的單管反應(yīng)體系,將多個(gè)實(shí)驗(yàn)步驟集成在單個(gè)反應(yīng)管中完成,最大 程度降低了樣品損失。通過長片段富集,極大降低了文庫的線粒體 DNA 污染比率,實(shí)現(xiàn)了從單個(gè)細(xì)胞起始樣本獲取高質(zhì)量的染色質(zhì)可及性信息。研究團(tuán)隊(duì)采用 scNanoATAC-seq2 技術(shù)對(duì)小鼠著床前胚胎各發(fā)育階段進(jìn)行了系統(tǒng)、深入的單細(xì)胞分辨率染色質(zhì)可及性分析(圖1)。
圖1. scNanoATAC-seq2對(duì)小鼠著床前胚胎發(fā)育十個(gè)關(guān)鍵階段進(jìn)行單細(xì)胞染色質(zhì)可及性分析
該研究的重要發(fā)現(xiàn)如下:
1、確立了X染色體印記失活和重新激活的表觀調(diào)控基礎(chǔ)
X 染色體上調(diào)控X染色體失活現(xiàn)象的有兩個(gè)相鄰的主要拓?fù)湎嚓P(guān)結(jié)構(gòu)域:促進(jìn)X染色體失活的 X-ist 結(jié)構(gòu)域和抑制X染色體失活的 Tsix 結(jié)構(gòu)域。Xist結(jié)構(gòu)域包含 X-ist、Jpx、Ftx 和 Rlim 等重要調(diào)控基因,其表達(dá)主要促進(jìn)所在 X 染色體的失活。而 Tsix 結(jié)構(gòu)域包含 Tsix、Tsx 和 Linx 等重要調(diào)控基因,其表達(dá)主要抑制所在 X 染色體的失活,即促進(jìn)或維持該條 X 染色體的激活狀態(tài)。
利用兩種近交系小鼠交配產(chǎn)生的雜合胚胎進(jìn)行分析,該研究發(fā)現(xiàn),在 4 細(xì)胞胚胎階段開始的父本 X 染色體印記失活過程中,X-ist 結(jié)構(gòu)域特異性增強(qiáng)父本 X 染色體在該區(qū)域的染色質(zhì)開放性,從而促進(jìn)整條父本 X 染色體的印記失活。而此時(shí) Tsix 結(jié)構(gòu)域保持父本和母本 X 染色體在該區(qū)域的對(duì)稱開放性,不參與父本 X 染色體的特異性印記失活(圖2)。發(fā)育到早期桑椹胚階段時(shí),這一狀態(tài)發(fā)生逆轉(zhuǎn),X-ist 結(jié)構(gòu)域逐漸轉(zhuǎn)變?yōu)楦副竞湍副?X 染色體在該區(qū)域的對(duì)稱開放性,而 Tsix 結(jié)構(gòu)域逐漸特異性增強(qiáng)母本 X 染色體在該區(qū)域的染色質(zhì)開放性,保持母本 X 染色體處于活躍狀態(tài),而仍然使整條父本 X 染色體維持印記失活狀態(tài)(圖2)。此后,在晚期囊胚階段,在兩個(gè)胚外譜系的細(xì)胞(滋養(yǎng)外胚層和原始內(nèi)胚層)中保持這一由 Tsix 結(jié)構(gòu)域主導(dǎo)的父本X染色體印記失活狀態(tài)。而在多能性的上胚層細(xì)胞中Tsix結(jié)構(gòu)域重新逆轉(zhuǎn)回父本和母本 X 染色體在該區(qū)域的對(duì)稱開放性,印記失活的父本 X 染色體被重新激活,但是其激活程度仍然略低于母本 X 染色體。
圖2. X-ist與Tsix結(jié)構(gòu)域調(diào)控父本X染色體印記失活和重新激活。
2、鑒定了調(diào)控合子基因組激活和早期胚胎兩次譜系命運(yùn)決定的關(guān)鍵轉(zhuǎn)錄因子
對(duì)于結(jié)合基序已知的轉(zhuǎn)錄因子,通過分析其結(jié)合位點(diǎn)的染色質(zhì)狀態(tài),ATAC-seq 可以準(zhǔn)確鑒定每個(gè)轉(zhuǎn)錄因子的調(diào)控活性,準(zhǔn)確判斷對(duì)應(yīng)關(guān)鍵生物學(xué)事件的主導(dǎo)轉(zhuǎn)錄因子。通過對(duì)從受精卵到晚期囊胚的十個(gè)關(guān)鍵發(fā)育階段的分析,包括受精卵、早期2細(xì)胞、晚期2細(xì)胞、4細(xì)胞、早期8細(xì)胞、晚期8細(xì)胞、16細(xì)胞(早期桑葚胚)、晚期桑椹胚期、早期囊胚和晚期囊胚,該研究準(zhǔn)確鑒定了該過程中每個(gè)發(fā)育階段和每個(gè)分化譜系的關(guān)鍵轉(zhuǎn)錄因子(圖3)。scNanoATAC-seq2 分析提示,這些轉(zhuǎn)錄因子的基因體和轉(zhuǎn)錄因子下游結(jié)合位點(diǎn)上的表觀激活程度在發(fā)育過程中協(xié)同變化。這為后續(xù)通過基因敲除等手段對(duì)每個(gè)主導(dǎo)轉(zhuǎn)錄因子的功能進(jìn)行精細(xì)分析奠定了基礎(chǔ),也為研究著床前胚胎的每個(gè)發(fā)育階段的核心轉(zhuǎn)錄因子網(wǎng)絡(luò)提供了表觀組學(xué)依據(jù)。
圖3. 調(diào)控小鼠著床前胚胎各階段發(fā)育的主導(dǎo)轉(zhuǎn)錄因子
3、揭示了主要重復(fù)元件類別在早期胚胎發(fā)育過程中的表觀調(diào)控特點(diǎn)
哺乳動(dòng)物基因組中大約一半都是由重復(fù)元件組成的。一些重要類型的重復(fù)元件在基因組中有數(shù)千個(gè)序列幾乎一模一樣的拷貝,分散分布在整個(gè)基因組中。例如全長 LINE1 重復(fù)元件拷貝的長度在 6 kb 左右,同一亞家族內(nèi)兩個(gè)拷貝之間的序列相似度能夠達(dá)到 99% 以上。二代短讀段測序很難區(qū)分這些不同的拷貝,因而無法判斷其染色質(zhì)狀態(tài)(圖4)。該研究發(fā)現(xiàn)大部分全長 LINE1 在卵裂期染色質(zhì)開放度下降,而后在囊胚期上升。然而,存在 157 個(gè)調(diào)控模式相反的全長 LINE1 拷貝,其染色質(zhì)開放度在卵裂期上升,而后在囊胚期下降,可能涉及常染色質(zhì)-異染色質(zhì)的區(qū)室形成。
MERVL 屬于長末端重復(fù)序列(long terminal repeat,LTR)家族,全長約 6kb,中間為內(nèi)源逆轉(zhuǎn)錄病毒(endogenous retrovirus,ERV)蛋白編碼序列,兩端為輔助轉(zhuǎn)座和順式調(diào)控的 MT2-mm 元件。先前的研究表明,這類轉(zhuǎn)座子在合子基因組激活過程中被廣泛激活并轉(zhuǎn)錄,人為沉默 MERVL 會(huì)導(dǎo)致小鼠著床前發(fā)育異常。由于小鼠基因組中 570 個(gè)完整 MERVL 元件的序列高度相似,短讀段測序技術(shù)難以實(shí)現(xiàn)唯一比對(duì)。利用 5 kb 以上的長讀段(涵蓋MERVL側(cè)翼的非重復(fù)序列),scNanoATAC-seq2 能夠?qū)崿F(xiàn) MERVL 來源 DNA 片段的唯一比對(duì),從而精確描繪每個(gè)拷貝的 MERVL 的表觀激活特征。在晚期2細(xì)胞階段發(fā)生的合子基因組激活中,MERVL 的表觀激活發(fā)生于兩端的 MT2-mm 重復(fù)元件,而內(nèi)部的 ERV 編碼序列所在的染色質(zhì)保持相對(duì)關(guān)閉狀態(tài)。此外,逐個(gè)拷貝分析的染色質(zhì)可及性表明,這些序列相似的 MERVL 元件之間仍存在表觀激活程度的差異。在 scNanoATAC-seq2 鑒定的活躍 MERVL 元件附近(30 kb以內(nèi)),相應(yīng)的靶基因呈現(xiàn) ZGA 表達(dá)激活(如Zscan4c、Zscan4d和Sp110);相反,表觀遺傳沉默的 MERVL 元件附近基因的表達(dá)則在 ZGA 過程中未激活。
圖4. scNanoATAC-seq2鑒定序列高度相似的不同拷貝重復(fù)元件的染色質(zhì)狀態(tài)
4、鑒定了一批新的小鼠早期胚胎非經(jīng)典印記基因
scNanoATAC-seq2 技術(shù)能夠高效區(qū)分父、母本等位基因,適合研究發(fā)育中的基因印記。在 C57×DBA 和 C57×CAST 雜合胚胎中,該研究分別識(shí)別了 47% 和 97% 的染色質(zhì)可及性的親本來源。利用這些數(shù)據(jù),該研究描繪了染色質(zhì)可及性介導(dǎo)的非經(jīng)典印記的動(dòng)態(tài)變化(不依賴DNA甲基化)。結(jié)果顯示,非經(jīng)典印記強(qiáng)度在著床前發(fā)育過程中逐漸消失,并在晚期囊胚譜系分化后降至最低水平。該研究最晚在8細(xì)胞胚胎階段觀測到較強(qiáng)的等位基因特異性染色質(zhì)可及性。由此,通過反交胚胎驗(yàn)證,研究人員在該發(fā)育階段鑒定出 325 個(gè)小鼠非經(jīng)典印記基因。其中 266 個(gè)基因是相較于 Inoue 等人的研究新鑒定出來的父源非經(jīng)典印記基因。Inoue 等人的研究是基于孤雌和孤雄小鼠桑葚胚的染色質(zhì)可及性差異,而不是基于正常胚胎發(fā)育過程的等位基因特異性染色質(zhì)可及性分析得出的。
5、發(fā)現(xiàn)16細(xì)胞胚胎階段已經(jīng)出現(xiàn)胚內(nèi)和胚外譜系分化的染色質(zhì)可及性特征
該研究鑒定了早期囊胚中內(nèi)細(xì)胞團(tuán)和滋養(yǎng)外胚層譜系特異性的染色質(zhì)開放區(qū)域特征,并且以此為基礎(chǔ)解析其他發(fā)育階段的胚內(nèi)異質(zhì)性。結(jié)果表明,小鼠胚胎發(fā)育至16細(xì)胞階段時(shí),首次出現(xiàn)了表觀基因組層面的內(nèi)細(xì)胞團(tuán)和滋養(yǎng)外胚層命運(yùn)分化特征(圖5)。這提示在囊胚腔出現(xiàn)之前,囊胚中兩種譜系的分化特征已然在16細(xì)胞胚胎(早期桑葚胚)階段的染色質(zhì)可及性層面出現(xiàn)。
圖6. 小鼠胚胎發(fā)育16細(xì)胞期出現(xiàn)細(xì)胞譜系分化的染色質(zhì)可及性特征
總之,該研究利用單細(xì)胞起始的 scNanoATAC-seq2 技術(shù),構(gòu)建了涵蓋小鼠著床前發(fā)育全過程的高精度單細(xì)胞染色質(zhì)可及性圖譜,系統(tǒng)鑒定了不同發(fā)育階段、不同譜系細(xì)胞的關(guān)鍵轉(zhuǎn)錄因子,揭示了調(diào)控合子基因組激活和譜系分化(上胚層、原始內(nèi)胚層和滋養(yǎng)外胚層)的順式調(diào)控網(wǎng)絡(luò)。此外,還解析了雌性胚胎中父本 X 染色體的印記失活與重新激活,以及非經(jīng)典印記基因的表觀調(diào)控基礎(chǔ)。這些發(fā)現(xiàn)為理解包括人類在內(nèi)的哺乳動(dòng)物早期胚胎發(fā)育的分子機(jī)制提供了新的線索。
北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心湯富酬研究員、文路副研究員與清華大學(xué)基礎(chǔ)醫(yī)學(xué)院紀(jì)家葵研究員為該論文的共同通訊作者。清華大學(xué)基礎(chǔ)醫(yī)學(xué)院博士生李孟瑤博士(已畢業(yè))與北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心博士生蔣振寰為該論文的并列第一作者。
論文鏈接:
https://www.science.org/doi/10.1126/science.adp4319
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com