ATAC+轉(zhuǎn)錄組聯(lián)合分析怎么做?這里有套路!
2022-12-05 閱讀數(shù):3106
ATAC-seq全稱為Assay for Transposase Accessible Chromatin with high-throughput sequencing,是一種利用轉(zhuǎn)座酶研究染色質(zhì)可進(jìn)入性的高通量測序技術(shù),該技術(shù)通過轉(zhuǎn)座酶對某種特定時空下開放的核染色質(zhì)區(qū)域進(jìn)行切割,進(jìn)而獲得在該特定時空下基因組中所有活躍轉(zhuǎn)錄的調(diào)控序列。ATAC-seq憑借樣本需求量低、建庫流程簡單成為表觀基因組學(xué)研究的新寵。
在ChIP-seq技術(shù)興起時,常見的文章套路會利用ChIP-seq技術(shù)與RNA-seq技術(shù)進(jìn)行聯(lián)合分析,從而更好的找到相關(guān)轉(zhuǎn)錄調(diào)控因子,而ATAC-seq與ChIP-seq都可以用來研究染色質(zhì)調(diào)控區(qū)域中的分子調(diào)控機(jī)制,但ATAC-seq技術(shù)是否能夠與RNA-seq技術(shù)進(jìn)行聯(lián)合分析,從而為染色質(zhì)調(diào)控區(qū)域的相關(guān)研究提供更多的信息?近年有發(fā)表的相關(guān)文獻(xiàn)表明,聯(lián)合ATAC-seq技術(shù)以及RNA-seq技術(shù)進(jìn)行數(shù)據(jù)分析,根據(jù)自身所關(guān)注的生物學(xué)問題,通過不同的分析策略和展現(xiàn)形式可以為染色質(zhì)區(qū)域的分布和開放性研究提供新思路。
通過總結(jié)ATAC-seq與RNA-seq聯(lián)合分析的文章發(fā)現(xiàn),其中重要的部分是研究表觀變化層面的變化與轉(zhuǎn)錄調(diào)控變化層面的變化是否有相關(guān)性,統(tǒng)計ATAC-seq與RNA-seq聯(lián)合分析相關(guān)基因的數(shù)量以及相關(guān)表達(dá)情況,為關(guān)鍵基因的挖掘提供篩選集合,所以通過總結(jié)該類文獻(xiàn)的研究思路發(fā)現(xiàn),兩個組學(xué)所反映不同層面的變化的相關(guān)性以及差異基因的篩選有兩種類型:
首先分析基因表達(dá)與基因啟動子ATAC-seq信號之間的顯著相關(guān)性,用散點圖來表示,然后根據(jù)基因的表達(dá)水平和啟動子可及性將基因分組,形成四象限圖,體現(xiàn)不同分組間的差異基因的數(shù)目。
在文章[1]中ATAC-seq與RNA-seq中差異基因的分組方法是依據(jù)ATAC-seq的reads在染色質(zhì)啟動子上的最大重疊數(shù)(可及性)高于數(shù)據(jù)的第70百分位,則基因被定義為高可達(dá)性(HA),如果覆蓋低于第50百分位,則被定義為中低可達(dá)性(MA)的分類方法進(jìn)行分組判斷,然后根據(jù)每個基因的可達(dá)性和表達(dá)值,評估其是否可以被分配到四組:MA-ME(中低可達(dá)性和表達(dá))、HA – He(高可達(dá)性和表達(dá))、HA – ME(高可達(dá)性和中低表達(dá))或MA-HE(中低可達(dá)性和高表達(dá))(圖一)。隨后從HA-HE分組中挑選關(guān)鍵轉(zhuǎn)錄因子,主要根據(jù)顯著富集的motif查看相應(yīng)的基因以及功能(圖二)。
圖一 啟動子可及性與基因表達(dá)密切相關(guān)
a為散點圖顯示啟動子可及性和基因表達(dá)之間的強(qiáng)正相關(guān)。相關(guān)系數(shù)如紅框所示;b根據(jù)啟動子可及性和基因表達(dá)水平對基因進(jìn)行分組。每組的基因數(shù)量在方框中顯示。
圖二 HA-ME基因分析,與對照相比,HA-ME基因啟動子中富集的基序
整合ATAC-seq與RNA-seq數(shù)據(jù),取ATAC-seq與RNA-seq之間差異基因的交集,根據(jù)生物學(xué)問題以及關(guān)注的關(guān)鍵基因選擇共有的基因或者獨有的基因集合進(jìn)行研究。
在文章[2]中α細(xì)胞以及β細(xì)胞的放染色質(zhì)區(qū)域,將這些可及染色質(zhì)圖譜與人類胰腺α細(xì)胞以及β細(xì)胞的RNA-seq數(shù)據(jù)相關(guān)聯(lián),以確定可能負(fù)責(zé)調(diào)節(jié)細(xì)胞類型特異性特征基因的順調(diào)節(jié)元件(圖三)查看相關(guān)基因的peak的位置以及富集情況去查找α細(xì)胞以及β細(xì)胞中的標(biāo)記基因(圖四)。
圖三 胰腺α細(xì)胞以及β細(xì)胞ATAC-seq與RNA-seq中差異表達(dá)的基因比例情況
圖四 胰腺α細(xì)胞以及β細(xì)胞中不同基因的peak的位置以及富集情況
染色質(zhì)調(diào)控區(qū)域在許多疾病過程和胚胎發(fā)育中起著關(guān)鍵作用,所以表觀遺傳機(jī)制的研究十分重要,表觀遺傳涉及的范圍非常廣泛,包括DNA甲基化,組蛋白修飾,RNA的可變剪切,miRNA調(diào)控,轉(zhuǎn)錄調(diào)控,染色質(zhì)可及性分析等。隨著染色質(zhì)免疫共沉淀芯片(ChIP-chip)技術(shù)的發(fā)展,大量的表觀基因組分析技術(shù)已經(jīng)出現(xiàn),如ChIP-seq、DNase-seq、ATAC-seq等。近年來,越來越多的測序技術(shù)更新給研究帶來極大的便利,與此同時不同技術(shù)的聯(lián)合分析也越來越多,為不同的研究目的提供對應(yīng)的參考。
總的來說,ATAC-seq與RNA-seq的聯(lián)合分析重要的是如何從兩種組學(xué)技術(shù)中挖掘相同或者不同的相關(guān)的差異表達(dá)基因,或者關(guān)注染色質(zhì)開放性區(qū)域與轉(zhuǎn)錄調(diào)控層面的相關(guān)性,然后結(jié)合自身關(guān)注的生物學(xué)問題對挑選感興趣的差異基因或者相關(guān)的生物學(xué)通路進(jìn)行研究,有助于進(jìn)一步了解表觀遺傳機(jī)制。
參考文獻(xiàn):
[1] Starks RR, Biswas A, Jain A, Tuteja G. Combined analysis of dissimilar promoter accessibility and gene expression profiles identifies tissue-specific genes and actively repressed networks. Epigenetics Chromatin. 2019 Feb 22;12(1):16.
[2] Ackermann AM, Wang Z, Schug J, Naji A, Kaestner KH. Integration of ATAC-seq and RNA-seq identifies human alpha cell and beta cell signature genes. Mol Metab. 2016 Jan 11;5(3):233-244.
[3] Merrill CB, Montgomery AB, Pabon MA, Shabalin AA, Rodan AR, Rothenfluh A. Harnessing changes in open chromatin determined by ATAC-seq to generate insulin-responsive reporter constructs. BMC Genomics. 2022 May 25;23(1):399.
[4] Li X, Chen Y, Fu C, Li H, Yang K, Bi J, Huo R. Characterization of epigenetic and transcriptional landscape in infantile hemangiomas with ATAC-seq and RNA-seq. Epigenomics. 2020 Jun;12(11):893-905.
[5] Wang L, Lv Q, Wu P, Luo S, Liu S, Chen X, Luo X. RNA-seq and ATAC-seq analysis of CD163+ macrophage-induced progestin-insensitive endometrial cancer cells. Cancer Med. 2022 Nov 14.
[6] Hu JL, Yierfulati G, Wang LL, Yang BY, Lv QY, Chen XJ. Identification of potential models for predicting progestin insensitivity in patients with endometrial atypical hyperplasia and endometrioid endometrial cancer based on ATAC-Seq and RNA-Seq integrated analysis. Front Genet. 2022 Aug 26;13:952083.