关于 ATAC-seq,你需要知道的6点知识

工欲善其事,必先利其器。

ATAC-seq 已然成为表观遗传研究的利器,关于 ATAC-seq,我们可能需要知道以下几件事情:

1. 何为 ATAC-Seq?


ATAC-seq,全名 Assay for Transposase Accessible Chromatin using sequencing,即运用高通量测序手段研究转座酶可接近的染色质的实验。关键词:高通量测序,转座酶可接近染色质。所谓转座酶能接近的区域,既处于开放状态的区域,这也是本实验的关键所在。


ATAC-seq 技术最早于 2013 年由斯坦福大学 William Greenleaf 和 Howard Chang合作开发,文章发表于 Nature Methods,至今已被引用 1622 次。

图 1. 2013 年 ATAC-seq 被正式提出

2. ATAC-Seq 的工作原理?


核小体致密的地方,转座酶不能进入,而松散的区域,转座酶能够进入并切割下暴露的 DNA,连接上特异性的 adapters,连接上 adapters 的 DNA 片段被分离出来,用于二代测序。因此,ATAC-seq 得到的,是全基因度尺度上处于开放状态的染色质区域。

图 2. ATAC-seq 工作原理

3. 相比其他方法,ATAC-seq 有什么优点?


2013 年的那篇 Nature Methods 提出的 ATAC-seq,是作为 MNase-seq、FAIRE-seq 和 DNase-seq 的替代实验。相比于它们,ATAC-seq 具有以下明显优势:


(1)样本需求量大大减少

需求的细胞量从 500 到 50,000,相比于其他实验动辄 10^7 个细胞的样本需求量,ATAC-seq 对细胞量少的实验显得非常友好,也大大拓展了其应用场景。

图 3. 相比其他技术,ATAC-seq 所需细胞更少且耗时短

(2)实验时间更短

相比 3、4 天才能做完的 MNase-seq、FAIRE-seq 而言,ATAC-seq 文库构建简单快速。以检测人体外周血中 T 细胞的表观基因组,从抽血到上机测序,作者只花了 275 分钟,可以说非常高效了。

图 4. ATAC-seq 的高效使之具有应用于临床的潜力


(3)对测序深度要求更低

相比于MNase-seq,ATAC-seq 的测序量降低了几十倍不止,而关键是信号居然还那么好,这意味着你可以省下不少钱,或者花相同的钱,你可以获得更多的有用数据。


(4)一次性获得全基因组上的染色质开放区域

获得了开放区域能干啥,预测上面结合的转录因子啊!


4. ATAC-seq 能回答什么科学问题?


ATAC-seq 至少能回答以下三个问题:

(1)找调控某一生物学过程的关键转录因子

比如用 ATAC-seq 鉴定早期胚胎发育各时期的开放染色质区域,找出差异,查看差异开放染色质区域富集了哪些转录因子的 motif,这些转录因子就是调控 2 细胞期 → 4 细胞期 → 8 细胞期 → 囊胚期这一发育过程的关键转录因子。


(2)找哪个转录因子调控了我感兴趣的基

对于这个问题,其实有三种策略:

Plan A:基于大量 ChIP-seq 公共数据挖掘;

Plan B:motif 分析预测;

Plan C:ATAC-seq 结合 motif 分析。


对于 PlanC,原理图如下:

图 5. 用 ATAC-seq 找哪个转录因子调控了我感兴趣的基因

你可能会说,单做 motif 分析也能做这事儿呀,为啥还要做 ATAC-seq 呢?motif 分析只能标出某基因上游启动子区域有哪些TF的 motif,这些TF不一定真的能跑来结合。用 ATAC-seq 标出这里有蛋白结合,但不知道具体是哪个转录因子。ATAC-seq + 某个基因上游的 motif 分析,准确找到基因上游结合的转录因子。


(3)找我感兴趣的转录因子调控的靶基因

推荐用 ChIP-seq 找转录因子的靶基因,即 Plan A。再结合转录因子 KD/KO/过表达或激活的 RNA-seq,能够更准确找到转录因子靶基因。


如果没有 ChIP 级别的抗体,无法做 ChIP-seq,就退而求其次,用 ATAC-seq 找转录因子的靶基因。用 ATAC-seq 标出基因组范围哪里有调控蛋白结合,再标出哪里有某个TF的 motif,二者相叠加,就能推测出这个TF调控的靶基因。


5. ATAC-seq 怎么用?

说了这么多,我还是不会用怎么办?我们不妨看两个典型的案例。


Case1: 研究哺乳动物早期胚胎发育过程,来自清华大学颉伟课题组,2016 年发表于 Nature

图 6. 用 ATAC-seq 分析潜在的转录因子结合位点

作者用 ATAC-seq 检测了早期胚胎发育过程中染色质开放区域的动态变化,发现不同时期细胞开放染色质富集在不同的生物学功能之中,这与不同发育时期的特征非常契合。结合 motif 分析表达谱数据,找出了在胚胎特定的发育时期处于关键调控地位的转录因子。


Case2: 研究免疫细胞分化过程,2016 年发表于 Immunity(IF=22.845)


CD8+ T 细胞在急性、慢性病毒侵染后会分化为不同下游细胞:effector、memory、exhausted 以及 effector、memory 的前体细胞,借助 ATAC-seq 技术,检测这些细胞的染色质开放区域,将不同细胞之间及和原始 CD8+ T 细胞进行比较,得到 CD8+ T 细胞在病毒侵染后分化为下游细胞过程中的染色质开放区域的动态变化。

图 7. 借助 ATAC-seq 挖掘潜在转录因子结合位点

作者得到了动态变化过程中 18000 多个差异的开放位点,对这些位点进行聚类,通过 motif 分析,结合已有的转录因子 ChIP-seq 数据和表达谱数据,得到这些开放位点可靠结合的转录因子家族,留下了丰富的可供挖掘的数据。


6. 都单细胞时代了,是否也有单细胞 ATAC-seq?

在高通量测序中,我们使用成千上万或百万细胞,然而每一个细胞的状态存在差异(比如肿瘤存在很强的异质性),最终测到的是这一簇细胞的平均状态。这时,单细胞测序显得尤为重要。生物技术已经逐渐迈入单细胞时代,各种单细胞测序技术层出不穷,单细胞基因组测序、单细胞 RNA-seq、单细胞 DNA 甲基化测序……那么,是否也存在单细胞 ATAC-seq 呢?

2015 年,斯坦福大学 William Greenleaf 和 Howard Y Chang 继续发力,通过将 ATAC-seq 结合微流控技术,推出了升级版本单细胞 ATAC-seq(scATAC-seq),文章发表于 Nature

图 8. 单细胞 ATAC-seq 的工作流程

在 scATAC-seq 中,通过一个程序化的微流控平台捕获单个细胞,随后在一个整合的流体学集成环路(integrated fluidics circuit,IFC)上进行转座酶切和 PCR,回收文库,并通过带有 barcode 的引物进行 PCR 扩增;随后将单细胞的文库混合并进行高通量测序。

文章转自:嘉因生物

推荐阅读更多精彩内容