LACE-seq 保姆级教程

近期接触到一个新的测序类型 -- LACE-seq (linear amplification of complementary DNA ends and sequencing)。也许，我们对ChIP-seq并不陌生，知道它可以用来研究某个转录因子或者组蛋白在基因组范围的结合位点。那么，LACE-seq技术可以类比ChIP-seq，用来研究RNA结合蛋白 (RNA-binding protein, RBP) 在基因组范围内所绑定的RNA靶标。
目前，鉴定RBP靶标常用方法主要有RIP-seq和CLIP-seq，但是由于这两种方法均依赖于特异性抗体富集RBP，且需要百万数量级的细胞来制备文库。因此，限制了这些方法在稀有细胞类型及临床穿刺样本中的应用。针对这些缺点，LACE-seq实现了在微量细胞中鉴定RBP作用靶点，通过线性扩增逆转录酶在RBP结合位点处的终止信号，实现了在单碱基分辨率和单细胞层面精准鉴定RBP的结合位点。
研究表明，RBP在早期生殖、个体发育、细胞分化、增殖和凋亡等生理过程中发挥了关键的调控作用，而LACE-seq技术则为研究RBP在胚胎发育和生殖疾病中的功能机制奠定了一些基础。

从上面的建库示意图可知，在免疫沉淀后，使用含有poly-T的序列来做PCR扩增第二条链，这说明该文库富集了mRNA。另外，序列中引入了两个额外的碱基，这也是后续分析需要注意的事项。

软件准备

cutadapt去接头，bowtie比对，piranha用于peakcaling。前面两个软件比较常见，这里就不多说了。主要来说piranha，该软件安装需要依赖系统库GSL (GNU Scientific Library)，没有的话需要提前安装：

wget http://mirrors.ustc.edu.cn/gnu/gsl/gsl-2.7.tar.gz
tar -zxf gsl-2.7.tar.gz
cd gsl-2.7
./configure --prefix=/path/gsl-2.7
make
make check
make install

安装后，需要将其添加到环境变量里面，为了使用以后方便使用可以将其添加到home目录下的.bashrc文件里面：

export PATH=$PATH:/path/gsl-2.7/bin
export C_INCLUDE_PATH=$C_INCLUDE_PATH:/path/gsl-2.7/include
export CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/path/gsl-2.7/include
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/path/gsl-2.7/lib
export LIBRARY_PATH=$LIBRARY_PATH:/path/gsl-2.7/lib

添加后，使用命令source ~/.bashrc立刻加载修改后的设置，使之立即生效。然后就可以安装软件piranha软件了：

wget http://smithlabresearch.org/downloads/piranha-1.2.1.tar.gz
tar -xzf piranha-1.2.1.tar.gz
./configure
 make all
 make install

上面安装的piranha输入文件格式只能是bed，如果想直接接受bam文件，需要先安装BAMTools，安装方法可以参考：https://github.com/pezmaster31/bamtools/wiki，接受bam格式的安装方法如下：

./configure --with-bam_tools_headers="/path/BAMTools/include"  --with-bam_tools_library="/path/BAMTools/lib"
make all
make install

为了省事起见，也可以选择使用conda来安装piranha：

conda create -n piranha -c bioconda piranha

不过，虽然用conda安装软件很省事，但安装的piranha也不接受bam格式的输入文件。

分析流程

1、去接头
先去除序列中的接头，然后再去除poly-A尾巴：

cutadapt -f fastq -q 30,0 -a ATCTCGTATGCCGTCTTCTGCTT -m 18 --max-n 0.25 --trim-n -o sample.rmadp.fq.gz sample.fastq.gz
cutadapt -f fastq -a A{15} -m 18 -n 2 -o sample.trimed.fq.gz sample.rmadp.fq.gz

2、比对
先比对到pre-RNA (NCBI网站可以下载) 上面去除RNA，将未必对上的序列再比对到基因组上。比对设定的参数允许两个错配的作用，应该就是矫正建库时引入的两个额外碱基：

bowtie -p 5 -v 2 -m 10 --best -strata --un sample.unmap.fastq -S rnaidx sample.trimed.fq.gz sample.rna.sam
bowtie -p 5 -v 2 -k 10 --best -strata --un -S refidx sample.unmap.fastq sample.sam 
samtools view -@ 5 -Sb -o sample.bam sample.sam
samtools sort -O BAM -@ 5 -o sample.sort.bam sample.bam
samtools index -@ 5 sample.sort.bam

3、peakcalling
最后，使用piranha软件来做callpeak，如果输入文件bed，可以用bedtools软件的bamtobed将bam转为bed格式：

# bed输入
bedtools bamtobed -i sample.sort.bam >sample.bed
Piranha -s -p 0.001 -b 20 -d ZeroTruncatedNegativeBinomial -o sample.peak.bed sample.bed

# bam输入
Piranha -s -p 0.001 -b 20 -d ZeroTruncatedNegativeBinomial -o sample.peak.bed sample.sort.bam

过程还是挺简单的，至此，我们就得到了富集的peak文件，基于此就可以做后续的分析了。有点奇怪的地方，按照软件的说明参数-s指定是否需要排序，我这里使用的是sort后的bam文件，还是需要这个参数，否则会报错。也许，要求的不是coordinate排序方式。

结果展示

下面展示一下，本人使用文献数据分析的部分结果，数据来自GSE137925。

meta-analysis of Ddx4 LACE-seq：

IGV track of Chr17(qB1)：

IGV track of D10Wsu102e and Pou5f1：

从上面的结果来看，基本重现了文献的结果，只是本人做的图显得有些潦草了，不过，结果可以跟文献吻合说明咱们的数据处理过程没有错误，这才是最重要的！

参考资料

http://smithlabresearch.org/software/piranha
<<Global profiling of RNA-binding protein target sites by LACE-seq>>

往期回顾

可视化：两种方法绘制桑基图
 可视化：density与ridgeline
单细胞：不同亚群的基因平均表达热图
 可视化：bubble
可视化：scatterplot

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 160,646评论 4赞 366
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,979评论 1赞 301
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 110,391评论 0赞 250
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 44,356评论 0赞 215
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,740评论 3赞 293
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,836评论 1赞 224
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 32,022评论 2赞 315
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,764评论 0赞 204
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,487评论 1赞 246
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,728评论 2赞 252
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,200评论 1赞 263
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,548评论 3赞 260
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,217评论 3赞 241
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,134评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,921评论 0赞 201
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,919评论 2赞 283
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,766评论 2赞 274