转录组入门(2):读文章获取测序数据

本系列课程学习的文章是:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 很容易在文章里面找到数据地址GSE81916 这样就可以下载sra文件。
来源于生信技能树:http://www.biotrainee.com/forum.php?mod=viewthread&tid=1750#lastpost

文献查找

Pubmed上搜索文献:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors

Paste_Image.png

读文章

获取数据

  1. CEO(Gene Expression Omnibus database)中查找accession code GSE81916;
Paste_Image.png
Paste_Image.png
  1. 找到数据存放的ftp地址:
Paste_Image.png
  1. 进入ftp,查看sra数据:

Paste_Image.png

从Overall design和Samples中得知,小鼠的RNAseq数据是:
SRR3589959
SRR3589960
SRR3589961
SRR3589962

  1. 使用wget下载这四个数据:
    for i in {56..62}; do echo $i wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR35899$i/SRR35899$i.sra; done

文章中对RNAseq数据的分析:

human reference genome:GRCh37/hg19
gene transfer file:GTF version GRCh37.70
比对软件:TopHat (v2.0.13)
Reads比对结果筛选:MQ>30
平均插入大小和标准差:Picard-tools(v1.126)
read count table生成:HTSeq (v0.6.0)
基因差异表达分析:DESeq (v3.0)
外显子差异表达分析: DEXSeq (v3.1)
The read per million normalized BigWig files: BEDTools (v2.17.0)和bedGraphToBigWig tool (v4)
统计分析和画图:R (v3.1.1)
基因功能分析:DAVID

推荐阅读更多精彩内容