单端测序与双末端测序问题

问题

  • Paired-End测序与Mate-Pair测序相对于单端测序有何优势?

  • Paired-End中的Read1和Read2到底是啥关系?它们是如何参与拼接和比对的呢?

  • Mate-Paired与Paird-End两种不同建库测序的区别在哪里?产生的数据有何不同?各自有哪些优缺点?

  • Single-Read测序、Paired-End测序、Mate-Pair测序,何时选择哪种测序策略?读长、插入序列为多少?
    不懂的问题很多,困惑很多,借此寻找答案的机会也将单端测序与双末端测序的区别整理一下,巩固基础知识。

学基础

Single-Read测序、Paired-end和Mate-pair主要区别

以上三者的区别主要在于测序文库的构建方法上。

Single-Read测序(Single-read)首先将DNA样本进行片段化处理形成200-500bp的片段,引物序列连接到DNA片段的一端,然后末端加上接头,将片段固定在

flow cell上生成DNA簇,上机测序单端读取序列。该方式建库简单,操作步骤少,常用于小基因组、转录组、宏基因组测序。


image

Paired-end文库制备是指在构建待测DNA文库时在两端的接头上都加上测序引物结合位点,在第一轮测序完成后,去除第一轮测序的模板链,用对读测序模块(Paired-End Module)引导互补链在原位置再生和扩增,以达到第二轮测序所用的模板量,进行第二轮互补链的合成测序。


image

Mate-pair文库制备旨在生成一些短的DNA片段,这些片段包含基因组中较大跨度(2-10 kb)片段两端的序列,更具体地说:首先将基因组DNA随机打断到特定大小(2-10 kb范围可选);然后经末端修复,生物素标记和环化等实验步骤后,再把环化后的DNA分子打断成400-600 bp的片段并通过带有链亲和霉素的磁珠把那些带有生物素标记的片段捕获。这些捕获的片段再经末端修饰和加上特定接头后建成mate-pair文库,然后上机测序。


image

解困惑&答问题

为何要有 Paired-end这样的技术发明呢?

主要原因在于Illumina的二代测序仪的读长短,相对于第一代sanger测序法(约1000bp)或者跟同属于NGS的其他测序仪相比短了许多。因此illumina发展了 Paired-end的建库测序技术。同时这种技术还大大推进了基因组学数据分析的发展。
例如,依赖于Paired-end的技术,假设一个DNA片段刚好跨越了重复序列区域(下图左侧)以及独特序列区域(下图右侧)。加入只读取Single-Read,我们只会获得红色实线的序列信息,也就是ATATATAT。接下来,当我们想要将这段read跟reference genome做比对的时候,便会出现问题:到底这段read是出自于红色实线的位置,还是红色虚线的位置?这个问题我们就可以使用Paired-end的技术来加以解决。由于Paired-end reads之间的距离为已知(在此我们设为34bp),我们便可以先定位绿色read的位置,在正确定位出左边红色re reads之间 ad的位置,而不至于将其误判在红色虚线的位置。如下图所示:


image

此外,根据我们内部的一个测试。在进行de novo assembly的时候,序列长度以及Paired-end的序列信息可以让我们得到最好的组装结果。透过下边可以发现,Paired-end的序列信息甚至比序列长度要来得更为重要。因此,建议大家在选择测序方案的时候,尽量选择Paired-end吧!


image

总结,不管采用哪种方式,PE/MP测序的结果除了序列本身外还有中间的距离信息。距离信息可以用来判定组装后成对reads间的序列是否准确,也可用来帮助组装。这种测序方式可以用来解决基因组中的重复序列难题,被广泛采用。目前在采用双端测序法时,454平台建库最长(最长能达到20k),Illumina 建库长度最短(小于5k)。由于Solid和Solexa都是采用桥式扩增的方式,其本身自带Paired-End测序能力。而454和Ion Torrent要对打断后的片段进行环化、酶切,然后才能进行 mate-paired 测序。因此建库的成本会比单端测序的高 。

Paired-End reads是如何比对的?

Paired-End reads是如何拼接的?

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,026评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,655评论 1 296
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,726评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,204评论 0 213
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,558评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,731评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,944评论 2 314
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,698评论 0 203
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,438评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,633评论 2 247
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,125评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,444评论 3 255
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,137评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,103评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,888评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,772评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,669评论 2 271

推荐阅读更多精彩内容

  • 8种特殊建库测序 8种特殊建库测序 1. RNA-seq 2. 外显子测序 3. small RNA-seq 4....
    wangchuang2017阅读 12,811评论 2 92
  • 什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sang...
    翠湖心影阅读 20,108评论 2 81
  • 作为一个已经在生物信息行业摸爬两年的小白,还是有必要重新认识一下高通量测序领域的一些常用名词。什么是高通量测序?高...
    相见很不晚阅读 4,363评论 1 30
  • 测序的世界很奇妙,不同的数据处理可能得出不同的结论,入门生信首先要做的就是了解你的数据还等什么?跟我一起来探索吧~...
    刘小泽阅读 23,913评论 13 181
  • 收到很多雨天晴,很感动,在这个环境里,这些和煦用心的话最能打动人,从雨天晴里能看到很多,很多平时联系很少的人给你写...
    Hi_张阅读 232评论 0 0