bioinfo100-第13题-从双序列比对开始学起

参考:

孟浩巍的知乎
zhn

第13题 从双序列比对开始学起

Hello 大家好!

经过我们之前的12个问题,我们对Illumina 测序的原理,测序的储存模式,测序数据的质控已经有了一个比较清楚的认识。那么我们今天就开始用接下来的若干次提问来学习与比对有关的知识。

比对其实应该对应的单词是alignment,但往往特指低通量的序列之间的比较。

比如10条序列,进行多序列比对就是我们常说的 multiple alignment问题;

如果是2条序列的比对,我们经常称其为pairwise alignment.

回贴通常对应的单词应该是mapping,一般指高通量的数据去寻找基因组的位置。

比如我们进行测序以后,有10M对read pair,要去寻找他们在基因组上的位置,这个时候就是一个典型的mapping问题。

alignment与mapping其实是密切相关的概念,所有的mapping软件其实都是从低通量的办法逐步改进而得到的。

今天我们的问题是,请各位学习一下北京大学高歌老师的《生物信息学:导论与方法》中的双序列比对(pairwise alignment)的相关算法。主要是Needleman-Wunsch算法(全局比对)和Smith-Waterman算法(局部比对)相关的内容,然后回答下面的问题。

  1. 博客 可参考--Needleman-Wunsch算法(全局比对)和Smith-Waterman算法(局部比对)
  2. 视频参考:高歌老师视频:
    课程视频的链接如下:
    1 生物信息学:导论与方法(北京大学)-序列比对中的基本概念
    2 生物信息学:导论与方法(北京大学)-利用动态规划进行全局序列比对
    3 生物信息学:导论与方法(北京大学)-从全局比对到局部比对

今天的问题:

如果我们假设比对的 scoring matrix 如下图1所示,同时gap的罚分d= -5


图1 序列比对的scoring matrix

假设我们的 seq1 = AAGT,seq2=AGCT;那么我们进行双序列比对,需要填写下面的表格。

表1 双序列比对需要填写的表格

1. 使用Needleman-Wunsch算法(全局比对),那么表1应该怎么填写?最终的比对结果是什么?

全局比对结果

全局比对的赋分过程

最终的比对结果为:


比对结果

2. 使用Smith-Waterman算法(局部比对),那么表1应该怎么填写?最终的比对结果是什么?

局部比对的赋分过程
局部比对结果
注意:在进行局部⽐比对回溯的时候,需要从第1个⾮非零的碱基开始,沿对⻆角线⽅方向到第1个遇到0的结果为⽌止。因 此本题中,局部⽐比对的结果有3个:

第1个结果是(浅蓝色): 
A
A
第2个结果是(⻩色): 
AAG 
-AG
第3个结果是(深蓝色): 
T
T

3. 请思考,为什么有的时候需要全局比对,有的时候需要局部比对?

全局比对:适用于相同长短的序列比对
局部比对:适用于不同长短的序列找相似的序列
另,全局比对不容易发现序列中的特殊结构域

全局⽐比对,是从头到尾对序列列的每⼀一个碱基都进⾏行行⽐比对,找到最优解; 
局部⽐比对,是为了了找到两条序列列中最相似的部分,可以有多个结果;
全局⽐比对能找到2条序列列⽐比对的最优解,⽤用处很⼤大⾃自不不必说,单独说说局部⽐比对的相关意义与必要性。
随着越来越多的序列列信息的产⽣生,⼈人们发现对于: 

1.某些蛋⽩白序列列虽然整体相差很⼤大,但是对于某些特殊的功能域却有着极⾼高的相似性; 
2.⽽而且在不不同物种中序列列和功能都相当保守,这在全局⽐比对中是很难发现的; 
3.另⼀一⽅方⾯面随着70年年代内含⼦子的发现⽐比对算法必须要能够处理理由于内含⼦子导致的⼤大⽚片段的差异
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,716评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,558评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,431评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,127评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,511评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,692评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,915评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,664评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,412评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,616评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,105评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,424评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,098评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,096评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,869评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,748评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,641评论 2 271