选择压力分析,从序列下载到结果绘图

选择压力及基因在进化过程中所受到的压力,也称自然选择。

  • 在遗传学中, Ka/Ks或者dN/dS表示的是非同义突变频率(Ka)和同义突变频率(Ks)之间的比例。
  • 一般认为,同义突变不受自然选择,而非同义突变则受到自然选择作用。由于非同义替换往往对于生命体有害,所以在负选择的作用下,非同义替换常常会在群体中被逐渐消灭。
  • 当Ka/Ks > 1时,基因受到正选择(positive selection)
  • 受到正选择的基因可能是物种受到自然选择/人工选择的结果。对研究物种环境适应性、人工选育/驯化的影响具有重要意义。

具体知识我不作赘述,感兴趣的可以去看其他文章,本文主要介绍选择压力分析具体的流程及方法。这方面网上的教程很少,我也只是在各种网上的教程里自己摸索整理出的方法,方法不一定对,仅供参考。

1. 物种选择及序列下载

  • 物种的选择
    在进行选择压力之前,我们首先要确定分析的物种,物种一般选择近缘物种,数量不宜太多,一般5-6个。不然会导致单拷贝直系同源基因太少。
  • 序列下载
    我们需要下载物种的CDS序列或自己测序获得的CDS序列进行分析,下载的数据库推荐两个:
  1. NCBI Genome Database,这个是大家平时可能最常用的基因数据库。

    image.png

  2. 中国国家基因库,这个数据库回定期同步国际数据库的资源,网络加载速度比 NCBI 快很多且中文界面比较友好。

    image.png

2. 序列去冗余及格式调整

  • 这里我以Ameiurus melas基因组为例,首先下载CDS序列,如下图所示,我们首先需要修改其序列名称,只保留红框中我们需要的部分,这步可以自己编写脚本,或者使用我写的Python脚本。(使用方法: python 1_modify_NCBI_ID.py YourFastaFile.fa)
    image.png

然后对序列最长CDS序列进行提取,并将物种名称加到ID的前面,得到如下格式:


image.png

3. 直系单拷贝同源基因筛选及系统发育树构建

这里使用OrthoFinder寻找同源基因并建树,得到直系单拷贝同源基因和物种系统发育树结果。

4. 多序列比对及格式转换

  1. 首先将所有的直系单拷贝同源基因进行多序列比对,这里我这了很多软件,发现常规的mafft, muscle 等软件比对后会改变密码子序列。于是使用了PhyloSuite中的mafft多序列比对,选择密码子(codon)模式。

    image.png

  2. 最后使用PhyloSuite的格式转换工具,转换比对完成后的序列为Paml所需要的格式。到这里,所有的数据准备就完成了,就可以开始选择压力分析了。

    image.png

5. 选择压力分析

目前我们有了选择压力分析所必须的文件:

  1. 比对好的Paml格式密码子序列。
  2. 物种的系统发育树。(计算时要在选择的物种名后加上 #1

选择压力分析使用的是Paml中的codeml软件包。EasyCodeML做了很好的可视化界面,但是不能批量运算,只能一次分析一个,并且容易卡死(Mac 和 windows上都遇到过)。

所以我自己写了一个脚本callCodeml(使用方法:python3 callCodeml.py 序列文件夹 物种发育树文件)来计算前景枝受到的选择压力,调用codeml批量运算枝位点模型(Branch site model),并使用chi2检验,只输出 P < 0.05 的结果,最终将结果自动整理成表格。

image.png

至此,选择压力分析完成,我们只需要根据OrthoFinder的文件即可找到OG00XXXX同源组所对应的基因名称。

6. 绘图

困了,睡觉,改天有缘再写。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,847评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,208评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,587评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,942评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,332评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,587评论 1 218
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,853评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,568评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,273评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,542评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,033评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,373评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,031评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,073评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,830评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,628评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,537评论 2 269

推荐阅读更多精彩内容