其实MCScan画图也可以很好看

最近发现了python版的MCScan,是个大宝藏。由于走了不少弯路,终于画出美图,赶紧记录下来

github地址 https://github.com/tanghaibao/jcvi/wiki/MCscan-(Python-version)

1、软件安装

需要安装LASTAL和jcvi python包

sudo apt install last-align
pip install jcvi

2、输入数据

输入数据只有两类cds和bed文件
可以自动从phytozome,这点十分方便

$ python -m jcvi.apps.fetch phytozome
...
         Acoerulea               Alyrata             Athaliana
       Bdistachyon                 Brapa           Cclementina
           Cpapaya          Creinhardtii              Crubella
          Csativus             Csinensis Csubellipsoidea_C-169
          Egrandis                Fvesca                  Gmax
        Graimondii        Lusitatissimum            Mdomestica
        Mesculenta             Mguttatus     Mpusilla_CCMP1545
   Mpusilla_RCC299           Mtruncatula          Olucimarinus
           Osativa               Ppatens              Ppersica
      Ptrichocarpa             Pvirgatum             Pvulgaris
         Rcommunis              Sbicolor              Sitalica
     Slycopersicum       Smoellendorffii            Stuberosum
            Tcacao            Thalophila              Vcarteri
         Vvinifera                 Zmays         early_release

以水稻和拟南芥为例

$ python -m jcvi.apps.fetch phytozome Osativa,Athaliana
$ ls
Athaliana_167_cds.fa.gz  Athaliana_167_gene.gff3.gz Osativa_204_cds.fa.gz  Osativa_204_gene.gff3.gz

其中gff3文件不需要解压 一键转换成bed格式

python -m jcvi.formats.gff bed --type=mRNA --key=Name Osativa_204_gene.gff3.gz -o osa.bed

cds解压后需要去掉|分隔符 b并要修改id 以基因而不是转录本命名

$ gunzip Athaliana_167_cds.fa.gz
$ mv Athaliana_167_cds.fa ath.cds
$ sed 's/\.*$//g' -i ath.cds  #也可以这么做 python -m jcvi.formats.fasta format --sep="|" Athaliana_167_cds.fa.gz  ath.cds
$ sed 's/\.//g' -i ath.cds 

如果是其他物种或者自己组装的基因组数据,记得基因id需要遵循在染色体上的位置从大到小排序的命名原则,否则软件会在gff3转bed的时候自动命名,务必要和cds里的id对应。

3、Pairwise synteny 分析

$ python -m jcvi.compara.catalog ortholog osa ath

分析过程很快,结果包括.anchors文件,点阵图,如果遇到报错,多半是要安装python包,更新Latex。结果文件的含义“The .last file is raw LAST output, .last.filtered is filtered LAST output, .anchors is the seed synteny blocks (high quality), .lifted.anchors recruits additional anchors to form the final synteny blocks.”

$ ls osa.ath.*
osa.ath.lifted.anchors  osa.ath.anchors  osa.ath.last.filtered  osa.ath.last

4、可视化

重头戏来了

a 共线性图

首先生成.simple文件

python -m jcvi.compara.synteny screen --minspan=30 --simple osa.ath.anchors osa.ath.anchors.new

再编辑两个配置文件seqids和layout

$ vi seqids #设置需要展示等染色体号 
Chr1,Chr2,Chr3,Chr4,Chr5,Chr6,Chr7,Chr8,Chr9,Chr10,Chr11,Chr12 #osa
Chr1,Chr2,Chr3,Chr4,Chr5,Chr6,Chr7,Chr8,Chr9,Chr10,Chr11,Chr12 #ath

$ vi layout #设置颜色、长宽等
# y, xstart, xend, rotation, color, label, va,  bed
 .6,     .1,    .8,       0,      , Osa, top, osa.bed
 .4,     .1,    .8,       0,      , Ath, top, ath.bed
# edges
e, 0, 1, osa.ath.anchors.simple

接下来就是见证奇迹的时刻


还有许多高能操作,大家可以试试
真好看

突出显示

$ vi XXX.XXXanchors.simple 
g*GSVIVT01012028001 GSVIVT01000604001   ppa011886m  ppa008534m  392 +
GSVIVT01010441001   GSVIVT01000970001   ppa022891m  ppa001358m  115 -
GSVIVT01000555001   GSVIVT01003228001   ppa002809m  ppa010569m  359 +
...
$ python -m jcvi.graphics.karyotype seqids layout
突出显示.png
$ vi layout
# y, xstart, xend, rotation, color, label, va,  bed
 .7,     .1,    .8,      15,      , Grape, top, grape.bed
 .5,     .1,    .8,       0,      , Peach, top, peach.bed
 .3,     .1,    .8,     -15,      , Cacao, bottom, cacao.bed
# edges
e, 0, 1, grape.peach.anchors.simple
e, 1, 2, peach.cacao.anchors.simple

$ vi seqids
chr1,chr2,chr3,chr4,chr5,chr6,chr7,chr8,chr9,chr10,chr11,chr12,chr13,chr14,chr15,chr16,chr17,chr18,chr19
scaffold_1,scaffold_2,scaffold_3,scaffold_4,scaffold_5,scaffold_6,scaffold_7,scaffold_8
scaffold_1,scaffold_2,scaffold_3,scaffold_4,scaffold_5,scaffold_6,scaffold_7,scaffold_8,scaffold_9,scaffold_10r

$ python -m jcvi.graphics.karyotype seqids layout
扇形.png
局部展示.png
多物种单个block展示.png

b dotplot

亲测点阵图是自动出来的,当然也可以用命令行

$ python -m jcvi.graphics.dotplot osa.ath.anchors
还是很漂亮的

可以看到水稻和拟南芥基因组的syntenic很差,github示例里葡萄和桃子的syntenic regions不错,可以推断出一些染色体genome triplication事件

查看synteny depth分布

python -m jcvi.compara.synteny depth --histogram osa.ath.anchors
osa.ath.depth.pdf

anyway,先介绍到这里啦

更多请参考
基因组共线性工具MCScanX使用说明
基因组间共线性分析想学吗?
无限个!物种共线性分析结果可视化

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 161,601评论 4 369
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,367评论 1 305
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 111,249评论 0 254
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,539评论 0 217
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,967评论 3 295
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,929评论 1 224
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,098评论 2 317
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,825评论 0 207
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,609评论 1 249
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,796评论 2 253
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,282评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,603评论 3 261
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,277评论 3 242
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,159评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,959评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 36,079评论 2 285
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,874评论 2 277

推荐阅读更多精彩内容

  • 基因组组装完成后,或者是完成了草图,就不可避免遇到一个问题,需要对基因组序列进行注释。注释之前首先得构建基因模型,...
    xuzhougeng阅读 48,811评论 11 182
  • 这个故事仿佛已经过去很久,仿佛仍然还在继续。就像你若相信这世间的美好,就能够看见彩虹;你若信仰心有灵犀的感情,那么...
    心中的蓝莲花阅读 702评论 0 0
  • 2017,亲爱的妈咪59岁。最近一次与她出境旅行在2014年,三年前的巴厘岛假期一直让她念念不忘。 我寻思着今年也...
    颖颖潜行阅读 281评论 1 3
  • 一、我的障碍 1、人际关系中的障碍 我很难走近权威,害怕与强人接触,在他们身上会照见我的不堪和失败。 我很难接受与...
    上善若水泽万物阅读 591评论 0 1