用verkko组装基因组

背景介绍

verkko是一个最新的可以应用于二倍体基因组T2T(telomere-to-telomere)级别的基因组组装的组装软件。

2022年9月14号李恒在主题为PacBio HiFi数据组装及应用的在线会议上提到过,“目前为止verkko可能是比hifiasm效果更佳的组装二倍体T2T基因组的软件。”

那它为什么这么厉害呢?

根据GitHub的介绍,verkko是一个混装PacBio HiFi和ONT数据的基因组组装软件,基于Canu的纠错模块将PacBio HiFi reads纠错后建立multiplex de Bruijn图, 再将ONT序列对齐(align)到图上,逐步解决循环和缠结的区域,最终用Canu的consensus模块得出最终结果。

所以,如果你想最大限度地发挥verkko的能力,首先你得有PacBio HiFi reads和ONT数据(也许还得是ultra long ONT才行)。

作为一个非常state-of-art的软件,verkko当然也是支持在大型集群上运行的,不管是SGE, Slurm 还是LSF的作业系统它都是支持滴~ 另外,verkko还支持trio-based phasing ,不过要先用rukkimerqury这两个软件先处理后才能输入给verkko。

软件安装

让我们再次感谢conda的方便~

conda install -c conda-forge -c bioconda -c defaults verkko

软件运行

由于我只有PacBio HiFi数据,所以就跑个纯hifi的试试水

verkko -d /path/to/verkko \
--hifi test1.hifi_reads.fastq.gz \
test2.hifi_reads.fastq.gz \
test3.hifi_reads.fastq.gz \
--no-correction \
--no-nano \
--threads 20 \
--local \
--local-memory 100 \
--local-cpus 20

可用资源

bioRxiv文章:https://www.biorxiv.org/content/10.1101/2022.06.24.497523v1
GitHub地址:https://github.com/marbl/verkko

一个无用的小知识

Verkko is Finnish for net, mesh and graph.

Verkko在芬兰语中是网、网格和图形的意思。

私货时间

  1. 可以说verkko是一个所图甚大的基因组组装软件,是标准的state-of-art technology
  2. 有钱真的可以为所欲为。

推荐阅读更多精彩内容