病毒序列识别工具

导读

开始有关病毒的基因组学研究。

分析工具 特点 发表杂志 发表时间 被引(2021)
VirSorter 组装,PERL PeerJ 2015 585
VirSorter2 组装 Microbiome 2021 27
vConTACT2 组装 python NBT 2019 173
VirFinder 组装,R k-mer Microbiome 2017 130
GOTTCHA reads, PERL Nucleic Acids Res 2015 104
ViromeScan reads, shell集成,真核 BMC Genomics 2016 65
VIP 组装,shell集成 Scientific reports 2016 57
MARVEL 组装, python, binning Frontiers in Genetics 2018 34
Prophage Hunter BGI网页工具 Nucleic Acids Res 2019 9

1. VirSorter

用于prophages (viral genomes integrated in a microbial genome)识别鉴定。可使用有参,无参两种模式鉴定more fragmented and larger scale微生物基因组数据中的病毒信号。可鉴定短于30kb contig中的病毒信号。对长于10kb的contig,virsorter表现最佳。

文章:VirSorter: mining viral signal from microbial genomic data
中文:挖掘微生物基因组数据中的病毒信号
杂志:PeerJ
时间:2015

VirSorter Github: https://github.com/simroux/VirSorter

分析流程:

  • 组装:MetaSPAdes
  • 抽提病毒序列1:VirSorter (gene enrichment based method)
  • 抽提病毒序列2:VirFinder (k-mer frequency based method)
  • 病毒序列分类:NCBI viral RefSeq sequences, NCBI taxonomy data
  • 基因预测:MetaProdigal
  • crAss-like噬菌体检测
  • Tentative病毒contig鉴定
  • Pfam结构蛋白鉴定病毒
  • 病毒组样品聚类
  • 前噬菌体分析

参考:
Metagenome Data on Intestinal Phage-Bacteria Associations Aids the Development of Phage Therapy against Pathobionts.
Cell Host & Microbe. 2020

VirSorter2

从宏基因/转录组数据中识别病毒信号缺少1. 广谱基因marker 2. 数据库代表 3. 有效工具。但VirSorter2很OK。

标题:VirSorter2: a multi-classifier, expert-guided approach to detect diverse DNA and RNA viruses
中文:一种含多分类器且有专家指导的DNA/RNA病毒检测方法
杂志:Microbiome
时间:2021

VirSorter2 Github: https://github.com/jiarong/VirSorter2
bitbucker: https://bitbucket.org/MAVERICLab/virsorter2/src/master/

2. VirFinder

VirFinder: R package for identifying viral sequences from metagenomic data using sequence signatures。基于病毒序列 k -mers词频和机器学习识别病毒序列的方法。 此方法利用了常用的序列k -mers构建序列相量,构建机器学习分类器,不需要参考病毒序列数据库,显著提高了病毒序列识别的速度和准确性,将有助于在宏基因组学时代下对病毒的研究。

标题:VirFinder: a novel k-mer based tool for identifying viral sequences from assembled metagenomic data
中文:识别宏基因组中病毒序列,基于k-mer
杂志:Microbiome
时间: 2017
单位:南加利福尼亚大学

VirFinder Github: https://github.com/jessieren/VirFinder

分析流程:

  • 组装:MetaSPAdes
  • 抽提病毒序列1:VirSorter (gene enrichment based method)
  • 抽提病毒序列2:VirFinder (k-mer frequency based method)
  • 病毒序列分类:NCBI viral RefSeq sequences, NCBI taxonomy data
  • 基因预测:MetaProdigal
  • crAss-like噬菌体检测
  • Tentative病毒contig鉴定
  • Pfam结构蛋白鉴定病毒
  • 病毒组样品聚类
  • 前噬菌体分析

工具比较:

参考:
1 Metagenome Data on Intestinal Phage-Bacteria Associations Aids the Development of Phage Therapy against Pathobionts.
Cell Host & Microbe. 2020
2 VirFinder:基于k-mer的病毒序列预测算法

DeepVirFinder

使用深度学习方法预测病毒序列。该方法对短病毒序列具有较好的预测精度,可用于从宏基因组数据中预测序病毒列。与基于k-mer的VirFinder方法相比,DeepVirFinder通过使用卷积神经网络(CNN)显著提高了预测精度。CNN可以自动从病毒和原核生物序列中学习基因组模式,同时根据学习到的基因组模式建立预测模型。

标题:Identifying viruses from metagenomic data using deep learning
中文:识别宏基因组中的病毒序列,使用深度学习
杂志:quantitative biology
时间:2020
单位:南加利福尼亚大学

DeepVirFinder Github: https://github.com/jessieren/DeepVirFinder

更多:
QB:基于深度学习的病毒序列识别
DeepVirFinder使用指南

安装

# 创建独立环境
conda create -n deepvirfinder
conda activate deepvirfinder
# 安装依赖
conda install python=3.6 numpy theano=1.0.3 keras=2.2.4 scikit-learn Biopython h5py

ProxyError: Conda cannot proceed due to an error in your proxy configuration

# clone 主程序
git clone https://github.com/jessieren/DeepVirFinder
cd DeepVirFinder
chmod 777 dvf.py
./dvf.py --help
python dvf.py --help

3. GOTTCHA

Genomic Origin Through Taxonomic CHAllenge (GOTTCHA)。把细菌和病毒序列分别识别鉴定出来。

文章:Accurate read-based metagenome characterization using a hierarchical suite of unique signatures
GOTTCHA Github: https://github.com/LANL-Bioinformatics/GOTTCHA

4. ViromeScan

文章:ViromeScan: a new tool for metagenomic viral community profiling
Sourceforge: https://sourceforge.net/projects/viromescan/files/?source=navbar

5. VIP

文章:VIP: an integrated pipeline for metagenomics of virus identification and discovery
描述:Virus Identification Pipeline (VIP)
Github: https://github.com/keylabivdc/VIP

6. MARVEL

文章:MARVEL, a Tool for Prediction of Bacteriophage Sequences in Metagenomic Bins
描述:Metagenomic Analysis and Retrieval of Viral Elements
Github: https://github.com/laboratoriobioinformatica/MARVEL

7. Prophage Hunter

文章:Prophage Hunter: an integrative hunting tool for active prophages
BGI网页工具:https://pro-hunter.bgi.com/index.php/Home/Index/index.html

工具比较:

8. vConTACT2

bitbucket: https://bitbucket.org/MAVERICLab/vcontact2/wiki/Home

文章:Taxonomic assignment of uncultivated prokaryotic virus genomes is enabled by gene-sharing networks
中文:通过基因分享网络给META中的病毒基因组做分类注释
杂志:Nature Biotechnology
时间:2019

参考:
微生物组学数据分析工具综述 | 16S+宏基因组+宏病毒组+宏转录组

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,117评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,963评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 107,897评论 0 240
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,805评论 0 203
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,208评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,535评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,797评论 2 311
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,493评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,215评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,477评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,988评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,325评论 2 252
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,971评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,055评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,807评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,544评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,455评论 2 266