Paper-39 比较基因组学分析实例:双歧杆菌科的比较基因组和系统生物学分析 (BMC Genomics, 2017) 2021-01-25

image.png

摘要

  • 双歧杆菌科的成员代表了在各种动物的肠道中定居的两个主要微生物群,特别是在它们的哺乳阶段,而它们也作为泌尿生殖道的致病菌存在。 尽管双歧杆菌科的基因组学尚未引起人们的广泛关注,但近年来双歧杆菌属的全基因组已被详细研究。
  • 在这里,对67种双歧杆菌科(亚)物种进行了比较基因组分析,包括该科目前所有公认的属,即Aeriscardovia,Alloscardovia,Bifidobacterium,Bombiscardovia,Gardnerella,Neoscardovia,Parascardovia,Pseudoscardovia和Scardovia。
  • 此外,为了包括属于双歧杆菌科的67个(当前公认的)(亚)物种中的每个物种的代表,我们对这个科的另外11个物种的基因组进行了测序,从而完成了这一科到目前为止该物种中进行的最广泛的比较基因组分析。
  • 结果
  • 基于基因组学的分析揭示了双歧杆菌科每个成员遵循的推测的进化途径,强调了Aeriscardovia aeriphila AMG(AMG)是该科进化树中最深的分支。 此外,基于基因组含量的功能分析揭示了该科成员,其碳水化合物利用能力及其相应宿主之间的联系。
  • 在这种情况下,从人和猴子分离出的双歧杆菌(亚)种具有最高相对数量的获得糖基水解酶编码基因,可能是为了增强其代谢能力,以利用宿主消耗的不同碳源。
  • 结论
  • 在双歧杆菌科中,双歧杆菌属的基因组学已被广泛研究。相反,对该科其他八属成员的基因组学知之甚少。在这项研究中,我们解码了双歧杆菌科每个成员的基因组序列。 进行了后续的比较基因组和系统发育分析,评估了该科推导的全基因组,并评估了属于该科的每个分类单元的进化。

背景知识

  • 双歧杆菌科是双歧杆菌门唯一的科,并且已被证明代表了放线放线杆菌中最深的分支 。目前,双歧杆菌科包括双歧杆菌属的55(亚)种 和另外八个属的成员,即Aeriscardovia,Alloscardovia,Bombiscardovia,Gardnerella,Neoscardovia,Parascardovia,Pseudoscardovia和Scardovia,它们总共包含12种。
    此外,从白蚁中鉴定出了一种新颖的,但不可的物种,并以“ Candidatus Ancillula trichonymphae”的分类学名称被包括在双歧杆菌科中。 后一种生物的名称源自Trichonympha属的多种鞭毛虫,其中该菌株为共生菌。
  • 双歧杆菌科是具有发酵型代谢的化学有机营养菌,革兰氏阳性,无孢子形成,不能运动,厌氧或兼性厌氧细菌。它们生活在不同的生态环境中,例如人和动物的胃肠道(GIT),口腔和昆虫肠道,而它们也可能存在于血液和污水中,可能是由于环境污染所致。许多双歧杆菌因其据称促进健康的活动以及在早期定居中的相关性和对婴儿肠道糖组的贡献而受到赞赏[7]。 相反,双歧杆菌科另一属的成员通常与人类和动物的龋齿有关,并且通常从人类扁桃体脓肿和细菌性阴道病的临床样本中分离出来 。 此外,双歧杆菌主要包括严格的厌氧菌,但有一些例外,例如动物双歧杆菌亚种。 乳酸和小行星 双歧杆菌,该科的其他成员可以在有氧条件下生长,并具有较低G + C含量的DNA 。
  • 该科中最有争议的物种是阴道加德纳菌Gardnerella vaginalis ,最初由利奥波德(Leopold)在1953年描述,并命名为“嗜血杆菌” 。 随后,分类学研究与从生化分析和电子显微镜检查获得的数据相结合,支持将其重新分类为新属。 目前,阴道加德纳菌被描述为一种机会病原菌,其存在与细菌性阴道病紧密相关。 此外,1996年分别被归类为牙双歧杆菌和猪双歧杆菌的牙旁假单胞菌和Scardovia wiggsiae和牙本质双歧杆菌与人的龋齿有关 。 虽然这些物种的成员在成年人的唾液中大量存在,但它们的存在与其他龋齿相关生物密切相关 。
  • 值得注意的是,双歧杆菌属的比较基因组分析已针对整个属或一种特定的双歧杆菌类​​群,即双歧双歧杆菌 ,青春双歧杆菌 ,短双歧杆菌 。 长双歧杆菌 或动物双歧杆菌亚种。 乳酸类群。相反,尚未详细研究属于双歧杆菌科的其他八个属的基因组学。 在这里,我们解码了属于双歧杆菌科的11种物种的基因组,而这些基因组没有以前的基因组数据。 此外,我们对当前分配给双歧杆菌科的67个物种,(亚)物种进行了深入的比较基因组分析,以及系统发育重建。
方法
双歧杆菌科菌株
  • 我们从国家生物技术信息中心(NCBI)的公共数据库中检索了56种双歧杆菌科菌株的完整和部分基因组序列(表1)。此外,我们对GenBank序列数据库中保存的11种双歧杆菌科菌株的基因组序列进行了测序和分析(表2)。


    截图大师 Capture 107 - Comparative genomic and phylogenomic an_ - https___bmcgenomics.biomedcentral.co.jpg

    image.png
细菌菌株和生长条件
  • 将双歧杆菌科纯培养物接种到补充有0.05%(wt / vol)L-半胱氨酸盐酸盐的de Man-Rogosa-Sharpe(MRS)培养基中,并在厌氧气氛(2.99%H2、17.01%CO2和 80%N2)在37°C的室内(Concept 400,Ruskin)中放置16小时。 如先前所述[29]提取DNA,并使用先前描述的方案进行进一步的苯酚-氯仿纯化。
基因组测序和组装
  • 按照供应商的协议(英国Illumina),在GenProbio srl(意大利帕尔马)使用MiSeq(英国Illumina)对从各种双歧杆菌科菌株中提取的DNA进行全基因组测序。 从分离菌株的靶向基因组测序中获得的配对末端读数的Fastq文件用作通过MEGAnnotator管道进行基因组组装的输入[31]。 MIRA程序(版本4.0.2)用于每个双歧杆菌科的基因组序列的从头组装[32]。
基因注释
  • 使用Prodigal可以预测蛋白质编码的开放阅读框(ORF)[33]。 使用tRNAscan-SE v1.4鉴定了转移RNA基因,而使用RNAmmer v1.2鉴定了核糖体RNA基因。 基因查找程序的结果与RAPSearch2分析(基于减少的字母的蛋白质相似性搜索)的数据相结合,该数据由美国国家生物技术信息中心(NCBI)和隐马尔可夫模型概况(HMM)提供 )在手动整理的Pfam-A蛋白科数据库中搜索(http://hmmer.org/)。 合并的结果由Artemis进行了检查,该结果用于手动编辑,目的是验证并在必要时重新定义每个预测的编码区域的起点,并删除或添加编码区域。
双歧杆菌科全基因组分析
  • 对于双歧杆菌科每个成员的67个基因组序列,使用PGAP管道进行了全基因组计算。 本研究中使用的所有基因组的ORF含量均使用GF(基因家族)方法按功能簇进行组织,该方法涉及使用BLAST分析将每种蛋白质与所有其他蛋白质进行比较(临界E值为1 X 10-5,同一性为50% 至少两个蛋白质序列的至少50%),然后使用MCL(基于图论的马尔可夫聚类算法)将其聚类为直系同源群体(BaeCOGs)的双歧杆菌科特定簇。 基于存在/不存在矩阵,使用包含在PGAP软件中的优化算法来建立泛基因组图谱,该矩阵包含分析的基因组中所有已鉴定的BaeCOG。 此后,对67个双歧杆菌科基因组中每个基因组的独特蛋白质家族进行了分类。 通过选择每个基因组至少包含一个蛋白质成员的科来定义所有基因组之间共享的蛋白科,称为核心BaeCOG。

系统发育比较

  • 该科(核心BaeCOGs)的串联核心基因组序列,使用MAFFT进行比对,并使用Clustal W版本2.1中的邻居连接方法构建了系统树。 核心基因组超级树是使用FigTree(http://tree.bio.ed.ac.uk/software/figtree/)构建的。 使用程序1.2.1版的JSpecies计算平均核苷酸同一性(ANI)的值。

功能分析

  • 利用CAZy数据库对编码具有结构相关的催化和糖结合模块以催化糖苷键的水解,修饰或合成的酶的基因进行预测。 使用eggNOG数据库对每个基因进行功能注释。 通过MetaCyc代谢途径数据库对参与初级和次级代谢的完整途径进行了搜索。 使用1×10-10的临界E值预测基因功能,以鉴定每个数据库的最佳命中值。

通过进化重建获得基因损益

  • 使用Dollo的简约性,使用Count软件来预测由于至少有四个可用基因组的细菌物种的进化而导致的基因获取或基因丢失。

结果与讨论

双歧杆菌科基因组的一般基因组特征
  • 六个双歧杆菌物种的基因组序列,即Bifidobacterium aquikefiri LMG 28769, Bifidobacterium eulemuris DSM 100216, Bifidobacterium hapali DSM 100202, Bifidobacterium lemurum DSM 28807, Bifidobacterium myosotis DSM 100196, Bifidobacterium tissieri DSM 100201以及通过shot弹枪测序来解码双歧杆菌科五个不同的基因,包括Aeriscardovia aeriphila LMG 21773, Alloscardovia macacae DSM 24762, Bombiscardovia coagulans DSM 22924 and Pseudoscardovia radai DSM 24742, Pseudoscardovia suis DSM 24744。表2总结了这11个双歧杆菌科基因组的基因组特征和测序数据。为了提供双歧杆菌科的完整基因组分析,现对属于该科的当前描述的67个(亚)种中的每一个的代表性基因组序列进行了分析。 从NCBI公共数据库中检索(表1)。 由于从NCBI数据库中检索到的三歧念珠菌ImTpAt基因组序列不完整,并且无法从任何公共细菌培养物中检索到该菌株,因此我们决定从分析中排除ImTpAt的基因组序列。 56个先前表征的双歧杆菌类​​群的基因组数据与此处报道的11个双歧杆菌科物种的染色体序列相结合,形成了最全面的代表性基因组成员数据库 双歧杆菌科。 双歧杆菌科基因组的平均基因组长度为2.25 Mb,大小范围从Scardovia wiggsiae F0424的1.55 Mb到双歧双歧杆菌DSM 23969的3.25 Mb,分别对应于1244和2557个预测的蛋白质编码开放阅读框(ORF)( 表格1)。 平均基因组GC含量范围从阴道加德纳氏菌ATCC 14018的41.36%到霍乱双歧杆菌LMG 10510的65.53%,与双歧杆菌属的其他类群(52.91%)相比,双歧杆菌菌株的平均值更高(60.24%)。 双歧杆菌菌株的平均基因组大小也比其他科成员高,分别为2.33 Mb和1.88 Mb,突出显示了1.24的基因比率(通过将双歧杆菌(亚)种的平均基因数除以 (双歧杆菌科的非双歧杆菌分类群),有利于双歧杆菌菌株。 双歧杆菌属成员拥有的更大的基因补体可能反映了该双歧杆菌属的遗传变异性增加,赋予双歧杆菌与双歧杆菌科其他成员相比具有更大的适应各种生态位的能力。 表1中列出的数据是从非常有限的环境中分离出来的。 进一步的分析涉及属于双歧杆菌科的不同物种的移动元件,发现此类移动元件的百分比不同(按这些基因组内基因总数的比例计算),范围从印度双歧杆菌LMG 11587的0.07%到印度双歧杆菌LMG 11587的5.02% B. hapali DSM100202。此外,整个双歧杆菌属中含有1.5%的可移动元素,而非双歧杆菌属中则含有0.9%的可移动元素,突出显示了约2.1的可移动元素比率(通过将元素的平均含量除以 预测了双歧杆菌(亚)物种的移动元素与属于双歧杆菌科的非双歧细菌分类单元的移动元素)。 因此,双歧杆菌基因组中预测的可移动元件的大量丰富反映了这些菌株的上述基因组变异性增加。 有趣的是,双歧杆菌中的tRNA基因的数量在嗜热双歧杆菌亚种的40个范围内。 LMG 21689至79用于长双歧杆菌亚种 婴儿ATCC 15697,而在双歧杆菌科的其他成员中,tRNA的丰度似乎变化较小,范围为45至48(表1)。 但是,不属于双歧杆菌属的双歧杆菌科菌株对于20个氨基酸中的每一个都至少具有一个tRNA基因(附加文件1:表S1)。 此外,除了不属于双歧杆菌属的双歧杆菌科菌株脯氨酸tRNA中反密码子GGG的丰度较低外,对每个(亚)物种的反密码子序列进行更深入的筛选不会显示出主要差异(附加文件1: 表S1)。 因此,可能会认为双歧杆菌科某些成员中较低的tRNA基因数目与这些菌株密码子使用的简化无关。 此外,尽管双歧杆菌基因组包含1至6个rRNA基因座,每个基因组平均3.2,但Aeriscardovia,Alloscardovia,Bombiscardovia,Gardnerella,Neoscardovia,Parascardovia,Pseudoscardovia和Scardovia的基因组平均数量较低。 rRNA基因座的残基,即2.6,与在相应基因组中鉴定出的不广泛的ORFome和tRNA武库一致(表2)。
  • 此外,基于毒力因子数据库(VFDB)对双歧杆菌科的12个基因组进行了计算机分析,没有发现任何毒力遗传决定因素的发生。 这样的结果证实了先前报道的关于齿状芽孢杆菌Bd1基因组的发现。
双歧杆菌科的全基因组,核心基因组和独特基因
  • 进行了涉及双歧杆菌科的67个(亚)种的比较基因组分析,以揭示该细菌科的相应泛基因组,核心基因组和独特基因。 所有基因组都经过相同的ORF查找和注释方案,以便为每个双歧杆菌科分类单元生成可比较的数据集。 在67个双歧杆菌科(亚)物种中,总共鉴定出25744个BaeCOG(双歧杆菌科的直系同源基因簇),其中8359个成员至少存在于两个基因组中。 将全基因组大小与所包含的基因组数量作图时,清楚地表明,功率趋势线尚未达到平稳状态(图1)。 实际上,通过顺序添加基因组序列发现的新基因数量在前三个基因组添加中从839个减少到636个BaeCOG,在最后三个添加中发现数量从274个到272个BaeCOG减少,这表明存在一个开放的平台 双歧杆菌科的基因组。 这一发现表明,尚未鉴定出更多的双歧杆菌科成员,尤其是不属于双歧杆菌属的成员,因为与目前公认的双歧杆菌(亚)种相比,它们在各种环境中的特征仍然很差。

图1
image.png
#泛基因组和双歧杆菌科的基因功能分类
  • 小图a显示了泛基因组,其表示为顺序添加67个双歧杆菌科基因组后所得基因库大小的变化。x轴代表所包括基因组的数目,而y轴代表所产生的泛基因组中基因的数目。小图b显示了与预测的EggNOG分类相关的核心BaeCOG的数量。面板c显示了通过EggNOG数据库分类的,与双歧杆菌属和不属于双歧杆菌属的双歧杆菌科成员之间的功能类别相关的TUG的百分比。COG科由一个字母缩写表示:A,RNA加工和修饰;B,染色质的结构和动力学;C,能源生产与转化;D,细胞周期控制与有丝分裂;E,氨基酸的代谢和运输;F,核苷酸代谢与转运;G,碳水化合物的代谢和运输;H,辅酶代谢;一,脂质代谢;J,翻译;K,转录;L,复制和修复;M,细胞壁/膜/包膜生物发生;N,细胞运动;O,翻译后修饰,蛋白质更新和伴侣功能;P,无机离子的运输和代谢;Q,二级结构;T,信号转导;U,细胞内运输和分泌;Y,核结构;五,防御机制;Z,细胞骨架;R,仅一般功能预测;S,功能未知

  • 对双歧杆菌科的全基因组分析允许鉴定所有67个(亚)物种共有的353个COG,代表当前已测序的双歧杆菌科代表的核心基因组(核心BaeCOG)。 使用eggNOG数据库对核心BaeCOG的功能注释进行的搜索显示,最保守的核心基因指定了内部功能,例如复制,转录和翻译,或与适应相关的功能,例如碳水化合物,核苷酸和氨基酸代谢 作为细胞包膜的生物发生(图1)
  • 泛基因组分析还允许鉴定双歧杆菌科的真正独特基因(TUG),即存在于一种特定菌株中但在双歧杆菌科的任何其他受检代表中都不存在的基因。 TUG的数量范围从印度双歧杆菌LMG 11587的42个到古双歧杆菌LMG 10738的585个。EggNOG分析显示,大多数TUG(59%)没有功能注释(附加文件1:表S2)。 然而,考虑到通过eggNOG分析得到的分类基因,除了假设基因和无功能基因之外,在碳水化合物代谢和细胞包膜生物发生以及复制和转录过程中,基因数量最多。 如上所述,这四个类别被确定为包含最多的核心BaeCOG。 有趣的是,TUGs的功能注释显示,与双歧杆菌科其他成员相比,双歧杆菌基因组显示出参与碳水化合物代谢和细胞包膜生物发生的TUGs含量更高,反映了平均水平上分别有38%和78%的TUGs。 组之间的数字分别为[2,54](图1和附加文件1:表S2)。 这些结果与先前基于双歧杆菌属的每个(亚)物种参考菌株的基因组和功能分析一致,表明双歧杆菌处于强大的选择压力下,需要获取和保留用于碳水化合物利用的辅助基因,以便在特定领域具有竞争力。 他们居住的生态位。

双歧杆菌科成员的系统生物学分析

  • 双歧杆菌科每个成员的基因组序列的可用性允许深入分析此广泛科的每个成员的进化发育。 基于代表核心BaeCOG的314个蛋白序列的串联构建了系统进化超树,但排除了每个基因组中鉴定的旁系同源物(图2)。

图2
image.png
  • 基于从314个核心基因推导的氨基酸序列串联而成的双歧杆菌科的超级树。高于70的引导值会在各个节点附近标记。双歧杆菌群以不同的颜色突出显示


  • 生成的系统进化树表明,十个不属于双歧杆菌属的双歧杆菌科菌株代表了该超级树的最深分支,与55个双歧杆菌(亚)物种分开(图2)。

  • 因此,双歧杆菌物种位于超级树的顶部,与双歧杆菌科的非双歧细菌成员相比,反映出它们的最高平均基因比率(1.24)。 因此,这些数据清楚地表明,当前已知的双歧杆菌物种的进化涉及相对有限的祖先基因损失发生率,但是涉及广泛的基因获取事件,从而证实了先前发表的数据[2]。 有趣的是,不属于双歧杆菌属的双歧杆菌科的两个成员,即阴道加德纳氏菌ATCC 14018和Bo。 与双歧杆菌科的其他非双歧杆菌成员相比,凝结素DSM 22924与双歧杆菌菌株似乎具有更高的系统发育相关性(图2)。 阴道芽孢杆菌ATCC 14018与双歧杆菌LMG 11597具有相同的系统发育分支。 凝集素DSM 22924位于双歧杆菌属的最深分支中,即小行星芽孢杆菌组,与放线杆菌双歧杆菌DSM 22766的基因组相关性较高,后者也从Bombus分离。 为了验证这两个双歧杆菌科的分支,构建了基于16S rRNA基因的系统树以及基于五个管家基因(包括hsp60,rpoB,dnaJ,dnaG和clpC)的树(附加文件2:图 S1)。凝结物DSM 22924与放线杆菌B. actinocoloniie的DSM 22766在两个树中共享相同的系统发生分支,阴道加氏菌ATCC 14018在这些系统发生树中的位置不同。 尽管如此,基于管家的树仍然确认了阴道双歧杆菌ATCC 14018在双歧杆菌属中的位置,而在基于16S rRNA的树中,它位于双歧杆菌和其他非双歧杆菌之间。 这些发现对Bo的正确分类学分类提出了疑问。 凝结物DSM 22924,并加强了系统生物学方法作为分类学验证工具的重要性[55]。 此外,我们调查了双歧杆菌科成员全基因组中预期编码无氧呼吸酶的基因的发生,如先前对小行星芽孢杆菌PRL2011的基因组所述[10]。 这种计算机分析表明在Bo的基因组中存在细胞色素bd氧化酶编码复合物。 凝集素DSM 22924(附加文件1:表S3),包括cydA和cydB,它们编码细胞色素的结构亚基,以及cydC和cydD,编码细胞色素装配体所需的转运蛋白。

  • 此外,在双歧杆菌科的11个基因组中鉴定了这四个基因,包括从昆虫中分离的六种菌株,即放线杆菌B. actinocoloniiforme DSM 22766,波希双歧杆菌DSM 22767,炸双歧杆菌DSM 19703,双歧杆菌公社R-52791,棒状双歧杆菌LMG 18911。 B. indicum LMG 11587,强调了细胞色素bd氧化酶复合物的存在与分离的生态位之间的相关性(附加文件1:表S3)。

  • 根据双歧杆菌科树的重建,作为这项研究的一部分,新测序的六种双歧杆菌物种中有五种位于先前确定的双歧杆菌组之一内。 有趣的是,似乎有四个菌株属于长双歧杆菌组,即,Myosotis DSM 100196,reuteri DSM 23975,eulemuris DSM 100216和Lemurum B. lemurum DSM 28807(图2)。 这一发现与这些菌株的特殊生态起源是一致的。 实际上,这四个物种中的每一个都是从猴子的粪便中分离出来的,类似于先前已被指定为长双歧杆菌组的其他两个成员,即斯氏双歧杆菌DSM 23968和双歧杆菌callitrichos DSM23973。因此,这些发现突出了 长双歧杆菌群包括从人类和其他相关灵长类动物中分离出来的双歧杆菌(亚)种(图2)。 此外,巴氏双歧杆菌DSM 100202与双歧双歧杆菌DSM 23969具有遗传相关性,而双歧双歧杆菌DSM 23969属于双歧双歧杆菌[24]。 值得注意的是,tisserieri DSM 100201被证明在双歧杆菌科树中占据独特位置。 该观察结果通过平均核苷酸同一性(ANI)分析得到了证实,该分析显示了与最相关的拟南芥(Alloscardovia criceti)DSM 17774菌株的最高值为88.02%。 值得注意的是,假设ANI值低于95%就足以将该分类单元分类为不同的物种[43]。 因此,由于其与其他双歧杆菌类​​群的遗传差异,B。tissieri DSM 100201是值得进一步研究的有趣菌株。 为了验证来自基因组前瞻性的双歧杆菌科其他10个已测序成员的物种分配(表2),将解码后的基因组与已测序的其他56个(亚)物种进行ANI比较。 10个双歧杆菌科菌株的测序基因组显示ANI值低于95%,确认了它们作为不同物种的地位,在真双歧杆菌DSM 100216和狐猴双歧杆菌DSM 28807之间观察到相对较高的值93.8%(附加文件1:表S4 )。

  • 此外,双歧杆菌科树确认了最近解码的B. commune R-52791和Aesculapii DSM 26737的基因组序列在系统发育上的相关性,它们分别位于与B. bohemicum DSM 22767和B. stellenboschense DSM 23968相同的分支中。 这些数据进一步证实了两种菌株的生态起源,即孟买属的昆虫和Callitrichidae科的猴子之间的直接相关性。

  • 双歧杆菌科的酶学分析和进化发育

  • 我们进行了功能分析,以评估在双歧杆菌科的每个(亚类)物种中都包含碳水化合物,氨基酸和脂肪酸降解途径的基因的存在。 将获得的基因数量与每种菌株的总遗传武库(即基因总数)进行归一化,非双歧杆菌菌株的回收率比双歧杆菌菌株的回收率略低,即分别为7%,11%和9%, 分别(附加文件1:表S5)。 有趣的是,双歧杆菌科的所有成员都具有双歧杆菌分流途径,包括编码D-木酮糖5-磷酸磷酸酮醇酶/ D-果糖6-磷酸磷酸酮醇酶的基因xfp,从而扩展了这种新陈代谢的概念。 双歧杆菌对整个家庭的特征。

  • 为了进一步研究由67个双歧杆菌科(sub)物种的基因组编码的碳水化合物利用能力,对糖类进行了酶分类。 这种酶的分类基于碳水化合物活性酶(CAZy)数据库[​​44],该数据库涵盖了与碳水化合物分解和利用有关的所有当前已知的遗传决定因素,并且揭示了双歧杆菌科的全基因组包括9742个预测为 编码碳水化合物活性酶,即糖基水解酶(GHs),糖基转移酶(GTs),多糖裂解酶(PLs),碳水化合物酯酶(CEs)和碳水化合物结合模块(CBMs),分别占43.4%,43.8%,0.2%5.9 %和12.6%。 回收到的大量酶反映了先前对47种双歧杆菌属菌株进行的分析结果,其中对双歧杆菌在哺乳动物肠道中的分解聚糖能力进行了广泛的审查。

  • 着眼于GH鉴定,在分析的55个双歧杆菌(亚)物种基因组中预测了3989个基因,而其余12个双歧杆菌科基因组包含573个此类基因。 双歧杆菌科基因组指定了一个庞大的GH科,其中GH13,GH3,GH43,GH23,GH32和GH25超过了其他已鉴定科(其他文件1:表S6)。 尽管与双歧杆菌科的非双歧杆菌成员(即48个)相比,给定双歧杆菌基因组的预测GH编码基因的平均数量(即72个)更高,但是GH的标准化相对于预测的总量 基因提供相似的GH指数,即分别为0.039和0.032(附加文件1:表S6)。 尽管如此,显示最高GH指数的20个菌株的基因组全部属于双歧杆菌属,并且几乎都是从人类和猴子的粪便样本中分离出来的,其中主要是链状双歧杆菌LMG 11043,eulemuris DSM 100216,B. 分别为DSM 100202和B. biavatii DSM 23969(表1)。 这些结果表明,驻留在灵长类动物/人肠道中的双歧杆菌已经经历了与碳水化合物代谢有关的相对大量的适应性事件,从而受益于这种特殊环境中存在的多种营养素的广泛来源。 相反,表现出相对较低的GH指数的双歧杆菌科物种来自多种环境,例如昆虫或其他动物的肠道以及污水(表1)。 此外,具有低GH指数的基因组与双歧杆菌科某些成员的较小基因组互补性相对应,这可能是由于被认为对人体健康有害的那些微生物的基因衰退特性所致。 inopinata和S.wiggsiae [59]。

  • 虽然在微生物基因组进化过程中发生的基因获取事件支持对新生态位的适应,但另一方面,基因丢失有助于简化基因组以节省能量和生物化合物。 预测双歧杆菌科糖组的完整含量,使我们能够估计该糖解科中编码碳水化合物活性酶的基因的获得和丢失率。 为了描述在碳水化合物代谢中具有预测功能的基因的得失事件,我们收集了BaeCOG,其中包括从全基因组分析中获得的GH编码基因。 产生的846个BaeCOG被分配到双歧杆菌科树中,这表明当前双歧杆菌(亚)物种的进化仅涉及有限的祖先基因丢失事件,但涉及大量的GH编码基因获取(图3)。 因此,似乎在双歧杆菌进化的早期就已经获得了编码GHs的基因,随后简化了GH相关基因阿森纳,这导致了或已经专门针对那些已经确定了当前双歧杆菌物种的生态位。 有趣的是,双歧双歧杆菌(B. bifidum)组的成员与其他组相比拥有最多的GH编码基因获取数量,这可能是为了扩大其对宿主中存在的不同碳源的代谢能力,类似于上面提到的有关 GH指数差异(图3和表1)。 仅考虑那些已知参与宿主聚糖降解的GH科成员的BaeCOG,即GH20,GH29,GH33,GH38,GH95,GH101,GH112,GH125和GH129 ,双歧双歧杆菌组。 ,再次显示了最高数量的GH编码基因采集(最多七个BaeCOG)。 在这种情况下,双歧双歧杆菌表现出双歧杆菌科科中最高的宿主聚糖降解BaeCOGs获取数量,从而突出了该双歧杆菌物种以宿主聚糖为食的能力。


图3
image.png
  • 根据双歧杆菌科内的预测生长激素分析进化损益事件。 该图像显示了双歧杆菌科的基于核心基因的超级树,其中每个节点报告为每个菌株鉴定的预测GH的数量。 此外,获利和损失事件由通向每个节点的边缘上的绿色和橙色条表示,而放置在超级树叶子上的数字表示表1中显示的相关双歧杆菌类​​群。

结论

  • 在解剖和鉴定双歧杆菌属不同成员的基因组含量方面已经投入了很多精力 。 相反,对双歧杆菌科其他成员的基因组学知之甚少,除了双歧杆菌属之外还包括另外八属。 在这项研究中,基因组测序使我们能够探索双歧杆菌科中已知成员(由67个(亚)种代表)的基因组含量,并仔细研究属于该科的每个分类单元之间的系统发育相关性。 与双歧杆菌科的其他成员相比,双歧杆菌的每个基因组显示出更多的基因,这也许反映了基于分离出双歧杆菌的广泛生态位的竞争优势。 这些微生物降解多种碳源的能力也反映了双歧杆菌更复杂的基因组含量[54,63]。 通过对双歧杆菌科成员全基因组的分析,这些发现在本研究中得到了进一步的验证,该分析突出显示了与碳水化合物相比,专门用于碳水化合物代谢和细胞包膜生物发生的双歧杆菌基因组中TUG的丰度更高。 对于双歧杆菌科的其他成员来说,这样的数字。 酶促基因分析表明,显示最高GH指数的20个菌株属于双歧杆菌菌株,它们几乎都是从人或猴子中分离出来的。
  • 此外,基因增/减分析表明,从这些灵长类动物中分离出的双歧杆菌属成员拥有最高数量的GH编码基因,这可能是为了扩大其代谢不同碳源的能力。 这些结果突出了与双歧杆菌属成员中碳水化合物代谢有关的相对大量的适应性事件,这些双歧杆菌属存在于消耗多种营养素的杂食性生物中。 此外,我们的系统生物学分析表明,在阴道加德纳菌和Bo的分类中可能存在分类不一致。 凝集素,它与其他双歧杆菌菌株,即枯草芽孢杆菌LMG 11597和放线芽孢杆菌DSM 22766表现出密切的亲缘关系。
缩略语
  • ANI:平均核苷酸同一性
    BaeCOG:双歧杆菌科的直系同源群
    CAZy:碳水化合物活性酶
    CBMs:碳水化合物结合模块
    CE:碳水化合物酯酶
    GF:基因科
    GH:糖基水解酶
    GIT:胃肠道
    GT:糖基转移酶
    HMM:隐马尔可夫模型
    MRS:曼罗萨沙普
    NCBI:国家生物技术信息中心
    ORF:开放阅读框
    PL:多糖裂解酶
    TUGs:真正独特的基因
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 151,829评论 1 331
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 64,603评论 1 273
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 101,846评论 0 226
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 42,600评论 0 191
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 50,780评论 3 272
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 39,695评论 1 192
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,136评论 2 293
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 29,862评论 0 182
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 33,453评论 0 229
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 29,942评论 2 233
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,347评论 1 242
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 27,790评论 2 236
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,293评论 3 221
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 25,839评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,448评论 0 181
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 34,564评论 2 249
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 34,623评论 2 249

推荐阅读更多精彩内容