Waldmann 2009贝叶斯 WinBUGS

  1. Waldmann P. Easy and flexible Bayesian inference of quantitative genetic parameters. Evolution (N. Y). 2009;63:1640–3.

贝叶斯方法在数量遗传学和进化生物学中有了巨大的进步。然而,应用这种方法的出版物相对较少,可能是因为多用途和用户友好的软件的可用性有限。这里描述了如何只有几行代码的良好开发和非常灵活的贝叶斯软件WinBUGS(Lunn等人,2000)可以用于推断通用设计的系谱中的加性多基因方差和遗传性。所呈现的代码通过应用于早期公布的苏格兰松的数据集来说明。


进化中感兴趣的大多数性状是多基因的并受遗传和环境因素的影响。数量遗传学为多基因性状的研究提供了一个完善的和强大的框架(Falconer和Mackay 1996)。数量遗传学背后的基本想法是观察具有不同程度的关系(coancestry)的个体(可能来自交配方案)的样本,并且基于关系系数估计该性状的遗传和环境方差分量。在历史上,或多或少复杂的交配设计已被用来产生个体之间的共祖差异(Lynch和Walsh 1998)。还有人建议,可以通过首先使用分子标记来重建看似无关的个体之间的共生来估计数量基因参数(Blouin 2003)。多基因性状的遗传变异通常被估计为加性遗传方差(和遗传力)。遗传力的估计是重要的,因为该参数确定了通过对群体应用自然和人工选择可以预期的响应Henderson(1976)介绍了计算一般家系的加性遗传相关矩阵的方法。这种方法通常被称为动物(或个体)模型。限制最大似然(REML)方法通常用于估计单个模型中的方差分量。众所周知,基于个体模型的统计技术在估计变异分量和预测育种值方面优于传统的基于家系的方法,因为它们使用来自谱系的所有信息,并且对选择引入的偏差较不敏感(Lynch和Walsh 1998)贝叶斯统计方法在遗传学中变得越来越流行,因为它们在高度复杂的层次统计模型分析中以概率形式总结不确定性的能力(Sorensen和Gianola 2002; Beaumont和Rannala 2004; O'Hara等人。2008)数值模拟,通常是马尔可夫链蒙特卡罗(MCMC)方法,被用来执行贝叶斯推理所需的积分吉布斯采样器是一种高效的MCMC方法,最初是由Geman和Geman(1984)开发的,用于分析Gibbs在物理场中的格子分布,后来由Gelfand和Smith(1990)引入统计学。吉布斯抽样基于从完全条件分布的抽样,并要求这些分布对于所有参数以封闭形式可用Metropolis-Hastings更新可用于完全条件分布不可用的模型(Gilks​​等人,1996).WMC等人将MCMC方法引入数量遗传学。 (1993)和Sorensen et al。 (1994)。然而,鉴于贝叶斯量化遗传学中有前途的方法发展,仍然缺乏使用这些方法的出版物。主要原因可能是缺乏用户友好的软件,研究人员可以使用而没有深入的统计知识。单变量和多变量贝叶斯吉布斯抽样算法在两个动物育种软件中实现。 MT-GSAM(VanTassell和Van Vleck 1996)和GIBBSF90(Misztal等人,2002)是可以处理大家系的强大程序。然而,这些程序需要良好的动物模型知识以及贝叶斯推理的经验。即使这两个程序都能处理一系列不同的模型,但它们缺乏通用软件包的灵活性。例如,方差分量的先验次数受到限制,并且难以执行模型比较。 Damgaard(2007)展示了如何使用多目的MCMC程序WinBUGS(Lunn等人,2000)来适应动物模型,但是该方法需要事先将数据转换为使得模型在WinBUGS中拟合更容易的格式,并且代码不必要地复杂。在这里,我展示了一种在WinBUGS中实现单个模型的替代方法。使用早期公开的来自苏格兰松的数量遗传学研究的数据来说明该方法(Waldmann等人2008)。

推荐阅读更多精彩内容