Tanaka2017 GS的贝叶斯优化

Tanaka, R., and Iwata, H. 2017. Bayesian optimization for genomic selection: a method for discovering the best genotype among a large number of candidates. Theor. Appl. Genet. (123456789): 1–13. Springer Berlin Heidelberg. doi:10.1007/s00122-017-2988-z.

摘要

提出了一种基于优化算法的新的预育策略,并通过模拟进行了评估。这种策略可以找到更好的基因型与较少的表型分型努力。摘要:基因组预测是一种很有前途的方法,用于在基因库中保存的大量种质资源中搜索优良的基因型。当一些种质进行表型和基因分型时,可以建立预测模型,并且可以从其标记基因型预测剩余种质的基因型值。在这项研究中,我们着重于基因组预测在预培育中的应用,并提出了一种新的策略,可以降低发现更好种质所需的表型分型的成本。将基因组预测优越基因型作为优化问题,引入贝叶斯优化方法进行求解。贝叶斯优化,根据预期的改善(EI)作为选择标准,抽样未观察到的投入,似乎是有利于prebreeding。 EI取决于基因型值的预测分布,而通常的选择仅取决于点估计。我们模拟了候选基因型中最佳基因型的搜索,并且显示基于EI的策略比通常的和随机选择策略需要更少的基因型来鉴定最佳基因型。因此,贝叶斯优化对于将基因组预测应用于预培育可能是有用的,并且会减少大量候选人中找到最佳加入所需的表型加入的数量。


介绍

为了在2050年之前为90多亿人口提供粮食,我们需要通过新的育种技术和利用种质资源中的遗传多样性来加速作物遗传改良(Tester和Langridge,2010)。由于精英繁殖种群和商业栽培种在其长期的驯化和选择历史中失去了遗传多样性,所以野生,外来或本地种质的丰富变异的进化对于促进植物育种是至关重要的(Tanksley and McCouch 1997; Jordan et al。 McCouch等,2013)。为了收集,保存,保存和分发代表作物品种遗传多样性的种子(如Sachs,2009),已做出了大量的国内和国际努力。
鉴定特定育种目标的最佳种质是耗费时间和劳力的,因为它要求在植物基因库中保存大量种质的表型。为了便于筛选,已经在各种作物物种中开发了核心种质(少量代表性种质的部分集合; Brown 1989)。然而,核心收集战略可能会限制核心收集品之外的加入者的使用。例如,核心集合中可能缺少有价值的稀有等位基因。已经提出了替代的策略,例如种质策略的重点鉴定(例如,Khazaei等,2013),但缺点是图依赖于与目标性状有关的农业生态信息,并且不能使用遗传信息
基因组选择(GS; Meuwissen et al.2001)依靠基因组预测来发现种质资源中的优质种质。与表型分型相比,标记基因分型即使在标记数量较多的情况下也能实现高通量且更具成本效益。可以基于训练数据(表型和全基因组标记数据对)建立基因组预测模型,并基于其全基因组标记基因型预测没有表型数据的基因型的基因型值。基因组预测可用于鉴定种质资源中的优质材料,并将其应用于预育,目的是鉴定大量材料中的高潜力基因型(Pace等,2015; Chang等,2016; Gorjanc等,2016 ; Yu等,2016)。
全局优化是一个数学问题,用于在输入空间中查找使函数最大化的输入值,而预先培育的目的是在候选基因型中找到最好(或更好)的基因型。为了有效实现全球最优化,我们需要平衡两个相互冲突的目标:探索和利用。通常,我们只是利用我们的预测模型来找到最好的基因型;选择具有较高预测基因型值的基因型。由于我们的预测模型并不总是正确的,所以这种纯粹的利用策略可能会发现与训练数据集密切相关的更好的基因型(局部最优),而不是所有候选基因型(全局最优)中的最佳基因型。为避免陷入局部最优,需要对输入空间进行广泛的探索,以确保选定的基因型和训练数据集的遗传多样性。探索-利用折衷是全球优化中的一个众所周知的问题,并且已经开发了几种算法来解决这个问题,包括贝叶斯优化(Mockus 1994; Jones等人1998; Shahriari等人2016),但是它从未适用于前期育种的情况。
在这项研究中,我们介绍贝叶斯优化在与基因组预测育种的背景下,并提出了一种新的有效的策略,以发现集合中最好的基因型,同时尽量减少表型筛选步骤的数量。我们的新策略使用一个新的标准选择未经测试的基因型。我们的策略和通常的GS之间的差异在于选择取决于预测的分布或预测的基因型值的点估计。我们的策略建议选择不仅具有高预测值而且具有高后验方差(换言之,预测的“不确定性”)的基因型,而通常的GS选择仅具有高预测值的基因型。通过考虑预测的不确定性,勘探开发权衡将是平衡的。在GS中,与训练群体相关的基因型在预测中往往具有很大的不确定性。因此,不确定基因型的选择导致对遗传空间的广泛搜索。因此,我们的策略平衡了探索(通过基于“不确定性”搜索基因型进行的基因空间的广泛搜索)和开发(根据预测选择更好的基因型),而通常的GS是纯粹的开发。我们通过模拟来评估我们的策略的潜力,假设最好的基因型在基因型中具有最高的基因型值。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,458评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,454评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,171评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,062评论 0 207
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,440评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,661评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,906评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,609评论 0 200
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,379评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,600评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,085评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,409评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,072评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,088评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,860评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,704评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,608评论 2 270

推荐阅读更多精彩内容