本文描述了一个新的推断智能体动机的方法。该方法基于影响图,这是一种图模型的类型,包含特别的决策和效用节点。图标准可以被用来确智能体观测动机和智能...
Programmable Agents Misha Denil, Sergio Gómez Colmenarejo, Serkan Cabi, ...
对抗健壮性的研究非常具有挑战性。在众多研究方向中,存在一些相应的进展。本篇论文是一个较清楚的整理,有助于大家更好地理解对抗网络的工作机制。 On...
分布算法目前是强化学习的有趣的发现。以此为基础可以构造更具严格理论支持的强化学习算法。本系列给出最近 Google Brain 团队的工作,首次...
Transformer 架构目前是一个非常重要的发现。以此为基础可以构造更加强大的自然语言神经网络模型,也可以用于其他的一些领域。本系列给出最近...
来自 DeepMind 的两篇重要论文,关于免模型规划和一般化的贡献分配研究。值得大家研读。感兴趣的小伙伴 可以私信我。我们将在近期分享解析。 ...
Jan Leike, Jessica Taylor, Benya Fallenstein Abstract A Bayesian agent a...
Benja Fallenstein and Jessica Taylor, Paul F. Christiano Abstract Classi...
https://www.vox.com/future-perfect/2018/11/19/18097663/nick-bostrom-vuln...
文集作者