人工智能安全性的一些具体问题探讨 Concrete Problems in AI Safety

Dario Amodei Google Brain
Chris Olah Google Brain
Jacob Steinhardt Stanford University
Paul Christiano UC Berkeley
John Schulman OpenAI
Dan Mané Google Brain

机器学习和人工智能领域的快速发展由于其可能对社会带来的潜在影响越来越被人们关注. 本文,我们讨论了一个潜在的影响:机器学习系统中的事故问题,我们将其定义为可能会在设计不良的真实世界人工智能系统中出现的不可预知且具有危害的行为. 我们给出了五个实际的研究问题,这些相关的问题包括事故风险,根据问题来源分成了三类:错误的目标函数();过于频繁的评价代价过高的目标函数;或者在学习过程中不可预知行为. 我们对这些领域中的已有工作和与前沿人工智能系统相关的建设性研究方向进行了回顾. 最后,我们考虑了如何高效地思考未来人工智能应用的安全性的高层问题.

引言

过去几年中,我们看到了机器学习和人工智能领域的一些长期存在的困难问题的解决上快速发展,遍及计算机视觉、玩视频游戏、自动驾驶及围棋等各种各样的领域. 这些进展令人们对人工智能在医疗、科学、运输等领域的变革的正面影响倍感兴奋的同时,也带来了对于这些自动系统在隐私、安全性、公平、经济、军事等方面潜在影响的思考,另外更是对强大的人工智能的长期影响产生了深思.

我们相信人工智能技术很可能是完全有利于人类,但同样相信严肃地思考潜在挑战和风险非常值得. 我们还对隐私、安全性、公平、经济和政策方面的工作相当支持,但在本文中我们讨论另一类问题,这类问题同样与人工智能对社会影响有关,即机器学习系统中事故问题. 我们将事故定义为由于指定了错误的目标函数不注意学习的过程或者引入了其他机器学习相关的实现错误而导致的在机器学习系统中不可预估的危害行为.

在机器学习社群中已经有大量不同领域的文献讨论了和事故(包含健壮性、风险敏感性和安全探索)问题;我们在下面进行回顾.

然而,当机器学习系统被部署在规模不断扩展的自治、开放场景时,非常值得去对这些方法的扩展性进行反思及理解降低现代机器学习系统中事故风险过程中存在什么样的挑战. 总之,我们相信存在很多具体的开放的与机器学习系统的事故问题相联系的技术问题.

现有大量公众对这些事故的讨论. 大部分讨论聚焦于极端情况,比如在超智能体中错误指定的目标函数. 然而,我们的观点是,其实不需要采用这些极端的场景来有效地讨论事故,实际上按照极端的思维方式会将我们引入到一个不必要的缺少准确性的推测性讨论的境地,比如在一些评论中提到的[37,83]. 我们相信通常最有效的方式是采用现代机器学习技术构建一个由实际的问题构成的框架. 随着人工智能能力提升以及AI系统在社会作用上的日益增强,我们期望在本文中讨论的根本挑战会不断重要起来. 人工智能和机器学习社区越来越成功地参与和理解这些根本的技术挑战,最终我们越能够成功地开发出更加有用、有意义和重要的人工智能系统.

本文的目标就是要聚焦于一些具体的当前就可进行试验的也和前沿人工智能系统相关的安全性问题,同样对与这些问题相关的已有的文献进行了回顾. 在第二节,我们使用机器学习经典方法(诸如监督分类和强化学习)来对事故风险减轻(这在公众讨论中常被成为“人工智能安全”)进行了建模.

我们解释了为何我们认为在机器学习领域中当前发展方向,比如深度强化学习和在更广的环境中的行动的智能体,能够给出越来越相关的对事故的研究. 在第 3-7 节,我们探究了五个具体的人工智能安全性问题. 每节都有相应的对相关实验的描述. 第 8 节讨论了一些相关的尝试,第 9 节总结.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 157,012评论 4 359
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,589评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 106,819评论 0 237
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,652评论 0 202
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 51,954评论 3 285
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,381评论 1 210
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,687评论 2 310
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,404评论 0 194
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,082评论 1 238
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,355评论 2 241
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,880评论 1 255
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,249评论 2 250
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,864评论 3 232
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,007评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,760评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,394评论 2 269
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,281评论 2 259

推荐阅读更多精彩内容