GPT-2,吓坏创造者的「深度造假写手」

96
极小光 Db3aaf4f effd 43dc 9137 d6bf7f70211e
0.5 2019.05.15 10:06 字数 1012

简评: 今年二月份刷屏的 GPT-2 着实厉害,那个生成续写故事的例子更是效果好到吓人一跳,它到底有多厉害,本文略微讲讲。更详细的信息可参考文末 OpenAI 的博客链接。

你能从下面这两段文字里品味出什么区别?

「四月间,天气寒冷晴朗,钟敲了十三下。」
「我坐在小汽车里,前往西雅图开始一份新工作。给车加油,插入钥匙,让它自己开。我沉入冥思,想象这会是怎样的一天。」

第一段文字,是英国著名作家乔治·奥维尔(George Orwell)的传世经典,政治荒诞讽刺小说《1984》开篇第一句话。

第二段文字,则是将第一段文字输入 GPT-2 程序后,这个 AI 系统的自动续写。

仅仅输入这么简单的一句话,GPT-2 显然就精确的抓住了乔治·奥维尔《1984》的荒诞、压抑、恐惧和反乌托邦的笔调,洋洋洒洒的续写起来:

一百年后,2045 年, 我在中国一个贫穷农村地区的一所中学教书。我先开始教的是中国历史和中国科技史......

英国著名作家乔治·奥维尔(George Orwell)

▎「深度造假」

GPT-2 人工智能文字编写程序可以写小说、新闻、发言稿,还可以发短信推文。

程序开发者给它起了个绰号 —— 深度造假文字(deepfakes for text),精确地概括了它的功能。简而言之,GPT-2 就是一个文字发生器。你可以文字输入这个 AI 系统,只言片语或者大段文字都行,之后程序会根据自己的判断,决定接下来应该如何写作。

它产生的文字,从质量到数量到适应范围,都远远超出了设计者的预期。

它的「造假能力」如此令人信服,以至于其所属公司 Open AI 做出了一个不同寻常的决定:暂不公开 GPT-2 的技术信息,以免该技术被恶意使用。

▎以假乱真

与其它类似功能的程序相比,GPT-2 几乎不露马脚,比如写着写着忘了在写什么,或夹杂一些莫名其妙的词汇等。

英国《卫报》记者把英国脱欧的一些标题词汇输入 GPT-2,它写出了这样的一段「新闻稿」:

当被要求对有关报道做出澄清时,梅首相的发言人说:“首相已经明确表明,她要做的是尽快完成脱欧,这在上周的女王年度施政讲话中有明确授权。”

OpenAI 的研究负责人阿莫迪(Dario Amodei)对《卫报》说,GPT-2 从两个方面具有革命性的突破 —— 一是它的数据储藏能力巨大,是现有最前沿的 AI 文字发生器数据储量的 12 倍。这使得它能更好地理解掌握写作文风,笔法和意图。这也导致了它的第二个突破,即它的写作质量和应用的广泛性。

而也正是它生产出的文字达到了真假难辨的程度,也促使 OpenAI 公司决定暂时不公开 GPT-2 的技术。他们下一步将测试使用 GPT-2 可能出现的任何结果,以及如何防止恶意使用。

公司表示,使用 AI 技术的道德原则是一个全新的领域,他们还在探索之中。


博客链接:Better Language Models and Their Implications
推荐阅读:数字游戏:艺术家如何用大数据展现艺术

极光日报
极光日报
54.6万字 · 49.2万阅读 · 1203人关注
每日为 Makers 导读 1-3 篇优质英文文章。 内容涉及:硅谷、科技、编程、设计、人工智能等相关领域。
Web note ad 1