BBC新闻实验室新闻机器人研究进展

[人工智能]

本文编译自:BBCnewslabs

一些新闻机构正在投入大量的自动化写作,而另一些新闻机构正在通过自动化的消息类用户界面传递内容。Facebook,Slack和Telegram打开了强大的API来构建各种新的交付方式,而BBC新闻实验室已经与三个平台Facebook,Twitter和Telegram合作,通过API接口方式分发其机器人服务和新闻内容。

BBC Messenger 新闻机器人

BBC Mundo与Facebook Messenger合作旅程的第一站是Lei He's Facebook 机器人,利用Facebook发布的Messenger API,机器人通过自动化消息与用户进行沟通。西班牙语是世界上最广泛使用的语言之一,所以BBC Mundo及其充满热情的社交媒体团队成为机器人实验的起点,而Facebook Messenger来自世界上最大的社交媒体平台之一,我们都认为这样的合作是一个巨大的新机会。

我们发现Messenger将通过新发布的API来启用机器人,我们开始思考是否可以使用这个功能来接触更广泛的用户,他们可能不会来到BBC的网站,或者想要在Messenger平台里找寻更方便的新闻获取方式。

该机器人允许用户阅读并订阅Messenger应用程序中的BBC Mundo热门事件,并获得自动回复,订阅者将获得每日两次更新。除了自动化的消息之外,它还允许BBC Mundo编辑人员向订阅者手动推送突发新闻。

虽然我们一直在尝试使用文字到语音技术和人工智能服务,但我们的Mundo bot具有非常基本的功能。用户可以看到四个命令:

1. 订阅。这使得机器人允许每天通过新闻头条发送通知。

2. 获取故事。当用户请求新闻时,他们会收到到BBC Mundo顶级故事链接的转盘。他们可以选择与Messenger中的朋友分享故事,或阅读BBC网站上的全文。他们还可以向机器人询问更多的故事,这些故事会自动生成一批新的链接。

3. 得到帮助。即使我们试图保持简单,我们希望为用户提供指示,以防他们感到失落。当用户键入“Ayuda”时,会显示四个命令选项的说明,以及可用于访问Mundo团队成员的电子邮件地址。

4. 取消订阅。此命令停止从机器人的推送通知。

我们决定保持机器人简单因为我们意识到从活动和快速原型会话,用户并不总是知道如何与由AI驱动的“智能机器人”进行交互。其他的新闻机构为他们的实验机器人创建了独立的项目页面,而我们的则有260万的关注者,当他们向我们的Mundo Facebook页面发送消息时,他们会直接与之互动。此外,我们还担心黑盒算法和有偏见的分发平台,因此我们想给用户提供清晰、简单的命令来控制他们接收到的新闻。

我们与Dario Ramalho,BBC news的UX设计师以及爱德华·怀特,设计了最好的机器人体验,并为交互设定了正确的基调。以下是我们关注用户体验的一些方法:

1. 机器人的问候消息清楚地说明了机器人的功能,使我们的用户知道预期。

2. 我们通过名称来对用户进行个性化处理。

3. 我们考虑到可能的打字错误。例如,用户仍然会收到新闻报道的总结,无论他们是否输入“noticias”或“noticisa”。

4. 我们多样化通知消息,因此用户每天都不会收到完全相同的措辞。我们希望这样使互动更自然和更有吸引力。

工作原理:

用户在他们的移动/ Web端Messenger应用程序上发送消息,该消息通过Facebook的内部API路由到我们的机器人服务以进行响应。我们的机器人服务将响应发送给提供给我们的特殊回叫网址。

工作原理

下一步计划:

1. 我们想使用机器学习技术,并使用Wit.ai 机器人引擎(一种将自然语言转换为可操作数据的API)训练我们的机器人。通过实现这一点,我们希望能够与用户建立更个性化的信息,更好更有效的沟通。

2. 假设人们会问我们的机器人关于某个话题的消息。我们想利用BBC新闻已经具备的主题标签系统来提取关于某个主题的最新或最热的文章 - 例如,如果有人说“告诉我关于戴维·卡梅隆”,我们可以拉起最近有一篇关于他的文章。

3. 如果BBC Mundo Messenger机器人被证明是成功的话,我们可能会将机器人扩展到其他BBC World Service语言。

我们计划与世界服务团队合作,引入更多的度量标准,比如哪些文章是最受关注的,以及用户在与机器人交互时阅读了多少文章。我们希望这能教会我们更多关于观众行为和偏好的信息,然后我们就可以应用到机器人的未来工作中去。

现在,我们高兴地看到,我们的新闻机器人可以利用最常用的消息传递平台之一(总共10亿个用户,每月大约11%的世界人口使用)和最大数量的对话者交流,它直接解决了世界服务的目标,那就是扩大覆盖面和获取新闻。

我们面临的挑战是让机器人的个性化,并以正确的语气构建信息,使他们感到自然和人性化。


Twitter

我们加入了欧盟的公民投票工作,以开发人员的一套工具为基础提供了投票成果的交付服务,是视觉新闻团队的Paul Sargeant和新闻实验室的Jacqui Maher之间的一次精彩合作。

公民投票结果的晚上,由结果数据馈送触发的每个局部区域的动画图像被生成并显示在电视上,生成这些动画的服务器也被设置为拍摄每个动画的静止图像并将其保存到共享文件夹。除了其他相关工作,新闻实验室还参与了另一个方面:视觉新闻团队致力于在@BBCRe投票twitter帐户里分享每个图像并附带一个简短的摘要。手动执行这样做会耗费时间,很明显需要尝试一些自动化。新闻实验室响应编辑的需求,编写了能够处理每个图像,并为每个结果自动构建摘要的机器人。

机器人在推文中

面临的挑战:

任何生成句子的代码,特别是对于这样一个非常重要的投票,都可能出现错误,所以我们尽力避免误导社交媒体。在尝试构建推文之前,除了存在于“tweetable”目录中,计数区域的图像状态已被验证为“处理”。但不仅这样,在此基础上我们还需检查:

1. 通过GSSID查找数据库中计数区的名称长度正确,短期,中期或长期的变化应该都提前存在。如果在数据库中找不到名称,那么只需简单地将其从映像文件名中解析出来。

2. 该地区的结果值是空白的,换句话说,这是该地点首次报告的结果 。如果没有,并且传入的结果已经改变 - 例如从LEAVE到REMAIN,则会发出几个警报。该地区的状态将被设置为“翻转”,其先前报告的结果存储为“past_result”,传入的结果取代了较早的结果,最重要的是,任何内容都不会被推送。这种情况是不太可能的,需要可以合理整理并做出决定的人进行人为干预。

3. 如果传入的结果与以前报告的结果相同 - 例如,它是REMAIN,仍然是REMAIN,我们会将该地区的状态更新为“更新”,因为这种情况通常意味着我们的一个来源发出更准确的数据。为了问责的缘故,我们将之前的结果和结果存储起来就像“翻转”的情景一样,以便非常清楚,这不是一个领域的第一个结果报告。最后,如果这确实是第一个结果报告,我们将其状态设置为“新”


Telegram

无论是政府还是其他方式,我们如何在BBC被审查或阻止的地方接触受众?我们注意到Telegram是乌兹别克斯坦最受欢迎的消息应用程序,但这里BBC被阻止。当Telegram发布其Bot API时,我们意识到就在这个平台上有机会以自动方式分发我们的报道。

该项目有两个主要组成部分:一是机器人本身,通过API与Telegram集成,处理来自平台用户的消息,创建一个能够响应基本静态文本回复命令的Telegram机器人需要编写相当数量的代码。因此,我们构建了一个友好的基于Web的管理,我们的编辑器可以使用一系列自定义命令和功能来配置机器人。每个机器人都与我们的一项语言服务相关联,而这些服务又有一系列的RSS提要,主要是围绕着各个部分和主题进行的。

我们的Web管理员支持多种类型的命令。订阅:向注册用户发送每日文章摘要;取消订阅:允许用户管理收到的摘要;按需新闻:立即发送最新文章;简单的文本:向用户发送消息,实时更改。

面临的挑战:

安全;易于配置 - 例如,提出了诸如“命令类型”之类的东西来封装“订阅”请求中涉及的所有内容;强大的,快速的幕后机器人服务,可实时获取配置更改;可扩展性和可靠性;针对移动目标开发(电报API随内部供给更改而变化);集成到BBC生产流水线,特别是部署平台,流程和工具;该项目还推动了新闻实验室从粗糙的原型转变为生产就绪应用程序的专业知识,将其集成到BBC部署工具和流程中。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,015评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,262评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,727评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,986评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,363评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,610评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,871评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,582评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,297评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,551评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,053评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,385评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,035评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,079评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,841评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,648评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,550评论 2 270

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 170,568评论 25 707
  • [设计思维] [人工智能] 封面用研原创文章:王蒋艳 附:《Cheat Sheet: All Facebook M...
    CoverUER阅读 6,877评论 0 5
  • 这条路 是这么近 又是那么遥远 我走了一些日子 又停留了一些日子 然后,再过了些日子 也不知道是何时 我竟迷失了方...
    董言阅读 369评论 0 7
  • 有时候越是美好的回忆,越不敢去回忆, 因为深知已是过去,再去怀念,越是想念,越是遗憾;直到有一天相似的情景出现,仿...
    空凭祭阅读 245评论 0 2
  • 前儿星期六无事,和玉一起看了星爷的《美人鱼》,全程没有特别大的笑点,平平无奇。 同时看了『飓风营救3』,这种惊险刺...
    浅蓝啦啦啦阅读 184评论 0 0