小冰负责人李笛:微软不缺钱,缺对未来的把握

作者 | 阿司匹林

小冰的诞生

2013 年 9 月,刚刚加入微软的李笛一直在不停约见微软的各个产品团队。年底的时候,微软的几个同事利用业余时间开发一款叫 Bing Knows 的网页产品,Bing Knows 做的是基于知识库的深度问答,类似于百度知道和知乎。

2013 年 12 月,李笛拉着小伙伴一起,希望将 Bing Knows 做成一个聊天机器人。彼时,李笛团队对标的还是搜狗语音助手。

“当时我们认为他的产品(搜狗语音助手)做的最好。国内的语音助手也很多,我们想要进一步去了解搜狗语音助手的时候,得到的反馈是这个团队解散了。这个时候我们就意识到,也许单纯的做Cortana的维度,我们会不会重蹈覆辙?在这个过程里面,一个最核心的问题就是,这样一个对话的人工智能,它的基础服务是什么?在互联网时代,基础服务开始是门户,后来变成了搜索引擎。换句话说互联网的服务可能千差万别,但作为最底层的一个基本是搜索引擎。”

于是,李笛给自己划定了几个选项:

 ● 第一个选项是很多人都在做的,包括Siri;

 ● 第二个就是给你一些无关痛痒的反馈,就是闲聊。

当时,李笛做的建立一个基本的服务层,这就需要获取数据回路,然而,Bing Knows并没有解决这个问题。因为大多数人在问完问题,获得答案之后就走了,也就是说,这样的“对话”往往只有一轮,根本无法获取优质的数据。

后来,李笛选择将小冰打造成一款闲聊的产品,这也是后来小冰刻意避免回答知识性问题的原因。

2014 年 1 月,这款产品的 demo 版完成,也就是小冰的雏形。

2014 年 5 月,距离产品发布只剩一周,李笛团队终于敲定了产品名称:小冰,这个名字来源于Bing 搜索引擎。自此,问答网页变机器人,Bing Knows 脱胎为小冰。

2014 年 5 月 29 日,微软小冰 BETA 版正式微信平台上开放公测。

从那以后,李笛就多了一个身份——“微软小冰之父”。不过,李笛一直很抗拒这个称号,在他看来,这是整个团队共同的成果。

最开始的时候,小冰平均单次对话轮数(CPS)还是 4 轮左右,经过这么多年,一步步提高到 11 轮,18 轮,23 轮。在李笛看来,一次 23 轮的对话,比 23 次一轮对话的数据要有价值的多。

从收集数据这一点上来看,小冰确实做得非常成功。

#进军智能音箱

在这几年的时间里,小冰积累了大量用户,并相继推出了日本版小冰、美国版小冰、印度版小冰、以及印尼版小冰。

根据微软的官方数据,截至 2017 年 4 月,小冰已拥有超过 1 亿用户,累计对话量超过 300 亿,平均单次对话轮数(CPS)达到 23,并已登陆包括微信、QQ、微博、Facebook Messenger、LINE 在内的 14 个平台,而且已经内置在中文版 Windows 10 操作系统中。

在这三年中,小冰一直在不断尝试突破自身的限制,从主持人,到歌手,到客服,到诗人,到财经评论,竭尽所能证明自己是一个与众不同的虚拟助手。

然而,包括 Siri 在内的智能手机端的语音助手,都未能让语音成为主流的交互方式之一,而小冰虽然在手机端积累了海量用户,但是绝大部分都是通过文字的形式去跟小冰交互,语音占比不到 10%。

2014 年,亚马逊的智能音箱 Echo 问世,才成功为语音助手找到了真正的落地点,并迅速成为潮流,成为众多科技公司的效仿对象。

有数据显示,在所有智能设备中,手机端的语音助手的活跃度最低,DAU 甚至小于 4%,相比之下智能音箱的 DAU 为 70%,智能手机端语音助手活跃度偏度一直是一个难以解决的问题,而以智能音箱为代表的智能音箱为语音助手带来了很好的切入口。

Canalys 的数据显示,2017 年全球智能音箱出货量突破 3000 万台,而今年预计全球出货量将达到 5630 万台。与此同时,2017 年全球智能手机出货 14.72 亿台,较上一年下滑 100 万台,中国市场去年也第一次全年下滑。可以预见,以智能音箱为代表的物联网将迎来爆发的势态,而语音流量的入口之争大局已初定。

2017 年,国内的百度、阿里、小米等纷纷推出搭载自家语音助手的智能音箱,抢占语音流量入口,而老牌选手小冰却姗姗来迟,直到 2018 年初,才与小米生态链企业 Yeelight 合作,在智能音箱上落地。

为什么会和 Yeelight 合作,而且还是双语音助手(用户可以在设置界面自行选择“小爱”或者“小冰·”)的形式呢?

对此,李笛表示,“小米和我们都很开放,包括我们也接受双 AI,小米也接受像我们这样的 AI 设备,我认为今天整个行业最核心的问题是大家还没有找到一个真正的解决方案到底这个 AI 是什么,这也是为什么我们跟小米、米家、小米生态链和 Yeelight 进行合作的原因。”

不过,此次微软小冰和 Yeelight 合作是不收取任何费用的,而根据李笛的说法,这主要是出于两方面原因的考量:

第一,在一些新的领域,我们认为现在是积累真知的阶段,我们不知道这个东西到底应该怎么做才是对的。

第二,小冰是一个全球的项目,我们更倾向于把商业测试放在日本、美国等地方,这样可以规避掉很多问题。

此外,未来小冰还会作为车载语音助手出现,并且已经路测了一段时间了,至于什么时候正式搭载在量产车上,目前还没有正式的时间表。

迟到者如何破局

虽然小冰是算是智能家居领域的“迟到者”,但是这个“迟到者”却有着自己的优势,毕竟小冰一开始走的就不是 Siri 等传统的任务型语音助手的路线,而是主打闲聊、连续对话以及内容创造。

因此,在与智能音箱结合的时候,小冰团队也希望能做出一些新的尝试,于是就有了全双工技术的诞生。也就是说,用户只需要一次唤醒,就可以进行连续对话。(详见《与小冰同居的日子》

据介绍,小冰的全双工技术是一年半之前跟有信合作的成果,其中基于串流的预测的部分,全球范围内目前为止是第一个。根据李笛的说法,直到今天,国内外都还没有第二家厂商研发出类似的技术。

此外,小冰的全双工技术并不容易被复制。首先,语音的自然度评分非常重要,语音 SR 和 TTS 都要达到比较高的质量,尤其是 TTS 需要非常自然;其次,需要有足够多的数据来训练足够好的预测模型。最后,必须具备小冰这种聊天的基本能力。

在体验过后,我们发现,习惯连续对话之后就再也回不去了。据说,Yeelight发了才几天,但是我们现在看到说有一个用户跟小冰连续说了四个多小时,差不多1600多轮。

是的,不管是连续对话,还是俏皮的回答,小冰都比其他语音助手更像一个人。

绕不开的 Alexa

不可否认,市场上最受关注的依然是亚马逊的 Alexa,以及围绕 Alexa 打造的生态系统 Alexa Skills。据外媒报导,目前 Alexa 支持的技能已经超过 2 万种,并且仍在大力投入,构建开发者社区。

目前,市场上的许多语音助手都在学习和借鉴 Alexa 的模式,但是这种模式真的是未来吗?

李笛表示,像这些东西一定是未来,但不是这种形式,现在探索,我觉得为时尚早。在他看来,目前的 IoT 还没有达到这样一个系统所需要的市场,而且这种类似于 App Store 的模式在图形交互时代或许管用,但是在语音交互时代却存在诸多问题。

但是根据编者的了解,小冰团队也在积极为小冰打造更多的技能。

不过,在小冰向 Alexa 学习的同时,Alexa 其实也一直在努力走上小冰的路线,毕竟任务型的对话有很大的局限性。

根据微软的数据,任务型的对话只占总对话量的 20%,也就是说 80% 其实都是在闲聊。

为此,2017 年亚马逊举办了一场为期数月的竞赛,赛题是“建立一个社交机器人,这台机器人要能够与人类进行交流,并对热门话题持续讨论 20 分钟”。最终的获胜者可以领取 100 万美元的奖金。

在李笛看来,这个其实是小冰从第一天做起来的时候就擅长和专注的东西,一个以 EQ 为基础的通用型对话。显然,在这一领域,小冰靠着多年的积累已经有了很深厚的优势。

至于战略方面,李笛表示,“微软内部的战略叫做无处不在,我们认为我们是做 AI 的,所以我们提供的不是一个硬件设备的语音助手,不是提供一个功能或卖点,而是利用这个硬件设备实现我们的新触角。”

一路走来

在外人看来,背靠微软这座大山,小冰能有今天的成绩并没有什么了不起。但是在四年前,只有小冰选择了一条与 Siri 不一样的路,而且这一路上也遭遇了诸多险阻。

让李笛记忆犹新的是,2014 年 6 月 1 日,他在赶往公司的路上接到电话,得知小冰被微信封杀了。从上线到被封杀,小冰在微信上仅仅存活了 60 个小时。直到一年多之后,已经升级到第三代的小冰,才得以重返微信。

不过李笛也很庆幸,他正好赶上微软变革的一个好时间:

“早五年,我觉得我们也做不了;晚五年,我们做的时候 AI 还没有像今天这样(火热)。我们恰好有对话系统的先发优势,微软大量的技术储备、团队、人员、经验在这儿。”

可谓是天时地利人和。周鸿祎在自传中说过,中国互联网赶上了好时机,早不得也晚不得。小冰亦是如此。

至于为什么微软内部会在已经有小娜的情况下,还让小冰发展了四年,并予以了高度重视,估计就像李笛说的那样,“微软不缺钱,缺对未来的把握。”

推荐阅读更多精彩内容