[自译]设计语音体验

原文作者：Lyndon Cerejo

基于语音的界面变得更加的普遍了。Siri和Cortana等语音助手已经存在了好些年，但是在过去的几个季节中，Amazon和Google的语音驱动设备已经走进了百万的家庭。

VoiceLabs最近的分析显示，今年有2450万语音设备使用，是去年的四倍，作为体验设计师，我们现在有机会去设计语言体验和界面了！

一个新的界面并不是意味着我们完全不顾及以往成功的界面。我们需要为语音界面的细微差别作出努力，包括对话交互和无屏交互。我们会看典型用户是如何操作的，讨论在语音体验所涉及到的每个步骤。并通过为Alexa设计一款语音app来列举这些步骤（Amazon叫它Skill）。

理解语音界面

就像是移动app运行在OS和设备上，三个层级必须一同工作才可以支撑语音交互：

三个层级支持交互

语音app（ Amazon Skills 和 Actions for Google ）

人工智能平台（ Amazon Alexa, Google Assistant, Apple Siri, Microsoft Cortana ）

设备（ Echo, Home, smartphones, computers ）

每一层都需要关联到下一层，并且去支持上一层级。语音界面位于上面两层，这两层都在云端，而不在设备上。

让我们看看下面的例子，了解这些层是如何工作的，使用Alexa Jeopardy!Skill作为例子。

可用语音交互层

语音驱动设备都在持续地倾听，像是Amazon Echo 和 Google Home，都在等待唤起（“Alexa...”和"OK,Google...”）去执行动作。一旦被激活，设备会将收集到的音频发送到云上的AI平台（“玩Jeopardy吧～”）。平台使用自动语音识别(ASR)和自然语言理解(NLU)来分析用户的意图（开始玩游戏）然后将它发送给app（Jeopardy!J6 Skill 在Alexa上）。然后app处理请求然后通过文本作出响应（如果可以，也能进行可视化优化）。平台将文本转化为语音，然后在设备上运行（“欢迎来到Jeopardy J6，这里是今天的…”）所有的这些都在几秒钟内完成。

建立语音体验

去年，Mark Zuckerberg进行了个人挑战，在他的家里建立简单的AI。他做到了，把它叫做Jarvis，并给了它Morgan Freeman的声音。

Mark Zuckerberg给Morgan Freeman介绍使用了他声音的AI

我们其他的人可能没有资源去做同样的事情，但是可以在已经建立的复杂AI平台来上建立语音app。这让我们只需要关心语音app的设计和开发。这也是一个简化的开发过程。Amazon 和 Google 提供了开放的模板，代码，和详细的构建不同语音app的命令。甚至是非开发人员也可以在一个小时里开放出一款app。

他们简化程序开发方面的投入正在取得回报。每个月都会有数以千计新的语音app诞生。语音app的增长让人们回想到了上世纪90年代的网络热潮，以及随着app store的推出，移动应用的爆发式增长。

按类别划分的Alexa Skills，2017年5月

在这个拥挤的语音市场，优秀的设计将会让你的语音app和其他数百款类似的app中脱颖而出。

设计语言体验

在开始研发之前，需要有5个步骤来设计优秀的语言使用体验。虽然直接投入到研发中很直接，但是花费在设计上的时间是值得的。

设计语音体验的步骤

我们将会讨论并应用去设计语音app，这也会是使用Skill templates for Alexa开发的简单应用。

1.发现

通过问题来开始设计，“这款语音app会给用户带来什么价值？”这个问题应用不论你是否正在开发独立的语音app或你的语音app只是用户的一个接触点。仔细想想为什么人们使用语音app。人们使用语音界面，因为有解放双手的交互，交互的速度和易用性，主要的使用场景可能是在家里，车里，这在2016年的Mary Meeker的互联网趋势报告中有体现（http://www.kpcb.com/blog/2016-internet-trends-report）。

使用语音界面的理由（来源：KPCB）

去发现主要用户需求的关键是，通过语音app比手机和电脑更加便宜，一些例子，像是银行提供账户信息，和在附近打算找电影看看。

如果你的竞争者已经有了语音app，请仔细思考他们在做什么，去看他们的更新，已经在应用市场中的评价。（例如Amazon’s Alexa Skill Store）。目的不是盲目的模仿，而是要了解已经设置的功能项，和对用户的期望。

（写这篇文章的时候，有超过1500“知识和琐事”的Alexa Skills,这成为了Amazon上最拥挤的技能类别，然而在用户体验方面，并没有简单的小技巧。为了演示语音设计的过程，我们创建了UX设计技能，让我们的读者能过测试他们的知识或学一些新的东西）。

2.定义

在这个步骤上，我们会定义它将有的功能和个性。

个性

在设计语音界面时，我们无法接触足够的视觉元素，像是web或者mobile上的那样个性。这个个性必须通过语言的交流，声音和音调来表达。不同于Mark Zuckerberg，听到的是Morgan Freeman的声音，我们听到的是设备默认的声音。这使得语气和措辞在传达我们想要的个性方面至关重要。

好消息是这一块领域的基础已经完成的差不多了，会记录在一个公司的品牌指南，或者网站风格指南中，在你的语言app中使用这些指导原则，在不同的渠道和接触点上保持一致的个性。

Virgin America的品牌个性（图片来源：http://vxbrandguidelines.com）

如果你有让Alexa唱过歌，或尝试复活节彩蛋，那么你就会了解她的个性。出于好奇，我接触了负责她个性的团队，这是他们所说的：

“在设计Alexa的声音时，我们希望她有个性去反应出Amazon的价值观，我们希望她乐于帮助，谦虚，而且聪明，同时还十分有趣。这是一个持续的过程，我们预计Alexa的声音会随着开放人员的增多，进化得更加聪明。”

这种个性也可以反映在app的名称，图标，和显示给用户的描述中。所以在发布你的app时，确保它能过吸引用户。

对于我们的用户体验技巧，我们可以采取直接或者有趣的方式，这会反应在我们的问答措辞中。一个正常音调的例子是：

哪个UX设计原则更倾向简单而不是复杂性？

奥卡姆剃刀

西科斯定律

Aesthetic-usability效应

Satisficing

一个有趣音调的例子是：

显然，有有一个UX设计原则更偏向简单，而不是复杂，你能够猜出它叫什么吗？

奥卡姆剃刀：最好的用户体验。

西科斯定律：听起来像是一个门外汉会想出来的。

Aesthetic-usability效应：这是一个花哨的UX行话。

Satisficing：嗯..我向滚石乐队道歉。

是的，让我们保持正常。

功能

你应该仔细想想哪些功能，你的语言app对用户而言是有价值的。从第一步审视你的工作，确立核心功能和提高业务能力。有时候，提供的核心功能显而易见，比如银行提供关于余额，交易和到期日期的信息。其提供相关功能表单的价值，例如Tide的引导语音app，或Glad的语音app，其中一个可以帮助用户记住存储他们的剩菜，另一个运行用户检查哪些应该回收。

如果你将相似的体验从web迁移到了mobile。这可以作为服务的起点。对语音功能而言，考虑哪种功能可以让你的用户受益。在一个语音驱动的设备上去塑造。如果技能有安全或者隐私的影响。可以考虑添加一个级别的保护。（Capital One Alexa Skill允许用户创建个人账号访问），虽然你可能会得到一个在语音上的功能列表，但从1～5个核心功能开始，并使用语音分析进行跟进和改版。

用户体验设计技能的核心可能是：

根据需求提供用户体验的设计原则；

测试用户的随机性原则；

测试用户在多个体验下的原则；记录分数。

与多名用户进行UX测试。

因为我们正在建立UX设计技能，使用Amazon的技能模版，我们的选择目前仅限于第一（当前技能模板）或第三（琐事技能模版）选项。假如我们的研究表明，我们的用户会觉得进行测试比听听原则更有价值，我们的核心功能会继续测试原则并记录分数。

3.详细对话流程

既然你已经列出了语音app的功能，那么可以开始关注app与用户之间的详细对话流程。人们的对话是复杂的，它会有许多的转折，人们经常从一个话题跳到另一个话题。语音AI平台还有很长的一段路要走，才能到达这样一个复杂度，所以你必须教会如何对用户做出反应。

你的语言app只能支持你在先前列出的功能，但用户总能以各种形式向应用发问。详细描述对话的流程，可以让你对用户做出回应，或者让对话朝着应用程序可能为用户做的事情进行。

对于语言app所支持的每一项功能，都是以创建用户和app的对话开始，类似于剧本中的对话。当你写这些对话的时候，要记住你的个性，声音以及语调的特点。开始创建和整理你的语音app程序的实际内容，对于我们的测试而言，这意味着建立一个测试问题的列表。

从理想的路径开始-语音app的对话流程可以响应用户的请求，不发生任何的异常和错误。然后找出对话中可能存在的异常（用户不提供完整的信息）和错误（app不能给理解或不能够照着用户的要求去做）。

因为谈话是被，听到，而不是阅读，一个好的实践是大声的读出来，看看这像不像是自然的口语对话，并检查它是不是传达出了你预期的语调。

如果你的语音app需要通过手机app的内容来补充对话内容，那么可以统一成一种交互模式，这样用户就可以无缝地进行交互。Tide的去污技能告诉用户他们可以在Alexa app上去污。那么关于新的Echo可以触屏的传言可能是真的。

下面是一个关于理想路径的对话示例，我们的体验设计技能的核心：

user：Alexa，开始UX设计测试。

Alexa：我会问你5个问题，可能有多选。尽可能多的回答正确，只需要告诉我选项，我们开始吧，问题1...

user：正确的回答…

Alexa：正确了！你现在的得分是1。接下来是问题2...

user：正确的回答…

Alexa：哦～，这是错误的答案，正确的答案是【】，你的分数是1.接下来是问题3...

…

Alexa：（在5个问题之后）正确！5个问题中你回答对了4个，谢谢你的参与！

4.描述交流短语

人们并不总是用同样的词来表达同样的意思，语音app也需要被教导。Phrase-mapping是一个练习项目，用来适应用户所说短语的变化方式。

对于您在前面对话步骤中详细描述的每个对话路径，轻考虑用户可能会通过不同的单词来进行表达。然后分解每个请求的措辞。并识别他们可能使用的同义词，包括任何地区的变体和方言。如果你的声音处理碳酸饮料，那么可能包括汽水，pop，可乐，饮料，碳酸饮料等，长三明治包括sub，超大三明治，意大利三明治，面包等，运动鞋可能会是运动鞋，鞋，沙滩鞋，跑鞋，网鞋等。

尽可能的完善和详细这些列出来的变化列表，以便您的语音app能够理解用户的请求。Alexa需要理解这些变化形式，尽可能多的代表短语。“取决于你个性的声音，表达的方式可能有好几百种，有很多方法来简化话语的产生。”

下面是一个Phrase-mapping，对UX设计测试的功能示例。Alexa的人工智能平台很好的将用户意图转化为他们的模版，但是如果你进行了更改，那需要补充短语。

5.完善

设计过程中的最后一步是验证和完善语音app，然后花时间和精力在开发商。在“细节”步骤中，大声朗读有助于确保他们听起来足够的自然，现在的步骤是测试用户的语音界面。

最简单的方法就是使用Oz技术向导，一个人扮演设备使用者，并根据界面脚本做出响应。另一种选择是使用SaySpring这样的原型软件来创建和测试交互原型。

如果你的语音app正在通过代码模版创建，那么它可能更容易地创建应用程序，并使用Amazon和Google的测试工具，在设备上进行测试模式。

这个测试会给你真实世界中很好的语音体验，包括处理错误，重复反馈，还有不自然，强迫，或机械般的回复。

开发

现在语音体验已经被设计了，是时候开始build-test-submit阶段，每个平台都有详细的指导和教程，来帮助任何人构建和测试技能，包括Alexa设备，为Google开发Actions，Cortana等。

思考你的反馈回路有助于您理解app如何使用语音。你可以通过开发者账号得到技能指标（用户、对话、话语意图），但是可以通过免费服务，例如VoiceLabs进行分析服务。

在你构建和测试语音app之后，最后一步是精简的提交过程。由于Alexa的skill市场发展迅速，发现有用的新app十分困难。在Amazon改进之前，使用你的语音app中可见的列表元素，来帮助用户找到并尝试你的技能，包括图标，名称，和相关描述。

匹配的技能可以在Amazon的Skill store中进行：UX Design Quiz

指导原则

这里有一些语音体验设计的指导原则。Amazon和Google提供了更多的原则，关于该做和不该做的事情。

通过用户可以理解的方式介绍app。

“欢迎来到UX Design Quiz。我将会问你5个关于UX设计的5歌问题，看看你现在掌握的如何。你可以要求我重复问题或者跳过。你现在准备好了吗？”

虽然是与语音app交互，但也需要一个语音界面来帮助用户实现短期记忆。

Alexa：“这个原则是14世纪的逻辑学家和方济会士提出的，他在英国的Surrey村庄出生。简而言之，它认为简单比复杂性更好。这种解决问题的原则可以很容易地应用在UX Design上，通过更简单的设计解决问题，这个原则叫什么？

你的第一个选择是：奥卡姆剃刀，有时称为吝啬法则。

下一个选择是西科斯定律，也被称为Hick-Hyman定律。

下一个选择是：aesthetic-usability效果。

最后一个选择时：满意，而不是牺牲？

请从ABCD四个选项中做出选择。”

user：“嗯..Alexa，重复一遍。等等，结束测试！”

示例比命令更好。

命令：“请告诉我你的出生年月日。”

示例：“请说出你的生日，例如，1990年4月15日。”

没有风险的进行交互。

这也是一种行为的平衡，太多会难以应付。

让重要的行为更加醒目，让隐藏的风险更低。

如果你让Alexa去关灯，你可以看着它发生，而不需要去确认，尽管有时候时多了一个“OK”。

使用高亮的两条原则

为失败设计

事情都会有糟糕的时候，为这些场景做设计。包括无法理解问题和信息，信息不完整，请求无法处理，给用户回复默认的选项等。

结语

任何时候尝试和一个人发生互动，你都必须将人看作是很先进的操作系统。你的最高目标就是去模仿他们。

– K.K Barrett, Her movie production designer, Wired, 2014

如果你还没有看过电影“Her”，那就花上时间看看这部未来主义的电影吧，讲述一个孤独的作家和OS之间发生的故事。虽然这个时科幻小说，但是在今天的世界里，随着采用独立语音设备的普及Amazon Echo 和 Google Home ，语音体验也在不断优化，通过Amazon和Google的平台，开发语音app是一个相对简单的过程，但是体验不是偶然，它应该经过设计。

最后编辑于：2017.12.07 03:49:37

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 159,569评论 4赞 363
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,499评论 1赞 294
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 109,271评论 0赞 244
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 44,087评论 0赞 209
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,474评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,670评论 1赞 222
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,911评论 2赞 313
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,636评论 0赞 202
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,397评论 1赞 246
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,607评论 2赞 246
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,093评论 1赞 261
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,418评论 2赞 254
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,074评论 3赞 237
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,092评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,865评论 0赞 196
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,726评论 2赞 276
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,627评论 2赞 270

[自译]设计语音体验

推荐阅读更多精彩内容