[自译]设计语音体验

原文链接:Designing Voice Experiences

原文作者:Lyndon Cerejo

基于语音的界面变得更加的普遍了。Siri和Cortana等语音助手已经存在了好些年,但是在过去的几个季节中,Amazon和Google的语音驱动设备已经走进了百万的家庭。

VoiceLabs最近的分析显示,今年有2450万语音设备使用,是去年的四倍,作为体验设计师,我们现在有机会去设计语言体验和界面了!

一个新的界面并不是意味着我们完全不顾及以往成功的界面。我们需要为语音界面的细微差别作出努力,包括对话交互和无屏交互。我们会看典型用户是如何操作的,讨论在语音体验所涉及到的每个步骤。并通过为Alexa设计一款语音app来列举这些步骤(Amazon叫它Skill)。

理解语音界面

就像是移动app运行在OS和设备上,三个层级必须一同工作才可以支撑语音交互:

三个层级支持交互

语音app( Amazon Skills 和 Actions for Google )

人工智能平台( Amazon Alexa, Google Assistant, Apple Siri, Microsoft Cortana )

设备( Echo, Home, smartphones, computers )

每一层都需要关联到下一层,并且去支持上一层级。语音界面位于上面两层,这两层都在云端,而不在设备上。

让我们看看下面的例子,了解这些层是如何工作的,使用Alexa Jeopardy!Skill作为例子。

可用语音交互层

语音驱动设备都在持续地倾听,像是Amazon Echo 和 Google Home,都在等待唤起(“Alexa...”和"OK,Google...”)去执行动作。一旦被激活,设备会将收集到的音频发送到云上的AI平台(“玩Jeopardy吧~”)。平台使用自动语音识别(ASR)和自然语言理解(NLU)来分析用户的意图(开始玩游戏)然后将它发送给app(Jeopardy!J6 Skill 在Alexa上)。然后app处理请求然后通过文本作出响应(如果可以,也能进行可视化优化)。平台将文本转化为语音,然后在设备上运行(“欢迎来到Jeopardy J6,这里是今天的…”)所有的这些都在几秒钟内完成。

建立语音体验

去年,Mark Zuckerberg进行了个人挑战,在他的家里建立简单的AI。他做到了,把它叫做Jarvis,并给了它Morgan Freeman的声音。

Mark Zuckerberg给Morgan Freeman介绍使用了他声音的AI

我们其他的人可能没有资源去做同样的事情,但是可以在已经建立的复杂AI平台来上建立语音app。这让我们只需要关心语音app的设计和开发。这也是一个简化的开发过程。Amazon 和 Google 提供了开放的模板,代码,和详细的构建不同语音app的命令。甚至是非开发人员也可以在一个小时里开放出一款app。

他们简化程序开发方面的投入正在取得回报。每个月都会有数以千计新的语音app诞生。语音app的增长让人们回想到了上世纪90年代的网络热潮,以及随着app store的推出,移动应用的爆发式增长。

按类别划分的Alexa Skills,2017年5月

在这个拥挤的语音市场,优秀的设计将会让你的语音app和其他数百款类似的app中脱颖而出。

设计语言体验

在开始研发之前,需要有5个步骤来设计优秀的语言使用体验。虽然直接投入到研发中很直接,但是花费在设计上的时间是值得的。

设计语音体验的步骤

我们将会讨论并应用去设计语音app,这也会是使用Skill templates for Alexa开发的简单应用。

1.发现

通过问题来开始设计,“这款语音app会给用户带来什么价值?”这个问题应用不论你是否正在开发独立的语音app或你的语音app只是用户的一个接触点。仔细想想为什么人们使用语音app。人们使用语音界面,因为有解放双手的交互,交互的速度和易用性,主要的使用场景可能是在家里,车里,这在2016年的Mary Meeker的互联网趋势报告中有体现(http://www.kpcb.com/blog/2016-internet-trends-report)。

使用语音界面的理由(来源:KPCB)

去发现主要用户需求的关键是,通过语音app比手机和电脑更加便宜,一些例子,像是银行提供账户信息,和在附近打算找电影看看。

如果你的竞争者已经有了语音app,请仔细思考他们在做什么,去看他们的更新,已经在应用市场中的评价。(例如Amazon’s Alexa Skill Store)。目的不是盲目的模仿,而是要了解已经设置的功能项,和对用户的期望。

(写这篇文章的时候,有超过1500“知识和琐事”的Alexa Skills,这成为了Amazon上最拥挤的技能类别,然而在用户体验方面,并没有简单的小技巧。为了演示语音设计的过程,我们创建了UX设计技能,让我们的读者能过测试他们的知识或学一些新的东西)。

2.定义

在这个步骤上,我们会定义它将有的功能和个性。

个性

在设计语音界面时,我们无法接触足够的视觉元素,像是web或者mobile上的那样个性。这个个性必须通过语言的交流,声音和音调来表达。不同于Mark Zuckerberg,听到的是Morgan Freeman的声音,我们听到的是设备默认的声音。这使得语气和措辞在传达我们想要的个性方面至关重要。

好消息是这一块领域的基础已经完成的差不多了,会记录在一个公司的品牌指南,或者网站风格指南中,在你的语言app中使用这些指导原则,在不同的渠道和接触点上保持一致的个性。

Virgin America的品牌个性(图片来源:http://vxbrandguidelines.com

如果你有让Alexa唱过歌,或尝试复活节彩蛋,那么你就会了解她的个性。出于好奇,我接触了负责她个性的团队,这是他们所说的:

“在设计Alexa的声音时,我们希望她有个性去反应出Amazon的价值观,我们希望她乐于帮助,谦虚,而且聪明,同时还十分有趣。这是一个持续的过程,我们预计Alexa的声音会随着开放人员的增多,进化得更加聪明。”

这种个性也可以反映在app的名称,图标,和显示给用户的描述中。所以在发布你的app时,确保它能过吸引用户。

对于我们的用户体验技巧,我们可以采取直接或者有趣的方式,这会反应在我们的问答措辞中。一个正常音调的例子是:

哪个UX设计原则更倾向简单而不是复杂性?

奥卡姆剃刀

西科斯定律

Aesthetic-usability效应

Satisficing

一个有趣音调的例子是:

显然,有有一个UX设计原则更偏向简单,而不是复杂,你能够猜出它叫什么吗?

奥卡姆剃刀:最好的用户体验。

西科斯定律:听起来像是一个门外汉会想出来的。

Aesthetic-usability效应:这是一个花哨的UX行话。

Satisficing:嗯..我向滚石乐队道歉。

是的,让我们保持正常。

功能

你应该仔细想想哪些功能,你的语言app对用户而言是有价值的。从第一步审视你的工作,确立核心功能和提高业务能力。有时候,提供的核心功能显而易见,比如银行提供关于余额,交易和到期日期的信息。其提供相关功能表单的价值,例如Tide的引导语音app,或Glad的语音app,其中一个可以帮助用户记住存储他们的剩菜,另一个运行用户检查哪些应该回收。

如果你将相似的体验从web迁移到了mobile。这可以作为服务的起点。对语音功能而言,考虑哪种功能可以让你的用户受益。在一个语音驱动的设备上去塑造。如果技能有安全或者隐私的影响。可以考虑添加一个级别的保护。(Capital One Alexa Skill允许用户创建个人账号访问),虽然你可能会得到一个在语音上的功能列表,但从1~5个核心功能开始,并使用语音分析进行跟进和改版。

用户体验设计技能的核心可能是:

根据需求提供用户体验的设计原则;

测试用户的随机性原则;

测试用户在多个体验下的原则;记录分数。

与多名用户进行UX测试。

因为我们正在建立UX设计技能,使用Amazon的技能模版,我们的选择目前仅限于第一(当前技能模板)或第三(琐事技能模版)选项。假如我们的研究表明,我们的用户会觉得进行测试比听听原则更有价值,我们的核心功能会继续测试原则并记录分数。

3.详细对话流程

既然你已经列出了语音app的功能,那么可以开始关注app与用户之间的详细对话流程。人们的对话是复杂的,它会有许多的转折,人们经常从一个话题跳到另一个话题。语音AI平台还有很长的一段路要走,才能到达这样一个复杂度,所以你必须教会如何对用户做出反应。

你的语言app只能支持你在先前列出的功能,但用户总能以各种形式向应用发问。详细描述对话的流程,可以让你对用户做出回应,或者让对话朝着应用程序可能为用户做的事情进行。

对于语言app所支持的每一项功能,都是以创建用户和app的对话开始,类似于剧本中的对话。当你写这些对话的时候,要记住你的个性,声音以及语调的特点。开始创建和整理你的语音app程序的实际内容,对于我们的测试而言,这意味着建立一个测试问题的列表。

从理想的路径开始-语音app的对话流程可以响应用户的请求,不发生任何的异常和错误。然后找出对话中可能存在的异常(用户不提供完整的信息)和错误(app不能给理解或不能够照着用户的要求去做)。

因为谈话是被,听到,而不是阅读,一个好的实践是大声的读出来,看看这像不像是自然的口语对话,并检查它是不是传达出了你预期的语调。

如果你的语音app需要通过手机app的内容来补充对话内容,那么可以统一成一种交互模式,这样用户就可以无缝地进行交互。Tide的去污技能告诉用户他们可以在Alexa app上去污。那么关于新的Echo可以触屏的传言可能是真的。

下面是一个关于理想路径的对话示例,我们的体验设计技能的核心:

user:Alexa,开始UX设计测试。

Alexa:我会问你5个问题,可能有多选。尽可能多的回答正确,只需要告诉我选项,我们开始吧,问题1...

user:正确的回答…

Alexa:正确了!你现在的得分是1。接下来是问题2...

user:正确的回答…

Alexa:哦~,这是错误的答案,正确的答案是【】,你的分数是1.接下来是问题3...

Alexa:(在5个问题之后)正确!5个问题中你回答对了4个,谢谢你的参与!

4.描述交流短语

人们并不总是用同样的词来表达同样的意思,语音app也需要被教导。Phrase-mapping是一个练习项目,用来适应用户所说短语的变化方式。

对于您在前面对话步骤中详细描述的每个对话路径,轻考虑用户可能会通过不同的单词来进行表达。然后分解每个请求的措辞。并识别他们可能使用的同义词,包括任何地区的变体和方言。如果你的声音处理碳酸饮料,那么可能包括汽水,pop,可乐,饮料,碳酸饮料等,长三明治包括sub,超大三明治,意大利三明治,面包等,运动鞋可能会是运动鞋,鞋,沙滩鞋,跑鞋,网鞋等。

尽可能的完善和详细这些列出来的变化列表,以便您的语音app能够理解用户的请求。Alexa需要理解这些变化形式,尽可能多的代表短语。“取决于你个性的声音,表达的方式可能有好几百种,有很多方法来简化话语的产生。”

下面是一个Phrase-mapping,对UX设计测试的功能示例。Alexa的人工智能平台很好的将用户意图转化为他们的模版,但是如果你进行了更改,那需要补充短语。

5.完善

设计过程中的最后一步是验证和完善语音app,然后花时间和精力在开发商。在“细节”步骤中,大声朗读有助于确保他们听起来足够的自然,现在的步骤是测试用户的语音界面。

最简单的方法就是使用Oz技术向导,一个人扮演设备使用者,并根据界面脚本做出响应。另一种选择是使用SaySpring这样的原型软件来创建和测试交互原型。

如果你的语音app正在通过代码模版创建,那么它可能更容易地创建应用程序,并使用Amazon和Google的测试工具,在设备上进行测试模式。

这个测试会给你真实世界中很好的语音体验,包括处理错误,重复反馈,还有不自然,强迫,或机械般的回复。

开发

现在语音体验已经被设计了,是时候开始build-test-submit阶段,每个平台都有详细的指导和教程,来帮助任何人构建和测试技能,包括Alexa设备,为Google开发Actions,Cortana等。

思考你的反馈回路有助于您理解app如何使用语音。你可以通过开发者账号得到技能指标(用户、对话、话语意图),但是可以通过免费服务,例如VoiceLabs进行分析服务。

在你构建和测试语音app之后,最后一步是精简的提交过程。由于Alexa的skill市场发展迅速,发现有用的新app十分困难。在Amazon改进之前,使用你的语音app中可见的列表元素,来帮助用户找到并尝试你的技能,包括图标,名称,和相关描述。

匹配的技能可以在Amazon的Skill store中进行:UX Design Quiz

指导原则

这里有一些语音体验设计的指导原则。Amazon和Google提供了更多的原则,关于该做和不该做的事情。

通过用户可以理解的方式介绍app。

“欢迎来到UX Design Quiz。我将会问你5个关于UX设计的5歌问题,看看你现在掌握的如何。你可以要求我重复问题或者跳过。你现在准备好了吗?”

虽然是与语音app交互,但也需要一个语音界面来帮助用户实现短期记忆。

Alexa:“这个原则是14世纪的逻辑学家和方济会士提出的,他在英国的Surrey村庄出生。简而言之,它认为简单比复杂性更好。这种解决问题的原则可以很容易地应用在UX Design上,通过更简单的设计解决问题,这个原则叫什么?

你的第一个选择是:奥卡姆剃刀,有时称为吝啬法则。

下一个选择是西科斯定律,也被称为Hick-Hyman定律。

下一个选择是:aesthetic-usability效果。

最后一个选择时:满意,而不是牺牲?

请从ABCD四个选项中做出选择。”

user:“嗯..Alexa,重复一遍。等等,结束测试!”

示例比命令更好。

命令:“请告诉我你的出生年月日。”

示例:“请说出你的生日,例如,1990年4月15日。”

没有风险的进行交互。

这也是一种行为的平衡,太多会难以应付。

让重要的行为更加醒目,让隐藏的风险更低。

如果你让Alexa去关灯,你可以看着它发生,而不需要去确认,尽管有时候时多了一个“OK”。

使用高亮的两条原则

为失败设计

事情都会有糟糕的时候,为这些场景做设计。包括无法理解问题和信息,信息不完整,请求无法处理,给用户回复默认的选项等。

结语

任何时候尝试和一个人发生互动,你都必须将人看作是很先进的操作系统。你的最高目标就是去模仿他们。

– K.K Barrett, Her movie production designer, Wired, 2014

如果你还没有看过电影“Her”,那就花上时间看看这部未来主义的电影吧,讲述一个孤独的作家和OS之间发生的故事。虽然这个时科幻小说,但是在今天的世界里,随着采用独立语音设备的普及Amazon Echo 和 Google Home ,语音体验也在不断优化,通过Amazon和Google的平台,开发语音app是一个相对简单的过程,但是体验不是偶然,它应该经过设计。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,569评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,499评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,271评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,087评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,474评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,670评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,911评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,636评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,397评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,607评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,093评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,418评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,074评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,092评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,865评论 0 196
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,726评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,627评论 2 270

推荐阅读更多精彩内容