助理范式阻碍了语音用户界面的使用

文章 (114) 2021-08-15 09:54:38

语音用户界面的主要用例(至少以每月活跃用户的数量来衡量)是语音助手,如 Alexa、Google Assistant 或 Siri。这些助手可帮助用户完成简单的任务,例如设置闹钟、播放媒体或回答问题,免提并使用最直观的用户界面 - 语音。

然而,经过多年围绕语音助手的炒作,只有少数人使用助手来处理更复杂的事情。大卫皮尔斯在华尔街日报的一篇关于语音助手的文章中写道:“我无法想象通过语音助手预订航班或管理我的预算,或者通过对我的扬声器大喊配料来跟踪我的饮食。” 这是为什么?使用语音预订航班应该相当简单,因为在计算机出现之前,所有航班都是通过与旅行社交谈来预订的。

缺乏反馈
助手无法完成更复杂任务的一个重要原因是缺乏反馈。当用户和助手说话时,助手是完全被动的,当助手给用户输出时,它不能接受输入。这使得体验完全顺序和回合制。

这与人与人之间的对话非常不同,在人与人之间的对话中,各方提供非语言交流线索,例如手势和面部表情,以表明他们理解或缺乏理解。有时这些信号可以是口头的,例如简短的 a-ha 或 eh?

因为语音助手没有这些信号,所以体验是基于给出语音输入然后等待并希望助手以预期的方式回复。

如果助手没有正确理解,用户必须从头开始重新体验。让我们再次考虑助手范例中的航班预订用户任务。用户说“我想要两张从柏林到纽约的商务舱机票”。助理回答“从贝鲁特到纽约有两个航班。选项一早上 7.52 起飞,选项二下午 2.33 起飞。你想预订哪一个?” 并开始等待用户输入。因为有错误,用户需要重置对话并从头开始。最关键的是,助手已经浪费了几秒钟说完全不正确和不相关的信息。

在人与人之间的对话中,销售人员会回答类似“贝鲁特到纽约,让我们看看”之类的话,客户可以立即纠正他“对不起,我的意思是从柏林到纽约”,然后对话将继续自然。

体验之间的最大区别是反馈循环。人类对话有一个快速、自然的反馈循环,误听或误解很容易纠正。这如何在语音用户界面中复制?

更好的选择
使用语音用户界面获得更好用户体验的关键是摆脱自然语言响应,并用实时视觉反馈取而代之。当用户通过触摸、鼠标或键盘向计算机提供输入时,他会实时看到他的输入如何影响图形用户界面。使用语音输入时也会发生同样的情况。

这种实时视觉反馈鼓励用户继续使用更复杂的话语,并让她在出现错误时能够自然地纠正自己。语音平台在提高其语音识别软件的准确性方面展开竞争,但良好用户体验的关键不是使准确性完美,而是使更正变得容易。想想键盘:我们一直在犯错,但人们认为键盘技术还不够成熟,无法真正使用。

虽然语音助手已经将语音用户界面带入了主流,但现在是时候抛弃对话式语音助手范式,开始将语音作为另一种与触摸和视觉一起使用的方式了。不应将语音视为我们当前用户界面的替代品,而应将其视为增强它们的补充。

当语音被用作补充方式时,图形用户界面为人们提供了他们能够做什么的提示,摆脱了语音助手的技能发现问题。图形用户界面实时响应用户输入,解决语音助手缺乏反馈的问题。这可以实现更复杂的用户任务,并最终可以将语音转化为它的样子:最自然、最高效的输入方式。

 

THE END

发表回复