发布时间:2023-7-1 分类: 行业资讯
回顾人机交互发展的历史,人们经历了基于命令行,基于鼠标和键盘的GUI时代以及基于触摸的主要NUI时代的CLI时代。每个后期阶段都比前一阶段更自然,学习成本更低,整体效率更高。
在人工智能时代,人工智能为机器带来了三种功能:感知,认知和自然语言输出。感知能力使机器能够理解人类语言。认知能力使机器能够思考如何回答人类的问题。自然语言输出能力使机器能够表达和人类一样; —这三种功能的结合带来了人机交互的语音交互阶段。语音交互是人机交互最自然的方式。它大大降低了人们与机器交互时的学习成本,将人机交互的综合效率提高到了一个新的水平。它已成为一种非常重要的人机交互方法。
一、“等待体验”——语音交互体验的三分之一
生活中人与人之间的对话,对话是通过“向对方发一言”,“等待对方回复”,“对方给予回复”,三个阶段不断循环。其中,“等待对方回复”是对话体验的“三分之一”,这将对答复的满意度产生直接影响。在等待回复阶段的同时,如果对方处于认真思考的状态,它将使我们感到受到重视;但是,如果对方在等待时没有注意到对方本身,即使对方给出的回答是好的,我们也会有疑问。 。
对应人机语音交互的三个部分 - &ndquo;&ndquo;进入体验“,”等待体验“ 同样处于整个体验循环的中间链接在语音交互体验中起着重要作用。然而,关于语音交互中的“等待体验”,该行业尚未系统地研究并且仍处于模糊状态。
1. 响应时间一定是越短越好吗?
数字性能管理平台Dynatrace研究了用户浏览网页的行为,发现当页面加载速度提高0.5秒时,可以将用户行为转换为代购源码网站上的核心数据提升10%。因此,在网页设计和应用程序设计中,最大限度地减少等待时间是产品设计的不懈追求。
与基于视觉的交互不同,语音交互自然带有情感属性。然而,情绪体验是复杂的,并且它不仅受单一效率变量的控制。在大多数情况下,当人们在生活中相互交谈时,快速反应会给用户一种轻浮和匆忙的感觉,而缓慢的反应会给用户带来延迟和迟钝的感觉。
那么,在语音交互中,什么样的响应时间可以获得最佳体验?响应时间体验的趋势是什么?
2. 等待体验受哪些变量的影响?
在视觉设计领域,当设计页面的加载状态时,为了降低用户的跳出率,设计师通常通过提供进度条或使用有趣的情感设计来消除用户的焦虑。
然而,在语音交互领域,语音的载体是不可见的或不确定的,并且我们甚至没有具有加载状态的接口。在这种情况下,等待体验会影响哪些变量?影响程度如何?总之,可以说在语音交互领域,虽然等待体验很重要,但它仍然是“迷雾”。鉴于此,我们采用当前语音交互的主要载体——以智能扬声器产品为例,对AI产品的等待体验进行专门研究。
二、智能音箱的等待体验研究
目前,智能扬声器主要采用语音首次唤醒后输入命令的语音交互过程。鉴于此,我们可以将智能扬声器的使用分为两个主要阶段:
1)唤醒阶段:用户通过指定的唤醒字将扬声器从等待状态转换为就绪状态,并且可以在接收用户的语音命令之前唤醒扬声器。 2)用户请求和反馈阶段:用户提供语音命令内容和智能扬声器反馈结果,以满足用户的需求。
对于这两个阶段,我们通过以下三个实验进行了研究。
实验1:唤醒阶段的响应时间对等待经历的影响;实验2:用户请求和反馈阶段的响应时间对等待体验的影响;实验3:不同反馈模式(如视觉和声音)对等待体验的影响。
下面我们将逐一详细说明每个实验的结论:
实验一:唤醒阶段的响应时间对等待体验的影响
为了全面检查各种因素对唤醒阶段等待体验的影响,在实验中,我们为用户提供不同的智能唤醒响应时间和不同的唤醒反馈模式。在用户完成实验任务后,有必要评估扬声器的唤醒响应速度(5点刻度:太快,不能接受;有点快,可以接受;只是好;有点慢,可以接受;太慢,不能接受)。
实验1的结果表明,最佳唤醒响应时间与唤醒反馈模式有关。在不同的唤醒反馈模式下,最佳响应时间是不同的:
1)当唤醒反馈为“轻”反馈时,唤醒响应速度尽可能快。在200ms时,用户的响应舒适度最高(响应时间仅评估为用户比例),73%的用户对速度感到满意。 2)当唤醒反馈为“光+音效”时,唤醒响应速度的舒适时间约为300ms,76%的用户对速度感到满意。 3)当唤醒反馈为“轻+声”时,唤醒响应速度的舒适时间约为500ms,74%的用户对速度感到满意。
(注意:本实验设置了市场上的三种唤醒反馈方法:灯光,灯光+音效,灯光+人声,参考不同反馈情况的响应时间,但对于最佳反馈模式,除了响应时间还受到其他因素的影响,将在另一章中进行探讨。)
实验二:用户请求及反馈阶段响应时间对等待体验的影响
由于用户请求和反馈阶段的响应与唤醒阶段的响应在技术实现和用户期望方面不同,我们进行了第二个实验,以研究用户请求和反馈阶段的最佳响应时间范围。在实验中,我们为用户提供了具有不同响应时间设置的智能扬声器。
实验2的主要研究成果如下:1)在1250ms内,用户认为响应速度更好,其中650ms是最佳经验值。在450ms时,少数用户认为响应速度太快,用户会感受到紧迫感和压力感,这是难以接受的。 2)在1450ms,53%的用户开始感觉到响应延迟,但仍然可以接受。 3)从2150ms开始,20%的用户认为说话者的反应太慢而无法接受。我们认为20%的用户不满意,仅仅被称为优秀产品是不够的。
实验三:视觉、声音等不同反馈方式对等待体验的影响
由于在请求反馈阶段中当前在市场上的智能扬声器的响应时间通常高于1.5秒,因此它没有达到第二研究的理想响应间隔。因此,我们通过实验3进一步研究反馈设计对用户响应速度感知的影响。我们为用户提供了五套具有不同反馈方法的解决方案。
在实验3的五组实验中,每组程序设置有不同的响应时间。
实验3的主要研究发现,不同的反馈设计会影响人们对说话者反应速度的感知:
1)在1250ms内,D经验很差,声音反馈会产生抢劫的感觉。一些用户认为说话者反应太快。
2)从1350ms到2150ms,在方案D和E中感觉舒适的用户比例很高。在添加声音/声音效果之后,方案D的语音响应是“好的”,这有助于减轻用户的延迟并增强速度感知体验。 。
3)响应时间为3150ms及以上,响应模式设计对缓解延迟的影响不明显,应尽可能避免。
此外,实验3还发现响应速度预期与用户性别和任务类型有关。与男性相比,女性用户对响应时间的容忍度较低。当说话者没有反馈时他们可以忍受的平均响应时间低于男性,也就是说,他们希望在更短的时间内从发言者那里得到响应反馈。
与音乐类和问答类等任务相比,用户对控制类任务的响应时间容忍度较低,用户希望在控制类任务中获得更及时的响应反馈。
三、小结
本文讨论了语音交互中的等待体验,并以智能说话人为例,重点关注唤醒阶段和请求反馈阶段的响应时间和反馈模式的人体工程学实验研究。由于实验条件和样本量等限制,实验研究结论可能并不代表家庭环境中所有智能扬声器用户的全部感受,但希望通过我们的研究和探索,我们可以指导人工智能的响应时间和反馈。语音对话产品。设计的方式旨在帮助创建自然和终极的语音对话体验。