发布时间:2022-12-1 分类: 电商动态
语音的互动将为我们的产品设计带来巨大的变化。更加直观和听觉的方式应该是提高产品效率和增强用户体验的一种进步和挑战。未来的产品方向,或人机交互的方式,很可能是语音和屏幕之间的三维互动。我们将有机会设计完全不同的用户体验和完全不同的产品感知。
语音交互的优势
在过去几年中,全球人工智能市场发展迅速,亚马逊Echo的速度非常快。据国外媒体统计,2016年Echo的出货量达到650万台。
Echo是一个能够真正完成简单指令的演讲者。这是与人类互动的最简单方式。当你喊“alexa,播放xxxxx”时,你可以播放你想要的歌曲,完全依靠你,完全解放你的双手。作为人与人之间最直接,最自然的交流方式,语音对话中的每个句子都包含多个场景中的多个动作。同时,语音相对不易被时间和地点约束,并且可以在短时间内执行。获得并处理大量信息。
GUI是预设的交互方式。系统只能通过识别用户的交互(例如滑动,点击和双击)以及用户所在页面的位置来判断用户的指令并做出准确的反馈。形成人机交互,迫使用户沿单一路径完成操作,将用户限制为固定脚本。
VUI专注于如何发挥语言和意识形态的力量,利用人们的日常语言进行交流,真实,自然的表达和反馈,以获得用户信任和传递信息。用户不再具有与过去GUI相同的体验。语音交互过程更直接。用户只需使用有限的语音提示和短期记忆即可完成操作。他们甚至可以发出不同的语音命令来期待相同的反馈。
最自然,人性化,用户摩擦较少的互动
不受实体UI性质的影响,用户可以随时随地访问和处理信息。
从场景切入
与用户自互联网诞生以来习惯的GUI界面交互相比,语音交互主要是由不同的输入方法引起的。最重要的特征是“自由之手”——当你使用语音请求时,你的眼睛和手可以同时忙于其他事情,从这个角度来看,语音交互在家庭和旅行领域具有天然的优势。
1、智能家居
在“相对封闭且安全”的系列中(特殊指针对语音信号采集的干扰程度),通过语音交互命令控制家庭交换机是一个很好的切入点。我相信在不久的将来,配备语音互动系统的智能家居可以听你的话。您说的每条指令都会直接影响/控制房屋的当前运行状态。 “你可能会越来越满意,你变得懒惰……”
2、辅助驾驶
汽车语音交互系统释放驾驶员的手和眼睛,使驾驶员能够专注于前方的道路状况,例如接听电话,切换窗口,播放广播音乐,路线导航和其他语音交互命令。
3、企业应用
将来,将会有各种各样的专业知识工作者,这些工作者将被或多或少地简化或替换,例如文本和数据输入工作,例如客户服务机器人。
4、医疗&教育
例如,无论是医生还是患者,录音医疗记录都是提高医疗效率的良好辅助手段之一。
VUI是否取代GUI
语音交互不是一种取代触摸交互的独立或升级,而是基于人类最本能和最自然的形式之一。是否可以广泛使用取决于对现场的深刻理解和人类智能技术的进步。必须从硬件,软件和操作系统深入定制人工智能的开发,以便为用户带来最佳体验。
在GUI中,用户的行为实际上是预先设计或设置的(这也是强调用户在设计中的指导的因素),并且通过引导用户点击,滑动和其他指令来完成相关的判断和反馈。互动。 。在语音交互中,用户的行为将变得完全不可预测,您无法预设用户的行为(语音内容),甚至同一用户在不同情况下(与场景不同)可能具有完全不同的行为。并且期望,系统必须通过更多的场景理解和上下文,以解决用户的意图,使得可能的合理反馈。
语音交互本身是非可视化的,非常消耗用户的注意力
在某些情况下,语音交互的优点可能会成为一个缺点。例如,如果您站在电视机旁边,那么交换机最合适的互动应该是手动 - mdash; —只需按一下即可解决。当人们获得信息时,视觉比听觉强。当别人说话时,你很可能必须等待他完成理解,你甚至可以跳过一些文本,你可以在看文本时理解它。在这种情况下,语音交互的缺点将进一步放大。当你开车时,语音交互简直太棒了。在这个伴随的场景中,语音交互的方式完全解决了人手并大大提高了效率。
(图片来自网络)
一旦语音识别技术取得了进一步的突破,人机交互将以最熟悉的方式进行。目前,以智能扬声器产品为切入点,物联网的新入口已经形成,从需求到服务的路径也大大缩短。从产品本身的交互设计出发,语音交互的特征和逻辑将促使其逐步覆盖浏览器和应用等门户,形成以语音交互为核心的新生态链。
人工智能的出现肯定会带来戏剧性的变化。交互模式也将从当前的主流软件(界面,触摸屏)/纯硬件升级到更复杂的人机交互。
人耳,眼,口,手工自然结构,最符合人类交互经验,应在不同的场景中通过不同的器官(方法)进行,并自然地与外部信息相互作用。随着技术的进步,互动的方式将是颠覆性的创新,未来的人机交互往往更具立体感和本能。 GUI + VUI是有机和有机的结合,因为它符合人类的本能,不会被替换,只会相互促进,并通过适当的协作机制提供更好的用户体验。但与纯GUI的区别在于未来的互动形式肯定会更加情绪化 - ——“ like like human”。
语音交互不好,不仅取决于硬件设备的识别准确性,还需要垂直场景中的语义理解,以及后端内容服务。