语音交互示例：从切换播放模式的详细信息

资讯热点

当前位置：首页 > 电商动态 > 语音交互示例：从切换播放模式的详细信息

语音交互示例：从切换播放模式的详细信息

发布时间：2023-1-13 分类：电商动态

这个项目的时间不是很紧张。我有时间探索一些细节。有些事情可以做我不能做的事情。探索它背后的原因是非常有趣的。

一、简单介绍VUI

据推测，每个人都不太熟悉语音交互，而且汽车上的语音交互更加奇怪。在这里，我将谈到科学普及的背景。至于对这方面更感兴趣，我可以找到这些信息。我认为其他文章将详细介绍该理论。在这里，我将讨论实际应用中对需求的探索。

首先，语音交互来自交互式语音应答（IVR），它通过电话执行任务。与10086不同，它识别人们所说的内容，因为它擅长处理大量信息的复杂信息。句子，应用场景更广泛。

智能手机快速发展后，VUI（语音用户互动）诞生了。 Siri和Cortana是典型的应用程序。语音交互一直被称为“最自然的交互式门户”，其优缺点是显而易见的。

汽车场景的语音交互具有明显的优势：不需要驾驶员分散操作，直接语音命令可以达到预期目的。因此，在汽车中使用语音交互，任务类型要求将占大多数。

二、实际应用中遇到的问题

我今天在以前的产品文档中看到了这个设计：

目前的设计是由于技术限制。不支持的语句不能用于下一轮对话，因此在反馈完成后直接退出语音。没有大问题，许多车载电话语音交互直接表明它们不受支持，以下声明没有。但是，这个程序仍然极大地妨碍了他们使用语音的热情。此设计至少不适合以下几点：

在人工智能不是非常智能的情况下，尝试了解用户的意图并允许用户继续说话。

功能点设计应考虑可发现性。对于语音交互，隐形交互方法应该提高其可发现性。

已知的对话原则之一：这种方式的原则，即清楚说话的需要，可以在这里简化，但也需要针对不同的用户群。

三、从用户出发，了解说出这句话的初始意图

在我看来，语音交互是一个繁琐的设计过程，因为不同场景中的用户会说出难以预测的内容，因此我将选择一些最常见的使用场景，然后按照每个场景的最佳路径（相同的写入）与业务流程相关的示例对话框，以及异常。

切换播放模式时这是一个异常现象：

用户：帮我切换到随机播放/随机歌曲/单曲…

TTS：随机播放

（TTS：从文本到语音，文本到语音通常是由产品和交互设置的内置文本。当用户说某句话命中某个语句时，则广播对应于该语句的反馈语言。整个过程是甚至做是一个完整的对话交互设计。）

让我们看看为什么用户这样说，“切换播放模式”：

在移动应用程序中，切换播放模式，全部点击切换到所需的播放模式，三种播放模式都是固定顺序，所以用户会想要在汽车上继续这种操作习惯，会有这样的说法。

我知道播放模式是什么，但我不知道汽车上的语音控制是什么，所以我试探性地尝试了。

我不知道哪种播放模式，所以我只想看看哪种播放模式可用

无论起点如何，最终目标都是切换模式。

四、根据不同意图，对用户进行分类，寻找更好的解决方案

根据以上三种情况，可分为：

对于熟悉音乐的用户，请探索在汽车端使用语音控制。

对于不熟悉音乐的用户，请探索在汽车上使用语音控制。

让我们来看看语音切换模式需要解决的问题：

无需关注界面，直接释放语音命令即可实现目标;

缩短用户的操作路径：例如，如果您在手机上切换播放模式，有时需要点击两次;并且汽车机器直接发出显式命令并直接完成它。

来，首先分析上述两个用户组的更深层次的用户定位。

1.熟悉音乐的用户

移动电话上的大多数操作都是因为播放详情页面上的操作按钮太多，因此播放模式包含在按钮中。以下是不同的音乐界面。故意选择一些不太受欢迎的音乐应用，这是出乎意料的酷。狗是可选的，基本上其他应用程序使用点击播放模式交互;

更进一步，移动电话用户在两种情况下在播放模式之间切换：

第一个熟悉播放模式的人，在操作前会有心理上的期望，所以它会被设置为她想要的播放模式，播放模式最多可以切换三次，用户成本不高高，所以这也是大多数移动应用程序将其添加到图标的原因;

第二种类型，不熟悉的人，可能想知道他们在手术中有什么游戏模式，最后确定最终的心理预期，所以点击次数将超过三次。

总之，无论熟悉程度如何，都会有一个既定的心理目标，具有明确的操作意图。

熟悉音乐应用程序的用户群基本上是集中的：大约18到40岁，他们基本上知道有三种游戏模式，所以你可以有以下做法：

实践1：经过深思熟虑的指导，让他们的意图变得更清晰，这样就不会有这样的陈述;直接命令切换还可以减少用户的操作路径并降低用户的运营成本。

练习2：首先完成用户目标意图：切换播放模式，然后提示用户可以切换哪种播放模式，以便用户逐渐熟悉

练习3：完成用户的目标意图，不提示，三种播放模式可能是懒惰的，不想说具体的播放模式名称，所以只记得一个声明就可以实现。

2.不熟悉音乐的用户

我特意找了亲爱的爸爸，并要求他的中年和老朋友开车，年龄在40-50岁之间，其中大部分都在45岁以下。以下是一些聊天。

我的问题：当你播放音乐时，你知道你可以在播放模式之间切换吗？如果你知道，你知道有几种播放模式可以切换吗？请列出您的印象。在这个过程中，不要打开音乐应用程序来查看它，依靠自己的记忆〜

对我来说，可能被调查的目标用户在一线城市会有不同的结果，这是非常意外的。但有多少中老年人居住在一线城市？大部分中老年人生活在非一线城市。对他们来说，简单地播放歌曲可以满足他们对音乐的需求。

但是，是否有必要像这样推送这个功能？

让我们来看看将使用智能汽车的人的分布:(来自互联网的数据，随时查看）

65％的中国消费者愿意接受车辆互联网功能，其在欧洲国家高于40％，在北美高出32％。中国消费者也更愿意尝试与娱乐相关的功能，如社交媒体，汽车视频和音乐。

在未来十年，55岁以上的人口将增加近1亿人。与此同时，在90年代更换80后，它将逐渐成长为主要的消费市场。 2015年，这一数字已达到2亿。消费者对年轻人和老年人的需求变化值得探索，以便提前赢得市场。

因此，中年和老年人的需求还有待挖掘，所以我认为这里应该做的是音乐推荐的智慧，这样他们就可以享受人工智能的好处;而不是引导他们使用新功能，以便使用它们，操作成本大大提高，并且他们的内存负担也增加了。很明显，汽车的语音交互只是想减少用户对驾驶的干扰，这与我们想要做的相反。

五、结合推荐做法、语音交互优化准则，确定最后的方案

在用户组分析和对需求的深入分析已经结束之后，有必要根据开头没有到位的点来澄清最终计划。

根据第二和第四个可优化的要点和推荐的做法，让我们进行比较和分析：

第一种方法是互动指导。实际上，在整体方案设计中，需要考虑如何引导用户理解语音交互。

第二种和第三种做法符合理解用户的意图，可以提高可发现性。不同之处在于后续信息是否提示用户。但是，这里的纠结点有以下几点：

提示用户，他们可以清楚地知道他们可以说什么，但声明太长，无法精简，并且对用户有一定的内存负担;

用户不会被提示，他们可能不明白可以直接操作播放模式的名称，这更简单，更有效。

让我们澄清设计目标：简单，高效，而不是分散注意力;所以提示是必须的。为了澄清这些，继续参考本书中的参考 - 《语音界面用户设计》，根据语音用户界面基本设计原则中的异常处理，增强的错误提示有这样的对话示例：

天气APP：我可以为您提供天气信息。你的州和城市在哪里？

用户：En…我在斯普林菲尔德。

天气APP：对不起，我不明白，请说州和市。

网友：哦，我在明尼苏达州的斯普林菲尔德。

这种异常处理促使用户需要清晰的信息，然后我们的解决方案也可以采用这样的方案：

用户：切换播放模式

TTS：好的，你想切换到什么样的播放模式？

用户：随机播放

TTS：Switched，下次你可以随便跟我说话。再见〜

这样的解决方案似乎是如此智障吗？

语音交互方案一直处于发现，改进，探索，制定，纠缠，推翻和持续优化的过程中。在这方面没有很多类似教科书的理论，所以记录从分歧到下一个优化点。制定优化计划的小过程可能是微不足道的，分享语音交互的日常工作，并希望帮助想要知道的人它。

作者：江青，微信公众号：莫奇BTS站和大胖子

本文最初由@青绛发表。未经许可，禁止复制。

该地图来自的，基于CC0协议

« 谈人工智能产品设计：LDA主题模型 | 为什么网易的H5会引发一群人报名？ »

: 周一周五 8:30 - 18:00

鲁ICP备14007395号-24

百度统计

客服QQ