发布时间:2023-1-13 分类: 电商动态
这个项目的时间不是很紧张。我有时间探索一些细节。有些事情可以做我不能做的事情。探索它背后的原因是非常有趣的。
一、简单介绍VUI
据推测,每个人都不太熟悉语音交互,而且汽车上的语音交互更加奇怪。在这里,我将谈到科学普及的背景。至于对这方面更感兴趣,我可以找到这些信息。我认为其他文章将详细介绍该理论。在这里,我将讨论实际应用中对需求的探索。
首先,语音交互来自交互式语音应答(IVR),它通过电话执行任务。与10086不同,它识别人们所说的内容,因为它擅长处理大量信息的复杂信息。句子,应用场景更广泛。
智能手机快速发展后,VUI(语音用户互动)诞生了。 Siri和Cortana是典型的应用程序。语音交互一直被称为“最自然的交互式门户”,其优缺点是显而易见的。
汽车场景的语音交互具有明显的优势:不需要驾驶员分散操作,直接语音命令可以达到预期目的。因此,在汽车中使用语音交互,任务类型要求将占大多数。
二、实际应用中遇到的问题
我今天在以前的产品文档中看到了这个设计:
目前的设计是由于技术限制。不支持的语句不能用于下一轮对话,因此在反馈完成后直接退出语音。没有大问题,许多车载电话语音交互直接表明它们不受支持,以下声明没有。但是,这个程序仍然极大地妨碍了他们使用语音的热情。此设计至少不适合以下几点:
在人工智能不是非常智能的情况下,尝试了解用户的意图并允许用户继续说话。
功能点设计应考虑可发现性。对于语音交互,隐形交互方法应该提高其可发现性。
已知的对话原则之一:这种方式的原则,即清楚说话的需要,可以在这里简化,但也需要针对不同的用户群。
三、从用户出发,了解说出这句话的初始意图
在我看来,语音交互是一个繁琐的设计过程,因为不同场景中的用户会说出难以预测的内容,因此我将选择一些最常见的使用场景,然后按照每个场景的最佳路径(相同的写入)与业务流程相关的示例对话框,以及异常。
切换播放模式时这是一个异常现象:
用户:帮我切换到随机播放/随机歌曲/单曲…
TTS:随机播放
(TTS:从文本到语音,文本到语音通常是由产品和交互设置的内置文本。当用户说某句话命中某个语句时,则广播对应于该语句的反馈语言。整个过程是甚至做是一个完整的对话交互设计。)
让我们看看为什么用户这样说,“切换播放模式”:
在移动应用程序中,切换播放模式,全部点击切换到所需的播放模式,三种播放模式都是固定顺序,所以用户会想要在汽车上继续这种操作习惯,会有这样的说法。
我知道播放模式是什么,但我不知道汽车上的语音控制是什么,所以我试探性地尝试了。
我不知道哪种播放模式,所以我只想看看哪种播放模式可用
无论起点如何,最终目标都是切换模式。
四、根据不同意图,对用户进行分类,寻找更好的解决方案
根据以上三种情况,可分为:
对于熟悉音乐的用户,请探索在汽车端使用语音控制。
对于不熟悉音乐的用户,请探索在汽车上使用语音控制。
让我们来看看语音切换模式需要解决的问题:
无需关注界面,直接释放语音命令即可实现目标;
缩短用户的操作路径:例如,如果您在手机上切换播放模式,有时需要点击两次;并且汽车机器直接发出显式命令并直接完成它。
来,首先分析上述两个用户组的更深层次的用户定位。
1.熟悉音乐的用户
移动电话上的大多数操作都是因为播放详情页面上的操作按钮太多,因此播放模式包含在按钮中。以下是不同的音乐界面。故意选择一些不太受欢迎的音乐应用,这是出乎意料的酷。狗是可选的,基本上其他应用程序使用点击播放模式交互;
更进一步,移动电话用户在两种情况下在播放模式之间切换:
第一个熟悉播放模式的人,在操作前会有心理上的期望,所以它会被设置为她想要的播放模式,播放模式最多可以切换三次,用户成本不高高,所以这也是大多数移动应用程序将其添加到图标的原因;
第二种类型,不熟悉的人,可能想知道他们在手术中有什么游戏模式,最后确定最终的心理预期,所以点击次数将超过三次。
总之,无论熟悉程度如何,都会有一个既定的心理目标,具有明确的操作意图。
熟悉音乐应用程序的用户群基本上是集中的:大约18到40岁,他们基本上知道有三种游戏模式,所以你可以有以下做法:
实践1:经过深思熟虑的指导,让他们的意图变得更清晰,这样就不会有这样的陈述;直接命令切换还可以减少用户的操作路径并降低用户的运营成本。
练习2:首先完成用户目标意图:切换播放模式,然后提示用户可以切换哪种播放模式,以便用户逐渐熟悉
练习3:完成用户的目标意图,不提示,三种播放模式可能是懒惰的,不想说具体的播放模式名称,所以只记得一个声明就可以实现。
2.不熟悉音乐的用户
我特意找了亲爱的爸爸,并要求他的中年和老朋友开车,年龄在40-50岁之间,其中大部分都在45岁以下。以下是一些聊天。
我的问题:当你播放音乐时,你知道你可以在播放模式之间切换吗?如果你知道,你知道有几种播放模式可以切换吗?请列出您的印象。在这个过程中,不要打开音乐应用程序来查看它,依靠自己的记忆〜
对我来说,可能被调查的目标用户在一线城市会有不同的结果,这是非常意外的。但有多少中老年人居住在一线城市?大部分中老年人生活在非一线城市。对他们来说,简单地播放歌曲可以满足他们对音乐的需求。
但是,是否有必要像这样推送这个功能?
让我们来看看将使用智能汽车的人的分布:(来自互联网的数据,随时查看)
65%的中国消费者愿意接受车辆互联网功能,其在欧洲国家高于40%,在北美高出32%。中国消费者也更愿意尝试与娱乐相关的功能,如社交媒体,汽车视频和音乐。
在未来十年,55岁以上的人口将增加近1亿人。与此同时,在90年代更换80后,它将逐渐成长为主要的消费市场。 2015年,这一数字已达到2亿。消费者对年轻人和老年人的需求变化值得探索,以便提前赢得市场。
因此,中年和老年人的需求还有待挖掘,所以我认为这里应该做的是音乐推荐的智慧,这样他们就可以享受人工智能的好处;而不是引导他们使用新功能,以便使用它们,操作成本大大提高,并且他们的内存负担也增加了。很明显,汽车的语音交互只是想减少用户对驾驶的干扰,这与我们想要做的相反。
五、结合推荐做法、语音交互优化准则,确定最后的方案
在用户组分析和对需求的深入分析已经结束之后,有必要根据开头没有到位的点来澄清最终计划。
根据第二和第四个可优化的要点和推荐的做法,让我们进行比较和分析:
第一种方法是互动指导。实际上,在整体方案设计中,需要考虑如何引导用户理解语音交互。
第二种和第三种做法符合理解用户的意图,可以提高可发现性。不同之处在于后续信息是否提示用户。但是,这里的纠结点有以下几点:
提示用户,他们可以清楚地知道他们可以说什么,但声明太长,无法精简,并且对用户有一定的内存负担;
用户不会被提示,他们可能不明白可以直接操作播放模式的名称,这更简单,更有效。
让我们澄清设计目标:简单,高效,而不是分散注意力;所以提示是必须的。为了澄清这些,继续参考本书中的参考 - 《语音界面用户设计》,根据语音用户界面基本设计原则中的异常处理,增强的错误提示有这样的对话示例:
天气APP:我可以为您提供天气信息。你的州和城市在哪里?
用户:En…我在斯普林菲尔德。
天气APP:对不起,我不明白,请说州和市。
网友:哦,我在明尼苏达州的斯普林菲尔德。
这种异常处理促使用户需要清晰的信息,然后我们的解决方案也可以采用这样的方案:
用户:切换播放模式
TTS:好的,你想切换到什么样的播放模式?
用户:随机播放
TTS:Switched,下次你可以随便跟我说话。再见〜
这样的解决方案似乎是如此智障吗?
语音交互方案一直处于发现,改进,探索,制定,纠缠,推翻和持续优化的过程中。在这方面没有很多类似教科书的理论,所以记录从分歧到下一个优化点。制定优化计划的小过程可能是微不足道的,分享语音交互的日常工作,并希望帮助想要知道的人它。
作者:江青,微信公众号:莫奇BTS站和大胖子
本文最初由@青绛发表。未经许可,禁止复制。
该地图来自的,基于CC0协议