每一次的科技变革,所带来的不只是产品的更新迭代,还有一种全新的生活方式。就比如触屏手机的出现,老式键盘退出了历史舞台,繁琐的操作方式被抛弃,手机有了多样化的界面风格和丰富的娱乐功能。

同样的,当智能语音技术出现之后,触屏又显得out了,通过语音就能输入文字、操控手机里的应用、导航路线,甚至远程控制家里的设备。

blob.png

智能语音技术身后的巨大经济空间被迅速发掘,吸引了众多科技公司投身其中,各种各样的语音产品如雨后春笋一般出现在我们的生活里。

但一个很奇怪的现象也出现了,语音技术在不断的进步,智能语音产品也在推陈出新,然而,很多人对语音产品的热度却下降了,甚至一度报以恶评。

有些人觉得语音输入错误率太高,比手动输入花费的时间还多;有些人觉得所谓的智能家电功能鸡肋,体验太差;还有的人则认为智能语音产品都是炒作,不值得花钱去购买。

这些观点可能更针对于国内的消费者,对于国外的消费者来说,他们很早之前就已经开始接触带有语音功能的产品,诸如苹果的Siri,以及亚马逊的智能音箱echo。

语音操控对于已经习惯使用这些产品的人来说,或许已经成为了他们生活的一部分。而之所以会有“觉得智能语音真的很鸡肋”这些想法,或许是因为还不够了解它。

blob.png

智能语音被看作是告别触摸式模式的下一代交互模式。它是有很鲜明的理由存在的:

首先,比起文字交互来说,语音交互更加自然,适用性更广。从人的学习能力来看,语音可以说是我们先天就能获得的能力,但文字不是,很多人甚至都不会书写。

所以从某种程度上来说,如果语音交互能够普及,在理想状态下是人人都可以用语音命令来操控智能设备,实现智能体验。

其次,语音交互能够把人更多的感官解放出来,比如视觉、双手。让我们能够在很多情况下更集中精力去做某件事,就比如在驾驶汽车的时候,用语音来导航能避免我们因为查看屏幕分散了注意力而产生的许多事故。

blob.png

再次,语音交互所能适用的场景并不是单一的,它能应用在我们所能想象得到的所有地方,目前已经出现的智能家居系统就是一个很好的例子,它通过将物联网和语音技术联合,仅用语音就能操控家中所有的设备。

以同样的方式,它也可以应用在工业上、娱乐上、交通系统上。在未来,能够变革很多行业。

当然,对于很多人提到的语音交互可能存在的不足,比如语音识别效果、语义理解能力,实际上,这是语音交互领域存在的普遍问题,但随着技术的发展有了很大的改善。

就拿国内从事语音交互服务的欧拉蜜来说,目前它的识别率就高达九成以上,应用了深度学习算法和神经网络模型自动语音识别技术的它能够实时地将语音转化为文字,而且对于噪声的处理能力也很卓越,基本不需要额外对音频进行优化或者处理,就能让用户获得良好的识别效果。

对于用户最关注的语义理解部分,人机交互方案专家欧拉蜜也有自己独到的解决方法,采用了具有可全文检索的结构化知识库,能够辅助确定语法参数的合法性,更好的消除语句歧义。

除此之外,它还完美的解决了一个语音方面的大难题,就是上下文理解。它采用了具有记忆基础的上下文理解处理技术,利用多维度的上下文支持能力,能够进行长句式连续询问。也就是说,不仅可以让应用理解用户的“言外之意”,还可以和用户聊天唠嗑等等。

当然,身为人机交互领域专家的欧拉蜜能做到的还不止这些,它还具有语音唤醒、离线识别、实时目标检测和人脸识别等等功能,有效辅助并强化AI人机交互行为,来让语音识别更加高效、精准和多元化。

由此也可见,语音技术并没有像人们所以为的那样停滞不前,而是一直在摸索、在进步。智能时代的到来已经是一个大势,面对新事物的到来,最好的态度或许就是去尝试着理解它,并接受它。