1. 主页 > AI行业 > 行业观察

大模型能带智能音箱走出困境吗?

2014年Echo问世,定义了智能音箱并开启新技术时代;

三年后,微软、苹果、阿里和小米在中国推出智能音箱,掀起市场热潮;

2018年智能音箱市场进入白热化,阿里巴巴投资30亿元建设天猫精灵生态,百度和小米加大投资展开份额争夺战;

2019年,中国智能音箱市场出货量飙升至4589万台进入巅峰;

2020年市场呈现阿里、百度、小米三强鼎立格局,但增长势头放缓;

2021年和2022年销量连续两年下滑。

智能音箱的困境何在

智能音箱所面临的挑战,已经能明显察觉到。

首先,从交互体验角度,智能音箱的远场交互技术仍然受到限制,远距离操作容易导致交互失败,而背景噪音常常干扰用户与设备的交流。即使技术有所进步,但智能音箱在“免唤醒”和“多轮对话”等交互功能上仍然有所欠缺。

其次,智能音箱在个性化交互方面表现得不够出色。用户情绪的准确识别和响应,以及有针对性的对话等复杂交互仍然难以实现。这使得智能音箱的交互性相对局限。

再者,智能音箱的使用场景相对单一。虽然智能音箱可以查询天气、听故事、播放音乐等基础功能,但是其真正的深度应用并不广泛。大多数用户仅仅将智能音箱作为常规音箱来使用,而不是作为智能家居的入口或者连接商业的潜力工具。

另外,尽管智能音箱的功能越来越强大,但是对于很多用户来说,它们仍然是一种新鲜事物。用户可能需要一段时间来适应和接受这种新的交互方式,从而提高对智能音箱的依赖度。

最后,用户对智能音箱的期待被严重降低,许多人仅仅将其视为一个常规的音响来使用,而不是一个智能家居的入口或一个有潜力连接商务的工具。这无疑阻碍了智能音箱市场的进一步扩展。

大模型能赋予智能音箱新生命吗

近日OpenAI发布消息,他们为ChatGPT赋予了与用户进行语音和音频互动的能力。这让大家对智能音箱的未来发展寄予了期待!

如果大模型整合到智能音箱中,可以极大地优化音箱的交互体验及内容生成的质量。

详细地说,智能音箱的运作包括三个关键步骤:首先是将用户的语音转化为文字指令;接着,理解并处理这些指令;最后,将处理结果转化为语音输出

这三个步骤分别涉及到自动语音识别(ASR)、自然语言处理(NLP)以及文本到语音(TTS)这三种技术。

在这三个技术中,ASR的技术已经相当成熟,NLP正在经历显著的突破,而TTS虽然早期便开始向成熟迈进,但在情感交互方面仍面临挑战。然而,随着大模型的出现,不仅NLP有巨大的增长潜力,其他技术也预期将实现显着的进步。

小米旗下红米智能音箱(图片来自新浪)

小米旗下红米智能音箱(图片来自新浪)

我们可以大胆预测,随着大模型的加持,智能音箱未来不仅可能实现更个性化的服务,还能够准确捕捉和响应用户的情感,进一步丰富应用场景

尽管在某些方面已经展现出了极大的潜力,但智能音箱仍面临着许多挑战和困难需要克服。然而,随着科技的不断发展,我们有理由相信,未来的智能音箱将会更加成熟和完善,更好地服务于人类社会。

本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/industry/1071.html