本篇文章5984字,读完约15分钟
雷锋。(公开号码:雷锋。com)出版社:本文授权转载自牧婧的公共号《声学在线》,原标题为“视频|中国对“智能扬声器”最全面的评价,教你如何选择ai扬声器。声学在线专注于声学和人工智能技术创新和行业发展。
智能扬声器的战争已经在硅谷开始了,现在,这场战争已经点燃了中国市场。中国智能扬声器市场的迅猛发展已经成为技术巨头、传统行业制造商和初创企业竞争的舞台,智能扬声器产品正在路上!
在“百宝箱大战”中,哪些产品脱颖而出,适合首发?作为消费者,如何在市场上选择智能扬声器产品?今天,“声学在线”将对国内主流智能扬声器产品进行评估。
声学在线从产品销售、用户关注度和制造商影响力等几个维度审视市场上的智能扬声器产品,选择了阿里巴巴旗下的“天猫精灵”x1、科达讯飞京东合资推出的“丁咚扬声器”a1、喜玛拉雅调频推出的“潇雅智能扬声器”、联想推出的“联想智能扬声器”、小米推出的“小米智能扬声器”和罗基推出的“罗基智能扬声器”
评估“智能扬声器”是否值得购买?除了价值和价格之外,我们还可以从性能的两个方面入手,第一是产品的智能交互属性,第二是产品的说话者属性。接下来,我们将从这些维度对这六个智能扬声器进行评估。
智能交互属性
人工智能说话者的智能属性是什么?对于消费者来说,他们最关心的是语音交互的准确性、响应速度、复杂环境下的可用性以及功能体验的人性化、智能化和个性化。声学在线从以上几个方面入手,提取了可以定量评价的指标,并对六位演讲者进行了评价。
1.语音交互的准确性
目前,市场上所有的智能扬声器都将有一个由商家定义的“名称”,商家称之为“唤醒词”。这个“名字”对于智能扬声器尤其重要,它是所有用户与智能扬声器交流的起点。
如果你想通过声音控制一个聪明的说话者,你必须称它为“名字”,也就是唤醒这个词。否则,如果你没有一个有“眼睛”的聪明的说话者,你就会被忽视。以下是今天被评估的六位演讲者的“名字”——唤醒词。
上表是每个智能扬声器产品的警示词
在我们知道了智能说话者的名字之后,我们就可以和说话者进行语音交互了。过去,市场上我们熟悉的产品,如手机、平板电脑等。,仍处于近场语音交互阶段。我们和他们之间的距离一般小于50厘米,在这个距离内会有非常流畅的语音交互体验。当距离延长到1米时,上述设备的语音交互功能基本处于停止食物的状态,或者处于停止食物的边缘。
智能扬声器产品的成功将我们的语音交互扩展到了远场语音交互阶段。在1米之内,我们可以实现自由流畅的语音交互体验,即使距离延长到3米- 5米,也有相对可接受的语音交互体验。首先,让我们测试这个函数的性能。
1.远场声音醒来
首先,我们测试了远场语音唤醒的“唤醒率”。接下来,我们将开始“我叫你三次,你敢答应吗?”游戏。我们测试了上述六种智能扬声器在不同环境和不同距离的声学听音室内的语音唤醒率和远场拾取能力,即语音唤醒能力的准确性。
测试条件:声学试听室环境设置三种环境。(1)安静环境,40db以内;(2)在嘈杂的环境中,播放固定的60db白噪声音频;(3)自噪声环境,即当扬声器自身播放音频或播放语音时,唤醒智能扬声器。当测试距离分别为3米和5米时,使用相同音量的唤醒词来唤醒智能扬声器。在每个测试条件下,唤醒重复十次。
图为6个用于酒店测试的智能扬声器
测试结果:
(1)下图所示为3m距离唤醒失败次数的统计结果。
图:3米距离唤醒失败的统计
如上图所示:
在一个安静的场景中,3米外的所有智能扬声器都被成功唤醒。
在自噪声场景中,小米人工智能扬声器、丁咚智能扬声器、天猫精灵和潇雅扬声器在3米距离处表现更好。在噪音场景下,3m距离处表现较好的是丁咚智能扬声器、小米智能扬声器和联想智能扬声器。
根据以上三个声音场景,在3m距离测试条件下,表现最好的前三名分别是丁咚智能扬声器、小米智能扬声器和天猫精灵。
(2)下图为5m距离唤醒失败次数的统计结果。
图:5m距离唤醒失败次数统计
如上图所示:
在安静的场景中,在5米距离处表现较好的是:智能扬声器、小米ai扬声器、潇雅扬声器、rokid扬声器;
在噪声场景中,5米距离表现较好的是天猫精灵、小米人工智能扬声器和智能扬声器;
在自噪声场景中,小米ai扬声器和天猫elf在5米的距离上表现出色。
根据以上三个声音场景,在5m距离测试条件下,性能最佳的前三位扬声器分别是小米ai扬声器、天猫Elf和丁咚智能扬声器。
其次,让我们测试一下各种智能扬声器的“假唤醒”。顾名思义,误唤醒率指的是在没有说出智能扬声器的唤醒词的情况下,智能扬声器的误触发。想象一下,在日常生活中,家里的智能扬声器莫名其妙地自言自语,这也是一件可怕的事情。因此,错误唤醒率的参数对于智能扬声器来说也是非常关键的。
测试条件:在声学在线会议室放置6个智能音箱,不间断地播放6个智能音箱的各种音频文件,时长8小时,包括《奔跑》、《兄弟》、《甄嬛传》、《郭德纲相声专辑》、《我的前半生》等。,并收集和记录了每个发言者的虚假觉醒。
测试结果:
经过8个小时的测试,表现最差的前三名是丁咚议长、罗基德和天猫精灵,他们都有不同程度的虚假觉醒,而其他发言者没有出现。其中,最夸张的是丁咚聪明的演说家。每次边肖测试天猫精灵,丁咚都会在天猫精灵之前醒来并回答问题。以下视频显示了测试天猫精灵时,丁咚扬声器的错误唤醒。
视频持续了19秒。测试天猫精灵时,说话者被错误唤醒
2.远场语音识别/语义理解能力
在测试了唤醒能力之后,让我们看看哪个说话者在语音识别和语义理解方面更好。这些能力决定了与智能扬声器交互的可用性和流畅性。
预准备:下载智能扬声器提供的手机应用,根据应用的提示要求进行网络分发。
图中显示了每个智能扬声器的移动应用
(1)网络分发:每个演讲者的网络分发过程大约需要两分钟。其中,rokid通过蓝牙连接配置网络;扬声器的网络分配过程是最简单的;联想扬声器的网络分销体验最差;小米代言人、天猫精灵和潇雅代言人的分销流程基本相同。
(2)应用:目前,小米爱说话人、天猫爱说话人、潇雅爱说话人、联想爱说话人的手机应用都推出了“对话记录”功能,方便用户查看智能说话人是否正确识别您的“指令”。至于说话者是否理解你的命令并以个性化和智能化的方式回答你的问题,这将考验每个说话者背后的语义理解和云内容服务的深度。
比较条件:在声学听音室环境中,设置三种环境。(1)安静环境,40db以内;(2)在嘈杂的环境中,播放相同的60db雨音频;(3)自噪声环境,即说话人自己播放歌曲的情况。语音唤醒距离为2.5米。当扬声器以放大的音量播放音乐时,它可以唤醒扬声器并询问天气。从应用的对话信息看远场语音识别的准确性,从说话人反馈的结果看语义理解的能力。
比较结果:
(1)所有智能扬声器都能在安静的环境中成功唤醒。除了丁咚扬声器手机应用暂时不支持提供语音识别记录,以及rokid月石无法查看完整的通话记录之外,语音识别的结果可以在其他智能扬声器的“通话信息”中清楚地看到,并且可以准确地识别所有的单词。从智能说话人反馈的反应结果来看,语义理解的输出结果是完全正确的。
(2)在嘈杂的环境中(播放相同的60db的雨声),在距离扬声器2.5m处播放相同的雨声,固定音频节点(分贝值约为60db),唤醒智能扬声器,执行播放音乐、查询天气等命令。以下是六位演讲者的表演:
视频时长为4分23秒
我们可以从视频中看到:
当丁咚说话者播放歌曲时,反馈结果不正确,可能是歌曲名称识别不正确,或者是语义理解有问题;
当潇雅人询问天气时,会有不正确的识别结果;
当联想扬声器执行命令时,语音识别是正确的,但语义理解将是错误的;
图为潇雅人工智能扬声器和联想智能扬声器的语音记录截图
小米ai说话人在嘈杂环境中表现最好,查询天气、播放音乐语音识别和语义理解反馈的结果正确;
罗基德·月石演奏音乐时,没有反馈结果;
当天猫精灵播放音乐时,识别结果总是不正确的。
图为小米人工智能扬声器和天猫精灵应用程序中对话记录的截图
一般来说,对于智能扬声器来说,在嘈杂的环境中执行各种命令是非常具有挑战性的。其中,小米人工智能扬声器在嘈杂环境中的语音交互效果最好。
(3)在自噪声环境下(当说话者播放歌曲时,唤醒说话者执行命令),智能说话者正在播放“千年等”,距离扬声器2.5米。当音频播放到第一首歌词时(分贝值约为85分贝),唤醒扬声器并询问天气情况。以下是六款智能扬声器的性能:
视频时长为2分58秒
我们可以从视频中看到:
在自噪声环境中,也就是说,当音乐音量约为85分贝时,唤醒扬声器极具挑战性。联想和roikd将面临无法在自噪声环境中醒来的问题,其中小米ai扬声器在自噪声环境中醒来的能力最强。在所有扬声器再次唤醒后,除了潇雅ai扬声器,执行命令没有问题。
2.语音交互响应速度
除了语音交互的准确性之外,响应速度也是一个性能指标,在选择智能扬声器时不可忽视。反应速度是一个综合指标,受唤醒反应速度、网络和云数据处理等参数的影响,唤醒后提出的不同问题对不同的问题可能会有不同的反应,速度会有不同程度的下降。
测试过程:在安静的环境下,我们仍然通过询问天气和播放周杰伦的歌曲《向涛》来测试说话者的反应速度,并用秒表记录反应时间。
测试结果:
图中显示了每个扬声器的响应速度
总体而言,响应速度最快的前三位扬声器分别是丁咚智能扬声器、潇雅ai扬声器和小米ai扬声器。
3.复杂环境中的可用性
在考虑了语音交互的准确性和上述智能扬声器的响应速度之后,让我们来看看智能扬声器在复杂环境中的可用性。
除了rokid月石配有电池,所有六个扬声器都需要220伏电源。此外,所有智能扬声器都需要wi-fi支持,也就是说,智能扬声器的主要应用环境仍然是室内,这就像蓝牙扬声器一样不方便进行。
另外,虽然以上六种智能扬声器都支持蓝牙适配,但智能扬声器的市场趋势很可能会取代牙科扬声器市场,因此覆盖蓝牙扬声器功能的需求也非常强烈。目前,天猫精灵、小米ai音箱、潇雅ai音箱、联想智能音箱、丁咚智能音箱和rokid月石都能支持蓝牙模式播放手机歌曲,体验更加流畅。
4.功能体验
功能体验的人性化、智能化和个性化是用户最关心的维度,因为用户的最终购买或体验在于功能属性。这六个智能扬声器都有基本功能,如播放音乐、阅读书籍、询问天气、设置备忘录、设置闹钟和控制智能家居。当然,小米、天猫、潇雅和罗基德已经引入了增加新技能和培训人工智能助理的功能。
音乐内容来源:
天猫精灵:喜马拉雅调频,虾音乐等。
智能扬声器:支持百度音乐、米谷音乐和喜马拉雅调频;
潇雅智能音箱:百度音乐、喜马拉雅调频、cnr电台等。;
小米ai音箱:喜玛拉雅调频、荔枝调频、伊调频、库克音乐、儿歌、中国广播电台听力新闻、收听头条、Nassos等。;
联想智能扬声器:内容提供商有酷乐、喜马拉雅调频等。;
若琪·月石:目前,我们还不知道罗基德访问了哪些合作伙伴,但根据若琪的官方说法,目前月石有600万个音乐图书馆,全部是32万个高清音频源。
除了上述功能,每个智能扬声器也有自己独特的特点:
潇雅人工智能用户背后有独特的喜马拉雅内容源资源。现在,你可以通过购买潇雅获得喜马拉雅会员2年。对于喜欢在喜马拉雅山听书的深度用户来说,值得推荐。免费收听大量全球畅销书是一种很好的体验。
天猫精灵推出了声纹识别购物功能。声纹预设后,可以通过声纹进行验证,直接付款。然而,目前通过扬声器购物的体验并不理想,推荐的产品基本上不是边肖想买的。除了支付电话费,购物功能基本上就是鸡肋。
据小米ai发言人介绍,如果你是小米智能家居生态链产品的用户,小米ai确实可以称得上是语音控制的关键,控制小米电视、小米空气体净化器等产品仍然是一种很好的体验。
天猫精灵和罗基德·月石目前可以支持多轮对话,也就是说,在醒来一次后,他们可以进行多轮交流。然而,许多回合的对话容易陷入回答不相关问题的混乱局面。
此外,在测试过程中,我们发现天猫精灵、小米人工智能音箱和潇雅人工智能音箱可以支持一键通技术。也就是说,您可以说出指令,而无需等待设备响应。说话者可以直接执行命令,比如问“今天天气怎么样?”首先唤醒天猫精灵,等待设备亮起来,然后开始询问天气。
在测试了这六个扬声器的智能属性之后,让我们来评估这六个智能扬声器的扬声器。
扬声器属性
1.音质效果
不管它是否智能,作为一个音箱,首先要考虑的必须是它的音质。我们还选取了几首有代表性的歌曲,如老鹰乐队的《加州旅馆》、王菲的《灯笼裤》和腾格里歌手的《天堂》,对以下六位演讲者的音质进行了主观评价。
天猫精灵的听觉总体来说是好的,有很好的层次感,其中高频部分清晰明亮,低频部分较重,但缺点是低音有点模糊。
叮咚扬声器的低音重而有力,但由于其叮咚大小,其潜音深度远远不够,高频部分层次感弱,听觉不是很明亮清晰。
联想扬声器最接近亚马逊echo的尺寸,低频显示良好,层次感强,高频部分饱满但不僵硬,但低音部分不够强。
潇雅扬声器也是一个大的智能扬声器,但其低频仍然缺乏一些力量和沉重的感觉,但高频清晰明亮,中频细节是平均的。
小米ai扬声器的尺寸与联想扬声器相似,低音稳定有力,中音明亮突出,细节平均,高音谐波丰富,清晰纤细不刺耳,但配重明显不足,音量大时振动明显。
若羌月石的音量不小,但音质独特,其低频部分明显缺失,导致频率响应不均匀,中高频成分渲染过度,使声音非常脆硬,有很强的机器感。
图为6个扬声器的音质评价结果
一般来说,目前人工智能扬声器的音质无法与bose和jbl等专业扬声器相比。与市场上价格相同的蓝牙音箱相比,有些ai音箱不如其他音箱好。
2.扬声器值
购买扬声器的另一个重要参数是面值。这六位演讲者的价值观是什么?我不会在这里评论,但让用户自己选择。我呈现各种美丽的图片供你参考:
从左到右依次是月石、潇雅智能扬声器、智能扬声器、联想智能扬声器、天猫精灵和小米智能扬声器;
当观察六个智能扬声器的外观时,声学在线惊讶地发现罗基德·月石没有3c认证的图标。
3.产品价格
让我们谈谈每个人最关心的价格。价格如下。最具竞争力的是小米人工智能扬声器和天猫精灵:
图中显示了6个扬声器的价格
综合评价
这六款音箱,除了小米的ai音箱,还在公开测试阶段,其他的可以从相应的渠道购买。虽然用户对京东和淘宝的评价褒贬不一,但总体的症结在于扬声器音质差、产品性能不稳定、扬声器外观不理想等。但总的来说,用户的满意率在95%以上。其中,天猫Elf销量最大,每月累计销量超过1万台。
那么,你决定从哪个智能扬声器开始了吗?
雷锋文章版权所有。严禁擅自转载。详情请参考转载说明。
标题:也许是国内最全“智能音箱”评测,教你如何选 AI 音箱?
地址:http://www.hcsbodzyz.com/hcxw/10363.html