亚马逊Echo的火热直接引爆了国内的智能音箱市场,整个智能硬件产业链都躁动起来。
然而,高歌猛进的过程中,中国的消费者们似乎并不会买账。
那么,语音交互是否能够成为下一代交互技术?智能音箱能够语音交互的入口级产品?手机之后的下一个普罗大众的硬件到底是什么?
目前智能音箱上的服务有哪些?未来的市场到底有多大?近日,网易智能采访了智能音箱领域的消费者、渠道商、品牌商、制造工厂、方案商、芯片商、语音交互平台以及内容服务商。一窥智能音箱市场的究竟。
文 / 小羿
行业方兴,冰与火同在
前两年,对于互联网和硬件厂商来说,不做智能硬件,你会失去一块蛋糕;而今年的说法是,如果你不做智能音箱,你将落后一个时代。
这是因为,所有的人都笃定,语音交互将成为下一代人机交互方式。而智能音箱就是语音交互的第一个入口级产品。
太平洋的东边,亚马逊的Echo出货量已经超过了1000万台,占据了美国70%的市场。美国智能音箱市场已经崛起。而亚马逊Echo的成功使得Google、微软、Facebook等国外巨头纷纷效仿。
太平洋的另一边,在中国,百度、阿里、京东、联想、小米等科技巨头们也开始布局,尤其是在小米发布了299元的智能音箱之后,整个产业链全面躁动。据一位供应链人士介绍,由于各大互联网公司的布局,目前国内很多OEM厂已全线接到任务。
亚马逊Echo系列音箱
“亚马逊带动的智能音箱市场完全可以在中国复制的,中国市场肯定能达到千万级、甚至上亿级出货量。”已经深耕智能音箱市场两年的魏强这样对网易智能说到。
魏强是灵隆科技的总经理,这家由京东和科大讯飞合资的公司早在2015年8月就推出了第一款智能音箱产品——叮咚音箱。
“从市场容量上,中国市场肯定比美国市场大。从智能音箱的角度看,美国的普及时间要比中国早一到两年。”在音箱市场摸爬滚打了五六年的宋少卿也表示出了同样的观点。
宋少卿是创业公司Sugr的CEO,2014年WiFi音箱兴起的时候,他的团队曾推出了颇受好评的方糖音箱。当WiFi音箱的风潮过去之后,宋少鹏敏锐的观察到了亚马逊Echo的成功,并决定转型方案集成商,目前专门为亚马逊Alexa平台提供认证解决方案。
“去掉了音箱外壳,我们以集成电路+软件的形式,形成一套完整的解决方案。”据宋少卿透露,目前Sugr是Alexa认证的唯二解决方案,这个解决方案包括麦克风处理(如降噪、去回声等技术),Alexa整套系统,音箱的工业设计、结构设计、声学设计、用户体验和APP设计等。
目前,智能音箱的方案集成商在中国有很多,其中很多是为Alexa平台服务的。而国内市场的火爆,让他们纷纷开始将目标转向国内。
押注AI的百度也嗅到了商机,百度度秘事业部总经理景鲲在接受网易智能采访时候透露,百度为深圳做智能音箱的方案集成商,尤其是给亚马逊Alexa提供解决方案的厂商提供了一种盒壳,只要把开发套件放进去,就可以很容易做出一款智能音箱。景鲲希望这些品牌商和方案商,借助DuerOS直接将为Alexa生产的硬件带到中国来。
几乎所有的人都认为,中国智能音箱的需求将是井喷的。
然而,事实却是,中国智能音箱市场销量低迷,消费者并不买账。
据有机构粗略统计,中国智能音箱目前的月销量不足2万台,年销量最多20万台左右。深耕智能音箱市场两年的叮咚音箱,年销量也仅10万台左右。
行业热潮与用户冰冷形成了强烈的反差,在谢殿侠看来却很正常,“中国智能音箱市场起步速度不会很快,成熟度也不会那么高,这是因为智能音箱在中国家庭中扮演的角色远没有美国重要。”
小米推出299元智能音箱
作为国内专攻自然语言理解的创业公司海知智能的CEO,谢殿侠在美国生活了很长时间,他对Echo的使用场景做了如下分析:
“Echo的用户多是家庭主妇,在家中待的时间也很长。Echo的使用场景多是在厨房,美国家庭主妇一般是在做饭的时候听背景音乐。这是因为美国人的厨房大多是开放式厨房,而且他们做饭相对中国的煎炒烹炸来说显得安静,适合听音乐。”
谢殿侠认为,相比之下,中国没有形成家庭主妇的社交群体,晚上又因为应酬较多不在家,而中国家庭一般没有开放式厨房,大多数的习惯是看电视。这几点原因导致中国音箱用户少,使用场景、时间段都被压缩。
“即使中国厂商可以把智能音箱做得比Echo更漂亮、更便宜,内容服务也更好,但是纯粹作为单品音箱来讲,其成功的程度和速度都不及美国。”谢殿侠向网易智能表示。
网易人工智能产品总监刘锐总结说,“因为统计上的问题,中国智能音箱目前销量数据可能比这个数据(月销量2万台)更少,但是不否定未来半年中国公司会用钱把这个量砸出来,但是有多少消费者会去买,这个问题我持怀疑态度。”
老树开花科技为国内很多家科技公司提供智能音箱的继承方案,其CEO朱俊文在智能硬件领域有很多资源整合能力。他这样看待中国智能音箱的初期市场:
“这波智能音箱的市场会分为两大块,一块可以称为高端市场,价格在四五百元左右,这块是各个互联网公司都在主打的;另一块是用一二百元甚至更低价格的智能音箱取代传统存量的蓝牙音箱市场。”
“但是智能音箱肯定达不到手机的销量和地位,能达到大几千万的量已经是很了不起的了。”朱俊文补充到。
谢殿侠认为,像小米AI音箱将价格打到299元,其实是想切传统蓝牙音箱的蛋糕,“如果能将这部分存量市场进行转化也是不错的。下半年如果你看到很多智能音箱降价,或者市场上出现大量一两百元的智能音箱出来的时候,都不会是令人惊奇的事情。”
“未来6-12个月对中国的智能音箱市场很关键,这个时间会出现很多的品牌和产品,可以起到教育市场的作用。”魏强这样预测国内的音箱市场。
至于智能音箱会成为下一个智能手机,还是下一个智能手环的问题,魏强表示他没有答案,“当年手环的风吹来吹去,主要是后端的服务没有做好。音箱前期也有这种问题,没有能够满足用户的服务。
要想让智能音箱逐渐成为用户的必需品,就必须打造杀手级的应用。”
语音交互是一个不可逆的大潮
重金投入智能音箱背后,是这些公司对语音交互大变革的期待。
思必驰CMO龙梦竹经常跑在智能语音的市场前沿,她认为,亚马逊的Echo是一个偶然产品,但Alexa是一个必然。龙梦竹认为,互联网或语音技术公司醉翁之意不在酒,他们背后的算盘大多是,用音箱的火热来推广他们的语音交互技术。
“PC上的入口我们还不知道怎么做,难道就是语音控制开机,关机吗?但它会给用户带来认知上的改变。还有一个比较有意思的是,我们有个合作伙伴还想把语音交互加到马桶上,用语音控制厕所冲水。”龙梦竹半开玩笑的说。
现在的智能语音,就像当年触摸屏兴起后,人们把所有的地方都改成触摸交互一样,要把所有的操作都盲目地改成语音交互。
从目前来看,语音交互趋势是一个不可逆的大潮。
然而,语音交互是一个全新的交互方式,使用场景和落地产品也在不断摸索中。
百度COO陆奇曾说,人工智能落地最关键的是找到场景和商业模式,做出极致体验,并快速迭代。
语音交互本身是很大的一个入口,但是语音交互的入口是不是智能音箱,现在谁也不知道。
但可以肯定,智能音箱是语音交互第一代落地产品。谢殿侠认为,中国的智能音箱市场没有我们想象的那么乐观,但确实会在语音交互初期扮演很大的作用。“但中国智能音箱的活跃度、黏性、留存率未必有美国市场那么高。”
魏强说,智能音箱是一个入口级的产品,他的盈利点不是在硬件本身,而是在未来的后端的内容服务,靠硬件赚钱不是我们的主要目标。“智能音箱我们已经做了两年,产品体验是最重要的,一方面是提高用户对产品的理解,另一方面要把后台的服务做好。”
但在龙梦竹看来,智能音箱不应该被叫做智能音箱,“没准有一天,有个厂商做了一个机器人形的智能音箱,它就爆发了呢?它只是外形是机器人或者音箱,如果你们现在想贴概念,我更愿意把它定义为新型的智能产品,弱化智能音箱这个概念。关键是找到精准的受众和场景。”龙梦竹说到。
在朱俊文看来,目前语音交互上有三个入口级的产品:智能音箱、智能故事机、智能家电。“三个产品周期不一样,音箱处于市场培育期,儿童智能故事机今年进入快速发展,而智能家电明年才能完成市场教育。另外,智能灯的需求也可能会起来。”
根据朱俊文的观点,中国智能音箱销量爆发还是在明年。“未来竞争的焦点是在智能云平台上面,其中互联网公司是很重要的力量,整个行业希望有一个完整的云平台解决方案来做。”朱俊文说到。
而百度的DuerOS将使用场景的重点落在了家庭、车载、手机等能够快速迭代的场景中。景琨认为,这三个场景对语音的需求是逐渐的升温的,家庭和车载的需求是从0到1,手机上的语音助手以前就有,后续它的角色会越来越重要。“电视绝对是属于一个未来语音交互的重要载体”,景琨认为,有语音的能力之后,用户跟设备的交互黏性以及活跃度会急剧提高。
刘锐则看好家庭和车载两个场景,“语音交互用在智能家庭场景中,需要有输入、输出,还要有一个信息呈现中心。这个信息呈现中心,必须要一个大一点的屏幕,可能是电视。车载场景可能还需要网络再好一点,比如说5G的普及。”
在谢殿侠看来,智能音箱在中国是一个新兴的市场,而电视、冰箱、空调却是一个存量市场。“没准智能语音交互的电视会跑得更快。”谢殿侠称,“未来真正在家庭中起到重要作用的,可能还是电视,另外我还看好智能台灯、儿童故事机等。”
去中心化:再谈智能家居控制论
在谢殿侠看来,从人机交互发展的维度论角度,语音交互最大的贡献是提供了控制维度。
“现在的手机APP与过去PC上的网页和软件有什么区别?主要的区别就是APP进行了升维,这个维度就是诸多的传感器、麦克风以及相机。”谢殿侠解释到,“因为有了GPS传感器,才有了滴滴、Uber、ofo这些公司;这个基础上再加上语音、麦克风,就有了微信、WhatsApp;如果再加上摄像头,就有了Instagram。”
根据谢殿侠的观点,当APP升维之后,就产生了PC时代没有的公司和产品。未来有了语音交互之后,就又增加了一个维度,就是控制维度。谢殿侠认为,过去的传感器只是感受,现在的传感器是控制,想象力非常巨大,未来的产品形态会发生翻天覆地的变化。而智能音箱,只是大时代下的冰山一角。
但是,这里有个坑:智能音箱不应该成为中枢控制设备,去控制其他家电,而应该是去中心化的。就像朱俊文所说,没有Echo之前,很多人都在谈中控,这里的核心是中控模式,但是亚马逊的Echo是去中心化的。
“语音交互机器人是未来的发展方向,未来的语音交互将是Always On(实时在线),家庭中所有的电器都应该具备语音交互能力。”谢殿侠这样憧憬到。
刘锐认为,未来的语音采集端应该是分布在家庭各个地方,就像Echo Dot一样。“真正能做到智能化的体验的应该是,遍布在家庭各个角落,达到去中心化的效果。”
也就是说,智能家居控制这件事,目前还是一个美好的想象。
“Echo最初打动人的最重要的功能是开关灯,反馈很强、很迅速,正反馈这是人性中很根本的一点。”刘锐说到,Echo火起来有一个点确实是因为智能家居,但是中国智能音箱市场如果押注在智能家居控制上,目前是一件非常有风险的事情。
魏强认为,家居物联网是一个过程,必须形成一套统一的标准。智能家居虽然是个趋势,但是迭代更新速度太慢,实现的路径会很曲折。
云知声Pandora项目负责人张鹏认为,用语音控制家居是未来的趋势,但是中控是不是一定必须要用音箱来呈现,可以是任何型态的存在。
但是,在宋少卿看来,智能音箱不一定非要控制家居才能成为入口,只要能承载流媒体播放、信息播放、信息获取分发,就已经是一个入口。
“在智能家居真正实现之前,所有的预测都只是一种言论。”刘锐说,预测未来最好的办法是加入并创造它。
起码,从目前来看,智能家居其实是“皇帝的新装”。