急速转型、All in AI的背景下,百度已将宝押在了创立仅半年的对话式人工智能系统DuerOS上面。
在百度COO陆奇的整体规划下,百度大脑+百度智能云已经成为了百度AI战略的两大支柱,这其中,DuerOS又成为了百度大脑的最重要组成部分。
DuerOS创立于今年1月,归属度秘事业部,由总经理景鲲直接负责。依据百度的战略思路:iOS与Android是触摸交互时代的霸主,而语音交互会成为下一个人机交互时代,在这个新时代同样需要一个基于语音的人机交互界面,不同于触摸交互,语音交互受到了不同语言的制约,而百度要抢占中文语音交互系统的战略高地。
被百度寄予厚望的DuerOS,目标是要打造一个基于语音交互的全新开放平台,这个平台通过API、SDK为合作伙伴提供创新技术工具,输出AI技术能力,一起合作共赢。
近日,网易采访了DuerOS的直接负责人景鲲,他作为微软前首席研发总监、度秘事业部总经理、人工智能产品委员会主席,分享了语音技术的发展情况,以及如果让语音交互技术落地和发展应用场景。
在听清的问题上,百度主要做了麦克风阵列、回声消除、语音唤醒、远场识别几项技术。其中,自定义语音唤醒技术可能是百度收购KITT.ai以后具备的最大技术优势。
但目前的现实情况普遍是,虽然很多企业宣称其语音识别准确率达到了97%以上,降噪和远场识别做的也足够好,实验室数据足够亮眼,但在实际的应用场景中,还是会出现无法唤醒的情况。DuerOS同样面临着这些问题,如景鲲所说,近场语音已经基本上成熟,但是远场语音识别在不懂的环境下需要逐渐被攻克。
在听懂的问题上,景鲲宣称百度可能是国内唯一能解决听懂问题的。景鲲的理由是,解决自然语言理解的问题,关键是要做数据训练,而DuerOS借助百度搜索有了数据上的优势。
“在人机交互的过程当中,其实就跟原来人们用百度搜索一样的,从关键字变成了自然语言,都是表达和需求之间的一个契合。“景鲲说到。也就说,如果DuerOS依托百度搜索,就可以调用十亿级的知识图谱实体、语音调用和音频数据、千亿的图片和网页等数据,这是DuerOS的最大优势所在。
即便如此,百度依然不能忽视人才的作用。今年以来,百度先后收购了渡鸦、KITT.AI等AI技术公司,以弥补自身技术上存在的不足。景鲲说,百度收购技术公司的思路基本上是,与自己技术有互补性,或者客户有特别强的需求但百度还不具备,我们就会考虑收购。据悉,渡鸦在人机交互方面有很多创意产品和应用,而KITT.AI在开源自定义上(如自定义语音唤醒词)有着很强的实力。
据景鲲透露,截止目前DuerOS的生态合作伙伴已经达到120家(包括硬件、芯片、方案、内容等领域厂商),但距离平台的数量级还差得很远,毕竟仅运营了半年时间。景鲲说,“我们希望一起打造高端的Case,一方面让他们自己的产品更好,另外一方面我们也能够覆盖越来越多的长尾。”
面对需求千差万别的开发者和厂商,DuerOS在普适性上似乎还有很长的路要走。作为平台,DuerOS如何去权衡厂商和个人开发者使用服务的完成度和自由度?对此问题,景鲲表示,不管开发者和厂商是直接拿来使用,还是进行二次开发,DuerOS都要提供一个至少能够完成基本服务的系统。
“百度正在抱着开放的心态来做这件事,比如很多合作伙伴希望把自己的内容和服务放到DuerOS的后台去支撑,后者仅提供听清和听懂的能力就可以了,这时候DuerOS也同样要支持。”景鲲说。
在DuerOS的内容服务接入上,景鲲认为不同产品、不同用户对语音内容服务的要求不一样,但用户的需求跟原来的搜索具有很强的联系。“我们希望DuerOS是一道门,用户通过它去获取原来百度搜索上已经连接的信息服务。”景鲲说。
对于目前的平台运营以及如何选择合作伙伴,景鲲说,目前来讲我们不会去挑客户,就算是一些个人开发者,百度也会去支持。“我们在官网上开发了很多不同的套件和解决方案,其实是希望每个小企业、大企业还有个人开发者都能够开发这样的设备。”
关于平台的商业化方面,景鲲告诉网易智能,目前DuerOS不会考虑商业化,现在最大的问题是怎么让普通消费者知道语音对话设备,让语音对话交互将成为一个标配。未来,新的人机交互模式势必会带来大量的商业机会和新的模式。“但是现在来讲,最主要的还是用户体验和用户认知。”
基于这种思路,DuerOS首先将使用场景的重点落在了家庭、车载、手机等能够快速迭代的场景中。景鲲认为,这三个成精对语音的需求是逐渐的升温的,家庭和车载的需求是从0到1,手机上的语音助手以前就有,后续它的角色会越来越重要。
据IDC预测,到2020年51%的智能汽车企业、68%的智能手机与穿戴设备企业都将在产品中采用对话式人工智能系统。
据景鲲介绍,DuerOS已经接入了120多家企业的应用和产品,比较重要的有,与国安广视合作推出的智能机顶盒,在长沙、石家庄等地都有开展机顶盒免费换的活动,直接打入普通家庭生活中。另外,百度与小鱼在家合作推出了分身鱼陪伴机器人,还与极米合作推出的激光无屏电视,都内置了DuerOS系统支持语音交互。
但是,景鲲并不认为这会造成大量同质化的产品流入国内,他认为外观、声腔、喇叭的不同,都可以做成不同的产品。
景鲲希望这些品牌商和方案商,借助DuerOS直接将为Alexa生产的硬件带到中国来。在他们看来,如果系统门槛越低,集成越方便越便利。景鲲说,“对于这一部分的用户,我们是开创了一扇很容易进入中国市场的大门。”
其次,景鲲认为,智能语音产品已经成为传统家电厂商新的增长点,所以不管消费者是否接受,下一代的电视、空调、洗衣机可能都会带语音交互。在这其中,景鲲特别看好智能电视,“电视绝对是属于一个未来语音交互的重要载体”。景鲲还称,有语音的能力之后,用户跟设备的交互黏性以及活跃度会急剧提高。但具体的数据如何,景鲲称现在还不方便透露。
景鲲认为,DuerOS想要成为语音交互时代的Android,首先要跨越技术的门槛。在Android和iOS出来之前,那个时候也有触屏,但是电阻屏很不方便。在那个时代,Android和iOS解决了屏幕的问题,解决了手触摸的问题,解决了这两个核心的技术问题之后,整个手机产业开始腾飞。
“我觉得本质是一样的,在现在也要解决听清、听懂这几个核心技术问题,这几个核心技术问题如果不解决,是不可能让整个产业有一个大爆发的。”景鲲表示,我觉得在现在这个时代,是一个技术的瓶颈期,攻克了技术瓶颈之后,语音交互的发展本质上跟Android时代是一样的。
面对语音交互领域国内外巨头的竞争和布局,景鲲称,大家看到的是一样的方向,就说明这是一个巨大的机会,而百度又是中文领域最大的搜索引擎,可以利用自己的优势做出最基础的生态。
就像陆奇所说,长期来看DuerOS对于百度意味着巨大的机会,但目前的工作重点是要打造好产品,以及健康的生态系统,这也是一大挑战。