IT思维

文章页右侧顶部广告

对话景鲲:DuerOS要做语音交互时代的Android

作者 | 小羿

急速转型、All in AI的背景下,百度已将宝押在了创立仅半年的对话式人工智能系统DuerOS上面。

在百度COO陆奇的整体规划下,百度大脑+百度智能云已经成为了百度AI战略的两大支柱,这其中,DuerOS又成为了百度大脑的最重要组成部分。

DuerOS创立于今年1月,归属度秘事业部,由总经理景鲲直接负责。依据百度的战略思路:iOS与Android是触摸交互时代的霸主,而语音交互会成为下一个人机交互时代,在这个新时代同样需要一个基于语音的人机交互界面,不同于触摸交互,语音交互受到了不同语言的制约,而百度要抢占中文语音交互系统的战略高地。

被百度寄予厚望的DuerOS,目标是要打造一个基于语音交互的全新开放平台,这个平台通过API、SDK为合作伙伴提供创新技术工具,输出AI技术能力,一起合作共赢。

近日,网易采访了DuerOS的直接负责人景鲲,他作为微软前首席研发总监、度秘事业部总经理、人工智能产品委员会主席,分享了语音技术的发展情况,以及如果让语音交互技术落地和发展应用场景。

All in AI,DuerOS首要解决听清、听懂的问题

在景鲲看来,语音交互技术首先要解决的是听清和听懂的问题。

在听清的问题上,百度主要做了麦克风阵列、回声消除、语音唤醒、远场识别几项技术。其中,自定义语音唤醒技术可能是百度收购KITT.ai以后具备的最大技术优势。

但目前的现实情况普遍是,虽然很多企业宣称其语音识别准确率达到了97%以上,降噪和远场识别做的也足够好,实验室数据足够亮眼,但在实际的应用场景中,还是会出现无法唤醒的情况。DuerOS同样面临着这些问题,如景鲲所说,近场语音已经基本上成熟,但是远场语音识别在不懂的环境下需要逐渐被攻克。

在听懂的问题上,景鲲宣称百度可能是国内唯一能解决听懂问题的。景鲲的理由是,解决自然语言理解的问题,关键是要做数据训练,而DuerOS借助百度搜索有了数据上的优势。

“在人机交互的过程当中,其实就跟原来人们用百度搜索一样的,从关键字变成了自然语言,都是表达和需求之间的一个契合。“景鲲说到。也就说,如果DuerOS依托百度搜索,就可以调用十亿级的知识图谱实体、语音调用和音频数据、千亿的图片和网页等数据,这是DuerOS的最大优势所在。

即便如此,百度依然不能忽视人才的作用。今年以来,百度先后收购了渡鸦、KITT.AI等AI技术公司,以弥补自身技术上存在的不足。景鲲说,百度收购技术公司的思路基本上是,与自己技术有互补性,或者客户有特别强的需求但百度还不具备,我们就会考虑收购。据悉,渡鸦在人机交互方面有很多创意产品和应用,而KITT.AI在开源自定义上(如自定义语音唤醒词)有着很强的实力。

起步阶段:要想成为平台,首先让用户对语音交互有认知

根据景鲲的说法,DuerOS的目标是成为人工智能时代的Android。“在时代的变革过程中,Android从底层消费层入手,解决了基础的门槛,让很多人更容易进入这个行业来开发自己的手机,他们可以定义自己的手机,在解决一些基础应用需求的同时,也让整个市场更加丰富。我们希望DuerOS也扮演一样的角色。”

据景鲲透露,截止目前DuerOS的生态合作伙伴已经达到120家(包括硬件、芯片、方案、内容等领域厂商),但距离平台的数量级还差得很远,毕竟仅运营了半年时间。景鲲说,“我们希望一起打造高端的Case,一方面让他们自己的产品更好,另外一方面我们也能够覆盖越来越多的长尾。”

面对需求千差万别的开发者和厂商,DuerOS在普适性上似乎还有很长的路要走。作为平台,DuerOS如何去权衡厂商和个人开发者使用服务的完成度和自由度?对此问题,景鲲表示,不管开发者和厂商是直接拿来使用,还是进行二次开发,DuerOS都要提供一个至少能够完成基本服务的系统。

“百度正在抱着开放的心态来做这件事,比如很多合作伙伴希望把自己的内容和服务放到DuerOS的后台去支撑,后者仅提供听清和听懂的能力就可以了,这时候DuerOS也同样要支持。”景鲲说。

在DuerOS的内容服务接入上,景鲲认为不同产品、不同用户对语音内容服务的要求不一样,但用户的需求跟原来的搜索具有很强的联系。“我们希望DuerOS是一道门,用户通过它去获取原来百度搜索上已经连接的信息服务。”景鲲说。

对于目前的平台运营以及如何选择合作伙伴,景鲲说,目前来讲我们不会去挑客户,就算是一些个人开发者,百度也会去支持。“我们在官网上开发了很多不同的套件和解决方案,其实是希望每个小企业、大企业还有个人开发者都能够开发这样的设备。”

关于平台的商业化方面,景鲲告诉网易智能,目前DuerOS不会考虑商业化,现在最大的问题是怎么让普通消费者知道语音对话设备,让语音对话交互将成为一个标配。未来,新的人机交互模式势必会带来大量的商业机会和新的模式。“但是现在来讲,最主要的还是用户体验和用户认知。”

落地应用:看好家庭和车载等场景 智能音箱和电视需求或井喷

语音交互是一个全新的交互方式,使用场景和落地产品也在不断摸索中。陆奇曾说,人工智能落地最关键的是找到场景和商业模式,做出极致体验,并快速迭代。

基于这种思路,DuerOS首先将使用场景的重点落在了家庭、车载、手机等能够快速迭代的场景中。景鲲认为,这三个成精对语音的需求是逐渐的升温的,家庭和车载的需求是从0到1,手机上的语音助手以前就有,后续它的角色会越来越重要。

据IDC预测,到2020年51%的智能汽车企业、68%的智能手机与穿戴设备企业都将在产品中采用对话式人工智能系统。

据景鲲介绍,DuerOS已经接入了120多家企业的应用和产品,比较重要的有,与国安广视合作推出的智能机顶盒,在长沙、石家庄等地都有开展机顶盒免费换的活动,直接打入普通家庭生活中。另外,百度与小鱼在家合作推出了分身鱼陪伴机器人,还与极米合作推出的激光无屏电视,都内置了DuerOS系统支持语音交互。

在产品品类上,景鲲认为智能音箱的需求将是井喷的。据景鲲透露,百度为深圳做智能音箱的方案集成商,尤其是给亚马逊Alexa提供解决方案的厂商提供了一种盒壳,只要把开发套件放进去,就可以很容易做出一款智能音箱。

但是,景鲲并不认为这会造成大量同质化的产品流入国内,他认为外观、声腔、喇叭的不同,都可以做成不同的产品。

景鲲希望这些品牌商和方案商,借助DuerOS直接将为Alexa生产的硬件带到中国来。在他们看来,如果系统门槛越低,集成越方便越便利。景鲲说,“对于这一部分的用户,我们是开创了一扇很容易进入中国市场的大门。”

其次,景鲲认为,智能语音产品已经成为传统家电厂商新的增长点,所以不管消费者是否接受,下一代的电视、空调、洗衣机可能都会带语音交互。在这其中,景鲲特别看好智能电视,“电视绝对是属于一个未来语音交互的重要载体”。景鲲还称,有语音的能力之后,用户跟设备的交互黏性以及活跃度会急剧提高。但具体的数据如何,景鲲称现在还不方便透露。

要想成为超级平台,还有很长的时间和很长的路要走

不久前,百度公布了2017年第二季度未经审计的财报。财报显示,Q2百度营收为208.74亿人民币,同比增长14.3%,净利润44.15亿人民币,同比增长82.9%。百度将这些增长归功为DuerOS带来的开放生态。实际上,语音交互的落地应用还处于早期,不管是在技术、内容服务还是场景打造上都还有很多的问题要解决。

景鲲认为,DuerOS想要成为语音交互时代的Android,首先要跨越技术的门槛。在Android和iOS出来之前,那个时候也有触屏,但是电阻屏很不方便。在那个时代,Android和iOS解决了屏幕的问题,解决了手触摸的问题,解决了这两个核心的技术问题之后,整个手机产业开始腾飞。

“我觉得本质是一样的,在现在也要解决听清、听懂这几个核心技术问题,这几个核心技术问题如果不解决,是不可能让整个产业有一个大爆发的。”景鲲表示,我觉得在现在这个时代,是一个技术的瓶颈期,攻克了技术瓶颈之后,语音交互的发展本质上跟Android时代是一样的。

面对语音交互领域国内外巨头的竞争和布局,景鲲称,大家看到的是一样的方向,就说明这是一个巨大的机会,而百度又是中文领域最大的搜索引擎,可以利用自己的优势做出最基础的生态。

就像陆奇所说,长期来看DuerOS对于百度意味着巨大的机会,但目前的工作重点是要打造好产品,以及健康的生态系统,这也是一大挑战。

网易智能

网易智能(公众号 smartman163),定位人工智能等前沿科技领域的垂直媒体及产品服务平台,面向人工智能等领域的从业者和关注者。运营栏目包括大型策划栏目《AI英雄》,行业研究与分析栏目《AI研究院》等,提供原生内容、新闻策划、数据报告、产品评测等服务。

发表留言

Return to Top ▲Return to Top ▲