文/杨雪
世界上最伟大的销售员之一罗永浩在昨天的锤子科技 2016 年新品发布会上演讲了近三个小时。这一次,他除了推销了锤子科技最新生产的 Smartisan M1 以及 Smartisan M1L 外,依然将重点放在了 Smartisan OS 3.0 系统的介绍上。
最激动人心的部分当属语音识别、Bigbang 和 Onestep 三项重要功能。这其中,除了我们熟知的讯飞语音识别,还有那家被不小心打错名字的公司「三角兽」。简单来说,罗永浩展示的「炸开」功能(Bigbang 语义识别)就是采用三角兽的语义技术。
Smartisan OS 3.0 中最新的 Bigbang 功能将三角兽顶层的 NLP(自然语言处理)和语义相关技术整合到手机里,重新包装了用户交互体验。最终呈现出来的,正如老罗在发布会上所展示的那样:那些大段的文字——不管它们是以图像还是文字的方式存在,不管它们是中文还是英文——都可以被切割成「段」,以被更加方便的复制、粘贴。
三角兽正在做的是提供开放域聊天系统和端对端对话解决方案。他们将数百个垂直领域归纳为几个模型,将自然语言理解,对话管理和自然语言生成等技术,生成完整的解决方案,是一家中文智能交互系统的研发商。用一个例子简单概括,计算机视觉的公司负责机器人的眼睛,而三角兽负责机器人的语言系统——不仅仅是「说」,更重要的是如何说,怎么说,说什么。
三角兽 CEO 王卓然曾在英国学习十年,是 University College London 的博士。因为国外的学习经历,王卓然在智能交互领域研究深入,他先后在东芝、百度的人工智能相关部门任职,现已成为智能交互、机器学习和垂直领域对话系统方面的专家。技术合伙人亓超则是微软小冰的技术创始人。
两人相遇于百度度秘的团队。当 2016 年人工智能大热,王卓然认为语言智能交互是大有可为的领域,便拉上亓超一同创业。2016 年 2 月,他们同联合创始人马宇驰一起成立了三角兽科技,目标是打造一套基于 NLP、深度学习技术的中文聊天对话系统。
左起分别为亓超、马宇驰、王卓然
王卓然将语音方面的人机交互分为三个领域:闲聊、单轮问答和多轮对话。简单来讲,闲聊就是在人没有具体需求,只是想要寻求陪伴、开心的时候与机器的交谈,比如调戏微软小冰;单轮问答的技术路线更倾向于一个智能化的搜索引擎,人与机器之间是一问一答的形式;而最复杂的属于多轮驱动任务的对话。机器需要根据人说话的上下文跟踪,来判断需求,完成任务,比如订票、帮忙买咖啡等等。
目前中国市场上出现了很多「傻瓜式」机器人,王卓然说,这样的境况源于他们底层的语音识别技术没有做好。而三角兽则能够在聊天当中加入各种各样的任务,这也综合了王卓然和亓超的技术优势。
不管是初创公司还是大公司,都面临着同样的问题:没有足够多的、适合人工智能介入的场景。三角兽目前的做法是与 B 端的合作公司一同探索,验证不同的使用场景。「理想情况下是在这个过程每一步趟出一些场景是比较有广泛的 2C 的市场,但这个市场足够大可以去切。」亓超说。
他们的技术目前已经被验证可应用的方向主要集中在智能家居、智能穿戴、智能车载领域。主要的合作伙伴已经有很多,已经面向用户的 Rokid 机器人;优必选,他们选择将这个智能交互的解决方案交给三角兽;想成为「国内特斯拉」的威马汽车则需要三角兽帮忙完成一个智能的汽车中控台以及刚刚开完新品发布会的锤子科技。
这些也是目前我们可以想象的,凡是需要语音交互的场景,三角兽都可以将自己的解决方案应用其中。
除此以外,三角兽目前集中探索的另一个主要领域是二次元与泛娱乐市场。他们正在将这套聊天机器人进行性格定制,帮助一些文娱公司「复活虚拟角色」。想象一下,不久的将来,我们就可以与自己喜欢的形象互动,甚至将他们「锁定」在身边。
王卓然认为三角兽的技术在二次元领域的应用前景足够大,「我们想要那些虚拟的角色复活,让它可以跟你自由地对话。二次元用户把很多虚拟角色当成自己生命中的一部分,但这个角色其实它不能跟你交互。如果我让他给你陪伴的同时能够去聊天,不是将整个产业做了一次升级吗?」
「在这个层面上,这个技术我可以说只有我们能做。要让每个角色有不同的性格,能体现它是萌妹子还是御姐,这对聊天是很大的一个挑战。但我们有这个信心,因为亓超在这方面有足够积累,他知道这个应该怎么走,大方向定了那就一步一步去解决路上的问题了。我们不断地在去完善这个技术,希望年底能看到一些比较能体现这个技术的产品或者 Demo。」
而需要王卓然和亓超去解决的问题还有很多,首先需要让虚拟角色在需要体现性格的句子上体现出性格,并且需要保证性格的一致性。其次,他们需要将产品送到用户手中,并且不断得到反馈。用技术手段去处理用户的聊天反馈,才能得到个性化的虚拟角色。
将人工智能真正带入人们的日常生活充满挑战。但是王卓然对此仍然抱有乐观预期,「人工智能颠覆人们生活是早晚的事情,只是这个颠覆有一个中间过程。它要首先成为我们生活的补充,应该是从你现有的交互模式,从电脑到手机,到你将来可能习惯你身边有一个东西,你可以通过语音,或者通过一个什么方式用自然语言去交互。人工智能的第一步不是取代你的手机、电脑,而是它可能是在你不方便使用这东西的时候,有一个可以给你增补的选择。」
这个市场听上去足够大。但目前的主要困难依然在于,需要有人去培养用户跟一个物体或者虚拟角色对话的习惯。当人们意识到,说一句话就能把事情解决的时候,王卓然们的机会才真正到来。
当然,未来已来,我们都在路上。
题图来自:云摄影 V.photos
内容由极客公园提供授权发布。