公众号/将门创投
From: MIT Technology Review;
编译:Iris
尽管Siri已能够和用户玩成语接龙、猜歌词的互动游戏,当要正常对话沟通时,它却陡然变得迟钝和搞笑。如何回应这些超出内置指令的问题,也是过去诸多AI聊天机器人难以攻克的难题。不过,Facebook的机器人Blender已经可以胜任这个工作,它不仅能完美地接上话题,而且能够讲笑话、鼓励用户等,有“以假乱真”的效果。
Blender不仅能执行一些简单的口令,而且能应对各种复杂的谈话。Facebook的工程师斯蒂芬•罗勒甚至公开表示:“如果你解决了AI对话的问题,你就相当于解决了关于AI的所有难题。”
可以说,Blender是AI先进功能的集大成者,它最近也获评“最先进聊天机器人”,势头胜过Apple和Google等研发的虚拟小助理。
不仅仅会讲笑话——
有问必答,会跟你谈天说地的机器人
海量的训练数据是Blender开启顺畅聊天模式的动力源泉。它的聊天数据参数累计达到94亿个。在经过15亿个公开的Reddit对话数据训练后,它已能够响应大多数简单的谈话。在输入更多带有人类情绪的对话数据后,它学会了换位思考,如果用户对它说:“我升职了”,它会高兴地回应:“恭喜!”,在谈话中与用户形成了情绪互动。
Blender具有共情能力的对话例子
团队同时与Blender进行了信息密集型对话,传授多领域的知识,以便它应付简单的数学和语法问题。其数据库规模比谷歌的聊天机器人Meena的数据采集库要大3.6倍,大库存也意味着它不能在单个设备上运行,而必须依托于两个计算芯片来共同负荷高运行功率
在实验阶段,研究人员测试与不同的Blender聊天
找出它们的特性和突破口
在Blender上市之前,谷歌曾宣称Meena是世界上最好的聊天机器人。但是,在Facebook的最新测试中,有75%的受测试用户认为Blender比Meena更吸引人,67%的人觉得Blender听起来更像人类。Blender甚至骗过了49%的用户,让他们误以为自己正在跟真人对话。
Facebook方公布的Blender与Meena的数据对比图
任何开源聊天机器人系统都要面对的一个挑战,就是它们绝不能说出刻薄或有偏见的话语。团队为此从用于微调的三组语言信息数据中特别过滤出那些不太合适的语言,但由于Reddit数据集实在太大,他们并没有完全实现“零坏话”的过滤成果。
即便如此,团队依然希望他们能找到更好的安全机制,比如利用一种能反复检查聊天机器人反应的刻薄语言分类器,来将这些不好的话语进一步进行筛选并过滤掉。然而,研究人员发现,这种方法并不全面。有时候,像“这看起来不错呢”这样的句子看起来好像并没有什么问题,但在非常敏感的特殊语境中,它可能会被误解为一种刻薄而有偏见的回复。考虑到对话中会出现的多种语境的不可预测性,要将它们逐一过滤掉,几乎是不可能的事。
目前,Facebook的AI团队也对开发比Blender还要更复杂的对话机器人项目颇感兴趣。在Facebook新一期的工作预想中,他们所要研发的对话机器人不仅能对文字做出反应,还能对视觉提示做出反应。举个例子:通过一个名为“图像聊天”的系统,机器人可以对用户发送的照片进行有趣的评论,甚至和他们来一场“表情包battle”。
Facebook AI研发聊天机器人项目的进步曲线图
长远来看,Blender并不是Facebook最后的智能聊天机器人,它也不会是世界上唯一的、最好的聊天机器人。我们完全可以期待一个更完善、更有个性的机器人出现在社交平台上,能接我们抛出的流行梗,也能说一些幽默的笑话,让我们迷上这种和机器人对话的“亦假亦真”的感觉。