文/ Devin Coldewey
好了,不要惊慌,但计算机已经创造出自己的秘密语言,而且现在很可能正在对我们评头论足呢。好吧,这种说法过于简单化了,而且后半段索性说得不对。不过,谷歌的人工智能研究人员最近遇到了一个非常吸引人但到底存不存在还说不准的发展动态。
你可能还记得,在今年 9 月份的时候,谷歌宣布自己的 神经机器翻译系统(GNMT)上线 了,它能够利用深度学习在两种语言之间进行更好、更自然的翻译,太酷了!
在取得这项成就之后,GNMT 的开发人员对一件事情感到很好奇。如果你教翻译系统把英语翻译成韩语,再把韩语翻译成英语;或者是教它把英语翻译成日语,再把日语翻译成英语……那么它能不能直接把韩语翻译成日语,不用依靠英语作为两种语言之间的桥梁?研究人员制作了下面这张 GIF 动画,用以展示他们称为“zero-shot 翻译”的概念(橙色部分):
事实证明, 这是可行的!GNMT 能够在两种没有进行过明确关联的语言之间产生出“合理的”翻译结果。请记住,其中没有用到英语。
不过,这引出了第二个问题。如果计算机能够在之前没有关联的概念和词语之间建立联系……这是否意味着计算机已经对那些词语形成了一种共享概念,意味着它对词语有了更深层次的理解,而不仅仅在不同语言之间进行等价关联?
换言之,计算机有没有创造出自己的内部语言,并使用它来表达概念,从而在不同语言之间进行互译?考虑到 GNMT 神经网络存储空间中句子彼此关联的复杂程度,谷歌语言和人工智能的研究人员认为,它已经做到了。
这种“中间语言”似乎是作为一种更深层次的表达存在的,它可以看出三种语言句子和词语之间的相似性。除此之外,我们就很难说出别的门道了,因为复杂神经网络的内部过程是出了名的难以描述。
那可能是一些复杂的东西,或者也有可能是一些简单的东西。但是,这种语言存在的事实本身——系统通过原创语言来辅助自己对未学习概念的理解——从哲学上说,堪称非常强大的东西。
你可以在 Arxiv 阅读这篇介绍研究人员成果的论文,其中主要讲的是高效率的多语种翻译,但也谈到了这种神秘的中间语言。毫无疑问,由系统创造和应用的更深层次概念还需要进一步的研究。在此之前,让我们把期望值放到最低。
翻译:王灿均(@何无鱼)
Google’s AI translation tool seems to have invented its own secret internal language
内容由 TechCrunch中国 提供授权发布,未经许可谢绝转载。