Bryan Catanzaro曾于2014年6月加入百度。他在百度带领了一个15人的研发团队,探索语音识别领域,训练和部署深度神经网络的工具和方法。在来百度之前,他在英伟达就职了3年,并于2016年9月离开百度,重新加入英伟达,成为英伟达深度学习应用研究部门的副总裁。
我主要关注人工智能为变革所做出的贡献,人工智能正在使众多公司以及世界经济运作方式发生改变,这就是因为它切实能够帮助人们在工作中提升效率。人类所创造出的工业化社会,体现在高度的机械化以减少体力劳动。人工智能正在制造能够进行智力工作的工具。
我们可用摄像机或音频等传感器来测量,或者我们可以用文字记录等形式记录下来。解读这些数据并做出决定的过程,就是一种脑力劳动,而我们可以在此领域创造出越来越智能的机器。我认为人工智能的定义更趋于意识和感知,而我认为人类整体对此所做出的理解则有所偏差。
当然,也有一些人对制造通用性智能机器非常感兴趣,但我认为那是更遥远的事情,而且我不太了解如何定义通用智能机器,独立研究此项工作就更不可能实现。我的工作主要集中于更加实际的项目——帮助计算机理解数据并做出决策。
实际上,它可能比人类更了解应该如何灌溉。这是一种非常狭义的智能,但却非常实用。所以,我的确认为这可以被看作是智能的一种形式。现在,暂不探讨灌溉的本质以及其对地球的危害,抑或人类对地球干预的历史等等。所以它的角度很狭隘,但很实用,而且它的智能以自己的方式体现。
我们每天在互联网上与之互动的许多产品都使用人工智能系统,它们为我们提供了价值。它们为我们提供社交媒体消息流,提供推荐和地图,它们提供像Siri或Android助手这样的对话界面。
所有这些东西都是由人工智能驱动的,但仍处于起步阶段。有太多的事情我们还不知道如何去做,还有很多有待发掘的问题需要思考解决。因此,我相信在未来相当长的一段时间里,我们将继续看到人工智能应用在新领域里出现。
我们有非常复杂的世界模型,也许我们认为这是理所当然的,因为每个人似乎都很容易理解。这不是你必须在学校里学习的东西。但这些模型实际上非常有用,而且它们比我们目前用人工智能技术构建的模型要复杂得多,使用也更普遍。
关于迁移学习的问题,我觉得我们很擅长在我们目之所及的范围内进行迁移学习。在很多情况下,人工智能在迁移学习方面会做的更好。实际上,关于世界是如何构造的,物体是怎样的,物体实际上的组成等可能会有更少的假设。我认为我们不应该忘记我们所做的事情并不是事出无因。我们根据本能行事,且其非常复杂。
我确实认为童年是人类智力发展非常重要的一个部分,它在人类智力发展中扮演了非常重要的角色,因为它帮助我们建立和校准这些世界的运作模式,然后我们在各种各样的事情中都有所应用,比如前面提到的猎鹰雕像问题。
计算机也需要这样的东西吗?有可能。我们得拭目以待。我认为计算机的不同之处在于,它们在传输信息时表现得更出色。所以这可能是它接受一次训练,就可以重复使用的技能——而不像人类,“复制”一个人的过程既耗时又不精确。
所以至少在图像识别方面,我认为迁移学习很有效。对于其他类型的域名,可能会更有挑战性。但至少在图像识别方面,我们已经找到了一组更高级的功能,它们能够有效区分各种不同类型的物体,甚至是我们之前从未见过的物体。
我感到非常兴奋,计算机能够持续学习、理解音频,前景越来越好。然而,我想指出的是,“对话和交流”是人类的超级能力所在。人类有很多用于对话和理解交流语言的内置机制。讲话途径和听觉途径一起进化,所以它们能够完美匹配。
我记得我过去做过的一些关于语音识别的实验,识别性能对那些实际上是人类无法听到的压缩失真音频非常敏感。我们可以像这样录制一段录音,然后用一种听起来完全相同的方式压缩它,并且观察到我们模型识别准确率的显著差异。
这有点令人不安,因为我们试图训练模型,使其不受到人类不受影响变量的影响,但实际上很难做到这一点。我们当然还没有达到这个目标。我们一直在努力提高我们对所要解决的问题的理解,这样我们就能避免这些事情,但仍有更多的工作要做。
我认为我们肯定有可以回答类似问题的数据库以及知识基础。问题是,这样的问题真的超出了大多数个人助理的领域,因为老实说,花絮非常有趣,但它们并不像可以设置定时器、查看天气或播放歌曲的机器人那样有用。所以这些都是那些系统所关注的事情。
这将改变房地产市场,因为我们不一定把车停在我们要去的地方。这将改变一些经济状,因为在经济上会有新的可行的交付机制。我认为智能可以帮助机器人在道路上行驶,这是我最感兴趣的下一件事,我认为它真的会改变一切。
就游戏和其他东西而言,电脑比人更擅长游戏,这很有趣,因为我觉得,硅谷思维有时候是一个非常线性的智力概念。一他们使用这种线性的智力,让一些人感觉受到人工智能的威胁,因为他们推断出人工智能在这个线性范围内变得越来越智能,这将导致各种各样的意外事件,比如Lee Sedol输掉了比赛。
智力是一种多维度的东西。事实上,电脑更擅长围棋这件事并没有对我的生活有多大改变。我不认为围棋是我智力的重要组成部分。当Gary Kasparov输给了深蓝,这并没有威胁到我的智慧。我在某种程度上定义了我的工作方式,以及我如何为这个世界增添价值,以及在很多其他的坐标轴上让我快乐的东西,但是除了“我可以下国际象棋吗?”之外。或者“我可以玩吗?”我认为这说明了智商确实是多方面的。有很多不同的种类——可能有成千上万种不同的智力——而且它不是线性的。
正因为如此,我觉得,当我们观注人工智能的发展时,我们会看到越来越多的智能机器,但它们在一些非常狭窄的领域会变得越来越智能,比如“这是比我更好的游戏机器人”,或者“这是比我更好的汽车司机”。这将是非常有用的,但它不会改变我对自己的看法、我的工作或者是什么让我快乐。
因为我觉得人类领域还有更多的智力维度将继续存在。这将需要很长一段时间,如果有的话,人工智能将会比我们在所有这些领域变得更好。因为,就像我说的,我不相信智力是线性的。
过去几十年,世界生产率增长一直在放缓,我觉得人工智能是我们摆脱这一陷阱的一种方式,在这种情况下,我们一直无法找到促进经济增长的方法,因为我们的生产率一直没有得到提高。实际上,我觉得这对我们所有人来说都是必要的,那就是找出提高生产率的方法,而我认为人工智能就是我们未来几十年需要做的事情。
在你的第三个说法中,我不同意的一件事是,失业率永远不会上升。我认为没有什么事情是那么简单的。实际上,我很担心短期内的工作转移。我认为会有一些人在受苦,事实上,在某种程度上,这种情况已经发生了。
特朗普的当选让我大开眼界:确实有很多人觉得自己被经济抛在了后面,他们对世界的看法和我的看法截然不同。我认为,随着我们我们社会数字化进程推进,人工智能成为一种杠杆,有些人会变得非常善于利用它来提高生产力,从而看到不平等加剧,这让我感到担忧。
我所担心是我们社会所面临的挑战,随着人工智能的兴起,我们必须做更多的事情以确保我们给人们生活的目的和意义,也许不一定是为了每天早上8点上班打卡。我想要相信这种未来的存在。
现在有很多人都是很优秀的人,他们可以很多不同的方式做出贡献,比如智力上的,艺术上的,但是他们现在没有机会,因为他们没有合适的机会接受正确的教育以运用他们的技能,而且他们中的很多人所从事的工作,我认为,并不能充分发挥他们的潜力。
所以我希望,随着我们将这些工作自动化进程的推进,能够让更多人找到为他们提供意义和目标的工作,让他们真正发挥自己的才能,让世界变得更美好,但我承认,此转变不容易。我确实认为,这将对我们的政府运作方式和经济运行方式产生重大影响,我希望我们能找到一种方法,帮助消除在过渡期间所经历的一些痛苦。
在破坏某些对手的光纤系统之后,你可以做更多的事情,比如用人工智能来操纵它们。关于俄罗斯参与2016年美国大选的讨论很多,但与派遣邪恶的杀手机器人无关。其中更多的是改变人们的观点,或试图改变他们的观点,而人工智能将给实体组织以工具,使他们用一种前所未有的规模去实现。
我认为,其中不乏一些对人工智能的邪恶用途,它们比电影中所描绘的邪恶机器人杀手的全面正面攻击更难以察觉。我确实担心这些事情,但我也同意你的乐观观点。我认为人类犯了很多错误,我们此时不应该给太放松。
我们应该从这些错误中吸取教训,但同时我们也做了很多有益的事情。我们过去也曾利用技术让世界变得更好,同时,我希望人工智能也能实现这一点。
当我还是一名博士生的时候,我研究人工智能,所有聪明的人都告诉我:“不要学习深度学习,因为它并没有用处。使用另一种叫做支持向量机的算法。”在当时,希望那就是所谓的主算法。
所以我当时并没有研究深度学习,因为当时它的影响力很小。我认为现在我们有了更多的数据,而且深度学习模式能够成功地利用这些数据,因而我们已经取得了很大的进步。
不过,我并不认为深度学习是一种主算法,因为深度学习类似云的概念,内部结构交错,而实际上,从其中找到一个空间来解决特定的问题则需要很多人类的聪明才智。
我认为,下一步,英伟达要想办法利用人工智能来改变自己的工作方式。英伟达之所以有动力这么做,是因为我们看到了人工智能给我们的客户所带来的价值。我们的GPU销售一直在增长,因为对于其他所有试图利用人工智能解决自身问题的人们来说,我们的产品极具价值。
我认为我们将看到人工智能以不同的方式应用于解决许多不同的问题,而我在英伟达的工作就是想办法做到这一点。所以这就是我的团队所关注的。
我们在几个不同的领域都有项目,从图形到音频,还有文本,等等。我们正试图改变英伟达的一切:从芯片设计到视频游戏,以及两者之间的一切。
在我的日常工作中,我领导着这个团队,这意味着我花了很多时间和团队里的人讨论他们所做的工作,并努力确保他们拥有适当的资源、数据,合适的硬件、想法和正确的逻辑,这样他们就能在试图解决的问题上取得进展。
然后,我们制作一些原型产品,展示如何将人工智能应用于特定问题,然后我与公司的同事合作,向他们展示人工智能应用于他们所关心问题的前景。
我认为,这项任务能让我感到非常兴奋,因为我们真的正站在公司的核心位置为改变英伟达公司而努力工作着。因此,我们并没有开发应用型人工智能,而可能会帮助搭建公司的一些外围设备。我们实际上是在努力解决该公司在人工智能领域面临的非常根本的问题,希望我们能够改变公司的运营方式,将英伟达转变为一家人工智能公司,而不仅仅是一家为人工智能制造硬件的公司。
如果你参加任何学术类人工智能会议,你会看到有很多精力充沛且充满兴奋的新面孔。能看到这个景象真是太好了。但即使面对这些增长和变化,对整个行业来说仍是一个大问题。所以,对于所有想知道下一步会发生什么的听众来说,来从事人工智能工作吧。我们有很多有趣的问题需要解决,但合适的人很少。
因而我认为我们并不能够强制人工智能以一种对人类有意义的方式来解释它所做出的所有决定。我坚信,我们可以做一些事情使系统的结果更具有解释性。例如,在我之前提到的简历工作描述匹配系统上,我们已经建立了一个原型,可以突出显示模型中对简历最感兴趣的部分,无论是正面的还是负面的内容都是如此。
这是向解释能力迈出的一小步,因此,如果你要把职位描述和某个特定的人拎出来,看他们是如何匹配的,可能就会向你解释这个模型在做排序时的关注点在哪儿。
几千年来,人类一直在思考的一个问题是,“有人想要找你。”我们很大一部分的潜意识在担心,比如“今晚谁会来杀我?”谁会抢走我的工作?谁来拿走我的食物?谁会把我的房子烧掉?这些都是我们担心的事情。因此,科幻小说对人工智能的大量描述,是对大脑担忧未来的放大化,而并不是真正地与科技及其潜在对话。
我认为,科幻小说中,最影响我对人工智能看法的是阿西莫夫机器人三大定律(Isaac Asimov’s Three Laws)。我认为,这些作品都是非常经典的,我希望其中一些作品能够改编以针对我们如今试图用人工智能所解决的问题,从而使人工智能变得安全,并让人们有信心与人工智能互动,而不是担心人工智能的发展。
但我觉得大多数科幻小说都是这样,尤其是电影,其增加卖点的结果是使人们感到害怕,而不是向人们展示人工智能正在帮助人们过上更好的生活。事实上并不像电影那么吸引人,所以我觉得流行文化对人工智能的处理是非常不现实的。