公众号/AI科技大本营
HAL 9000(来源:ScieNews.com)
译者 | 婉清
编辑 | 阿司匹林
出品 | AI科技大本营(公众号ID:rgznai100)
机器学习是目前计算机领域最火的技术之一,从电商到自动驾驶,都有机器学习的应用。但是,当大众谈起机器学习时,却往往以 AI(人工智能) 代称,这遭到了很多学者的批判,机器学习宗师级大牛迈克尔 · 乔丹更是直言不讳,称“我讨厌将机器学习称为 AI”。
虽然机器学习目前能够解决的问题非常有限,但是它确实让我们看到了新一轮科技变革的曙光。然而,关于机器学习的炒作已经太多,我们需要从不同的角度去审视它,认真思考,才能真正理解它。
作为一名风投经理,Andreessen Horowitz 展现了自己的独特视角,提出关系数据库和自动化是帮助我们理解机器学习的两个重要概念。Horowitz 认为,洗衣机是自动化机器的一种,但是它没有“智能”,而机器学习也可以看作一种可以实现自动化的技术,人们用它打造的只不过是一台台智能时代的“洗衣机”。
以下内容由AI科技大本营编译:
机器学习进入公众视野已经有四五年了,几乎达到了妇孺皆知的地步。不仅每天都有各种初创公司涌现,大型科技平台公司也正围绕机器学习进行自我改造:科技行业以外的所有人大都读过《经济学人》或《商业周刊》的封面故事,很多大公司也有一些项目正在进行。我们都知道,这会是下一个风口。
更进一步,理论上我们大多了解神经网络是什么,它可能与模式和数据有关。机器学习让我们在数据中找到模式或结构,这些模式或结构是隐式和概率性的(因此是“推断”),而不是显式的,这在以前只有人类才能找到,计算机是无法找到的。机器学习解决了这类问题:那些以前“对计算机而言很难,但对人类来说很容易”的问题,或者说“对计算机来说很难描述”的问题。
不过,我认为我们还没有一个明确的概念,即机器学习对科技公司或更广泛的经济体系中的公司意味着什么,如何在结构上思考它能够带来什么新事物,或者机器学习对我们所有人意味着什么,以及它实际上能够解决什么重要问题。
“人工智能”(Artificial Intelligence)一词并没有起到什么帮助作用,它只会让讨论进行不下去,或者早早结束。当我们说起“人工智能”时,就好像 2001 年初的黑色巨石(black monolith)出现了一样,我们都变成了猿类,对着它尖叫,挥舞着拳头。结果就是,我们无法真正分析“人工智能”。
编者注: black monolith,黑色巨石。源自阿瑟·克拉克(Arthur C. Clarke)的科幻小说《2001:太空奥德赛》(Space Odyssey,又译:《2001:太空漫游》)。书中描述道,高度智慧的外星生命在地球上留下了一块黑石。在书中黑石代表着远远超过人类触及范围的智慧。
事实上,我可以列举一长串无助于讨论当前机器学习发展的方式,例如:
当然,也有其他更有益的方式:
为什么提到关系数据库?因为它是一个新的基础赋能层,改变了计算机所能胜任的事情。在于上世纪 70 年代末关系数据库出现之前,如果你想让数据库显示你希望的东西,比如“所有已购买此产品且居住在此城市的客户”,通常需要一个专门的工程项目才能实现。数据库不是用结构化的,因此任何任意交叉引用查询都非比寻常的困难。数据库是记录保存系统,而关系数据库则把它们变成了商业智能系统。
这样一来就极大地改变了数据库的用途,从而创建了新的用例,催生了市值高达数十亿美元的新公司。关系数据库不仅为我们带来了 Oracle,也带来了 SAP。而 SAP 和它的同行们给我们带来了全球即时供应链——苹果和星巴克。到了 90 年代,几乎所有的企业软件无一例外都是关系数据库:PeopleSoft、CRM 和 SuccessFactors 等数十种软件都是运行在关系数据库之上。没有人指着 SuccessFactors 或 Salesforce 说,“这玩意儿将永远不会起作用,因为 Oracle 拥有所有的数据库”——相反,这项技术成了一个赋能层,它成了所有东西的一部分。
所以,这也是如今我们思考机器学习的一个很好的方式——它是我们利用计算机所能做的进一步改进,它将成为许多各家公司不同产品的一部分。最终,几乎所有的东西都有机器学习在里面,没人关心,也没人惊奇。
两者之间重要的相似之处在于,尽管关系数据库具有规模效应,但别忘了网络是有限的,或者说“赢家通吃”的效应,机器学习也一样。如果 B 公司和 A 公司一样,从同一家供应商购买相同的数据库软件,那么 A 公司使用的数据库并不会因此变得更好。机器学习实际上也是差不多的情况:机器学习都是数据相关的,但是特定应用的需要的数据却是不同的。更多的手写数据会使手写体识别器变得更好,而更多的燃气轮机数据也会使系统更好地预测燃气轮机的故障,但是其中一套数据对另一个系统却毫无帮助。记住,数据是不可替代的。
这就触及了在谈论机器学习时最常见的误解的核心:在某种程度上,机器学习是通往 HAL 9000 (编者注: HAL 9000是《2001:太空漫游》中的最具人性的超级计算机)道路上一种单一的、通用的东西;或者 Google 或微软各自建立了“一个(HAL 9000)”;或者 Google “拥有所有的数据”;或者 IBM 已经拥有了一个真实的东西(HAL 9000),叫作 Waston。的确,人们在看待自动化时总会犯相同的错误:每一波自动化浪潮,我们夺回想象人们正在创造一些拟人化的东西,或者具有通用智能的玩意。要知道,这可是有前车之鉴的:在 1920-1930 年代,我们想象的是,钢铁机器人拿着锤子在工厂里走来走去;而在 50 年代,我们想象的是人形机器人在厨房里干家务。然而我们并没有得到机器仆人,但好在我们有了洗衣机。
你可以说洗衣机就是机器人,但它们没有“智能”。它们并不知道水和衣服是什么。此外,就算在洗涤领域中,洗衣机也并不是通用的:你不能把盘子放进洗衣机里,也不能把衣服放进洗碗机里(或者说,你可以这么做,但你不会得到想要的结果)。它们只是另一种形式的自动化罢了,在概念上,与传送带或送料机并没有什么不同。同样,机器学习让我们得以解决以前计算机无法解决的问题,但是这些问题中,每个问题都需要不同的实现、不同的数据、不同的市场路线以及不同的公司才能解决。这些都是自动化的一部分,你可以把它们看作一台台洗衣机。
因此,我们谈论机器学习的挑战之一,就是在数学的机械解释与幻想之间找到一个平衡点。机器学习并不会创造出 HAL 9000(至少,这个领域中很少有人会认为它很快就能实现),但认为它“只是统计数据”对于理解也没有帮助。让我们重新审视与关系数据库的相似之处,这可能更像是在 1980 年讨论 SQL 一样:如何从解释表连接(table join)到思考 Salesforce.com?如果你说“这可以让你问些新问题”,这当然是非常好的,但是问题并不总是清晰明了。你可以制作一些令人印象深刻的语音识别和图像识别的演示,但是,如果是一家普通的公司会怎么做呢?就像美国一家大型媒体公司的一个团队不久前对我说的那样:“我们知道,我们可以使用机器学习来索引十年来的运动员采访视频,但是,我们寻找的究竟是什么呢?”
那么,对于真正的公司来说,机器学习的“洗衣机”到底是什么呢?我认为有两套工具可以用来帮助思考这个问题。首先是考虑数据类型和问题类型的流程:
那么,对于真正的公司来说,机器学习的“洗衣机”到底是什么呢?我认为有两套工具可以用来帮助思考这个问题。首先是考虑数据类型和问题类型的形式:
在这方面中,我发现最令人兴奋的是影像领域。以往,只要我们有计算机,就能够处理文本和数字,但图像(和视频)对它们而言,大多都是盲区。现在,它们可以“看到”了,就像它们可以读文本和数字一样。这意味着图像传感器(和麦克风)将成为一个全新的输入机制:与其说是一个“摄像头”,还不如说就是一个全新的、强大的、灵活的传感器,它可以生成机器可读的数据流。未来各种各样的问题,最终都会演变成计算机视觉问题,尽管今天看上去并不像是计算机视觉方面的问题。
最近我遇到了一家为汽车行业提供座椅的公司,该公司已经在廉价的 DSP 芯片上部署了神经网络,并与廉价的智能手机图像传感器相结合,以检测织物是否有起皱的现象(我们应该期待的是,市面将涌现各种类似用途的机器学习的小玩意儿,它们非常小巧、便宜,只做一件事,就像文章 Why the Future of Machine Learning is Tiny 说的那样)。它实际上就是把以前无法自动化的任务自动化,因此将它描述为“人工智能”是不利于我们理解的。
这种自动化的概念是思考机器学习的第二个工具。发现织物上是否存在起皱的现象并不需要 20 年的经验:做到这一点,真的只需要哺乳动物的大脑就够了。事实上,有位同事跟我说,你可以训练狗狗做的事情,机器学习也可以做到,这也是思考人工智能偏见的一个有用途径(狗狗到底学到了什么?训练数据中有什么?你确定吗?你会怎么问?),但是它也有限制,因为狗狗确实具备一般的智力和常识,并不像我们知道的任何神经网络。吴恩达表示机器学习在不到一秒内就可以做任何你所能做的事情。谈论机器学习确实是在寻找隐喻,但我更喜欢这个隐喻:机器学习给你的其实是无限数量的实习生,或者无限数量的十岁孩童。
五年前,如果你给一台计算机一堆照片,它所能做的,只是按照片尺寸大小排序。而一个十岁孩童,可以把这堆照片按男人和女人来分组,一个十五岁的少年可以按照“酷”和“不酷”来进行划分照片,一个实习生可以指着某张照片说“这个人真的很有趣”。今天,有了机器学习的加持,计算机的能力将会与十岁孩童或者十五岁少年相仿。但它可能永远不会达到实习生的水平。但是如果你有一百万名十五岁的少年来一起来查看数据,你将会怎么做呢?你会接听什么样的电话,会浏览什么样的图像,会检查哪些文件传输或用信用卡付款呢?
也就是说,机器学习不必与专家或者数十年的经验或判断相匹配。我们不是自动化专家。相反,我们要求的是:接听所有的电话,找到那些愤怒的人;浏览十万张照片,找到那些看上去很酷(或者至少看上去怪异)的人。
从某种意义上说,这就是自动化始终在做的事情;正如 Excel 并没有给我们带来人工会计师,Photoshop 和 Indesign 也没有给我们带来人工平面设计师,实际上,蒸汽机也没有给我们带来人造马匹。(在早期的“人工智能”浪潮中,能够对弈国际象棋的计算机并没有给我们带来一个装在盒子里的、性情乖戾的俄国中年人。)相反,我们将一项离散任务大规模地自动化了。
如果这个隐喻被打破(就像所有的隐喻一样),那么,在某些领域中,机器学习不仅能找到我们已经能够识别的东西,而且还能找到人类无法识别的东西。DeepMind 的 AlphaGo 就是最好的例子。AlphaGo 不会像下国际象棋的计算机那样去下围棋:按照顺序分析每一种可能的棋步。相反,它被赋予了规则,让它自己尝试制定策略,与自己下棋的次数,要比人类在有生之年所能下的棋还要多。也就是说,这并不是一千名实习生,而是一名非常非常快的实习生。如果你给实习生一千万张照片,他们浏览完会说:“这很有趣,但当我看到第三百万张照片时,这种模式才真正开始出现。”那么,哪些领域足够窄又足够深,以至于我们可以告诉一个机器学习系统规则(或者给它一个分数),只要查看所有数据,就能得出人类无法得出的新结果?
我花了很多时间去了解大公司,讨论他们的技术需求,他们在机器学习方面通常有一些非常明显的、可轻易实现的目标。既有很多明显的分析和优化问题,也有很多明显的图像识别问题或音频分析问题。同样,我们讨论自动驾驶汽车和混合现实的唯一原因就是机器学习(可能)让它们能够得以实现。但当我们讨论织物上的起皱情况或客户服务中心的情绪分析之后,这些公司接下来往往问道:“还有什么呢?”这将带来什么其他的东西吗?它会发现哪些我们不知道的未知事物呢?
在机器学习变得稀松平常之前,我们可能还有十到十五年的时间。
原文链接:
https://www.ben-evans.com/benedictevans/2018/06/22/ways-to-think-about-machine-learning-8nefy